KR20150140859A - 셀룰라아제 활성을 갖는 폴리펩티드 - Google Patents

셀룰라아제 활성을 갖는 폴리펩티드 Download PDF

Info

Publication number
KR20150140859A
KR20150140859A KR1020157033817A KR20157033817A KR20150140859A KR 20150140859 A KR20150140859 A KR 20150140859A KR 1020157033817 A KR1020157033817 A KR 1020157033817A KR 20157033817 A KR20157033817 A KR 20157033817A KR 20150140859 A KR20150140859 A KR 20150140859A
Authority
KR
South Korea
Prior art keywords
ala
asn
leu
pro
gly
Prior art date
Application number
KR1020157033817A
Other languages
English (en)
Inventor
프란세스 에이치. 아널드
피트 하인젤만
Original Assignee
캘리포니아 인스티튜트 오브 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 캘리포니아 인스티튜트 오브 테크놀로지 filed Critical 캘리포니아 인스티튜트 오브 테크놀로지
Publication of KR20150140859A publication Critical patent/KR20150140859A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)

Abstract

본 발명의 개시내용은 CBH II 키메라 융합 폴리펩티드, 상기 폴리펩티드를 엔코딩하는 핵산 및 상기 폴리펩티드를 생성하는 숙주 세포에 관한 것이다.

Description

셀룰라아제 활성을 갖는 폴리펩티드{POLYPEPTIDES HAVING CELLULASE ACTIVITY}
관련 출원에 대한 상호 참조
본 출원은 35 U. S. C. §119 하에 미국 가출원 제61/166,993호(출원일: 2009년 4월 6일) 및 제61/177,882호(출원일: 2009년 5월 13일)에 대한 우선권을 주장하며, 이들 개시내용은 본 명세서에 참고로 포함된다.
정부 지원 연구에 관한 성명
미국 정부는 미국 국립 보건원에 의해 수여된 보조금 GM068664호 및 ARO - 미국 육군 로버트 모리스 조달 센터(ARO - U.S. Army Robert Morris Acquisition Center)에 의해 수여된 보조금 DAAD19-03-0D-0004호에 따라 본 발명에 대해 특정 권리를 가진다.
본 발명의 개시내용은 생체분자 엔지니어링(engineering) 및 설계, 및 엔지니어링된 단백질 및 핵산에 관한 것이다.
바이오매스(biomass) 전환 과정에서의 셀룰라아제 혼합물의 특성은 셀룰라아제 기질 물리적 상태 및 조성 외에, 안정성, 생성물 억제, 상이한 셀룰라아제 구성성분 간의 상승효과, 생산적인 결합 대 비생산적인 흡수 및 pH 의존성을 비롯한 많은 효소 특성에 좌우된다. 셀룰라아제 가수분해의 다변적인 성질을 고려해볼 때, 상이한 응용 및 공급원료(feedstock)를 위한 효소 제형을 최적화시키기 위하여 선택할 다양한 셀룰라아제를 갖는 것이 바람직하다.
본 발명의 개시내용은 셀룰라아제 활성을 가지며, 야생형 단백질에 비해 증가된 내열성(thermostable) 및 활성을 갖는 재조합 폴리펩티드를 제공한다. 본 발명의 개시내용은 C-종말단(예를 들어, 고유 단백질 서열에 따라, 아미노산 약 310-315, 예를 들어 서열 번호 2 및 4 참조)에 Cys에서 Ser으로의 돌연변이를 갖는 고유 효소 및 CBH II 키메라가 장기간의 가수분해 검정에서 고유 효소보다 솔리드(solid) 셀룰로오스를 더 가수분해시키는 것을 나타내며, 이를 제공한다.
본 발명의 개시내용은 서열 GECDG(서열 번호 2의 312-316)를 포함하는 모티브 내의 C-말단 영역에 C→S 치환을 포함하는 재조합 폴리펩티드를 제공하며, 여기서, 이 변이체는 야생형 셀로바이오하이드롤라제(cellobiohydrolase)에 비해 내열성 및 셀룰라아제 활성이 증가된다. 예를 들어, 본 발명의 개시내용은 C314S를 포함하는 서열 번호 2와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C311S를 포함하는 서열 번호 4와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C310S를 포함하는 서열 번호 12와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C312S를 포함하는 서열 번호 13과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C314S를 포함하는 서열 번호 14와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C315S를 포함하는 서열 번호 15와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C313S를 포함하는 서열 번호 16과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C311S를 포함하는 서열 번호 17과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C313S를 포함하는 서열 번호 19와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C312S를 포함하는 서열 번호 21과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C311S를 포함하는 서열 번호 22와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 64와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C407S를 포함하는 서열 번호 65와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C394S를 포함하는 서열 번호 66과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 67과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 68과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 69와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 70과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 71과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 72와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 73과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 74와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 75와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C407S를 포함하는 서열 번호 76과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C394S를 포함하는 서열 번호 77과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; 또는 C412S를 포함하는 서열 번호 78과 85%, 90%, 95%, 98%, 99% 이상 동일하고, 여기서, 전술한 폴리펩티드는 셀룰라아제 활성을 가지며, Cys->Ser 돌연변이가 결여된 이들의 상응하는 모체(parental)(야생형) 단백질에 비해 향상된 내열성을 갖는다.
본 발명의 개시내용은 또한 재조합으로 생성되거나, 합성 제조되거나 또는 다르게는 비-천연적으로 생성되는, 실질적으로 정제된 폴리펩티드를 제공하며, 여기서 상기 폴리펩티드는 하기에 나타낸 서열을 포함하고, 하기에 확인된 위치를 제외한 위치에 1개 내지 10개, 10개 내지 20개 또는 20개 내지 30개의 보존적 아미노산 치환을 가지며, 하기에 확인된 위치에 C→S 치환이 존재한다: C314S를 포함하는 서열 번호 2; C311S를 포함하는 서열 번호 4; C310S를 포함하는 서열 번호 12; C312S를 포함하는 서열 번호 13; C314S를 포함하는 서열 번호 14; C315S를 포함하는 서열 번호 15; C313S를 포함하는 서열 번호 16; C311S를 포함하는 서열 번호 17; C313S를 포함하는 서열 번호 19; C312S를 포함하는 서열 번호 21; C311S를 포함하는 서열 번호 22; C400S를 포함하는 서열 번호 64; C407S를 포함하는 서열 번호 65; C394S를 포함하는 서열 번호 66; C400S를 포함하는 서열 번호 67; C400S를 포함하는 서열 번호 68; C400S를 포함하는 서열 번호 69; C400S를 포함하는 서열 번호 70; C400S를 포함하는 서열 번호 71; C400S를 포함하는 서열 번호 72; C400S를 포함하는 서열 번호 73; C400S를 포함하는 서열 번호 74; C400S를 포함하는 서열 번호 75; C407S를 포함하는 서열 번호 76; C394S를 포함하는 서열 번호 77; 또는 C412S를 포함하는 서열 번호 78.
본 발명의 개시내용은 하기로 이루어진 군으로부터 선택되는 서열을 포함하는 재조합 폴리펩티드를 제공한다: (a) 위치 314에 Ser을 갖고, 서열 번호 2와 85% 이상의 동일성을 가지며, 셀룰라아제 활성을 갖는 폴리펩티드; (b) 위치 311에 Ser을 갖고, 서열 번호 4와 70% 이상의 동일성을 가지며, 셀룰라아제 활성을 갖는 폴리펩티드; (c) (i) 위치 310에 Ser을 갖고, 서열 번호 12, (ii) 위치 312에 Ser을 갖고, 서열 번호 13, (iii) 위치 314에 Ser을 갖고, 서열 번호 14, (iv) 위치 315에 Ser을 갖고, 서열 번호 15, (v) 위치 313에 Ser을 갖고, 서열 번호 16, (vi) 위치 311에 Ser을 갖고, 서열 번호 17, (vii) 위치 313에 Ser을 갖고, 서열 번호 19, (viii) 위치 312에 Ser을 갖고, 서열 번호 21 및 (ix) 위치 311에 Ser을 갖고, 서열 번호 22로 이루어진 군으로부터 선택되는 서열과 70% 이상의 동일성을 갖는 폴리펩티드로서, 상기 폴리펩티드가 각각 셀룰라아제 활성을 갖는 폴리펩티드; 및 (d) 2개의 상이한 모체 셀로바이오하이드롤라제 폴리펩티드로부터의 2개 이상의 도메인을 포함하는 키메라 폴리펩티드로서, 상기 도메인이 N-말단에서 C-말단으로, (세그먼트(segment) 1)-(세그먼트 2)-(세그먼트 3)-(세그먼트 4)-(세그먼트 5)-(세그먼트 6)-(세그먼트 7)-(세그먼트 8)을 포함하며, 여기서 세그먼트 1이 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 1 내지 약 x1과 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 2가 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x1 내지 약 x2와 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 3이 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x2 내지 약 x3과 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 4가 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x3 내지 약 x4와 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 5가 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x4 내지 약 x5와 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 6이 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x5 내지 약 x6과 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 7이 서열 번호 2("1") 또는 서열 번호 4("2")의 아미노산 잔기 x6 내지 약 x7과 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 8이 서열 번호 2("1") 또는 서열 번호 4("2")의 아미노산 잔기 x7 내지 약 x8과 50 내지 100% 이상 동일한 서열을 포함하고; 여기서 x1은 서열 번호 2의 잔기 43, 44, 45, 46 또는 47, 또는 서열 번호 4 또는 서열 번호 6의 잔기 42, 43, 44, 45 또는 46이고; x2는 서열 번호 2의 잔기 70, 71, 72, 73 또는 74, 또는 서열 번호 4 또는 서열 번호 6의 잔기 68, 69, 70, 71, 72, 73 또는 74이고; x3은 서열 번호 2의 잔기 113, 114, 115, 116, 117 또는 118, 또는 서열 번호 4 또는 서열 번호 6의 잔기 110, 111, 112, 113, 114, 115 또는 116이고; x4는 서열 번호 2의 잔기 153, 154, 155, 156 또는 157, 또는 서열 번호 4 또는 서열 번호 6의 잔기 149, 150, 151, 152, 153, 154, 155 또는 156이고; x5는 서열 번호 2의 잔기 220, 221, 222, 223 또는 224, 또는 서열 번호 4 또는 서열 번호 6의 잔기 216, 217, 218, 219, 220, 221, 222 또는 223이고; x6은 서열 번호 2의 잔기 256, 257, 258, 259, 260 또는 261, 또는 서열 번호 4 또는 서열 번호 6의 잔기 253, 254, 255, 256, 257, 258, 259 또는 260이고; x7은 서열 번호 2의 잔기 312, 313, 314, 315 또는 316, 또는 서열 번호 4의 잔기 309, 310, 311, 312, 313, 314, 315 또는 318이고; x8은 서열 번호 2, 서열 번호 4 또는 서열 번호 6의 서열을 갖는 폴리펩티드의 C-말단에 상응하는 아미노산 잔기이며, 여기서, 상기 키메라 폴리펩티드가 서열 번호 2의 위치 314, 또는 서열 번호 4의 위치 311에 Ser을 포함하며, 상기 키메라 폴리펩티드가 셀룰라아제 활성을 가지며, 서열 번호 2, 4 또는 6을 포함하는 CBH II 폴리펩티드에 비해 개선된 내열성 및/또는 pH 안정성을 갖는 키메라 폴리펩티드. 재조합 폴리펩티드의 일 실시형태에서, 세그먼트 1은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 1 내지 약 x1을 포함하고 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 2는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x1 내지 약 x2이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 3은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x2 내지 약 x3이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 4는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x3 내지 약 x4이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 5는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x4 내지 약 x5이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 6은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x5 내지 약 x6이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 7은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x6 내지 약 x7이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 8은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x7 내지 약 x8이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며, 상기의 보존적 아미노산 치환은 서열 번호 2의 위치 314, 서열 번호 4의 위치 311, 또는 서열 번호 6의 위치 313을 제외한 위치에서 일어난다. 다른 실시형태에서, 상기 키메라 폴리펩티드는 서열 번호 12 내지 62 및 63으로 이루어진 군으로부터 선택되는 서열과 80%, 90%, 95%, 98% 또는 99% 이상 동일한 서열을 포함한다.
본 발명의 개시내용은 또한 서열 번호 12 내지 62 또는 63에 기재된 서열로 이루어진 재조합 폴리펩티드를 제공한다.
본 발명의 개시내용은 또한 상술된 폴리펩티드 중 임의의 것을 엔코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 함유하는 벡터 및 상기 폴리뉴클레오티드 또는 벡터를 함유하는 숙주 세포를 제공한다.
본 발명의 개시내용은 또한 실질적으로 정제된 형태 또는 세포 용해물의 일부로서 상기 개시내용의 폴리펩티드를 포함하는 효소 제제(preparation)를 제공한다.
본 발명의 개시내용은 또한 셀룰로오스를 비롯한 바이오매스의 처리 방법을 제공하며, 상기 방법은 상기 바이오매스를 본 발명의 개시내용의 폴리펩티드 또는 효소 제제와 접촉시키는 것을 포함한다.
도 1a-b 후보물질 CBH II 모체 유전자 효모 발현 배양 상층액의 SDS-PAGE 겔. (A) 겔 레인(Lane)(좌측에서 우측으로) : 1-H. 제코리나(H. jecorina), 2-빈 벡터, 3-H. 인솔렌스(H. insolens), 4-C. 써모필럼(C. thermophilum), 5-H. 제코리나(2중), 6-P. 크리소스포리움(P. chrysosporium), 7-T. 에메르소니이(T. emersonii), 8-빈 벡터(2중), 9-H. 제코리나(3중). 겔의 하단의 숫자는 2시간, 50 ℃에서의 PASC 가수분해 검정 후에 반응물 내에 존재하는 환원당(㎍/㎖)의 농도를 나타낸다. 이후의 BSA 표준물질과의 SDS-PAGE 비교에 의해 5-10 mg/ℓ의 H. 인솔렌스 발현 수준의 평가가 가능하게 된다. (B)는 S. 세레비지애(S. cerevisiae) CBH II 발현 배양 상층액의 SDS-PAGE 겔 분석을 나타낸 것이다. CBH II 밴드는 60 kDa 분자량 표준물질 바로 아래에서 나타났다. 레인, 좌측에서 우측으로, 1-야생형 H. 제코리나, 2-H. 제코리나 B7P3, 3-H. 제코리나 C311S, 4-야생형 C. 써모필럼, 5-야생형 H. 인솔렌스, 6-H. 인솔렌스 B7P3, 7-H. 인솔렌스 C314S. 숫자는 50 mM 소듐 아세테이트, pH 4.8 중에 50 ℃에서 PASC(1 ㎎/㎖)와 함께 100분간의 인큐베이션 동안 생성된 SDCAA 발현 배양 상층액 당량 ㎖당 반응 부피 ㎖당 글루코오스 당량 ㎍을 나타낸 것이다. 레인 1 내지 4에 대한 값을 2로 나누어, 로딩되는 농축된 배양 상층액의 2배의 부피를 보정하고, 여기서 이러한 보정의 생략은 H. 인솔렌스 효소에 대한 특이적 활성 값이 인위적으로 낮게 나타나게 할 것이다.
도 2a-c는 CBH II 키메라 라이브러리 블록 경계의 예시를 나타낸 것이다. (a) 색상으로 구별되는 블록을 갖는 H. 인솔렌스 CBH II 촉매 도메인 리본 다이어그램. CBH II 효소를 셀로바이오-유래의 아이소파고민(isofagomine) 글리코시다제 억제제와 복합체화시켰다. (b) 2차 구조 요소, 이황화 결합 및 검은색 화살표로 나타낸 블록 구분을 나타내는 H. 인솔렌스 촉매 도메인의 선형의 표현. (c) 재조합시에 절단될 수 있는 접촉을 나타내는 측쇄 접촉 맵(4.5A 내의 측쇄 중원자). 절단된 접촉의 대부분은 연속 블록 사이에 발생한다.
도 3은 절단된 접촉의 수(E) 및 23개의 분비형/활성 샘플 및 15개의 비분비형/비활성 샘플 세트 키메라에 대한 가장 근사한 모체로부터의 돌연변이의 수(m)를 나타낸다.
도 4는 모체 CBH II 효소 및 3개의 내열성 키메라에 대한 pH의 함수로서, pH 5.0으로 정규화된 특이적 활성을 나타낸 것이다. 나타낸 데이터는 2회의 반복에 대한 평균이며, 여기서 HJPlus 및 H. 제코리나에 대한 오차 막대(error bar)는 2개의 독립적인 시험에 대한 값을 나타낸다. 16시간 반응, 300 ㎍(효소)/g(PASC), 50 ℃, 12.5 mM 소듐 시트레이트/12.5 mM 소듐 포스페이트 완충액, 나타낸 바와 같은 pH.
도 5는 소정의 범위의 온도에 걸친 모체 및 내열성 키메라에 대한 장기간 셀룰로오스 가수분해 검정 결과(㎍(글루코오스 환원당 당량)/㎍(CBH II 효소))를 나타낸 것이다. 오차 막대는 HJPlus 및 H. 인솔렌스 CBH II 효소의 3회의 반복에 대한 표준 오차를 나타낸다. 40시간 반응, 100 ㎍(효소)/g(PASC), 50 mM 소듐 시트레이트, pH 4.8.
도 6은 63 ℃에서 12시간의 인큐베이션 후에 검증 세트 키메라에 대한 정규화된 잔류 활성을 나타낸 것이다. 기질로서 PASC를 사용하는 2시간 검정에서 농축된 배양 상층액 중의 CBH II 효소에 대한 잔류 활성을 결정하였다. 50 ℃, 25 mM 소듐 아세테이트 완충액, pH 4.8.
도 7 모체 및 키메라 CBH II 효소 발현 벡터 Yep352/PGK91-1-ss에 대한 맵. 기재된 벡터는 야생형 H. 제코리나 cel6a(CBH II 효소) 유전자를 함유한다. 키메라 및 모체 CBH II 효소 둘 모두에 대하여, ss Lys-Arg Kex2 부위 다음의 CBD/링커 아미노산 서열은 다음과 같다:
ASCSSVWGQCGGQNWSGPTCCASGSTCVYSNDYYSQCLPGAASSSSSTRAASTTSRVSPTTSRSSSATPPPGSTTTRVPPVGSGTATYS (서열 번호 8).
도 8은 CBH II 모체 및 51개의 CBH II 키메라에 대한 관측된 T50 값 및 예측된 T50 값을 나타낸 것이다. 선은 선형 회귀 모델 식(표 7 내의 파라미터)을 나타낸다. 모체 CBH II T50 값이 사각형으로 나타나 있다.
도 9a-c는 온도의 함수로서의 아비셀에 대한 CBH II 특이적 활성, (a) CBH II 모체 및 키메라 특이적 활성을 나타낸 것이다. (b) CBH II 모체, C311S 돌연변이체 및 B7P3 단일 블록 치환 키메라 특이적 활성. 반응을 15 ㎎/㎖의 아비셀 농도와 함께, 50 mM 소듐 아세테이트, pH 4.8에서 16시간 동안 실행하였다. (c) 온도의 함수로서 아비셀에 대한 CBH II 모체, 단일 점 돌연변이 및 단일 블록 치환 키메라 활성(㎍/글루코오스/㎖ 반응물). 반응을 15 mg/㎖의 아비셀 농도와 함께 50 mM 소듐 아세테이트, pH 4.8에서 150분 동안 실행하였다. 55 ℃에서 CBH II 효모 배양 상층액을 투여하여, 대략 당량의 환원당 생성물 농도를 달성하였다. 제시된 데이터는 2개의 독립적인 반복의 평균이며, 오차 막대는 각 온도 지점에 대한 2중의 활성 값을 나타낸다.
도 10은 모체 1, H. 인솔렌스 및 모체 3, C. 써모필럼으로부터의 블록 7에 대한 ClustalW 다중 서열 정렬을 나타낸 것이다. 화살표는 복귀 돌연변이체에서 변경된 잔기를 나타낸다.
도 11은 21111331 키메라 점 돌연변이체에 대한 T50 값을 나타낸 것이다. 값은 2개의 독립적인 중복물의 평균으로 나타낸 것이며, 오차 막대는 각 점 돌연변이체에 대한 2중의 T50 값을 나타낸다. 50 mM 소듐 아세테이트 완충액, pH 4.8 중에서 시험 온도에서 10분 동안 불활성화를 수행하였다. 잔류 활성을 50 ℃에서 100분 동안 상기 완충액 중에서의 1 g/L의 인산 팽윤형 셀룰로오스(PASC)와의 인큐베이션에 의해 결정하였다.
도 12는 H. 인솔렌스 및 H. 제코리나 모체 CBH II, Ser 단일 점 돌연변이체 및 B7P3 블록 치환 키메라에 대한 T50 값을 나타낸 것이다. 값은 3회의 독립적인 반복의 평균으로 나타낸 것이며, 오차 막대는 각 CBH II에 대한 1의 표준 편차를 나타낸 것이다. 50 mM 소듐 아세테이트 완충액, pH 4.8 중에서 시험 온도에서 10분 동안 불활성화를 수행하였다. 잔류 활성을 50 ℃에서 100분 동안 상기 완충액 중에서의 1 g/L의 인산 팽윤형 셀룰로오스(PASC)와의 인큐베이션에 의해 결정하였다.
도 13은 CBH II 키메라 31311112, 13231111 및 S. 세레비지애로부터 이종 분비되는 P. 크리소스포리움으로부터의 야생형 CBH II 촉매 도메인(H. 제코리나 CBM에 융합됨)에 대한 T50 값을 나타낸 것이다. 값은 2개의 독립적인 반복으로 나타낸 것이며, 오차 막대는 각 시험에 대한 값을 나타낸 것이다. 50 mM 소듐 아세테이트 완충액, pH 4.8 중에서 시험 온도에서 10분 동안 불활성화를 수행하였다. 잔류 활성을 50 ℃에서 100분 동안 상기 완충액 중에서의 1 g/L의 인산 팽윤형 셀룰로오스(PASC)와의 인큐베이션에 의해 결정하였다.
도 14a-d는 CBH II 재조합 블록 경계면을 나타낸 것이다. (a) 신규한 비-모체 잔기쌍이 가능한 블록-사이 부위(연결된 구형)가 통상 표면-노출되어, 용매로 상호작용을 스크리닝할 수 있다. (b) 예시적인 경계면(B5-B6)은 백본(backbone)(정렬된 H. 제코리나 및 H. 인솔렌스에 대한 카툰(cartoon))의 전환, 표면상의 가변 잔기 및 상대적으로 드문 가능성의 잔기 173 및 253에서의 신규한 매립형 소수성 쌍(화살표)을 나타낸 것이다. (c) B3(황색)의 파트에서 기질 결합과 관련된 이동이 관찰되지만(화살표), H. 제코리나(검은색 카툰)로부터의 블록 1-4는 큰 변동 없이 동족체 H. 인솔렌스 블록(채색된 카툰)과 매치된다. (d) B6,B7 접합부에서의 삽입-결실(화살표)이 형태 변화를 필요로 할 것이지만, 동족체 블록 5-8도 또한 유사하다.
도 15는 C314S 돌연변이의 구조적 분석 및 이의 안정화 효과를 나타낸 것이다. (a) 고해상도 H. 인솔렌스 구조(locn)에 대한 수소 위치를 REDUCE.1을 사용하여 첨가하였다. (b) 유사한 세린 구조의 재구성된 기하학을 PyMOL(http:(//)www. pymol.org)에서 모델링하였다. SHARPEN2 모델링 플랫폼(모든 원자 로제타(Rosetta) 에너지 함수와 함께)에서의 측쇄 최적화도 또한, Cys314 및 Ser314 둘 모두가 Pro339의 카보닐에 수소 결합을 공여하고, Gly316의 아미드로부터 수소 결합을 수여할 것임을 시사한다. 세린의 뛰어난 수소 결합능은 세린 함유 변이체가 더 큰 안정성을 갖는데 역할을 할 수 있다. 다른 가능한 설명은 기하학적 상보성이다. 자세하게, locn으로부터의 Cys 위치는 측쇄가 눈에 띄게 굴곡져(즉, N-C-Cα-Cβ로부터의 부적절한 이면각이 표준 위치로부터 6°임), Pro 카보닐로부터의 거리를 증가시키는 점에서 형태 변형의 증거를 보여준다. 문자가 앞에 있는 도면의 숫자는 수소 결합 거리(Å)를 나타낸다.
본 명세서 및 첨부된 특허청구범위에서 사용되는 바와 같은 단수형 부정관사("a," "an") 및 정관사("the")는 문맥상 명백히 다르게 기술되지 않는 한, 다수의 지시대상을 포함한다. 따라서, 예를 들어, "하나의 도메인"에 대한 언급은 다수의 도메인을 포함하며, "단백질"에 대한 언급은 하나 이상의 단백질을 포함하는 등등이다.
또한, "또는"의 사용은 다르게 언급되지 않는 한 "및/또는"을 의미한다. 유사하게, "함유하다", "함유하는", "포함하다" 및 "포함하는"은 상호교환가능하며, 제한하고자 하는 것이 아니다.
다양한 실시형태의 설명이 용어 "포함하는"을 사용하는 경우, 당업자는 몇몇 특정 예에서 실시형태가 대안적으로 "본질적으로 구성되는" 또는 "구성되는"이라는 표현을 사용하여 기재될 수 있음을 이해할 것임이 추가로 이해되어야 한다.
본 명세서에 기재된 방법 및 재료와 유사하거나 동등한 방법 및 재료가 개시된 방법 및 조성물의 실시에 사용될 수 있지만, 예시적인 방법, 장치 및 재료가 본 명세서에 기재된다.
다르게 정의되지 않는 한, 본 명세서에서 사용된 모든 기술 및 과학 용어는 본 발명의 개시내용이 속하는 분야의 당업자 중 하나가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 따라서, 본 출원에서 사용된 바와 같이, 다음의 용어는 다음의 의미를 가질 것이다.
최근의 연구에 의해, 실험실 규모 바이오매스 전환 과정에서 이들의 중온성 대응물(counterpart)에 비해 호열성 진균류로부터의 셀룰라아제의 뛰어난 성능이 기록되었으며, 여기서 증가된 안정성은 중간 온도 및 상승된 온도 둘 모두에서 더 긴 기간에 걸친 활성의 보유를 야기한다. 진균류 셀룰라아제는 이들이 고도로 활성이 있으며, 하이포크레아 제코리나(Hypocrea jecorina)(무성(anamorph) 트리코더마 리제이(Trichoderma reesei))와 같은 진균류 숙주에서 상층액 중에 40 g/L 이하의 수준으로 발현될 수 있기 때문에 흥미롭다. 불행히도, 문서화된 내열성 진균류 셀룰라아제의 세트가 적다. 진행적(processive) 셀로바이오하이드롤라제 클래스 II(CBH II) 효소의 경우에, 10개 미만의 천연 내열성 유전자 서열이 CAZy 데이터베이스에 주석이 달려있다.
본 명세서에서 더 충분히 기재되는 바와 같이, 반복적 키메라 폴리펩티드 생성 및 분석을 사용하여, 특히 안정화 도메인 및 궁극적으로는 특정 아미노산으로 부여된 내열성 및 향상된 활성을 동정하였다.
하기에 더 상세히 기재될 바와 같이, 본 발명은 적어도 부분적으로 셀룰로오스의 가수분해를 촉매반응시키는 신규한 효소의 생성 및 발현에 기초한다. 일 실시형태에서, 증가된 온도에서 셀룰로오스를 가수분해시키도록 엔지니어링된(engineered) 신규한 폴리펩티드가 제공된다. 이들 폴리펩티드는 특정 잔기에서 아미노산 치환을 포함하도록 변경된 셀로바이오하이드롤라제 변이체를 포함한다. 이들 변이체가 하기에 더욱 상세히 기재될 것이지만, 본 발명의 개시내용의 폴리펩티드가 하나 이상의 변형된 아미노산을 함유할 수 있음이 이해된다. 변형된 아미노산의 존재는 예를 들어, (a) 폴리펩티드 반감기의 증가, (b) 내열성 및 (c) 증가된 기질 턴오버(turnover)의 면에서 유익할 수 있다. 아미노산(들)은 재조합 생성(예컨대, 포유동물 세포에서의 발현 중에 N--X--S/T 모티브에서의 N-연결된 글리코실화) 중에 예를 들어, 번역-동시 또는 번역-후에 변형되거나 합성 수단에 의해 변형된다. 따라서, "돌연변이체", "변이체" 또는 "변형된" 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포는 몇몇 방식으로 모체 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포와 상이하거나 이로부터 변화되거나, 변경되거나 유도된 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포를 의미한다. 돌연변이체 또는 변형된 단백질 또는 효소는 비록 반드시 그런 것은 아니나, 통상 돌연변이체 폴리뉴클레오티드 또는 유전자로부터 발현된다.
"돌연변이"는 돌연변이체 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포를 야기하는 임의의 과정 또는 메커니즘을 의미한다. 이는 단백질, 효소, 폴리뉴클레오티드 또는 유전자 서열이 변경되는 임의의 돌연변이 및 이러한 돌연변이로부터 야기되는 세포 내의 임의의 검출가능한 변화를 포함한다. 전형적으로, 단일 또는 다중 뉴클레오티드 잔기의 점 돌연변이, 결실 또는 삽입에 의해, 폴리뉴클레오티드 또는 유전자 서열에서 돌연변이가 발생한다. 돌연변이는 유전자의 단백질-엔코딩 영역 내에서 생기는 폴리뉴클레오티드 변경뿐 아니라, 비제한적으로 조절 또는 프로모터 서열과 같은 단백질-엔코딩 서열 밖의 영역에서의 변경을 포함한다. 유전자 내의 돌연변이는 "침묵(silent)"일 수 있으며, 즉, 발현 시에 아미노산 변경에 반영되지 않고, 유전자의 "서열-보존적" 변이체를 야기할 수 있다. 이는 일반적으로 하나의 아미노산이 1개 초과의 코돈에 해당하는 경우 발생한다.
변형된 아미노산의 비제한적인 예는 글리코실화 아미노산, 황산화 아미노산, 프레닐레이티드(prenylated)(예를 들어, 파네실레이티드(farnesylated), 제라닐제라닐레이티드(geranylgeranylated)) 아미노산, 아세틸화 아미노산, 아실화 아미노산, 페길화 아미노산, 티오티닐화 아미노산, 카복실화 아미노산, 인산화 아미노산 등을 포함한다. 아미노산의 변형에서 당업자에 설명하기에 적절한 참고문헌이 본 명세서 도처에 충분히 있다. 예시적인 프로토콜이 문헌[Walker (1998) Protein Protocols on CD-ROM (Humana Press, Towata, N.J.)]에 나타나 있다.
본 발명의 개시내용의 변형된 셀로바이오하이드롤라제 폴리펩티드를 생성하고 분리하는 재조합 방법이 본 명세서에 기재된다. 재조합 생성 외에, 폴리펩티드는 고체상 기법을 사용하는 직접 펩티드 합성에 의해 생성될 수 있다(예를 들어, 문헌[Stewart et al. (1969) Solid-Phase Peptide Synthesis (WH Freeman Co, San Francisco); 및 문헌[Merrifield (1963) J. Am. Chem. Soc. 85: 2149-2154]). 펩티드 합성은 수동 기법을 사용하거나 자동화에 의해 수행될 수 있다. 자동화된 합성은 예를 들어, 제조처에 의해 제공되는 지침에 따라, 어플라이드 바이오시스템즈(Applied Biosystems) 431A 펩티드 합성기(Peptide Synthesizer)(Perkin Elmer, Foster City, Calif.)를 사용하여 달성될 수 있다.
"셀로바이오하이드롤라제 II" 또는 "CBH II 효소"는 박테리아 및 진균류에 광범위하게 분포되는 셀룰라아제 패밀리 6 단백질 내의 효소를 의미한다. 상기 효소는 셀룰로오스의 가수분해에 수반된다.
"셀룰라아제 활성"은 셀룰로오스를 가수분해시킬 수 있는 효소를 의미한다. 셀룰라아제는 셀룰로오스의 가수분해를 촉매작용시키는 진균류, 박테리아 및 원생동물에 의해 생성되는 효소의 클래스를 말한다. 그러나, 식물 및 동물과 같은 다른 유형의 유기체에 의해 생성되는 셀룰라아제도 또한 존재한다. 이러한 군의 효소에 대한 EC 번호는 EC 3.2.1.4이다. 촉매작용되는 반응물의 유형에 기초하여 5가지의 일반적인 셀룰라아제의 유형이 있다: 엔도(endo)-셀룰라아제; 엑소(exo)-셀룰라아제, 이 카테고리 내에는 2가지 주요 유형의 엑소-셀룰라아제(또는 셀로바이오하이드롤라제, 축약하여, CBH)가 있음-한 유형은 환원성 말단으로부터 전진하여 작용하고, 한 유형은 셀룰로오스의 비-환원성 말단으로부터 전진하여 작용함; 셀로비아제 또는 베타-글루코시다제 가수분해; 산화적 셀룰라아제; 및 물 대신에 인산염을 사용하여 셀룰로오스를 해중합화(depolymerize)하는 셀룰로오스 포스포릴라아제. 대부분의 진균류 셀룰라아제는 2개의 도메인, 즉 촉매 도메인 및 셀룰로오스 결합 도메인을 가지며, 이들은 가요성 링커에 의해 연결된다. 본 발명의 개시내용의 특정 실시형태에서, 셀룰라아제 활성은 CBH 활성이다. 본 명세서에 기재된 서열은 일부 예에서, 셀룰로오스 결합 도메인 및 촉매 도메인 둘 모두를 포함하거나 또는 촉매 도메인만을 포함한다. 오직 촉매 도메인 서열만이 제공되는 이러한 예에서, 서열 번호 8에 제공되는 것과 같은 셀룰로오스 결합 도메인(CBD)이 직접적으로 또는 링커를 통해 촉매 도메인에 기능적으로 연결(코딩 서열의 일부로서 또는 이후에 연결)될 수 있음이 인식될 것이다.
본 명세서에서 상호교환하여 사용되는 "단백질" 또는 "폴리펩티드"는 펩티드 결합이라 불리는 화학적 결합에 의해 함께 연결되는 아미노산이라 불리는 화학적 빌딩 블록(building block)의 하나 이상의 사슬을 포함한다. "효소"는 바람직하게는 더 구체적으로 또는 덜 구체적으로, 하나 이상의 화학 또는 생화학적 반응을 촉매작용시키거나 증진시키는 단백질로 완전히 또는 대부분 구성된 임의의 물질을 의미한다. "본래" 또는 "야생형" 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포는 천연에서 발생하는 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포를 의미한다.
"아미노산 서열"은 문맥에 따라 아미노산의 폴리머(단백질, 폴리펩티드 등) 또는 아미노산 폴리머를 나타내는 문자열이다. 용어 "단백질", "폴리펩티드" 및 "펩티드"는 본 명세서에서 상호교환하여 사용된다. "아미노산"은 중심 탄소 원자가 수소 원자, 카복실산 기(그 탄소 원자는 본 명세서에서 "카복실 탄소 원자로 지칭됨), 아미노 기(그 질소 원자는 본 명세서에서 "아미노 질소 원자"로 지칭됨) 및 측쇄 기, R에 연결된 구조를 갖는 분자이다. 펩티드, 폴리펩티드 또는 단백질에 혼입되는 경우, 아미노산은 하나의 아미노산을 다른 아미노산에 연결하는 탈수 반응에서 그 아미노산 카복실산 기의 하나 이상의 원자를 소실한다. 결과적으로, 단백질에 혼입되는 경우, 아미노산은 "아미노산 잔기"로 지칭된다.
제공된 단백질의 특정 아미노산 서열(즉, 아미노-말단으로부터 카복시-말단으로 쓰여지는 경우 폴리펩티드의 "1차 구조")은 mRNA의 코딩 부분의 뉴클레오티드 서열에 의해 결정되며, 이러한 mRNA는 차례로 유전적 정보, 전형적으로는 게놈 DNA(세포 기관 DNA, 예를 들어 미토콘드리아 또는 엽록체 DNA 포함)에 의해 구체화된다. 따라서, 유전자의 서열을 결정하는 것은 상응하는 폴레펩티드의 1차 서열 및 더욱 특히 유전자 또는 폴리뉴클레오티드 서열에 의해 엔코딩된 폴리펩티드 또는 단백질의 역할 또는 활성을 예측하는 데 도움을 준다.
특정 서열의 "보존적 아미노산 치환" 또는 간단히 "보존적 변이"는 본질적으로 동일한 아미노산 서열을 갖는 하나의 아미노산 또는 아미노산 시리즈의 대체를 지칭한다. 당업자는 엔코딩된 서열 내의 단일의 아미노산 또는 소정의 백분율의 아미노산을 변경시키거나, 첨가하거나 결실시키는 개별 치환, 결실 및 첨가가 "보존적 변이"를 야기하며, 여기서 변경이 화학적으로 유사한 아미노산으로의 아미노산의 치환, 아미노산의 첨가, 또는 아미노산의 결실을 야기함을 인식할 것이다.
기능상 유사한 아미노산을 제공하는 보존적 치환 표가 당업계에 주지되어 있다. 예를 들어, 하나의 보존적 치환 그룹은 알라닌(A), 세린(S) 및 트레오닌(T)을 포함한다. 다른 보존적 치환 그룹은 아스파르트산(D) 및 글루탐산(E)을 포함한다. 다른 보존적 치환 그룹은 아스파라긴(N) 및 글루타민(Q)을 포함한다. 다른 보존적 치환 그룹은 아르기닌(R) 및 라이신(K)을 포함한다. 다른 보존적 치환 그룹은 아이소류신(I), 류신(L), 메티오닌(M) 및 발린(V)을 포함한다. 다른 보존적 치환 그룹은 페닐알라닌(F), 티로신(Y) 및 트립토판(W)을 포함한다.
따라서, 열거된 폴리펩티드 서열(예를 들어, 서열 번호 2, 4, 6 및 12-78)의 "보존적 아미노산 치환"은 폴리펩티드 서열의 아미노산의 소정의 백분율, 전형적으로는 10% 미만이 동일한 보존적 치환 그룹의 보존적으로 선택된 아미노산으로 치환되는 것을 포함한다. 따라서, 본 발명의 개시내용의 폴리펩티드의 보존적으로 치환된 변이체는 동일한 보존적 치환 그룹의 보존적으로 치환된 변이와 함께, 100, 75, 50, 25 또는 10개의 치환을 함유할 수 있다.
비-작용 또는 비-코딩 서열의 첨가와 같은, 핵산 분자의 엔코딩된 활성을 변경시키지 않는 서열의 첨가가 기본적인 핵산의 보존적 변이임이 이해된다. 효소의 "활성"은 반응을 촉매작용시키는, 즉 "작용하는" 능력의 척도이며, 반응의 생성물이 생성되는 속도로 표현될 수 있다. 예를 들어, 효소 활성은 시간 단위당 또는 효소 단위(예를 들어, 농도 또는 중량)당 생성되는 생성물의 양, 또는 친화도 또는 해리 상수의 용어로 표현될 수 있다. 본 명세서에서 상호교환하여 사용되는 "셀로바이오하이드롤라제 활성 또는 셀룰라아제 활성", "셀로바이오하이드롤라제 또는 셀룰라아제의 생물학적 활성", 또는 "셀로바이오하이드롤라제 또는 셀룰라아제의 작용 활성"은 표준 기법에 따라 생체 내 또는 시험관 내에서 결정시, 단백질이 가하는 활성, 셀룰라아제 활성을 갖는 폴리펩티드 및 특정 실시형태에서, 셀룰로오스 기질상의 셀로바이오하이드롤라제 활성을 말한다.
당업자는 개시된 핵산 작제물(construct)의 많은 보존적 변이가 작용상 동일한 작제물을 생성시키는 것을 인식할 것이다. 예를 들어, 상술된 바와 같이, 유전자 코드의 축퇴성(degeneracy) 때문에, "침묵 치환"(즉, 엔코딩된 폴리펩티드의 변경을 야기하지 않는 핵산 서열 내의 치환)은 아미노산을 엔코딩하는 모든 핵산 서열의 암시된 특징이다. 유사하게, 아미노산 서열 내의 하나의 또는 소수의 아미노산의 "보존적 아미노산 치환"은 고도로 유사한 특성을 갖는 상이한 아미노산으로 치환되며, 개시된 작제물과 고도로 유사한 것으로 용이하게 확인된다. 각각의 개시된 서열의 이러한 보존적 변이는 본 명세서에 제공되는 폴리펩티드의 특징이다.
"보존적 변이체"는 제공된 아미노산 잔기가 단백질 또는 효소의 전반적인 형태 및 기능을 변경시키지 않고 변화되는 단백질 또는 효소이며, 아미노산을 극성 또는 비-극성 특징, 크기, 형상 및 전하를 포함하는 유사한 특징을 갖는 아미노산으로 대체하는 것을 포함하나 이에 한정되지 않는다. 보존적인 것으로 나타낸 것 이외의 아미노산은 단백질 또는 효소에서 상이할 수 있는데, 이는 유사한 기능의 임의의 2개의 단백질 간의 단백질 또는 아미노산 서열 유사성 백분율이 달라질 수 있으며, 예를 들어, 정렬 기법에 따라 결정시 30% 이상, 50% 이상, 70% 이상, 80% 이상, 또는 90% 이상일 수 있기 때문이다. 본 명세서에서 언급되는 "서열 유사성"은 뉴클레오티드 또는 단백질 서열이 관련된 정도를 의미한다. 두 서열 간의 유사성 정도는 서열 동일성 및/또는 보존 백분율을 기준으로 할 수 있다. 본 명세서에서 "서열 동일성"은 2개의 뉴클레오티드 또는 아미노산 서열이 변하지 않는 정도를 의미한다. "서열 정렬"은 유사성 정도를 평가하기 위한 목적으로, 최고의 동일성(그리고, 아미노산 서열의 경우에는 보존) 수준을 달성하도록 둘 이상의 서열을 일렬로 세우는 과정을 의미한다. 서열을 정렬하고 유사성/동일성을 평가하는 많은 방법이 예를 들어 Cluster 방법과 같이 당업계에 주지되어 있으며, 상기 Cluster 방법에서 유사성은 MEGALIGN 알고리듬뿐 아니라, BLASTN, BLASTP 및 FASTA를 기초로 한다(Lipman and Pearson, 1985; Pearson and Lipman, 1988). 이들 프로그램 모두를 사용하는 경우, 바람직한 셋팅은 가장 높은 서열 유사성을 야기하는 것이다.
특정 폴리펩티드의 비-보존적 변형은 보존적 치환으로 특성화되지 않은 임의의 아미노산을 치환하는 것, 예를 들어, 상술된 6개 그룹의 범위를 가로지르는 임의의 치환이다. 이들은 염기성 또는 산성 아미노산의 중성 아미노산으로의 치환(예를 들어, Asp, Glu, Asn 또는 Gln을 Val, Ile, Leu 또는 Met로 치환), 방향족 아미노산의 염기성 또는 산성 아미노산으로의 치환(예를 들어, Phe, Tyr 또는 Trp을 Asp, Asn, Glu 또는 Gln으로 치환) 또는 아미노산을 유사 아미노산으로 대체하지 않는 임의의 다른 치환을 포함한다. 염기성 측쇄는 라이신(K), 아르기닌(R), 히스티딘(H)을 포함하며; 산성 측쇄는 아스파르트산(D), 글루탐산(E)을 포함하며; 하전되지 않은 극성 측쇄는 글리신(G), 아스파라긴(N), 글루타민(Q), 세린(S), 트레오닌(T), 티로신(Y), 시스테인(C)을 포함하며; 비극성 측쇄는 알라닌(A), 발린(V), 류신(L), 아이소류신(I), 프롤린(P), 페닐알라닌(F), 메티오닌(M), 트립토판(W)을 포함하며; 베타-분지형 측쇄는 트레오닌(T), 발린(V), 아이소류신(I)을 포함하며; 방향족 측쇄는 티로신(Y), 페닐알라닌(F), 트립토판(W), 히스티딘(H)을 포함한다.
"모체" 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포는 임의의 방법, 도구 또는 기법을 사용하여, 그리고 모체 그 자체가 본래이던지 또는 돌연변이체이던지, 임의의 다른 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포가 유래되거나 만들어지는 임의의 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포이다. 모체 뉴클레오티드 또는 유전자는 모체 단백질 또는 효소를 엔코딩한다.
CBH II 폴리펩티드의 변이체를 제공하는 것 외에, 1) 제1 모체 가닥으로부터 분리되고 아미노산 치환을 포함하도록 변형된 변이체 도메인; 및 2) 도메인을 보완하는 활성 또는 새로운 활성을 포함하도록 변형되거나 변형되지 않은 제2 모체 가닥으로부터 분리된 도메인을 포함하는 키메라 폴리펩티드가 제공된다. 본 발명의 개시내용의 키메라 폴리펩티드를 엔지니어링하는 방법이 본 명세서에 개시된다.
본 발명의 개시내용은 야생형 또는 모체 단백질에 비해 증가된 내열성을 갖는 셀룰라아제 및 셀로바이오하이드롤라제(CBH) II 변이체, 돌연변이체 및 키메라를 제공하며, 여기서, 야생형 단백질은 서열 번호 2, 4 또는 6으로 이루어진다. 변이체는 서열 GEXDG(여기서, X는 C, A 또는 G이며(서열 번호 107), X는 세린으로 치환됨)를 포함하는 모티브 내의 C-말단 영역에 세린을 포함하며, 이 변이체는 셀룰라아제 활성을 포함하고, 여기서, 폴리펩티드는 서열 GEXDG(서열 번호 107) 내에 세린이 결여된 야생형 셀룰라아제에 비해 증가된 내열성을 갖는다. 일 실시형태에서, 변이체는 대부분의 셀룰라아제 및 셀로바이오하이드롤라제 II 단백질에서 관찰되는 모티브 GECDG(예를 들어, 서열 번호 2, 아미노산 312-316 참조)에서 Cys→Ser의 하나 이상의 돌연변이를 포함하며(하기에서 더욱 충분히 기재되는 바와 같이), 내열성 또는 활성을 향상시키는 추가의 돌연변이를 포함할 수 있다. 셀룰라아제 간의 동일성이 상당히 낮을 수 있다. 상술된 바와 같은 세린 치환은 서열 번호 107의 모티브를 갖는 임의의 셀룰라아제에 적용가능하다(예를 들어, 여기서 폴리펩티드는 서열 번호 2 또는 4와 60% 이상의 동일성을 가짐).
예를 들어, 본 발명의 개시내용은 C314S를 포함하는 서열 번호 2와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C311S를 포함하는 서열 번호 4와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C310S를 포함하는 서열 번호 12와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C312S를 포함하는 서열 번호 13과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C314S를 포함하는 서열 번호 14와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C315S를 포함하는 서열 번호 15와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C313S를 포함하는 서열 번호 16과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C311S를 포함하는 서열 번호 17과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C313S를 포함하는 서열 번호 19와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C312S를 포함하는 서열 번호 21과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C311S를 포함하는 서열 번호 22와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 64와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C407S를 포함하는 서열 번호 65와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C394S를 포함하는 서열 번호 66과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 67과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 68과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 69와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 70과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 71과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 72와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 73과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 74와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C400S를 포함하는 서열 번호 75와 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C407S를 포함하는 서열 번호 76과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C394S를 포함하는 서열 번호 77과 85%, 90%, 95%, 98%, 99% 이상 동일하거나; C412S를 포함하는 서열 번호 78과 85%, 90%, 95%, 98%, 99% 이상 동일한 서열을 포함하는, 증가된 내열성 및 셀룰라아제 활성을 갖는 폴리펩티드를 제공하며, 여기서, 상기 폴리펩티드는 셀룰라아제 활성을 가지며, Cys→Ser 돌연변이가 결여된 이들의 상응하는 모체(야생형) 단백질에 비해 개선된 내열성을 갖는다.
*다른 실시형태에서, 본 발명의 개시내용은 상술된 폴리펩티드를 제공하나, 이들은 서열 번호 64와의 정렬에 의해 결정될 수 있는 하나 이상의 첨가 돌연변이를 추가로 포함하며, 여기서 서열 번호 64는 위치 413에 Pro를 포함하거나, 위치 231에 Ser 또는 Thr을 포함하거나, 위치 305에 Ser 또는 Thr을 포함하거나, 위치 410에 Gln 또는 Asn을 포함하거나, 위치 82에 Glu를 포함하거나 상기의 것의 임의의 조합을 포함한다. 서열 번호 64의 아미노산 서열과 서열 번호 2, 4, 6, 12-63 및 65-78의 서열의 서열 정렬에 의해 유사한 치환을 확인할 수 있다.
본 발명의 개시내용은 또한, 재조합적으로 생성되거나, 합성 제조되거나, 다르게는 비-천연적으로 생성되는 실질적으로 정제된 폴리펩티드를 제공하며, 여기서 상기 폴리펩티드는 하기에 나타낸 서열을 포함하며, 하기에 확인된 위치를 제외한 위치에 1 내지 10개, 10 내지 20개 또는 20 내지 30개의 보존적 아미노산 치환을 갖고, 하기에 확인된 위치에 C→S 치환이 존재한다:
C314S를 포함하는 서열 번호 2;
C311S를 포함하는 서열 번호 4;
C310S를 포함하는 서열 번호 12;
C312S를 포함하는 서열 번호 13;
C314S를 포함하는 서열 번호 14;
C315S를 포함하는 서열 번호 15;
C313S를 포함하는 서열 번호 16;
C311S를 포함하는 서열 번호 17;
C313S를 포함하는 서열 번호 19;
C312S를 포함하는 서열 번호 21;
C311S를 포함하는 서열 번호 22;
C400S를 포함하는 서열 번호 64;
C407S를 포함하는 서열 번호 65;
C394S를 포함하는 서열 번호 66;
C400S를 포함하는 서열 번호 67;
C400S를 포함하는 서열 번호 68;
C400S를 포함하는 서열 번호 69;
C400S를 포함하는 서열 번호 70;
C400S를 포함하는 서열 번호 71;
C400S를 포함하는 서열 번호 72;
C400S를 포함하는 서열 번호 73;
C400S를 포함하는 서열 번호 74;
C400S를 포함하는 서열 번호 75;
C407S를 포함하는 서열 번호 76;
C394S를 포함하는 서열 번호 77; 또는
C412S를 포함하는 서열 번호 78.
"분리된 폴리펩티드"는 천연적으로 이를 동반하는 다른 오염물질, 즉 단백질, 지질 및 폴리뉴클레오티드로부터 분리된 폴리펩티드를 말한다. 상기 용어는 이들의 천연 발생 환경 또는 발현 시스템(예를 들어, 숙주 세포 또는 시험관 내 합성)으로부터 제거되거나 정제된 폴리펩티드를 포함한다.
"실질적으로 순수한 폴리펩티드"는 폴리펩티드 종에 우세한 종이 존재하는 조성물을 말하며(즉, 이것은 몰 또는 중량 기준으로 조성물 내의 임의의 다른 개별 거대분자 종보다 더 풍부함), 일반적으로, 대상 종이 몰 또는 중량%로 표시되는 거대분자 종의 약 50% 이상을 포함하는 경우 실질적으로 정제된 조성물이다. 일반적으로, 실질적으로 순수한 폴리펩티드 조성물은 조성물 중에 존재하는 몰 또는 중량%로, 모든 거대분자 종의 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상 및 약 98% 이상을 포함할 것이다. 일부 실시형태에서, 대상 종은 본질적으로 균질(즉, 오염물질 종이 조성물에서 통상의 검출 방법에 의해서 검출될 수 없음)될 때까지 정제되고, 조성물은 본질적으로 단일의 거대분자 종으로 이루어진다. 용매 종, 소분자(500 Dalton 미만) 및 원소 이온 종은 거대분자 종으로 간주되지 않는다.
"참조 서열"은 서열 비교를 위한 근거로 사용되는 정의된 서열을 말한다. 참조 서열은 더 큰 서열의 서브셋, 예를 들어, 전장 유전자 또는 폴리펩티드 서열의 세그먼트일 수 있다. 일반적으로, 참조 서열은 핵산 또는 폴리펩티드의 20개 이상의 뉴클레오티드 또는 아미노산 잔기 길이, 25개 이상의 뉴클레오티드 또는 잔기 길이, 50개 이상의 뉴클레오티드 또는 잔기 길이, 또는 핵산 또는 폴리펩티드의 전장일 수 있다. 2개의 폴리뉴클레오티드 또는 폴리펩티드가 각각 (1) 두 서열 간의 유사한 서열(즉, 완전한 서열의 일 부분)을 포함할 수 있고, (2) 두 서열 간의 상이한 서열을 추가로 포함할 수 있기 때문에, 2개의(또는 그 이상의) 폴리뉴클레오티드 또는 폴리펩티드 간의 서열 비교는 전형적으로 서열 국소 영역의 유사성을 확인하고 비교하기 위하여, "비교창(comparison window)"에 걸쳐 폴리뉴클레오티드 또는 폴리펩티드의 서열을 비교함으로써 수행된다.
"서열 동일성"은 두 아미노산 서열이 비교창에 걸쳐 실질적으로 동일한 것(즉, 아미노산-대-아미노산 기준)을 의미한다. 용어 "서열 유사성"은 동일한 생물물리학적 특징을 공유하는 유사한 아미노산을 말한다. 용어 "서열 동일성 백분율" 또는 "서열 유사성 백분율"은 2개의 최적으로 정렬된 서열을 비교창에 걸쳐 비교하고, 2개의 폴리펩티드 서열에서 동일한 잔기(또는 유사한 잔기)가 나타나는 위치의 수를 결정하여, 매치되는 위치의 수를 생성하고, 매치되는 위치의 수를 비교창(즉, 창 크기) 내의 총 위치의 수로 나누고, 이 결과와 100을 곱하여, 서열 동일성 백분율(서열 유사성 백분율)을 생성함으로써 계산된다. 폴리뉴클레오티드 서열에 관하여, 용어 서열 동일성 및 서열 유사성은 단백질 서열에 대해 기재된 바와 유사한 의미를 가지며, 용어 "서열 동일성 백분율"은 2개의 폴리뉴클레오티드 서열이 비교창에 걸쳐 동일함(뉴클레오티드-대-뉴클레오티드 기준으로)을 나타낸다. 이와 같이, 폴리뉴클레오티드 서열 동일성 백분율(또는 예를 들어, 분석 알고리듬에 기초하여 침묵 치환 또는 다른 치환에 대한 폴리뉴클레오티드 서열 유사성 백분율)도 또한 계산할 수 있다. 본 명세서에 기재된 서열 알고리듬(또는 당업자가 입수할 수 있는 다른 알고리듬) 중 하나를 사용함으로써, 또는 시각적 검사에 의해 최대 일치가 결정될 수 있다.
폴리펩티드에 적용되는 경우, 용어 실질적 동일성 또는 실질적 유사성은 2개의 펩티드 서열이 디폴트 갭 가중치(default gap weight)를 사용하는 프로그램 BLAST, GAP 또는 BESTFIT에 의해서 또는 시각적 검사에 의해서와 같이 최적으로 정렬되는 경우, 서열 동일성 또는 서열 유사성을 공유함을 의미한다. 유사하게, 2개의 핵산의 맥락에서 적용되는 경우, 용어 실질적 동일성 또는 실질적 유사성은 2개의 핵산 서열이 디폴트 갭 가중치를 사용하는 프로그램 BLAST, GAP 또는 BESTFIT에 의해서 또는 시각적 검사에 의해서와 같이 최적으로 정렬되는 경우, 서열 동일성 또는 서열 유사성을 공유함을 의미한다.
서열 동일성 또는 서열 유사성 백분율을 결정하기에 적합한 알고리듬 중 한 예는 문헌[Pearson, W. R. & Lipman, D. J., (1988) Proc. Natl. Acad. Sci. USA 85:2444]에 기술된 FASTA 알고리듬이다. 또한, 문헌[W. R. Pearson, (1996) Methods Enzymology 266:227-258]도 참조하길 바란다. 동일성 백분율 및 유사성 백분율을 계산하기 위하여 DNA 서열의 FASTA 정렬에 사용되는 바람직한 파라미터는, BL50 매트릭스 15: -5, k-tuple=2; 참여 벌점(joining penalty)=40, 최적화(optimization)=28; 갭 벌점=-12, 갭 길이 벌점=-2; 및 폭=16으로 최적화된다.
유용한 알고리듬의 다른 예는 PILEUP이다. PILEUP는 관계 및 서열 동일성 백분율 또는 서열 유사성 백분율을 나타내는 진행적인 쌍대(pairwise) 정렬을 이용한 관련 서열의 그룹으로부터의 다중 서열 정렬을 발생시킨다. 또한, 이에 의해, 정렬을 생성시키는데 사용되는 클러스터링 관계를 나타내는 트리(tree) 또는 덴도그램(dendogram)을 작도한다. PILEUP는 문헌[Feng & Doolittle, J. Mol. Evol. 35:351-360 (1987)]의 진행적 정렬 방법의 간소화를 이용한다. 사용되는 방법은 문헌[Higgins & Sharp, (1989) CABIOS 5:151-153]에 기재된 방법과 유사하다. 프로그램은 300개 이하의 서열(5,000개 뉴클레오티드 또는 아미노산의 최대 길이 각각)을 정렬시킬 수 있다. 다중 정렬 절차는 2개의 가장 유사한 서열의 쌍대(pairwise) 정렬로 시작하여, 2개의 정렬된 서열의 클러스터를 생성시킨다. 이후, 이러한 클러스터는 다음의 가장 관련된 서열 또는 정렬된 서열의 클러스터로 정렬된다. 서열의 2개의 클러스터는 2개의 개별적 서열의 쌍대 정렬의 간단한 연장에 의해 정렬된다. 최종 정렬은 일련의 진행적인 쌍대 정렬에 의해 달성된다. 프로그램은 특정 서열 및 이의 아미노산 또는 뉴클레오티드 좌표를 서열 비교 영역에 지정하고, 프로그램 파라미터를 지정함으로써 수행된다. PILEUP을 이용하여, 참조 서열은 디폴트 갭 가중치(3.00), 디폴트 갭 길이 가중치(0.10), 및 가중치화된 말단 갭과 같은 파라미터를 이용하여 서열 동일성 백분율(또는 서열 유사성 백분율) 관계를 결정하기 위해 다른 시험 서열과 비교된다. PILEUP는 GCG 서열 분석 소프트웨어 패키지, 예를 들어, 버전 7.0으로부터 수득될 수 있다(Devereaux et al., (1984) Nuc. Acids Res. 12:387-395).
다중의 DNA 및 아미노산 서열 정렬에 적합한 알고리듬의 다른 예는 CLUSTALW 프로그램(Thompson, J. D. et al., (1994) Nuc. Acids Res. 22:4673-4680)이다. CLUSTALW는 서열 그룹들 간의 다중 쌍대 비교를 실시하고, 그것들을 모아서 서열 동일성을 기준으로 다중 정렬을 만든다. 갭 오픈(open) 및 갭 확장(extension) 벌점은 각각 10 및 0.05이다. 아미노산 정렬을 위하여, BLOSUM 알고리듬을 단백질 가중치 매트릭스로서 사용할 수 있다(Henikoff and Henikoff, (1992) Proc. Natl. Acad. Sci. USA 89:10915-10919).
상술된 바와 같이, 셀로바이오하이드롤라제 및 셀룰라아제 패밀리 구성원은 만들어지는 모티브 GECDG(예를 들어, 서열 번호 2 아미노산 312-316 참조) 내의 서열 정렬 및 치환에 의해 동정될 수 있다. 그 다음, 변형된 폴리펩티드를 후술되는 바와 같이 다양한 온도 및 조건에서 활성에 대해 검정하여, 바람직한 활성이 도입된 변형을 확인할 수 있다. 예시적인 서열은 하기의 GenBank 수탁 번호에서 찾을 수 있으며, 이의 서열은 본 명세서에 참고로 포함된다.
Figure pat00001
다른 실시형태에서, 향상된 내열성을 갖는 변이체 셀룰라아제 폴리펩티드의 패밀리는 C→S, G→S 또는 A→S 치환을 갖는 하기 표에 기재된 것을 포함한다. 또한, 하기 표에서 동정된 치환을 갖는 하기의 서열 중 임의의 것에 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지며, 셀룰라아제 활성 및 내열성을 갖는 폴리펩티드도 또한 본 발명의 개시내용에 포함된다.
H. 제코리나 CBH II에 가장 높은 동일성을 갖는 단백질 서열에 대한 H. 제코리나 CBH II Cys311을 브라켓팅(bracketing)하는 아미노산 프레임의 정렬. 311 등가 위치의 잔기를 진하게 밑줄로 나타내었다. 본 작업에서 연구한 재조합 H. 인솔렌스 및 P. 크리소스포리움 CBH II에 대한 서열을 H. 인솔렌스 및 P. 크리소스포리움으로 표기한다. 250개의 가장 동일한 서열 중 54개를 중복성 때문에 배제시켰다(즉, 구조 연구를 위한 점 돌연변이체 또는 95% 초과로 동일한 아형(isoform)). 셀룰라아제에 대한 수탁 번호가 나타나며, 상응하는 서열은 수탁 번호로부터 직접적으로 복사되는 것처럼, 본 명세서에 참고로 포함된다. 수탁 번호와 관련된 서열은 서열 번호 79-106으로 언급된다. 볼드체-밑줄친 잔기(예를 들어, C, A 또는 G)를 S로 대체함. 나타낸 서열 다음의 괄호 안의 숫자는 서열 번호임.
Figure pat00002
본 발명의 개시내용의 목적을 위하여, 본 발명의 개시내용의 폴리펩티드는 이것이 모체 셀룰라아제의 T50보다 약 4 ℃ 이상, 또는 약 9 ℃ 이상 더 높은 T50을 갖거나, 예를 들어, 모체 셀로바이오하이드롤라제의 T50에 비해 약 4 ℃ 내지 약 30 ℃ 더 높은 T50 또는 그 사이의 임의의 값, 또는 약 9 ℃ 내지 약 30 ℃ 더 높은 T50 또는 그 사이의 임의의 값을 갖는다면, 상응하는 모체 폴리펩티드에 비해 향상된 내열성을 나타낸다. T50은 변형된 효소 또는 천연 효소가 15분 동안의 사전-인큐베이션 후에 50%의 그의 잔류 활성을 보유하는 온도이며, 하기 실시예에 기재되거나 해당 분야에 알려져 있는 검정에 의해 결정된다.
본 발명의 개시내용의 변형된 셀로바이오하이드롤라제 또는 셀룰라아제는 상응하는 모체 셀로바이오하이드롤라제(예를 들어, 서열 번호 2, 4 또는 6)의 T50보다 약 4 ℃ 내지 약 30 ℃ 더 높거나, 또는 그 사이의 임의의 범위, 약 5 ℃ 내지 약 20 ℃ 더 높거나, 또는 그 사이의 임의의 범위, 약 8 ℃ 내지 약 15 ℃ 더 높거나, 또는 그 사이의 임의의 범위, 또는 약 9 ℃ 내지 약 15 ℃ 더 높거나 또는 그 사이의 임의의 범위인 T50을 가질 수 있다. 예를 들어, 변형된 셀룰라아제는 상응하는 모체 셀로바이오하이드롤라제의 T50 보다 약 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28 또는 30 ℃ 이상 더 높은 T50을 가질 수 있다.
또한, 본 명세서에서 확인된 변이체를 사용하여 키메라 셀로바이오하이드롤라제를 생성할 수 있다. 예를 들어, SCHEMA는 수백개의 활성이 있는 β-락타마제 및 사이토크롬 P450 효소 키메라의 패밀리를 생성하기 위하여 이전에 사용되었다. SCHEMA는 단백질 구조 데이터를 사용하여, <E>를 최소화하는 연속 아미노산 "블록"의 경계를 한정하며, <E>는 블록이 상이한 모체 중에 교환되는 경우 파괴되는 아미노산 측쇄 접촉의 라이브러리 평균 수이다. β-락타마제 키메라가 폴딩되고 활성이 있을 가능성은 그 서열에 대한 E 값에 반비례하였음을 보여주었다. RASPP(최단 경로 문제로서 재조합) 알고리듬을 사용하여, 돌연변이의 라이브러리 평균 수인 <m>에 비해 <E>를 최소화하는 블록 경계를 확인하였다. 3개의 모체로부터의 8개의 블록(38 = 6,561가지의 가능한 서열)으로 이루어진 β-락타마제 집합물(collection)로부터 특성화된 약 500개의 독특한 키메라 중 20% 초과의 키메라가 촉매적으로 활성이 있었다. 유사한 방법으로, 2,300개 초과의 신규한, 촉매적으로 활성이 있는 효소를 함유하는 3-모체, 8-블록 사이토크롬 P450 키메라 패밀리를 생성하였다. 이들 2개의 집합물로부터의 키메라는 각각 가장 근접한 모체로부터 평균 66개 및 72개 아미노산의 높은 수의 돌연변이로 특성화되었다. 따라서, SCHEMA/RASPP는 상당한 분획의 기능적 구성원 및 유의미한 서열 가변성을 갖는 키메라 패밀리의 설계를 가능하게 한다.
또한, 서열의 소표본으로부터의 서열-안정성 데이터를 기준으로 SCHEMA 키메라의 내열성이 예측될 수 있음이 알려져 있다. 184개의 사이토크롬 P450 키메라에 대한 열 불안정화 데이터의 선형 회귀 모델링은 SCHEMA 블록이 내열성에 대해 부사적으로 기여하는 것을 보여주었다. 이러한 모델에 의해 300개 초과의 키메라가 내열성으로 예측되었으며, 시험하였던 모든 44개가 가장 안정적인 모체보다 더 안정하였다. 35개 만큼 적은 내열성 척도를 사용하여 가장 내열성인 키메라를 예측할 수 있는 것으로 추정되었다. 더욱이, 내열성 P450 키메라는 독특한 활성 및 특이성 프로파일을 나타내며, 이 프로파일은 키메라생성(chimeragenesis)이 추가의 유용한 효소 특성을 야기할 수 있음을 보여준다. 여기에서, CBH II 효소의 SCHEMA 재조합으로, 고온에서, 연장된 기간에 걸쳐, 그리고 광범위한 pH에 걸쳐, 인산 팽윤형 셀룰로오스(PASC)상에서 활성이 있는 키메라 셀룰라아제를 생성할 수 있다.
본 명세서에 기재된 방법을 사용하여, 야생형 모체 CBH II 단백질에 비해 향상된 특성을 갖는, 셀로바이오하이드롤라제 활성을 갖는 많은 키메라 폴리펩티드를 생성하였다.
3개의 진균류 CBH II 효소로부터의 서열의 블록을 교환함으로써 신규한 CBH II 효소의 다양한 패밀리를 구축하였다. 이러한 세트로부터 샘플링한 48개 키메라 서열 중 23개는 S. 세레비지애에 의해 활성형으로 분비되었으며, 5개는 63 ℃에서, 가장 안정적인 모체보다 더 큰 반감기를 갖는다. 이러한 48개-구성원 샘플 세트가 가능한 총 6,561개 서열 중 1% 미만을 대표하는 것을 고려하여, 본 발명자들은 이러한 키메라의 하나의 집합물이 이미 수백 개의 활성이 있는 내열성 CBH II 효소를 함유하는 것으로 예측하였으며, 이는 CAZy 데이터베이스에서 대략 20개의 진균류 CBH II 효소를 위축시키는 수이다.
제2 CBH II 검증 세트에서 모든 10개의 촉매적 활성 키메라가 호열성 진균류 H. 인솔렌스로부터의 가장 안정적인 모체, 천연-내열성 CBH II보다 더 내열성이었음의 발견에 의하여, 키메라 내열성에 긍정적으로 기여하는 블록을 확인하기 위하여 샘플 세트 서열-안정성 데이터를 사용하는 방법을 검증하였다. 따라서, 본 발명의 개시내용은 S. 세레비지애에서 촉매적 활성형으로 발현되는 총 33개의 새로운 CBH II 효소까지 생성하였으며, 이 중 15개는 이들이 작제되었던 가장 안정적인 모체보다 더 내열성이다. 이들 15개의 내열성 효소는 서열이 다르며, 각각 94개 및 58개 아미노산 위치만큼 많은 위치에서 서로 그리고 이들의 가장 근접한 천연 상동체와 상이하다.
합한 샘플 및 검증 세트에서 CBH II 키메라의 내열성의 분석으로, 확인된 4개의 내열성화 블록, 즉 B1P1, B6P3, B7P3 및 B8P2가 동일한 키메라에 존재하는 경우 열 안정성에 누적하여 기여하는 것이 나타났다. H. 인솔렌스 CBH II보다 더 내열성인 5개 샘플 세트 키메라 중 4개가 이들 안정화 블록 중 2개 또는 3개를 함유한다(표 1). 모두가 H. 인솔렌스 CBH II보다 더 안정적인 검증 세트의 10개의 활성이 있는 구성원은 2개 이상의 안정화 블록을 함유하고, 이 그룹에서 6개의 가장 내열성인 키메라 중 5개가 3개 또는 4개의 안정화 블록을 함유한다.
본 발명의 개시내용은 안정화 블록을 재결합하여, 매우 안정적이고, 활성이 있는 신규한 셀룰라아제를 생성할 수 있음을 보여준다. 안정성 회귀 모델로, CBH II SCHEMA 라이브러리가 가장 안정적인 모체 효소보다 더 안정적인 2,026개의 키메라를 함유하는 것으로 예측된다. 이들 키메라는 천연 셀룰라아제와 다르며 그와 별개이고; 이들은 8 내지 72개 돌연변이(평균 50개)까지 모체와 상이하고, 평균 63개 돌연변이까지 서로 상이하다. 이러한 세트로부터의 총 33개의 유전자를 합성하고 S. 세레비지애에서 발현시켰으며; 이들 키메라 CBH II의 모든 것이 63 ℃에서 그의 불활성화 반감기 또는 T50 중 어느 하나로 측정시, 호열성 진균류 H. 인솔렌스로부터의 가장 안정적인 모체 셀룰라아제보다 더 안정적인 것으로 밝혀졌다. 오직 8개의 블록의 키메라를 제조함으로써, 서열 복잡성을 감소시켜, 서열-안정성 모델의 생성 및 단일의 고도의 안정화 서열 블록의 확인을 가능하게 하였다. 이러한 블록 내에서 오직 10개의 아미노산 치환만을 시험함으로써, 단일의, 고도의 안정화 치환을 확인하였다. 키메라에 걸쳐 관찰되고 본래 P. 크리소스포리움, H. 인솔렌스 및 H. 제코리나 CBH II 효소에서 관찰되는 C313S(서열 번호 6을 참조함; C314S, 서열 번호 2 및 C311S, 서열 번호 4) 치환의 매우 큰 안정화 효과는 이러한 위치에서 임의의 잔기의 Ser으로의 돌연변이가 이것이 도입되는 임의의 패밀리 6 셀룰라아제를 안정화시킬 수 있음을 시사한다.
재조합시에 파괴된 접촉의 수를 최소화시켜(도 2c), 블록을 전체 단백질의 안정성에 독립적으로 기여하는 분리된 유닛으로서 접근되게 하여, 키메라 내열성에 누적하여 또는 심지어는 부가하여 기여하게 한다. 이러한 CBH II 효소 재조합에 대하여, SCHEMA는 이러한 파괴된 접촉을 최소화하는데 효과적이다: H. 인솔렌스 모체 CBH II 결정 구조에서 정해진 총 303개의 블록 사이 접촉이 있는 한편, CBH II SCHEMA 라이브러리 설계는 오직 33개의 가능한 접촉의 파괴를 야기한다. CBH II 효소 모체가 명백한 구조적 서브도메인(subdomain)을 특징으로 하지 않고, 8개의 블록 중 오직 4개(1, 5, 7 및 8) 만이 밀집한 구조 유닛 또는 모듈과 유사한 점을 고려하여, 적은 수의 파괴된 접촉은 SCHEMA/RASPP 알고리듬이 블록의 수가 구조적 서브디비젼(subdivision)의 수보다 더 큰 것으로 나타나는 경우에 효과적임을 시사한다. β-락타마제 및 사이토크롬 P450 키메라에 대하여 이전에 관찰된 바와 같이, 낮은 E 값은 키메라 폴딩 및 활성의 전조가 된다. 본 명세서에서 사용되지 않았지만, 이러한 관계는 높은 분획의 활성이 있는 구성원을 함유하는 키메라 샘플 세트를 설계하는데 유익할 것이다.
본 발명의 개시내용은 또한 키메라를 사용하여, pH 안정성이 CBH II 효소에서 향상될 수 있는지를 결정하였다. H. 제코리나 CBH II의 특이적 활성은 최적의 값인 5를 초과하여 증가함에 따라 급격하게 감소하는 반면, 안정화 블록을 산업적으로 가장 유의미한 H. 제코리나 CBH II 효소에 치환함으로써 생성되는 HJPlus는 이들 더 높은 pH에서 상당히 더 많은 활성을 보유한다(도 4). 내열성 11113132 및 13311332 키메라 및 또한 H. 인솔렌스 및 C. 써모필럼 CBH II 셀룰라아제 모체는 HJPlus보다 훨씬 더 넓은 pH/활성 프로필을 갖는다. H. 제코리나 CBH II의 좁은 pH/활성 프로필은 몇몇 카복실-카복실레이트 쌍의 탈양자화에 기여하며, 이는 pH 약 6 초과에서 단백질을 불안정화시킨다. HJPlus에서 블록 7 내의 모체 3의 치환은 아스파르트산염 227을 히스티딘으로 변화시키며, (블록 8의) D277 및 D316 사이의 카복실-카복실레이트 쌍을 제거한다. D277을 양으로 하전된 히스티딘으로 대체하는 것은 비산성 pH에서 전하 반발의 불안정화를 방지하여, HJPlus가 H. 제코리나 CBH II보다 더 높은 pH에서 활성을 보유하게 할 수 있다. 남아있는 2개의 내열성 키메라 및 H. 인솔렌스 및 C. 써모필럼 모체 CBH II 효소의 훨씬 더 넓은 pH/활성 프로필은 HJPlus 및 H. 제코리나 CBH II의 E57-E119 카복실-카복실레이트 쌍에 상응하는 위치에서의 산성 잔기의 부재 때문일 수 있다.
HJPlus는 상대적으로 높은 특이적 활성 및 높은 내열성 양자 모두를 나타낸다. 도 5는 이들 특성이 장기간 가수분해 실험에서 훌륭한 성능을 야기함을 보여준다: HJPlus는 모체 CBH II 효소보다 7 내지 15 ℃ 더 높은 온도에서 셀룰로오스를 가수분해하였으며, 또한 이들의 온도 최적조건에서 모든 모체에 비해 상당히 증가된 장기간 활성을 가져, 1.7배만큼 H. 제코리나 CBH II보다 더 나았다. HJPlus 키메라의 특이적 활성이 H. 제코리나 CBH II 모체의 특이적 활성보다 더 낮은 점을 고려하여, 이러한 증가된 장기간 활성은 내열성 HJPlus가 최적의 가수분해 온도에서 더 긴 반응 시간 동안 활성을 보유하는 능력에 기여할 수 있다.
다른 2개의 내열성 키메라는 HJPlus의 넓은 온도 범위를 공유한다. 이러한 관찰은 승온 및 최고 작동 온도에서의 t1/ 2간의 양의 관계를 뒷받침하며, 6,561개의 CBH II 키메라 서열 중의 많은 내열성 키메라도 또한 승온에서 셀룰로오스를 분해시킬 수 있을 것임을 시사한다. 승온에서 무정형 PASC 기질을 가수분해하는 이러한 능력이 내열성 진균류 CBH II 키메라의 강력한 유용성의 징조이나, 결정질 기질 및 리그닌을 함유하는 기질을 더 조사하는 연구는 바이오매스 분해 응용에 대한 이러한 신규 CBH II 효소 패밀리의 관련성의 더 완전한 평가를 제공할 것이다.
바이오매스 전환 과정의 대부분은 진균류 셀룰라아제(주로 CBH II, 셀로바이오하이드롤라제 클래스 I(CBH I), 엔도글루카나제 및 β-글루코시다제)의 혼합물을 사용하여, 높은 수준의 셀룰로오스 가수분해를 달성한다. 다양한 그룹의 내열성 CBH II 효소 키메라를 생성하는 것은 효소 혼합물이 특정 응용 및 공급원료를 위해 제형화되고 최적화될 수 있는 안정적인, 고도의 활성이 있는 셀룰라아제의 목록을 구축하는 데에서의 첫번째 단계이다.
"펩티드 세그먼트"는 더 큰 폴리펩티드 또는 단백질의 한 부분 또는 단편을 말한다. 펩티드 세그먼트는 그 자체가 기능적 활성을 가질 필요가 없지만, 일부 예에서, 펩티드 세그먼트는 그 자체의 생물학적 활성을 갖는 폴리펩티드의 도메인에 해당할 수 있다. 안정성-관련 펩티드 세그먼트는 이러한 펩티드 세그먼트가 결여된 관련 폴리펩티드에 비해 안정성, 기능 또는 폴딩을 증진시키는 폴리펩티드에서 관찰되는 펩티드 세그먼트이다. 불안정화-관련 펩티드 세그먼트는 폴리펩티드 내에 존재하는 경우 안정성, 기능 또는 폴딩의 소실을 유발하는 것으로 확인되는 펩티드 세그먼트이다.
"융합된", "작동가능하게 연결된" 및 "작동가능하게 회합된"은 2개의 다른 별개의 도메인 또는 펩티드 세그먼트의 화학적 또는 물리적 커플링을 광범위하게 지칭하는 것으로 본 명세서에서 상호교환하여 사용되며, 여기서, 각각의 도메인 또는 펩티드 세그먼트는 작동가능하게 연결되는 경우, 원하는 활성을 갖는 기능적 폴리펩티드를 제공할 수 있다. 도메인 또는 펩티드 세그먼트는 이들이 작용성이 되도록 펩티드 링커를 통하여 연결될 수 있거나, 다른 중간체 또는 화학적 결합을 통해 융합될 수 있다. 예를 들어, 2개의 도메인은 동일한 코딩 서열의 부분일 수 있으며, 여기서, 폴리뉴클레오티드는 전사될 때 단일의 mRNA를 엔코딩하고, 이 단일의 mRNA는 번역될 때 단일의 폴리펩티드로서 두 도메인 모두를 포함하도록 인-프레임 (in frame)이다. 대안적으로, 두 도메인 모두는 개별 폴리펩티드로서 따로 발현되고, 화학 결합을 사용하여 서로 융합될 수 있다. 전형적으로, 코딩 도메인은 직접 또는 펩티드 링커에 의해 분리되어, "인-프레임"으로 연결되며, 단일의 폴리뉴클레오티드에 의해 엔코딩될 것이다. 펩티드 링커 및 펩티드에 대한 다양한 코딩 서열이 해당 분야에 알려져 있다.
"폴리뉴클레오티드" 또는 "핵산 서열"은 폴리머 형태의 뉴클레오티드를 말한다. 일부 예에서, 폴리뉴클레오티드는 그것이 유래되는 유기체의 천연 발생 게놈에서 바로 연속되는(contiguous)(5' 말단에 하나, 그리고 3' 말단에 하나) 코딩 서열 중 어느 하나와 바로 연속되지 않은 서열을 말한다. 따라서, 상기 용어는 예를 들어, 벡터 내에 혼입되거나; 자가 복제 플라스미드 또는 바이러스 내에 혼입되거나; 원핵생물 또는 진핵생물의 게놈 DNA 내에 혼입되거나, 또는 다른 서열과 독립적으로 별개의 분자로 존재하는(예컨대, cDNA) 재조합 DNA를 포함한다. 본 발명의 개시내용의 뉴클레오티드는 리보뉴클레오티드, 데옥시리보뉴클레오티드 또는 어느 하나의 뉴클레오티드의 변형된 형태일 수 있다. 본 명세서에서 사용된 폴리뉴클레오티드는 다른 것 중 특히, 단일- 및 이중-가닥 DNA, 단일- 및 이중-가닥의 영역의 혼합물인 DNA, 단일- 및 이중-가닥 RNA, 및 단일- 및 이중-가닥 영역의 혼합물인 RNA, 단일-가닥 또는 더욱 전형적으로는, 이중-가닥, 또는 단일- 및 이중-가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 하이브리드(hybrid) 분자를 말한다. 용어 폴리뉴클레오티드는 게놈 DNA 또는 RNA(유기체, 즉 바이러스의 RNA 게놈에 좌우됨)뿐 아니라, 게놈 DNA 및 cDNA에 의해 엔코딩된 mRNA를 포함한다.
"핵산 세그먼트", "올리고뉴클레오티드 세그먼트" 또는 "폴리뉴클레오티드 세그먼트"는 더 큰 폴리뉴클레오티드 분자의 일 부분을 말한다. 폴리뉴클레오티드 세그먼트는 단백질의 엔코딩된 기능성 도메인에 상응할 필요가 없으나; 일부 경우에, 세그먼트는 단백질의 기능성 도메인을 엔코딩할 것이다. 폴리뉴클레오티드 세그먼트는 약 6개 이상의 뉴클레오티드 길이(예를 들어, 6개 내지 20개, 20개 내지 50개, 50개 내지 100개, 100개 내지 200개, 200개 내지 300개, 300개 내지 400개 이상의 뉴클레오티드 길이)일 수 있다. 안정성-관련 펩티드 세그먼트는 안정성-관련 폴리뉴클레오티드 세그먼트에 의해 엔코딩될 수 있으며, 여기서, 펩티드 세그먼트는 이러한 펩티드 세그먼트가 결여된 폴리펩티드에 비해 안정성, 기능 또는 폴딩을 증진시킨다.
"키메라"는 2개 이상의 상이한 모체 단백질의 2개 이상의 세그먼트의 조합을 말한다. 당업자에게 인식될 바와 같이, 세그먼트는 실제로 각각의 모체에서 생길 필요가 없는데, 이는 키메라가 천연의 핵산 그들 자체가 아닌, 관련이 있는 특정 서열이기 때문이다. 예를 들어, 키메라 진균류 클래스 II 셀로바이오하이드롤라제(CBH II 셀룰라아제)는 2개의 상이한 모체 CBH II 폴리펩티드로부터의 2개 이상의 세그먼트를 가질 것이다. 셀룰라아제 활성을 갖는 새로운 폴리펩티드를 초래하도록 2개의 세그먼트가 연결된다. 다시 말하면, 단백질은 이것이 전장 모체 중 어느 하나의 동일한 서열을 갖는다면, 키메라가 아닐 것이다. 키메라 폴리펩티드는 2개의 상이한 모체 단백질로부터의 2개 초과의 세그먼트를 포함할 수 있다. 예를 들어, 각 최종 키메라 또는 키메라 라이브러리에 대한 2개, 3개, 4개, 5개 내지 10개, 10개 내지 20개 이상의 모체가 있을 수 있다. 각각의 모체 폴리펩티드의 세그먼트는 매우 짧거나 매우 길 수 있으며, 세그먼트는 단백질의 전장의 1 내지 90%, 95%, 98%, 또는 99%의 연속 아미노산 길이의 범위일 수 있다. 일 실시형태에서, 최소 길이는 10개 아미노산이다. 일 실시형태에서, 단일의 교차점이 2개의 모체에 대하여 정의된다. 교차 위치는 하나의 모체의 아미노산 세그먼트가 멈출 위치 및 다음의 모체의 아미노산 세그먼트가 시작할 위치를 정의한다. 따라서, 단순한 키메라는 오직 하나의 교차 위치를 가질 것이며, 교차 위치 전의 세그먼트가 하나의 모체에 속하고, 교차 위치의 이후의 세그먼트가 제2 모체에 속할 것이다. 일 실시형태에서, 키메라는 하나 초과의 교차 위치, 예를 들어, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개 내지 30개 이상의 교차 위치를 갖는다. 이들 교차 위치가 명명되고 정의되는 방법 둘 모두가 하기에 기재되어 있다. 2개의 교차 위치 및 2개의 모체가 있는 실시형태에서, 제1 모체로부터의 제1 연속 세그먼트에 이어서, 제2 모체로부터의 제2 연속 세그먼트에 이어서, 제1 모체로부터의 제3 연속 세그먼트가 있을 것이다. 연속은 세그먼트를 중단시키는 유의성이 없음을 표시하는 것을 의미한다. 이들 연속 세그먼트는 연결되어 연속 아미노산 서열을 형성한다. 예를 들어, 100 및 150에서 2개의 교차를 갖는 휴미콜라 인솔렌스(Humicola insolens)(하기에서 "1") 및 H. 제코리나(하기에서 "2")로부터의 CBH II 키메라는 1로부터 처음 100개 아미노산에 이어서, 2로부터 다음 50개에 이어서, 1로부터 나머지의 아미노산을 가질 수 있으며, 모두가 하나의 연속 아미노산 사슬로 연결된다. 대안적으로, CBH II 키메라는 2로부터 처음 100개 아미노산에 이어서, 1로부터 다음 50개에 이어서, 2로부터 나머지의 아미노산을 가질 수 있다. 당업자에게 인식된 바와 같이, 정확한 서열뿐 아니라 키메라의 변이체가 존재한다. 따라서, 키메라가 변이체 키메라이면, 각각의 세그먼트의 100%가 최종 키메라에 존재하지 않아도 된다. 추가의 잔기, 또는 잔기의 제거 또는 변경 중 어느 하나를 통해 변경될 수 있는 양은 변이체가 정의됨에 따라 정의될 것이다. 물론, 당업자에게 이해되는 바와 같이, 상기의 설명은 아미노산뿐 아니라 아미노산을 엔코딩하는 핵산에도 적용된다.
본 발명의 개시내용은 특이적 변이체 외에, CBH II 키메라를 생성하는데 사용될 수 있는 변이체를 기재한다. 지정된 SCHEMA 재조합 라이브러리를 사용하여 이러한 다양한 효소 패밀리의 특히 잘-연구된 구성원을 기초로 셀로바이오하이드롤라제 효소, 더욱 특히 셀로바이오하이드롤라제 II 효소를 생성하였다: H. 인솔렌스는 모체 "1"(서열 번호 2)이며, H. 제코리나는 모체 "2"(서열 번호 4)이고, C. 써모필럼은 모체 "3"(서열 번호 6)이다. SCHEMA는 상동성 단백질의 어떤 단편이 단백질의 구조적 무결성에 영향을 미치지 않고 재결합될 수 있는지를 예측하기 위한 컴퓨터 기반의 방법이다(참조예: Meyer et al., (2003) Protein Sci., 12:1686-1693). 이러한 컴퓨터 방법으로, CBH II 모체 단백질에서 7개의 재조합 점을 확인하여, CBH II 키메라 폴리펩티드의 라이브러리의 형성을 가능하게 하였으며, 여기서 각각의 폴리펩티드는 8개의 세그먼트를 포함한다. 서열-안정성 데이터의 선형 회귀의 사용에 의해, 또는 폴딩된 단백질 대 폴딩되지 않은 단백질의 MSA의 일치 분석(consensus analysis)에 의존함으로써, 각각의 세그먼트의 전반적인 안정성에의 추가의 기여를 결정함으로써, 안정성이 더 높은 키메라를 동정할 수 있다. SCHEMA 재조합은 허용되는(tolerant) 잔기를 교환하면서 중요한 기능의 잔기를 보존함으로써, 키메라가 생물학적 기능을 보유하며, 높은 서열 다양성을 나타내는 것을 보장한다.
따라서, 본 명세서에서 다양한 실시형태로 예시된 바와 같이, 본 발명의 개시내용은 그의 모체 가닥 또는 생성된 키메라 코딩 서열이 상술된 바와 같이 C→S 치환을 포함하도록 변형될 수 있는 모체 도메인의 키메라를 포함하는 CBH II 폴리펩티드를 제공한다. 일부 실시형태에서, 폴리펩티드는 상이한 모체 CBH II 단백질로부터 N-에서 C-말단으로 다수의 도메인을 갖는 키메라를 포함한다:
(세그먼트 1)-(세그먼트 2)-(세그먼트 3)-(세그먼트 4)-(세그먼트 5)-(세그먼트 6)-(세그먼트 7)-(세그먼트 8),
여기서, 세그먼트 1은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 1 내지 약 x1을 포함하고; 세그먼트 2는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x1 내지 약 x2이고; 세그먼트 3은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x2 내지 약 x3이고; 세그먼트 4는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x3 내지 약 x4이고; 세그먼트 5는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x4 내지 약 x5이고; 세그먼트 6은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x5 내지 약 x6이고; 세그먼트 7은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x6 내지 약 x7이고; 세그먼트 8은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x7 내지 약 x8이고; 여기서 x1은 서열 번호 2의 잔기 43, 44, 45, 46 또는 47, 또는 서열 번호 4 또는 서열 번호 6의 잔기 42, 43, 44, 45 또는 46이고; x2는 서열 번호 2의 잔기 70, 71, 72, 73 또는 74, 또는 서열 번호 4 또는 서열 번호 6의 잔기 68, 69, 70, 71, 72, 73 또는 74이고; x3은 서열 번호 2의 잔기 113, 114, 115, 116, 117 또는 118, 또는 서열 번호 4 또는 서열 번호 6의 잔기 110, 111, 112, 113, 114, 115 또는 116이고; x4는 서열 번호 2의 잔기 153, 154, 155, 156 또는 157, 또는 서열 번호 4 또는 서열 번호 6의 잔기 149, 150, 151, 152, 153, 154, 155 또는 156이고; x5는 서열 번호 2의 잔기 220, 221, 222, 223 또는 224, 또는 서열 번호 4 또는 서열 번호 6의 잔기 216, 217, 218, 219, 220, 221, 222 또는 223이고; x6은 서열 번호 2의 잔기 256, 257, 258, 259, 260 또는 261, 또는 서열 번호 4 또는 서열 번호 6의 잔기 253, 254, 255, 256, 257, 258, 259 또는 260이고; x7은 서열 번호 2의 잔기 312, 313, 314, 315 또는 316, 또는 서열 번호 4 또는 서열 번호 6의 잔기 309, 310, 311, 312, 313, 314, 315 또는 318이고; x8은 서열 번호 2, 서열 번호 4 또는 서열 번호 6의 서열을 갖는 폴리펩티드의 C-말단에 상응하는 아미노산 잔기이다.
상기 도메인 참조를 사용하여, 다수의 키메라 구조를 표 1에 나타낸 바와 같이 생성하였다.
H. 인솔렌스 모체 CBH II에 대한 64.8 ℃의 T50 측정값보다 더 높은 것으로 예측된 T50 값을 갖는 1,588개의 CBH II 키메라 서열
Figure pat00003
Figure pat00004
Figure pat00005
Figure pat00006
Figure pat00007
상기 표를 참조하여, 각 숫자는 키메라 CBH II 폴리펩티드의 도메인을 지칭한다. 상기 숫자는 도메인이 유래되는 모체 가닥을 나타낸다. 예를 들어, 서열 12111131을 갖는 키메라 CBH II 키메라 폴리펩티드는 폴리펩티드가 N-에서 C-말단으로, 서열 번호 2의 약 x7 내지 x8(예컨대, C-말단)의 아미노산에 연결된 서열 번호 6("3")의 약 x6 내지 x7의 아미노산에 연결된 서열 번호 2의 약 x5 내지 약 x6의 아미노산에 연결된 서열 번호 2의 약 x4 내지 약 x5의 아미노산에 연결된 서열 번호 2의 약 x3 내지 약 x4의 아미노산에 연결된 서열 번호 2의 약 x2 내지 약 x3의 아미노산에 연결된 서열 번호 4("2")의 약 x1 내지 x2의 아미노산에 연결된 서열 번호 2("1")의 약 1 내지 x1의 아미노산의 서열을 포함함을 나타낸다.
일부 실시형태에서, CBH II 폴리펩티드는 하기로 이루어진 군으로부터 선택되는 키메라 세그먼트 구조를 갖는다:
11113132, 21333331, 21311131, 22232132, 33133132, 33213332, 13333232, 12133333, 13231111, 11313121, 11332333, 12213111, 23311333, 13111313, 31311112, 23231222, 33123313, 22212231, 21223122, 21131311, 23233133, 31212111 및 32333113.
일부 실시형태에서, 폴리펩티드는 서열 번호 2, 4 또는 6의 야생형 폴리펩티드에 비해 향상된 내열성을 갖는다. 폴리펩티드의 활성은 실시예에 기재된 기질 중 임의의 하나 또는 기질의 조합으로 측정될 수 있다. 당업자에게 명백할 것과 같이, 실시예에 기재된 것으로 예시된 화합물의 클래스 내의 다른 화합물이 시험되고 사용될 수 있다.
일부 실시형태에서, 폴리펩티드는 참조 서열에 비하여, 아미노산에 다양한 변화를 가질 수 있다. 변화는 하나 이상의 아미노산의 치환, 결실 또는 삽입일 수 있다. 변화가 치환인 경우, 변화는 보존적, 비-보존적 치환 또는 보존적 및 비-보존적 치환의 조합일 수 있다. 예를 들어, 키메라는 서열 번호 2의 C314 또는 서열 번호 4의 C311에서 C→S 치환을 포함할 수 있다.
따라서, 일부 실시형태에서, 폴리펩티드는 N-말단에서 C-말단으로 하기의 일반 구조를 포함할 수 있다:
(세그먼트 1)-(세그먼트 2)-(세그먼트 3)-(세그먼트 4)-(세그먼트 5)-(세그먼트 6)-(세그먼트 7)-(세그먼트 8),
여기서, 세그먼트 1은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 약 1 내지 약 x1의 아미노산 잔기를 포함하고 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 2는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x1 내지 약 x2이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 3은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x2 내지 약 x3이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 4는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x3 내지 약 x4이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 5는 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x4 내지 약 x5이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 6은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x5 내지 약 x6이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 7은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x6 내지 약 x7이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며; 세그먼트 8은 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x7 내지 약 x8이고 약 1 내지 10개의 보존적 아미노산 치환을 가지며;
여기서, x1은 서열 번호 2의 잔기 43, 44, 45, 46 또는 47, 또는 서열 번호 4 또는 서열 번호 6의 잔기 42, 43, 44, 45 또는 46이고; x2는 서열 번호 2의 잔기 70, 71, 72, 73 또는 74, 또는 서열 번호 4 또는 서열 번호 6의 잔기 68, 69, 70, 71, 72, 73 또는 74이고; x3은 서열 번호 2의 잔기 113, 114, 115, 116, 117 또는 118, 또는 서열 번호 4 또는 서열 번호 6의 잔기 110, 111, 112, 113, 114, 115 또는 116이고; x4는 서열 번호 2의 잔기 153, 154, 155, 156 또는 157, 또는 서열 번호 4 또는 서열 번호 6의 잔기 149, 150, 151, 152, 153, 154, 155 또는 156이고; x5는 서열 번호 2의 잔기 220, 221, 222, 223 또는 224, 또는 서열 번호 4 또는 서열 번호 6의 잔기 216, 217, 218, 219, 220, 221, 222 또는 223이고; x6은 서열 번호 2의 잔기 256, 257, 258, 259, 260 또는 261, 또는 서열 번호 4 또는 서열 번호 6의 잔기 253, 254, 255, 256, 257, 258, 259 또는 260이고; x7은 서열 번호 2의 잔기 312, 313, 314, 315 또는 316, 또는 서열 번호 4 또는 서열 번호 6의 잔기 309, 310, 311, 312, 313, 314, 315 또는 318이고; x8은 서열 번호 2, 서열 번호 4 또는 서열 번호 6의 서열을 갖는 폴리펩티드의 C-말단에 상응하는 아미노산 잔기이며,
여기서, 키메라는 표 1에 기재된 바와 같은 알고리듬을 갖고, 키메라는 서열 번호 2의 C314 또는 서열 번호 4의 C311에 상응하는 C→S 치환을 포함한다.
일부 실시형태에서, 치환의 수는 2개, 3개, 4개, 5개, 6개, 8개, 9개 또는 10개 이상의 아미노산 치환(예를 들어, 10개 내지 20개, 21개 내지 30개, 31개 내지 40개 등의 아미노산 치환)일 수 있다.
일부 실시형태에서, 기능적 CBH II 폴리펩티드는 예컨대 실시예에 기재된 규정된 기질에 대하여 증가된 내열성과 함께 셀룰라아제 활성을 가질 수 있으며, 또한, 참조 셀로바이오하이드롤라제 또는 그의 세그먼트에 소정의 수준의 아미노산 서열 동일성을 가질 수 있다. 참조 효소 또는 세그먼트는 야생형(예를 들어, 천연 발생) 또는 엔지니어링된(engineered) 효소의 것일 수 있다. 따라서, 일부 실시형태에서, 본 발명의 개시내용의 폴리펩티드는 N-말단에서 C-말단으로 일반 구조를 포함할 수 있으며, 여기서, 세그먼트 1이 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 1 내지 약 x1과 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 2가 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x1 내지 약 x2와 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 3이 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x2 내지 약 x3과 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 4가 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x3 내지 약 x4와 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 5가 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 약 x4 내지 약 x5와 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 6이 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x5 내지 약 x6과 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 7이 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x6 내지 약 x7과 50 내지 100% 이상 동일한 서열을 포함하고; 세그먼트 8이 서열 번호 2("1"), 서열 번호 4("2") 또는 서열 번호 6("3")의 아미노산 잔기 x7 내지 약 x8과 50 내지 100% 이상 동일한 서열을 포함하고;
여기서, x1은 서열 번호 2의 잔기 43, 44, 45, 46 또는 47, 또는 서열 번호 4 또는 서열 번호 6의 잔기 42, 43, 44, 45 또는 46이고; x2는 서열 번호 2의 잔기 70, 71, 72, 73 또는 74, 또는 서열 번호 4 또는 서열 번호 6의 잔기 68, 69, 70, 71, 72, 73 또는 74이고; x3은 서열 번호 2의 잔기 113, 114, 115, 116, 117 또는 118, 또는 서열 번호 4 또는 서열 번호 6의 잔기 110, 111, 112, 113, 114, 115 또는 116이고; x4는 서열 번호 2의 잔기 153, 154, 155, 156 또는 157, 또는 서열 번호 4 또는 서열 번호 6의 잔기 149, 150, 151, 152, 153, 154, 155 또는 156이고; x5는 서열 번호 2의 잔기 220, 221, 222, 223 또는 224, 또는 서열 번호 4 또는 서열 번호 6의 잔기 216, 217, 218, 219, 220, 221, 222 또는 223이고; x6은 서열 번호 2의 잔기 256, 257, 258, 259, 260 또는 261, 또는 서열 번호 4 또는 서열 번호 6의 잔기 253, 254, 255, 256, 257, 258, 259 또는 260이고; x7은 서열 번호 2의 잔기 312, 313, 314, 315 또는 316, 또는 서열 번호 4 또는 서열 번호 6의 잔기 309, 310, 311, 312, 313, 314, 315 또는 318이고; x8은 서열 번호 2, 서열 번호 4 또는 서열 번호 6의 서열을 갖는 폴리펩티드의 C-말단에 상응하는 아미노산 잔기이며,
여기서, 키메라는 표 1에 기재된 바와 같은 알고리듬을 가지고, 키메라는 서열 번호 2의 C314 또는 서열 번호 4의 C311에 상응하는 C→S 치환을 포함한다.
일부 실시형태에서, 키메라 폴리펩티드의 각각의 세그먼트는 서열 번호 2, 서열 번호 4 또는 서열 번호 6의 (세그먼트 1), (세그먼트 2), (세그먼트 3), (세그먼트 4)-(세그먼트 5), (세그먼트 6), (세그먼트 7) 및 (세그먼트 8)의 각각에 대해 지정된 참조 세그먼트에 비하여 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가질 수 있다.
일부 실시형태에서, 폴리펩티드 변이체는 서열 번호 2, 4 또는 6의 야생형 폴리펩티드의 효소 활성에 비해 향상된 내열성을 가질 수 있으며, 여기서, 키메라는 서열 번호 2의 C314 또는 서열 번호 4의 C311에 상응하는 C→S 치환을 포함한다.
본 명세서에 기재된 키메라 효소는 다양한 형태, 예컨대 용해물, 미정제 추출물 또는 단리된 제제로 제조될 수 있다. 폴리펩티드는 적합한 용액에 용해되거나; 아세톤 분말과 같이 분말로 제형화되거나(안정화제와 함께 또는 이것 없이); 동결건조물질(lyophilizate)로 제조될 수 있다. 일부 실시형태에서, 폴리펩티드는 단리된 폴리펩티드일 수 있다.
일부 실시형태에서, 폴리펩티드는 어레이(array) 형태일 수 있다. 효소는 마이크로타이터 플레이트(mircotitre plate)의 웰 내의 용액으로서, 용해성 형태일 수 있거나, 또는 기재상에 고정화될 수 있다. 기재는 고체 기재 또는 다공성 기재(예를 들어, 멤브레인)일 수 있으며, 이는 유기 중합체, 예컨대 폴리스티렌, 폴리에틸렌, 폴리프로필렌, 폴리플루오로에틸렌, 폴리에틸렌옥시 및 폴리아크릴아미드뿐 아니라 이의 공중합체 및 그라프트(graft)로 이루어질 수 있다. 또한, 고체 지지체는 무기, 예컨대, 유리, 실리카, 기공 제어형 유리(controlled pore glass; CPG), 역상 실리카 또는 금속, 예컨대 금 또는 백금일 수 있다. 기질의 외형은 비드, 구형, 입자, 과립, 겔, 멤브레인 또는 표면의 형태일 수 있다. 표면은 평면, 실질적 평면 또는 비-평면일 수 있다. 고체 지지체는 다공성 또는 비-다공성일 수 있으며, 팽윤성 또는 비-팽윤성을 가질 수 있다. 고체 지지체는 웰, 함몰부 또는 다른 컨테이너(container), 용기, 특징부 또는 위치의 형태로 형성될 수 있다. 다수의 지지체는 검출 방법 및/또는 기기에 의해, 또는 로봇을 이용한 시약의 전달을 다룰 수 있는 다양한 위치에서 어레이 상에 형성될 수 있다.
또한, 본 발명의 개시내용은 본 명세서에 개시된 엔지니어링된 CBH II 폴리펩티드를 엔코딩하는 폴리뉴클레오티드를 제공한다. 폴리뉴클레오티드는 유전자 발현을 제어하는 하나 이상의 이종 조절 또는 제어 서열에 작동가능하게 연결되어, 폴리펩티드를 발현할 수 있는 재조합 폴리뉴클레오티드를 생성할 수 있다. CBH II 키메라를 엔코딩하는 이종 폴리뉴클레오티드를 함유하는 발현 작제물을 적절한 숙주 세포 내로 도입하여, 폴리펩티드를 발현할 수 있다.
CBH II 키메라 효소(예를 들어, 키메라 CBH II의 세그먼트 구조)의 특정 서열의 지식을 고려하면, 폴리뉴클레오티드 서열은 엔지니어링된 CBH II 키메라 효소의 아미노산 서열으로부터 당업자에게 명백할 것이다. 폴리펩티드의 아미노산 서열의 지식과 합한 다양한 아미노산에 해당하는 코돈의 지식은 당업자가 본 발명의 개시내용의 폴리펩티드를 엔코딩하는 상이한 폴리뉴클레오티드를 만드는 것을 가능하게 한다. 따라서, 본 발명의 개시내용은 가능한 코돈 선택에 기초하여 조합을 선택함으로써 제조될 수 있는 폴리뉴클레오티드의 각각의 그리고 모든 가능한 변이를 고려하며, 모든 이러한 변이는 본 명세서에 기재된 폴리펩티드 중 임의의 것을 위해 특별히 개시된 것으로 간주되어야 한다.
일부 실시형태에서, 폴리뉴클레오티드는 본 명세서에 기재된 폴리펩티드를 엔코딩하지만, 상술된 바와 같은 C→S 치환(예를 들어, 여기서 폴리펩티드 또는 키메라는 서열 번호 2의 C314 또는 서열 번호 4의 C311에 상응하는 C→S 치환을 포함함)을 갖는, 키메라 폴리펩티드의 CBH II 변이체를 엔코딩하는 참조 폴리뉴클레오티드에 대해 뉴클레오티드 수준에서, 80% 이상의 서열 동일성, 약 85% 이상의 서열 동일성, 약 90% 이상의 서열 동일성, 약 91% 이상의 서열 동일성, 약 92% 이상의 서열 동일성, 약 93% 이상의 서열 동일성, 약 94% 이상의 서열 동일성, 약 95% 이상의 서열 동일성, 약 96% 이상의 서열 동일성, 약 97% 이상의 서열 동일성, 약 98% 이상의 서열 동일성, 또는 약 99% 이상의 서열 동일성을 갖는다.
일부 실시형태에서, 폴리펩티드를 엔코딩하는 단리된 폴리뉴클레오티드는 다양한 방식으로 조작되어, 폴리펩티드의 발현을 제공할 수 있다. 단리된 폴리뉴클레오티드를 벡터 내로 삽입하기 전에, 단리된 폴리뉴클레오티드를 조작하는 것은 발현 벡터에 따라 바람직하거나 필요할 수 있다. 재조합 DNA 방법을 사용하여 폴리뉴클레오티드 및 핵산 서열을 변형시키는 기법은 당업계에 주지되어 있다. 문헌[Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3rd Ed., Cold Spring Harbor Laboratory Press]; 및 문헌[Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, updates to 2007]에 지침이 제공되어 있다.
일부 실시형태에서, 폴리뉴클레오티드는 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 위한 조절 서열에 작동가능하게 연결된다. 일부 실시형태에서, 조절 서열은 적절한 프로모터 서열일 수 있으며, 이는 숙주 세포에 대해 동종 또는 이종 중 어느 하나의 세포외 또는 세포내 폴리펩티드를 엔코딩하는 유전자로부터 수득될 수 있다. 박테리아 숙주 세포에 대하여, 본 발명의 개시내용의 핵산 작제물의 전사를 지시하는데 적합한 프로모터는 E. 콜라이(E. coli) lac 오페론, 바실러스 서브틸리스(Bacillus subtilis) xylA 및 xylB 유전자, 바실러스 메가테리움(Bacillus megaterium) 자일로스 이용 유전자(예를 들어, Rygus et al., (1991) Appl. Microbiol. Biotechnol. 35:594-599; Meinhardt et al., (1989) Appl. Microbiol. Biotechnol. 30:343-350), 원핵생물 베타-락타마제 유전자(Villa-Kamaroff et al., (1978) Proc. Natl Acad. Sci. USA 75: 3727-3731)로부터 수득되는 프로모터뿐 아니라 tac 프로모터(DeBoer et al., (1983) Proc. Natl Acad. Sci. USA 80:21-25)를 포함한다. 다양한 적합한 프로모터가 문헌["Useful proteins from recombinant bacteria" in Scientific American, 1980, 242:74-94]; 및 상기 Sambrook 등의 문헌에 기재되어 있다.
일부 실시형태에서, 조절 서열은 또한, 전사를 종결시키기 위해 숙주 세포에 의해 인식되는 서열인, 적합한 전사 터미네이터(terminator) 서열일 수도 있다. 터미네이터 서열은 폴리펩티드를 엔코딩하는 핵산 서열의 3' 말단에 작동가능하게 연결된다. 선택된 숙주 세포에서 작용성인 임의의 터미네이터가 사용될 수 있다.
일부 실시형태에서, 조절 서열은 또한 숙주 세포에 의한 번역에 중요한 mRNA의 비번역 영역인, 적합한 리더(leader) 서열일 수도 있다. 리더 서열은 폴리펩티드를 엔코딩하는 핵산 서열의 5' 말단에 작동가능하게 연결된다. 선택된 숙주 세포에서 작용성인 임의의 리더 서열이 사용될 수 있다.
임의의 실시형태에서, 조절 서열은 또한 폴리펩티드의 아미노 말단에 연결된 아미노산 서열을 코딩하며 엔코딩된 폴리펩티드를 세포의 분비 경로로 향하게 하는 신호 펩티드 코딩 영역일 수도 있다. 핵산 서열의 코딩 서열의 5' 말단은 번역 리딩 프레임으로, 분비된 폴리펩티드를 엔코딩하는 코딩 영역의 세그먼트와 천연적으로 연결된 신호 펩티드 코딩 영역을 내재적으로 함유할 수 있다. 대안적으로, 코딩 서열의 5' 말단은 코딩 서열에 대해 외래인 신호 펩티드 코딩 영역을 함유할 수 있다. 코딩 서열이 천연적으로 신호 펩티드 코딩 영역을 함유하지 않는 경우, 외래의 신호 펩티드 코딩 영역이 필요할 수 있다. 박테리아 숙주 세포에 효과적인 신호 펩티드 코딩 영역은 바실러스 NClB 11837 말토제닉 아밀라아제, 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 알파-아밀라아제, 바실러스 리케니포르미스 서브틸리즘(Bacillus licheniformis subtilism), 바실러스 리케니포르미스 베타-락타마제, 바실러스 스테아로써모필러스 중성 프로테아제(nprT, nprS, nprM) 및 바실러스 서브틸리스 prsA를 위한 유전자로부터 수득된 신호 펩티드 코딩 영역일 수 있다. 추가로, 신호 펩티드는 문헌[Simonen and Palva, (1993) Microbiol Rev 57:109-137]에 기재되어 있다.
본 발명의 개시내용은 추가로 엔지니어링된 CBH II 변이체 또는 키메라 폴리펩티드를 엔코딩하는 폴리뉴클레오티드, 및 그들이 도입되는 숙주의 유형에 따라, 하나 이상의 발현 조절 영역, 예컨대 프로모터 및 터미네이터, 복제 원점 등을 포함하는 재조합 발현 벡터에 관한 것이다. 발현 벡터를 생성하는 데에서, 코딩 서열이 발현을 위한 적절한 조절 서열과 작동가능하게 연결되도록, 코딩 서열이 벡터 내에 위치한다.
재조합 발현 벡터는 임의의 벡터(예를 들어, 플라스미드 또는 바이러스)일 수 있으며, 이는 편리하게 재조합 DNA 절차로 처리될 수 있으며, 폴리뉴클레오티드 서열의 발현을 야기할 수 있다. 벡터의 선택은 전형적으로 벡터가 도입되는 숙주 세포와 벡터의 상용성에 좌우될 것이다. 벡터는 선형 또는 폐환 플라스미드일 수 있다.
발현 벡터는 자가 복제 벡터, 즉, 그 복제가 염색체 복제와 독립적인 염색체외 부분으로 존재하는 벡터, 예를 들어, 플라스미드, 염색체외 요소, 미니염색체(minichromosome) 또는 인공 염색체일 수 있다. 벡터는 자가-복제를 보장하기 위한 임의의 수단을 함유할 수 있다. 대안적으로, 벡터는 숙주 세포 내로 도입시, 게놈 내로 통합되고, 그것이 통합된 염색체(들)와 함께 복제되는 것일 수 있다. 또한, 숙주 세포의 게놈 내로 도입될 전체 DNA 또는 트랜스포존(transposon)을 함께 함유하는 단일의 벡터 또는 플라스미드, 또는 둘 이상의 벡터 또는 플라스미드가 사용될 수 있다.
일부 실시형태에서, 본 발명의 개시내용의 발현 벡터는 하나 이상의 선택가능한 마커를 함유하며, 이는 형질전환된 세포의 용이한 선택을 가능하게 한다. 선택가능한 마커는 그 생성물이 살생물제 또는 바이러스 내성, 중금속에 대한 내성, 영양요구체에 대한 독립영양성 등을 제공하는 유전자이다. 박테리아 선택가능한 마커의 예에는 바실러스 서브틸리스 또는 바실러스 리케니포르미스로부터의 dal 유전자, 또는 항생제 내성, 예컨대 앰피실린, 카나마이신, 클로람페니콜(실시예 1) 또는 테트라사이클린 내성을 부여하는 마커가 있다. 다른 유용한 마커는 당업자에게 명백할 것이다.
다른 실시형태에서, 본 발명의 개시내용은 CBH II 변이체 또는 키메라 폴리펩티드를 엔코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하며, 상기 폴리뉴클레오티드는 숙주 세포에서 폴리펩티드의 발현을 위하여 하나 이상의 조절 서열에 작동가능하게 연결되어 있다. 본 발명의 개시내용의 발현 벡터에 의해 엔코딩되는 폴리펩티드를 발현시키는데 사용하기 위한 숙주 세포는 당업계에 주지되어 있고, 박테리아 세포, 예컨대 E. 콜라이 및 바실러스 메가테리움; 진핵생물 세포, 예컨대 효모 세포, CHO 세포 등, 곤충 세포, 예컨대 드로소필라(Drosophila) S2 및 스포돕테라(Spodoptera) Sf9 세포; 동물 세포, 예컨대 CHO, COS, BHK, 293, 및 보웨스 멜라노마(Bowes melanoma) 세포; 및 식물 세포를 포함하지만, 이에 한정되지 않는다. 다른 적합한 숙주 세포가 당업자에게 명백할 것이다. 상술된 숙주 세포들에 대한 적절한 배양 배지 및 성장 조건은 당업계에 주지되어 있다.
본 발명의 개시내용의 CBH II 변이체 또는 키메라 폴리펩티드는 당업계에 주지되어 있는 방법을 사용함으로써 제조될 수 있다. 폴리펩티드는 문헌[Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3rd Ed., Cold Spring Harbor Laboratory Press]; 및 문헌[Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, updates to 2007]에 제공된 것과 같은 재조합 기법에 의해 합성될 수 있다. 효소를 엔코딩하는 폴리뉴클레오티드 또는 증폭을 위한 프라이머는 또한 공지된 합성 방법에 따라, 예를 들어 문헌[Beaucage et al., (1981) Tet Lett 22:1859-69]에 기재된 포스포라미디트 방법 또는 예를 들어, 이것이 전형적으로 자동화된 합성 방법으로 실시됨에 따라, 문헌[Matthes et al., (1984) EMBO J. 3:801-05]에 기재된 방법을 사용하여 표준 고체상 방법에 의해 제조될 수 있다. 또한, 본질적으로 임의의 핵산이 다양한 상업적 공급처, 예컨대 The Midland Certified Reagent Company (Midland, TX), The Great American Gene Company(Ramona, CA), ExpressGen Inc. (Chicago, IL), Operon Technologies Inc. (Alameda, CA) 및 많은 다른 공급처들 중 임의의 공급처로부터 수득될 수 있다.
숙주 세포 내에서 발현되는 엔지니어링된 효소는 특히 라이소자임 처리, 초음파처리(sonication), 여과, 염석(salting-out), 초원심분리, 크로마토그래피 및 친화성 분리(예를 들어, 기질 결합 항체)를 비롯한 단백질 정제를 위해 주지되어 있는 기법 중 임의의 하나 이상의 기법을 사용하여 세포 및/또는 배양 배지로부터 회수될 수 있다. 박테리아, 예컨대, E. 콜라이의 용해 및 이로부터의 높은 효율의 단백질의 추출에 적합한 용액은 Sigma-Aldrich (St. Louis MO)로부터 제품명 셀라이틱(CelLytic) BTM 하에 구매할 수 있다.
폴리펩티드의 분리를 위한 크로마토그래피 기법은 특히 역상 크로마토그래피, 고성능 액체 크로마토그래피, 이온 교환 크로마토그래피, 겔 전기영동 및 친화성 크로마토그래피를 포함한다. 특정 효소를 정제하는 조건은 부분적으로 순 전하, 소수성, 친수성, 분자량, 분자 형상 등에 좌우될 것이며, 당업자에게 명백할 것이다.
키메라 폴리펩티드의 SCHEMA 지정된 재조합 및 합성의 설명이 본 명세서의 실시예뿐 아니라 문헌[Otey et al., (2006), PLoS Biol. 4(5):e112; Meyer et al., (2003) Protein Sci., 12:1686-1693; 미국 특허 출원 제12/024,515호(출원일: 2008년 2월 1일) 및 미국 특허 출원 제12/027,885호(출원일: 2008년 2월 7일)]에 기재되어 있으며; 이러한 참고문헌은 이들 전문이 본 명세서에 참고로 인용된다.
상술된 바와 같이, 폴리펩티드는 다양한 응용, 예컨대 특히 바이오연료 생성, 셀룰로오스 분해 등에 사용될 수 있다.
하기의 실시예는 추가로 설명하려는 것이나 상기 개시내용 또는 첨부된 특허청구범위를 제한하지 않는 것으로 의도된다.
실시예
CBH II 발현 플라스미드 작제.
CBH II 효소를 엔코딩하는 모체 및 키메라 유전자를 효모 발현 벡터 YEp352/PGK91-1-αss(도 6)에 클로닝하였다. 모체 및 키메라 CBH II 촉매 도메인을 엔코딩하는 DNA 서열을 진디자이너(GeneDesigner) 소프트웨어(DNA2.0)를 사용하여 S. 세레비지애 코돈 편향성(codon bias)으로 설계하고, DNA2.0으로 합성하였다. CBH II 촉매 도메인 유전자를 XhoI 및 KpnI으로 분해하고, XhoI 및 KpnI 부위 사이에 벡터 내로 라이게이션하고, E. 콜라이 XL-1 블루(Blue)(Stratagene) 내로 형질전환시켰다. CBH II 유전자를 다음의 프라이머를 사용하여 시퀀싱하였다: CBH2L(5'-GCTGAACGTGTCATCGGTTAC-3'(서열 번호 9)) 및 RSQ3080(5'-GCAACACCTGGCAATTCCTTACC-3'(서열 번호 10)). CBH II 유전자를 정방향 프라이머 CBH2LPCR (5'-GCTGAACGTGTCATCGTTACTTAG-3'(서열 번호 11)), 및 His6 오버행(overhang)과 정지 코돈을 갖는, 적절한 CBH II 유전자에 상보적인 역방향 프라이머를 사용하여 증폭시킴으로써, C-말단 His6 모체 및 키메라 CBH II 작제물을 만들었다. PCR 생성물을 라이게이션시키고, 형질전환시키고, 상술된 바와 같이 시퀀싱하였다.
S. 세레비지애에서의 CBH II 효소 발현.
EZ 효모 II 형질전환 키트(Zymo Research)를 사용하여 S. 세레비지애 균주 YDR483W BY4742(Matα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0 ΔKRE2, ATCC 번호 4014317)를 컴피턴트(competent)하게 만들고, 플라스미드 DNA를 형질전환시키고, 합성 드롭아웃(dropout)-우라실 아가에 플레이팅하였다. 콜로니를 20 ㎍/㎖의 트립토판이 보충된 합성 덱스트로스 카사미노산(SDCAA) 배지(20 g/L 덱스트로스, 6.7 g/L 디프코(Difco) 효모 질소 베이스(base), 5 g/L 박토(Bacto) 카사미노산, 5.4 g/L Na2HPO4, 8.56 g/L NaH2PO4·H2O)의 5 ㎖ 밤샘 배양물 내로 가져오고, 30 ℃, 250 rpm에서 밤새 배양하였다. 5 ㎖ 배양물을 250 ㎖ 튜나이르(Tunair) 플라스크(Shelton Scientific) 내의 40 ㎖의 SDCAA로 확대시키고, 30 ℃, 250 rpm에서 48시간 동안 진탕시켰다. 배양물을 원심분리하고, t1/2 검정에 사용하기 위하여 30-kDa PES 멤브레인이 장착된 아미콘 한외여과 셀을 사용하여 상층액을 500 ㎕로 농축하였다. 농축된 상층액을 1 mM 페닐메틸설포닐플루오라이드 및 0.02% NaN3에 가져왔다. His6-태그형(tagged) CBH II 단백질을 제조처의 프로토콜에 따라 Ni-NTA 스핀 컬럼(Qiagen)을 사용하여 정제하고, 단백질을 제브라-스핀(Zeba-Spin) 탈염 컬럼(Pierce)을 사용하여 50 mM 소듐 아세테이트, pH 4.8로 교환하였다. 피어스 쿠마시 플러스(Pierce Coomassie Plus) 단백질 시약을 사용하고, BSA를 표준물질로 사용하여, 정제된 단백질 농도를 결정하였다. 20 ㎕의 농축된 배양 상층액 또는 대략 5 ㎍의 정제된 CBH II 효소 중 어느 하나를 7.5% Tris-HCl 겔(Biorad) 상에 로딩하고, 심플리블루 세이프 스테인(SimplyBlue safe stain)(Invitrogen)으로 염색함으로써, SDS-PAGE 분석을 수행하였다. CBH II 상층액 또는 정제된 단백질을 제조처의 지시에 따라 EndoH (New England Biolabs)로 37 ℃에서 1시간 동안 처리하였다. 37.5 ㎕의 농축된 배양 상층액을 37.5 ㎕의 PASC에 첨가하고, 50 ℃에서 2시간 동안 인큐베이션함으로써, 농축된 효모 배양물 상층액에서의 CBH II 효소 활성을 측정하였다. 후술되는 바와 같은 넬슨-소모기이(Nelson-Somogyi) 검정을 통해, 형성된 환원당 당량을 결정하였다.
반감기, 특이적 활성, pH-활성 및 장기간 셀룰로오스 가수분해 측정.
인산 팽윤형 셀룰로오스(PASC)를 준비하였다. 기질 상에서 CBH II 효소 활성을 증진시키기 위하여, PASC를 10 g/L의 농도로, 5OmM 소듐 아세테이트, pH 4.8 중의 10 mg/㎖의 A. 니거(A. niger) 엔도글루카나제 (Sigma)와 37 ℃에서 1시간 동안 사전-인큐베이션시켰다. 15분 동안 95 ℃로 가열함으로써, 엔도글루카나제를 불활성화시키고, PASC를 5OmM 아세테이트 완충액으로 2회 세정하고, 탈이온수 중에 10 g/L로 재현탁화시켰다.
농축된 CBH II 발현 배양 상층액을 후술되는 바와 같이, 처리된 PASC와의 인큐베이션 후에 넬슨-소모기이 환원당 검정에서 측정시 0.5의 A520을 제공하는 농도로, 50 mM 소듐 아세테이트, pH 4.8에 첨가함으로써, CBH II 효소 t1/2를 측정하였다. 37.5 ㎕의 CBH II 효소/완충액 혼합물을 63 ℃의 수조에서 불활성화시켰다. 인큐베이션 후에, 37.5 ㎕의 엔도글루카나제-처리된 PASC를 첨가하고, 가수분해를 50 ℃에서 2시간 동안 수행하였다. 반응 상층액을 멀티스크린(Multiscreen) HTS 플레이트(Millipore)를 통해 여과시켰다. 스펙트라맥스(SpectraMax) 마이크로플레이트 판독기(Molecular Devices)를 사용하고 백그라운드 흡광도에 대해 보정하여 수득된 넬슨-소모기이 검정 log(A520) 값을 마이크로 엑셀을 사용하여 선형 회귀로부터 수득된 CBH II 효소 반감기 및 시간에 대해 작도하였다.
특이적 활성 측정을 위해, 정제된 CBH II 효소를 PASC에 첨가하여, 5 g/L PASC 및 3 mg(효소)/g(PASC)의 CBH II 효소 농도와 함께 75 ㎕의 25 mM 소듐 아세테이트, pH 4.8의 최종 반응 부피를 제공하였다. 인큐베이션을 50 ℃ 수조에서 2시간 동안 진행하고, 환원당 농도를 결정하였다. pH/활성 프로필 측정을 위하여, 정제된 CBH II 효소를 75 ㎕의 반응 부피 중에 300 ㎍/g(PASC)의 농도로 첨가하였다. 반응물을 12.5 mM 소듐 시트레이트/12.5 mM 소듐 포스페이트로 완충화시키고, 50 ℃에서 16시간 동안 시행하고, 환원당을 결정하였다. 100 mM 소듐 아세테이트, pH 4.8, 20 mM NaCl 중의 1 g/L의 처리된 PASC 300 ㎕ 부피로 장기간 셀룰로오스 가수분해 측정을 수행하였다. 정제된 CBH II 효소를 100 ㎍/g(PASC)으로 첨가하고, 환원당 결정 전 40시간 동안 수조에서 반응을 수행하였다.
CBH II 효소를 엔코딩하는 5개의 후보물질 모체 유전자를 S. 세레비지애 코돈 편향성으로 합성하였다. 5개 모두는 동일한 N-말단 코딩 서열을 함유하였으며, 여기서, 잔기 1-89는 H. 제코리나 촉매 도메인의 셀룰로오스 결합 모듈 (CBM), 가요성 링커 영역 및 5개의 N-말단 잔기에 상응한다. 휴미콜라 인솔렌스 및 케토미움 써모필럼(Chaetomium thermophilum)으로부터의 후보물질 CBH II 효소 중 2개가 다른 3개, 즉, 하이포크레아 제코리나, 파네로케이트 크리소스포리움(Phanerochaete chrysosporium) 및 탈라로마이세스 에멀소니이(Talaromyces emersonii)보다 훨씬 더 높은 수준으로 S. 세레비지애로부터 분비되었다(도 1). 3개의 약하게 발현된 후보물질 모체에 대한 SDS-PAGE 겔 내의 밴드가 식별하기 어려웠기 때문에, 농축된 배양 상층액을 인산 팽윤형 셀룰로오스(PASC)와 인큐베이션시킨 활성 검정을 수행하여, 활성이 있는 셀룰라아제의 존재를 확인하였다. 표 1에 제시되어 있는, 형성된 환원당에 대한 값으로, T. 에멀소니이 CBH II를 제외한 모든 효소에 대하여 농축된 S. 세레비지애 배양 상층액 중의 활성이 있는 CBH II의 존재를 확인하였다. H. 제코리나로부터의 산업상 가장 유의미한 진균류 CBH II 효소와 재결합시키기 위하여, H. 인솔렌스 및 C. 써모필럼 서열을 선택하였다. 촉매 도메인의 각각의 서열 동일성은 64%(1:2), 66%(2:3) 및 82%(1:3)였으며, 여기서 H. 인솔렌스는 모체 1이고, H. 제코리나는 모체 2이며, C. 써모필럼은 모체 3이다. 이들 각각의 촉매 도메인은 360개, 358개 및 359개의 아미노산 잔기를 함유한다.
산업 응용을 위해 셀룰라아제를 생성하는데 가장 흔히 사용되는 유기체인 사상균 H. 제코리나에서의 이종 단백질 발현은 사카로마이세스 세레비지애에서보다 훨씬 더 힘들다. 관찰된 S. 세레비지애로부터의 H. 제코리나 CBH II의 분비는 이러한 이종 숙주의 선택의 동기가 되었다. 재조합 셀룰라아제의 활성을 감소시키는 것으로 보고되어 있는 과글리코실화(hyperglycosylation)를 최소화하기 위하여, 재조합 CBH II 유전자를 글리코실화-결함 dKRE2 S. 세레비지애 균주 내에서 발현시켰다. 이러한 균주는 야생형 균주보다 더 작은 만노오스 올리고머를 N-연결 및 O-연결 글리코실화 부위에 부착시키는 것으로 예상되며, 이는 천연적으로 생성된 H. 제코리나 CBH II 효소의 글리코실화와 더욱 유사하다. 고-만노오스 구조를 제거하기 위한 EndoH 처리와 함께 및 이것 없이 CBH II 단백질의 SDS-PAGE 겔 분석으로, EndoH 처리가 이러한 균주로부터 분비되는 효소의 전기영동 이동성을 증가시키지 않는 것이 나타났으며, 이는 야생형 S. 세레비지애 균주가 재조합 단백질에서 글리코실화 부위에 부착되는 분지형 만노오스 부분의 부재를 확인시켜준다.
H. 인솔렌스 (pdb 유입 locn)의 고해상도 구조를 SCHEMA를 위한 주형으로 사용하여, 재조합시에 파괴될 수 있는 접촉을 확인하였다. RASPP로, 각각 15 미만의 <E>를 갖는 4개의 후보물질 라이브러리를 선출하였다. 후보물질 라이브러리 모두는 이전에 작제된 키메라 라이브러리보다 더 낮은 <E>를 가지며, 이는 폴딩된 활성이 있는 키메라의 허용가능한 분획이 상대적으로 높은 <m>에 대해 수득될 수 있음을 시사한다. 키메라 서열 상이성은 가장 큰 <m> = 50을 야기하는 블록 경계를 선택함으로써 최대화된다. 이러한 설계를 위한 블록을 도 2B에 예시하였고, 표 2에 상술하였다.
표 2: 모체 CBH II 효소 촉매 도메인에 대한 ClastalW 다중 서열 정렬. 블록 2, 4, 6 및 8은 박스와 회색 음영으로 나타내었다. 블록 1, 3, 5 및 7은 음영으로 나타내지 않았다. (H. 인솔렌스: 서열 번호 2; H. 제코리나: 서열 번호 4 및 C. 써모필럼: 서열 번호 6).
Figure pat00008
H. 인솔렌스 CBH II 촉매 도메인은 α/β 배럴(barrel) 구조를 가지며, 여기서, 8개의 헬릭스는 배럴 주변을 한정하고, 7개의 평행한 β-시트(sheet)는 활성 부위를 형성한다(도 2a). 2개의 연장된 루프는 활성 부위 위에 지붕(roof)을 형성하며, 이는 기질 셀룰로오스 사슬이 가수분해 중에 통과하는 터널(tunnel)을 생성하는 것이다. 7개의 블록 경계 중 5개는 2차 구조의 요소 사이에 속하나, 블록 4는 연속 α-헬릭스의 중간에서 시작하고 끝난다(도 2a, 2b). 블록사이 측쇄 접촉의 대부분은 1차 구조에서 인접한 블록 사이에서 발생한다(도 2c).
48개 키메라 유전자의 샘플 세트를 하나의 모체로부터의 5개의 블록 및 남아있는 2개의 모체 중 하나 또는 둘 모두로부터의 3개의 블록을 가지는 16개 키메라의 3개 세트로 설계하였으며(표 3); 각각의 블록 위치에서 각각의 모체의 표현을 동등하게 하도록 서열을 선택하였다. 상응하는 유전자를 합성하고 발현시켰다.
표 3: 샘플 세트 CBH II 효소 키메라의 서열
Figure pat00009
48개 샘플 세트 S. 세레비지애 농축된 배양 상층액 중 23개는 PASC에 대하여 가수분해 활성을 나타내었다. 이들 결과는 6,561개의 가능한 CBH II 키메라 서열(예를 들어, 표 1 참조) 중 수천개가 활성이 있는 효소를 엔코딩함을 시사한다. 23개의 활성이 있는 CBH II 샘플 세트 키메라는 상당한 서열 다양성을 나타내며, 가장 가까운 모체 서열과, 그리고 서로 각각 23개 및 36개 이상의 아미노산 치환, 및 54 및 123개 만큼 많이 다르다. 이들의 평균 돌연변이 수준 <m>은 36이다.
마이어(Meyer) 등이 E, m 및 키메라가 폴딩되고 활성이 있을 가능성 사이의 상관관계를 밝혀냄에 따라, 샘플 세트 CBH II 키메라에 대하여 유사한 상관관계가 존재하는지 여부의 분석을 행하였다. PASC 상에서 활성을 검정하여 측정시, 농축된 발현 배양 상층액 중의 CBH II 효소 활성의 양을 SDS-PAGE 겔 내의 CBH II 밴드의 강도와 상호관련시켰다(도 1). H. 제코리나 CBH II 모체에서와 같이, 검출할 수 없는 겔 밴드를 갖는 일부 CBH II 키메라에 대하여 활성을 검출할 수 있었다. 겔 밴드를 나타내나 활성이 결여된 CBH II 키메라는 관찰되지 않았다. CBH II 키메라가 활성 형태로 분비될 가능성은 E 및 m 둘 모두와 반비례하였다(도 3).
모체 및 활성이 있는 키메라 CBH II 효소의 농축된 배양 상층액에 대한 열 불안정화(t1/2)의 반감기를 63 ℃에서 측정하였다. H. 인솔렌스, H. 제코리나 및 C. 써모필럼 CBH II 모체 반감기는 각각 95, 2 및 25분이었다(표 1). 활성이 있는 샘플 세트 키메라는 1분 미만 내지 3,000 초과까지의 넓은 범위의 반감기를 나타내었다. 23개의 활성이 있는 키메라 중 5개는 가장 내열성인 모체 H. 인솔렌스 CBH II의 반감기보다 더 큰 반감기를 가졌다.
CBH II 키메라 반감기를 위한 정량적 예측 모델을 구축하기 위한 시도로, 5개의 상이한 선형 회귀 데이터 모델링 알고리듬을 사용하였다(표 4). 각각의 알고리듬을 사용하여 각 샘플 세트 CBH II 키메라 및 모체의 블록 조성을 log(t1/2)에 연관시키는 모델을 구축하였다. 이들 모델은 블록의 log(t1/2)로의 기여를 정량화하는 내열성 가중치(thermostability weight value)를 생성하였다. 5개 모델링 알고리듬 모두에 대하여 이러한 과정을 1,000회 반복하면서, 2개의 무작위로 선택된 서열을 각 계산에서 생략하여, 각 알고리듬이 24개 블록 각각에 대하여 1,000개의 가중치를 생성하게 하였다. 각각의 블록의 내열성 가중치에 대하여 평균 및 표준 편차(SD)를 계산하였다. 각각의 모델이 2개의 생략된 서열의 t1/ 2을 얼마나 잘 예측하는지를 측정함으로써, 각각의 모델 알고리듬의 예측 정확성을 평가하였다. 1,000개 알고리듬 반복에 대한 측정치와 예측치 간의 상관관계는 모델 알고리듬의 교차-검증 점수이다. 5개 모델 모두에 대하여, 교차-검증 점수(X-val)는 0.57 이하였으며(표 4), 이는 선형 회귀 모델링을 정량적 CBH II 키메라 반감기 예측을 위해 이러한 작은 23개 키메라 t1/2 데이터 세트에 적용할 수 없음을 나타낸다.
표 4: 5개 선형 회귀 알고리듬을 CBH II 효소 키메라 블록 안정성 점수에 적용하기 위한 교차 검증 값. 알고리듬 약어: 능형 회귀(ridge regression; RR), 부분 최소 제곱 회귀(partial least square regression; PLSR), 서포트 벡터 머신 회귀(support vector machine regression; SVMR), 선형 프로그래밍 서포트 벡터 머신 회귀(linear programming support vector machine regression; LPSVMR) 및 선형 프로그래밍 부스팅 회귀(linear programming boosting regression; LPBoostR).
Figure pat00010
선형 회귀 모델링을 사용하여, 블록을 안정화, 불안정화 또는 중립으로 정성적으로 분류하였다. 각각의 회귀 알고리듬에 의해 결정되는 내열성 기여를 밝히는 점수화(scoring) 시스템을 사용하여 키메라 내열성에서의 각각의 블록의 영향을 특성화하였다. 각각의 알고리듬에 대하여, 중립보다 SD가 1 초과만큼 큰 내열성 가중치를 갖는 블록을 "+1"로 점수화하고, 중립의 1 SD 내의 블록을 0으로 할당하고, 중립보다 SD가 1 이상 작은 블록을 "- 1"로 점수화하였다. 5개의 모델 각각으로부터의 1, 0, -1 안정성 점수를 합산함으로써, 각 블록에 대한 "안정성 점수"를 얻었다. 표 5는 각각의 블록에 대한 점수를 요약한 것이다. 블록 1/모체 1(B1P1), B6P3, B7P3 및 B8P2가 가장 큰 안정화 효과를 갖는 것으로 동정되었고, B1P3, B2P1, B3P2, B6P2, B7P1, B7P2 및 B8P3이 가장 강한 불안정화 블록인 것으로 관찰되었다.
표 5: 샘플 세트 CBH II 효소 키메라에 대한 5개의 선형 회귀 알고리듬1에 의해 생성된 정성적 블록 분류 결과. +1의 점수는 중립보다 1초과의 SD만큼 큰 내열성 가중치(블록의 키메라 내열성에 대한 기여에 대한 무치수 측정기준(metric))를 갖는 블록을 나타내고(안정화), 0의 점수는 중립의 1의 표준 편차 내의 가중치를 갖는 블록을 나타내고, -1은 중립보다 1초과의 표준 편차만큼 더 작은 가중치를 갖는 블록(불안정화)을 나타낸다.
Figure pat00011
CBH II 효소 키메라를 엔코딩하는 유전자의 제2 세트를 합성하여, 예측된 안정화 블록을 검증하고, 가장 안정적인 모체보다 더 내열성인 셀룰라아제를 동정하였다. 이러한 검증 세트에 포함시킨 24개의 키메라(표 6)에는 가장 불안정적인 것으로 예측된 7개의 블록이 없었고, 4개의 가장 안정적인 블록이 풍부하였으며, 여기서 표현은 더 높은 안정성 점수에 편향되었다. 또한, 예측된 가장 안정적인 블록을 H. 제코리나 CBH II 효소(모체 2) 내로 치환시킴으로써, "HJPlus" 12222332 키메라를 작제하였다.
표 6: 24개 검증 세트 CBH II 효소 키메라의 서열, 이 중 9개는 활성 형태로 발현되었다.
Figure pat00012
24개 검증 세트 키메라 중 9개뿐 아니라 HJPlus 키메라에 대한 S. 세레비지애 발현 배양물의 농축된 상층액은 PASC에 대한 활성을 나타내었다(표 6). 활성이 검출되지 않았던 15개의 키메라 중, 9개가 블록 B4P2를 함유하였다. 처음 샘플 세트에서 B4P2를 함유하는 16개 키메라 중, 오직 하나만이 PASC에 대한 활성을 나타내었다. 키메라 세트 및 HJPlus 둘 모두의 합산으로, B4P2를 특징으로 하는 26개 키메라 중 단지 2개가 활성이었으며, 이는 이러한 특정 블록이 S. 세레비지애에서의 활성이 있는 셀룰라아제의 발현에 매우 유해함을 나타낸다.
검증 세트로부터의 10개의 기능적 키메라 CBH II 효소의 안정성을 평가하였다. 안정적인 효소가 이미 50 시간 초과의 반감기를 갖고있기 때문에, 63 ℃에서의 12-시간 열 불활성화 후의 PASC에 대한 잔류 가수분해 활성을 사전 평가를 위한 측정기준으로 사용하였다. 이러한 12-시간 인큐베이션으로, 샘플 세트의 가장 내열성인 키메라, 즉 11113132 활성이 측정가능하게 감소되었으며, 내열성 H. 인솔렌스 모체 CBH II가 완전히 불활성화되었다. 기능성 검증 세트 키메라의 10개 모두는 가장 안정적인 모체 H. 인솔렌스 CBH II보다 더 큰 부분의 그들의 활성을 보유하였다.
선택된 내열성 키메라의 활성을 정제된 효소를 사용하여 분석하였다. 모체 CBH II 효소 및 3개의 내열성 키메라, 즉, 가장 내열성 샘플 세트 키메라인 11113132, 가장 내열성 검증 세트 키메라인 13311332 및 HJPlus 키메라 12222332를 C-말단 His6 정제 태그와 함께 발현시키고, 정제하였다. 활성 시험 중에 CBH II 효소의 열 불안정화를 최소화하기 위하여, 본 발명자들은 50 ℃, pH 4.8에서 PASC 기질과의 더 짧은 2-시간 인큐베이션을 사용하였다. 표 3에 나타낸 바와 같이, H. 제코리나로부터의 모체 및 키메라 CBH II 특이적 활성은 가장 활성이 있는 모체 CBH II 효소의 4배 이내였다. HJPlus의 특이적 활성은 H. 제코리나 CBH II를 제외하고 시험한 모든 다른 CBH II 효소보다 더 컸다.
셀룰라아제 활성의 pH 의존성도 또한 중요한데, 이는 넓은 pH/활성 프로파일이 더 넓은 범위의 유력한 셀룰로오스 가수분해 조건 하에서의 CBH II 키메라의 사용을 가능하게 할 것이기 때문이다. H. 제코리나 CBH II는 4 내지 6의 pH에서 최적의 활성을 갖는 것으로 관찰되었으며, 이들 값의 밖에서는 활성이 현저하게 감소하였다. 도 4는 H. 인솔렌스 및 C. 써모필럼 CBH II 효소 및 모든 3개의 정제된 내열성 CBH II 키메라가 H. 제코리나 CBH II의 pH/활성 프로파일보다 상당히 더 넓은 pH/활성 프로파일을 갖는 것을 보여준다. 류(Liu) 등이 C. 써모필럼 CBH II에 대하여 최적의 pH가 4인 것으로 보고하였으나, 본 발명에서 재조합 효소의 최적의 pH는 거의 7이었다. 천연의 H. 인솔렌스 CBH II는 넓은 pH/활성 프로파일을 가지면서, 최대 활성은 pH 9 근처이고, pH 4에서는 이러한 최대 활성의 대략 60%이다. 재조합 효소에 대하여 유사하게 넓은 프로파일이 관찰되었다. HJPlus 키메라는 H. 제코리나 CBH II보다 훨씬 더 넓은 pH/활성 프로파일을 가지며, 다른 2개의 모체 CBH II 효소와 유사한 pH 의존성을 나타내었다.
승온에서의 활성 및 연장된 시간 간격에 걸친 활성의 보유를 달성하는 것은 가장 안정적인 CBH II 효소를 엔지니어링하기 위한 2가지 주요 동기이다. 셀룰로오스 가수분해에서의 내열성 CBH II 키메라의 성능을 40-시간 간격에 걸쳐 소정의 범위의 온도에 걸쳐 시험하였다. 도 5에 나타낸 바와 같이, 모든 3개의 내열성 키메라는 모체 CBH II 효소보다 더 높은 온도에서 PASC에 활성이 있었다. 키메라는 70 ℃에서 활성을 보유하였지만, H. 제코리나 CBH II는 57 ℃ 초과에서는 PASC를 가수분해하지 않았고, 안정적인 H. 인솔렌스 효소는 63 ℃ 초과에서 가수분해를 나타내지 않았다. 장기간 셀룰로오스 가수분해 검정에서 HJPlus의 활성은 이들의 각각의 최적의 온도에서 모든 모체의 활성을 초과하였다.
CBH II 라이브러리는 몇 가지 이유로 보다 적은 잠재적 붕괴를 갖는다. CBH II 모체 서열의 더 높은 동일성 외에, CBH II 폴드의 배럴 위상 기하학은 재조합에 의해 파괴될 수 있는 많은 장거리의 접촉을 제한한다. 블록-사이 접촉(4.5Å 내의 중원자)은 H. 인솔렌스 구조 locn으로부터 유래된 접촉 맵에서 전체의 오직 27%(503/1831)만을 포함한다. 오직 키메라 내에 신규한 잔기 쌍이 가능한 접촉만을 계수하는 경우, 전체 블록-사이는 23%(68/294)로 감소한다. 게다가, 이들 상호작용의 대부분은 단백질 표면상의 잔기 사이에 있으며, 용매 스크리닝의 가능성은 잔기-잔기 상호작용의 상당한 방해 기회를 추가로 감소시킨다(도 14a). 하나의 예외인, 위치 176과 256 사이의 매립된 상호작용은 도 14b에 예시되어 있다. 이 부위에서, B6P2 및 B5P1 또는 B5P3 중 어느 하나가 있는 키메라는 Metl73 : Trp253 (모체 쌍 Met176 : Phe256 또는 Leu173 : Trp253보다 더 큰 아미노산) 쌍을 이룬다. 그럼에도 불구하고, 모체 결정학 모델의 조사시에, 이러한 위치에서의 입체 충돌은 Met 측쇄의 내재적 유연성 및 단백질 백본의 부분, 위치 Trp253의 이동 때문이 아닌 것으로 여겨진다. 특히, 하나의 특성화된 키메라는 이러한 패턴에 부합하며(13333232), 회귀 모델 피트(68 ℃)에 따라 모체보다 더 안정적이다(67 ℃).
커플링이 블록 구조 분기를 발생시킬 수 있는 다른 메커니즘은 블록 경계에서 신규한 잔기쌍의 존재에 좌우되지 않는다. 대신에, 모체 서열이 분기하기 때문에, 내재적 블록 구조는 분기되어, 모듈 블록 이식물을 방해할 수 있다. CBH II 라이브러리의 경우에서, 높은 모체 쌍 서열 동일성 값(82%, 66% 및 64%)은 적은 구조 편차만이 예상됨을 제시한다(1 Å 미만의 RMSD). H. 인솔렌스 및 H. 제코리나 CBH II(C. 써모필럼 CBH II는 결정 구조가 결여되어 있으나, H. 인솔렌스와 82% 동일함)에 대한 결정학적 구조를 비교함으로써 이러한 가능성을 평가할 수 있다. 각각의 모체(locn 및 lcb2)에 대한 구조로부터 블록을 정렬함으로써, 낮은 알파 탄소 RMSD 값(0.5, 0.5, 0.6, 0.5, 0.3, 0.7, 0.3 및 0.4 Å RMSD)을 생성하였다. H. 인솔렌스에 중첩된 H. 제코리아 블록이 추가의 도 5c에 예시되어 있다. 컨텍스트-의존(context-dependent) 효과를 점검하기 위하여, 인 실리코(in silico) 구조 재조합을 수행하여, 각각의 정렬된 블록을 대향하는 숙주 구조로 스플라이싱(splicing)시켰다. B7P2(11111121)를 사용할 때, 블록 6과 7 사이의 Asn 삽입에 기인한 최소의 충돌(2.65 Å)을 제외하고, 모든 단일-블록 치환 키메라(예컨대, 11112111 또는 22122222)에 대한 비-충돌 구조 모델(3 Å을 초과하여 이격된 알파 카본)을 구축하는 것이 가능하다.
추가의 실험을 수행하여, 다양한 블록/세그먼트의 키메라의 안정성 및 향상된 내열성 및/또는 pH 안정성에 대한 기여를 결정하였다. CBH II 효소를 엔코딩하는 모체 및 키메라 유전자를 효모 발현 벡터 YEp352/PGK91-1-αss 내로 클로닝하고, 합성 덱스트로스 카사미노산(SDCAA) 배지에서 발현시켰다. 아비셀(avicel) 활성 검정을 위하여, 효모 펩톤 덱스트로스(YPD) 배양 상층액을 1 mM 페닐메틸설포닐플루오라이드 및 0.02% NaN3로 가져오고, 농축 없이 사용하였다. 농축된 배양 상층액의 희석액을 37.5 ㎕ PASC 및 225 ㎕ 50 mM 소듐 아세테이트, pH 4.8에 첨가하고, 50 ℃에서 2시간 동안 인큐베이션시킴으로써, 농축된 SDCAA 효모 배양 상층액 중의 CBH II 효소 활성을 측정하였다. 넬슨-소모기이 검정을 통하여, 형성된 환원당 당량을 결정하였다.
농축된 CBH II SDCAA 발현 배양 상층액을 엔도글루카나제-처리된 PASC와의 인큐베이션 후에 넬슨-소모기이 환원당 검정으로 측정시, 0.5의 A520을 제공하는 농도로, 50 mM 소듐 아세테이트, pH 4.8에 첨가함으로써, CBH II 효소 T50 값을 측정하였다. 200 ㎕ CBH II 효소/완충액 혼합물을 대상 온도에서 10분 동안 수조에서 인큐베이션시켰다. 인큐베이션 후에, 37.5 ㎕의 엔도글루카나제-처리된 PASC 및 62.5 ㎕의 50 mM 소듐 아세테이트를 첨가하고, 가수분해를 50 ℃에서 2시간 동안 수행하였다. A520 값을 온도에 대해 작도하는 넬슨-소모기이 검정의 선형 보간에 의해 효소가 그 활성의 절반을 소실하는 인큐베이션 온도를 결정하였다.
장기간 아비셀 PH101(Fluka) 가수분해 측정을 위하여, 0.3 ㎍의 정제된 CBH II를 수조 내에 위치한 PCR 튜브 내의 270 ㎕의 50 mM 소듐 아세테이트, pH 4.8 중의 3 mg의 아비셀과 함께 16시간 동안 인큐베이션시켰다. 상기 튜브를 실온 수조에서 10분 동안 냉각시키고, 1000 g에서 10분 동안 원심분리시키고, 환원당 분석을 위해 상층액을 빼내었다.
YPD 발현 배양 상층액 내의 CBH II 활성의 평가를 위하여, 2 ㎖ 내지 40 ㎖ 범위의 상층액 부피를 코니컬(conical) 튜브 내의 50 mM 소듐 아세테이트, pH 4.8 중에 현탁화된 33 mg/㎖ 아비셀 800 ㎕에 첨가하였다. 4 ℃에서 1시간 동안 CBH II가 아비셀에 결합하게 하고, 2000 g에서 2분 동안 원심분리하고, 50 mM 소듐 아세테이트, pH 4.8로 2회 세정하였다. 2차 세정 후에, CBH II-결합 아비셀을 2.75 ㎖의 소듐 아세테이트 완충액에 재현탁화시키고, 270 ㎕ 분액으로 나누고, 50 ℃에서 2.5시간 동안 인큐베이션시켰다. 원심분리 및 상층액 환원당 분석을 상술된 바와 같이 수행하였다.
매쓰매티카(Mathematica)에서 선형 회귀 패키지를 사용하여 CBH II 키메라 T50 데이터를 17-파라미터, 블록 부가 모델에 맞추고, 또한 교차 검증 분석에 사용하였다. 모체 2 및 3으로부터의 8개의 블록 각각의 치환을 나타내는 16 파라미터를 갖는 모체 1(H. 인솔렌스 CBH II) 참고 상태에 비한 블록 효과를 기록하였다.
본 명세서에서 효소가 10-분 인큐베이션 중에 그 활성의 50%를 소실하는 온도로 정의되는 T50 값을 3개의 모체 셀로바이오하이드롤라제, 종래 실험으로부터의 33개의 활성이 있는 CBH II 키메라, 및 정성적 안정성 모델링에서 특히 가장 내열성인 것으로 예측된, 즉 7개의 예측된 불안정화 블록 중 어느 것도 함유하지 않고, 4개의 예측된 안정화 블록 중 3개 또는 4개를 함유하는 18개의 추가 키메라에 대하여 결정하였다. 51개 키메라 서열 모두가 표 8에 나열되어 있다. 이전에 분비되지 않는 것으로 분류되어 있는, 예측된 내열성 키메라 모두를 다시 배양하고, 다시 농축시켜, T50 측정을 위하여 충분한 양의 12112132, 13111132 및 13322332 CBH II가 수득되게 하였다. 키메라 및 모체 CBH II에 대한 T50 값의 완전한 세트가 표 8에 제공되어 있다. 모든 이들 CBH II에 대한 아미노산 서열이 표 7에 나타나 있다. 시험한 31개의 예측된 내열성 키메라 모두는 가장 내열성이 모체 효소의 T50 값(64.8 ℃)보다 2도를 초과하여 더 높은 T50 값을 갖는다. 또한, 표에는 증가된 내열성을 제공하기 위하여, Ser으로 돌연변이될 수 있는 블록/도메인 7 내의 Cys 잔기가 식별된다. 따라서, 본 발명의 개시내용은 하기의 서열 중 임의의 것의 폴리펩티드를 제공하며, 여기서, 밑줄/이탤릭체/볼드체 Cys는 Ser 잔기로 치환되며, 생성된 폴리펩티드는 야생형 효소에 비해 향상된 내열성을 갖는다.
표 7: 표 8에 나타낸 CBH II 모체 및 키메라 촉매 도메인에 대한 아미노산 서열. 또한, 표는 P. 크리소스포리움 CBH II에 대한 촉매 도메인을 포함한다.
Figure pat00013
Figure pat00014
Figure pat00015
Figure pat00016
Figure pat00017
Figure pat00018
Figure pat00019
Figure pat00020
Figure pat00021
Figure pat00022
표 8: 모체 CBH II, 23개의 원래 샘플 세트 CBH II 키메라 및 예측된 내열성 CBH II 키메라에 대한 2개의 독립적인 이중 T50 값(℃). 이러한 작업을 위해 합성된 18개의 키메라는 별표로 앞에 표시되어 있다.
Figure pat00023
선형 회귀를 서열-안정성 데이터에 적용하여, 관측된 T50 값을 R2 = 0.88에 맞추는 10-파라미터 모델을 생성하였다(도 8). 트레이닝 세트(training set) 외의 회귀 모델의 예측 능력을 더 잘 평가하기 위하여, 11-배 교차-검증을 수행하여, 0.57의 R2를 초래하였으며, 여기서 2개의 아웃라이어(outlier)(11313121 및 22222222)의 제거로, 교차 검증 R2를 0.76으로 증가시켰다. 회귀 모델은 가장 안정적인 모체 1(H. 인솔렌스)을 참조 상태 T50으로 사용하며, 0.1 이하의 p 값을 갖는 9개의 추가의 용어를 포함한다. 모델 파라미터(표 9)는 단일의 블록, 즉 모체 3으로부터의 블록 7(B7P3)이 H. 인솔렌스 CBH II에 비해 훨씬 더 키메라 내열성에 강력한 기여자임을 보여준다. C. 써모필럼 CBH II로부터의 이러한 블록은 이를 함유하는 키메라의 안정성에 대략 8.5 ℃ 기여한다. 0.1 이하의 p 값을 갖는 8개의 남아있는 블록 중 2개가 1.2 ℃ 및 2.7 ℃의 더 작은 안정성 기여를 하는 것으로 관찰된 한편, 다른 6개는 안정성을 감소시켰다.
표 9: T50 선형 회귀 모델 파라미터 및 p-값. 도 1의 회귀 피트(fit) 라인을 계산하기 위하여 사용된 0.1 미만의 p를 갖는 파라미터 값이 볼드체로 나타나 있다. 모체 2 및 3으로부터의 8개 블록의 각각의 치환을 나타내는 16개 파라미터와 함께 모체 1(H. 인솔렌스 CBH II) 참조 상태에 비하여 블록 효과를 기록하였다.
Figure pat00024
B7P1 및 B7P3 서열의 정렬로, H. 인솔렌스 및 C. 써모필럼 효소 내의 56개 아미노산 위치 중 10개에서 블록 7이 상이한 것이 나타났다. 가장 높은 T50 값을 갖는 키메라, 즉 21311131의 백그라운드에서, B7P3(모체 3의 세그먼트 7(서열 번호 6)) 내의 각 잔기를 B7P1(모체 1의 세그먼트 7(서열 번호 2)) 내의 상응하는 잔기로 개별적으로 돌연변이시키고, 점 돌연변이체 각각에 대해 결정된 T50 값을 수득하였다. 돌연변이, 즉 S313C는 키메라 내열성을 현저하게 변경시켰으며, 이러한 단일 돌연변이는 21311131의 T50을 약 10 ℃ 감소시켰다(도 11).
상이한 백그라운드에서 역 돌연변이의 효과를 연구하기 위하여, C313S 치환(H. 인솔렌스에서는 314S 및 H. 제코리나에서는 C311S)을 엔코딩하는 H. 인솔렌스 및 H. 제코리나 모체 CBH II에 대한 유전자를 작제하고, 발현시키고, 효소의 T50 값을 결정하였다. 안정화 B7P3이 야생형 H. 인솔렌스 및 H. 제코리나 효소 내로 치환된 키메라 11111131 및 22222232의 안정성도 또한 정량화하였다. B7P3 블록 치환 및 Cys-Ser 점 돌연변이 둘 모두는 모체 CBH II를 현저하게 안정화시켰으며; 가장 큰 효과는 C311S 치환을 함유하는 H. 제코리나 CBH II에 대한 T50의 약 8 ℃의 증가였다(도 12). 또한, Cys-Ser 돌연변이를 B7P3을 함유하지 않는 2개의 키메라, 즉, 31311112 및 13231111에서 뿐만 아니라 재조합 모체 세트에 없었던 동종 CBH II(파네로케이트 크리소스포리움으로부터의)에서 시험하였다. P. 크리소스포리움 CBH II 촉매 도메인은 모체 CBH II 촉매 도메인에 오직 55 내지 56% 동일하였다. 이들 효소 모두는 Cys-Ser 치환에 의해 안정화되었으며; P. 크리소스포리움 CBH II는 현저하게 10 ℃까지 안정화되었다(도 13).
내열성 CBH II 키메라 중 8개 및 동등한 C313S 돌연변이를 함유하는 모체 효소를 이들의 특이적 활성을 결정할 수 있도록 His6-태그화시키고, 정제하였다. 표 10A에 나타낸 바와 같이, 50 ℃에서 무정형 셀룰로오스(PASC) 상에서 측정시, 이들 키메라 및 Cys-Ser 돌연변이를 함유하는 천연의 효소에 대한 특이적 활성은 야생형 모체에 대한 특이적 활성과 유사하였다. 따라서, 증가된 내열성은 특이적 활성을 잃으면서 얻는 것이 아니다.
표 10A: 천연, 점 돌연변이체 및 선택된 내열성 키메라 CBH II에 대한 특이적 활성 값(㎍(글루코오스 환원당 당량)/(㎍(CBH II 효소)×분×102)). 오차 막대는 표준 오차를 나타내며, 여기서 표준 오차는 3회의 반복에 대한 표준 편차/sqrt (n)로 정의된다. 2-시간 반응, 3 mg(효소)/g(PASC), 50℃, 25 mM 소듐 아세테이트, pH 4.8.
Figure pat00025
표 10B: H. 제코리나 및 H. 인솔렌스 야생형, C313S 점 돌연변이체 및 B7P3 블록 치환 CBH II에 대한 합성(SDCAA) 및 풍부(YPD) 발현 배양 배지 상층액 둘 모두에서의 전체 활성. 나타낸 값은 셀룰라아제 활성 검정에 첨가된 발현 배양 상층액 CBH II 당량 ㎖당 ㎍(글루코오스)/㎖(셀룰라아제 활성 검정)이다. SDCAA 배양에 대하여, 농축된 SDCAA 배양 상층액을 사용하였고, 50 mM 소듐 아세테이트, pH 4.8 중에서 100분 동안 50 ℃에서의 인산 팽윤형 셀룰로오스(1 mg/㎖)에 대한 활성을 측정하였다. 아비셀에 결합시킴으로써, YPD 상층액 CBH II를 농축시키고, 50 mM 소듐 아세테이트, pH 4.8 중에서 150분 동안 55 ℃에서 아비셀(15 mg/㎖)에 대한 활성을 측정하였다.
Figure pat00026
이어서, 이들 동일한 내열성 키메라(가장 안정적인 모체보다 T50이 2 내지 10 ℃ 더 높음)를 모체 효소가 활성을 거의 나타내지 않거나, 나타내지 않는 온도를 포함하는 소정의 범위의 온도에 걸쳐, 16-시간 인큐베이션 중의 결정질 셀룰로오스 상에서의 활성에 대하여 시험하였다. 도 9a는 8개의 시험한 내열성 키메라 중 7개가 60 내지 65 ℃에서 아비셀에 대하여 최대로 활성이 있었으며, 모든 8개의 키메라가 시험한 가장 높은 온도인 70 ℃에서 활성을 보유하였음을 보여준다. 반대로, 3개의 모체 CBH II는 50 ℃에서 최대 활성을 보였으며, 70 ℃에서 완전히 또는 거의 완전히 불활성이었다. 또한, 증가된 최적의 활성 온도를 갖는 7개의 키메라는 모체 CBH II 효소 중 어느 것보다 아비셀을 유의적으로 더 가수분해시켰다. 도 9b에 나타낸 바와 같이, Cys-Ser 점 돌연변이를 함유하는 H. 인솔렌스 및 H. 제코리나 모체에 대하여 유사한 거동이 관찰되었다. Cys-Ser 점 돌연변이는 또한 아비셀 가수분해 및 P. 크리소스포리움 CBH II에 대한 최고 작동 온도를 증가시켰다. P3B7 블록 치환은 H. 인솔렌스 및 H. 제코리나 모체에서 만들어졌으며, 이는 작동 온도와 H. 인솔렌스 CBH II의 가수분해 둘 모두를 증가시켰으나, 최고 작동 온도의 증가에도 불구하고, H. 제코리나 효소에 의한 전반적인 셀룰로오스 가수분해를 향상시키지 않았다.
야생형 H. 제코리나 CBH II의 낮은(1 mg/L 미만) 분비가 이종 S. 세레비지애 발현 숙주로부터 관찰되었다. 야생형 H. 제코리나 CBH II 효소에서의 C311S 돌연변이는 CBH II 전체 분비 활성을 현저하게 증가시킨다(표 11). 합성(SDCAA) 배지에서, C311S 및 B7P3 치환은 2배만큼 H. 제코리나 CBH II 전체 분비 활성을 증가시키나, 풍부(YPD) 배지에서 활성 증가는 10배이다. 다른 2개의 모체 CBH II보다 훨씬 더 높은 수준으로 발현되는 H. 인솔렌스 CBH II 모체에 대하여, C314S 돌연변이는 분비 활성을 약 1.5배 증가시키지만, B7P3 블록 치환은 이를 감소시켰다. H. 인솔렌스 및 H. 제코리나 야생형 및 Cys-Ser 돌연변이체 모두가 유사한 특이적 활성을 갖기 때문에(표 10), 셀룰라아제 전체 분비 활성의 증가는 작용 효소의 향상된 분비의 결과이다. S. 세레비지애 이종 단백질 분비 및 단백질 안정성 간의 상관관계를 관찰하였으며, Cys-Ser 돌연변이체 CBH II의 증가된 분비가 이들의 더 높은 안정성을 반영할 수 있음을 시사한다.
표 11: 천연, 점 돌연변이체 및 선택된 내열성 키메라 CBH II에 대한 특이적 활성 값(㎍(글루코오스 환원당 당량)/(㎍(CBH II 효소)×분×102)). 오차 막대는 표준 오차를 나타내며, 여기서 표준 오차는 3회의 반복에 대한 표준 편차/sqrt (n)로 정의된다. 2-시간 반응, 3 mg(효소)/g(PASC), 50 ℃, 25 mM 소듐 아세테이트, pH 4.8.
Figure pat00027
Cys-Ser 돌연변이를 모델링하기 위하여, 고해상도 H. 인솔렌스 CBH II locn 결정 구조를 사용하였다. 먼저, 수소 결합 네트워크를 REDUCE로 최적화시켰다. Cys314는 Pro 339의 카보닐에 수소 결합을 형성하는 것으로 예측되었다. 이러한 예측을 확인하기 위하여, 모델링 플랫폼 SHARPEN을 사용하여 측쇄 패킹을 최적화시켰다. Ser314는 Cys314와 유사한 상호작용을 만들어, 더 강한 수소 결합 및 더 바람직한 기하학을 야기하는 것으로 예측된다(도 14).
많은 효과에 의해, Cys-Ser 돌연변이가 천연의 CBH II 및 키메라를 비롯한 넓은 범위의 CBH II를 안정화시키는 이유가 설명될 수 있다. Cys 및 Ser은 유사하며(등전자가 아니지만), 이들 2개의 아미노산은 이러한 위치에서 다른 대안에 비해 서열 정렬을 좌우한다. 이러한 잔기에 대한 수소 결합 파트너는 백본 요소(Gly316의 아미드 및 Pro339의 카보닐)이며, 이에 따라 제3자의 아미노산 변이에 덜 좌우될 것이다. 추가로, 이러한 포켓(Asn283, Pro339, Phe345)에 대한 바로 근처의 측쇄는 연구한 모든 4개의 천연의 CBH II 셀룰라아제에서 보존된다.
고해상도(1.3Å) H. 인솔렌스 결정 구조(pab 유입 locn6)는 Cys314가 수소 결합 네트워크의 부분임을 보여준다(도 15). Cys에 비해 Ser의 증가된 수소 결합능은 안정화에서 더 강한 수소 결합 상호작용에 대한 역할을 시사할 수 있다. 또한, 결정 구조는 Ser이 입체상의 이유로 바람직할 수 있음을 시사한다. 구체적으로, Cys 측쇄가 표준(canonical) 결합 각으로 재건되는 경우, 6° 구부러짐이 제거되고, Cys는 Pro339의 카보닐에 더 가깝게 밀려, 바람직하지 않은 입체 상호작용을 생성한다.
H. 제코리나 CBH II에 가장 큰 동일성을 공유하는 196개의 단백질 서열의 정렬. 250개의 가장 동일한 서열 중 54개를 중복성(즉, 구조 연구를 위한 점 돌연변이체 또는 95% 초과로 동일한 아형) 때문에 정렬에서 배제시켰다. Ser311에 유리한 편향이 있다: 158 서열은 Ser을 가지며, 20은 Ala을 가지고, 10은 Cys을 가지며, 5는 결실을 가지고, 3은 Gly를 갖는다. 그러나, H. 제코리나 아미노산의 빈도보다 2배 더 많은 가장 빈번한 선택이 일어나는 42개의 다른 위치가 있다.
*Cys-Ser 돌연변이의 큰 안정화 효과는 이러한 위치에서 Ser이 천연의 셀룰라아제 내열성의 전반적인 지표일 가능성을 증가시킨다. 그러나, 이 위치에서 Cys를 특징으로 하는 H. 인솔렌스 CBH II에 대한 64.8 ℃의 T50은 C. 써모필럼 CBH II의 T50(64.0 ℃)보다 더 크며, 이는 Ser이 유일한 안정성 결정물질이 아님을 나타낸다.
내열성은 산업 셀룰라아제에 대해 대상이 되는 유일한 특징이 아니다. 특이적 활성, 셀룰로오스 결합에 대한 변화 및 발현 및 생성물 억제 상의 효과도 또한 모두 중요하다. 본 명세서에서 키메라 및 데이터는 재조합에 의해, 단기간(예를 들어, 2-시간) 셀룰로오스 가수분해 검정에서 측정된 특이적 활성의 희생 없이 향상된 내열성을 얻는 CBH II 키메라가 생성됨을 증명하였다. 열안정화 Cys-Ser 돌연변이를 함유하는 CBH II에 대해서도 유사한 관찰을 행하였다. 장기간 가수분해 검정에서, CBH II 키메라 및 모든 3개의 시험한 Cys-Ser 돌연변이체 CBH II 중 몇몇은 천연의 CBH II보다 더 많은 셀룰로오스를 가수분해하였다. 이러한 뛰어난 성능은 효소가 승온에서 더 긴 기간 동안 계속 작용하게 하는 더 큰 내열성과 함께, 모체 CBH II의 특이적 활성과 유사한 특이적 활성을 갖는 결과일 것이다. 이들 검정을 동량의 정제된 모체, 키메라 및 Cys-Ser 돌연변이체 효소로 수행하였기 때문에, 관찰된 고온 가수분해 향상은 S. 세레비지애 발현 숙주로부터의 증가된 분비의 결과가 아니다. 따라서, 내열성 키메라 및 Cys-Ser 돌연변이체가 셀룰로오스 분해를 위한 효소 제형의 유용한 구성성분임을 알 수 있다.
다양한 특정 실시형태가 예시되고 기재되었으나, 본 발명(들)의 사상과 범주로부터 벗어남 없이, 다양한 변형이 이루어질 수 있음이 인식될 것이다.
SEQUENCE LISTING <110> California Institute of Technology Arnold, Frances H. Heinselman, Pete <120> POLYPEPTIDES HAVING CELLULASE ACTIVITY <130> 00016-047WO1 <140> Not yet known <141> 2010-04-06 <150> US 61/166,993 <151> 2009-04-06 <150> US 61/177,882 <151> 2009-05-13 <160> 107 <170> PatentIn version 3.5 <210> 1 <211> 1083 <212> DNA <213> Humicola insolens <220> <221> CDS <222> (1)..(1083) <400> 1 ggt aac ccc ttt gaa ggt gtt cag ctg tgg gct aat aac tat tat aga 48 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 tct gag gta cat aca ctg gcc att ccg caa att aca gac ccc gcg ttg 96 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 cgt gcc gca gct agt gct gtg gct gag gtg cca agt ttt caa tgg ctg 144 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 gac aga aat gta aca gtg gat act ttg ttg gta cag act ttg tca gaa 192 Asp Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu 50 55 60 atc cgt gag gcc aat caa gca ggt gct aat ccc caa tat gca gcg caa 240 Ile Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 atc gtg gtc tat gat ctg ccc gat aga gac tgt gca gct gcc gcc tcg 288 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 aat ggt gaa tgg gca ata gcg aac aac ggt gta aac aat tac aaa gct 336 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 tac att aat aga att aga gag ata ttg ata agt ttt tcg gac gtt aga 384 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 acg ata tta gtc att gag cca gat agt cta gct aat atg gtc aca aat 432 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 atg aat gtc ccg aag tgt tcc ggt gca gcc agc act tat agg gaa tta 480 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 acc ata tat gca ctg aag caa ttg gat ctg cct cat gtc gct atg tac 528 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 atg gat gcc ggc cac gct gga tgg tta ggc tgg ccg gca aac att cag 576 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 cca gcc gca gaa ttg ttt gcc aaa att tac gaa gat gct gga aag cct 624 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 aga gca gtg aga ggt ctt gca act aat gtt gct aat tac aat gca tgg 672 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 tca gtt tca tcc cct cca cca tac aca agt cca aat cca aac tac gat 720 Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 gaa aag cat tat atc gaa gca ttc aga ccc tta tta gaa gcc cgt ggt 768 Glu Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly 245 250 255 ttc cca gcc caa ttt ata gtg gat cag gga aga tca ggt aag caa cca 816 Phe Pro Ala Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro 260 265 270 act ggc caa aag gag tgg ggg cat tgg tgt aat gct att ggc aca gga 864 Thr Gly Gln Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly 275 280 285 ttt ggt atg aga cct act gct aat acc ggt cac cag tat gtg gat gct 912 Phe Gly Met Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala 290 295 300 ttt gtt tgg gtt aaa ccg ggc ggt gaa tgc gac ggg acc agc gat act 960 Phe Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr 305 310 315 320 acg gcg gcc aga tat gat tat cat tgt ggt ctg gaa gat gca tta aaa 1008 Thr Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys 325 330 335 cca gct cct gaa gcc ggc cag tgg ttc aac gaa tac ttc att caa ttg 1056 Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu 340 345 350 ctt agg aac gct aac ccg ccc ttt taa 1083 Leu Arg Asn Ala Asn Pro Pro Phe 355 360 <210> 2 <211> 360 <212> PRT <213> Humicola insolens <400> 2 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu 50 55 60 Ile Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly 245 250 255 Phe Pro Ala Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro 260 265 270 Thr Gly Gln Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly 275 280 285 Phe Gly Met Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr 305 310 315 320 Thr Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys 325 330 335 Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu 340 345 350 Leu Arg Asn Ala Asn Pro Pro Phe 355 360 <210> 3 <211> 1077 <212> DNA <213> Hypocrea jecorina <220> <221> CDS <222> (1)..(1077) <400> 3 ggt aat cca ttc gtt ggg gtg aca ccc tgg gcg aac gcc tat tat gct 48 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 tct gag gtt tca tcc cta gct att ccc tct tta aca ggt gca atg gct 96 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 aca gcc gcc gct gcc gtt gca aag gtc cct tcc ttc atg tgg ctg gat 144 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp 35 40 45 act ttg gac aaa acc ccc tta atg gaa caa acg ttg gct gat ata cgt 192 Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg 50 55 60 act gcg aat aaa aac ggc ggc aat tat gct gga caa ttt gtg gtt tat 240 Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr 65 70 75 80 gac ctg ccg gat aga gat tgt gct gca cta gcg agc aac ggg gag tac 288 Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr 85 90 95 agc att gcg gat ggc ggt gtc gca aag tac aaa aac tat ata gat act 336 Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr 100 105 110 atc agg caa ata gtt gtc gaa tac agt gat att cgt acg ctg ctt gta 384 Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val 115 120 125 atc gaa ccc gat tcc tta gcg aac ttg gta aca aat cta ggt act ccg 432 Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro 130 135 140 aag tgt gcg aac gcg cag agt gct tat ctt gag tgc atc aat tat gca 480 Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala 145 150 155 160 gtc acc cag ttg aat ttg cca aac gtt gca atg tat ctt gat gct ggt 528 Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly 165 170 175 cat gcc ggg tgg ttg ggt tgg cca gca aat cag gat ccc gct gcg cag 576 His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln 180 185 190 ctg ttt gca aat gtt tac aaa aat gcc tca agt cct aga gcg ctg agg 624 Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg 195 200 205 ggt ctt gca aca aat gtt gct aat tac aac gga tgg aat att acc tca 672 Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser 210 215 220 ccc cca tca tac aca caa gga aat gct gtt tac aat gaa aaa ctt tat 720 Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr 225 230 235 240 att cat gcc att ggt cca ctg ctg gct aat cac gga tgg agt aat gcc 768 Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala 245 250 255 ttt ttc att aca gat caa ggg aga agt ggt aaa caa cct act gga caa 816 Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln 260 265 270 caa caa tgg ggt gac tgg tgt aat gtt atc ggt act ggg ttt ggc atc 864 Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile 275 280 285 aga cca tca gcg aat acg ggt gat tca ttg ttg gac tca ttt gtt tgg 912 Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp 290 295 300 gtt aaa ccc ggg ggt gaa tgt gat gga acg agt gat tct tct gct cca 960 Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro 305 310 315 320 agg ttc gat tct cat tgc gca tta cca gat gct ttg cag cca gca cct 1008 Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro 325 330 335 caa gca gga gct tgg ttc caa gct tat ttt gta caa tta ctg act aac 1056 Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn 340 345 350 gcc aat cct agt ttt cta taa 1077 Ala Asn Pro Ser Phe Leu 355 <210> 4 <211> 358 <212> PRT <213> Hypocrea jecorina <400> 4 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp 35 40 45 Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg 50 55 60 Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr 65 70 75 80 Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr 85 90 95 Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr 100 105 110 Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val 115 120 125 Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro 130 135 140 Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala 145 150 155 160 Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly 165 170 175 His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln 180 185 190 Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg 195 200 205 Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser 210 215 220 Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr 225 230 235 240 Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala 245 250 255 Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln 260 265 270 Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile 275 280 285 Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp 290 295 300 Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro 305 310 315 320 Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro 325 330 335 Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn 340 345 350 Ala Asn Pro Ser Phe Leu 355 <210> 5 <211> 1077 <212> DNA <213> Chaetomium thermophilium <220> <221> CDS <222> (1)..(1077) <400> 5 ggt aac cct ttc agt ggt gtg cag tta tgg gct aat act tac tat tct 48 Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala Asn Thr Tyr Tyr Ser 1 5 10 15 tca gaa gtc cac acc tta gct atc cca agc tta agt cca gaa tta gcg 96 Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu Ser Pro Glu Leu Ala 20 25 30 gct aag gcg gcg aaa gta gct gaa gtg cca tca ttc caa tgg tta gat 144 Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 aga aac gtg act gtg gat act ctg ttt tct ggt aca ctt gct gag ata 192 Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu Ile 50 55 60 agg gcg gct aac caa agg gga gct aat cca cca tat gct ggc atc ttt 240 Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 gtg gtt tat gac ctt cct gat aga gat tgt gct gcc gct gca agc aat 288 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 ggt gaa tgg agt ata gct aac aac ggt gct aac aac tat aag aga tat 336 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 atc gat aga att aga gaa ttg ttg att cag tac tca gat atc agg aca 384 Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 att ttg gtt att gaa cca gac agt cta gca aat atg gtt act aac atg 432 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 aac gta caa aaa tgt tct aac gca gca tct acg tat aaa gaa ctg act 480 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Lys Glu Leu Thr 145 150 155 160 gtg tat gca ttg aaa cag ttg aac ttg cca cac gta gcc atg tat atg 528 Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met 165 170 175 gat gca ggt cac gcc ggc tgg tta ggc tgg ccc gct aat ata cag cct 576 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 gcc gca gaa tta ttc gcg caa ata tac aga gac gct gga cgt ccg gct 624 Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala 195 200 205 gcg gtc agg ggt ctt gcc act aac gtt gca aat tac aac gct tgg tca 672 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 ata gcg agt cct cca tcg tac aca agc cct aac cca aac tac gat gag 720 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 aag cat tac ata gaa gca ttt gct cct ttg ctt cgt aac caa ggt ttt 768 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 gat gca aag ttt atc gtc gat acc gga aga aac ggc aag cag ccg aca 816 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 ggg cag cta gaa tgg ggg cac tgg tgc aat gtc aag ggt acg ggt ttc 864 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 ggt gtt aga ccc acg gct aac act ggg cat gag ttg gtt gat gca ttc 912 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 gtt tgg gta aaa ccc gga gga gag tca gac ggt act tct gat act agt 960 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser 305 310 315 320 gct gcc aga tac gat tac cac tgt ggc ctt tct gat gct ttg aca cca 1008 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Thr Pro 325 330 335 gcc cct gaa gcc ggg caa tgg ttc cag gcc tac ttc gaa caa cta ttg 1056 Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu 340 345 350 att aac gca aac cca cca tag 1077 Ile Asn Ala Asn Pro Pro 355 <210> 6 <211> 358 <212> PRT <213> Chaetomium thermophilium <400> 6 Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala Asn Thr Tyr Tyr Ser 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu Ser Pro Glu Leu Ala 20 25 30 Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu Ile 50 55 60 Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Lys Glu Leu Thr 145 150 155 160 Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Thr Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu 340 345 350 Ile Asn Ala Asn Pro Pro 355 <210> 7 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> CBD Linker <220> <221> CDS <222> (1)..(267) <400> 7 gct agc tgc tca agc gtc tgg ggc caa tgt ggt ggc cag aat tgg tcg 48 Ala Ser Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 ggt ccg act tgc tgt gct tcc gga agc aca tgc gtc tac tcc aac gac 96 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 tat tac tcc cag tgt ctt ccc ggc gct gca agc tca agc tcg tcc acg 144 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 cgc gcc gcg tcg acg act tct cga gta tcc ccc aca aca tcc cgg tcg 192 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 agc tcc gcg acg cct cca cct ggt tct act act acc aga gta cct cca 240 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 gtc gga tcg gga acc gct acg tat tca 267 Val Gly Ser Gly Thr Ala Thr Tyr Ser 85 <210> 8 <211> 89 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 8 Ala Ser Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser 85 <210> 9 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer CBH2L <400> 9 gctgaacgtg tcatcggtta c 21 <210> 10 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer RSQ3080 <400> 10 gcaacacctg gcaattcctt acc 23 <210> 11 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer CBH2LPCR <400> 11 gctgaacgtg tcatcgttac ttag 24 <210> 12 <211> 356 <212> PRT <213> Phanerochaete chrysosporium <400> 12 Asn Asn Pro Trp Thr Gly Phe Gln Ile Phe Leu Ser Pro Tyr Tyr Ala 1 5 10 15 Asn Glu Val Ala Ala Ala Ala Lys Gln Ile Thr Asp Pro Thr Leu Ser 20 25 30 Ser Lys Ala Ala Ser Val Ala Asn Ile Pro Thr Phe Thr Trp Leu Asp 35 40 45 Ser Val Ala Lys Ile Pro Asp Leu Gly Thr Tyr Leu Ala Ser Ala Ser 50 55 60 Ala Leu Gly Lys Ser Thr Gly Thr Lys Gln Leu Val Gln Ile Val Ile 65 70 75 80 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Lys Ala Ser Asn Gly Glu 85 90 95 Phe Ser Ile Ala Asn Asn Gly Gln Ala Asn Tyr Glu Asn Tyr Ile Asp 100 105 110 Gln Ile Val Ala Gln Ile Gln Gln Phe Pro Asp Val Arg Val Val Ala 115 120 125 Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Asn Val 130 135 140 Gln Lys Cys Ala Asn Ala Lys Thr Thr Tyr Leu Ala Cys Val Asn Tyr 145 150 155 160 Ala Leu Thr Asn Leu Ala Lys Val Gly Val Tyr Met Tyr Met Asp Ala 165 170 175 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Ser Pro Ala Ala 180 185 190 Gln Leu Phe Thr Gln Val Trp Gln Asn Ala Gly Lys Ser Pro Phe Ile 195 200 205 Lys Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Leu Gln Ala Ala 210 215 220 Ser Pro Asp Pro Ile Thr Gln Gly Asn Pro Asn Tyr Asp Glu Ile His 225 230 235 240 Tyr Ile Asn Ala Leu Ala Pro Leu Leu Gln Gln Ala Gly Trp Asp Ala 245 250 255 Thr Phe Ile Val Asp Gln Gly Arg Ser Gly Val Gln Asn Ile Arg Gln 260 265 270 Gln Trp Gly Asp Trp Cys Asn Ile Lys Gly Ala Gly Phe Gly Thr Arg 275 280 285 Pro Thr Thr Asn Thr Gly Ser Gln Phe Ile Asp Ser Ile Val Trp Val 290 295 300 Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asn Ser Ser Ser Pro Arg 305 310 315 320 Tyr Asp Ser Thr Cys Ser Leu Pro Asp Ala Ala Gln Pro Ala Pro Glu 325 330 335 Ala Gly Thr Trp Phe Gln Ala Tyr Phe Gln Thr Leu Val Ser Ala Ala 340 345 350 Asn Pro Pro Leu 355 <210> 13 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II polypeptide <400> 13 Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala Asn Thr Tyr Tyr Ser 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu Ser Pro Glu Leu Ala 20 25 30 Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser Phe Met Trp Leu Asp 35 40 45 Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg 50 55 60 Thr Ala Asn Lys Asn Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val 65 70 75 80 Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly 85 90 95 Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr Ile 100 105 110 Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr Ile 115 120 125 Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn 130 135 140 Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Lys Glu Leu Thr Val 145 150 155 160 Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met Asp 165 170 175 Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala 180 185 190 Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala Ala 195 200 205 Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Val 210 215 220 Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys 225 230 235 240 His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro 245 250 255 Ala Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly 260 265 270 Gln Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe Gly 275 280 285 Met Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe Val 290 295 300 Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Ser Ala 305 310 315 320 Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Thr Pro Ala 325 330 335 Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Ile 340 345 350 Asn Ala Asn Pro Pro Phe 355 <210> 14 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II polypeptide <400> 14 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro 260 265 270 Thr Gly Gln Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly 275 280 285 Phe Gly Met Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr 305 310 315 320 Ser Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Thr 325 330 335 Pro Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu 340 345 350 Leu Ile Asn Ala Asn Pro Pro Phe 355 360 <210> 15 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 15 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu 50 55 60 Ile Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Lys Glu Leu 145 150 155 160 Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro 195 200 205 Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly 245 250 255 Phe Pro Asn Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln 260 265 270 Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr 275 280 285 Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp 290 295 300 Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp 305 310 315 320 Thr Thr Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu 325 330 335 Lys Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln 340 345 350 Leu Leu Arg Asn Ala Asn Pro Pro Phe 355 360 <210> 16 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 16 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu Ile 50 55 60 Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr 260 265 270 Gly Gln Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe 275 280 285 Gly Met Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu 340 345 350 Arg Asn Ala Asn Pro Pro Phe 355 <210> 17 <211> 357 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 17 Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala Asn Thr Tyr Tyr Ser 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu Ser Pro Glu Leu Ala 20 25 30 Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu Ile 50 55 60 Arg Glu Ala Asn Gln Ala Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 65 70 75 80 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 85 90 95 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 100 105 110 Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr Ile Leu 115 120 125 Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val 130 135 140 Pro Lys Cys Ser Gly Ala Ala Ser Ala Tyr Leu Glu Cys Ile Asn Tyr 145 150 155 160 Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala 165 170 175 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala 180 185 190 Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu 195 200 205 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Val Ser 210 215 220 Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 225 230 235 240 Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala 245 250 255 Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln 260 265 270 Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe Gly Met 275 280 285 Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe Val Trp 290 295 300 Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr Ala Ala 305 310 315 320 Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala Pro 325 330 335 Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu Arg Asn 340 345 350 Ala Asn Pro Pro Phe 355 <210> 18 <211> 357 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 18 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu Ile 50 55 60 Arg Ala Ala Asn Gln Arg Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 65 70 75 80 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 85 90 95 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 100 105 110 Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr Ile Leu 115 120 125 Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val 130 135 140 Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Lys Glu Leu Thr Val Tyr 145 150 155 160 Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met Asp Ala 165 170 175 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala 180 185 190 Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala Ala Val 195 200 205 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Val Ser 210 215 220 Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 225 230 235 240 Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala 245 250 255 Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln 260 265 270 Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val 275 280 285 Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp 290 295 300 Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala 305 310 315 320 Arg Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Thr Pro Ala Pro 325 330 335 Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Ile Asn 340 345 350 Ala Asn Pro Pro Phe 355 <210> 19 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 19 Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala Asn Thr Tyr Tyr Ser 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu Ser Pro Glu Leu Ala 20 25 30 Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu Ile 50 55 60 Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe 245 250 255 Pro Ala Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr 260 265 270 Gly Gln Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe 275 280 285 Gly Met Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 20 <211> 356 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 20 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp 35 40 45 Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg 50 55 60 Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr 65 70 75 80 Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr 85 90 95 Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Arg 100 105 110 Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr Ile Leu Val 115 120 125 Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val Pro 130 135 140 Lys Cys Ser Gly Ala Ala Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala 145 150 155 160 Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly 165 170 175 His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln 180 185 190 Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg 195 200 205 Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser 210 215 220 Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr 225 230 235 240 Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Ala Lys 245 250 255 Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Leu 260 265 270 Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg 275 280 285 Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp Val 290 295 300 Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Thr Ala Ala Arg 305 310 315 320 Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala Pro Glu 325 330 335 Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu Arg Asn Ala 340 345 350 Asn Pro Pro Phe 355 <210> 21 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 21 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Gly Asn Tyr Ala Gly Gln Phe Val 65 70 75 80 Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly 85 90 95 Glu Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile 100 105 110 Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr Ile 115 120 125 Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn 130 135 140 Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Arg Glu Leu Thr Ile 145 150 155 160 Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met Asp 165 170 175 Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala 180 185 190 Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg Ala 195 200 205 Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Val 210 215 220 Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys 225 230 235 240 His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro 245 250 255 Ala Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly 260 265 270 Gln Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe Gly 275 280 285 Met Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe Val 290 295 300 Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr Ala 305 310 315 320 Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala 325 330 335 Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu Arg 340 345 350 Asn Ala Asn Pro Pro Phe 355 <210> 22 <211> 357 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 22 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 65 70 75 80 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 85 90 95 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 100 105 110 Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr Ile Leu 115 120 125 Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val 130 135 140 Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Lys Glu Leu Thr Val Tyr 145 150 155 160 Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met Asp Ala 165 170 175 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala 180 185 190 Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala Ala Val 195 200 205 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Val Ser 210 215 220 Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 225 230 235 240 Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala 245 250 255 Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln 260 265 270 Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe Gly Met 275 280 285 Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe Val Trp 290 295 300 Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr Ala Ala 305 310 315 320 Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala Pro 325 330 335 Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu Arg Asn 340 345 350 Ala Asn Pro Pro Phe 355 <210> 23 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 23 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Lys Glu Leu Thr 145 150 155 160 Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Thr Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu 340 345 350 Ile Asn Ala Asn Pro Pro Phe 355 <210> 24 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 24 Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala Asn Thr Tyr Tyr Ser 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu Ser Pro Glu Leu Ala 20 25 30 Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu Ile 50 55 60 Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Lys Glu Leu Thr 145 150 155 160 Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe 245 250 255 Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 25 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 25 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu 50 55 60 Ile Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys 145 150 155 160 Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr 165 170 175 Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp 180 185 190 Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro 195 200 205 Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr 305 310 315 320 Ser Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Thr 325 330 335 Pro Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu 340 345 350 Leu Ile Asn Ala Asn Pro Pro Phe 355 360 <210> 26 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 26 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu Ile 50 55 60 Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Thr Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu 340 345 350 Ile Asn Ala Asn Pro Pro Phe 355 <210> 27 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 27 Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala Asn Thr Tyr Tyr Ser 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu Ser Pro Glu Leu Ala 20 25 30 Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu Ile 50 55 60 Arg Ala Ala Asn Gln Arg Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 65 70 75 80 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 85 90 95 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 100 105 110 Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr Ile Leu 115 120 125 Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val 130 135 140 Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Lys Glu Leu Thr Val Tyr 145 150 155 160 Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met Asp Ala 165 170 175 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala 180 185 190 Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala Ala Val 195 200 205 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala 210 215 220 Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 225 230 235 240 Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe Asp Ala 245 250 255 Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln 260 265 270 Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val 275 280 285 Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp 290 295 300 Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser Ala Pro 305 310 315 320 Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro 325 330 335 Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn 340 345 350 Ala Asn Pro Ser Phe Leu 355 <210> 28 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 28 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Lys Glu Leu 145 150 155 160 Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro 195 200 205 Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp 210 215 220 Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn 225 230 235 240 Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly 245 250 255 Trp Ser Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 29 <211> 357 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 29 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp 35 40 45 Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg 50 55 60 Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr 65 70 75 80 Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr 85 90 95 Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Arg 100 105 110 Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr Ile Leu Val 115 120 125 Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val Gln 130 135 140 Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala 145 150 155 160 Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly 165 170 175 His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln 180 185 190 Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg 195 200 205 Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Val Ser Ser 210 215 220 Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr 225 230 235 240 Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala Lys 245 250 255 Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Leu 260 265 270 Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg 275 280 285 Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp Val 290 295 300 Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser Ala Pro Arg 305 310 315 320 Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln 325 330 335 Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala 340 345 350 Asn Pro Ser Phe Leu 355 <210> 30 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 30 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu 50 55 60 Ile Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Lys Glu Leu 145 150 155 160 Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro 195 200 205 Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly 245 250 255 Phe Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 31 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 31 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu Ile 50 55 60 Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Lys Glu Leu Thr 145 150 155 160 Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Thr 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu 340 345 350 Arg Asn Ala Asn Pro Pro Phe 355 <210> 32 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 32 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Gln Trp Leu Asp 35 40 45 Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu Ile 50 55 60 Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe 245 250 255 Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Thr 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu 340 345 350 Arg Asn Ala Asn Pro Pro Phe 355 <210> 33 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 33 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys Ile 145 150 155 160 Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro 180 185 190 Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg 195 200 205 Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Thr 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu 340 345 350 Arg Asn Ala Asn Pro Pro Phe 355 <210> 34 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 34 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Ala Tyr Leu Glu Cys 145 150 155 160 Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr 165 170 175 Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp 180 185 190 Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro 195 200 205 Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 35 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 35 Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala 1 5 10 15 Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala 20 25 30 Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp 35 40 45 Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg 50 55 60 Thr Ala Asn Lys Asn Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val 65 70 75 80 Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly 85 90 95 Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr Ile 100 105 110 Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr Ile 115 120 125 Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn 130 135 140 Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr Ile 145 150 155 160 Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met Asp 165 170 175 Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala 180 185 190 Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg Ala 195 200 205 Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile 210 215 220 Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys 225 230 235 240 His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe Asp 245 250 255 Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly 260 265 270 Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe Gly 275 280 285 Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val 290 295 300 Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Thr Ala 305 310 315 320 Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala 325 330 335 Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu Arg 340 345 350 Asn Ala Asn Pro Pro Phe 355 <210> 36 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 36 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 37 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 37 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Ala Tyr Leu Glu Cys Ile 145 150 155 160 Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro 180 185 190 Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg 195 200 205 Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 38 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 38 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Thr 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu 340 345 350 Arg Asn Ala Asn Pro Pro Phe 355 <210> 39 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 39 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 40 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 40 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys Ile 145 150 155 160 Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro 180 185 190 Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg 195 200 205 Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 41 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 41 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe 245 250 255 Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Thr 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu 340 345 350 Arg Asn Ala Asn Pro Pro Phe 355 <210> 42 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 42 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 43 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 43 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys 145 150 155 160 Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr 165 170 175 Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp 180 185 190 Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro 195 200 205 Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr 305 310 315 320 Thr Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys 325 330 335 Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu 340 345 350 Leu Arg Asn Ala Asn Pro Pro Phe 355 360 <210> 44 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 44 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys Ile 145 150 155 160 Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro 180 185 190 Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg 195 200 205 Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Thr 305 310 315 320 Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro 325 330 335 Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu Leu 340 345 350 Arg Asn Ala Asn Pro Pro Phe 355 <210> 45 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 45 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys Ile 145 150 155 160 Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro 180 185 190 Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg 195 200 205 Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 46 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 46 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys 145 150 155 160 Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr 165 170 175 Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp 180 185 190 Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro 195 200 205 Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 47 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 47 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Ala Tyr Leu Glu Cys Ile 145 150 155 160 Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro 180 185 190 Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg 195 200 205 Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe 245 250 255 Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 48 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 48 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg 115 120 125 Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn 130 135 140 Leu Gly Thr Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys 145 150 155 160 Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr 165 170 175 Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp 180 185 190 Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro 195 200 205 Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 49 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 49 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 50 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 50 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg Tyr 100 105 110 Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Arg Glu Leu Thr 145 150 155 160 Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe 245 250 255 Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 51 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 51 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Ala Tyr Leu Glu Cys 145 150 155 160 Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr 165 170 175 Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp 180 185 190 Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro 195 200 205 Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 52 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 52 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu 50 55 60 Ile Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Lys Glu Leu 145 150 155 160 Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro 195 200 205 Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 53 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 53 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Lys Glu Leu 145 150 155 160 Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro 195 200 205 Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly 245 250 255 Phe Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 54 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 54 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu 50 55 60 Ile Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Ala Tyr Leu Glu Cys 145 150 155 160 Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr 165 170 175 Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp 180 185 190 Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro 195 200 205 Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly 245 250 255 Phe Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 55 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 55 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Ala Asn Pro Gln Tyr Ala Ala Gln Ile 65 70 75 80 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 85 90 95 Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala Tyr 100 105 110 Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr 115 120 125 Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 130 135 140 Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Lys Glu Leu Thr 145 150 155 160 Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Met 165 170 175 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro 180 185 190 Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Arg Pro Ala 195 200 205 Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser 210 215 220 Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu 225 230 235 240 Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe 245 250 255 Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr 260 265 270 Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe 275 280 285 Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe 290 295 300 Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser 305 310 315 320 Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro 325 330 335 Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu 340 345 350 Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 56 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 56 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Ala Tyr Leu Glu Cys 145 150 155 160 Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr 165 170 175 Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp 180 185 190 Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro 195 200 205 Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 57 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 57 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Leu Val Gln Thr Leu Ser Glu 50 55 60 Ile Arg Glu Ala Asn Gln Ala Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly 245 250 255 Phe Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 58 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 58 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr Ser Asp Ile Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 59 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 59 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Gln Tyr Ala Ala Gln 65 70 75 80 Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ala Ile Ala Asn Asn Gly Val Asn Asn Tyr Lys Ala 100 105 110 Tyr Ile Asn Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly 245 250 255 Phe Pro Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 60 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 60 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 65 70 75 80 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 85 90 95 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 100 105 110 Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu 115 120 125 Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr 130 135 140 Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr 145 150 155 160 Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala 165 170 175 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala 180 185 190 Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu 195 200 205 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Val Ser 210 215 220 Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 225 230 235 240 Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala 245 250 255 Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln 260 265 270 Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val 275 280 285 Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp 290 295 300 Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser Ala Pro 305 310 315 320 Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro 325 330 335 Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn 340 345 350 Ala Asn Pro Ser Phe Leu 355 <210> 61 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 61 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Met Trp Leu 35 40 45 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 50 55 60 Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 65 70 75 80 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 85 90 95 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 100 105 110 Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu 115 120 125 Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr 130 135 140 Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr 145 150 155 160 Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala 165 170 175 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala 180 185 190 Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu 195 200 205 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala 210 215 220 Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 225 230 235 240 Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly Phe Asp Ala 245 250 255 Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln 260 265 270 Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val 275 280 285 Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp 290 295 300 Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser Ser Ala Pro 305 310 315 320 Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro 325 330 335 Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn 340 345 350 Ala Asn Pro Ser Phe Leu 355 <210> 62 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 62 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Ser 305 310 315 320 Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln 325 330 335 Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu 340 345 350 Leu Thr Asn Ala Asn Pro Ser Phe Leu 355 360 <210> 63 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> Chimeric CBH II Polypeptide <400> 63 Gly Asn Pro Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg 1 5 10 15 Ser Glu Val His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu 20 25 30 Arg Ala Ala Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu 35 40 45 Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Glu 50 55 60 Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro Tyr Ala Gly Ile 65 70 75 80 Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser 85 90 95 Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Arg 100 105 110 Tyr Ile Asp Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg 115 120 125 Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn 130 135 140 Met Asn Val Pro Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu 145 150 155 160 Thr Ile Tyr Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr 165 170 175 Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln 180 185 190 Pro Ala Ala Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro 195 200 205 Arg Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp 210 215 220 Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp 225 230 235 240 Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu Arg Asn Gln Gly 245 250 255 Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro 260 265 270 Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val Lys Gly Thr Gly 275 280 285 Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala 290 295 300 Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr 305 310 315 320 Thr Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys 325 330 335 Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr Phe Ile Gln Leu 340 345 350 Leu Arg Asn Ala Asn Pro Pro Phe 355 360 <210> 64 <211> 447 <212> PRT <213> Trichoderma reesei <400> 64 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Gly Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Asn Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Arg Phe Asp Ser His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 65 <211> 453 <212> PRT <213> Humicola insolens <400> 65 Ala Ser Cys Ala Pro Thr Trp Gly Gln Cys Gly Gly Ile Gly Phe Asn 1 5 10 15 Gly Pro Thr Cys Cys Gln Ser Gly Ser Thr Cys Val Lys Gln Asn Asp 20 25 30 Trp Tyr Ser Gln Cys Leu Pro Gly Ser Gln Val Thr Thr Thr Ser Thr 35 40 45 Thr Ser Thr Ser Ser Ser Ser Thr Thr Ser Arg Ala Thr Ser Thr Thr 50 55 60 Ser Thr Gly Gly Val Thr Ser Ile Thr Thr Ala Pro Thr Arg Thr Val 65 70 75 80 Thr Ile Pro Gly Gly Ala Thr Thr Thr Ala Ser Tyr Asn Gly Asn Pro 85 90 95 Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg Ser Glu Val 100 105 110 His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu Arg Ala Ala 115 120 125 Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn 130 135 140 Val Thr Val Asp Thr Leu Leu Val Glu Thr Leu Ser Glu Ile Arg Ala 145 150 155 160 Ala Asn Gln Ala Gly Ala Asn Pro Pro Tyr Ala Ala Gln Ile Val Val 165 170 175 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu 180 185 190 Trp Ala Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Gly Tyr Ile Asn 195 200 205 Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr Ile Leu 210 215 220 Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val 225 230 235 240 Ala Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr Ile Tyr 245 250 255 Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met Asp Ala 260 265 270 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala 275 280 285 Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg Ala Val 290 295 300 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ser 305 310 315 320 Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 325 330 335 Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala 340 345 350 Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln 355 360 365 Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe Gly Met 370 375 380 Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe Val Trp 385 390 395 400 Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr Ala Ala 405 410 415 Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala Pro 420 425 430 Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Arg Asn 435 440 445 Ala Asn Pro Pro Phe 450 <210> 66 <211> 440 <212> PRT <213> Phanerochaete chrysosporium <400> 66 Ala Ser Ser Glu Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro 1 5 10 15 Thr Thr Cys Val Ser Gly Thr Thr Cys Thr Val Leu Asn Pro Tyr Tyr 20 25 30 Ser Gln Cys Leu Pro Gly Ser Ala Val Thr Thr Thr Ser Val Ile Thr 35 40 45 Ser His Ser Ser Ser Val Ser Ser Val Ser Ser His Ser Gly Ser Ser 50 55 60 Thr Ser Thr Ser Ser Pro Thr Gly Pro Thr Gly Thr Asn Pro Pro Pro 65 70 75 80 Pro Pro Ser Ala Asn Asn Pro Trp Thr Gly Phe Gln Ile Phe Leu Ser 85 90 95 Pro Tyr Tyr Ala Asn Glu Val Ala Ala Ala Ala Lys Gln Ile Thr Asp 100 105 110 Pro Thr Leu Ser Ser Lys Ala Ala Ser Val Ala Asn Ile Pro Thr Phe 115 120 125 Thr Trp Leu Asp Ser Val Ala Lys Ile Pro Asp Leu Gly Thr Tyr Leu 130 135 140 Ala Ser Ala Ser Ala Leu Gly Lys Ser Thr Gly Thr Lys Gln Leu Val 145 150 155 160 Gln Ile Val Ile Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Lys Ala 165 170 175 Ser Asn Gly Glu Phe Ser Ile Ala Asn Asn Gly Gln Ala Asn Tyr Glu 180 185 190 Asn Tyr Ile Asp Gln Ile Val Ala Gln Ile Gln Gln Phe Pro Asp Val 195 200 205 Arg Val Val Ala Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr 210 215 220 Asn Leu Asn Val Gln Lys Cys Ala Asn Ala Lys Thr Thr Tyr Leu Ala 225 230 235 240 Cys Val Asn Tyr Ala Leu Thr Asn Leu Ala Lys Val Gly Val Tyr Met 245 250 255 Tyr Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu 260 265 270 Ser Pro Ala Ala Gln Leu Phe Thr Gln Val Trp Gln Asn Ala Gly Lys 275 280 285 Ser Pro Phe Ile Lys Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala 290 295 300 Leu Gln Ala Ala Ser Pro Asp Pro Ile Thr Gln Gly Asn Pro Asn Tyr 305 310 315 320 Asp Glu Ile His Tyr Ile Asn Ala Leu Ala Pro Leu Leu Gln Gln Ala 325 330 335 Gly Trp Asp Ala Thr Phe Ile Val Asp Gln Gly Arg Ser Gly Val Gln 340 345 350 Asn Ile Arg Gln Gln Trp Gly Asp Trp Cys Asn Ile Lys Gly Ala Gly 355 360 365 Phe Gly Thr Arg Pro Thr Thr Asn Thr Gly Ser Gln Phe Ile Asp Ser 370 375 380 Ile Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asn Ser 385 390 395 400 Ser Ser Pro Arg Tyr Asp Ser Thr Cys Ser Leu Pro Asp Ala Ala Gln 405 410 415 Pro Ala Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Gln Thr Leu 420 425 430 Val Ser Ala Ala Asn Pro Pro Leu 435 440 <210> 67 <211> 447 <212> PRT <213> Trichoderma reesei <400> 67 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Gly Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Asn Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Arg Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 68 <211> 447 <212> PRT <213> Trichoderma reesei <400> 68 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Glu Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Ser Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Ser Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Gln Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 69 <211> 447 <212> PRT <213> Trichoderma reesei <400> 69 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Ser Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Asn Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Arg Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 70 <211> 447 <212> PRT <213> Trichoderma reesei <400> 70 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Gly Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Ser Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Arg Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 71 <211> 447 <212> PRT <213> Trichoderma reesei <400> 71 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Gly Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Asn Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Gln Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 72 <211> 447 <212> PRT <213> Trichoderma reesei <400> 72 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Ser Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Ser Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Arg Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 73 <211> 447 <212> PRT <213> Trichoderma reesei <400> 73 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Ser Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Asn Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Gln Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 74 <211> 447 <212> PRT <213> Trichoderma reesei <400> 74 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Gly Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Ser Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Gln Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 75 <211> 447 <212> PRT <213> Trichoderma reesei <400> 75 Gln Ala Cys Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser 1 5 10 15 Gly Pro Thr Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp 20 25 30 Tyr Tyr Ser Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr 35 40 45 Arg Ala Ala Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser 50 55 60 Ser Ser Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro 65 70 75 80 Val Gly Ser Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val 85 90 95 Thr Pro Trp Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala 100 105 110 Ile Pro Ser Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala 115 120 125 Lys Val Pro Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu 130 135 140 Met Glu Gln Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly 145 150 155 160 Asn Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 165 170 175 Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val 180 185 190 Ala Lys Tyr Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu 195 200 205 Tyr Ser Asp Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala 210 215 220 Asn Leu Val Thr Asn Leu Ser Thr Pro Lys Cys Ala Asn Ala Gln Ser 225 230 235 240 Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro 245 250 255 Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp 260 265 270 Pro Ala Asn Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys 275 280 285 Asn Ala Ser Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala 290 295 300 Ser Tyr Asn Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly 305 310 315 320 Asn Ala Val Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu 325 330 335 Leu Ala Asn His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly 340 345 350 Arg Ser Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys 355 360 365 Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly 370 375 380 Asp Ser Leu Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys 385 390 395 400 Asp Gly Thr Ser Asp Ser Ser Ala Pro Gln Phe Asp Pro His Cys Ala 405 410 415 Leu Pro Asp Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln 420 425 430 Ala Tyr Phe Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 435 440 445 <210> 76 <211> 453 <212> PRT <213> Humicola insolens <400> 76 Ala Ser Cys Ala Pro Thr Trp Gly Gln Cys Gly Gly Ile Gly Phe Asn 1 5 10 15 Gly Pro Thr Cys Cys Gln Ser Gly Ser Thr Cys Val Lys Gln Asn Asp 20 25 30 Trp Tyr Ser Gln Cys Leu Pro Gly Ser Gln Val Thr Thr Thr Ser Thr 35 40 45 Thr Ser Thr Ser Ser Ser Ser Thr Thr Ser Arg Ala Thr Ser Thr Thr 50 55 60 Ser Thr Gly Gly Val Thr Ser Ile Thr Thr Ala Pro Thr Arg Thr Val 65 70 75 80 Thr Ile Pro Gly Gly Ala Thr Thr Thr Ala Ser Tyr Asn Gly Asn Pro 85 90 95 Phe Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg Ser Glu Val 100 105 110 His Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu Arg Ala Ala 115 120 125 Ala Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn 130 135 140 Val Thr Val Asp Thr Leu Leu Val Glu Thr Leu Ser Glu Ile Arg Ala 145 150 155 160 Ala Asn Gln Ala Gly Ala Asn Pro Pro Tyr Ala Ala Gln Ile Val Val 165 170 175 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu 180 185 190 Trp Ala Ile Ala Asn Asn Gly Ala Asn Asn Tyr Lys Gly Tyr Ile Asn 195 200 205 Arg Ile Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr Ile Leu 210 215 220 Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val 225 230 235 240 Ala Lys Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr Ile Tyr 245 250 255 Ala Leu Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met Asp Ala 260 265 270 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala 275 280 285 Glu Leu Phe Ala Lys Ile Tyr Glu Asp Ala Gly Lys Pro Arg Ala Val 290 295 300 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ser 305 310 315 320 Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 325 330 335 Tyr Ile Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala 340 345 350 Gln Phe Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln 355 360 365 Lys Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe Gly Met 370 375 380 Arg Pro Thr Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe Val Trp 385 390 395 400 Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr Ala Ala 405 410 415 Arg Tyr Asp Pro His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala Pro 420 425 430 Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Arg Asn 435 440 445 Ala Asn Pro Pro Phe 450 <210> 77 <211> 440 <212> PRT <213> Phanerochaete chrysosporium <400> 77 Ala Ser Ser Glu Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro 1 5 10 15 Thr Thr Cys Val Ser Gly Thr Thr Cys Thr Val Leu Asn Pro Tyr Tyr 20 25 30 Ser Gln Cys Leu Pro Gly Ser Ala Val Thr Thr Thr Ser Val Ile Thr 35 40 45 Ser His Ser Ser Ser Val Ser Ser Val Ser Ser His Ser Gly Ser Ser 50 55 60 Thr Ser Thr Ser Ser Pro Thr Gly Pro Thr Gly Thr Asn Pro Pro Pro 65 70 75 80 Pro Pro Ser Ala Asn Asn Pro Trp Thr Gly Phe Gln Ile Phe Leu Ser 85 90 95 Pro Tyr Tyr Ala Asn Glu Val Ala Ala Ala Ala Lys Gln Ile Thr Asp 100 105 110 Pro Thr Leu Ser Ser Lys Ala Ala Ser Val Ala Asn Ile Pro Thr Phe 115 120 125 Thr Trp Leu Asp Ser Val Ala Lys Ile Pro Asp Leu Gly Thr Tyr Leu 130 135 140 Ala Ser Ala Ser Ala Leu Gly Lys Ser Thr Gly Thr Lys Gln Leu Val 145 150 155 160 Gln Ile Val Ile Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Lys Ala 165 170 175 Ser Asn Gly Glu Phe Ser Ile Ala Asn Asn Gly Gln Ala Asn Tyr Glu 180 185 190 Asn Tyr Ile Asp Gln Ile Val Ala Gln Ile Gln Gln Phe Pro Asp Val 195 200 205 Arg Val Val Ala Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr 210 215 220 Asn Leu Asn Val Gln Lys Cys Ala Asn Ala Lys Thr Thr Tyr Leu Ala 225 230 235 240 Cys Val Asn Tyr Ala Leu Thr Asn Leu Ala Lys Val Gly Val Tyr Met 245 250 255 Tyr Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu 260 265 270 Ser Pro Ala Ala Gln Leu Phe Thr Gln Val Trp Gln Asn Ala Gly Lys 275 280 285 Ser Pro Phe Ile Lys Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala 290 295 300 Leu Gln Ala Ala Ser Pro Asp Pro Ile Thr Gln Gly Asn Pro Asn Tyr 305 310 315 320 Asp Glu Ile His Tyr Ile Asn Ala Leu Ala Pro Leu Leu Gln Gln Ala 325 330 335 Gly Trp Asp Ala Thr Phe Ile Val Asp Gln Gly Arg Ser Gly Val Gln 340 345 350 Asn Ile Arg Gln Gln Trp Gly Asp Trp Cys Asn Ile Lys Gly Ala Gly 355 360 365 Phe Gly Thr Arg Pro Thr Thr Asn Thr Gly Ser Gln Phe Ile Asp Ser 370 375 380 Ile Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asn Ser 385 390 395 400 Ser Ser Pro Arg Tyr Asp Pro Thr Cys Ser Leu Pro Asp Ala Ala Gln 405 410 415 Pro Ala Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Gln Thr Leu 420 425 430 Val Ser Ala Ala Asn Pro Pro Leu 435 440 <210> 78 <211> 459 <212> PRT <213> Trichoderma reesei <400> 78 Asp Tyr Lys Asp Asp Asp Asp Lys Glu Phe Leu Glu Ala Ser Cys Ser 1 5 10 15 Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys 20 25 30 Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln 35 40 45 Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser 50 55 60 Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr 65 70 75 80 Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly 85 90 95 Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala 100 105 110 Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu 115 120 125 Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser 130 135 140 Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr 145 150 155 160 Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly 165 170 175 Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala 180 185 190 Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys 195 200 205 Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile 210 215 220 Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr 225 230 235 240 Asn Leu Gly Thr Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu 245 250 255 Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met 260 265 270 Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln 275 280 285 Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser 290 295 300 Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly 305 310 315 320 Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr 325 330 335 Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His 340 345 350 Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys 355 360 365 Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly 370 375 380 Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu 385 390 395 400 Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser 405 410 415 Asp Ser Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala 420 425 430 Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val 435 440 445 Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 450 455 <210> 79 <211> 484 <212> PRT <213> Podospora anserina <400> 79 Met Ala Lys Arg Leu Leu Leu Thr Ala Ala Leu Ala Ala Thr Thr Leu 1 5 10 15 Ala Ala Pro Val Ile Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser 20 25 30 Gln Cys Gly Gly Gln Gly Trp Thr Gly Ala Thr Cys Cys Ala Ser Gly 35 40 45 Ser Thr Cys Val Ala Gln Asn Gln Trp Tyr Ser Gln Cys Leu Pro Gly 50 55 60 Ser Gln Val Thr Thr Thr Ala Gln Ala Pro Ser Ser Thr Arg Thr Thr 65 70 75 80 Thr Ser Ser Ser Ser Arg Pro Thr Ser Ser Ser Ile Ser Thr Ser Ala 85 90 95 Val Asn Val Pro Thr Thr Thr Thr Ser Ala Gly Ala Ser Val Thr Val 100 105 110 Pro Pro Gly Gly Gly Ala Ser Ser Thr Ala Ser Tyr Ser Gly Asn Pro 115 120 125 Phe Leu Gly Val Gln Gln Trp Ala Asn Ser Tyr Tyr Ser Ser Glu Val 130 135 140 His Thr Leu Ala Ile Pro Ser Leu Thr Gly Pro Met Ala Thr Lys Ala 145 150 155 160 Ala Ala Val Ala Lys Val Pro Ser Phe Gln Trp Met Asp Arg Asn Val 165 170 175 Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Asp Ile Arg Ala Ala 180 185 190 Asn Arg Ala Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr 195 200 205 Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Trp 210 215 220 Ala Ile Ala Asp Gly Gly Ala Ala Lys Tyr Lys Ala Tyr Ile Asp Arg 225 230 235 240 Ile Arg His His Leu Val Gln Tyr Ser Asp Ile Arg Thr Ile Leu Val 245 250 255 Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val Pro 260 265 270 Lys Cys Gln Gly Ala Ala Asn Thr Tyr Lys Glu Leu Thr Val Tyr Ala 275 280 285 Leu Lys Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly 290 295 300 His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gly Pro Ala Ala Glu 305 310 315 320 Leu Phe Ala Gly Ile Tyr Lys Asp Ala Gly Arg Pro Thr Ser Leu Arg 325 330 335 Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ser Ser 340 345 350 Ala Pro Ser Tyr Thr Thr Pro Asn Pro Asn Phe Asp Glu Lys Arg Phe 355 360 365 Val Gln Ala Phe Ser Pro Leu Leu Thr Ala Ala Gly Phe Pro Ala His 370 375 380 Phe Ile Thr Asp Thr Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln Leu 385 390 395 400 Glu Trp Gly His Trp Cys Asn Ala Ile Gly Thr Gly Phe Gly Pro Arg 405 410 415 Pro Thr Thr Asp Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Ile 420 425 430 Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr Ala Ala Arg 435 440 445 Tyr Asp His His Cys Gly Phe Ala Asp Ala Leu Lys Pro Ala Pro Glu 450 455 460 Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala 465 470 475 480 Asn Pro Pro Phe <210> 80 <211> 485 <212> PRT <213> Chaetomium Globosum <400> 80 Met Ala Ala Lys Leu Phe Leu Ala Ala Ala Leu Ala Ala Thr Ala Leu 1 5 10 15 Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Ala Thr Leu Trp Gly 20 25 30 Gln Cys Gly Gly Asn Gly Trp Asn Gly Ala Thr Cys Cys Ala Ser Gly 35 40 45 Ser Thr Cys Thr Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu Pro Gly 50 55 60 Gly Ala Val Thr Thr Pro Gly Thr Thr Thr Lys Pro Thr Ser Thr Ser 65 70 75 80 Thr Ser Thr Ser Thr Ser Ser Arg Ser Thr Ser Thr Ser Gln Gly Gly 85 90 95 Gly Val Ser Ser Ser Thr Ser Ser Pro Pro Val Val Thr Asn Pro Pro 100 105 110 Thr Ser Ile Pro Gly Gly Ala Ser Ser Thr Ala Ser Tyr Thr Gly Asn 115 120 125 Pro Phe Ser Gly Val Gln Met Trp Ala Asn Asp Tyr Tyr Arg Ser Glu 130 135 140 Val His Thr Leu Ala Met Pro Ser Leu Thr Gly Ala Met Ala Thr Lys 145 150 155 160 Ala Ala Lys Val Ala Glu Val Pro Ser Tyr Gln Trp Met Asp Arg Asn 165 170 175 Val Thr Val Asp Thr Leu Phe Ser Gly Thr Leu Ala Gln Ile Arg Ala 180 185 190 Ala Asn Gln Ala Gly Ala Ser Pro Pro Tyr Ala Gly Ile Phe Val Val 195 200 205 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu 210 215 220 Trp Ser Ile Ala Asn Gly Gly Ala Ala Asn Tyr Lys Ala Tyr Ile Lys 225 230 235 240 Arg Ile Arg Glu Leu Ile Ile Gln Tyr Ser Asp Ile Arg Met Leu Leu 245 250 255 Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Gly Val 260 265 270 Ala Lys Cys Ala Gly Ala Ala Ser Thr Tyr Lys Glu Leu Thr Ile His 275 280 285 Ala Leu Lys Glu Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala 290 295 300 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala 305 310 315 320 Asp Leu Phe Ala Thr Leu Tyr Lys Asp Ala Gly Arg Pro Ala Ala Val 325 330 335 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Val Ser 340 345 350 Ser Ala Pro Ala Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His 355 360 365 Tyr Val Glu Ala Phe Ser Pro Leu Leu Thr Ala Ala Gly Phe Pro Ala 370 375 380 His Phe Ile Thr Asp Thr Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln 385 390 395 400 Leu Glu Trp Gly His Trp Cys Asn Ala Val Gly Thr Gly Phe Gly Gln 405 410 415 Arg Pro Ser Ala Asn Thr Gly His Asp Leu Leu Asp Ala Phe Val Trp 420 425 430 Ile Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr Ala Ala 435 440 445 Arg Tyr Asp His Asn Cys Gly Leu Ala Asp Ala Leu Lys Pro Ala Pro 450 455 460 Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn 465 470 475 480 Ala Asn Pro Pro Phe 485 <210> 81 <211> 487 <212> PRT <213> Magnaporthe grisea <400> 81 Met Ala Ser Lys Leu Phe Leu Ala Ala Ala Leu Leu Gln Gly Ala Leu 1 5 10 15 Ser Ser Pro Leu Ala Val Glu Glu Arg Gln Ala Cys Ala Ala Gln Trp 20 25 30 Gly Gln Cys Gly Gly Gln Asp Tyr Thr Gly Pro Thr Cys Cys Gln Ser 35 40 45 Gly Ser Thr Cys Val Val Ser Asn Gln Trp Tyr Ser Gln Cys Leu Pro 50 55 60 Gly Ser Ser Asn Pro Thr Thr Thr Ser Arg Thr Ser Thr Ser Ser Ser 65 70 75 80 Ser Ser Thr Ser Arg Thr Ser Ser Ser Thr Ser Arg Pro Pro Ser Ser 85 90 95 Val Pro Thr Thr Pro Thr Ser Val Pro Pro Thr Ile Thr Thr Thr Pro 100 105 110 Thr Thr Thr Pro Thr Gly Gly Ser Gly Pro Gly Thr Thr Ala Ser Phe 115 120 125 Thr Gly Asn Pro Phe Ala Gly Val Asn Leu Phe Pro Asn Lys Phe Tyr 130 135 140 Ser Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu Thr Gly Ser Leu 145 150 155 160 Val Ala Lys Ala Ser Ala Val Ala Gln Val Pro Ser Phe Gln Trp Leu 165 170 175 Asp Ile Ala Ala Lys Val Glu Thr Leu Met Pro Gly Ala Leu Ala Asp 180 185 190 Val Arg Ala Ala Asn Ala Ala Gly Gly Asn Tyr Ala Ala Gln Leu Val 195 200 205 Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly 210 215 220 Glu Phe Ser Ile Ala Asp Gly Gly Val Val Lys Tyr Lys Ala Tyr Ile 225 230 235 240 Asp Ala Ile Arg Lys Gln Leu Leu Ala Tyr Ser Asp Val Arg Thr Ile 245 250 255 Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Gly 260 265 270 Val Pro Lys Cys Ala Gly Ala Lys Asp Ala Tyr Leu Glu Cys Thr Ile 275 280 285 Tyr Ala Val Lys Gln Leu Asn Leu Pro His Val Ala Met Tyr Leu Asp 290 295 300 Gly Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Gln Pro Ala 305 310 315 320 Ala Asp Leu Phe Gly Lys Leu Tyr Ala Asp Ala Gly Lys Pro Ser Gln 325 330 335 Leu Arg Gly Met Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Asp Leu 340 345 350 Thr Thr Ala Pro Ser Tyr Thr Thr Pro Asn Pro Asn Phe Asp Glu Lys 355 360 365 Lys Tyr Ile Ser Ala Phe Ala Pro Leu Leu Ala Ala Lys Gly Trp Ser 370 375 380 Ala His Phe Ile Ile Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly 385 390 395 400 Gln Lys Glu Trp Gly His Trp Cys Asn Gln Gln Gly Val Gly Phe Gly 405 410 415 Arg Arg Pro Ser Ala Asn Thr Gly Ser Glu Leu Ala Asp Ala Phe Val 420 425 430 Trp Ile Lys Pro Gly Gly Glu Cys Asp Gly Val Ser Asp Pro Thr Ala 435 440 445 Pro Arg Phe Asp His Phe Cys Gly Thr Asp Tyr Gly Ala Met Ser Asp 450 455 460 Ala Pro Gln Ala Gly Gln Trp Phe Gln Lys Tyr Phe Glu Met Leu Leu 465 470 475 480 Thr Asn Ala Asn Pro Pro Leu 485 <210> 82 <211> 421 <212> PRT <213> Sclerotinia sclerotiorum <400> 82 Met Gly Leu Lys Asn Val Leu Leu Ala Ala Ala Ala Val Ala Pro Thr 1 5 10 15 Val Tyr Ala Gln Gly Ala Gly Tyr Ser Gln Cys Gly Gly Gln Gly Trp 20 25 30 Ser Gly Ala Thr Thr Cys Val Ser Gly Phe Thr Cys Thr Tyr Thr Asn 35 40 45 Glu Tyr Tyr Ser Gln Cys Leu Pro Gly Ser Gly Gly Gly Ala Ser Ser 50 55 60 Ser Arg Pro Thr Thr Thr Ala Pro Thr Thr Ile Val Thr Ser Thr Lys 65 70 75 80 Ala Ser Thr Thr Thr Gly Ser Ser Ala Thr Thr Thr Ala Ala Pro Ala 85 90 95 Ala Gly Asn Pro Phe Val Gly Lys Ala Leu Tyr Val Asn Pro Tyr Tyr 100 105 110 Ala Ser Glu Ile Ser Ala Ser Ala Ile Pro Ser Leu Thr Gly Ala Met 115 120 125 Ala Thr Lys Ala Ala Ala Val Ala Lys Val Pro Thr Phe Phe Trp Leu 130 135 140 Asp Thr Ala Asp Lys Val Pro Thr Met Gly Thr Tyr Leu Ser Asn Ile 145 150 155 160 Arg Ala Leu Asn Lys Ala Gly Ala Asn Pro Pro Val Ala Gly Thr Phe 165 170 175 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 180 185 190 Gly Glu Tyr Ser Ile Ala Asn Asn Gly Val Ala Asn Tyr Lys Ala Tyr 195 200 205 Ile Asp Ser Ile Val Thr Ile Leu Lys Asn Tyr Ser Asp Thr Ser Val 210 215 220 Ile Leu Ile Ile Val Asp Leu Pro Asn Val Ser Met Tyr Leu Asp Ala 225 230 235 240 Gly His Ala Gly Trp Leu Gly Trp Ser Ala Asn Ile Gly Pro Ala Ala 245 250 255 Gln Leu Phe Gly Gln Val Tyr Lys Ala Ala Gly Ser Pro Ser Gln Val 260 265 270 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Thr Ser Ser 275 280 285 Ser Cys Pro Ser Tyr Thr Ser Gly Asp Ser Asn Cys Asn Glu Lys Leu 290 295 300 Tyr Ile Asn Ala Leu Ala Pro Leu Leu Thr Ala Gln Gly Phe Pro Ala 305 310 315 320 His Phe Ile Met Asp Thr Gly Arg Asn Gly Val Gln Pro Thr Ala Gln 325 330 335 Gln Ala Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val 340 345 350 Arg Pro Thr Thr Asn Thr Gly Asp Ala Leu Glu Asp Ala Phe Val Trp 355 360 365 Val Lys Pro Gly Gly Glu Ala Asp Gly Thr Ser Asn Thr Thr Ala Ala 370 375 380 Arg Tyr Asp Phe His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro 385 390 395 400 Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Ala Gln Leu Leu Thr Asn 405 410 415 Ala Asn Pro Ser Phe 420 <210> 83 <211> 449 <212> PRT <213> Phaeosphaeria nodorum <400> 83 Met Lys Ala Val Ser Phe Leu Ala Val Ala Ala Leu Ala Pro Ala Ile 1 5 10 15 Lys Ala Gln Ala Ser Leu Tyr Gln Gln Cys Gly Gly Thr Gly Phe Ser 20 25 30 Gly Ser Thr Thr Cys Val Ser Gly Ala Tyr Cys Ser Lys Val Asn Asp 35 40 45 Ser Ala Thr Ser Ala Ala Pro Ala Pro Thr Thr Phe Lys Thr Ser Lys 50 55 60 Thr Val Gly Ser Pro Ala Thr Gly Ser Ser Thr Thr Gly Ser Ser Ala 65 70 75 80 Thr Gly Thr Ala Ser Pro Gly Asp Gly Ser Asn Pro Leu Lys Gly Lys 85 90 95 Asn Phe Tyr Ala Asn Ser Tyr Tyr Ala Ser Glu Ile Asn Asn Leu Ala 100 105 110 Ala Pro Ser Leu Val Ala Ala Gly Asn Ala Ala Leu Ala Ala Lys Ala 115 120 125 Ser Asn Val Ala Lys Val Gly Thr Phe Tyr Trp Leu Asp Val Arg Ala 130 135 140 Lys Val Pro Ile Ile Ser Thr Phe Ala Lys Asp Val Gln Lys Arg Asn 145 150 155 160 Ala Ala Gly Ala Asn Glu Val Leu Pro Leu Val Val Tyr Asp Leu Pro 165 170 175 Glu Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Leu Ser Leu Ala 180 185 190 Asn Asn Gly Thr Ala Leu Tyr Gln Glu Tyr Ile Asp Met Ile Ala Ala 195 200 205 Gln Ile Lys Gln Phe Pro Asp Val Thr Phe Leu Leu Val Val Glu Pro 210 215 220 Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Asn Val Ala Lys Cys Ala 225 230 235 240 Asn Ala Ala Thr Ala Tyr Lys Thr Leu Thr Ala Tyr Ala Ile Lys Thr 245 250 255 Leu Asn Leu Lys Asn Val Ile Met Tyr Leu Asp Ala Gly His Ala Gly 260 265 270 Trp Leu Gly Trp Thr Ala Asn Ile Glu Pro Ala Ala Glu Leu Phe Gly 275 280 285 Ala Leu Tyr Lys Ser Ala Gly Ser Pro Ala Ala Val Arg Gly Leu Val 290 295 300 Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Thr Cys Pro Ser 305 310 315 320 Tyr Thr Gln Gly Asn Thr Asn Cys Asp Glu Lys Arg Tyr Val Asn Ala 325 330 335 Leu Ala Pro Leu Leu Val Lys Asn Gly Phe Pro Ala His Phe Leu Thr 340 345 350 Asp Thr Gly Arg Asn Gly Val Gln Pro Thr Lys Gln Gln Ala Trp Gly 355 360 365 Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile Arg Pro Ser Ser 370 375 380 Thr Thr Asp Asp Pro Leu Leu Asp Ala Tyr Val Trp Val Lys Pro Gly 385 390 395 400 Gly Glu Gly Asp Gly Thr Ser Asp Thr Ser Ala Val Arg Tyr Asp Ala 405 410 415 His Cys Gly Tyr Ala Asp Ala Leu Lys Pro Ala Pro Glu Ala Gly Ser 420 425 430 Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Ser Asn Ala Ser Pro Ala 435 440 445 Phe <210> 84 <211> 438 <212> PRT <213> Agaricus bisporus <400> 84 Met Phe Lys Phe Ala Ala Leu Leu Ala Leu Ala Ser Leu Val Pro Gly 1 5 10 15 Phe Val Gln Ala Gln Ser Pro Val Trp Gly Gln Cys Gly Gly Asn Gly 20 25 30 Trp Thr Gly Pro Thr Thr Cys Ala Ser Gly Ser Thr Cys Val Lys Gln 35 40 45 Asn Asp Phe Tyr Ser Gln Cys Leu Pro Asn Asn Gln Ala Pro Pro Ser 50 55 60 Thr Thr Thr Gln Pro Gly Thr Thr Pro Pro Ala Thr Thr Thr Ser Gly 65 70 75 80 Gly Thr Gly Pro Thr Ser Gly Ala Gly Asn Pro Tyr Thr Gly Lys Thr 85 90 95 Val Trp Leu Ser Pro Phe Tyr Ala Asp Glu Val Ala Gln Ala Ala Ala 100 105 110 Asp Ile Ser Asn Pro Ser Leu Ala Thr Lys Ala Ala Ser Val Ala Lys 115 120 125 Ile Pro Thr Phe Thr Trp Phe Asp Thr Val Ala Lys Val Pro Asp Leu 130 135 140 Gly Gly Tyr Leu Ala Asp Ala Gln Ser Lys Asn Gln Leu Val Gln Ile 145 150 155 160 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn 165 170 175 Gly Glu Phe Ser Leu Ala Asn Asp Gly Leu Asn Lys Tyr Lys Asn Tyr 180 185 190 Val Asp Gln Ile Ala Ala Gln Ile Lys Gln Phe Pro Asp Val Ser Val 195 200 205 Val Ala Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu 210 215 220 Asn Val Gln Lys Cys Ala Asn Ala Gln Ser Ala Tyr Lys Glu Gly Val 225 230 235 240 Ile Tyr Ala Ile Gln Lys Leu Asp Ala Val Gly Val Thr Met Tyr Ile 245 250 255 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Ser Pro 260 265 270 Ala Ala Gln Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Ser Pro Arg 275 280 285 Asn Leu Arg Gly Ile Ala Thr Asn Val Ala Asn Phe Asn Ala Leu Arg 290 295 300 Ala Ser Ser Pro Asp Pro Ile Thr Gln Gly Asn Ser Asn Tyr Asp Glu 305 310 315 320 Ile His Tyr Ile Glu Ala Leu Ala Pro Met Leu Ser Asn Ala Gly Phe 325 330 335 Pro Ala His Phe Ile Val Asp Gln Gly Arg Ser Gly Val Gln Asn Ile 340 345 350 Arg Asp Gln Trp Gly Asp Trp Cys Asn Val Lys Gly Ala Gly Phe Gly 355 360 365 Gln Arg Pro Thr Thr Asn Thr Gly Ser Ser Leu Ile Asp Ala Ile Val 370 375 380 Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ser 385 390 395 400 Pro Arg Phe Asp Ser His Cys Ser Leu Ser Asp Ala His Gln Pro Ala 405 410 415 Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Glu Thr Leu Val Ala 420 425 430 Asn Ala Asn Pro Ala Leu 435 <210> 85 <211> 443 <212> PRT <213> Lentinula edodes <400> 85 Met Lys Ile Thr Ser Thr Gly Leu Leu Ala Leu Ser Ser Leu Leu Pro 1 5 10 15 Phe Ala Leu Gly Gln Ser Gln Leu Tyr Ala Gln Cys Gly Gly Ile Gly 20 25 30 Trp Ser Gly Ala Thr Thr Cys Val Ser Gly Ala Thr Cys Thr Val Val 35 40 45 Asn Ala Tyr Tyr Ser Gln Cys Leu Pro Gly Ser Ala Ser Ala Pro Pro 50 55 60 Thr Ser Thr Ser Ser Ile Gly Thr Gly Thr Thr Thr Ser Ser Ala Pro 65 70 75 80 Gly Ser Thr Gly Thr Thr Thr Pro Ala Ala Gly Asn Pro Phe Thr Glu 85 90 95 Gln Ile Tyr Leu Ser Pro Tyr Tyr Ala Asn Glu Ile Ala Ala Ala Val 100 105 110 Thr Gln Ile Ser Asp Pro Thr Thr Ala Ala Ala Ala Ala Lys Val Ala 115 120 125 Asn Ile Pro Thr Phe Ile Trp Leu Asp Gln Val Ala Lys Val Pro Asp 130 135 140 Leu Gly Thr Tyr Leu Ala Asp Ala Ser Ala Lys Gln Lys Ser Glu Gly 145 150 155 160 Lys Asn Tyr Leu Val Gln Ile Val Val Tyr Asp Leu Pro Asp Arg Asp 165 170 175 Cys Ala Ala Leu Ala Ser Asn Gly Glu Phe Thr Ile Ala Asp Asn Gly 180 185 190 Glu Ala Asn Tyr His Asp Tyr Ile Asp Gln Ile Val Ala Gln Ile Lys 195 200 205 Gln Tyr Pro Asp Val His Val Val Ala Val Ile Glu Pro Asp Ser Leu 210 215 220 Ala Asn Leu Val Thr Asn Leu Ser Val Ala Lys Cys Ala Asn Ala Gln 225 230 235 240 Thr Thr Tyr Leu Glu Cys Val Thr Tyr Ala Met Gln Gln Leu Ser Ala 245 250 255 Val Gly Val Thr Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly 260 265 270 Trp Pro Ala Asn Leu Ser Pro Ala Ala Gln Leu Phe Thr Ser Leu Tyr 275 280 285 Ser Asn Ala Gly Ser Pro Ser Gly Val Arg Gly Leu Ala Thr Asn Val 290 295 300 Ala Asn Tyr Asn Ala Leu Val Ala Thr Thr Pro Asp Pro Ile Thr Gln 305 310 315 320 Gly Asp Pro Asn Tyr Asp Glu Met Leu Tyr Ile Glu Ala Leu Ala Pro 325 330 335 Leu Leu Gly Ser Phe Pro Ala His Phe Ile Val Asp Gln Gly Arg Ser 340 345 350 Gly Val Gln Asp Ile Arg Gln Gln Trp Gly Asp Trp Cys Asn Val Leu 355 360 365 Gly Ala Gly Phe Gly Thr Gln Pro Thr Thr Asn Thr Gly Ser Ser Leu 370 375 380 Ile Asp Ser Ile Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr 385 390 395 400 Ser Asn Thr Ser Ser Pro Arg Tyr Asp Ala His Cys Gly Leu Pro Asp 405 410 415 Ala Thr Pro Asn Ala Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe 420 425 430 Glu Thr Leu Val Glu Lys Ala Asn Pro Pro Leu 435 440 <210> 86 <211> 460 <212> PRT <213> Coniophora puteana <400> 86 Met Phe Lys Phe Ala Ala Leu Ser Ala Phe Val Ala Leu Val Pro Leu 1 5 10 15 Leu Val Asn Ala Gln Val Ala Ala Tyr Gly Gln Cys Gly Gly Gln Asp 20 25 30 Trp Thr Gly Ala Thr Ala Cys Ala Ser Gly Thr Ala Cys Thr Lys Val 35 40 45 Asn Asp Tyr Tyr Tyr Gln Cys Leu Pro Gly Ser Ser Gly Ser Ser Val 50 55 60 Ser Gly Gly Ser Gly Ser Gly Ser Thr Ser Ala Pro Ser Pro Thr Ser 65 70 75 80 Thr Val Pro Thr Ser Thr Ser Ser Ala Ser Thr Ala Pro Ser Ser Thr 85 90 95 Ser Thr Ser Ser Ala Ala Ser Ser Asp Asn Pro Tyr Thr Gly Tyr Gln 100 105 110 Ile Phe Leu Asn Pro Glu Tyr Ala Ser Glu Val Gln Ala Ala Ile Pro 115 120 125 Ser Ile Thr Asp Ser Ala Val Ala Ala Lys Ala Leu Lys Val Ala Glu 130 135 140 Val Pro Val Phe Phe Trp Leu Asp Gln Val Ala Lys Val Pro Asp Leu 145 150 155 160 Glu Thr Tyr Leu Ala Ala Ala Asp Lys Gln Gly Lys Ser Ser Gly Gln 165 170 175 Lys Gln Leu Leu Gln Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys 180 185 190 Ala Ala Asn Ala Ser Asn Gly Glu Phe Ser Ile Ser Asp Asp Gly Gln 195 200 205 Ala Lys Tyr Glu Asn Tyr Ile Asp Gln Ile Val Ala Ile Val Lys Lys 210 215 220 Tyr Pro Asp Val Arg Val Val Ala Val Val Glu Pro Asp Ser Met Gly 225 230 235 240 Asn Leu Val Thr Asn Met Asp Leu Pro Lys Cys Ser Ala Ala Ala Pro 245 250 255 Thr Tyr Lys Thr Cys Ile Asn Tyr Ala Ile Ala Gln Leu Ser Ser Ala 260 265 270 Gly Val Tyr Met Tyr Val Asp Ala Gly His Ala Gly Trp Leu Gly Trp 275 280 285 Pro Asn Asn Leu Ala Pro Ala Ala Gln Leu Phe Gly Glu Leu Tyr Glu 290 295 300 Thr Ser Gly Lys Ser Ala Tyr Phe Arg Gly Leu Ala Thr Asn Val Ala 305 310 315 320 Asn Tyr Asn Ala Leu Asn Thr Ser Ser Pro Asp Pro Cys Thr Gln Asn 325 330 335 Ala Pro Asn Tyr Asp Glu Met Leu Tyr Ile Asn Ala Leu Ser Pro Leu 340 345 350 Leu Gln Gln Gln Gly Phe Ser Ala Gln Phe Ile Val Asp Gln Gly Arg 355 360 365 Ser Gly Val Gln Asn Ile Arg Asn Ala Trp Gly Asp Trp Cys Asn Ile 370 375 380 Lys Gly Ala Gly Phe Gly Ile Arg Pro Thr Thr Asp Thr Gly Ser Pro 385 390 395 400 Leu Ile Asp Ser Ile Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly 405 410 415 Thr Ser Asn Ser Ser Ala Pro Arg Tyr Asp Ser Thr Cys Ser Leu Ser 420 425 430 Asp Ser Leu Gln Pro Ala Pro Glu Ala Gly Thr Trp Phe Gln Gln Tyr 435 440 445 Phe Glu Ala Leu Val Thr Asn Ala Val Pro Ser Leu 450 455 460 <210> 87 <211> 442 <212> PRT <213> Volvariella volvacea <400> 87 Met Ser Arg Phe Ser Ala Leu Thr Ala Leu Leu Leu Ser Leu Pro Leu 1 5 10 15 Leu Ala Ile Ala Gln Ser Pro Leu Tyr Gly Gln Cys Gly Gly Asn Gly 20 25 30 Trp Thr Gly Pro Lys Thr Cys Val Ser Gly Ala Thr Cys Thr Val Ile 35 40 45 Asn Asp Trp Tyr Trp Gln Cys Leu Pro Gly Asn Gly Pro Thr Ser Ser 50 55 60 Ser Pro Thr Ser Thr Pro Thr Thr Thr Thr Thr Thr Gly Gly Pro Gln 65 70 75 80 Pro Thr Val Pro Ala Ala Gly Asn Pro Tyr Thr Gly Tyr Glu Ile Tyr 85 90 95 Leu Ser Pro Tyr Tyr Ala Ala Glu Ala Gln Ala Ala Ala Ala Gln Ile 100 105 110 Ser Asp Ala Thr Gln Lys Ala Lys Ala Leu Lys Val Ala Gln Ile Pro 115 120 125 Thr Phe Thr Trp Phe Asp Val Ile Ala Lys Thr Ser Thr Leu Gly Asp 130 135 140 Tyr Leu Ala Glu Ala Ser Ala Leu Gly Lys Ser Ser Gly Lys Lys Tyr 145 150 155 160 Leu Val Gln Ile Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala 165 170 175 Leu Ala Ser Asn Gly Glu Phe Ser Ile Ala Asn Asn Gly Leu Asn Asn 180 185 190 Tyr Lys Gly Tyr Ile Asp Gln Leu Val Ala Gln Ile Lys Lys Tyr Pro 195 200 205 Asp Val Arg Val Val Ala Val Ile Glu Pro Asp Ser Leu Ala Asn Leu 210 215 220 Val Thr Asn Leu Asn Val Ser Lys Cys Ala Asn Ala Gln Thr Ala Tyr 225 230 235 240 Lys Ala Gly Val Thr Tyr Ala Leu Gln Gln Leu Asn Ser Val Gly Val 245 250 255 Tyr Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala 260 265 270 Asn Leu Asn Pro Ala Ala Gln Leu Phe Ser Gln Leu Tyr Arg Asp Ala 275 280 285 Gly Ser Pro Gln Tyr Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr 290 295 300 Asn Ala Leu Ser Ala Ser Ser Pro Asp Pro Val Thr Gln Gly Asn Pro 305 310 315 320 Asn Tyr Asp Glu Leu His Tyr Ile Asn Ala Leu Ala Pro Ala Leu Gln 325 330 335 Ser Gly Gly Phe Pro Ala His Phe Ile Val Asp Gln Gly Arg Ser Gly 340 345 350 Val Gln Asn Ile Arg Gln Gln Trp Gly Asp Trp Cys Asn Val Lys Gly 355 360 365 Ala Gly Phe Gly Gln Arg Pro Thr Leu Ser Thr Gly Ser Ser Leu Ile 370 375 380 Asp Ala Ile Val Trp Ile Lys Pro Gly Gly Glu Cys Asp Gly Thr Thr 385 390 395 400 Asn Thr Ser Ser Pro Arg Tyr Asp Ser His Cys Gly Leu Ser Asp Ala 405 410 415 Thr Pro Asn Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu 420 425 430 Thr Leu Val Arg Asn Ala Ser Pro Pro Leu 435 440 <210> 88 <211> 389 <212> PRT <213> Coniophora puteana <400> 88 Met Phe Ser Pro Val Val Leu Gly Ala Leu Ala Ala Leu Leu Pro Ala 1 5 10 15 Ala Val Gln Ala Met Pro Ala Ser Thr Gln Ala Arg Ala Ala Asp Ala 20 25 30 Thr Ala Asn Pro Tyr Thr Gly Tyr Thr Ile Phe Lys Asn Pro Glu Tyr 35 40 45 Val Ala Glu Val Gln Ala Ala Val Gln Gln Ile Ser Asp Ser Ser Leu 50 55 60 Ala Ser Ala Ala Ala Gly Val Glu Asp Val Pro Val Phe Phe Trp Leu 65 70 75 80 Asp Gln Val Ala Lys Val Pro Asn Leu Thr Thr Tyr Leu Ala Ala Ala 85 90 95 Asp Ala Glu Ala Lys Ser Ser Gly Ser Gln Gln Leu Phe Gln Ile Val 100 105 110 Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly 115 120 125 Glu Phe Ser Ile Ser Asp Asn Gly Gln Ala Asn Tyr Glu Asn Tyr Ile 130 135 140 Asp Gln Ile Val Ala Ser Ile Lys Gln Tyr Pro Asp Val Arg Val Val 145 150 155 160 Ala Val Val Glu Pro Asp Ser Met Ala Asn Leu Val Thr Asn Leu Ser 165 170 175 Val Gln Lys Cys Ala Asp Ala Glu Ser Thr Tyr Lys Thr Cys Val Ala 180 185 190 Tyr Ala Ile Glu Gln Leu Ala Thr Val Gly Val Tyr Met Tyr Leu Asp 195 200 205 Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Ser Pro Ala 210 215 220 Ala Glu Leu Phe Ala Gln Met Tyr Ser Thr Thr Gly Ser Ser Pro Tyr 225 230 235 240 Phe Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ser Leu Thr Thr 245 250 255 Asp Ser Pro Asp Pro Ile Thr Ser Gly Asp Ser Asn Tyr Asp Glu Leu 260 265 270 Leu Tyr Ile Glu Ala Leu Ser Pro Leu Leu Val Asp Asn Gly Phe Pro 275 280 285 Ala Gln Phe Ile Val Glu Gln Ala Arg Ser Gly Val Gln Asn Ile Arg 290 295 300 Ser Ala Trp Gly Asp Trp Cys Asn Val Lys Gly Ala Gly Phe Gly Leu 305 310 315 320 Arg Pro Ser Thr Asp Thr Pro Ser Ser Leu Ile Asp Ser Ile Val Trp 325 330 335 Val Lys Pro Gly Gly Glu Ala Asp Gly Thr Ser Asn Ser Ser Ala Ala 340 345 350 Arg Tyr Asp Tyr His Cys Ser Leu Ser Asp Ala Leu Gln Pro Ala Pro 355 360 365 Glu Ala Gly Thr Trp Phe Gln Thr Tyr Phe Glu Asp Leu Val Ser Gly 370 375 380 Ala Asn Pro Ala Phe 385 <210> 89 <211> 454 <212> PRT <213> Coprinopsis cinerea okayama <400> 89 Met Leu Lys Gly Ser Lys Phe Phe Ala Leu Ser Leu Ala Leu Leu Pro 1 5 10 15 Ala Leu Val Gln Ala Gln Arg Pro Leu Tyr Ala Gln Cys Gly Gly Thr 20 25 30 Gly Trp Thr Gly Glu Thr Thr Cys Val Ser Gly Ala Val Cys Glu Val 35 40 45 Ile Asn Gln Trp Tyr His Gln Cys Leu Pro Gly Ser Asn Gln Pro Gln 50 55 60 Pro Pro Val Thr Thr Gln Pro Pro Val Val Val Pro Thr Thr Ser Gln 65 70 75 80 Pro Pro Val Val Val Pro Thr Asn Pro Pro Gly Gly Thr Pro Val Pro 85 90 95 Ser Thr Gly Asn Pro Phe Glu Gly Tyr Asp Ile Tyr Leu Ser Pro Tyr 100 105 110 Tyr Ala Glu Glu Val Glu Ala Ala Ala Ala Met Ile Asp Asp Pro Val 115 120 125 Leu Lys Ala Lys Ala Leu Lys Val Lys Glu Ile Pro Thr Phe Ile Trp 130 135 140 Phe Asp Val Val Arg Lys Thr Pro Asp Leu Gly Arg Tyr Leu Ala Asp 145 150 155 160 Ala Thr Ala Ile Gln Gln Arg Thr Gly Arg Lys Gln Leu Val Gln Ile 165 170 175 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn 180 185 190 Gly Glu Phe Ser Leu Ala Asp Gly Gly Met Glu Lys Tyr Lys Asp Tyr 195 200 205 Val Asp Arg Leu Ala Ser Glu Ile Arg Lys Tyr Pro Asp Val Arg Ile 210 215 220 Val Ala Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met 225 230 235 240 Asn Val Ala Lys Cys Arg Gly Ala Glu Ala Ala Tyr Lys Glu Gly Val 245 250 255 Ile Tyr Ala Leu Arg Gln Leu Ser Ala Leu Gly Val Tyr Ser Tyr Val 260 265 270 Asp Ala Gly His Ala Gly Trp Leu Gly Trp Asn Ala Asn Leu Ala Pro 275 280 285 Ser Ala Arg Leu Phe Ala Gln Ile Tyr Lys Asp Ala Gly Arg Ser Ala 290 295 300 Phe Ile Arg Gly Leu Ala Thr Asn Val Ser Asn Tyr Asn Ala Leu Ser 305 310 315 320 Ala Thr Thr Arg Asp Pro Val Thr Gln Gly Asn Asp Asn Tyr Asp Glu 325 330 335 Leu Arg Phe Ile Asn Ala Leu Ala Pro Leu Leu Arg Asn Glu Gly Trp 340 345 350 Asp Ala Lys Phe Ile Val Asp Gln Gly Arg Ser Gly Val Gln Asn Ile 355 360 365 Arg Gln Glu Trp Gly Asn Trp Cys Asn Val Tyr Gly Ala Gly Phe Gly 370 375 380 Met Arg Pro Thr Leu Asn Thr Pro Ser Ser Ala Ile Asp Ala Ile Val 385 390 395 400 Trp Ile Lys Pro Gly Gly Glu Ala Asp Gly Thr Ser Asp Thr Ser Ala 405 410 415 Pro Arg Tyr Asp Thr His Cys Gly Lys Ser Asp Ser His Lys Pro Ala 420 425 430 Pro Glu Ala Gly Thr Trp Phe Gln Glu Tyr Phe Val Asn Leu Val Lys 435 440 445 Asn Ala Asn Pro Pro Leu 450 <210> 90 <211> 361 <212> PRT <213> Moniliophthora perniciosa <400> 90 Ile Pro Gly Ser Asp Pro Gly Asn Pro Gly Pro Thr Ser Ser Ser Thr 1 5 10 15 Leu Ser Ser Thr Ala Ala Pro Pro Thr Asn Thr Gln Ser Pro Val Glu 20 25 30 Asp Asn Pro Tyr Thr Gly Tyr Thr Ile Tyr Leu Ser Pro Tyr Tyr Ala 35 40 45 Asp Glu Ile Asp Ala Ala Ala Ala Lys Ile Thr Asp Pro Thr Leu Lys 50 55 60 Val Gln Ala Leu Lys Val Lys Glu Ile Pro Thr Phe Ile Trp Phe Asp 65 70 75 80 Thr Thr Ala Lys Leu Ser Thr Leu Glu Pro Tyr Leu Lys Asp Ala Ser 85 90 95 Ala Lys Gly Lys Ala Glu Gly Lys Lys Tyr Leu Leu Gln Ile Val Val 100 105 110 Tyr Thr Leu Pro Glu Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 115 120 125 Leu Ser Ile Asp Asn Gly Gly Glu Val Lys Ser Arg Glu Tyr Ile Asp 130 135 140 Thr Met Val Ala Thr Ile Lys Lys Tyr Pro Asp Val Arg Val Val Ala 145 150 155 160 Val Val Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Asn Val 165 170 175 Gln Lys Cys Ser Lys Ala Gln Thr Ile Tyr Lys Thr Ser Thr Gln Tyr 180 185 190 Ala Leu Lys Gln Leu Asp Thr Ala Gly Val Tyr Met Tyr Leu Asp Ala 195 200 205 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Thr Pro Thr Ala 210 215 220 Gln Leu Phe Gln Gln Val Trp Gln Asp Ala Gly Ser Pro Lys Phe Val 225 230 235 240 Arg Gly Leu Ala Thr Asn Val Ala Asn Phe Asn Ala Leu Arg Ala Ala 245 250 255 Ser Pro Asp Pro Val Thr Ser Gln Asn Pro Asn Tyr Asp Glu Ile His 260 265 270 Tyr Ile Glu Gly Arg Ala Gly Gln Gln Asn Leu Arg Lys Glu Trp Gly 275 280 285 Asp Trp Cys Asn Val Lys Gly Ala Gly Phe Gly Thr Arg Pro Thr Thr 290 295 300 Asn Thr Gly Ser Ser Leu Ile Asp Ser Ile Val Trp Val Lys Pro Gly 305 310 315 320 Gly Glu Ser Ala Arg Phe Asp Ala Lys Cys Val Ser Ala Ser Ser His 325 330 335 Val Pro Ala Pro Glu Ala Gly Thr Trp Phe Gln Glu Tyr Phe Glu Ala 340 345 350 Leu Val Arg Asn Ala Asn Pro Ala Leu 355 360 <210> 91 <211> 460 <212> PRT <213> Piromyces rhizinflatus <400> 91 Met Lys Phe Ser Thr Leu Ile Gly Thr Leu Phe Ala Thr Gly Ala Leu 1 5 10 15 Ala Ser Ser Cys His Arg Asp Tyr Pro Cys Cys Asn Asp Cys Asn Val 20 25 30 Val Tyr Gln Asp Trp Glu Arg Asp Trp Gly Val Leu Asn Gly Gln Glu 35 40 45 Trp Cys Phe Ile Asp Lys Asn Arg Cys Asn Gly Gly Gly Tyr Cys Lys 50 55 60 Phe Glu Ser Leu Gly Tyr Pro Cys Cys Asn Gly Cys Asp Val Tyr Tyr 65 70 75 80 Thr Asp Asn Asp Gly Arg Trp Gly Val Glu Asn Gly Asn Trp Cys Gly 85 90 95 Ile Arg Asp Asp Lys Cys Asn Gly Tyr Gln Gln Pro Arg Thr Thr Thr 100 105 110 Thr Thr Arg Thr Thr Thr Arg Thr Thr Thr Thr Gln Arg Pro Val Gln 115 120 125 Thr Asn Val Ser Asp Asn Phe Phe Glu Asn Thr Leu Tyr Ser Asn Phe 130 135 140 Lys Phe Gln Gly Glu Val Gln Ser Ser Ile Gln Lys Leu Ser Gly Asp 145 150 155 160 Met Ala Lys Lys Ala Glu Lys Val Lys Tyr Val Pro Thr Ala Val Trp 165 170 175 Leu Ala Trp Glu Gly Ala Pro Arg Glu Val Pro Gln Tyr Leu Asp Asp 180 185 190 Ala Gly Ser Lys Thr Val Val Phe Val Leu Tyr Met Ile Pro Thr Arg 195 200 205 Asp Cys Asn Ala Asn Ala Ser Val Gly Gly Ser Ala Thr Leu Glu Lys 210 215 220 Tyr Lys Gly Tyr Ile Asp Asn Ile Tyr Asn Thr Phe Asn Gln Tyr Pro 225 230 235 240 Asn Ser Lys Ile Val Met Ile Leu Glu Pro Asp Thr Ile Gly Asn Leu 245 250 255 Val Thr Ala Asn Asn Ala Asn Cys Met Asn Val Gln Asn Leu His Lys 260 265 270 Gln Gly Leu Ala Tyr Ala Ile Ser Lys Phe Gly Thr Gln Lys Asn Val 275 280 285 Arg Val Tyr Leu Asp Ala Ala His Gly Ala Trp Leu Ser Ser His Ala 290 295 300 Asp Lys Thr Ala Gln Val Ile Lys Glu Ile Leu Asn Asn Ala Gly Ser 305 310 315 320 Gly Lys Leu Arg Gly Ile Thr Thr Asn Val Ser Asn Tyr Gln Thr Val 325 330 335 Asn Asp Glu Tyr Ser Tyr Gln Met Arg Leu Asn Ser Ala Leu Gln Asn 340 345 350 Leu Gly Val Arg Asp Leu His Tyr Ile Ile Asp Thr Ser Arg Asn Gly 355 360 365 Ala Asn Ile Ala Gln Gln Phe Asn Gln Ser Gly Thr Trp Cys Asn Phe 370 375 380 Lys Gly Ala Gly Leu Gly Ala Arg Pro Gln Ala Asn Pro Asp Ser Ser 385 390 395 400 Lys Pro Leu Leu Asp Ala Tyr Met Trp Ile Lys Thr Pro Gly Glu Ala 405 410 415 Asp Gly Ser Ser Ser Gly Ser Arg Ala Asp Pro Val Cys Gly Arg Trp 420 425 430 Asp Ser Leu Gln Gly Ala Pro Asp Ala Gly Ser Trp Phe His Asp Tyr 435 440 445 Phe Val Met Leu Leu Gln Asn Ala Asn Pro Pro Phe 450 455 460 <210> 92 <211> 518 <212> PRT <213> Piromyces rhizinflatus <400> 92 Met Lys Phe Ile Val Cys Ala Ser Ile Leu Ser Leu Gly Leu Phe Lys 1 5 10 15 Phe Ala Asp Ala Ala Cys Ala Gly Pro Tyr Ala Gln Cys Gly Gly Asn 20 25 30 Asn Phe Asn Gly Glu Asn Cys Cys Gln Ser Gly Tyr Lys Cys Val Ala 35 40 45 Ile Asn Glu Trp Tyr Ser Gln Cys Gln Glu Gly Ala Ala Glu Pro Glu 50 55 60 Pro Val Pro Gln Ser Ser Ala Ala Asp Asp Gln Trp Asn Asn Asn Asn 65 70 75 80 Gln Trp Asn Asn Asn Gln Gln Asn Asn Gln Trp Asn Asn Pro Trp Asp 85 90 95 Asn Asn Asn Asn Gln Trp Asn Asn Asn Gln Trp Asn Asn Asn Gln Gln 100 105 110 Asn Asn Gln Trp Asn Asn Asn Gln Gln Gln Asn Asn Gln Trp Asp Asn 115 120 125 Asn Asn Gln Trp Asn Asn Asn Gln Trp Asn Asn Asn Gln Gln Gln Asn 130 135 140 Asn Gln Gln Gln Asn Asn Gln Gln Gln Asn Asn Gln Trp Asn Asn Asn 145 150 155 160 Asn Gln Trp Asn Asn Asn Gln Gln Gln Asn Asn Gln Gln Gln Asn Asn 165 170 175 Gln Ala Pro Ala Gln Ser Asn Gly Gly Gly Ala Ser Gly Ser Ser Gln 180 185 190 Asn Phe Phe Thr Asn Glu Ile Tyr Ala Asn Pro Arg Phe Ile Glu Glu 195 200 205 Ile Asp Ser Ser Ile Pro Lys Leu Thr Pro Glu Leu Ala Ala Lys Ala 210 215 220 Glu Lys Val Lys Gln Val Pro Thr Ala Val Trp Leu Ala Trp Asp Gly 225 230 235 240 Ala Pro Gly Glu Val Glu Gly His Leu Lys Ala Ala Gly Ser Lys Thr 245 250 255 Val Val Phe Ile Leu Tyr Met Ile Pro Thr Arg Asp Cys Asn Ser Asn 260 265 270 Ala Ser Ala Gly Gly Ala Ser Asp Leu Asn Lys Tyr Lys Gly Tyr Val 275 280 285 Asp Asp Ile Ala Gly Thr Ile Lys Ser His Pro Glu Ser Lys Val Val 290 295 300 Met Ile Val Glu Pro Asp Thr Leu Gly Asn Leu Val Thr Gly Ser Ser 305 310 315 320 Glu Ala Cys Lys Asn Val His Ser Leu His Lys Ser Ala Leu Ser Tyr 325 330 335 Ala Val Asn Val Phe Gly Ala Met Ser Asn Val Ser Val Tyr Leu Asp 340 345 350 Ala Ala His Gly Lys Trp Leu Gly Gly Ser Thr Asp Lys Val Ala Ser 355 360 365 Val Leu Lys Glu Ile Leu Asp Asn Ala Pro Asn Gly Lys Ile Arg Gly 370 375 380 Leu Ser Thr Asn Val Ser Asn Tyr Gln Pro Leu Ser Ser Glu Ala Gln 385 390 395 400 Tyr His Gln Gly Leu Ser Ser Ala Leu Ala Ala Val Gly Tyr Pro Gly 405 410 415 Met Lys Phe Val Val Asp Thr Gly Arg Asn Gly Val Asp Val Ser Ser 420 425 430 Thr Phe Ser Ile Asn Glu Thr Trp Cys Asn Phe Val Gly Thr Gly Phe 435 440 445 Gly Glu Arg Pro Gln Gly Asn Pro Ser Gly Tyr Pro Leu Leu Asp Ala 450 455 460 Phe Met Trp Leu Lys Thr Pro Gly Glu Ala Asp Gly Ser Ala Thr Gly 465 470 475 480 Ser Arg Ala Asp Pro Val Cys Ala Arg Gln Asp Ser Leu Gln Gly Ala 485 490 495 Pro Asp Ala Gly Gln Trp Phe His Glu Tyr Phe Val Gln Leu Leu Glu 500 505 510 Asn Ala Lys Pro Gly Phe 515 <210> 93 <211> 376 <212> PRT <213> Piromyces rhizinflatus <400> 93 Glu Thr Leu Pro Gln Gln Ser Asn Ser Ala Lys Thr Leu Pro Gln Gln 1 5 10 15 Ser Asp Ser Ala Lys Thr Ile Pro Gln Pro Thr Ser Ala Glu Ser Gln 20 25 30 Thr Ser Lys Thr Leu Pro Gln Thr Gly Gly Ser Gly Asn Gly Ser Ser 35 40 45 Gln Asn Phe Phe Leu Asn Glu Ile Tyr Ala Asn Pro Lys Phe Ile Glu 50 55 60 Glu Val Glu Asp Ser Ile Glu Lys Leu Thr Pro Glu Leu Gln Ala Lys 65 70 75 80 Ala Glu Lys Val Lys Asp Val Pro Thr Ala Val Trp Leu Ala Trp Asp 85 90 95 Gly Ser Pro Gly Glu Val Glu Gly His Leu Val Ala Ala Gly Ser Lys 100 105 110 Thr Val Val Phe Leu Leu Tyr Met Ile Pro Thr Arg Asp Cys Asn Ser 115 120 125 Asn Ala Ser Ala Gly Gly Ala Ala Ser Leu Asp Lys Tyr Lys Gly Tyr 130 135 140 Ile Asp Asp Ile Ser Asn Thr Ile Lys Ser His Pro Glu Ser Lys Val 145 150 155 160 Val Met Val Val Glu Pro Asp Thr Leu Gly Asn Leu Val Thr Gly Asn 165 170 175 Ser Glu Ala Cys Lys Asn Val His Thr Leu His Lys Asn Ala Leu Ser 180 185 190 Tyr Ala Val Asp Val Phe Gly Ala Met Ser Asn Val Ser Val Tyr Leu 195 200 205 Asp Ala Ala His Gly Met Trp Leu Gly Pro His Thr Asp Lys Val Ala 210 215 220 Ser Val Ile Lys Glu Ile Leu Asn Asn Ala Pro Asn Gly Lys Ile Arg 225 230 235 240 Gly Leu Ser Thr Asn Val Ser Asn Tyr Gln Pro Val Ser Ser Glu Tyr 245 250 255 Gln Tyr His Gln Lys Leu Ala Ala Ser Leu Ala Ala Val Gly Val Asn 260 265 270 Asp Val His Phe Ile Val Asp Thr Gly Arg Ser Gly Val Asp Val Thr 275 280 285 Glu Thr Phe Ser Lys Gln Gln Thr Trp Cys Asn Phe Ile Gly Ala Gly 290 295 300 Leu Gly Pro Arg Pro Gln Gly Asn Pro Asp Ala Ser Met Pro Leu Leu 305 310 315 320 Asp Ala Tyr Met Trp Leu Lys Thr Pro Gly Glu Ala Asp Gly Ser Ala 325 330 335 Val Gly Asp Arg Ala Asp Pro Val Cys Ser His Glu Asp Ser Leu Gln 340 345 350 Val Ala Pro Asp Ala Gly Gln Trp Phe His Asp Tyr Phe Val Leu Leu 355 360 365 Leu Lys Asn Ala Asn Pro Pro Phe 370 375 <210> 94 <211> 463 <212> PRT <213> Piromyces rhizinflatus <400> 94 Met Lys Phe Leu Ser Leu Ile Gly Thr Leu Phe Ala Thr Gly Ala Leu 1 5 10 15 Ala Ser Gln Cys His Pro Asn Trp Pro Cys Cys Leu Asn Cys Asp Val 20 25 30 Val Tyr Gln Asp Gly Glu Gly Asp Trp Gly Val Leu Asn Asn Asp Trp 35 40 45 Cys Phe Ile Ser Lys Ser Arg Cys Gly Asn Asn Asn Asn Asn Asn Asn 50 55 60 Gly Tyr Cys Lys Phe Gln Ser Leu Gly Tyr Pro Cys Cys Ser Gly Cys 65 70 75 80 Gln Val Val Tyr Thr Asp Gly Asp Gly Asn Trp Gly Val Glu Asn Gly 85 90 95 Asn Trp Cys Gly Ile Arg Asp Glu Gln Cys Gly Gly Gly Asn Asn Trp 100 105 110 Gln Gln Pro Thr Thr Thr Arg Thr Thr Thr Arg Thr Thr Thr Arg Thr 115 120 125 Gln Asn Asn Arg Pro Thr Ser Asp Asn Phe Phe Asp Asn Thr Leu Tyr 130 135 140 Ser Asn Tyr Lys Phe Gln Asp Glu Val Gln Ser Ser Ile Asn Lys Leu 145 150 155 160 Ser Gly Gln Met Ala Glu Lys Ala Lys Lys Val Lys Tyr Val Pro Thr 165 170 175 Ala Ala Trp Leu Ala Trp Ser Gly Ala Pro Asp Glu Val Pro Arg Tyr 180 185 190 Leu Gln Glu Ala Gly Ser Asp Thr Val Val Phe Val Leu Tyr Met Ile 195 200 205 Pro Thr Arg Asp Cys Asn Ala Asn Ala Ser Ala Gly Gly Ser Ala Asn 210 215 220 Leu Asp Thr Tyr Lys Gly Tyr Val Asn Lys Ile Tyr Asn Thr Ile Asn 225 230 235 240 Gln Tyr Pro Asn Ser Arg Ile Val Met Ile Leu Glu Pro Asp Thr Ile 245 250 255 Gly Asn Leu Val Thr Ala Asn Asn Gln Asn Cys Gln Asn Val Gln Asn 260 265 270 Leu His Lys Asn Ala Leu Ala Tyr Ala Ile Ser Lys Phe Gly Thr Gln 275 280 285 Ser Asn Val Ser Val Tyr Leu Asp Ala Ala His Gly Ala Trp Leu Ser 290 295 300 Pro His Ala Asp Lys Thr Ala Gln Val Ile Lys Glu Ile Leu Ser Lys 305 310 315 320 Ala Gly Asn Gly Lys Ile Arg Gly Ile Ser Thr Asn Val Ser Asn Tyr 325 330 335 Gln Thr Ile Asp Asp Glu Tyr Asn Tyr His Gln Arg Leu Asn Ser Ala 340 345 350 Leu Gln Asn Leu Gly Val Ser Asn Met His Phe Ile Val Asp Thr Ser 355 360 365 Arg Asn Gly Ala Asn Ile Ala Ser Gln Phe Asn Gln Ser Gly Thr Trp 370 375 380 Cys Asn Phe Lys Gly Ala Gly Leu Gly Gln Arg Pro Lys Gly Ser Pro 385 390 395 400 Asp Pro Ser Lys Pro Leu Leu Asp Ala Tyr Met Trp Ile Lys Thr Pro 405 410 415 Gly Glu Ala Asp Gly Ser Ser Ser Gly Ala Arg Ala Asp Pro Val Cys 420 425 430 Gly Arg Trp Asp Ser Leu Gln Gly Ala Pro Asp Ala Gly Ser Trp Phe 435 440 445 His Asp Tyr Phe Val Met Leu Leu Gln Asn Ala Asn Pro Ser Phe 450 455 460 <210> 95 <211> 510 <212> PRT <213> Neocallimastix frontalis <400> 95 Met Lys Phe Ile Val Phe Ala Ser Ile Leu Ser Ser Gly Ile Ile Lys 1 5 10 15 Leu Ser Asn Ala Ala Cys Gly Gly Pro Tyr Ala Gln Cys Gly Gly Ser 20 25 30 Gly Phe Ser Gly Glu Ala Cys Cys Gln Asp Gly Tyr Lys Cys Val Ala 35 40 45 Met Asn Glu Trp Tyr Ser Gln Cys Gln Ala Gly Ser Asp Ala Pro Ala 50 55 60 Asn Ser Ala Ala Pro Val Asn Ser Ala Val Gly Asn Asp Asn Asn Asn 65 70 75 80 Asn Asn Asn Gln Trp Asn Asn Gln Trp Asn Asn Asn Gly Trp Asn Trp 85 90 95 Gly Asn Gly Asn Asn Glu Ala Gln Asn Pro Trp Asn Asn Asn Gly Trp 100 105 110 Ser Trp Glu Gly Gly Asn Asn Gly Asn Gln Asp Gln Asn Gln Trp Asp 115 120 125 Asn Asn Gly Trp Pro Trp Gly Gly Asn Asn Gly Asn Gln Gly Pro Val 130 135 140 Gln Val Asn Ile Gly Glu Asn Asn Asn Gln Asn Gln Asn Pro Ala Asn 145 150 155 160 Asp Ala Pro Ala Pro Pro Pro Ala Gln Gly Gln Ala Pro Ala Pro Ala 165 170 175 Pro Ala Ala Ala Ala Gly Gly Ser Gly Ser Ser Gln Asn Phe Phe Gln 180 185 190 Asn Glu Ile Tyr Ala Asn Pro Lys Phe Ile Glu Glu Val Asp Ser Ser 195 200 205 Ile Ala Lys Leu Asp Gly Glu Leu Lys Ala Lys Ala Glu Lys Val Lys 210 215 220 Ser Val Pro Thr Ala Val Trp Leu Ala Trp Asp Gly Ala Pro Gly Glu 225 230 235 240 Val Ala Gln His Leu Glu Ala Ala Gly Ser Lys Thr Val Val Phe Ile 245 250 255 Met Tyr Met Ile Pro Thr Arg Asp Cys Asn Ala Asn Ala Ser Ala Gly 260 265 270 Gly Ala Ser Asn Leu Gln Thr Tyr Lys Gly Tyr Val Asp Ser Ile Ser 275 280 285 Asn Thr Ile Lys Lys Tyr Pro Asn Ser Lys Val Val Met Ile Leu Glu 290 295 300 Pro Asp Thr Leu Gly Asn Leu Val Thr Ala Asn Ser Glu Asn Cys Lys 305 310 315 320 Asn Val His Gln Leu His Lys Asp Ala Leu Ser Tyr Gly Val Asn Val 325 330 335 Phe Gly Ser Met Ser Asn Val Ser Val Tyr Leu Asp Ala Ala His Gly 340 345 350 Ala Trp Leu Gly Asp Ser Thr Asp Lys Val Ala Ala Val Val Lys Glu 355 360 365 Ile Leu Ser Asn Ala Pro Asn Gly Lys Ile Arg Gly Leu Ser Thr Asn 370 375 380 Ile Ser Asn Tyr Gln Pro Val Asp Ser Glu Tyr Gly Tyr His Gln Lys 385 390 395 400 Leu Ala Ser Ala Leu Ser Ala Ala Gly Tyr Pro Asp Met His Phe Val 405 410 415 Val Asp Thr Gly Arg Asp Gly Val Ala Ile Ser Ser Gly Thr Trp Cys 420 425 430 Asn Leu Ile Gly Thr Gly Phe Gly Glu Arg Pro Lys Gly Asn Pro Asn 435 440 445 Pro Gly Met Pro Leu Leu Asp Ala Tyr Met Trp Leu Lys Thr Pro Gly 450 455 460 Glu Ala Asp Gly Ser Ser Thr Gly Ala Arg Ala Asp Pro Val Cys Ala 465 470 475 480 Lys Ser Asp Ser Leu Pro Gly Ala Pro Asp Ala Gly Gln Trp Phe His 485 490 495 Asp Tyr Phe Val Gln Leu Leu Lys Asn Ala Lys Pro Ala Phe 500 505 510 <210> 96 <211> 459 <212> PRT <213> Orpinomyces sp. PC-2 <400> 96 Met Lys Phe Ser Thr Val Leu Ala Thr Leu Phe Ala Thr Gly Ala Leu 1 5 10 15 Ala Ser Glu Cys His Trp Gln Tyr Pro Cys Cys Lys Asp Cys Thr Val 20 25 30 Tyr Tyr Thr Asp Thr Glu Gly Lys Trp Gly Val Leu Asn Asn Asp Trp 35 40 45 Cys Met Ile Asp Asn Arg Arg Cys Ser Ser Asn Asn Asn Asn Cys Ser 50 55 60 Ser Ser Ile Thr Ser Gln Gly Tyr Pro Cys Cys Ser Asn Asn Asn Cys 65 70 75 80 Lys Val Glu Tyr Thr Asp Asn Asp Gly Lys Trp Gly Val Glu Asn Asn 85 90 95 Asn Trp Cys Gly Ile Ser Asn Ser Cys Gly Gly Gly Gln Gln Gln Gln 100 105 110 Pro Thr Gln Pro Thr Gln Pro Thr Gln Pro Gln Gln Pro Thr Gln Pro 115 120 125 Ser Ser Asp Asn Phe Phe Glu Asn Glu Ile Tyr Ser Asn Tyr Lys Phe 130 135 140 Gln Gly Glu Val Asp Ile Ser Ile Lys Lys Leu Asn Gly Asp Leu Lys 145 150 155 160 Ala Lys Ala Glu Lys Val Lys Tyr Val Pro Thr Ala Val Trp Leu Ala 165 170 175 Trp Asp Gly Ala Pro Gln Glu Val Pro Arg Tyr Leu Gln Glu Ala Gly 180 185 190 Asn Lys Thr Val Val Phe Val Leu Tyr Met Ile Pro Thr Arg Asp Cys 195 200 205 Gly Ala Asn Ala Ser Ala Gly Gly Ser Ala Thr Ile Asp Lys Tyr Lys 210 215 220 Gly Tyr Ile Asn Asn Ile Tyr Asn Thr Ser Asn Gln Tyr Lys Asn Ser 225 230 235 240 Lys Ile Val Met Ile Leu Glu Pro Asp Thr Ile Gly Asn Leu Val Thr 245 250 255 Asn Asn Asn Asp Asn Cys Arg Asn Val Arg Asn Met His Lys Gln Ala 260 265 270 Leu Ser Tyr Ala Ile Ser Lys Phe Gly Thr Gln Ser His Val Lys Val 275 280 285 Tyr Leu Asp Ala Ala His Gly Ala Trp Leu Asn Gln Tyr Ala Asp Gln 290 295 300 Thr Ala Asn Val Ile Lys Glu Ile Leu Asn Asn Ala Gly Ser Gly Lys 305 310 315 320 Leu Arg Gly Ile Ser Thr Asn Val Ser Asn Tyr Gln Ser Ile Glu Ser 325 330 335 Glu Tyr Lys Tyr His Gln Asn Leu Asn Arg Ala Leu Glu Ser Lys Gly 340 345 350 Val Arg Gly Leu Lys Phe Ile Val Asp Thr Ser Arg Asn Gly Ala Asn 355 360 365 Val Glu Gly Ala Phe Asn Ala Ser Gly Thr Trp Cys Asn Phe Lys Gly 370 375 380 Ala Gly Leu Gly Gln Arg Pro Lys Gly Asn Pro Asn Pro Gly Ser Met 385 390 395 400 Pro Leu Leu Asp Ala Tyr Met Trp Ile Lys Thr Pro Gly Glu Ala Asp 405 410 415 Gly Ser Ser Gln Gly Ser Arg Ala Asp Pro Val Cys Ala Arg Gly Asp 420 425 430 Ser Leu Gln Gly Ala Pro Asp Ala Gly Ser Trp Phe His Glu Tyr Phe 435 440 445 Thr Met Leu Ile Gln Asn Ala Asn Pro Pro Phe 450 455 <210> 97 <211> 345 <212> PRT <213> Piromyces rhizinflatus <400> 97 Thr Ala Val Trp Leu Ala Trp Asp Gly Ala Pro Gly Glu Val Glu Gly 1 5 10 15 His Leu Lys Asn Ala Gly Asp Lys Thr Ile Val Phe Ile Leu Tyr Met 20 25 30 Ile Pro Thr Arg Asp Cys Asn Ser Lys Ala Ser Ala Gly Gly Ala Ser 35 40 45 Asn Leu Lys Lys Tyr Gln Gly Tyr Val Asp Ser Ile Ala Asn Thr Ile 50 55 60 Ser Lys His Pro Glu Ser Lys Val Val Met Val Ile Glu Pro Asp Thr 65 70 75 80 Leu Gly Asn Leu Ile Thr Gly Glu Thr Glu Glu Cys Lys Thr Val His 85 90 95 Thr Leu His Lys Asp Ala Leu Ala Tyr Ala Val Asn Val Phe Gly Asp 100 105 110 Met Ser Asn Val Ser Ala Tyr Leu Asp Ala Ala His Gly Lys Trp Leu 115 120 125 Gly Trp Ala Ala Gly Lys Thr Ala Ala Val Ile Lys Glu Ile Leu Asp 130 135 140 Asn Ala Pro Asn Gly Asn Ile Arg Gly Phe Ser Thr Asn Val Ser Asn 145 150 155 160 Tyr Gln Pro Ile Glu Ser Glu Tyr Glu Tyr His Glu Lys Leu Asn Ala 165 170 175 Ala Leu Glu Asp Leu Gly Ile Thr Gly Lys Lys Phe Ile Val Asp Thr 180 185 190 Gly Arg Ser Gly Val Asp Val Thr Glu Glu Phe Asn Leu Asn Gln Thr 195 200 205 Trp Cys Asn Leu Ile Tyr Ala Gly Leu Gly Glu Pro Ser Arg Gly Ser 210 215 220 Pro Asp Pro Glu Lys Phe Pro Leu Leu Asp Ala Tyr Phe Trp Leu Lys 225 230 235 240 Pro Pro Gly Glu Ala Asp Gly Ser Asp Thr Gly Ser Arg Ala Asp Pro 245 250 255 Val Cys Gly Arg Glu Asp Ser Phe Pro Gly Ala Pro Asp Ala Gly Ser 260 265 270 Trp Phe Ser Glu Tyr Phe Ala Ser Met Leu Glu Lys Ser Pro Phe Tyr 275 280 285 Gly Glu Gly Ile Glu Glu Glu Pro Glu Glu Pro Glu Glu Pro Leu Cys 290 295 300 Ser Gln Lys Phe Leu Asp Gln Gly Tyr Gln Cys Cys Ser Gln Cys Gly 305 310 315 320 Thr Ile Tyr Tyr Val Asp Asp Ala Gly Asn Trp Gly Val Glu Asn Asn 325 330 335 Glu Trp Cys Gly Leu Pro Glu Asp Cys 340 345 <210> 98 <211> 457 <212> PRT <213> Micromonospora cellulolyticum <400> 98 Val Ala Ile Leu Ser Ala Arg Arg Arg Ser Ala Ala Ile Ser Val Thr 1 5 10 15 Ala Val Ala Gly Leu Ala Ala Ala Gly Val Leu Arg Val Gly Gly Val 20 25 30 Ala Gly Thr Val Ser Gly Ser Leu Tyr Arg Asp Pro Ser Ser Ala Val 35 40 45 Val Arg Trp Val Ala Ala Asn Pro Gly Asp Phe Arg Ala Ala Val Ile 50 55 60 Arg Glu Lys Ile Ala Ser Gln Pro Gln Ala Arg Trp Tyr Ala Asn Phe 65 70 75 80 Asn Pro Ser Thr Ile Gln Ser Glu Val Ser Ala Phe Ile Gly Ala Ala 85 90 95 Asn Ser Ala Gln Gln Ile Pro Val Leu Ser Val Tyr Glu Ile Thr Asn 100 105 110 Arg Asp Cys Gly Gly Ala His Ala Gly Gly Ala Pro Asp Leu Asn Gln 115 120 125 Tyr Gln Thr Trp Val Ser Asn Phe Ala Arg Gly Leu Gly Asn Gln Thr 130 135 140 Val Leu Ile Ile Leu Glu Thr Asp Ser Leu Ala Leu Gln Thr Cys Leu 145 150 155 160 Ser Thr Ser Glu Leu Asn Ala Arg Asn Gln Ala Leu Ser Thr Ala Thr 165 170 175 Gln Thr Ile Lys Ser Ala Asn Pro Asn Ala Lys Val Tyr Leu Asp Gly 180 185 190 Gly His Ser Thr Trp Asn Ser Ala Asn Asp Thr Ala Asn Arg Leu Arg 195 200 205 Ala Ala Gly Val Gln Tyr Ala Asp Gly Phe Phe Thr Asn Val Ser Asn 210 215 220 Phe Asn Pro Thr Ser Ser Glu Ala Asn Phe Gly Arg Ala Val Ile Ser 225 230 235 240 Ala Leu Asn Gly Met Gly Ile Ser Gly Lys Arg Gln Val Ile Asp Thr 245 250 255 Ser Arg Asn Gly Gly Ala Ala Gly Asp Trp Cys Ala Asp Asp Asn Thr 260 265 270 Asp Arg Arg Ile Gly Gln Tyr Pro Thr Thr Asn Thr Gly Asp Ala Asn 275 280 285 Ile Asp Ala Tyr Leu Trp Val Lys Pro Pro Gly Glu Ala Asp Gly Cys 290 295 300 Ala Thr Arg Gly Ser Phe Gln Pro Asp Leu Ala Phe Ser Leu Ala Asn 305 310 315 320 Gly Val Pro Asn Pro Pro Thr Thr Ala Pro Pro Thr Thr Asn Arg Ala 325 330 335 Asp Asp Arg Pro Pro Thr Thr Ala Pro Pro Thr Thr Asp Thr Pro Thr 340 345 350 Thr Ala Pro Pro Thr Thr Pro Pro Pro Ala Gly Asn Gly Leu Ser Ala 355 360 365 Ser Val Ala Ile Thr Gln Trp Asn Gly Gly Phe Thr Ala Ser Val Asn 370 375 380 Val Thr Ala Gly Ser Ala Ile Asn Gly Trp Thr Val Thr Val Ala Leu 385 390 395 400 Pro Gly Gly Ala Ala Ile Thr Gly Thr Trp Asn Ala Gln Ala Ser Gly 405 410 415 Thr Ser Gly Thr Val Arg Phe Thr Asn Val Gly Tyr Asn Gly Gln Val 420 425 430 Gly Ala Gly Gln Thr Thr Asn Phe Gly Phe Gln Gly Thr Gly Thr Gly 435 440 445 Gln Gly Ala Thr Ala Thr Cys Ala Ala 450 455 <210> 99 <211> 193 <212> PRT <213> Orpinomyces sp. PC-2 <400> 99 Thr Leu His Lys Asn Ala Leu Ser Tyr Ala Val Asn Val Phe Gly Ser 1 5 10 15 Met Lys Asn Val Ser Val Tyr Leu Asp Ala Ala His Gly Met Trp Leu 20 25 30 Ser Ala Val Ala Asp Lys Thr Ala Ala Val Ile Lys Glu Val Leu Asp 35 40 45 Asn Ala Pro Asn Gly Lys Ile Arg Gly Leu Ser Thr Asn Ile Ser Asn 50 55 60 Tyr Gln Pro Val Tyr Ser Glu Tyr Lys Tyr His Glu Lys Leu Ser Ala 65 70 75 80 Glu Leu Glu Lys Leu Gly Val Ser Asp Ile His Phe Ile Val Asp Thr 85 90 95 Gly Arg Asn Gly Val Asp Ile Thr Glu Thr Phe Ser Lys Thr Gln Thr 100 105 110 Trp Cys Asn Phe Val Gly Thr Gly Phe Gly Glu Arg Pro Gln Gly Asn 115 120 125 Pro Asp Pro Val Lys Met Pro Leu Leu Asp Ala Tyr Met Trp Leu Lys 130 135 140 Thr Pro Gly Glu Ala Asp Gly Ser Asp Thr Gly Ser Arg Ala Asp Pro 145 150 155 160 Val Cys Ala Arg Glu Asp Ser Leu Pro Gly Ser Pro Asp Ala Gly Gln 165 170 175 Trp Phe His Asp Tyr Phe Val Gln Leu Leu Glu Asn Ala Asn Pro Ala 180 185 190 Phe <210> 100 <211> 458 <212> PRT <213> Catenulispora acidiphila <400> 100 Met Val Ala Thr Gln Leu Gly Gly Val Ala Met Ala Gly Thr Ile Ala 1 5 10 15 Ser Gly Thr Gln Phe Tyr Ala Asp Pro Asn Ser Gln Val Val Lys Trp 20 25 30 Asp Ala Ala Asn Pro Gly Asp Ala Arg Glu Pro Ala Ile Ala Ser Gln 35 40 45 Ile Ala Ser Val Ser Gln Gly Ile Trp Phe Ser Asn Tyr Arg Pro Ser 50 55 60 Thr Val Gln Ser Asp Val Ser Ala Val Thr Thr Ala Ala Ala Ala Ala 65 70 75 80 Gly Lys Thr Pro Val Leu Val Val Tyr Glu Ile Pro Asn Arg Asp Cys 85 90 95 Gly Gly Ala Ser Ala Gly Gly Ala Pro Asp Ile Ser Ser Tyr Glu Asn 100 105 110 Tyr Ile Gln Ser Phe Ala Asn Gly Leu Gly Ser His Gln Val Ile Val 115 120 125 Ile Leu Glu Pro Asp Ser Leu Ala Leu Gln Thr Cys Leu Ser Ser Gln 130 135 140 Gln Ala Thr Asp Arg Asp Asn Ala Ile Ala Phe Ala Gly Ala His Leu 145 150 155 160 Lys Ser Ala Asp Pro Ala Ala Lys Val Tyr Leu Asp Ala Gly His Ser 165 170 175 Ser Trp Asn Ser Pro Ser Ala Gln Ala Ala Ala Leu Asn Ala Ala Gly 180 185 190 Val Lys Thr Ser Ser Asp Gly Ile Phe Ser Asn Val Ser Asn Phe Gln 195 200 205 Thr Thr Ala Ser Glu Val Ser Tyr Asp Lys Gln Val Leu Ala Ala Leu 210 215 220 Gly Ser Pro Ser Asn Leu His Ile Val Val Asp Thr Ser Arg Asn Gly 225 230 235 240 Asn Gly Pro Ala Gly Ser Ala Trp Cys Asp Pro Ser Gly Arg Ala Leu 245 250 255 Gly Gln Ala Pro Thr Ala Asn Thr Gly Asp Ala Ala Val Asp Ala Phe 260 265 270 Leu Trp Ile Lys Pro Pro Gly Glu Ala Asp Gly Cys Ala Asp Ala Ala 275 280 285 Gly Thr Phe Asp Pro Ala Leu Ala Tyr Ala Leu Ile Thr Asn Gly Gly 290 295 300 Gly Pro Pro Pro Thr Ser Pro Ser Ser Thr Pro Ser Thr Thr Pro Ser 305 310 315 320 Thr Thr Pro Ser Thr Thr Pro Ser Thr Thr Pro Ser Thr Thr Pro Ser 325 330 335 Thr Thr Pro Ser Thr Pro Pro Ser Thr Thr Pro Ser Ser Pro Pro Ser 340 345 350 Ser Ser Pro Ala Gly Cys Gln Val Thr Tyr Thr Arg Thr Asn Glu Trp 355 360 365 Ala Gly Gly Phe Thr Ala Asn Val Ser Ile Thr Ser Ser Lys Ala Leu 370 375 380 Ser Ser Trp Thr Val Gly Phe Thr Tyr Gly Gly Asp Gln Gln Ile Thr 385 390 395 400 Asn Ser Trp Asn Gly Asn His Thr Gln Ser Gly Arg Asn Val Thr Leu 405 410 415 Thr Ser Leu Ser Tyr Asn Gly Ser Ile Gly Ala Gly Gln Thr Leu Thr 420 425 430 Gly Val Gly Val Gln Gly Thr Trp Thr Ser Ser Asp Ala Ala Pro Ser 435 440 445 Ala Phe Thr Leu Asn Gly Val Ala Cys His 450 455 <210> 101 <211> 422 <212> PRT <213> Actinosynnema mirum <400> 101 Met Ala Gly Ala Ala Val Leu Val Thr Gly Gly Gly Gln Thr Ala Thr 1 5 10 15 Ala Ala Asp Ser Ala Phe Tyr Thr Asp Pro Gly Ser Ser Ser Ala Arg 20 25 30 Trp Val Ala Ala Asn Pro Asn Asp Ser Arg Ala Ala Val Ile Arg Asp 35 40 45 Arg Val Ala Ser Val Pro Gln Ala Lys Trp Phe Thr Thr Thr Asn Thr 50 55 60 Ser Thr Val Arg Ser Glu Val Ser Ala Phe Val Gly Ala Ala Ala Ser 65 70 75 80 Ala Gly Lys Ile Pro Ile Leu Val Val Tyr Asn Ile Pro Asn Arg Asp 85 90 95 Cys Gly Gly Ala Ser Gly Gly Gly Ala Pro Ser His Gln Ala Tyr Arg 100 105 110 Ala Trp Val Asp Glu Val Ala Ala Gly Leu Gly Gly Arg Pro Ala Ser 115 120 125 Ile Ile Leu Glu Pro Asp Val Leu Pro Ile Met Ser Asn Cys Gln Ser 130 135 140 Ala Asp Gln Gln Asn Gln Thr Lys Ala Ser Met Ser Tyr Ala Gly Arg 145 150 155 160 Lys Leu Lys Ser Gly Ser Gly Gln Ala Lys Val Tyr Phe Asp Ile Gly 165 170 175 Asn Ser Asp Trp Leu Ala Pro Ala Glu Ala Ala Asn Arg Leu Arg Gly 180 185 190 Ala Asp Val Ser Gly Ser Ser Asp Gly Ile Ala Ser Asn Val Ser Asn 195 200 205 Tyr Arg Ala Thr Gln Ala Glu Val Ser Tyr Thr Lys Ala Ile Leu Asn 210 215 220 Ala Leu Gly Asp Gly Arg Leu Lys Ala Val Ile Asp Thr Ser Arg Asn 225 230 235 240 Gly Asn Gly Pro Leu Gly Ser Glu Trp Cys Asp Pro Pro Gly Arg Ala 245 250 255 Ile Gly Thr Pro Ser Thr Lys Asn Thr Gly Asp Ser Gln Ile Asp Ala 260 265 270 Phe Leu Trp Val Lys Ile Val Gly Glu Ala Asp Gly Cys Ile Ala Ser 275 280 285 Ala Gly Gln Phe Val Pro Gln Arg Ala Tyr Asp Leu Ala Val Ala Ala 290 295 300 Gly Pro Val Pro Thr Thr Thr Thr Thr Thr Pro Gly Gly Asn Pro Gly 305 310 315 320 Gly Gly Cys Ala Val Thr His Arg Val Val Ser Gln Trp Asn Gly Gly 325 330 335 Phe Thr Gly Glu Val Val Val Glu Asn Arg Gly Pro Ala Ile Ser Ser 340 345 350 Trp Thr Leu Glu Phe Ser Ala Pro Gly Val Thr Val Thr Gln Gly Trp 355 360 365 Asn Gly Thr Trp Thr Asp Thr Gly Asp Gly Val Arg Val Val Asn Thr 370 375 380 Ala Trp Asn Gly Ala Leu Ala Ser Gly Gly Arg Val Thr Ala Gly Tyr 385 390 395 400 Asn Ala Asn Tyr Gly Gly Gly Ala Pro Pro Phe Ser Ser Pro Thr Leu 405 410 415 Asn Gly Ala Ala Cys Ser 420 <210> 102 <211> 444 <212> PRT <213> Actinosynnema mirum <400> 102 Met Ala Ala Gly Ala Leu Ser Ser Ala Leu Val Ala Ala Ala Thr Ala 1 5 10 15 Ile Ala Thr Gly Thr Ala Ser Pro Ala Ala Val Ala Ala Asp Ser Glu 20 25 30 Phe Tyr Ser Asp Pro Ala Thr Ser Ala Ala Arg Trp Val Ala Ala Asn 35 40 45 Pro Asn Asp Ser Arg Ala Ala Val Ile Arg Asp Arg Val Ala Ser Val 50 55 60 Pro Gln Ala Lys Trp Phe Thr Thr Thr Asn Thr Ser Thr Ile Arg Ala 65 70 75 80 Glu Val Asp Ala His Thr Ser Ala Ala Ala Ser Ala Gly Lys Thr Pro 85 90 95 Ile Leu Val Val Tyr Asn Ile Pro Asn Arg Asp Cys Gly Gly Ala Ser 100 105 110 Gly Gly Gly Ala Pro Ser His Gly Ala Tyr Arg Gln Trp Val Asp Gln 115 120 125 Phe Ala Ala Gly Leu Ala Gly Arg Pro Ala Ala Ile Ile Leu Glu Pro 130 135 140 Asp Val Leu Pro Ile Met Ser Thr Cys Gln Ser Ala Ser Gln Gln Ala 145 150 155 160 Glu Thr Arg Ala Ser Met Ala Tyr Ala Gly Lys Ala Leu Lys Ala Ala 165 170 175 Ser Ser Gln Ala Lys Val Tyr Phe Asp Ile Gly His Ser Ala Trp Leu 180 185 190 Thr Pro Ala Glu Ala Ala Asn Arg Leu Arg Ala Ala Glu Val Ser Thr 195 200 205 Ser Ala Asp Gly Ile Ala Thr Asn Val Ser Asn Tyr Arg Arg Thr Ala 210 215 220 Asp Glu Val Ala Phe Ala Lys Ala Thr Leu Asn Ala Leu Gly Asp Gly 225 230 235 240 Arg Leu Lys Ala Val Val Asp Thr Ser Arg Asn Gly Asn Gly Pro Leu 245 250 255 Gly Ser Glu Trp Cys Asp Pro Pro Gly Arg Ala Ile Gly Thr Pro Ser 260 265 270 Thr Arg Asn Thr Gly Asp Pro Gln Ile Asp Ala Phe Leu Trp Val Lys 275 280 285 Ile Pro Gly Glu Ala Asp Gly Cys Ile Ala Gly Ala Gly Gln Phe Val 290 295 300 Pro Gln Arg Ala Tyr Asp Met Ala Val Ala Ala Gly Pro Ala Pro Thr 305 310 315 320 Thr Thr Thr Thr Thr Thr Thr Thr Thr Arg Val Thr Thr Thr Thr Thr 325 330 335 Thr Pro Pro Pro Asn Gly Ala Ala Cys Val Val Arg His Arg Val Val 340 345 350 Ser Ser Trp Ser Gly Gly His Thr Gly Glu Val Val Ile Glu Asn Arg 355 360 365 Gly Pro Ala Leu Gln Asn Trp Thr Leu Glu Phe Ser Ala Pro Gly Val 370 375 380 Ala Val Ser Gln Gly Trp Asn Gly Thr Trp Thr Asp Leu Gly Asp Thr 385 390 395 400 Val Arg Val Thr Ser Ala Ser Trp Asn Gly Gly Ile Ala Thr Gly Gly 405 410 415 Thr Ala Thr Thr Gly Tyr Ser Ala Ser Phe Ser Gly Gly Thr Pro Pro 420 425 430 Phe Thr Ser Pro Val Leu Asn Gly Thr Ala Cys Ala 435 440 <210> 103 <211> 426 <212> PRT <213> Nocardiopsis dassonvillei <400> 103 Met Ser Ser Val Ser Ala Leu Ala Leu Gly Thr Ala Leu Leu Ala Thr 1 5 10 15 Ala Pro Ala Ser Ala Ala Asp Ser Glu Phe Tyr Val Asn Pro Asn Thr 20 25 30 Ser Ala Ala Val Trp Val Glu Glu Asn Pro Asn Asp Pro Arg Ala Asp 35 40 45 Val Ile Arg Asp Arg Ile Ala Ser Val Ala Gln Ala Thr Trp Phe Thr 50 55 60 Gln Tyr Asn Pro Ala Glu Val Arg Asp Asp Val Asp Ala Val Val Ser 65 70 75 80 Ala Ala Asp Ala Gln Gly Gln Thr Pro Ile Leu Val Val Tyr Asn Ile 85 90 95 Pro Gly Arg Asp Cys Gly Asn His Ser Gly Gly Gly Ala Pro Ser His 100 105 110 Asp Ala Tyr Arg Ala Trp Val Asp Glu Val Ala Ala Gly Leu Glu Gly 115 120 125 Arg Ser Ala Thr Ile Val Leu Glu Pro Asp Ala Leu Pro Leu Val Ser 130 135 140 Gly Cys Ser Asp Pro Ser Glu Leu Leu Asp Ser Met Ala Tyr Ala Gly 145 150 155 160 Lys Ala Leu Met Glu Gly Ser Ser Glu Ala Arg Val Tyr Phe Asp Ile 165 170 175 Gly Asn Ser Ala Trp Leu Asp Pro Gln Glu Ala Ala Gly Leu Leu Asn 180 185 190 Gly Ala Asp Val Ala Asn Ser Ala His Gly Val Ala Thr Asn Thr Ser 195 200 205 Asn Tyr Asn Trp Thr His Asp Glu Val Ala Phe Ala Glu Ala Val Ile 210 215 220 Ala Ala Thr Gly Val Pro Gly Leu Gly Ala Val Ile Asp Thr Ser Arg 225 230 235 240 Asn Gly Asn Gly Pro Ala Pro Gln Asn Glu Trp Cys Asp Pro Pro Gly 245 250 255 Arg Met Ile Gly Arg Pro Ser Thr Thr Asp Thr Gly Asn Pro Leu Ile 260 265 270 Asp Ala Phe Ile Trp Thr Lys Leu Pro Gly Glu Ala Asp Gly Cys Ile 275 280 285 Ala Pro Ala Gly Gln Phe Val Pro Gln Ala Ala Tyr Asp Met Ala Val 290 295 300 Asn Ala Pro Glu Tyr Pro Thr Asp Pro Gly Glu Pro Thr Asp Pro Glu 305 310 315 320 Glu Pro Thr Asp Pro Pro Glu Gly Glu Gly Cys Thr Ala Asp Tyr Arg 325 330 335 Val Val Ser Glu Trp Gly Asn Gly Phe Gln Ala Ala Val Thr Val Thr 340 345 350 Ala Glu Asp Ser Leu Ser Gly Trp Thr Val Thr Trp Thr Tyr Ala Asp 355 360 365 Gly Gln Arg Phe Ser Gln Gly Trp Asn Ala Glu Phe Ser Ser Ser Gly 370 375 380 Ser Arg Val Thr Ala Ser Asp Leu Gly Trp Asn Gly Thr Leu Ser Ala 385 390 395 400 Gly Gly Ser Thr Glu Phe Gly Phe Thr Gly Thr His Gly Gly Ser Asn 405 410 415 Gly Val Pro Glu Val Thr Cys Ser Ala Ala 420 425 <210> 104 <211> 286 <212> PRT <213> Thermobifida fusca <400> 104 Asn Asp Ser Pro Phe Tyr Val Asn Pro Asn Met Ser Ser Ala Glu Trp 1 5 10 15 Val Arg Asn Asn Pro Asn Asp Pro Arg Thr Pro Val Ile Arg Asp Arg 20 25 30 Ile Ala Ser Val Pro Gln Gly Thr Trp Phe Ala His His Asn Pro Gly 35 40 45 Gln Ile Thr Gly Gln Val Asp Ala Leu Met Ser Ala Ala Gln Ala Ala 50 55 60 Gly Lys Ile Pro Ile Leu Val Val Ser Asn Ala Pro Gly Arg Asp Cys 65 70 75 80 Gly Asn His Ser Ser Gly Gly Ala Pro Ser His Ser Ala Tyr Arg Ser 85 90 95 Trp Ile Asp Glu Phe Ala Ala Gly Leu Lys Asn Arg Pro Ala Tyr Ile 100 105 110 Ile Val Glu Pro Asp Leu Ile Ser Leu Met Ser Ser Cys Met Gln His 115 120 125 Val Gln Gln Glu Val Leu Glu Thr Met Ala Tyr Ala Gly Lys Ala Leu 130 135 140 Lys Ala Gly Ser Ser Gln Ala Arg Ile Tyr Phe Asp Ala Gly His Ser 145 150 155 160 Ala Trp His Ser Pro Ala Gln Met Ala Ser Trp Leu Gln Gln Ala Asp 165 170 175 Ile Ser Asn Ser Ala His Gly Ile Ala Thr Asn Thr Ser Asn Tyr Arg 180 185 190 Trp Thr Ala Asp Glu Val Ala Tyr Ala Lys Ala Val Leu Ser Ala Ile 195 200 205 Gly Asn Pro Ser Leu Arg Ala Val Ile Asp Thr Ser Arg Asn Gly Asn 210 215 220 Gly Pro Ala Gly Asn Glu Trp Cys Asp Pro Ser Gly Arg Ala Ile Gly 225 230 235 240 Thr Pro Ser Thr Thr Asn Thr Gly Asp Pro Met Ile Asp Ala Phe Leu 245 250 255 Trp Ile Lys Leu Pro Gly Glu Ala Asp Gly Cys Ile Ala Gly Ala Gly 260 265 270 Gln Phe Val Pro Gln Ala Ala Tyr Glu Met Ala Ile Ala Ala 275 280 285 <210> 105 <211> 448 <212> PRT <213> Micromonospora sp. ATCC 39149 <400> 105 Met Ala Ala Ser Ala Leu Thr Ala Ala Val Ala Val Ser Ile Leu Gly 1 5 10 15 Gly Thr Pro Ala Ser Ala Ala Asp Ser Ala Phe Tyr Val Asp Pro Gln 20 25 30 Ala Ser Ala Ala Arg Trp Val Ala Ala Asn Pro Gly Asp Trp Arg Ala 35 40 45 Ala Val Ile Arg Asp Arg Ile Ala Ala Val Pro Gln Gly Arg Trp Phe 50 55 60 Thr Thr Thr Asn Thr Ser Thr Val Arg Ser Glu Val Asp Gln Phe Val 65 70 75 80 Gly Ala Ala Ala Ala Ala Gly Lys Val Pro Ile Met Val Val Tyr Asn 85 90 95 Ile Pro Asn Arg Asp Cys Ser Gly Ala Ser Gly Gly Gly Ala Pro Ser 100 105 110 His Thr Ala Tyr Arg Gln Trp Val Asp Gln Val Ala Ala Gly Leu Ala 115 120 125 Gly Arg Pro Ala Thr Ile Val Leu Glu Pro Asp Val Leu Pro Ile Met 130 135 140 Thr Asn Cys Gln Asn Ala Ser Gln Gln Ala Glu Thr Arg Ala Ser Met 145 150 155 160 Ala Tyr Ala Gly Lys Lys Leu Lys Ser Gly Ser Ala Gln Ala Lys Val 165 170 175 Tyr Phe Asp Ala Gly Asn Ser Ala Trp Leu Ala Pro Ala Glu Ile Ala 180 185 190 Ser Arg Leu Asn Gly Ala Asp Ile Ala Asn Ser Ala Asp Gly Ile Ser 195 200 205 Leu Asn Val Ser Asn Tyr Arg Thr Thr Ala Glu Ser Val Ser Tyr Ala 210 215 220 Lys Gln Val Ile Ala Ala Thr Gly Val Ser Arg Leu Lys Ala Val Ile 225 230 235 240 Asp Thr Ser Arg Asn Gly Asn Gly Pro Leu Gly Ser Glu Trp Cys Asp 245 250 255 Pro Pro Gly Arg Ala Ile Gly Thr Pro Ser Thr Thr Ala Thr Gly Asp 260 265 270 Ser Ala Ile Ala Ala Tyr Leu Trp Val Lys Leu Pro Gly Glu Ala Asp 275 280 285 Gly Cys Ile Ala Pro Ala Gly Gln Phe Val Pro Gln Arg Ala Tyr Asp 290 295 300 Leu Ala Ile Ala Ala Gly Pro Val Pro Thr Thr Ala Pro Pro Thr Thr 305 310 315 320 Ala Pro Pro Thr Thr Ala Pro Pro Thr Thr Ala Pro Pro Thr Thr Ala 325 330 335 Pro Pro Thr Thr Pro Pro Asn Gly Ala Cys Lys Val Thr Phe Thr Pro 340 345 350 Asn Thr Trp Ser Gly Gly Phe Thr Ala Glu Leu Arg Val Thr Asn Gly 355 360 365 Gly Ser Ala Leu Asn Gly Trp Ser Leu Ser Phe Gly Phe Gly Ser Gly 370 375 380 Ser Gly Val Arg Leu Thr Ser Gly Trp Asn Gly Glu Trp Ser Gln Asn 385 390 395 400 Gly Asp Val Phe Leu Val Arg Asn Ala Ala Trp Asn Gly Asn Leu Pro 405 410 415 Ala Gly Gly Thr Leu Ser Val Gly Phe Gln Gly Thr Phe Ser Gly Ala 420 425 430 Ser Leu Pro Thr Ala Val Gly Phe Thr Leu Asn Gly Ser Arg Cys Asn 435 440 445 <210> 106 <211> 456 <212> PRT <213> Thermobispora bispora <400> 106 Met Ser Arg Ile Arg Arg Phe Leu Ala Thr Ala Leu Ala Ala Ala Thr 1 5 10 15 Ala Gly Val Gly Ala Ile Val Thr Ala Ile Ala Ser Ala Gly Pro Ala 20 25 30 His Ala Tyr Asp Ser Pro Phe Tyr Val Asp Pro Gln Ser Asn Ala Ala 35 40 45 Lys Trp Val Ala Ala Asn Pro Asn Asp Pro Arg Thr Pro Val Ile Arg 50 55 60 Asp Arg Ile Ala Ala Val Pro Thr Gly Arg Trp Phe Ala Asn Tyr Asn 65 70 75 80 Pro Ser Thr Val Arg Ala Glu Val Asp Ala Tyr Val Gly Ala Ala Ala 85 90 95 Ala Ala Gly Lys Ile Pro Ile Met Val Val Tyr Ala Met Pro Asn Arg 100 105 110 Asp Cys Gly Gly Pro Ser Ala Gly Gly Ala Pro Asn His Thr Ala Tyr 115 120 125 Arg Ala Trp Ile Asp Glu Ile Ala Ala Gly Leu Arg Asn Arg Pro Ala 130 135 140 Val Ile Ile Leu Glu Pro Asp Ala Leu Pro Ile Met Thr Asn Cys Met 145 150 155 160 Ser Pro Ser Glu Gln Ala Glu Val Gln Ala Ser Ala Val Gly Ala Gly 165 170 175 Lys Lys Phe Lys Ala Ala Ser Ser Gln Ala Lys Val Tyr Phe Asp Ala 180 185 190 Gly His Asp Ala Trp Val Pro Ala Asp Glu Met Ala Ser Arg Leu Arg 195 200 205 Gly Ala Asp Ile Ala Asn Ser Ala Asp Gly Ile Ala Leu Asn Val Ser 210 215 220 Asn Tyr Arg Tyr Thr Ser Gly Leu Ile Ser Tyr Ala Lys Ser Val Leu 225 230 235 240 Ser Ala Ile Gly Ala Ser His Leu Arg Ala Val Ile Asp Thr Ser Arg 245 250 255 Asn Gly Asn Gly Pro Leu Gly Ser Glu Trp Cys Asp Pro Pro Gly Arg 260 265 270 Ala Thr Gly Thr Trp Ser Thr Thr Asp Thr Gly Asp Pro Ala Ile Asp 275 280 285 Ala Phe Leu Trp Ile Lys Pro Pro Gly Glu Ala Asp Gly Cys Ile Ala 290 295 300 Thr Pro Gly Val Phe Val Pro Asp Arg Ala Tyr Glu Leu Ala Met Asn 305 310 315 320 Ala Ala Pro Pro Thr Tyr Ser Pro Ser Pro Thr Pro Ser Thr Pro Ser 325 330 335 Pro Ser Pro Ser Gln Ser Asp Pro Gly Ser Pro Ser Pro Ser Pro Ser 340 345 350 Gln Pro Pro Ala Gly Arg Ala Cys Glu Ala Thr Tyr Ala Leu Val Asn 355 360 365 Gln Trp Pro Gly Gly Phe Gln Ala Glu Val Thr Val Lys Asn Thr Gly 370 375 380 Ser Ser Pro Ile Asn Gly Trp Thr Val Gln Trp Thr Leu Pro Ser Gly 385 390 395 400 Gln Ser Ile Thr Gln Leu Trp Asn Gly Asp Leu Ser Thr Ser Gly Ser 405 410 415 Asn Val Thr Val Arg Asn Val Ser Trp Asn Gly Asn Val Pro Ala Gly 420 425 430 Gly Ser Thr Ser Phe Gly Phe Leu Gly Ser Gly Thr Gly Gln Leu Ser 435 440 445 Ser Ser Ile Thr Cys Ser Ala Ser 450 455 <210> 107 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Consensus sequence <220> <221> MISC_FEATURE <222> (3)..(3) <223> Xaa is A, G or C <400> 107 Gly Glu Xaa Asp Gly 1 5 =

Claims (12)

  1. C-말단 영역에서 서열 GEXDG를 포함하는 모티브를 포함하는 재조합 변이체 폴리펩티드로서, 상기 X는 변이되지 않은 폴리펩티드에서 시스테인이고 재조합 변이체 폴리펩티드에서 세린이며, 상기 재조합 변이체 폴리펩티드가 셀룰라아제 활성을 포함하며, 상기 재조합 변이체 폴리펩티드가 서열 GEXDG(서열번호 107) 내에 세린이 결여된 변이되지 않은 폴리펩티드에 비해 증가된 내열성(thermostability)을 갖고, 상기 재조합 변이체 폴리펩티드가 상기 GEXDG 모티브 내 C314S를 포함하는 서열 번호 2와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C311S를 포함하는 서열 번호 4와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C310S를 포함하는 서열 번호 12와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C312S를 포함하는 서열 번호 13과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C314S를 포함하는 서열 번호 14와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C315S를 포함하는 서열 번호 15와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C313S를 포함하는 서열 번호 16과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C311S를 포함하는 서열 번호 17과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C313S를 포함하는 서열 번호 19와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C312S를 포함하는 서열 번호 21과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C311S를 포함하는 서열 번호 22와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 64와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C407S를 포함하는 서열 번호 65와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C394S를 포함하는 서열 번호 66과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 67과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 68과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 69와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 70과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 71과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 72와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 73과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 74와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 75와 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C407S를 포함하는 서열 번호 76과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C394S를 포함하는 서열 번호 77과 97% 이상 동일하거나; 상기 GEXDG 모티브 내 C412S를 포함하는 서열 번호 78과 97% 이상 동일한 서열을 포함하는, 재조합 변이체 폴리펩티드.
  2. 제1항에 있어서, 상기 재조합 변이체 폴리펩티드가 상기 GEXDG 모티브 내 C314S를 포함하는 서열 번호 2와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C311S를 포함하는 서열 번호 4와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C310S를 포함하는 서열 번호 12와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C312S를 포함하는 서열 번호 13과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C314S를 포함하는 서열 번호 14와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C315S를 포함하는 서열 번호 15와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C313S를 포함하는 서열 번호 16과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C311S를 포함하는 서열 번호 17과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C313S를 포함하는 서열 번호 19와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C312S를 포함하는 서열 번호 21과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C311S를 포함하는 서열 번호 22와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 64와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C407S를 포함하는 서열 번호 65와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C394S를 포함하는 서열 번호 66과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 67과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 68과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 69와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 70과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 71과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 72와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 73과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 74와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 75와 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C407S를 포함하는 서열 번호 76과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C394S를 포함하는 서열 번호 77과 99% 이상 동일하거나; 상기 GEXDG 모티브 내 C412S를 포함하는 서열 번호 78과 99% 이상 동일한 서열을 포함하며, 상기 재조합 변이체 폴리펩티드가 셀룰라아제 활성을 가지고, Cys→Ser 돌연변이가 결여된 상응하는 변이되지 않은 폴리펩티드에 비해 향상된 내열성을 갖는, 재조합 변이체 폴리펩티드.
  3. 제1항에 있어서, 상기 재조합 변이체 폴리펩티드가 상기 GEXDG 모티브 내 C314S를 포함하는 서열 번호 2; 상기 GEXDG 모티브 내 311S를 포함하는 서열 번호 4; 상기 GEXDG 모티브 내 C310S를 포함하는 서열 번호 12; 상기 GEXDG 모티브 내 C312S를 포함하는 서열 번호 13; 상기 GEXDG 모티브 내 C314S를 포함하는 서열 번호 14; 상기 GEXDG 모티브 내 C315S를 포함하는 서열 번호 15; 상기 GEXDG 모티브 내 C313S를 포함하는 서열 번호 16; 상기 GEXDG 모티브 내 C311S를 포함하는 서열 번호 17; 상기 GEXDG 모티브 내 C313S를 포함하는 서열 번호 19; 상기 GEXDG 모티브 내 C312S를 포함하는 서열 번호 21; 상기 GEXDG 모티브 내 C311S를 포함하는 서열 번호 22; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 64; 상기 GEXDG 모티브 내 C407S를 포함하는 서열 번호 65; 상기 GEXDG 모티브 내 C394S를 포함하는 서열 번호 66; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 67; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 68; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 69; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 70; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 71; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 72; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 73; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 74; 상기 GEXDG 모티브 내 C400S를 포함하는 서열 번호 75; 상기 GEXDG 모티브 내 C407S를 포함하는 서열 번호 76; 상기 GEXDG 모티브 내 C394S를 포함하는 서열 번호 77; 또는 상기 GEXDG 모티브 내 C412S를 포함하는 서열 번호 78을 포함하며, 상기 재조합 변이체 폴리펩티드가 셀룰라아제 활성을 가지고, Cys→Ser 돌연변이가 결여된 상응하는 변이되지 않은 폴리펩티드에 비해 향상된 내열성을 갖는, 재조합 변이체 폴리펩티드.
  4. 제1항 내지 제3항 중 어느 한 항의 폴리펩티드를 엔코딩(encoding)하는, 폴리뉴클레오티드.
  5. 제4항의 폴리뉴클레오티드를 포함하는, 벡터.
  6. 제4항의 폴리뉴클레오티드를 포함하는, 숙주 세포.
  7. 제5항의 벡터를 포함하는, 숙주 세포.
  8. 제1항 내지 제3항 중 어느 한 항의 폴리펩티드를 포함하는, 효소 제제.
  9. 제6항의 숙주 세포에 의해 생성된 폴리펩티드를 포함하는, 효소 제제.
  10. 셀룰로오스를 포함하는 바이오매스(biomass)를 제1항 내지 제3항 중 어느 한 항의 폴리펩티드와 접촉시키는 것을 포함하는, 셀룰로오스를 포함하는 바이오매스의 처리 방법.
  11. 셀룰로오스를 포함하는 바이오매스를 제8항의 효소 제제와 접촉시키는 것을 포함하는, 셀룰로오스를 포함하는 바이오매스의 처리 방법.
  12. 실시예 및 도면과 관련하여 본원에 실질적으로 기재된, 제1항 내지 제3항 중 어느 한 항의 재조합 변이체 폴리펩티드.
KR1020157033817A 2009-04-06 2010-04-06 셀룰라아제 활성을 갖는 폴리펩티드 KR20150140859A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16699309P 2009-04-06 2009-04-06
US61/166,993 2009-04-06
US17788209P 2009-05-13 2009-05-13
US61/177,882 2009-05-13
PCT/US2010/030133 WO2010118058A2 (en) 2009-04-06 2010-04-06 Polypeptides having cellulase activity

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020117026135A Division KR20120010254A (ko) 2009-04-06 2010-04-06 셀룰라아제 활성을 갖는 폴리펩티드

Publications (1)

Publication Number Publication Date
KR20150140859A true KR20150140859A (ko) 2015-12-16

Family

ID=42826496

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020117026135A KR20120010254A (ko) 2009-04-06 2010-04-06 셀룰라아제 활성을 갖는 폴리펩티드
KR1020157033817A KR20150140859A (ko) 2009-04-06 2010-04-06 셀룰라아제 활성을 갖는 폴리펩티드

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020117026135A KR20120010254A (ko) 2009-04-06 2010-04-06 셀룰라아제 활성을 갖는 폴리펩티드

Country Status (13)

Country Link
US (2) US9249401B2 (ko)
EP (1) EP2419515A4 (ko)
JP (1) JP2012522521A (ko)
KR (2) KR20120010254A (ko)
CN (1) CN102369284B (ko)
AU (1) AU2010234521B2 (ko)
BR (1) BRPI1012592A2 (ko)
CA (1) CA2755029A1 (ko)
CO (1) CO6430475A2 (ko)
MX (1) MX2011010494A (ko)
RU (1) RU2597289C2 (ko)
WO (1) WO2010118058A2 (ko)
ZA (1) ZA201106650B (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2628795A1 (en) 2008-06-06 2013-08-21 Danisco US Inc. Compositions and methods comprising cellulase variants with reduced affinity to non-cellulosic materials
WO2011143632A2 (en) 2010-05-14 2011-11-17 Codexis, Inc. Cellobiohydrolase variants
IT1406669B1 (it) * 2010-12-03 2014-03-07 Longoni Produzione di cellulasi ricombinanti di chaetamium globosum in piante transplastomiche di tabacco
MX2013007720A (es) 2011-01-26 2013-08-09 Novozymes As Polipeptidos que tienen actividad celobiohidrolasa y polinucleotidos que codifican para los mismos.
US9506048B2 (en) * 2011-01-26 2016-11-29 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
CA2833583A1 (en) * 2011-04-27 2012-11-01 Codexis, Inc. Cellobiohydrolase variants
US9322007B2 (en) * 2011-07-22 2016-04-26 The California Institute Of Technology Stable fungal Cel6 enzyme variants
EP2748187A4 (en) 2011-08-23 2015-03-04 Codexis Inc VARIANTS OF CELLOBIOHYDROLASE
US20150376589A1 (en) * 2012-11-15 2015-12-31 Bp Corporation North America Inc. Variant cbhii polypeptides with improved specific activity
US8778641B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8778640B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8993275B2 (en) * 2013-02-12 2015-03-31 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8771994B1 (en) * 2013-02-12 2014-07-08 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
WO2014155566A1 (ja) * 2013-03-27 2014-10-02 本田技研工業株式会社 耐熱性セロビオハイドロラーゼ
WO2019074828A1 (en) 2017-10-09 2019-04-18 Danisco Us Inc CELLOBIOSE DEHYDROGENASE VARIANTS AND METHODS OF USE

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2451508A (en) 1944-11-22 1948-10-19 Mcgraw Electric Co Automatic electric toaster
US2788508A (en) 1953-01-06 1957-04-09 Buchanan Electrical Prod Corp Electric connector
US5871550A (en) * 1997-08-26 1999-02-16 Genencor International, Inc. Mutant Thermonospora spp. cellulase
US7375197B2 (en) * 2002-01-14 2008-05-20 Midwest Research Institute Cellobiohydrolase I gene and improved variants
US7348168B2 (en) * 2002-12-20 2008-03-25 Novozymes A/S Polypeptides having cellobiohydrolase II activity and polynucleotides encoding same
CN101094917B (zh) * 2004-12-30 2012-04-25 金克克国际有限公司 新型变体红褐肉座菌cbh2纤维素酶
US7785854B2 (en) * 2006-08-31 2010-08-31 Iogen Energy Corporation Modified cellulases with increased thermostability, thermophilicity, and alkalophilicity
AU2009270398A1 (en) * 2008-07-16 2010-01-21 Iogen Energy Corporation Modified family 6 glycosidases with altered substrate specificity
MX2011012841A (es) * 2009-06-03 2012-01-27 Danisco Inc Variantes de celulasa con expresion, actividad y/o estabilidad mejoradas y usos de las mismas.

Also Published As

Publication number Publication date
ZA201106650B (en) 2012-05-30
CA2755029A1 (en) 2010-10-14
JP2012522521A (ja) 2012-09-27
EP2419515A2 (en) 2012-02-22
MX2011010494A (es) 2011-12-08
WO2010118058A3 (en) 2011-03-31
AU2010234521A1 (en) 2011-09-29
CO6430475A2 (es) 2012-04-30
US20100255542A1 (en) 2010-10-07
WO2010118058A2 (en) 2010-10-14
RU2597289C2 (ru) 2016-09-10
US20160355799A1 (en) 2016-12-08
KR20120010254A (ko) 2012-02-02
AU2010234521B2 (en) 2015-01-29
BRPI1012592A2 (pt) 2016-10-11
US9249401B2 (en) 2016-02-02
EP2419515A4 (en) 2013-07-24
CN102369284A (zh) 2012-03-07
RU2011137003A (ru) 2013-05-20
CN102369284B (zh) 2017-09-08

Similar Documents

Publication Publication Date Title
KR20150140859A (ko) 셀룰라아제 활성을 갖는 폴리펩티드
US9708633B2 (en) Stable, functional chimeric cellobiohydrolase class I enzymes
US20030054535A1 (en) Endoglucanase mutants and mutant hydrolytic depolymerizing enzymes and uses thereof
Furtado et al. Engineering the affinity of a family 11 carbohydrate binding module to improve binding of branched over unbranched polysaccharides
Voutilainen et al. Heterologous expression of Melanocarpus albomyces cellobiohydrolase Cel7B, and random mutagenesis to improve its thermostability
US20100304464A1 (en) Stable, functional chimeric cellobiohydrolases
CN110172468A (zh) 一种来源于类芽孢杆菌新型普鲁兰酶及其基因与应用
US9334517B2 (en) Endoglucanase having enhanced thermostability and activity
WO2010091441A9 (en) Stable, functional chimeric cellobiohydrolases
US20160251642A1 (en) Stable fungal cel6 enzyme variants
KR102100958B1 (ko) 가야도모나스 주비니에게 g7 유래 알파-네오아가로올리고당 가수분해효소의 이용
US20130084619A1 (en) Modified cellulases with enhanced thermostability
KR101646741B1 (ko) 신규 재조합 셀룰레이즈 및 그의 용도
WO2015048452A2 (en) Methods and enzymes for producing hydroxymethylfurfural
US9493751B2 (en) Dual-functional hybrid glucanases
KR20200087064A (ko) 가야도모나스 주비니에게 g7 유래 알파-네오아가로올리고당 가수분해효소의 이용
Hahnj et al. Crystal Structure and Site-directed Mutagenesis of Bacillus macerans Endo-1, 3-1, 4-(3-glucanase
KR20180024644A (ko) 활성이 개선된 네오사토리아 피쉐리 유래의 돌연변이 베타글루코시다제 및 그 용도
KR20130104586A (ko) 셀룰라제 융합 단백질 및 그를 이용한 셀룰로즈 물질의 분해 방법

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
WITB Written withdrawal of application