KR20140017612A - 당화 공정에서 점도를 감소시키는 방법 - Google Patents
당화 공정에서 점도를 감소시키는 방법 Download PDFInfo
- Publication number
- KR20140017612A KR20140017612A KR1020137027241A KR20137027241A KR20140017612A KR 20140017612 A KR20140017612 A KR 20140017612A KR 1020137027241 A KR1020137027241 A KR 1020137027241A KR 20137027241 A KR20137027241 A KR 20137027241A KR 20140017612 A KR20140017612 A KR 20140017612A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- polypeptide
- activity
- biomass
- mixture
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01004—Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
Abstract
본 발명은, 글리코실 하이드롤라아제 패밀리 61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물과 같이 바이오매스의 가수분해에 사용될 수 있는 조성물, 바이오매스 재료를 가수분해하는 방법, 및 글리코실 하이드롤라아제 패밀리 61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물을 사용하여 바이오매스 혼합물의 점도를 감소시키는 방법에 관한 것이다.
Description
관련 출원과의 상호 참조
본 출원은 본 명세서에 전체적으로 참고로 포함되는 미국 가출원 제61/453,923호(출원일: 2011년 3월 17일)에 대한 우선권을 주장한다.
본 발명은 바이오매스의 가수분해에 유용한 조성물, 이러한 조성물을 사용하여 바이오매스 재료를 가수분해하는 방법, 및 바이오매스 당화 혼합물의 점도를 감소시키는 방법에 관한 것이다.
재생가능한 리그노셀룰로오스계 바이오매스를 발효가능한 당으로 생물전환시키고, 이어서 이를 발효시켜 액체 연료에 대 대안으로서의 알코올(예를 들어, 에탄올)을 생성시키는 것은, 석유 파동이 발생했던 1970년대 이후로 연구자들의 지대한 관심을 끌어 왔다(Bungay, H. R., "Energy: the biomass options". NY: Wiley; 1981; Olsson L, Hahn-Hagerdal B. Enzyme Microb Technol 1996,18:312-31; Zaldivar, J et al., Appl Microbiol Biotechnol 2001, 56: 17-34; Galbe, M et al., Appl Microbiol Biotechnol 2002, 59:618-28). 리그노셀룰로오스계 바이오매스 재료로부터 당을 생성시키는 것은, 당을 에탄올로 발효시키고 증류하는 후속 단계를 갖는 것으로 얼마 전부터 공지되어 있다. 독일, 일본, 및 소비에트 연방과 같은 나라에서 연료가 귀했던 제2차 세계 대전 무렵에 많은 선행 개발이 일어났다. 이들 초기 공정은 주로 산 가수분해에 관한 것이었으며, 이는 조작 및 설계가 복잡했고, 전형적으로 온도, 압력, 및/또는 산 농도와 같은 공정 중의 작은 변동에 민감했다. 이들 초기 공정의 종합적인 논의는 문헌["Production of Sugars from Wood Using High-pressure Hydrogen Chloride", Biotechnology and Bioengineering, Volume XXV, 2757-2773 (1983)]에서 확인된다.
제2차 세계 대전으로부터 1970년대 초반까지의 기간에 풍부한 석유의 공급은 에탄올 전환 연구를 둔화시켰다. 그러나, 1973년의 석유 파동으로 인하여, 연구자들은 목재 및 농업 부산물을 에탄올 생산에 이용하기 위한 공정을 개발하기 위하여 그들의 노력을 증가시켰다. 이들 연구는, 해외 석유 생산에 대한 미국의 의존도를 감소시키고, 연료의 옥탄가를 증가시키며, 환경적 조치로서 배기가스 오염물질을 감소시키기 위한 가솔린 첨가제로서의 에탄올 개발에 있어서 특히 중요했다.
"석유 파동"과 동시에, 미국 환경 보호국(U.S. Environmental Protection Agency)은 납 첨가제의 감소를 요구하는 규제를 공포하였다. 에탄올이 사실상 납의 대체물인 한, 일부 정제공장은 에탄올을 치환물로서 선택하였으며, 이는 고가의 자본 설비 투자 없이 정제공장의 운영에 용이하게 도입되는 그의 역량 때문이다.
수십년 전에 개발된 고압 및 고온 가스 당화 공정은 계속 개선되고 있다. 현재의 새로운 연구는 효소적 전환 공정에 크게 집중하며, 이는 중온성 및 고온성 진균, 효모, 및 박테리아와 같은 다양한 유기체로부터, 셀룰로오스를 발효가능한 당으로 분해하는 효소를 채용한다. 이들 공정에는, 주로 상업화를 위한 그들의 규모 확대 능력 및 에탄올 생성의 효율에 대한 불확실성이 남아 있다.
셀룰로오스 및 헤미셀룰로오스는 광합성에 의해 생성되는 가장 풍부한 식물 재료이다. 그들은 중합체성 기질을 단량체성 당으로 가수분해할 수 있는 효소를 생성시키는 박테리아, 효모, 및 진균을 포함하는 다수의 미생물에 의해 에너지원으로서의 용도로 분해될 수 있다(Aro et al., 2001). 유기체는 종종 그들이 어떤 당을 사용하는지에 관해 제한적이며, 이는 전환 중에 어느 당이 가장 잘 생성되는지를 좌우한다. 비-재생가능한 자원의 한계에 접근함에 따라, 주요 재생가능한 에너지 자원이 될 셀룰로오스의 막대한 잠재력이 인식된다(Krishna et al., 2001). 생물학적 공정을 통한 셀룰로오스의 효과적인 이용은 식품, 원료, 및 연료의 부족을 잠재적으로 극복할 수 있다(Ohmiya et al., 1997).
셀룰라아제는 셀룰로오스(베타-1,4-글루칸 또는 베타 D-글루코시드 결합)를 가수분해하여 글루코스, 셀로바이오스, 셀로올리고당류(cellooligosaccharide) 등의 형성을 유발하는 효소이다. 셀룰라아제는 전통적으로 하기의 3개 주요 부류로 나누어졌다: 엔도글루카나아제(EC 3.2.1.4)("EG"), 엑소글루카나아제 또는 셀로바이오하이드롤라아제(EC 3.2.1.91)("CBH"), 및 베타-글루코시다아제([베타] -D-글루코사이드 글루코하이드롤라아제; EC 3.2.1.21)("BG")(Knowles et al., 1987; Shulein, 1988). 엔도글루카나아제는 셀룰로오스 섬유의 무정형 부분에 주로 작용하는 반면에, 셀로바이오하이드롤라아제는 결정질 셀룰로오스 또한 분해할 수 있다.
기계 펄프의 처리에서(Pere et al., 1996), 원료 첨가제로서의 용도를 위해(WO 91/04673), 그리고 습식 도정(grain wet milling)에서, 셀룰라아제는 또한 셀룰로오스 바이오매스의 에탄올로의 분해에 유용한 것으로 나타났다(여기서 셀룰라아제는 셀룰로오스를 글루코스로 분해하고, 효모 또는 다른 미생물이 글루코스를 에탄올로 추가 발효시킴). 분리 당화 발효(separate saccharification and fermentation)는, 바이오매스, 예를 들어, 옥수수 대(corn stover)에 존재하는 셀룰로오스를 글루코스로 전환시키고, 이어서 효모 균주가 글루코스를 에탄올로 전환시키는 공정이다. 동시 당화 발효(simultaneous saccharification and fermentation)는, 바이오매스, 예를 들어, 옥수수 대에 존재하는 셀룰로오스를 글루코스로 전환시키고, 동시에 동일한 반응기 내에서, 효모 균주가 글루코스를 에탄올로 전환시키는 공정이다. 셀룰로오스의 용이하게 입수가능한 공급원으로부터의 에탄올 생성은, 안정하고 재생가능한 연료 공급원을 제공한다.
셀룰라아제는 다수의 박테리아, 효모, 및 진균에 의해 생성된다. 소정의 진균은 셀룰로오스의 결정질 형태를 분해할 수 있는 완전한 셀룰라아제 시스템(즉, 전체 셀룰라아제)을 생성시킨다. 그러나, 전체 셀룰라아제, 특히 천연적인 것은 효율적인 분해를 반드시 달성하지는 못하는데, 이는 이러한 효율을 위해 필요한 모든 구성요소/활성, 예를 들어, CBH, EG, 및 BG 분류 각각으로부터의 활성을 그것이 포함하지 않을 수 있기 때문이다(Filho et al., 1996). 개별적인 CBH, EG, 및 BG 구성요소 단독으로는 효율적인 가수분해를 일으키지 않지만, EG-유형 셀룰라아제와 CBH- 유형 셀룰라아제의 조합은 상호작용하여 단독으로 사용된 어느 하나의 효소보다 더 효율적으로 셀룰로오스를 분해하는 것으로 공지되어 있다(Wood, 1985; Baker et al., 1994; Nieves et al., 1995).
셀룰라아제는, 세제 조성물의 세정 능력 증진, 유연제로서의 용도, 면직물의 촉감 및 외관 개선 등을 위한 직물의 처리에 유용한 것으로 당업계에 공지되어 있다(Kumar et al., 1997). 개선된 세정 성능을 가지며(미국 특허 제4,435,307호; 영국 출원 제2,095,275호 및 제2,094,826호) 직물의 촉감 및 외관을 개선하기 위해 직물의 처리에 사용하기 위한(미국 특허 제5,648,263호, 제5,691,178호, 및 제5,776,757호, 및 영국 출원 제1,358,599호) 셀룰라아제-함유 세제 조성물이 기재되어 있다.
그러므로, 진균 및 박테리아에서 생성되는 셀룰라아제는 중요한 관심을 받아 왔다. 특히, 트리코더마 종(Trichoderma spp.)(예를 들어, T. 롱지브라치아툼(T. longibrachiatum) 또는 T. 레세이(T. reesei))의 발효는 셀룰로오스의 결정질 형태를 분해할 수 있는 완전한 셀룰라아제 시스템을 생성시키는 것으로 나타났다. 수년에 걸쳐, 전통적인 돌연변이유발, 스크리닝, 선택, 및 고도로 개량된 대규모 저가 발효 조건의 개발에 의해 트리코더마 셀룰라아제 생성이 개선되어 왔다. 트리코더마 종의 다중-구성요소 셀룰라아제 시스템은 셀룰로오스를 글루코스로 가수분해할 수 있는 반면에, 효율적인 셀룰로오스 가수분해를 위한 상이한 특성을 가진 다른 미생물, 특히 박테리아 균주로부터의 셀룰라아제가 존재하며, 산업적 규모의 셀룰라아제 생성을 위해 이들 단백질을 사상 진균에서 발현시키는 것이 유리할 것이다. 그러나, 많은 연구들의 결과는 사상 진균으로부터 박테리아 효소를 발현시키는 수율이 낮다는 것을 입증한다(Jeeves et al., 1991).
글루코스 및 셀로바이오스와 같은 가용성 당은 화학물질 및 생물학적 산물의 생성을 위한 많은 용도를 갖는다. 셀룰로오스 가수분해의 최적화는 더 적은 효소의 사용을 가능하게 하며 가용성 당의 생성을 위한 비용 효율성을 개선하였다.
리그노셀룰로오스계 바이오매스의 발효가능한 당으로의 효율적인 전환은, 비용-효율적이고 환경-친화적인 방식의 바이오에탄올 생성의 핵심이다. 특히 증류를 위한 에너지 및 가공 비용을 감소시키기 위하여, 실행가능한 공정에 의해 생성되는 최소 에탄올 농도는 4%(w/v) 이상이어야 한다. 건조물 고체 함량이 높은 기질을 가공함으로써 이렇게 증가된 에탄올 농도를 달성할 수 있다. 그러나 건조물 함량이 높은 바이오매스의 당화에 연계된 통상의 문제는, 펌핑할 수 없거나 취급 중에 많은 에너지 투입을 필요로 하는 슬러리를 유발하는, 슬러리의 높은 점도이다. 높은 고체 함량의 취급을 처리할 경우, 1) 제한된 물질 전달을 동반하는 불충분한 혼합, 2) 아세트산, 푸르푸랄, 5-하이드록시메틸 푸르푸랄, 페놀계 리그닌 분해와 같은 저해제의 농도 증가, 3) 글루코스, 셀로바이오스, 에탄올과 같은 산물 저해, 및 4) 발효 미생물 생존 능력과 같은 문제가 발생할 것이다. 높은 점도는 공정 내의 건조 물질 수준을 제한하여, 에너지 및 물 소비량을 증가시키고, 분리 효율, 증발 및 열교환, 및 궁극적으로 에탄올 수율을 감소시킨다. 그러므로, 점도의 감소가 유익하며, 효소는 높은 점도를 유발하는 가용성/불용성 화합물의 분해에 있어서 중심 역할을 담당한다.
당화 공정의 점도를 감소시키고/감소시키거나 고체 로딩(solid loading)을 증가시키기 위한 연구가 진행되었다. 예를 들어, 바이오매스 기질 로딩 내의 고체 수준을 증가시키기 위하여 다수의 연구가 유가식 운전(fed-batch operation)을 이용하였다. 중력식 혼합 반응기(gravimetric mixing reactor) 설계가 사용되었으며, 이는 40% 이하의 고체 농도에서 전처리된 밀짚의 회분식 효소적 액화 및 가수분해를 가능하게 하였다. 다량의 기질의 가수분해, 가수분해 중의 상대적으로 낮은 점도, 및 공정 중의 상대적으로 높은 글루코스 농도를 달성하기 위하여, 이러한 유가식 전략은 효소적 가수분해 중에 바이오매스 기질 또는 기질 + 효소를 순차적으로 로딩한다. 대안적으로, 효소의 최적 온도, 예를 들어 50℃에서 소정의 기간 동안 리그노셀룰로오스계 바이오매스의 효소적 예비-가수분해를 실행하여 슬러리의 점도를 감소시킴으로써, 펌핑 및 교반을 가능하게 할 수 있다. 예비-가수분해 중의 점도의 감소는 후속의 발효 또는 SSF를 가능하게 만든다.
다수의 접근법의 개발에도 불구하고, 점도를 감소시키고 바람직한 발효가능한 당의 수율을 개선하기 위한 부가적 방식에 대한 필요성이 당업계에 남아 있다.
특허, 특허 출원, 및 간행물을 포함하는, 본 명세서에 인용된 모든 참고문헌은 전체적으로 참고로 포함된다.
본 개시는, 소정의 엔도글루카나아제 효소(예를 들어, 글리코실 하이드롤라아제 패밀리 61("GH61")/엔도글루카나아제 활성을 갖는 폴리펩티드, 예를 들어 T. 레세이 엔도글루카나아제("Eg4"))를 바이오매스 당화 혼합물에 포함시키는 것이 혼합물의 점도를 실질적으로 감소시킨다는 의외의 발견에 부분적으로 기초한다. 본 개시는 또한, 주어진 바이오매스 기질로부터 당화 및 바람직한 발효가능한 당의 수율을 실질적으로 개선하기 위해 이러한 효소(들)를 포함시키는 것에 관한 것이다.
본 명세서에는, 글리코실 하이드롤라아제 패밀리 61("GH61")/ 엔도글루카나아제 활성을 갖는 폴리펩티드가 제공된다. "GH61/엔도글루카나아제 활성"은, 폴리펩티드가 GH61 활성 및/또는 엔도글루카나아제 활성을 갖는다는 것을 의미한다. 일부 태양에서, 폴리펩티드는 단리된다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 다양한 종으로부터의 GH61 엔도글루카나아제 또는 엔도글루카나아제 IV("EG IV"), 또는 GH61 엔도글루카나아제에 상응하는(예를 들어, 그것과 상동성을 공유하고/하거나, 작용성 도메인을 공유하고/하거나, GH61 모티프(들)를 공유하고/하거나, 보존적 잔기를 공유하는) 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드)이다. 이러한 종은 트리코더마, 휴미콜라(Humicola), 푸사리움(Fusarium), 아스페르길루스(Aspergillus), 뉴로스포라(Neurospora), 페니실리움(Penicillium), 세팔로스포리움(Cephalosporium), 아클리아(Achlya), 포도스포라(Podospora), 엔도티아(Endothia), 무코르(Mucor), 코클리오볼루스(Cochliobolus), 피리쿨라리아(Pyricularia), 크리소스포리움(Chrysosporium), 아스페르길루스 아와모리(Aspergillus awamori), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 포에티두스(Aspergillus foetidus), 아스페르길루스 자포니쿠스(Aspergillus japonicus), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 오리제(Aspergillus oryzae), 크리소스포리움 루크노엔스(Chrysosporium lucknowense), 푸사리움 박트리디오이데스(Fusarium bactridioides), 푸사리움 세레알리스(Fusarium cerealis), 푸사리움 크루크웰렌스(Fusarium crookwellense), 푸사리움 컬모룸(Fusarium culmorum), 푸사리움 그라미네아룸(Fusarium graminearum), 푸사리움 그라미눔(Fusarium graminum), 푸사리움 헤테로스포룸(Fusarium heterosporum), 푸사리움 네군디(Fusarium negundi), 푸사리움 옥시스포룸(Fusarium oxysporum), 푸사리움 레티쿨라툼(Fusarium reticulatum), 푸사리움 로제움(Fusarium roseum), 푸사리움 삼부치눔(Fusarium sambucinum), 푸사리움 사르코크로움(Fusarium sarcochroum), 푸사리움 스포로트리키오이데스(Fusarium sporotrichioides), 푸사리움 설푸리움(Fusarium sulphureum), 푸사리움 토룰로섬(Fusarium torulosum), 푸사리움 트리코테치오이데스(Fusarium trichothecioides), 푸사리움 베네나툼(Fusarium venenatum), 브제르칸데라 아두스타(Bjerkandera adusta), 세리포리옵시스 아네이리나(Ceriporiopsis aneirina), 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아(Ceriporiopsis caregiea), 세리포리옵시스 길베센스(Ceriporiopsis gilvescens), 세리포리옵시스 판노신타(Ceriporiopsis pannocinta), 세리포리옵시스 리불로사(Ceriporiopsis rivulosa), 세리포리옵시스 서브루파(Ceriporiopsis subrufa), 세리포리옵시스 서브베르미스포라(Ceriporiopsis subvermispora), 코프리누스 시네레우스(Coprinus cinereus), 코리올루스 히르수투스(Coriolus hirsutus), 휴미콜라 인솔렌스(Humicola insolens), 휴미콜라 라누기노사(Humicola lanuginosa), 무코르 미에헤이(Mucor miehei), 마이셀리오프토라 테르모필라(Myceliophthora thermophila), 뉴로스포라 크라사(Neurospora crassa), 뉴로스포라 인터미디아(Neurospora intermedia), 페니실리움 푸르푸로게눔(Penicillium purpurogenum), 페니실리움 카네센스(Penicillium canescens), 페니실리움 솔리툼(Penicillium solitum), 페니실리움 푸니쿨로섬(Penicillium funiculosum) 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 플레비아 라디아테(Phlebia radiate), 플레우로투스 에린기(Pleurotus eryngii), 탈라로마이세스 플라부스(Talaromyces flavus), 티엘라비아 테레스트리스(Thielavia terrestris), 트라메테스 빌로사(Trametes villosa), 트라메테스 베르시콜로르(Trametes versicolor), 트리코더마 하르지아눔(Trichoderma harzianum), 트리코더마 코닌기(Trichoderma koningii), 트리코더마 롱지브라치아툼, 트리코더마 레세이, 트리코더마 비리데(Trichoderma viride), 지오스미티아 에메르소니(Geosmithia emersonii), 또는 G. 스테아로테르모필루스(G. stearothermophilus)를 포함한다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 본 개시의 도 1에 나타낸 아미노산 서열을 가진 폴리펩티드로 구성된 군으로부터 선택된 GH61 엔도글루카나아제이다. 예를 들어, 적합한 GH61 엔도글루카나아제는 그들의 젠뱅크(GenBank) 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움(S. thermophilum) 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스(A. fumigatus) Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), A. 푸미가투스 Afu6g09540으로부터의 NCBI Ref: XP_750843.1의 엔도글루카나아제, A. 푸미가투스 EDP47167의 엔도글루카나아제, T. 테레스트리스(T. terrestris) 16380의 엔도글루카나아제, T. 테레스트리스 155418의 엔도글루카나아제, T. 테레스트리스 68900의 엔도글루카나아제, C. 글로보섬(C. globosum)으로부터의 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293으로부터의 젠뱅크 등록: XP_752040을 가진 엔도글루카나아제로 명명되는 것들을 포함한다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열 동일성을 갖는 아미노산 서열을 포함한다. 소정의 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로 구성된 군으로부터 선택된 하나 이상의 서열 모티프(들)를 포함하는 아미노산 서열을 포함한다. 일부 실시 형태에서, 폴리펩티드는 길이가 약 100개 이상(예를 들어, 적어도 약 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 240개, 또는 그 이상)의 아미노산 잔기이다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는, 예를 들어, 도 1에 열거된 것들로부터 선택된 것과 같은 GH61 엔도글루카나아제의 변종이다. 적합한 폴리펩티드는, 예를 들어, 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 또는 EAA29347.1, 또는 S. 테르모필리움 24630의 St61, S. 테르모필리움 23839c의 St61A, S. 테르모필리움 46583의 St61B, S. 테르모필리움 80312의 St61D, A. 푸미가투스 Afu3g03870의 Afu61a(NCBI Ref: XP_748707), A. 푸미가투스 Afu6g09540의 효소(NCBI Ref: XP_750843.1), A. 푸미가투스 EDP47167의 효소, T. 테레스트리스 16380의 효소, T. 테레스트리스 155418의 효소, T. 테레스트리스 68900의 효소, 및 C. 글로보섬 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293의 효소(젠뱅크 등록: XP_752040을 가짐)를 포함한다. 일부 태양에서, GH61/. 엔도글루카나아제 활성을 갖는 폴리펩티드는, 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 효소의 변종이다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는,: (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로부터 선택된 하나 이상의 서열 모티프를 포함하는, 길이가 약 100개 이상(예를 들어, 적어도 약 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 240개 이상)의 아미노산 잔기인 효소의 변종일 수 있다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 GH61 엔도글루카나아제의 변종일 수 있으며, 여기서 변종은 서열 번호 1 내지 18 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상)의 동일성을 갖는 아미노산 서열을 갖는다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, GH61 엔도글루카나아제의 변종을 포함하는 단리된 폴리펩티드)는 엔도글루카나아제 활성을 갖는다. 변종은 서열 번호 84 내지 91로부터 선택된 하나 이상의 모티프(1, 2, 3, 4, 5, 6, 7, 또는 8개 이상의 모티프)를 포함할 수 있다. 본 개시의 목적상, 효소는 그들의 작용성에 의해 지칭될 수 있다. 예를 들어, 엔도글루카나아제 폴리펩티드는 또한, 엔도글루카나아제 활성을 갖는 폴리펩티드로 지칭될 수 있으며, 그 역도 성립한다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로부터 선택된 하나 이상의 서열 모티프(들)를 포함한다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(변종을 포함함)는 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함한다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함한다.
본 명세서에는 또한, EG IV 폴리펩티드의 변종이 제공된다. 예를 들어, 이러한 변종은 서열 번호 1 내지 29 및 148 중 어느 하나, 또는 그의 성숙한 폴리펩티드에 대한 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열 동일성을 가질 수 있다. 예를 들어, 본 명세서에는 T. 레세이 Eg4 폴리펩티드의 변종이 제공된다. 이러한 변종은 서열 번호 27의 잔기 22 내지 344에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 서열 동일성을 가질 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 단리된다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 엔도글루카나아제 활성을 갖는다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232 중 약 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 또는 12개 중 임의의 것 이상)에 상응하는 잔기, 또는 다른 폴리펩티드 중 임의의 것 내의 임의의 상응하는 보존된 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232에 상응하는 잔기를 포함한다. 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343 중 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 중 임의의 것 이상)에 상응하는 잔기를 포함할 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343에 상응하는 잔기를 포함한다. 폴리펩티드 또는 그의 변종은 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함할 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함한다.
본 명세서에는 또한, 본 명세서의 폴리펩티드 중 어느 하나를 암호화하는 핵산 또는 폴리뉴클레오티드가 제공된다. 예를 들어, 본 개시는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열 동일성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 제공한다. 예를 들어, 본 개시는 서열 번호 30에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 동일성을 갖는 단리된 핵산을 본 명세서에 제공한다. 상기 핵산을 포함하는 발현 카세트, 벡터, 및 세포 또한 제공된다.
본 명세서에는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물(예를 들어, 비-천연 조성물) 또한 제공된다. 일부 태양에서, 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 전체 셀룰라아제를 포함한다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드는, 예를 들어, T. 레세이 엔도글루카나아제 IV("T. 레세이 Eg4") 또는 그의 변종이다. T. 레세이 Eg4의 변종은 본 명세서에 제공된 변종 중 임의의 것일 수 있다.
일부 태양에서, 효소 조성물은 셀룰라아제 조성물이다. 효소 조성물은 하나 이상의 헤미셀룰라아제를 추가로 포함할 수 있으므로, 또한 헤미셀룰라아제 조성물일 수 있다. 일부 태양에서, 효소 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 셀룰라아제 폴리펩티드(들)를 포함한다. 일부 태양에서, 하나 이상의 셀룰라아제 폴리펩티드는 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드, 또는 β-글루코시다아제 활성을 갖는 폴리펩티드이다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 헤미셀룰라아제 폴리펩티드(들)를 추가로 포함한다. 일부 태양에서, 하나 이상의 헤미셀룰라아제 폴리펩티드는 자일라나아제 활성을 갖는 폴리펩티드, β-자일로시다아제 활성을 갖는 폴리펩티드, 또는 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드, 또는 조합된 자일라나아제/β-자일로시다아제 활성, 조합된 β-자일로시다아제/L-α-아라비노푸라노시다아제 활성, 또는 조합된 자일라나아제/ L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드이다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 셀룰라아제 폴리펩티드(들) 및 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 헤미셀룰라아제 폴리펩티드(들)를 포함한다.
일부 태양에서, 효소 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하며 엔도글루카나아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, β-글루코시다아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, 자일라나아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, β-자일로시다아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, 및/또는 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드를 추가로 포함한다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함한다. 일부 태양에서, 조성물은 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 추가로 포함한다. 일부 태양에서, 조성물은 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레(S. thermophile) 6A, 6B, 또는 그의 변종)를 추가로 포함한다. 일부 태양에서, 조성물은 GH61 효소(예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종) 이외의 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드를 추가로 포함한다.
조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있다. 조성물 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드, 및 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함할 수 있다.
본 명세서에 기재된 조성물 중 어느 하나는 전체 셀룰라아제를 포함할 수 있다. 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 전체 셀룰라아제를 포함하는 조성물이 제공된다. 대안적으로, 전체 셀룰라아제 + GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물이 제공된다. 일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드, 및 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드 이외의 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드, 및 β-글루코시다아제 활성을 갖는 폴리펩티드를 포함하는 조성물이 제공된다. 조성물은 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함한다. 예를 들어, 조성물은 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드, 및/또는 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종), 및 전체 셀룰라아제를 포함할 수 있다. 일부 태양에는, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종), 및 헤미셀룰라아제 활성을 갖는 하나 이상의 다른 폴리펩티드를 포함하는 조성물이 제공된다.
일부 태양에서, 전체 셀룰라아제는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 아닌 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종)를 포함한다. 전체 셀룰라아제는 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있다. 전체 셀룰라아제는 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있다.
일부 태양에서, 본 명세서에 기재된 조성물 중 어느 하나에서, 엔도글루카나아제 활성을 갖지만 GH61/엔도글루카나아제 활성을 갖는 것은 아닌 하나 이상의 폴리펩티드는, 예를 들어, T. 레세이 EG1(또는 그의 변종) 및/또는 T. 레세이 EG2(또는 그의 변종)이다. 일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종이다. 일부 태양에서, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, 및/또는 Tn3B, 또는 그의 변종이다. 일부 태양에서, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, 및/또는 AfuXyn5, 또는 그의 변종이다. 일부 태양에서, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, 제1군(Group 1) β-자일로시다아제 또는 제2군(Group 2) β-자일로시다아제이며, 여기서 제1군 β-자일로시다아제는 Fv3A, Fv43A 폴리펩티드, 또는 그의 변종일 수 있고, 제2군 β-자일로시다아제는 Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1 폴리펩티드, 또는 그의 변종일 수 있다. 일부 태양에서, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, Fv3A(또는 그의 변종) 및/또는 Fv43D(또는 그의 변종)이다. 일부 태양에서, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Af43A, Fv43B, Pf51A, Pa51A, 및/또는 Fv51A, 또는 그의 변종일 수 있다.
일부 태양에는, GH61/ 엔도글루카나아제 활성을 갖는 단리된 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물이 제공된다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 숙주 세포에 의해 발현되며, 여기서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 핵산이 숙주 세포 내로 조작되어 있다. 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 숙주 세포에 의해 발현되며, 그 폴리펩티드를 암호화하는 핵산은 숙주 세포에 대해 이종성이다.
일부 태양에는, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고, 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하는 조성물이 제공되며, 여기서 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 의해 발현되고, 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 대해 이종성이다. 일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하는 조성물이 제공되며, 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 의해 발현되고, 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 대해 내인성이다. 일부 태양에서, 셀룰라아제 폴리펩티드는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드와는 상이한 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종), 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종), 또는 β-글루코시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함한다. 일부 태양에서, 헤미셀룰라아제 폴리펩티드는 자일라나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종), β-자일로시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종), 또는 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함한다.
일부 태양에서, 조성물은 발효 브로스로부터 제조된다. 일부 태양에서, 조성물은 통합 균주(integrated strain)(예를 들어, 본 명세서에서 실시예에 기재된 바와 같은 H3A/Eg4, #27)의 발효 브로스로부터 제조되며, 여기서 GH61 엔도글루카나아제 유전자는 숙주 균주의 유전 물질 내로 통합된다. 일부 태양에서, 조성물은 균주의 발효 브로스로부터 제조되며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 암호화하는 핵산은 숙주 세포에 대해 이종성이고, 여기서 GH61 엔도글루카나아제는, 예를 들어, 균주 내로 통합되거나, 숙주 균주 내로 도입된 벡터에 의해 발현된다.
GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 본 명세서에 제공된 조성물 또는 방법 중 어느 하나는 전체 셀룰라아제일 수 있다. 조성물은 최소 생성 후 가공(post-production processing)(예를 들어, 정제, 여과, 세포 살해 단계(cell kill step), 및/또는 한외여과 등)이 적용되는 발효 브로스일 수 있으며, 전체 브로스 제형으로서 사용된다.
일부 태양에는, T. 레세이 Eg4, T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, 및 Fv51A, 또는 그들 각각의 변종을 포함하는 조성물(예를 들어, 비-천연 조성물)이 제공된다. 조성물은 전체 셀룰라아제일 수 있다. 조성물은 최소 생성 후 가공(예를 들어, 여과, 정제, 한외여과, 세포-살해 단계 등)이 적용되는 발효 브로스일 수 있으며, 따라서 전체 브로스 제형으로서 사용된다. 일부 태양에서, 조성물은 단리된 T. 레세이 Eg4 또는 그의 변종을 포함한다. 일부 태양에서, 조성물은 단리된 T. 레세이 Bgl1, 단리된 T. 레세이 xyn3, 단리된 Fv3A, 단리된 Fv43D, 및 단리된 Fv51A 중 하나 이상을 포함한다. 예를 들어, 정제되거나 단리된 폴리펩티드의 단순 첨가 또는 혼합에 의해 상기 폴리펩티드 중 임의의 것을 조성물 내로 도입할 수 있다. 대안적으로, 적합한 재조합 기술을 사용하여 본 명세서의 폴리펩티드가 숙주 균주에 의해 발현될 수 있으며, 소정의 상기 폴리펩티드는 숙주 세포 내에서 그들의 천연 수준에 비교하여 과발현되거나 저발현될 수 있다. 일부 태양에서, 상기 폴리펩티드 중 어느 하나를 암호화하는 유전자는 숙주 균주 내로 통합될 수 있다. 일부 태양에서, 본 개시의 조성물은 숙주 균주의 발효 브로스로부터 제조된다. 일부 태양에서, 조성물은 통합 균주(예를 들어, 본 명세서에서 실시예에 기재된 바와 같은 H3A/Eg4, #27)의 발효 브로스로부터 얻어진다. 일부 실시 형태에서, 발효 브로스에는 최소 생성 후 가공이 적용되며, 전체 브로스 제형으로서 사용된다. 일부 태양에서, GH61 엔도글루카나아제를 암호화하는 핵산은 숙주 세포에 대해 이종성이다. 일부 태양에서, T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, 또는 Fv51A를 암호화하는 하나 이상의 핵산은 본 발명의 GH61 엔도글루카나아제를 발현시키는 숙주 세포에 대해 이종성이다. 일부 태양에서, T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, 또는 Fv51A를 암호화하는 하나 이상의 핵산은 GH61 엔도글루카나아제를 발현시키는 숙주 세포에 대해 내인성이다.
GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는, 그 안의 효소적 구성요소 또는 다른 구성요소의 유형 및 농도의 관점에서 유사하나 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(들)가 없는 대조군 효소 조성물 또는 대조군 바이오매스 당화 혼합물에 의해 달성되는 수율에 비교하여, 바이오매스 재료의 가수분해로부터의 발효가능한 당(들)의 수율을 증가시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상 만큼) 충분한 양으로 효소 조성물 또는 바이오매스 당화 혼합물 내에 존재할 수 있다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드는, 그 안의 효소적 구성요소 또는 다른 구성요소의 유형 및 농도의 관점에서 유사하나 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없는 대조군 혼합물의 점도에 비교하여, 그 안의 바이오매스 재료의 가수분해 중에 바이오매스 당화 혼합물의 점도를 감소시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상 만큼) 충분한 양으로 효소 조성물 또는 바이오매스 당화 혼합물 내에 존재할 수 있다. 일부 태양에서, 효소 조성물 또는 바이오매스 당화 혼합물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드를, 폴리펩티드가 접촉되는 바이오매스 재료의 가수분해를 유발하기에 충분한 총량으로 포함한다. 효소 조성물 또는 바이오매스 당화 혼합물은 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드, 및/또는 전체 셀룰라아제, 또는 그의 혼합물을, 폴리펩티드가 접촉되는 바이오매스 재료의 가수분해를 유발하기에 충분한 총량으로 추가로 포함할 수 있다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 효소 조성물 또는 바이오매스 당화 혼합물내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 0.5 중량% 내지 약 30 중량%, 약 1 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 20 중량%, 약 7 중량% 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)인 양으로 존재한다. 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 8 중량%, 약 10 중량%, 또는 약 12 중량%인 양으로 존재한다. 효소 조성물 또는 바이오매스 당화 혼합물은 GH61/ 엔도글루카나아제 활성을 갖는 하나 초과의 폴리펩티드를 포함할 수 있다. 예를 들어, 효소 조성물 또는 바이오매스 당화 혼합물은 T. 레세이 Eg4 또는 그의 변종과 더불어 T. 레세이 Eg7(또는 그의 변종)을 포함할 수 있으며, 여기서 GH61/엔도글루카나아제(Eg4 + Eg7) 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 0.5 중량% 내지 약 30 중량%, 약 2 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 20 중량%, 약 7 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%)이다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(들)는 숙주 세포에 대해 이종성이거나 내인성인 폴리뉴클레오티드로부터 발현될 수 있다. 대안적으로, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입될 수 있다.
일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)는 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 80 중량%(예를 들어, 약 5 중량% 내지 약 70 중량%, 약 10 중량% 내지 약 60 중량%, 약 20 중량% 내지 약 50 중량%, 또는 약 25 중량% 내지 약 50 중량%)인 양으로 존재한다. 효소 조성물 또는 바이오매스 당화 혼합물은 셀로바이오하이드롤라아제 활성을 갖는 하나 초과의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있으며, 여기서 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 80 중량%(예를 들어, 약 5 중량% 내지 약 70 중량%, 약 10 중량% 내지 약 60 중량%, 약 20 중량% 내지 약 50 중량%, 또는 약 25 중량% 내지 약 50 중량%)이다. 일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현된다. 일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입될 수 있다.
효소 조성물 또는 바이오매스 당화 혼합물은 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있으며, 여기서 β-글루코시다아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 1 중량% 내지 약 30 중량%, 약 2 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%)이다. β-글루코시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 대안적으로, β-글루코시다아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입될 수 있다.
일부 태양에서, 효소 조성물 또는 바이오매스 당화 혼합물은 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함할 수 있으며, 여기서 자일라나아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 1 중량% 내지 약 40 중량%, 약 4 중량% 내지 약 30 중량%, 약 5 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%)이다. 자일라나아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 일부 태양에서, 자일라나아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입되거나 혼합될 수 있다.
효소 조성물 또는 바이오매스 당화 혼합물은 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함할 수 있으며, 여기서 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 1 중량% 내지 약 40 중량%, 약 2 중량% 내지 약 30 중량%, 약 4 중량% 내지 약 20 중량%, 또는 약 5 중량% 내지 약 15 중량%)이다. L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 일부 태양에서, L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입되거나 혼합될 수 있다.
효소 조성물 또는 바이오매스 당화 혼합물은 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어,Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)를 포함할 수 있으며, 여기서 β-자일로시다아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 1 중량% 내지 약 40 중량%, 약 4 중량% 내지 약 35 중량%, 약 5 중량% 내지 약 25 중량%, 또는 약 5 중량% 내지 약 20 중량%)이다. β-자일로시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 대안적으로, β-자일로시다아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입될 수 있다.
일부 태양에서, 본 명세서에 제공되는 효소 조성물은 전체 셀룰라아제일 수 있다. 전체 셀룰라아제는, 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Eg4, Eg1, Eg2, Eg7, 또는 그의 변종과 같은 것)를 포함할 수 있다. 전체 셀룰라아제는 또한, 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있다. 전체 셀룰라아제는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 추가로 포함할 수 있다. 전체 셀룰라아제는 숙주 세포의 발효 브로스의 형태로 사용될 수 있다. 브로스에는, 예를 들어, 여과, 정제, 한외여과, 세포-살해 단계 등을 포함하는 최소 생성 후 가공이 적용될 수 있으며, 따라서 브로스를 전체 브로스 제형으로 바이오매스 가수분해에 사용할 수 있다.
일부 태양에서, 본 명세서에 제공되는 효소 조성물은 바이오매스 재료를 발효가능한 당(들)(예를 들어, 글루코스, 자일로스, 아라비노스, 및/또는 셀로바이오스)으로 전환시킬 수 있다. 일부 태양에서, 효소 조성물은 본 명세서에 기재된 칼코플루오르 어세이(calcofluor assay)에 의해 결정할 때 약 0.1 이상(예를 들어, 0.1 내지 0.4)의 산물 분율(fraction product)을 달성할 수 있다.
일부 태양에서, 효소 조성물은 셀룰라아제 조성물 또는 헤미셀룰라아제 조성물일 수 있다. 효소 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함할 수 있고, 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함할 수 있으며, 여기서 GH61/엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드 및 하나 이상의 셀룰라아제 폴리펩티드, 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는, 바이오매스 당화 혼합물 내의 바이오매스 기질과 접촉시켜 가수분해하기 위해 혼합물을 사용하기 전에 혼합물 내로 블렌딩된다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드, 하나 이상의 셀룰라아제 폴리펩티드, 및 하나 이상의 헤미셀룰라아제 폴리펩티드는, 상이한 시간에 바이오매스 재료에 첨가된다. 예를 들어, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드는, 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드가 바이오매스 재료에 첨가되기 전 또는 후에 동일한 바이오매스 재료에 첨가된다.
일부 태양에서, 본 발명의 조성물은 GH61/엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드 및 바이오매스 재료를, 예를 들어, 혼합물 내에 포함한다. 예를 들어, 조성물은 가수분해 혼합물, 발효 브로스/혼합물, 또는 바이오매스 당화 혼합물일 수 있다. 혼합물은 하나 이상의 발효가능한 당(들)을 포함할 수 있다.
본 명세서에는 또한, 생성되는 바이오매스 당화 혼합물 내의 바이오매스 재료를 가수분해하기에 충분한 양으로 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물(예를 들어, 비-천연 조성물)과 바이오매스 재료를 접촉시키는 단계를 포함하는, 바이오매스 재료를 가수분해하는 방법이 제공된다.
본 명세서에는 또한, 혼합물의 점도를 감소시키기에 충분한 양으로 조성물 내에 존재하는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물(예를 들어, 비-천연 조성물)과 혼합물을 접촉시키는 단계를 포함하는, 바이오매스 혼합물, 및/또는 바이오매스 당화 혼합물의 점도를 감소시키는 방법이 제공된다. 일부 태양에서, 바이오매스 혼합물 또는 바이오매스 당화 혼합물은 바이오매스 재료, 임의로 또한 발효가능한 당(들), 전체 셀룰라아제, 및/또는 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물을 포함한다. 혼합물의 점도는, 혼합물에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없는 점을 제외하고는 동일한 구성요소를 동일한 농도로 포함하는 대조군 혼합물의 점도에 비교하여 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상) 만큼 감소될 수 있다. 바이오매스 재료는 헤미셀룰로오스, 셀룰로오스, 또는 그의 혼합물을 포함할 수 있다. 바이오매스 재료는 글루칸, 자일란 및/또는 리그닌, 또는 그의 혼합물을 포함할 수 있다.
일부 태양에서는, 바이오매스 재료를 산 또는 염기로 적합하게 처리하거나 전처리할 수 있다. 일부 태양에서, 염기는 암모니아이다. 본 발명의 방법은 바이오매스 혼합물의 pH를 약 4.0 내지 약 6.5의 pH(예를 들어, 약 4.5 내지 약 5.5의 pH)로 조정하는 단계를 추가로 포함할 수 있다. 일부 태양에서, 본 방법은 약 4.0 내지 약 6.5의 pH(예를 들어, 약 4.5 내지 약 5.5의 pH)에서 수행된다. 일부 태양에서, 약 2 h 내지 약 7 d(예를 들어, 약 4 h 내지 약 6 d, 약 8 h 내지 약 5 d, 또는 약 8 h 내지 약 3 d) 동안 수행된다. 이러한 pH 조정은 바이오매스 혼합물을 폴리펩티드 또는 효소 조성물과 접촉시키기 전에 적합하게 실행될 수 있다.
일부 태양에서, 바이오매스 재료는 당화 혼합물 내에 높은 고체 수준으로 존재하며, 예를 들어, 그의 고체 상태의 바이오매스 재료는 당화 혼합물 내의 효소 + 바이오매스 재료의 총 중량의 약 5 중량% 내지 약 60 중량% 이상(예를 들어, 약 10 중량% 내지 약 50 중량%, 약 15 중량% 내지 약 40 중량%, 약 15 중량% 내지 약 30 중량%, 또는 약 20 중량% 내지 약 30 중량%)을 구성한다. 그의 고체 상태의 바이오매스 재료의 중량은, 그의 건조 상태, 그의 건조 고체 상태, 그의 자연적 상태, 또는 그의 가공되지 않은 상태, 또는 바이오매스가 효소 조성물 내의 폴리펩티드와 접촉되기 전의, 바이오매스 재료의 중량을 의미한다. 바람직하게는, 그의 고체 상태의 바이오매스 재료는 당화 혼합물 내의 효소 + 바이오매스 재료의 총 중량의 약 15 중량% 이상, 더욱 더 바람직하게는 약 20 중량% 또는 25 중량% 이상을 구성한다.
일부 태양에서, 본 방법은 발효가능한 당(들)을 생성시키는 단계를 포함한다. 본 발명의 방법을 사용하여 발효가능한 당(들)의 양을 증가된 수준으로 생성시킬 수 있다. 예를 들어, 본 명세서의 방법 또는 조성물을 사용하여 생성시킨 발효가능한 당(들)의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없다는 점을 제외하고는 동일한 폴리펩티드 구성요소를 동일한 농도로 포함하는 효소 조성물에 의해 동일한 바이오매스 재료가 가수분해될 경우에 생성되는 발효가능한 당(들)의 양에 비교하여 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상) 만큼 증가된다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없다는 점을 제외하고는 동일한 구성요소를 동일한 농도로 갖는 효소 조성물에 의한 동일한 바이오매스 재료로부터의 발효가능한 당(들)의 수율에 비교하여, 발효가능한 당(들)의 수율을 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상) 만큼 증가시키기에 충분하다. 일부 태양에서, 바이오매스 당화 혼합물 내의 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없다는 점을 제외하고는 동일한 바이오매스 및 동일한 패널의 폴리펩티드를 동일한 농도로 포함하는 대조군 바이오매스 당화 혼합물의 점도에 비교하여, 혼합물의 점도를 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상) 만큼 감소시키기에 충분하다.
일부 태양에서, 당화 또는 가수분해 공정에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물의 양은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.1 mg 내지 약 50 mg 단백질(예를 들어, 약 0.2 mg 내지 약 40 mg 단백질, 약 0.5 mg 내지 약 30 mg 단백질, 약 1 mg 내지 약 20 mg 단백질, 또는 약 5 mg 내지 약 15 mg 단백질)이다. 본 명세서에 기재된 단백질 양은 효소 조성물 또는 바이오매스 당화 혼합물 내의 총 단백질의 중량을 지칭한다. 단백질은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하며 셀룰라아제 폴리펩티드(들) 및/또는 헤미셀룰라아제 폴리펩티드(들)와 같은 다른 효소를 포함할 수 있다. 일부 태양에서, 가수분해 또는 당화 공정에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 1 mg 내지 약 5 mg)의 단백질이다.
가수분해 또는 당화 공정에서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Eg1, T. 레세이 Eg2, 및/또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 1 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.
가수분해 또는 당화 공정에서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드 및 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 1 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.
일부 태양에서, 가수분해 또는 당화 공정에서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 0.5 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.
가수분해 또는 당화 공정에서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 약 0.5 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.
가수분해 또는 당화 공정에 사용되는 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 및/또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 0.5 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.
가수분해 또는 당화 공정에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 및/또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 0.5 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.
일부 태양에서, 본 발명의 방법은 약 30℃ 내지 약 65℃(예를 들어, 약 35℃ 내지 약 60℃, 약 40℃ 내지 약 60℃, 또는 약 45℃ 내지 약 55℃)의 온도에서 수행된다.
본 발명의 방법은 바이오매스 재료를 전체 셀룰라아제를 포함하는 효소 조성물과 접촉시키는 단계를 추가로 포함할 수 있다. 일부 태양에서, 바이오매스 재료를 전체 셀룰라아제를 포함하는 조성물과 추가로 접촉시키는 단계는, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물과 접촉시키는 단계 전에, 그 후에, 또는 그와 동시에 수행된다.
일부 태양에서, 본 발명의 방법은 바이오매스 재료를 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물과 접촉시키는 단계를 추가로 포함한다. 바이오매스 재료를 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물과 접촉시키는 단계는, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물과 접촉시키는 단계 전에, 그 후에, 또는 그와 동시에 수행될 수 있다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는, 바이오매스 재료에 접촉시키기 위해 혼합물을 사용하기 전에 혼합물 내로 블렌딩된다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는, 상이한 시간에 바이오매스 재료에 첨가된다. 예를 들어, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는, 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 첨가하기 전 또는 후에 첨가된다.
일부 태양에서는, 산업적 설정 및/또는 상업적 설정 양자 모두에서 본 발명을 응용하는 방법을 고려한다. 따라서, 적합한 GH61 엔도글루카나아제를 포함하는 본 조성물을 제조하거나, 시판하거나, 달리 상업화하는 방법 또는 방법은 본 개시의 범위 내에 있다. 본 방법은, 예를 들어, 조성물 또는 GH61 엔도글루카나아제 폴리펩티드 또는 그의 변종의 상업용 효소 공급 모델에서의 응용을 포함하며, 여기서 효소 및 변종은 본 발명의 조성물과 더불어 셀룰로오스계 당 제조사, 소정의 에탄올(바이오에탄올) 정제공장, 또는 다른 생화학물질 또는 생물재료 제조업체에 공급되거나 판매된다. 일부 태양에서 본 방법은 또한, 조성물 또는 GH61 엔도글루카나아제 폴리펩티드 또는 그의 변종의 현장 생물정제 모델에서의 응용일 수 있으며, 여기서 본 발명의 폴리펩티드 또는 변종, 또는 비-천연 셀룰라아제 및 헤미셀룰라아제 조성물은 셀룰로오스계 당 공장, 바이오에탄올 정제공장, 또는 생화학물질/생물재료 제조업체에, 또는 그 부근에 위치하는 현장에서 효소 제조업체에 의해 구축된 효소 생산 시스템에 의해 생산된다. 일부 태양에서, 바람직하게는 본 명세서에 기재된 바와 같이 적절한 전처리를 적용하는 적합한 바이오매스 기질은, 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조 설비에서, 또는 그 부근에서 본 명세서의 당화 방법 및 효소 및/또는 효소 조성물을 사용하여 가수분해할 수 있다. 이어서, 생성되는 발효가능한 당에 동일한 설비 또는 부근의 설비에서 발효를 적용할 수 있다.
본 명세서에 기재된 실시 형태의 특성 중 하나, 일부, 또는 전부를 조합하여 본 발명의 다른 실시 형태를 형성할 수 있음이 이해되어야 한다. 본 발명의 이들 태양 및 다른 태양은 당업자에게 자명해질 것이다.
도면의 간단한 설명
도면은 단지 예시를 목적으로 하며, 어떤 방식으로든 본 교시의 범주를 제한하고자 하는 것이 아님을, 당업자는 이해할 것이다.
<도 1>
도 1: GH61/엔도글루카나아제 활성을 갖는 다양한 폴리펩티드의 소정의 아미노산 서열을 도시한다.
<도 2>
도 2: 도 1(서열 번호 1 내지 28)에 제공된 것들과 같은, GH61/엔도글루카나아제 활성을 갖는 다양한 폴리펩티드의 다수의 아미노산 서열을 비교하는 클러스탈V(ClustalV)(PAM250)를 사용하여 퍼센트 동일성 및 상이성(divergence)을 도시한다.
<도 3>
도 3: 도 1(서열 번호 1 내지 28)에 제공된 것들과 같은 GH61/엔도글루카나아제 활성을 갖는 다양한 폴리펩티드의 정렬을 도시한다.
<도 4a 내지 4b>
도 4a 내지 4b: 도 4a는 T. 레세이 Eg4(서열 번호 30)의 뉴클레오티드 서열을 도시한다. 도 4b는 T. 레세이 Eg4(서열 번호 27)의 아미노산 서열을 도시한다. 예상되는 신호 서열은 밑줄로, 예상되는 보존된 도메인은 굵은체로, 그리고 예상되는 링커는 이탤릭체로 표시되어 있다.
<도 5>
도 5: T. 레세이 Eg4(TrEG4)(서열 번호 27)과 T. 레세이 Eg7(TrEG7, 또는 TrEGb)(서열 번호 26) 및 TtEG(서열 번호 29)의 아미노산 서열 정렬을 도시한다.
<도 6a 내지 6b>
도 6a 내지 6b: 도 6a는, 서열 정렬 및 TrEG7(프로틴 데이터 뱅크(Protein Data Bank) 등록: pdb:2vtc에서의 결정 구조) 및 TtEG(프로틴 데이터 뱅크 등록: pdb:3EII에서의 결정 구조)의 공지 구조로부터 추론된, T. 레세이 Eg4(TrEg4)의 보존된 잔기를 제공한다. 도 6b는, Tr6A 및 Tr7A의 공지 서열과의 서열 정렬로부터 추론된 보존된 CBM 도메인 잔기를 제공한다.
<도 7>
도 7은 다수의 GH61 엔도글루카나아제의 아미노산 서열 모티프를 열거한다. 서열 모티프 내의 각각의 "a"는, 알라닌, 알지닌, 아스파라긴, 아스파르트산, 시스테인, 글루탐산, 글루타민, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 타이로신, 또는 발린 중 어느 하나일 수 있는 아미노산을 나타낸다.
<도 8a 내지 8i>
도 8a 내지 8i: 도 8a는 pENTR-TOPO-Bgl1-943/942 플라스미드를 도시한다. 도 8b는 pTrex3g 943/942 발현 벡터를 도시한다. 도 8c는 pENTR/ T. 레세이 Xyn3 플라스미드를 도시한다. 도 8d는 pTrex3g/T. 레세이 Xyn3 발현 벡터를 도시한다. 도 8e는 pENTR-Fv3A 플라스미드를 도시한다. 도 8f는 pTrex6g 플라스미드를 도시한다. 도 8g는 pTrex6g/Fv3A 발현 벡터를 도시한다. 도 8h는 TOPO Blunt/Pegl1-Fv43D 플라스미드를 도시한다. 도 8i는 TOPO Blunt/Pegl1-Fv51A 플라스미드를 도시한다.
<도 9>
도 9: T. 레세이 통합 균주 H3A의 효소 조성물을 제공한다.
<도 10>
도 10: 실시예 2에서 각각의 샘플에 개별적으로 첨가된 효소(정제 또는 비정제), 및 이들 효소의 스톡 단백질 농도를 열거한다
<도 11a 내지 11d>
도 11a 내지 11d: 도 11a는, 실시예 2에 따라 T. 레세이 통합 균주 H3A에 첨가된 도 10의 다양한 정제 또는 비-정제 효소를 포함하는 효소 조성물을 첨가하는 단계에 의한 묽은 암모니아로 전처리된 옥수수 속대(corncob)의 당화 후의 글루코스 방출을 도시한다. 도 11b는, 실시예 2에 따라 T. 레세이 통합 균주 H3A에 첨가된 도 10의 다양한 정제 또는 비-정제 효소를 포함하는 효소 조성물을 첨가하는 단계에 의한 묽은 암모니아로 전처리된 옥수수 속대의 당화 후의 셀로바이오스 방출을 도시한다. 도 11c는, 실시예 2에 따라 T. 레세이 통합 균주 H3A에 첨가된 도 10의 다양한 정제 또는 비-정제 효소를 포함하는 효소 조성물을 첨가하는 단계에 의한 묽은 암모니아로 전처리된 옥수수 속대의 당화 후의 자일로바이오스 방출을 도시한다. 도 11d는, 실시예 2에 따라 T. 레세이 통합 균주 H3A에 첨가된 도 10의 다양한 정제 또는 비-정제 효소를 포함하는 효소 조성물을 첨가하는 단계에 의한 묽은 암모니아로 전처리된 옥수수 속대의 당화 후의 자일로스 방출을 도시한다.
<도 12a 내지 12b>
도 12a 내지 12b: 도 12a는, 실시예 3에 기재된 바와 같은 발현 카세트 Pegl1-eg4-sucA를 도시한다. 도 12b는, 실시예 3에 기재된 바와 같은, 발현 카세트 pEG1-EG4-sucA를 함유하는 pCR Blunt II TOPO의 플라스미드 맵을 도시한다.
<도 13>
도 13: 실시예 3에 따라 T. 레세이 Eg4를 발현시키는 T. 레세이 통합 균주 H3A 형질전환체에 의해 생성된 효소를 포함하는 효소 조성물에 의한, 글루칸 및 자일란의 셀로바이오스, 글루코스, 자일로바이오스, 및 자일로스로의 전환의 양 또는 백분율을 도시한다.
<도 14>
도 14: T. 레세이 Eg4를 발현시키는 H3A 형질전환체에 의해 생성된 효소 조성물의 증가하는 양을 사용하여 관찰한, 증가된 퍼센트 글루칸 전환을 도시한다. 실험적 상세 사항은 실시예 3에 기재되어 있다.
<도 15>
도 15: 실시예 4(실험 1)에 대한 T. 레세이 Eg4 투여 차트를 제공한다. 샘플 "#27"은 실시예 4에 기재된 바와 같은 H3A/Eg4 통합 균주이다. 첨가된 정제 T. 레세이 Eg4의 양은 "샘플 설명" 하에 중량% 또는 질량(mg 단백질/g G+X 단위)에 의해 열거되어 있다.
<도 16a 내지 16b>
도 16a 내지 16b: 도 16a는, 실시예 4에 따른 묽은 암모니아로 전처리된 옥수수 속대의 당화에서 글루코스 방출에 대한 T. 레세이 Eg4의 효과를 도시한다. 도 16b는, 묽은 암모니아로 전처리된 옥수수 속대의 당화에서 자일로스 방출에 대한 T. 레세이 Eg4의 효과를 도시한다. 이들 도면의 Y-축은 반응 혼합물 내에 방출되는 글루코스 또는 자일로스의 농도를 지칭한다. X 축은 효소 조성물 샘플의 명칭/간단한 설명을 열거한다. 이는 실시예 4(실험 1)에 따른 것이다.
<도 17a 내지 17b>
도 17a 내지 17b: 도 17a는 실시예 4(실험 2)에 대한 다른 T. 레세이 Eg4 투여 차트를 제공한다. 샘플은 도 15의 것들과 유사하게 기재되어 있다. 첨가된 정제 T. 레세이 Eg4의 양은 실시예 4, 실험 1(상기)의 것들보다 더 작은 증분으로 변동되었다. 도 17b는 실시예 4(실험 3)에 대한 다른 T. 레세이 Eg4 투여 차트를 제공한다. 샘플은 도 16 및 17a의 것들과 유사하게 기재되어 있다. 첨가된 정제 T. 레세이 Eg4의 양은 실시예 4, 실험 1 및 2(상기)의 것들보다 더욱 더 미세한 증분으로 변동되었다.
<도 18a 내지 18b>
도 18a 내지 18b: 도 18a는, 실시예 4에 기재된 바와 같은, 묽은 암모니아로 전처리된 옥수수 속대의 당화로부터의 글루코스 방출에 대한 다양한 양(0.05 mg/g 내지 1.0 mg/g)의 T. 레세이 Eg4의 효과를 도시한다. 도 18b는, 실시예 4에 기재된 바와 같은, 묽은 암모니아로 전처리된 옥수수 속대의 당화로부터의 글루코스 방출에 대한 다양한 양(0.1 mg/g 내지 0.5 mg/g)의 T. 레세이 Eg4의 효과를 도시한다.
<도 19>
도 19: 실시예 5에 기재된 바와 같은, 묽은 암모니아로 전처리된 옥수수 대의 상이한 고체 로딩의 당화로부터의 글루코스/ 자일로스 방출에 대한 효소 조성물 내의 T. 레세이 Eg4의 효과를 도시한다. 고체 로딩은 x-축 상에 #%로서 열거되어 있다.
<도 20>
도 20: 실시예 6에 따른, 묽은 암모니아로 전처리된 옥수수 속대로부터 T. 레세이 Eg4를 포함하는 효소 조성물을 사용하여 방출된 자일로스 단량체의 백분율 수율을 제공한다.
<도 21>
도 21: 실시예 6에 따른, 묽은 암모니아로 전처리된 옥수수 속대로부터 T. 레세이 Eg4를 포함하는 효소 조성물을 사용하여 방출된 글루코스 단량체의 백분율 수율을 제공한다.
<도 22>
도 22: 실시예 6에 따른, 묽은 암모니아로 전처리된 옥수수 속대로부터 T. 레세이 Eg4를 포함하는 효소 조성물을 사용하여 방출된 발효가능한 총 단량체의 수율(mg/ml)을 제공한다.
<도 23>
도 23: T. 레세이 Eg4가 없는 효소 조성물 대 T. 레세이 Eg4를 0.53 mg/g으로 포함하는 것에 의한 가수분해의 결과로서 방출된 글루코스의 양을 비교한다. 실험은 실시예 7에 기재되어 있다.
<도 24>
도 24: 실시예 7에 따라, 암모니아로 전처리된 옥수수 속대를 정제 T. 레세이 Eg4를 단독으로 사용하여 처리한 결과로서의 글루코스 단량체 방출을 도시한다.
<도 25>
도 25: T. 레세이 통합 균주 H3A 및 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 14 mg/g의 효소 용량에서의 당화 성능을 도시하고 비교한다. 이는 실시예 8의 기재에 따른 것이다.
<도 26>
도 26: 산으로 전처리된 옥수수 대에 대한, T. 레세이 통합 균주 H3A 및 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 다양한 효소 용량에서의 당화 성능을 도시한다. 이는 실시예 9의 기재에 따른 것이다.
<도 27>
도 27: 실시예 10에 따른, 묽은 암모니아로 전처리된 옥수수 잎, 줄기, 또는 속대에 대한, T. 레세이 통합 균주 H3A 및 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 당화 성능을 도시한다.
<도 28>
도 28: 방출된 글루코스 또는 자일로스의 양의 관점에서, T. 레세이 통합 균주 H3A 및 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 당화 성능을 비교한다. 이는 실시예 11에 따른 것이다.
<도 29>
도 29: T. 레세이 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 증가하는 양에서 퍼센트 글루칸 및 자일란 전환의 변화를 도시한다. 이는 실시예 12의 기재에 따른 것이다.
<도 30>
도 30: 묽은 암모니아로 전처리된 옥수수 속대 당화에 대한 T. 레세이 Eg4 첨가의 효과를 열거하는 표이다. 실험 조건은 실시예 13에 기재되어 있다.
<도 31>
도 31: T. 레세이 Eg4에 의한 CMC 가수분해를 도시한다. 실험 조건은 실시예 13에 기재되어 있다.
<도 32>
도 32: T. 레세이 Eg4에 의한 셀로바이오스 가수분해를 도시한다. 실험 조건은 실시예 13에 기재되어 있다.
<도 33>
도 33: 당화를 위한 다양한 효소 조성물의 양을 도시한다. 실험 조건은 실시예 14에 기재되어 있다.
<도 34>
도 34: 도 33에 상응하는 각각의 효소 조성물로 생성시킨 글루코스, 글루코스 + 셀로바이오스, 또는 자일로스의 양을 도시한다. 실험 조건은 실시예 14에 기재되어 있다.
<도 35>
도 35: 실시예 15에 기재된 바와 같은, CBH1, CBH2, 및 T. 레세이 Eg2 혼합물의 다양한 비율을 도시한다.
<도 36>
도 36: 다양한 효소 조성물을 사용하는 글루칸 전환(%)을 도시한다. 실험 조건은 실시예 15에 기재되어 있다.
<도 37>
도 37은, 실시예 22에 따라 CBH I의 존재 또는 부재 하에 T. 레세이 Eg4를 포함하는 조성물을 사용하여 아비셀(Avicel)을 처리하는 경우에 아스코르브산의 효과를 도시한다.
<도 38>
도 38: 실시예 22에 따라, CBH II의 존재/부재 하에 T. 레세이 Eg4를 포함하는 조성물을 사용하여 아비셀을 처리하는 경우에 아스코르브산의 효과를 도시한다.
<도 39a 내지 39b>
도 39a 내지 39b: 도 39a는 실시예 22의 실험에 사용된 기질 및 다양한 효소의 양을 도시하며, 그 결과는 도 37에 도시되어 있다. 도 39b는 실시예 22의 실험에 사용된 기질 및 다양한 효소의 양을 도시하며, 그 결과는 도 38에 도시되어 있다.
<도 40>
도 40: 실시예 16에 기재된 실험에 따라, 다양한 효소 조성물을 사용하는 옥수수 속대 가수분해로부터의 글루코스 생성을 도시한다.
<도 41>
도 41: 실시예 16의 기재에 따라 다양한 효소 조성물을 사용하는 옥수수 속대 가수분해로부터의 자일로스 생성을 도시한다.
<도 42>
도 42: 실시예 17의 기재에 따라 H3A, 및 정제 Eg4가 첨가된 H3A를 사용하는 당화 혼합물의 시간에 대한 점도를 도시한다.
<도 43>
도 43: 실시예 18의 기재에 따라 H3A 및 H3A/Eg4#27을 사용하는 당화 혼합물의 시간에 대한 점도를 도시한다.
<도 44>
도 44: 실시예19의 기재에 따라, H3A 또는 H3A/Eg4#27 브로스의 발효 브로스를 14 mg/g 셀룰로오스로 사용하는, 25% 및 30% 고체에서의 묽은 암모니아로 전처리된 옥수수 속대의 당화의 점도를 도시한다.
<도 45>
도 45: 실시예 20에 따라 다양한 효소 조성물을 사용하는, 6-h 당화, 25% 건조물, 50℃, pH 5.0에서의 글루코스 농도를 도시한다.
<도 46>
도 46: 실시예 20에 따라 다양한 효소 조성물을 사용하는, 24-시간 당화, 25% 건조물, 50℃, pH 5.0에서의 글루코스 농도를 도시한다.
<도 47>
도 47: 실시예 20에 따라 다양한 효소 조성물을 사용하는, 25% 건조물, 50℃, pH 5.0에서의 당화에서 시간에 대한 글루코스 농도를 도시한다.
<도 48>
도 48: 실시예 20에 따라 다양한 효소 조성물을 사용하는, 25% 건조물, 50℃, pH 5.0에서의 당화에서 시간에 대한 글루칸 전환을 도시한다.
<도 49>
도 49는 본 개시에 동정된 서열의 요약을 제공한다.
<도 50a 내지 50b>
도 50a 내지 50b: 도 50a는 Fv3A를 암호화하는 뉴클레오티드 서열(서열 번호 35)을 도시한다. 도 50b는 Fv3A 아미노산 서열(서열 번호 36)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 51a 내지 51b>
도 51a 내지 51b: 도 51a는 Pf43A를 암호화하는 뉴클레오티드 서열(서열 번호 37)을 도시한다. 도 51b는 Pf43A 아미노산 서열(서열 번호 38)을 도시한다. 예상되는 신호 서열은 밑줄로, 예상되는 보존된 도메인은 굵은체로, 예상되는 탄수화물 결합 모듈("CBM": carbohydrate binding module)은 대문자로, 그리고 CD와 CBM을 분리하는 예상되는 링커는 이탤릭체로 표시되어 있다.
<도 52a 내지 52b>
도 52a 내지 52b: 도 52a는 Fv43E를 암호화하는 뉴클레오티드 서열(서열 번호 39)을 도시한다. 도 52b는 Fv43E 아미노산 서열(서열 번호 40)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 53a 내지 53b>
도 53a 내지 53b: 도 53a는 Fv39A를 암호화하는 뉴클레오티드 서열(서열 번호 41)을 도시한다. 도 53b는 Fv39A 아미노산 서열(서열 번호 42)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 53a 내지 53b>
도 54a 내지 54b: 도 54a는 Fv43A를 암호화하는 뉴클레오티드 서열(서열 번호 43)을 도시한다. 도 54b는 Fv43A 아미노산 서열(서열 번호 44)을 도시한다. 예상되는 신호 서열은 밑줄로, 예상되는 보존된 도메인은 굵은체로, 예상되는 CBM은 대문자로, 그리고 보존된 도메인과 CBM을 연결하는 예상되는 링커는 이탤릭체로 표시되어 있다.
<도 55a 내지 55b>
도 55a 내지 55b: 도 55a는 Fv43B를 암호화하는 뉴클레오티드 서열(서열 번호 45)을 도시한다. 도 55b는 Fv43B 아미노산 서열(서열 번호 46)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 볼드체로 표시되어 있다.
<도 56a 내지 56b>
도 56a 내지 56b: 도 56a는 Pa51A를 암호화하는 뉴클레오티드 서열(서열 번호 47)을 도시한다. 도 56b는 Pa51A 아미노산 서열(서열 번호 48)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다. 예상되는 L-α-아라비노푸라노시다아제 보존된 도메인은 굵은체로 표시되어 있다. T. 레세이에서의 발현을 위하여, 게놈 DNA를 코돈 최적화하였다(도 73c 참조).
<도 57a 내지 57b>
도 57a 내지 57b: 도 57a는 Gz43A를 암호화하는 뉴클레오티드 서열(서열 번호 49)을 도시한다. 도 57b는 Gz43A 아미노산 서열(서열 번호 50)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다. T. 레세이에서의 발현을 위하여, 예상되는 신호 서열을 T. 레세이 CBH1 신호 서열(myrklavisaflatara(서열 번호 120))로 대체하였다.
<도 58a 내지 58b>
도 58a 내지 58b: 도 58a는 Fo43A를 암호화하는 뉴클레오티드 서열(서열 번호 51)을 도시한다. 도 58b는 Fo43A 아미노산 서열(서열 번호 52)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다. T. 레세이에서의 발현을 위하여, 예상되는 신호 서열을 T. 레세이 CBH1 신호 서열(myrklavisaflatara(서열 번호120))로 대체하였다.
<도 59a 내지 59b>
도 59a 내지 59b: 도 59a는 Af43A를 암호화하는 뉴클레오티드 서열(서열 번호 53)을 도시한다. 도 59b는 Af43A 아미노산 서열(서열 번호 54)을 도시한다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 60a 내지 60b>
도 60a 내지 60b: 도 60a는 Pf51A를 암호화하는 뉴클레오티드 서열(서열 번호 55)을 도시한다. 도 60b는 Pf51A 아미노산 서열(서열 번호 56)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 L-α-아라비노푸라노시다아제 보존된 도메인은 굵은체로 표시되어 있다. T. 레세이에서의 발현을 위하여, 예상되는 신호 서열을 코돈 최적화된 T. 레세이 CBH1 신호 서열(myrklavisaflatara(서열 번호 120))(밑줄)로 대체하였고, Pf51A 뉴클레오티드 서열을 발현을 위해 코돈 최적화하였다.
<도 61a 내지 61b>
도 61a 내지 61b: 도 61a는 AfuXyn2를 암호화하는 뉴클레오티드 서열(서열 번호 57)을 도시한다. 도 61b는 AfuXyn2 아미노산 서열(서열 번호 58)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 GH11 보존된 도메인은 굵은체로 표시되어 있다.
<도 62a 내지 62b>
도 62a 내지 62b: 도 62a는 AfuXyn5를 암호화하는 뉴클레오티드 서열(서열 번호 59)을 도시한다. 도 62b는 AfuXyn5 아미노산 서열(서열 번호 60)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 GH11 보존된 도메인은 굵은체로 표시되어 있다. 도 63a 내지 63b: 도 63a는 Fv43D를 암호화하는 뉴클레오티드 서열(서열 번호 61)을 도시한다. 도 63b는 Fv43D 아미노산 서열(서열 번호 62)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 64a 내지 64b>
도 64a 내지 64b: 도 64a는 Pf43B를 암호화하는 뉴클레오티드 서열(서열 번호 63)을 도시한다. 도 64b는 Pf43B 아미노산 서열(서열 번호 64)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 65a 내지 65b>
도 65a 내지 65b: 도 65a는 Fv51A를 암호화하는 뉴클레오티드 서열(서열 번호 65)을 도시한다. 도 65b는 Fv51A 아미노산 서열(서열 번호 66)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 L-α-아라비노푸라노시다아제 보존된 도메인은 굵은체로 표시되어 있다.
<도 66a 내지 66b>
도 66a 내지 66b: 도 66a는 Cg51B를 암호화하는 뉴클레오티드 서열(서열 번호 67)을 도시한다. 도 66b는 Cg51B 아미노산 서열(서열 번호 68)을 도시한다. 예상되는 상응하는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 67a 내지 67b>
도 67a 내지 67b: 도 67a는 Fv43C를 암호화하는 뉴클레오티드 서열(서열 번호 69)을 도시한다. 도 67b는 Fv43C 아미노산 서열(서열 번호 70)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 68a 내지 68b>
도 68a 내지 68b: 도 68a는 Fv30A를 암호화하는 뉴클레오티드 서열(서열 번호 71)을 도시한다. 도 68b는 Fv30A 아미노산 서열(서열 번호 72)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다.
<도 69a 내지 69b>
도 69a 내지 69b: 도 69a는 Fv43F를 암호화하는 뉴클레오티드 서열(서열 번호 73)을 도시한다. 도 69b는 Fv43F 아미노산 서열(서열 번호 74)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다.
<도 70a 내지 70b>
도 70a 내지 70b: 도 70a는 T. 레세이 Xyn3을 암호화하는 뉴클레오티드 서열(서열 번호 75)을 도시한다. 도 70b는 Xyn3 아미노산 서열(서열 번호 76)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 71a 내지 71b>
도 71a 내지 71b: 도 71a는 T. 레세이 Xyn2의 아미노산 서열(서열 번호 77)을 도시한다. 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다. 코딩 서열은 문헌[ et al. Biotechnology, 1992, 10:1461-65]에서 확인할 수 있다. 도 71b는 Xyn2를 암호화하는 뉴클레오티드 서열(서열 번호 160)을 도시한다.
<도 72a 내지 72b>
도 72a 내지 72b: 도 72a는 T. 레세이 Bxl1의 아미노산 서열(서열 번호 78)을 도시한다. 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다. 코딩 서열은 문헌[Margolles-Clark et al. Appl. Environ. Microbiol. 1996, 62(10):3840-46]에서 확인할 수 있다. 도 72b는 Bxl1을 암호화하는 뉴클레오티드 서열(서열 번호 159)을 도시한다.
<도 73a 내지 73f>
도 73a 내지 73f: 도 73a는 T. 레세이 Bgl1의 아미노산 서열(서열 번호 79)을 도시한다. 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다. 코딩 서열은 문헌[Barnett et al. Bio-Technology, 1991, 9(6):562-567]에서 확인할 수 있다. 도 73b는 Pa51A에 대해 추정되는 cDNA(서열 번호 80)를 도시한다. 도 73c는 Pa51A에 대해 코돈 최적화된 cDNA(서열 번호 81)를 도시한다. 도 73d: 성숙한 Gz43A를 암호화하는 게놈 DNA의 업스트림에 있는 CBH1 신호 서열(밑줄)을 포함하는 작제물에 대한 코딩 서열(서열 번호 82)을 도시한다. 도 73e: 성숙한 Fo43A를 암호화하는 게놈 DNA의 업스트림에 있는 CBH1 신호 서열(밑줄)을 포함하는 작제물에 대한 코딩 서열(서열 번호 83)을 도시한다. 도 73f: 성숙한 Pf51A를 암호화하는 코돈 최적화된 DNA의 업스트림에 있는 CBH1 신호 서열(밑줄)을 포함하는 작제물에 대한 코돈 최적화된 코딩 서열(서열 번호 92)을 도시한다.
<도 74a 내지 74b>
도 74a 내지 74b: 도 74a는 Pa3D를 암호화하는 뉴클레오티드 서열(서열 번호 93)을 도시한다. 도 74b는 Pa3D의 아미노산 서열(서열 번호 94)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 75a 내지 75b>
도 75a 내지 75b: 도 75a는 Fv3G를 암호화하는 뉴클레오티드 서열(서열 번호 95)을 도시한다. 도 75b는 Fv3G의 아미노산 서열(서열 번호 96)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 76a 내지 76b>
도 76a 내지 76b: 도 76a는 Fv3D를 암호화하는 뉴클레오티드 서열(서열 번호 97)을 도시한다. 도 76b는 Fv3D의 아미노산 서열(서열 번호 98)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 77a 내지 77b>
도 77a 내지 77b: 도 77a는 Fv3C를 암호화하는 뉴클레오티드 서열(서열 번호 99)을 도시한다. 도 77b는 Fv3C의 아미노산 서열(서열 번호 100)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 78a 내지 78b>
도 78a 내지 78b: 도 78a는 Tr3A를 암호화하는 뉴클레오티드 서열(서열 번호 101)을 도시한다. 도 78b는 Tr3A의 아미노산 서열(서열 번호 102)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 79a 내지 79b>
도 79a 내지 79b: 도 79a는 Tr3B를 암호화하는 뉴클레오티드 서열(서열 번호 103)을 도시한다. 도 79b는 Tr3B의 아미노산 서열(서열 번호 104)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 80a 내지 80b>
도 80a 내지 80b: 도 80a는 Te3A를 암호화하는 뉴클레오티드 서열(서열 번호 105)을 도시한다. 도 80b는 Te3A의 아미노산 서열(서열 번호 106)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 81a 내지 81b>
도 81a 내지 81b: 도 81a는 An3A를 암호화하는 뉴클레오티드 서열(서열 번호 107)을 도시한다. 도 81b는An3A의 아미노산 서열(서열 번호 108)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 82a 내지 82b>
도82a 내지 82b: 도 82a는 Fo3A를 암호화하는 뉴클레오티드 서열(서열 번호 109)을 도시한다. 도 82b는 Fo3A의 아미노산 서열(서열 번호 110)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 83a 내지 83b>
도 83a 내지 83b: 도 83a는 Gz3A를 암호화하는 뉴클레오티드 서열(서열 번호 111)을 도시한다. 도 83b는 Gz3A의 아미노산 서열(서열 번호 112)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 84a 내지 84b>
도 84a 내지 84b: 도 84a는 Nh3A를 암호화하는 뉴클레오티드 서열(서열 번호 113)을 도시한다. 도 84b는 Nh3A의 아미노산 서열(서열 번호 114)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 85a 내지 85b>
도 85a 내지 85b: 도 85a는 Vd3A를 암호화하는 뉴클레오티드 서열(서열 번호 115)을 도시한다. 도 85b는 Vd3A의 아미노산 서열(서열 번호 116)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 86a 내지 86b>
도 86a 내지 86b: 도 86a는 Pa3G를 암호화하는 뉴클레오티드 서열(서열 번호 117)을 도시한다. 도 86b는 Pa3G의 아미노산 서열(서열 번호 118)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.
<도 87>
도 87: Tn3B를 암호화하는 아미노산 서열(서열 번호 119)을 도시한다. 표준 신호 예상 프로그램, 시그널 P(Signal P)(www.cbs.dtu.dk/services/ SignalP/)는 예상되는 신호를 제공하지 않았다.
<도 88>
도 88: T. 레세이 Eg4(서열 번호 27)와 Tr6A(서열 번호 31)와 Tr7A(서열 번호 32)의 CBM 도메인의 부분적 아미노산 서열 정렬을 도시한다.
<도 89a 내지 89c>
도 89a 내지 89c: 도 89a는 T. 레세이로부터의 Eg6의 아미노산 서열(서열 번호 33)을 도시한다. 굵은체로 표시된 아미노산 서열은 예상되는 신호 펩티드 서열이다. 도 89b는 S. 코코스포룸(S. coccosporum) 엔도글루카나아제의 아미노산 서열(서열 번호 34)을 도시한다. 도 89c는 테르모아스쿠스 아우란티아쿠스(Thermoascus aurantiacus)로부터의 GH61A 를 암호화하는 뉴클레오티드 서열(서열 번호 149)을 도시한다.
<도 90a 내지 90i>
도 90a 내지 90i: 도 90a는, T. 레세이의 CBH1의 상동체인 Afu7A의 아미노산 서열(서열 번호 150)을 도시한다. 도 90b는 T. 레세이의 CBH1의 상동체인 Afu7B의 아미노산 서열(서열 번호 151)을 도시한다. 도 90c는 T. 레세이의 CBH1의 상동체인 Cg7A의 아미노산 서열(서열 번호 152)을 도시한다. 도 90d는 T. 레세이의 CBH1의 상동체인 Cg7B의 아미노산 서열(서열 번호 153)을 도시한다. 도 90e는 T. 레세이의 CBH1의 상동체인 Tt7A의 아미노산 서열(서열 번호 154)을 도시한다. 도 90f는 T. 레세이의 CBH1의 상동체인 Tt7B의 아미노산 서열(서열 번호 155)을 도시한다. 도 90g는 T. 레세이의 CBH2의 상동체인 St6A의 아미노산 서열(서열 번호 156)을 도시한다. 도 90h는 T. 레세이의 CBH2의 상동체인 St6B의 아미노산 서열(서열 번호 157)을 도시한다. 도 90i는 T. 레세이의 CBH2의 상동체인 Tt6A의 아미노산 서열(서열 번호 158)을 도시한다.
[발명의 상세한 설명]
달리 정의되지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자가 통상적으로 이해하는 의미를 갖는다. 문헌[Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED., John Wiley and Sons, New York (1994)] 및 문헌[Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N.Y. (1991)]은, 본 발명에 사용되는 다수의 용어의 일반적 사전을 당업자에게 제공한다. 본 명세서에 기재된 것과 유사하거나 균등한 임의의 방법 및 재료가 본 발명의 실시에 사용될 수 있지만, 바람직한 방법 및 재료가 기술된다. 수치 범위는 범위를 정의하는 숫자를 포함한다. 본 발명은 기재된 특정 방법론, 프로토콜, 및 시약으로 제한되지 않으며, 이는 그들이 변동될 수 있기 때문이다.
본 명세서에 제공된 제목은, 본 명세서에 전체로서 참고로 포함될 수 있는 본 발명의 다양한 태양 또는 실시 형태를 제한하지 않는다. 따라서, 하기에 정의되는 용어를 본 명세서에 전체로서 참고로 더욱 완전히 정의한다.
본 개시는 글리코실 하이드롤라아제 패밀리 61("GH61")/엔도글루카나아제 활성을 갖는 폴리펩티드, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드, 본 명세서에 제공되는 폴리펩티드를 암호화하는 뉴클레오티드, 본 명세서에 제공되는 뉴클레오티드를 함유하는 벡터, 및 본 명세서에 제공되는 뉴클레오티드 및/또는 벡터를 함유하는 세포를 포함하는 조성물을 제공한다. 본 개시는, 본 명세서에 제공되는 조성물을 사용하여 바이오매스 재료를 가수분해하는 방법, 및 바이오매스-함유 혼합물의 점도를 감소시키는 방법을 추가로 제공한다.
본 명세서에 사용되는 바와 같이, DNA 또는 RNA와 같은 핵산에 관하여 용어 "단리된"은, 핵산의 자연적 공급원에 존재하는 다른 DNA 또는 RNA로부터 분리된 분자를 각각 지칭한다. 또한, "단리된 핵산"은, 단편으로서는 천연적이 아니며 자연적 상태에서는 발견되지 않을 핵산 단편을 포함하고자 한다. 용어 "단리된"은 또한, 다른 세포 단백질로부터 단리된 폴리펩티드를 지칭하기 위해 본 명세서에 사용되며, 이는 정제 및 재조합 폴리펩티드 양자 모두를 포괄하고자 한다. 본 명세서에 사용되는 바와 같이, 용어 "단리된"은 또한, 재조합 DNA 기술에 의해 생성되는 경우에 세포 재료, 바이러스 재료, 또는 배양 배지가 실질적으로 없을 수 있는 핵산 또는 폴리펩티드를 지칭한다. 본 명세서에 사용되는 바와 같이, 용어 "단리된"은, 화학적으로 합성되는 경우에 화학적 전구체 또는 다른 화학물질이 실질적으로 없을 수 있는 핵산 또는 폴리펩티드를 부가적으로 지칭한다.
본 명세서에 사용되는 바와 같이, 폴리펩티드 X의 "변종"은, 하나 이상의 변경된 아미노산 잔기를 가진 폴리펩티드 X의 아미노산 서열을 갖는 폴리펩티드를 지칭한다. 변종은 보존적 또는 비보존적 변화를 가질 수 있다. 생물학적 활성에 영향을 미치지 않으면서 어느 아미노산 잔기를 치환하거나, 삽입하거나, 결실시킬 수 있는지를 결정하는 지침은 당업계에 공지된 컴퓨터 프로그램, 예를 들어, 레이저진(LASERGENE) 소프트웨어(DNA스타(DNASTAR))를 사용하여 확인할 수 있다. 본 발명의 변종은 전구체 효소 아미노산 서열과 비교하여 변경된 아미노산 서열을 포함하는 폴리펩티드를 포함하며, 여기서 변종 효소는 전구체 효소의 특징적인 셀룰로오스 분해 성질을 보유하지만 일부 특정 측면에서는 변경된 특성, 예를 들어, 전구체 효소에 비교하여 증가되거나 감소된 pH 최적점, 증가되거나 감소된 산화 안정성; 증가되거나 감소된 열안정성, 및 하나 이상의 기질에 대한 특이적 활성의 증가되거나 감소된 수준을 가질 수 있다.
본 명세서에 사용되는 바와 같이, 숙주 세포에 대해 "이종성"인 폴리펩티드 또는 핵산은 숙주 세포에서 자연적으로 발생하지 않는 폴리펩티드 또는 핵산을 지칭한다.
본 명세서에서 값 또는 파라미터에 "약"을 언급하는 것은, 그 값 또는 파라미터 자체에 관한 변동을 포함(및 기재)하는 것이다. 예를 들어, "약 X"를 언급하는 기재는 "X"의 기재를 포함한다.
본 명세서 및 첨부된 특허청구범위에 사용되는 바와 같이, 문맥이 명백하게 달리 지시하지 않는 한, 단수 형태("a," "or," 및 "the")는 복수 지시대상(plural referent)을 포함한다.
본 명세서에 기재된 방법 및 조성물의 태양 및 변형은, 태양 및 변형으로 "구성되는" 것 및/또는 "본질적으로 구성되는" 것을 포함한다는 것이 이해된다.
폴리펩티드
본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)를 제공한다. 예를 들어, 본 개시는 다양한 종으로부터의 GH61 엔도글루카나아제 또는 그의 변종, 다양한 종으로부터의 엔도글루카나아제 IV(또는 엔도글루카나아제 4) 폴리펩티드(본 명세서에서는 또한 "Eg4" 또는 "EG4"로서 기재되며, 이들은 본 명세서에서 호환적으로 사용됨) 또는 그의 변종, 및 트리코더마 레세이 Eg4 폴리펩티드 또는 그의 변종을 제공한다. 일부 태양에서, 폴리펩티드는 단리된다.
글리코시드 하이드롤라아제 패밀리 61("GH61") 효소
글리코시드 하이드롤라아제 패밀리 61("GH61") 효소는 진핵 생물에서 동정되었다. 약한 엔도글루카나아제 활성이 히포크레아 제코리나(Hypocrea jecorina)로부터의 Cel61A에 대해 관찰되었으며(Karlsson et al, Eur J Biochem, 2001, 268(24):6498-6507), 따라서 이는 GH61/엔도글루카나아제 활성을 갖는 것으로 언급된다. GH61 폴리펩티드는 셀룰라아제에 의한 리그노셀룰로오스계 기질의 효소적 가수분해를 가능하게 한다(Harris et al, 2010, Biochemistry, 49(15) 3305-16). 키틴 분해에 참여하는 상동성 폴리펩티드에 대한 연구는 GH61 폴리펩티드가, 전자 공여 기질을 필요로 하며 2가 금속 이온이 참여하는 산화성 가수분해 기전을 채용할 수 있을 것으로 예상한다(Vaaje-Kolstad, 2010, Science, 330(6001), 219-22). 이는 리그노셀룰로오스계 기질 분해에 대한 GH61 폴리펩티드의 상승적 효과가 2가 이온에 의존성이라는 관찰과 일치한다(Harris et al, 2010, Biochemistry, 49(15) 3305-16). 다수의 GH61 폴리펩티드의 입수가능한 구조가 다수의 보존된 아미노산 잔기에 의해 결합된 2가 원자를 갖는다(Karkehabadi, 2008, J. Mol. Biol., 383(1) 144-54; Harris et al, 2010, Biochemistry, 49(15) 3305-16). GH61 폴리펩티드는, 보존된 잔기에 의해 형성되며 기질 결합에 참여할 수 있는 금속 결합 부위에 편평한 표면을 갖는 것으로 보고되었다(Karkehabadi, 2008, J. Mol. Biol., 383(1), 144-54).
본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)를 제공하며, 이는 다양한 종으로부터의 GH61 엔도글루카나아제 또는 엔도글루카나아제 IV("EG IV")일 수 있거나, 또한 GH61 엔도글루카나아제에 상응하는(그것과 상동성을 공유하고/하거나, 작용성 도메인을 공유하고/하거나, GH61 모티프(들)를 공유하고/하거나, 보존적 잔기를 공유하는) 다양한 종으로부터의 폴리펩티드(예를 들어, 트리코더마 레세이 Eg4 폴리펩티드)일 수 있다. 이러한 종은 트리코더마, 휴미콜라, 푸사리움, 아스페르길루스, 뉴로스포라, 페니실리움, 세팔로스포리움, 아클리아, 포도스포라, 엔도티아, 무코르, 코클리오볼루스, 피리쿨라리아, 크리소스포리움, 아스페르길루스 아와모리, 아스페르길루스 푸미가투스, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리제, 크리소스포리움 루크노엔스, 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 푸사리움 베네나툼, 브제르칸데라 아두스타, 세리포리옵시스 아네이리나, 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아, 세리포리옵시스 길베센스, 세리포리옵시스 판노신타, 세리포리옵시스 리불로사, 세리포리옵시스 서브루파, 세리포리옵시스 서브베르미스포라, 코프리누스 시네레우스, 코리올루스 히르수투스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 뉴로스포라 인터미디아, 페니실리움 푸르푸로게눔, 페니실리움 카네센스, 페니실리움 솔리툼, 페니실리움 푸니쿨로섬 파네로카에테 크리소스포리움, 플레비아 라디아테, 플레우로투스 에린기, 탈라로마이세스 플라부스, 티엘라비아 테레스트리스, 트라메테스 빌로사, 트라메테스 베르시콜로르, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 트리코더마 레세이, 트리코더마 비리데, 지오스미티아 에메르소니, 또는 G. 스테아로테르모필루스를 포함한다.
GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 도 1에 열거된 다수의 GH61 엔도글루카나아제를 포함한다. 예를 들어, 적합한 GH61 엔도글루카나아제는, 예를 들어, 그들의 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스 Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), NCBI Ref: XP_750843.1을 갖는 A. 푸미가투스 Afu6g09540으로부터의 엔도글루카나아제, A. 푸미가투스 EDP47167로부터의 엔도글루카나아제, T. 테레스트리스 16380으로부터의 엔도글루카나아제, T. 테레스트리스 155418로부터의 엔도글루카나아제, T. 테레스트리스 68900으로부터의 엔도글루카나아제, C. 글로보섬으로부터의 Cg61A(등록 번호 EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 젠뱅크 등록 번호 XP_752040를 가진 A. 푸미가투스 Af293으로부터의 엔도글루카나아제를 포함하는 도 1에 열거된 다양한 서열에 약 60% 이상 동일한 아미노산 서열을 포함하는 것들을 포함한다. 일부 태양에서, 본 발명의 적합한 GH61 엔도글루카나아제 폴리펩티드는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 태양에서, 본 발명의 적합한 GH61 엔도글루카나아제 폴리펩티드는, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로부터 선택된 아미노산 서열 모티프 중 하나 이상을 포함한다. 폴리펩티드는 길이가 100개 이상(예를 들어, 110, 120, 130, 140, 150, 160, 170, 180, 200, 220, 250개 이상)의 잔기일 수 있다.
본 명세서에 제공된 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 또한, GH61 엔도글루카나아제의 변종, 예를 들어, 본 개시의 도 1에 나타낸 아미노산 서열을 가진 폴리펩티드 중 임의의 것일 수 있다. 예를 들어, 적합한 GH61 엔도글루카나아제는 그들의 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스(A. fumigatus) Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), NCBI Ref: XP_750843.1을 가진 A. 푸미가투스 Afu6g09540으로부터의 엔도글루카나아제, A. 푸미가투스 EDP47167로부터의 엔도글루카나아제, T. 테레스트리스 16380으로부터의 엔도글루카나아제, T. 테레스트리스 155418로부터의 엔도글루카나아제, T. 테레스트리스 68900으로부터의 엔도글루카나아제, C. 글로보섬으로부터의 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293으로부터의 젠뱅크 등록: XP_752040을 가진 엔도글루카나아제를 포함한다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 EG IV의 변종이다. 일부 태양에서, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 GH61 엔도글루카나아제의 변종이며, 여기서 변종은 서열 번호 1 내지 29 및 148의 아미노산 서열 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 동일성을 갖는 아미노산 서열을 갖는다.
서열 번호 1 내지 29 및 148의 아미노산 서열을 사용하는 정렬을 수행하고 정렬 결과를 도 3에 나타낸다. 도 2는 폴리펩티드의 아미노산 서열의 비교로부터 퍼센트 동일성 및 상이성 결과를 나타낸다. 정렬은 GH61 엔도글루카나아제 폴리펩티드가 소정의 서열 모티프를 공유함을 나타냈으며, 이러한 모티프는 본 개시의 도 7에 나타낸다.
따라서, 본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)를 제공하며, 이는 GH61 엔도글루카나아제 또는 그의 변종일 수 있고, 변종은 서열 번호 84 내지 91로부터 선택된 하나 이상의 모티프(2, 3, 4, 5, 6, 7, 또는 8개 중 임의의 것 이상)를 포함할 수 있다. 서열 번호 84 내지 91(도 7에 기재됨)을 가진 서열 모티프 내의 각각의 "a"는, 알라닌, 알지닌, 아스파라긴, 아스파르트산, 시스테인, 글루탐산, 글루타민, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 타이로신, 또는 발린 중 어느 하나일 수 있는 아미노산을 나타낸다. 예를 들어, 일부 태양에서 본 개시는, 서열 번호 84, 85, 86, 87, 88, 89, 90, 및 91 중 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개)과 같은 하나 이상의 서열 모티프를 포함하는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)를 제공한다. 일부 태양에서 본 개시는, 약 10개 이상, 예를 들어, 약 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 또는 350개 중 임의의 것 이상의 잔기의 영역에 걸쳐, 또는 미성숙한 폴리펩티드의 전체 길이, 전체 길이의 성숙한 폴리펩티드, 보존된 도메인의 전체 길이, 및/또는 전체 길이의 CBM에 걸쳐, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90 및 91로 구성된 군으로부터 선택된 서열 모티프 중 하나 이상을 포함하는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)를 제공한다. 보존된 도메인은 예상되는 촉매 도메인("CD")일 수 있다. 예시적인 폴리펩티드는 또한, 길이가 약 10개 이상, 예를 들어, 약 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 또는 600개 중 임의의 것 이상의 잔기인 단편을 포함한다. 단편은 보존된 도메인 및/또는 CBM을 포함할 수 있다. 단편이 보존된 도메인 및 효소의 CBM을 포함하는 경우에, 단편은 그 둘을 분리하는 링커를 임의로 포함한다. 링커는 천연 링커 또는 이종성 링커일 수 있다. 일부 태양에서, 폴리펩티드는 GH61/엔도글루카나아제 활성을 갖는다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 GH61 엔도글루카나아제 또는 그의 변종, 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 효소 또는 그의 변종, EG IV 또는 그의 변종, 또는 T. 레세이 Eg4 또는 그의 변종이다. 본 명세서에 기재된 변종은 엔도글루카나아제 활성을 갖는다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(변종을 포함함)는 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함할 수 있다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(변종을 포함함)는 촉매 도메인(예를 들어, 작용 촉매 도메인)을 포함할 수 있다.
T. 레세이 Eg4는 GH61 엔도글루카나아제 폴리펩티드이다. T. 레세이 Eg4의 아미노산 서열(서열 번호 27)을 도 1, 4b, 및 5에 나타낸다. 서열 번호 27은 미성숙한 T. 레세이 Eg4의 서열이다. T. 레세이 Eg4는 서열 번호 27의 잔기 1 내지 21(밑줄)에 상응하는 예상되는 신호 서열을 가지며; 신호 서열의 절단은 서열 번호 27의 잔기 22 내지 344에 상응하는 서열을 갖는 성숙한 폴리펩티드를 생성시킬 것으로 예상된다. 예상되는 보존된 도메인은 서열 번호 27의 잔기 22 내지 256 및 307 내지 343에 상응하며, 후자는 예상되는 탄수화물-결합 도메인(CBM)이다. 예를 들어, 카르복시 메틸 셀룰로오스를 기질로서 사용하는 효소적 어세이에서, T. 레세이 Eg4는 엔도글루카나아제 활성을 갖는 것으로 나타났다. 엔도글루카나아제 활성을 측정하는 방법 또한 당업자에게 공지되어 있다.
본 개시는 트리코더마 레세이 Eg4 폴리펩티드의 변종을 추가로 제공하며, 이는 서열 번호 27의 잔기 22 내지 344 중에서 약 50개 이상(예를 들어, 약 55, 60, 65, 70, 75, 100, 125, 150, 175, 200, 250, 또는 300개 이상)의 연속 아미노산 잔기에 대해 약 60% 이상(예를 들어, 약 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 서열 동일성을 갖는 서열을 포함할 수 있다. 예를 들어, 본 개시는 T. 레세이 Eg4 폴리펩티드의 변종을 제공한다. 이러한 변종은 서열 번호 27의 잔기 22 내지 344에 대해 약 70% 이상(예를 들어, 약 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 동일성을 가질 수 있다. 폴리펩티드 또는 그의 변종은 단리될 수 있다. 폴리펩티드 또는 그의 변종은 엔도글루카나아제 활성을 가질 수 있다.
다수의 공지 엔도글루카나아제, 예를 들어, T. 테레스트리스로부터의 엔도글루카나아제(등록 번호 ACE10234, 본 명세서에서는 또한 "TtEG"로 명명됨)(서열 번호 29), 및 T. 레세이 로부터의 다른 엔도글루카나아제 Eg7(등록 번호 ADA26043.1)(본 명세서에서는 또한 "TrEGb" 또는 "TrEG7"로 명명됨)과 T. 레세이 Eg4의 아미노산 서열 정렬(도 5 참조)에 기초하여, T. 레세이 Eg4 잔기 H22, H107, H184, Q193, 및 Y195는 금속 배위 잔기(metal coordinator residue)로서 작용할 것으로 예상되었고; 잔기 D61 및 G63은 보존된 표면 잔기일 것으로 예상되었으며; 잔기 Y232는 활성에 참여할 것으로 예상되었다. T. 레세이 Eg4 A 내의 예상되는 보존된 잔기를 도 6a 및 6b에 나타낸다. T. 레세이 Eg4 폴리펩티드의 변종은, 천연 T. 레세이 Eg4에 비교하여, 잔기 H22, H107, H184, Q193, Y195, D61, G63, 및 Y232에서 변경되지 않을 수 있다. 도 5의 정렬에 나타낸 바와 같이, T. 레세이 Eg4 폴리펩티드의 변종은, TrEGb, TtEG, 및 T. 레세이 Eg4 중에서 보존된 아미노산 잔기의 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 이상에서 변경되지 않을 수 있다. T. 레세이 Eg4 폴리펩티드의 변종은 천연 T. 레세이 Eg4의 예상되는 보존된 도메인 전체를 포함할 수 있다. 도 5 및 6을 참조한다. T. 레세이 Eg4 폴리펩티드의 예시적인 변종은, 도 4b에 나타낸 성숙한 T. 레세이 Eg4 서열(예를 들어, 서열 번호 27의 잔기 22 내지 344)에 대해 약 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 중 임의의 것 이상의 동일성을 갖는 서열을 포함한다. 일부 태양에서, T. 레세이 Eg4 폴리펩티드의 변종은 엔도글루카나아제(예를 들어, 엔도글루카나아제 IV(EGIV)) 활성을 갖는다.
일부 태양에서, T. 레세이 Eg4 폴리펩티드의 변종은 엔도글루카나아제 활성을 가지며, 서열 번호 27의 아미노산 서열에 대해, 또는 서열 번호 27의 잔기 (i) 22 내지 255, (ii) 22 내지 343, (iii) 307 내지 343, (iv) 307 내지 344, 또는 (v) 22 내지 344에 대해, 약 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 중 임의의 것 이상의 서열 동일성을 가진 아미노산 서열을 포함한다.
일부 태양에서, 폴리펩티드 또는 그의 변종은, 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232 중 약 3개 이상의 잔기(예를 들어, 약 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개 중 임의의 것 이상)에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은, 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343 중 3개 이상의 잔기(예를 들어, 약 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 중 임의의 것 이상)에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함한다. 적합하게는, 폴리펩티드는 엔도글루카나아제 활성을 갖는다.
아미노산 치환을 사용하여, GH61 엔도글루카나아제의 변종, 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 엔도글루카나아제, EG IV, 또는 트리코더마 레세이 Eg4 폴리펩티드를 제조할 수 있다. 보존적 치환을 하기 표에서 "보존적 치환"의 제목 하에 나타낸다. 치환은 또한, 하기 표에 나타낸 예시적인 치환일 수 있다.
[표 1]
(a) 예를 들어, 시트 또는 나선형 입체 형태(conformation)로서의 치환 영역 내의 폴리펩티드 골격의 구조, (b) 표적 부위에서의 분자의 전하 또는 소수성, 또는 (c) 측쇄의 크기(bulk)를 유지함에 대한 그들의 효과가 유의적으로 상이한 치환을 선택함으로써, 폴리펩티드의 효소적 특성의 실질적인 개질이 수행된다. 천연 잔기는 통상의 측쇄 특성에 기초하여 하기의 군으로 나누어진다:
(1) 비-극성: 노르류신, Met, Ala, Val, Leu, Ile;
(2) 전하가 없는 극성: Cys, Ser, Thr, Asn, Gln;
(3) 산성(음성 하전됨): Asp, Glu;
(4) 염기성(양성 하전됨): Lys, Arg;
(5) 쇄 배향에 영향을 주는 잔기: Gly, Pro; 및
(6) 방향족: Trp, Tyr, Phe, His.
이들 부류 중 하나의 구성원을 다른 부류로 교체함으로써 비-보존적 치환을 실행한다. 분자의 산화 안정성을 개선하고 비정상적인 가교결합을 방지하기 위하여, 폴리펩티드의 적절한 입체 형태를 유지하는 데에 참여하지 않는 임의의 시스테인 잔기 또한 일반적으로 세린으로 치환할 수 있다. 역으로, 시스테인 결합(들)을 폴리펩티드에 첨가하여 그의 안정성을 개선할 수 있다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)는 융합 또는 키메릭 폴리펩티드이며, 이는 폴리펩티드에 대해 전형적으로 이종성인(예를 들어, 본 개시의 폴리펩티드와는 상이한 공급원으로부터 유도됨) 하나 이상의 융합 세그먼트에 부착된 본 개시의 폴리펩티드의 도메인을 포함한다. 적합한 융합 또는 키메릭 세그먼트는, 폴리펩티드의 안정성을 증진하고/하거나, 다른 바람직한 생물학적 활성 또는 증진된 수준의 바람직한 생물학적 활성을 제공하고/하거나, 폴리펩티드의 정제(예를 들어, 친화도 크로마토그래피에 의함)를 용이하게 할 수 있는 세그먼트를 제한 없이 포함한다. 적합한 융합 세그먼트는, 목적하는 작용(예를 들어, 증가된 안정성, 용해도, 기능, 또는 생물학적 활성을 부여하고/하거나; 폴리펩티드의 정제를 단순화함)을 갖는 임의의 크기의 도메인일 수 있다. 본 발명의 융합 또는 혼성 폴리펩티드는 2개 이상의 융합 또는 키메릭 세그먼트로부터 작제할 수 있으며, 이들 각각 또는 이들 중 2개 이상은 상이한 공급원 또는 미생물로부터 유도된다. 융합 또는 혼성 세그먼트는 본 개시의 폴리펩티드의 도메인(들)의 아미노 말단 및/또는 카르복실 말단에 연결될 수 있다. 융합 세그먼트는 절단에 민감할 수 있다. 이러한 민감성을 갖는 것에는 일부 이점이 존재할 수 있으며, 예를 들어, 그것은 관심의 대상인 폴리펩티드의 간단한 회수를 가능하게 할 수 있다. 폴리펩티드를 암호화하는 융합 핵산으로 형질감염된 재조합 세포를 배양함으로써 융합 폴리펩티드를 생성시킬 수 있으며, 이는 폴리펩티드의 카르복실 말단부(terminal end) 또는 아미노 말단부에 부착된 융합 세그먼트, 또는 카르복실 말단부 및 아미노 말단부 양자 모두에 부착된 융합 세그먼트, 또는 그의 도메인을 포함한다.
따라서, 본 개시의 폴리펩티드는 또한, 유전자 융합(예를 들어, 과발현되고, 가용성인, 발현 산물의 활성 형태), 돌연변이 유발된 유전자(예를 들어, 유전자 전사 및 번역을 증진하는 코돈 개질을 갖는 유전자), 및 절단된 유전자(예를 들어, 신호 서열이 제거되거나 이종성 신호 서열로 치환된 유전자)의 발현 산물을 포함한다.
불용성 기질을 이용하는 글리코실 하이드롤라아제는 종종 모듈형 효소(modular enzyme)이다. 그들은 하나 이상의 비-촉매 탄수화물-결합 도메인(CBM)에 첨부된 촉매 모듈을 포함할 수 있다. 사실상, CBM은 글리코실 하이드롤라아제와 그의 표적 기질 다당류와의 상호작용을 촉진하는 것으로 생각된다. 따라서 본 개시는, 예를 들어, "스플라이스드-인(spliced-in)" 이종성 CBM의 결과로서 다중 기질을 갖는 키메릭 효소를 포함하는, 변경된 기질 특이성을 갖는 키메릭 효소를 제공한다. 본 개시의 키메릭 효소의 이종성 CBM을 또한 모듈형으로 설계함으로써 그들이 촉매 모듈 또는 촉매 도메인( 예를 들어, 활성 부위에서의 "CD")에 첨부되도록 할 수 있으며, 이는 아마도 글리코실 하이드롤라아제에 대해 이종성 또는 상동성일 수 있다.
따라서, 본 개시는 CBM/CD 모듈을 포함하거나 이들로 구성된 펩티드 및 폴리펩티드를 제공하며, 이는 상동적으로 쌍을 이루거나 연결되어 키메릭(이종성) CBM/CD 쌍을 형성할 수 있다. 따라서, 이들 키메릭 폴리펩티드/펩티드를 사용하여 관심의 대상인 효소의 성능을 개선하거나 변경할 수 있다.
일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 제공되며, 이는 본 개시의 도 1에 나타낸 서열을 가진 폴리펩티드 중 어느 하나의 하나 이상의 CD 및/또는 CBM을 포함한다. 예를 들어, 도 1의 적합한 GH61 엔도글루카나아제 폴리펩티드는, 그들의 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스 Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), A. 푸미가투스 Afu6g09540으로부터의 NCBI Ref: XP_750843.1의 엔도글루카나아제, A. 푸미가투스 EDP47167의 엔도글루카나아제, T. 테레스트리스 16380의 엔도글루카나아제, T. 테레스트리스 155418의 엔도글루카나아제, T. 테레스트리스 68900의 엔도글루카나아제, C. 글로보섬으로부터의 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293으로부터의 젠뱅크 등록: XP_752040을 가진 엔도글루카나아제를 포함한다. 적합하게는, 폴리펩티드는 2개 이상의 상이한 폴리펩티드로부터의 작용성 도메인을 포함하는 융합 폴리펩티드일 수 있다(예를 들어, 하나의 폴리펩티드로부터의 CBM이 다른 폴리펩티드로부터의 CD에 연결됨).
적합하게는, 본 개시의 폴리펩티드는 "실질적으로 순수한" 형태로 얻어지고/얻어지거나 사용될 수 있다. 예를 들어, 본 개시의 폴리펩티드는 주어진 조성물 내의 총 단백질의 약 80 중량% 이상(예를 들어, 약 85 중량%, 90 중량%, 91 중량%, 92 중량%, 93 중량%, 94 중량%, 95 중량%, 96 중량%, 97 중량%, 98 중량%, 또는 99 중량% 중 임의의 것 이상)을 구성하며, 이는 또한 완충제 또는 용액과 같은 다른 성분을 포함한다.
또한 적합하게는, 본 개시의 폴리펩티드는 배양 브로스(예를 들어, 사상 진균 배양 브로스) 내에서 얻어지고/얻어지거나 사용될 수 있다. 배양 브로스는 조작된 효소 조성물일 수 있으며, 예를 들어, 본 개시의 이종성 폴리펩티드를 발현시키도록 조작된 재조합 숙주 세포에 의해, 또는 본 개시의 내인성 폴리펩티드를 내인성 발현 수준보다 더 많거나 적은 양으로(예를 들어, 내인성 발현 수준보다 1-, 2-, 3-, 4-, 5-, 또는 그 이상의 배수로 더 많거나 적은 양으로) 발현시키도록 조작된 재조합 숙주 세포에 의해 배양 브로스가 생성될 수 있다. 또한, 배양 브로스는 본 개시의 복수의 폴리펩티드를 목적하는 비율로 발현시키도록 조작된 소정의 "통합" 숙주 세포 균주에 의해 생성될 수 있다.
핵산, 발현 카세트, 벡터, 및 숙주 세포
본 개시는 상기 제공된 폴리펩티드, 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드, GH61 엔도글루카나아제 또는 그의 변종, EG IV 또는 그의 변종, T. 레세이 Eg4 또는 그의 변종을 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 제공한다. 소정의 태양에서 본 개시는, 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 폴리펩티드, 또는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 이상의 동일성을 갖는 폴리펩티드를 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 제공한다.
소정의 태양에서 본 개시는, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로부터 선택된 하나 이상의 서열 모티프를 포함하는 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함) 중 어느 하나를 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 제공한다. 본 개시는, CBM 도메인(예를 들어, 작용성 CBM 도메인) 및/또는 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함하는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)를 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 추가로 제공한다.
본 개시는, T. 레세이 Eg4 폴리펩티드의 변종을 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 추가로 제공한다. 이러한 변종은 서열 번호 27의 잔기 22 내지 344에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상)의 서열 동일성을 가질 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 엔도글루카나아제 활성을 갖는다. 폴리펩티드 또는 그의 변종은, 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232 중 약 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 또는 12개 중 임의의 것 이상)에 상응하는 잔기를 포함할 수 있다. 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232에 상응하는 잔기를 포함할 수 있다. 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343 중 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 중 임의의 것 이상)에 상응하는 잔기를 포함할 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343에 상응하는 잔기를 포함한다.
본 개시는, 약 10개 이상, 예를 들어, 약 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 또는 1050개 중 임의의 것 이상의 뉴클레오티드의 영역에 걸쳐 서열 번호 30의 핵산 서열에 대해 약 70% 이상, 예를 들어, 약 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%; 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상의 동일성, 또는 완전한(100%) 동일성을 갖는 핵산 서열을 포함하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 제공한다. 일부 태양에서, 본 개시는 본 명세서에 제공된 폴리펩티드 중 어느 하나를 암호화하는 핵산을 제공한다. 본 명세서에는 또한, 서열 번호 30에 대해 약 80% 이상(예를 들어, 약 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상)의 동일성을 갖는 단리된 핵산이 제공된다.
일부 태양에는, 서열 번호 27의 아미노산 서열에 대해, 또는 서열 번호 27의 잔기 (i) 22 내지 255, (ii) 22 내지 343, (iii) 307 내지 343, (iv) 307 내지 344, 또는 (v) 22 내지 344에 대해, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)이 제공된다. 일부 태양에는, 서열 번호 30에 대해 70% 이상(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상)의 서열 동일성을 갖는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산), 또는 높은 엄격성 조건 하에 서열 번호 30의 상보체(complement), 또는 그의 단편에 혼성화될 수 있는 핵산이 제공된다. 본 명세서에 사용되는 바와 같이, 용어 "낮은 엄격성, 중간 엄격성, 높은 엄격성, 또는 매우 높은 엄격성 조건 하에 혼성화되다"는, 혼성화 및 세척을 위한 조건을 기재한다. 혼성화 반응을 수행하기 위한 지침은 문헌[Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1 - 6.3.6]에서 확인할 수 있다. 그 참고문헌에는 수성 및 비수성 방법이 기재되어 있으며, 둘 중의 어느 방법이든 사용할 수 있다. 본 명세서에 언급된 특정 혼성화 조건은 하기와 같다: 1) 낮은 엄격성 혼성화 조건: 6X 소듐 클로라이드/소듐 시트레이트(SSC) 중에 약 45℃, 이어서 0.2X SSC, 0.1% SDS 중에 50℃ 이상에서 2회 세척(낮은 엄격성 조건에 있어서 세척 온도는 55℃로 증가시킬 수 있음); 2) 중간 엄격성 혼성화 조건: 6X SSC 중에 약 45℃, 이어서 0.2X SSC, 0.1% SDS 중에 60℃에서 1회 이상 세척; 3) 높은 엄격성 혼성화 조건: 6X SSC 중에 약 45℃, 이어서 0.2.X SSC, 0.1% SDS 중에 65℃에서 1회 이상 세척; 및 바람직하게는, 4) 매우 높은 엄격성 혼성화 조건: 65℃에서 0.5M 소듐 포스페이트, 7% SDS, 이어서 0.2X SSC, 1% SDS에서 65℃에서 1회 이상 세척. 달리 특정되지 않는 한, 매우 높은 엄격성 조건 (4)가 바람직한 조건이다.
본 개시는 또한, 상기 핵산 중 임의의 것을 포함하는 발현 카세트 및/또는 벡터를 제공한다. 본 개시의 효소와 같은 폴리펩티드를 암호화하는 핵산은 프로모터에 작동적으로 연결될 수 있다. 구체적으로, 사상 진균 숙주에서의 재조합 발현을 목적으로 하는 경우, 프로모터는 사상 진균 프로모터일 수 있다. 핵산은, 예를 들어, 이종성 프로모터의 제어 하에 있을 수 있다. 핵산은 또한, 구성성 또는 유도성 프로모터의 제어 하에 발현될 수 있다. 사용할 수 있는 프로모터의 예는, 셀룰라아제 프로모터, 자일라나아제 프로모터, 1818 프로모터(트리코더마의 EST 맵핑에 의해 고발현 단백질로서 이전에 동정됨)를 포함하나, 이로 제한되지 않는다. 예를 들어 적합하게는, 프로모터는 셀로바이오하이드롤라아제, 엔도글루카나아제, 또는 β-글루코시다아제 프로모터일 수 있다. 특히 적합한 프로모터는, 예를 들어, T. 레세이 셀로바이오하이드롤라아제, 엔도글루카나아제, 또는 β-글루코시다아제 프로모터일 수 있다. 예를 들어, 프로모터는 셀로바이오하이드롤라아제 I(cbh1) 프로모터이다. 프로모터의 비제한적인 예는 cbh1, cbh2, egl1, egl2, egl3, egl4, egl5, pki1, gpd1, xyn1, 또는 xyn2 프로모터를 포함한다. 프로모터의 부가적인 비제한적인 예는 T. 레세이 cbh1, cbh2, egl1, egl2, egl3, egl4, egl5, pki1, gpd1, xyn1, 또는 xyn2 프로모터를 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "작동적으로 연결된"은, 프로모터가 선택된 DNA의 발현을 조절하는 것을 가능하게 하기 위하여, 선택된 뉴클레오티드 서열(예를 들어, 본 명세서에 기재된 폴리펩티드를 암호화하는)이 프로모터에 근접하여 존재함을 의미한다. 부가적으로, 전사 및 번역의 방향에 대하여 프로모터는 선택된 뉴클레오티드 서열의 업스트림에 위치한다. "작동적으로 연결된"은, 적당한 분자(예를 들어, 전사 활성화 단백질)가 조절 서열(들)에 결합될 경우에 유전자 발현을 허용하는 방식으로 뉴클레오티드 서열 및 조절 서열(들)이 연결됨을 의미한다.
본 개시는, 본 명세서에 기재된 폴리뉴클레오티드 벡터, 또는 발현 카세트 중 임의의 것을 함유하는 숙주 세포를 추가로 제공한다. 본 개시는 또한, 본 개시의 하나 이상의 폴리펩티드를 발현시키기 위해 사용할 수 있는 숙주 세포를 제공한다. 적합한 숙주 세포는 임의의 미생물의 세포(예를 들어, 박테리아, 원생 생물, 조류, 진균(예를 들어, 효모 또는 사상 진균), 또는 다른 미생물의 세포)를 포함하며, 바람직하게는 박테리아, 효모, 또는 사상 진균의 세포이다.
박테리아 속의 적합한 숙주 세포는 에스케리키아(Escherichia), 바실러스(Bacillus), 락토바실러스(Lactobacillus), 슈도모나스(Pseudomonas), 및 스트렙토마이세스(Streptomyces)의 세포를 포함하나, 이로 제한되지 않는다. 박테리아 종의 적합한 세포는, 예를 들어, 에스케리키아 콜라이(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 바실러스 리케니포르미스(Bacillus licheniformis), 락토바실러스 브레비스(Lactobacillus brevis), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 또는 스트렙토마이세스 리비단스(Streptomyces lividans)의 세포를 포함한다.
효모 속의 적합한 숙주 세포는, 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 칸디다(Candida), 한세눌라(Hansenula), 피치아(Pichia), 클루이베로마이세스(Kluyveromyces), 및 파피아(Phaffia)의 세포를 포함하나, 이로 제한되지 않는다. 효모 종의 적합한 세포는, 사카로마이세스 세레비시아(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 칸디다 알비칸스(Candida albicans), 한세눌라 폴리모르파(Hansenula polymorpha), 피치아 파스토리스(Pichia pastoris), P. 카나덴시스(P. canadensis), 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus), 및 파피아 로도자이마(Phaffia rhodozyma)의 세포를 포함하나, 이로 제한되지 않는다.
사상 진균의 적합한 숙주 세포는 아문(subdivision) 유미코티나(Eumycotina)의 모든 사상 형태를 포함한다. 사상 진균 속의 적합한 세포는, 아크레모니움(Acremonium), 아스페르길루스, 아우레오바시디움(Aureobasidium), 브제르칸데라, 세리포리옵시스, 크리소포리움(Chrysoporium), 코프리누스, 코리울루스, 코리나스쿠스(Corynascus), 케토미움(Chaetomium), 크립토코커스(Cryptococcus), 필로바시디움(Filobasidium), 푸사리움, 지베렐라(Gibberella), 휴미콜라, 마그나포르테(Magnaporthe), 무코르, 마이셀리오프토라, 무코르, 네오칼리마스틱스(Neocallimastix), 뉴로스포라, 파에실로마이세스(Paecilomyces), 페니실리움, 파네로카에테, 플레비아, 피로마이세스(Piromyces), 플레우로투스, 스키탈디움(Scytaldium), 스키조필룸(Schizophyllum), 스포로트리쿰(Sporotrichum), 탈라로마이세스, 테르모아스쿠스, 티엘라비아, 톨리포클라디움(Tolypocladium), 트라메테스, 및 트리코더마의 세포를 포함하나, 이로 제한되지 않는다. 사상 진균 종의 적합한 세포는, 아스페르길루스 아와모리, 아스페르길루스 푸미가투스, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리제, 크리소스포리움 루크노엔스, 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 푸사리움 베네나툼, 브제르칸데라 아두스타, 세리포리옵시스 아네이리나, 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아, 세리포리옵시스 길베센스, 세리포리옵시스 판노신타, 세리포리옵시스 리불로사, 세리포리옵시스 서브루파, 세리포리옵시스 서브베르미스포라, 코프리누스 시네레우스, 코리올루스 히르수투스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 뉴로스포라 인터미디아, 페니실리움 푸르푸로게눔, 페니실리움 카네센스, 페니실리움 솔리툼, 페니실리움 푸니쿨로섬 파네로카에테 크리소스포리움, 플레비아 라디아테, 플레우로투스 에린기, 탈라로마이세스 플라부스, 티엘라비아 테레스트리스, 트라메테스 빌로사, 트라메테스 베르시콜로르, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 트리코더마 레세이, 및 트리코더마 비리데의 세포를 포함하나, 이로 제한되지 않는다.
본 개시는 숙주 세포, 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 재조합에 의해 발현시키도록 조작된, 재조합 진균 숙주 세포 또는 재조합 사상 진균을 제공한다.
본 개시는 또한, 재조합 숙주 세포, 예를 들어, 재조합 진균 숙주 세포 또는 재조합 미생물, 예를 들어, T. 레세이 Xyn3, T. 레세이 Bgl1(또한 "Tr3A"라고 명명됨), Fv3A, Fv43D, 및 Fv51A 폴리펩티드를 재조합에 의해 발현시키도록 조작된, 재조합 T. 레세이와 같은 사상 진균을 제공한다. 예를 들어 적합하게는, 재조합 숙주 세포는 T. 레세이 숙주 세포이다. 적합하게는, 재조합 진균은 재조합 T. 레세이이다. 본 개시는, 예를 들어, T. 레세이 Eg4, T. 레세이 Xyn3, T. 레세이 Bgl1, Fv3A, Fv43D, 및 Fv51A 폴리펩티드를 재조합에 의해 발현시키도록 조작된 T. 레세이 숙주 세포를 제공한다. 대안적으로, 본 개시는 또한, 예를 들어, 아스페르길루스(예를 들어, A. 오리제(A. oryzae), A. 니게르(A. niger)) 숙주 세포 또는 본 명세서에 기재된 폴리펩티드를 재조합에 의해 발현시키도록 조작된 재조합 아스페르길루스인 재조합 숙주 세포 또는 재조합 미생물을 제공한다.
부가적으로 본 개시는, 당화에 적합한 비율로 적합한 효소를 포함하는 효소 블렌드를 발현시키도록 조작된 재조합 숙주 세포 또는 재조합 유기체를 제공한다. 재조합 숙주 세포는, 예를 들어, 진균 숙주 세포 또는 박테리아 숙주 세포이다. 재조합 진균은, 예를 들어, 재조합 T. 레세이, A. 오리제, A. 니게르, 또는 효모이다. 재조합 진균 숙주 세포는, 예를 들어, T. 레세이, A. 오리제, A. 니게르, 또는 효모 세포일 수 있다 재조합 박테리아 숙주 세포는, 예를 들어, 바실러스 서브틸리스, 또는 E. 콜라이 세포일 수 있다. 재조합 박테리아 유기체는, 예를 들어, 바실러스 서브틸리스 또는 E. 콜라이일 수 있다. 적합한 효소 블렌드 내에 존재하는 효소 비율/양의 예는 하기와 같이 본 명세서에 기재되어 있다.
조성물
본 개시는 또한, 셀룰라아제(들) 및/또는 헤미셀룰라아제(들)를 함유하는 효소 조성물과 같은 조성물(예를 들어, 비-천연 조성물)을 제공하며, 이를 사용하여 바이오매스 재료를 가수분해하고/하거나 바이오매스 혼합물(예를 들어, 효소 및 기질을 함유하는 바이오매스 당화 혼합물)의 점도를 감소시킬 수 있다.
셀룰라아제는 셀룰로오스(베타-1,4-글루칸 또는 베타 D-글루코시드 결합) 중합체를 글루코스, 셀로바이오스, 셀로올리고당류 등으로 가수분해할 수 있는 효소를 포함한다. 셀룰라아제는 전통적으로 하기의 3개 주요 부류로 나누어졌다: 엔도글루카나아제(EC 3.2.1.4)("EG"), 엑소글루카나아제 또는 셀로바이오하이드롤라아제(EC 3.2.1.91)("CBH"), 및 β-글루코시다아제(β-D-글루코사이드 글루코하이드롤라아제; EC 3.2.1.21)("BG")(Knowles et al., 1987, Trends in Biotechnology 5(9):255-261; Shulein, 1988, Methods in Enzymology, 160:234-242). 엔도글루카나아제는 셀룰로오스 섬유의 무정형 부분에 주로 작용하는 반면에, 셀로바이오하이드롤라아제는 결정질 셀룰로오스 또한 분해할 수 있다. 헤미셀룰라아제는, 예를 들어, 자일라나아제, β-자일로시다아제, 및 L-α-아라비노푸라노시다아제를 포함한다.
본 발명의 조성물은 하나 초과의 효소를 포함하는 다중-효소 블렌드일 수 있다. 적합하게는, 본 발명의 효소 조성물은 다른 미생물, 식물, 또는 유기체로부터 유도된 하나 이상의 부가적인 효소를 포함할 수 있다. 상승적 효소 조합 및 관련 방법이 고려된다. 본 개시는 다양한 유형의 바이오매스 재료를 분해하기 위한 효소 조성물에 포함된 효소의 최적 비율을 확인하는 방법을 포함한다. 이들 방법은, 예를 들어, 다양한 기질(예를 들어, 리그노셀룰로오스계 기질)을, 그들을 구성하는 발효가능한 당으로 효율적으로 전환시키는 단계를 달성하기 위해 본 발명의 효소 조성물에 포함될 효소의 최적 비율 또는 상대적 중량을 확인하기 위한 시험을 포함한다.
더 고등한 식물의 세포벽은 다양한 탄수화물 중합체(CP: carbohydrate polymer) 구성요소로 이루어져 있다. 이들 CP는 공유적 수단 및 비-공유적 수단을 통해 상호작용하여, 경성 세포벽을 형성하고 식물 내의 팽압에 저항하기 위해 필요한 구조적 견고성을 제공한다. 식물에서 발견되는 주요 CP는 셀룰로오스이며, 이는 세포벽의 구조적 골격을 형성한다. 셀룰로오스 생합성 중에, 폴리-β-1,4-D-글루코스의 쇄는 수소 결합 및 소수성 상호작용을 통해 자가 회합(self-associate)하여 셀룰로오스 미세섬유를 형성하며, 이는 추가로 자가 회합하여 더 큰 섬유를 형성한다. 셀룰로오스 미세섬유는 종종 구조적으로 불규칙하며, 변동 결정성(varying crystallinity)의 영역을 함유한다. 셀룰로오스 섬유의 결정화도는, 그의 구성요소 셀룰로오스 쇄 중에, 그리고 그 사이에 수소 결합이 얼마나 확고하게 정연한지에 따라 달라진다. 덜 정연한 결합을 가짐으로써 더 접근가능한 글루코스 쇄를 가진 영역을 무정형 영역이라고 지칭한다. 글루코스로의 셀룰로오스 탈중합화에 대한 일반적 모델은 최소 3개의 구별되는 효소적 활성을 포함한다. 접근가능한 단부의 수를 증가시키는 공정 중에, 엔도글루카나아제는 셀룰로오스 쇄를 더 짧은 쇄로 내부에서 절단하며, 이는 온전한 셀룰로오스 쇄보다 엑소글루카나아제 활성에 대해 더 민감하다. 이들 엑소글루카나아제(예를 들어, 셀로바이오하이드롤라아제)는 환원성 단부 또는 비-환원성 단부에 대해 특이적이며, 대부분의 경우에 셀로바이오스(글루코스의 이량체)를 유리시킨다. 이어서, 축적되는 셀로바이오스에 셀로바이아제(예를 들어, β-1,4-글루코시다아제)에 의한 글루코스로의 절단을 적용한다. 셀룰로오스는 무수-글루코스만을 함유한다. 반면에, 헤미셀룰로오스는 다수의 상이한 당 단량체를 함유한다. 예를 들어, 글루코스 이외에, 헤미셀룰로오스 내의 당 단량체는 자일로스, 만노스, 갈락토스, 람노스, 및 아라비노스 또한 포함할 수 있다. 헤미셀룰로오스는 주로 D-펜토오스 당을 함유하며, 간혹 소량의 L-당을 함유한다. 자일로스는 전형적으로 가장 많은 양으로 존재하나, 마누론산 및 갈락투론산 또한 존재하는 경향이 있다. 헤미셀룰로오스는 자일란, 글루쿠로노자일란, 아라비노자일란, 글루코만난, 및 자일로글루칸을 포함한다.
본 개시의 조성물(예를 들어, 효소 및 다중-효소 조성물)은 셀룰로오스 재료(예를 들어, 글루칸) 및/또는 헤미셀룰로오스 재료(예를 들어, 자일란, 아라비노자일란, 및 자일란-함유 기질 또는 아라비노자일란-함유 기질)의 당화에 사용될 수 있다. 적합하게는, 효소 블렌드/조성물은 비-천연 조성물이다.
본 명세서에 제공된 효소 조성물은 자일란-가수분해 효소, 헤미셀룰로오스-가수분해 효소 및/또는 셀룰로오스-가수분해 효소의 혼합물을 포함할 수 있으며, 이는 글루카나아제; 셀로바이오하이드롤라아제; L-α-아라비노푸라노시다아제; 자일라나아제; β-글루코시다아제; 및 β-자일로시다아제를 포함하는, 하나 이상의 셀룰라아제, 몇몇 셀룰라아제, 또는 모든 셀룰라아제를 포함한다. 본 개시는 또한, 비-천연 조성물일 수 있는 효소 조성물을 제공한다. 본 명세서에 사용되는 바와 같이, 용어 "효소 조성물"은, (1) 발효 브로스 또는 부분적으로 또는 완전히 단리되거나 정제된 형태의 구성요소 효소를 조합함으로써 제조된 조성물; (2) 하나 이상의 구성요소 효소를 발현시키도록 개질된 유기체에 의해 생성된 조성물; (소정의 실시 형태에서는, 하나 이상의 구성요소 효소를 발현시키기 위해 사용되는 유기체는 하나 이상의 유전자가 결실되도록 개질될 수 있고; 소정의 다른 실시 형태에서는, 하나 이상의 구성요소 효소를 발현시키기 위해 사용되는 유기체는 자일란 가수분해, 헤미셀룰로오스 가수분해, 및/또는 셀룰로오스 가수분해에 영향을 미치는 단백질을 추가로 포함할 수 있음); (3) 당화 또는 발효 반응 중에 구성요소 효소를 동시에, 별도로, 또는 순차적으로 조합함으로써 제조된 조성물; (4) 예를 들어, 당화 또는 발효 반응 중에 원위치 생성된 효소 혼합물; (5) 상기 (1) 내지 (4) 중 임의의 것 또는 전부에 따라 생성된 조성물을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "발효 브로스"는, 발효에 이어서 회수 및/또는 정제를 적용하지 않거나 최소로 적용하는, 발효에 의해 생성된 효소 제제를 지칭한다. 예를 들어, 미생물 배양물을 포화될 때까지 성장시켜, 단백질 합성(예를 들어, 효소의 발현)이 가능하도록 탄소-제한 조건 하에 인큐베이션한다. 이어서, 일단 효소(들)가 세포 배양 배지 내로 분비되면, 발효 브로스를 사용할 수 있다. 본 개시의 발효 브로스는 발효 종료시에 유도된 발효 재료의 분획화되지 않거나 분획화된 내용물을 함유할 수 있다. 예를 들어, 본 발명의 발효 브로스는 분획화되지 않으며, 미생물 세포(예를 들어, 사상 진균 세포)에 발효 공정이 적용된 후에 존재하는 소진된 배양 배지 및 세포 파편을 포함한다. 적합하게는, 발효 브로스는 소진된 세포 배양 배지, 세포외 효소, 및 생존하거나 살해된 미생물 세포를 함유할 수 있다. 대안적으로, 발효 브로스를 분획화하여 미생물 세포를 제거할 수 있다. 그러한 경우에, 발효 브로스는, 예를 들어, 소진된 세포 배양 배지 및 세포외 효소를 포함한다.
본 명세서에 제공된 셀룰라아제 조성물과 같은 효소 조성물은 칼코플루오르 어세이에 의해 결정할 때 0.1 이상(예를 들어 0.1 내지 0.4)의 산물 분율을 달성할 수 있다. 사용된 모든 화학물질은 분석용 등급이었다. 아비셀 PH-101은 FMC 바이오폴리머(FMC BioPolymer)(펜실베니아주 필라델피아 소재)로부터 구입하였다. 셀로바이오스 및 칼코플루오르 화이트는 시그마(Sigma)(미주리주 세인트루이스 소재)로부터 구입하였다. 인산으로 스웰링된 셀룰로오스(PASC: Phosphoric acid swollen cellulose)는 문헌[Walseth, TAPPI 1971, 35:228] 및 문헌[Wood, Biochem. J. 1971, 121:353-362]의 수정된 프로토콜을 사용하여 아비셀 PH-101로부터 제조하였다. 약술하면, 아비셀을 진한 인산에 가용화시킨 후에 차가운 탈이온수를 사용하여 침전시켰다. 셀룰로오스를 수집하고 추가의 물로 세척하여 pH를 중화시킨 후에, 그것을 50 mM 소듐 아세테이트(pH 5) 중의 1% 고체로 희석하였다. 모든 효소 희석은 50 mM 소듐 아세테이트 완충제(pH 5.0) 내로 실행하였다. GC220 셀룰라아제(다니스코 US 인코포레이티드(Danisco US Inc), 제넨코(Genencor))를 2.5, 5, 10, 및 15 mg 단백질/G PASC로 희석하여, 선형 보정 곡선을 생성시켰다. 보정 곡선의 범위 내에 들어오도록, 즉, 0.1 내지 0.4의 산물 분율의 응답을 얻도록, 시험할 샘플을 희석하였다. 96-웰 마이크로타이터 플레이트 내에서 150 ㎕의 차가운 1% PASC를 20 ㎕의 효소 용액에 첨가하였다. 플레이트를 덮고 이노바(Innova) 인큐베이터/진탕기 내에서 2 h 동안 50℃, 200 rpm에서 배양하였다. 100 mM 글리신(pH 10) 중의 50 μg/mL 칼코플루오르 100 ㎕로 반응을 켄칭(quenching)하였다. 형광 마이크로플레이트 판독기(몰리큘라 디바이시즈(Molecular Devices)의 스펙트라맥스(SpectraMax) M5) 상에서 여기 파장 Ex = 365 nm 및 방출 파장 Em = 435 nm로 형광을 판독하였다. 하기 수학식에 따라 결과를 산물 분율로서 표시한다:
FP = 1 - (Fl 샘플 - Fl 완충제 w/ 셀로바이오스)/(Fl 제로 효소 - Fl 완충제 w/셀로바이오스),
여기서 FP는 산물 분율이고, Fl = 형광 단위이다.
본 명세서에 구체적으로 기재된 효소 중 임의의 것을 본 명세서에 기재된 효소 중 임의의 하나 이상 또는 입수가능하고 적합한 임의의 다른 효소와 조합하여, 적합한 다중-효소 블렌드/조성물을 생성시킬 수 있다. 본 개시는 하기에 열거된 특정 예시적인 조합으로 한정되거나 제한되지 않는다.
예시적인 조성물
GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 비-천연 조성물이 제공된다. 본 발명은 또한, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 엔도글루카나아제 IV(예를 들어, T. 레세이 Eg4 폴리펩티드-보강된 전체 셀룰라아제)와 같은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드로 보강된 전체 셀룰라아제)를 포함하는 전체 셀룰라아제를 포함하는 비-천연 조성물을 제공한다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는, 본 명세서에 제공된 임의의 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드일 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 T. 레세이 Eg4 또는 그의 변종이다. T. 레세이 Eg4의 변종은 상기 제공된 변종 중 임의의 것일 수 있다.
도면을 포함하는 본 개시에서, 엔도글루카나아제는 "Eg" 또는 "Egl"이라고 본 명세서에서 호환적으로 지칭된다.
본 명세서에 사용되는 바와 같이, 용어 "천연 조성물"은, 하나 이상의 효소적 구성요소 또는 활성을 포함하는 천연 공급원에 의해 생성된 조성물을 지칭하며, 여기서 각각의 구성요소 또는 활성은, 그것이 인공적으로 개질되지 않은, 훼손되지 않은, 자연에서 발견되는 바와 같이 천연 공급원에 의해 생성되는 비율 및 수준으로 확인된다. 따라서 천연 조성물은, 구성요소 효소의 비율 또는 수준이 천연 유기체에 의해 그의 천연 환경에서 생성된 것으로부터 변경되지 않도록, 예를 들어, 셀룰로오스 분해효소 또는 헤미셀룰로오스 분해효소에 대해 개질되지 않은 유기체에 의해 생성된 것이다. 반면에, "비-천연 조성물"은, (1) 구성요소 셀룰로오스 분해효소 또는 헤미셀룰로오스 분해효소를 천연 비율 또는 비-천연(즉, 변경된) 비율로 조합하는 단계; 또는 (2) 하나 이상의 내인성 또는 외인성 효소를 발현시키거나, 과발현시키거나, 저발현시키도록 유기체를 개질하는 단계; 또는 (3) 하나 이상의 내인성 효소가 결실되도록 유기체를 개질하는 단계에 의해 생성된 조성물을 지칭한다. "비-천연 조성물"은 또한, 천연의 개질되지 않은 유기체이지만 조성물 내의 효소의 양이 그의 천연 서식지에서 성장한 천연 유기체에 의해 제조된 조성물 내에 존재하는 것과는 상이하도록, 유기체의 천연 환경과는 상이한 인공 배지 또는 환경에서 배양된 유기체에 의해 생성된 조성물을 지칭한다.
GH61 엔도글루카나아제 폴리펩티드 또는 그의 변종 중 어느 하나를 본 명세서에 기재된 조성물 중 임의의 것에 사용할 수 있다. 적합한 GH61 엔도글루카나아제는 본 개시의 도1에 나타낸 폴리펩티드 중 하나를 포함할 수 있다. 적합한 GH61 엔도글루카나아제는 그들의 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스 Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), A. 푸미가투스 Afu6g09540으로부터의 NCBI Ref: XP_750843.1의 엔도글루카나아제, A. 푸미가투스 EDP47167의 엔도글루카나아제, T. 테레스트리스 16380의 엔도글루카나아제, T. 테레스트리스 155418의 엔도글루카나아제, T. 테레스트리스 68900의 엔도글루카나아제, C. 글로보섬으로부터의 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293으로부터의 젠뱅크 등록: XP_752040을 가진 엔도글루카나아제를 포함한다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 GH61 엔도글루카나아제 또는 EG IV의 변종이다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 것, 또는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 동일성을 갖는 폴리펩티드를 포함하는 것이다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는 서열 번호 84 내지 91로부터 선택된 하나 이상의 모티프(2, 3, 4, 5, 6, 7, 또는 8 중 임의의 것 이상)를 포함할 수 있다. 그것은, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로 구성된 군으로부터 선택된 하나 이상의 서열 모티프(들)를 포함할 수 있다.
본 명세서에 기재된 조성물 또는 방법 중 어느 하나의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는 서열 번호 27의 잔기 22 내지 344에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상)의 서열 동일성을 가질 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은, 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232 중 약 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 또는 12개 중 임의의 것 이상)에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은, 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343 중 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 중 임의의 것 이상)에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 단리된다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 엔도글루카나아제 활성을 갖는다.
일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 엔도글루카나아제 IV, 예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종이다. 예를 들어, 본 개시는 T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 비-천연 조성물을 제공한다. T. 레세이 Eg4 폴리펩티드의 변종은 본 명세서에 기재된 T. 레세이 Eg4 폴리펩티드의 변종 중 어느 하나일 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 서열 번호 27의 아미노산 서열 또는 서열 번호 27의 잔기 22 내지 344를 포함한다.
일부 태양에는, 글리코실 하이드롤라아제 패밀리 61("GH61")/ 엔도글루카나아제 활성(예를 들어, T. 레세이 Eg4 또는 그의 변종)을 갖는 단리된(또는 실질적으로 정제된) 폴리펩티드를 포함하는 조성물이 제공된다. 폴리펩티드를 생성시키고, 폴리펩티드를 회수하고, 폴리펩티드를 단리하거나 정제하는 방법은 당업자에게 공지되어 있다.
본 명세서에 기재된 조성물 또는 방법 중 임의의 것의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 숙주 세포로부터 발현되며, 여기서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 핵산이 숙주 세포 내로 조작되어 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 발현시키는 숙주 세포에 대해 이종성이다.
본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드, 또는 그의 혼합물을 포함하는 조성물을 제공한다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 셀룰라아제 폴리펩티드(들)를 포함한다. 일부 태양에서, 셀룰라아제 폴리펩티드는 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드, 또는 β-글루코시다아제 활성을 갖는 폴리펩티드이다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 헤미셀룰라아제 폴리펩티드(들)를 포함한다. 일부 태양에서, 헤미셀룰라아제 폴리펩티드는 자일라나아제 활성을 갖는 폴리펩티드, β-자일로시다아제 활성을 갖는 폴리펩티드, 또는 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드이다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 셀룰라아제 폴리펩티드(들) 및 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 헤미셀룰라아제 폴리펩티드(들)를 추가로 포함한다. 본 명세서에 제공된 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 제공된다.
본 개시의 방법 및 조성물에 따라 사용하기 위한 셀룰라아제 및 헤미셀룰라아제는, 특히, 하기의 유기체 중 하나 이상으로부터 얻어지거나 재조합에 의해 생성될 수 있다: 크리니펠리스 스카펠라(Crinipellis scapella), 마크로포미나 파세올리나(Macrophomina phaseolina), 마이셀리오프토라 테르모필라, 소르다리아 피미콜라(Sordaria fimicola), 볼루텔라 콜레토트리코이데스(Volutella colletotrichoides), 티엘라비아 테레스트리스, 아크레모니움 종, 엑시디아 글란둘로사(Exidia glandulosa), 포메스 포멘타리우스(Fomes fomentarius), 스폰지펠리스 종(Spongipellis sp.), 리조플릭티스 로제아(Rhizophlyctis rosea), 리조무코르 푸실루스(Rhizomucor pusillus), 파이코마이세스 니테우스(Phycomyces niteus), 케토스틸룸 프레세니(Chaetostylum fresenii), 디플로디아 고시피나(Diplodia gossypina), 울로스포라 빌그라미(Ulospora bilgramii), 사코볼루스 딜루텔루스(Saccobolus dilutellus), 페니실리움 베루쿨로섬(Penicillium verruculosum), 페니실리움 크리소제눔(Penicillium chrysogenum), 테르모마이세스 베루코수스(Thermomyces verrucosus), 디아포르테 신제네시아(Diaporthe syngenesia), 콜레토트리쿰 라게나리움(Colletotrichum lagenarium), 니그로스포라 종(Nigrospora sp.), 자일라리아 하이포자일론(Xylaria hypoxylon), 넥트리아 피네아(Nectria pinea), 소르다리아 마크로스포라(Sordaria macrospora), 티엘라비아 테르모필라(Thielavia thermophila), 케토미움 모로룸(Chaetomium mororum), 케토미움 비르센스(Chaetomium virscens), 케토미움 브라질리엔시스(Chaetomium brasiliensis), 케토미움 쿠니콜로룸(Chaetomium cunicolorum), 시스파스토스포라 보니넨시스(Syspastospora boninensis), 클라도리눔 포에쿤디시뭄(Cladorrhinum foecundissimum), 사이탈리디움 테르모필라(Scytalidium thermophila), 글리오클라디움 카테눌라툼(Gliocladium catenulatum), 푸사리움 옥시스포룸 아종 리코페르시시(Fusarium oxysporum ssp. lycopersici), 푸사리움 옥시스포룸 아종 파시플로라(Fusarium oxysporum ssp. passiflora), 푸사리움 솔라니(Fusarium solani), 푸사리움 안구이오이데스(Fusarium anguioides), 푸사리움 포에(Fusarium poae), 휴미콜라 니그레센스(Humicola nigrescens), 휴미콜라 그리세아(Humicola grisea), 파네올루스 레티루기스(Panaeolus retirugis), 트라메테스 산구이네아(Trametes sanguinea), 스키조필룸 코무네(Schizophyllum commune), 트리코테시움 로제움(Trichothecium roseum), 마이크로스페롭시스 종(Microsphaeropsis sp.), 악소볼루스 스틱토이데우스 spej.(Acsobolus stictoideus spej.), 포로니아 푼크타타(Poronia punctata), 노둘리스포룸 종(Nodulisporum sp.), 트리코더마 종(예를 들어, 트리코더마 레세이), 및 실린드로카르폰 종(Cylindrocarpon sp.).
본 개시에서, 셀룰라아제 또는 헤미셀룰라아제는 셀룰로오스계 재료를 가수분해할 수 있는 효소의 발현을 유발하는 임의의 공지 미생물 발효 방법(들)으로부터 제조될 수 있다. 발효는 진탕 플라스크 배양, 소규모 또는 대규모 발효, 예를 들어, 셀룰라아제가 발현되거나 단리되는 것을 가능하게 하는 조건 하에 적합한 배지 내에서 수행되는, 실험실용 또는 산업용 발효기 내에서의 연속식, 회분식, 유가식, 또는 고체 상태 발효를 포함할 수 있다. 일반적으로, 미생물은 셀룰로오스계 재료를 가수분해할 수 있는 효소의 생성에 적합한 세포 배양 배지 내에서 배양된다. 배양은 탄소 및 질소 공급원, 및 무기 염류를 포함하는 적합한 영양 배지 내에서 당업계에 공지된 절차를 사용하여 이루어진다. 적합한 배양 배지, 온도 범위, 및 성장 및 셀룰라아제 생성에 적합한 다른 조건은 당업계에 공지되어 있다. 비제한적인 예로서, T. 레세이에 의한 셀룰라아제의 생성을 위한 통상의 온도 범위는 24℃ 내지 28℃이다.
본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 엔도글루카나아제 IV 폴리펩티드)를 포함하는 비-천연 조성물을 제공하며, 여기서 조성물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 엔도글루카나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 셀로바이오하이드롤라아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-글루코시다아제)(예를 들어, β-글루코시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 자일라나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-자일로시다아제)(예를 들어, β-자일로시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 및/또는 아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제)(예를 들어, L-α-아라비노푸라노시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드)를 추가로 포함한다. 본 명세서에 제공된 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 제공된다.
본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 예를 들어 T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 엔도글루카나아제 IV 폴리펩티드로 보강된 전체 셀룰라아제)를 포함하는 전체 셀룰라아제를 포함하는 비-천연 조성물을 제공하며, 여기서 조성물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 엔도글루카나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 셀로바이오하이드롤라아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-글루코시다아제)(예를 들어, β-글루코시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 자일라나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-자일로시다아제)(예를 들어, β-자일로시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 및/또는 아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제)(예를 들어, L-α-아라비노푸라노시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드)를 추가로 포함한다. 본 명세서에 제공된 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 제공된다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함한다. 일부 태양에서, 자일라나아제 활성을 갖는 폴리펩티드는 T. 레세이 Xyn3이다. 조성물은 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, 및/또는 Tn3B)를 추가로 포함할 수 있다. 조성물은 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 및/또는 그의 변종)를 추가로 포함할 수 있다. 조성물은 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 추가로 포함할 수 있다. 조성물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 EG1(또는 그의 변종) 및/또는 T. 레세이 EG2(또는 그의 변종))를 추가로 포함할 수 있다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함한다. 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(또는 2개 이상의 폴리펩티드)(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함할 수 있으며, 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(또는 2개 이상의 폴리펩티드)(예를 들어, T. 레세이 EG1(또는 그의 변종) 및/또는 T. 레세이 EG2(또는 그의 변종))를 추가로 포함한다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(또는 2개 이상의 폴리펩티드)(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, 및/또는 T. 레세이 Bxl1)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(또는 2개 이상의 폴리펩티드)(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 및/또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(2개 이상의 폴리펩티드)(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함할 수 있다.
일부 태양에서, 본 명세서에 기재된 폴리펩티드 중 임의의 것(예를 들어, 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드, 글루코시다아제 활성을 갖는 폴리펩티드(예를 들어, β-글루코시다아제), 자일라나아제 활성을 갖는 폴리펩티드, 자일로시다아제 활성을 갖는 폴리펩티드(예를 들어, β-자일로시다아제), 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제))은 본 명세서에 기재된 전체 셀룰라아제와 같은 전체 셀룰라아제의 구성요소일 수 있다. 본 명세서에 기재된 폴리펩티드 중 임의의 것은 상응하는 폴리펩티드(들)를 암호화하는 내인성 또는 외인성 유전자를 발현시킴으로써 생성시킬 수 있다. 일부 상황에서, 폴리펩티드(들)는 과발현되거나 저발현될 수 있다.
상기 조성물 중 임의 것에 관하여, 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 제공된다.
엔도글루카나아제 활성을 갖는 폴리펩티드
엔도글루카나아제 활성을 갖는 폴리펩티드는 내부 β-1,4 결합의 절단을 촉매하는 폴리펩티드를 포함한다. 엔도글루카나아제("EG")는 EC 3.2.1.4로 분류되는 셀룰라아제 효소의 군을 지칭한다. EG 효소는 셀룰로오스의 내부 베타-1,4 글루코시드 결합을 가수분해한다. EG는 셀룰로오스, 셀룰로오스 유도체(예를 들어, 카르복시 메틸 셀룰로오스), 리케닌의 1,4-베타-D-글리코시드 결합, 시리얼(cereal) 베타-D-글루칸 또는 자일로글루칸과 같은 혼합 베타-1,3 글루칸, 및 셀룰로오스계 구성요소를 함유하는 다른 식물 재료의 베타-1,4 결합의 내부가수분해(endohydrolysis)를 촉매한다. 문헌[Ghose, 1987, Pure and Appl. Chem. 59: 257-268]의 절차에 따라 카르복시메틸 셀룰로오스(CMC) 가수분해를 사용하여 EG 활성을 결정할 수 있다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 EG1(젠뱅크 등록 번호 HM641862.1) 및/또는 T. 레세이 EG2 폴리펩티드(젠뱅크 등록 번호 ABA64553.1)를 포함한다.
다른 예에서는, 열안정성 T. 테레스트리스 엔도글루카나아제(Kvesitadaze et al., Applied Biochem. Biotech. 1995, 50:137-143)를 본 개시의 방법 및 조성물에 사용한다. 그밖에, T. 레세이 EG3(젠뱅크 등록 번호 AAA34213.1)(Okada et al. Appl. Environ. Microbiol. 1988, 64:555-563), EG5(젠뱅크 등록 번호 AAP57754)(Saloheimo et al. Molecular Microbiology 1994, 13:219-228), EG6(도 89a)(미국 특허 공개 제20070213249호), 또는 EG7(젠뱅크 등록 번호 AAP57753)(미국 특허 공개 제20090170181호), A. 셀룰로라이티쿠스(A. cellulolyticus) EI 엔도글루카나아제(스위스-프롯(Swiss-Prot) 엔트리 P54583.1)(미국 특허 제5,536,655호), H. 인솔렌스 엔도글루카나아제 V(EGV)(프로틴 데이터 뱅크 엔트리 4ENG), S. 코코스포룸 엔도글루카나아제(도 89b)(미국 특허 공개 제20070111278호), A.아쿨레아투스(A. aculeatus) 엔도글루카나아제 F1-CMC(스위스-프롯 엔트리 P22669.1)(Ooi et al. Nucleic Acid Res. 1990, 18:5884), A. 카와치(A. kawachii) IFO 4308 엔도글루카나아제 CMCase-1(스위스-프롯 엔트리 Q96WQ8.1)(Sakamoto et al. Curr. Genet. 1995, 27:435-439), E. 카로토바라 엔도글루카나아제 CelS(젠뱅크 등록 번호 AAA24817.1)(Saarilahti et al. Gene 1990, 90:9-14); 또는 A. 테르모필룸(A. thermophilum) ALKO4245 엔도글루카나아제(미국 특허 공개 제20070148732호) 또한 사용할 수 있다. 부가적인 적합한 엔도글루카나아제는 예를 들어, 제WO 91/17243호, 제WO 91/17244호, 제WO 91/10732호, 미국 특허 제6,001,639호에 기재되어 있다. 엔도글루카나아제 활성을 갖는 폴리펩티드는 본 명세서에 제공된 엔도글루카나아제 중 어느 하나의 변종일 수 있다.
셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드
셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 1,4-D-글루칸 셀로바이오하이드롤라아제(E.C. 3.2.1.91) 활성을 갖는 폴리펩티드를 포함하며, 이는 셀룰로오스, 셀로테트리오스, 또는 임의의 베타-1,4-결합 글루코스 함유 중합체의 1,4-베타-D-글루코시드 결합의 가수분해를 촉매하여 쇄의 단부로부터 셀로바이오스를 방출한다. 본 발명의 목적상, 셀로바이오하이드롤라아제 활성은, 문헌[Lever et al., 1972, Anal. Biochem. 47: 273-279]의 PHBAH 방법에 의해 측정되는 바와 같이 셀룰로오스로부터의 수용성 환원당의 방출에 의해 결정될 수 있다. 카르복시메틸 셀룰로오스 또는 하이드록시에틸 셀룰로오스와 같은 치환된 셀룰로오스로부터의 환원당 방출의 유사한 측정에 의해, 셀로바이오하이드롤라아제의 엑소글루카나아제 공격 모드와 엔도글루카나아제 공격 모드를 구별할 수 있다(Ghose, 1987, Pure & Appl. Chem. 59: 257-268). 진정한 셀로바이오하이드롤라아제는, 비치환된 셀룰로오스 대 치환된 셀룰로오스에 대한 활성의 비율이 매우 높을 것이다(Bailey et al, 1993, Biotechnol. Appl. Biochem. 17: 65-76).
적합한 CBH는, A. 비스포루스(A. bisporus) CBH1(스위스 프롯 등록 번호 Q92400), A. 아쿨레아투스 CBH1(스위스 프롯 등록 번호 O59843), A. 니둘란스(A. nidulans) CBHA(젠뱅크 등록 번호 AF420019) 또는 CBHB(젠뱅크 등록 번호 AF420020), A.니게르 CBHA(젠뱅크 등록 번호 AF156268) 또는 CBHB(젠뱅크 등록 번호 AF156269), C. 푸르푸레아(C. purpurea) CBH1(스위스 프롯 등록 번호 O00082), C. 카르보나룸(C. carbonarum) CBH1(스위스 프롯 등록 번호 Q00328), C. 파라시티카(C. parasitica) CBH1(스위스 프롯 등록 번호 Q00548), F. 옥시스포룸(F. oxysporum) CBH1(Cel7A)(스위스 프롯 등록 번호 P46238), H. 그리세아(H. grisea) CBH1.2(젠뱅크 등록 번호 U50594), H. 그리세아 변종 테르모이데아(H.grisea var. thermoidea) CBH1(젠뱅크 등록 번호 D63515), CBHI.2(젠뱅크 등록 번호 AF123441), 또는 exo1(젠뱅크 등록 번호 AB003105), M. 알보마이세스(M. albomyces) Cel7B(젠뱅크 등록 번호 AJ515705), N. 크라사(N. crassa) CBHI(젠뱅크 등록 번호 X77778), P. 푸니쿨로섬(P. funiculosum) CBHI(Cel7A)(젠뱅크 등록 번호 AJ312295)(미국 특허 공개 제20070148730), P. 잔티넬룸(P. janthinellum) CBHI(젠뱅크 등록 번호 S56178), P.크리소스포리움 CBH(젠뱅크 등록 번호 M22220), 또는 CBHI-2(Cel7D)(젠뱅크 등록 번호 L22656), T. 에메르소니(T. emersonii) CBH1A(젠뱅크 등록 번호 AF439935), T. 비리데(T. viride) CBH1(젠뱅크 등록 번호 X53931), 또는 V. 볼바세아(V. volvacea) V14 CBH1(젠뱅크 등록 번호 AF156693)로부터 선택될 수 있다. 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 본 명세서에 제공된 CBH 중 어느 하나의 변종일 수 있다.
일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 CBH 1(스위스-프롯 엔트리 P62694.1)(또는 그의 변종) 및/또는 T. 레세이 CBH2(스위스-프롯 엔트리 P07987.1)(또는 그의 변종) 폴리펩티드를 포함한다. 문헌[Shoemaker et al. Bio/Technology 1983, 1:691-696]을 참조하고; 또한 문헌[Teeri et al. Bio/Technology 1983, 1:696-699], A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B(이들은 T. 레세이 CBH1의 상동체임); T. 테레스트리스 6A, S. 테르모필레 6A, 6B(이들은 T. 레세이 CBH2의 상동체임), 또는 그의 변종을 참조한다.
글루코시다아제 활성을 갖는 폴리펩티드
글루코시다아제 활성을 갖는 폴리펩티드는 베타-D-글루코사이드 글루코하이드롤라아제(E.C. 3.2.1.21) 활성을 갖는 폴리펩티드를 포함하며, 이는 베타-D-글루코스의 방출을 동반하여 셀로바이오스의 가수분해를 촉매한다. 본 발명의 목적상, 당업계에 공지된 방법, 예를 들어, HPLC에 의해 β-글루코시다아제 활성을 측정할 수 있다. 글루코시다아제 활성을 갖는 폴리펩티드는 GH 패밀리 1, 3, 9, 또는 48의 구성원을 제한 없이 포함하는 소정의 GH 패밀리의 구성원을 포함하며, 이는 셀로바이오스의 가수분해를 촉매하여 β-D-글루코스를 방출한다. 글루코시다아제 활성을 갖는 폴리펩티드는, 재조합 수단에 의해 다수의 미생물로부터 얻어지거나 상업적 공급원으로부터 구입한 β-글루코시다아제와 같은 β-글루코시다아제를 포함한다. 미생물로부터의 β-글루코시다아제의 예는, 박테리아 및 진균으로부터 얻어진 것들을 제한 없이 포함한다. 예를 들어, 적합하게는, β-글루코시다아제는 사상 진균으로부터 얻어진다. 일부 태양에서, 글루코시다아제 활성(예를 들어, β-글루코시다아제 활성)을 갖는 하나 이상의 폴리펩티드는 T. 레세이 Bgl1 폴리펩티드이다.
β-글루코시다아제는, 특히, A. 아쿨레아투스(Kawaguchi et al . Gene 1996, 173: 287-288), A. 카와치(Iwashita et al . Appl. Environ. Microbiol. 1999, 65: 5546-5553), A. 오리제(제WO 2002/095014호), C. 비아조테아(C. biazotea)(Wong et al. Gene, 1998, 207:79-86), P. 푸니쿨로섬(제WO 2004/078919호), S. 피불리게라(S. fibuligera)(Machida et al. Appl. Environ. Microbiol. 1988, 54: 3147-3155), S. 폼베(Wood et al. Nature 2002, 415: 871-880), 또는 T. 레세이(예를 들어, β-글루코시다아제 1(미국 특허 제6,022,725호), β-글루코시다아제 3(미국 특허 제6,982,159호), β- 글루코시다아제 4(미국 특허 제7,045,332호), β-글루코시다아제 5(미국 특허 제7,005,289호), β-글루코시다아제 6(미국 특허 공개 제20060258554호), β-글루코시다아제 7(미국 특허 공개 제20060258554호))로부터 얻어지거나 재조합에 의해 생성될 수 있다. β-글루코시다아제 활성을 갖는 폴리펩티드는 본 명세서에 제공된 β-글루코시다아제 중 어느 하나의 변종일 수 있다.
β-글루코시다아제를 암호화하는 내인성 또는 외인성 유전자를 발현시킴으로써 β-글루코시다아제를 생성시킬 수 있다. 예를 들어, β-글루코시다아제는, 예를 들어, 그램-양성 유기체(예를 들어, 바실러스 또는 악티노마이세테스(Actinomycetes)), 또는 진핵 숙주(예를 들어, 트리코더마, 아스페르길루스, 사카로마이세스, 또는 피치아)에 의해 세포외 공간 내로 분비될 수 있다. 일부 상황에서, β-글루코시다아제는 과발현되거나 저발현될 수 있다.
또한, β-글루코시다아제는 상업적 공급원으로부터 얻을 수 있다. 사용하기에 적합한 상업적 β-글루코시다아제 제제의 예는, 예를 들어, 악셀러라아제(Accellerase)(등록상표) BG(다니스코 US 인코포레이티드, 제넨코) 중의 T. 레세이 β-글루코시다아제; 노보자임(NOVOZYM)(상표) 188(A. 니게르로부터의 β-글루코시다아제); 메가자임(Megazyme)(아일랜드 소재의 메가자임 인터내셔날 아일랜드 리미티드(Megazyme International Ireland Ltd.))으로부터의 아그로박테리움 종(Agrobacterium sp.) β-글루코시다아제, 및 T. 마리티마(T. maritima) β-글루코시다아제를 포함한다.
β-글루코시다아제 활성은, 문헌[Chen et al., Biochimica et Biophysica Acta 1992, 121:54-60]에 의해 기재된 어세이와 같은 당업계에 공지된 다수의 적합한 수단에 의해 결정될 수 있으며, 여기서 1 pNPG는 50℃(122℉) 및 pH 4.8에서 4-니트로페닐-β-D-글루코피라노시드로부터 10 min 후에 유리된 1 ㎛oL의 니트로페놀을 의미한다.
자일라나아제 활성을 갖는 폴리펩티드
자일라나아제 활성은, 비색 아조-버치우드 자일란 어세이(azo-birchwood xylan assay)(S-AXBL, 아일랜드 소재의 메가자임 인터내셔날 아일랜드 리미티드)를 사용함으로써 측정할 수 있다.
자일라나아제 활성을 갖는 폴리펩티드는, 예를 들어, Xyn, Xyn2, AfuXyn2, 및/또는 AfuXyn5 폴리펩티드, 또는 그의 변종으로부터 선택된 제 A군 자일라나아제(Group A xylanase)를 포함할 수 있다.
본 명세서에 기재된 조성물 중 임의의 것은, 하나 이상의 제A군 자일라나아제에 부가하여, 또는 그 대신에, 하나 이상의 자일라나아제를 임의로 포함할 수 있다. 부가적인 하나 이상의 자일라나아제로서 임의의 자일라나아제(EC 3.2.1.8)를 사용할 수 있다. 적합한 자일라나아제는, 예를 들어, C. 사카로라이티쿰(C. saccharolyticum) 자일라나아제(Luthi et al. 1990, Appl. Environ. Microbiol. 56(9):2677-2683), T. 마리티마 자일라나아제(Winterhalter & Liebel, 1995, Appl. Environ. Microbiol. 61(5):1810-1815), 테르마토가 종(Thermatoga Sp.) 균주 FJSS-B.1 자일라나아제(Simpson et al. 1991, Biochem. J. 277, 413-417), B. 서큘란스(B. circulans) 자일라나아제(BcX)(미국 특허 제5,405,769호), A. 니게르 자일라나아제(Kinoshita et al. 1995, Journal of Fermentation and Bioengineering 79(5):422-428), S.리비단스 자일라나아제(Shareck et al. 1991, Gene 107:75-82; Morosoli et al. 1986 Biochem. J. 239:587-592; Kluepfel et al. 1990, Biochem. J. 287:45-50), B. 서브틸리스 자일라나아제(Bernier et al. 1983, Gene 26(1):59-65), C. 피미(C. fimi) 자일라나아제(Clarke et al., 1996, FEMS Microbiology Letters 139:27-35), P. 플루오레센스(P. fluorescens) 자일라나아제(Gilbert et al. 1988, Journal of General Microbiology 134:3239-3247), C. 테르모셀룸(C. thermocellum) 자일라나아제(Dominguez et al., 1995, Nature Structural Biology 2:569-576), B. 푸밀루스(B. pumilus) 자일라나아제(Nuyens et al. Applied Microbiology and Biotechnology 2001, 56:431-434; Yang et al. 1998, Nucleic Acids Res. 16(14B):7187), C. 아세토부틸리쿰(C. acetobutylicum) P262 자일라나아제(Zappe et al. 1990, Nucleic Acids Res. 18(8):2179), 또는 T. 하르지아눔(T. harzianum) 자일라나아제(Rose et al. 1987, J. Mol. Biol.194(4):755-756)를 포함한다. 자일라나아제 활성을 갖는 폴리펩티드는 본 명세서에 제공된 자일라나아제 중 어느 하나의 변종일 수 있다.
자일로시다아제(예를 들어, β-자일로시다아제) 활성을 갖는 폴리펩티드
자일로시다아제(예를 들어, β-자일로시다아제) 활성은, 발색성 기질 4-니트로페닐 베타-D-자일로피라노시드(pNPX, 시그마-알드리치(Sigma-Aldrich) N2132)를 사용함으로써 측정할 수 있다.
자일로시다아제(예를 들어, β-자일로시다아제) 활성을 갖는 폴리펩티드는 제1군 β-자일로시다아제 효소(예를 들어, Fv3A 또는 Fv43A) 또는 제2군 β-자일로시다아제 효소(예를 들어, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)일 수 있다. 일부 태양에서, 적합하게는, 본 명세서에 제공된 조성물 중 임의의 것은 하나 이상의 제1군 β-자일로시다아제 및 하나 이상의 제2군 β-자일로시다아제를 포함할 수 있다.
본 개시의 효소 블렌드/조성물과 같은, 본 명세서에 제공된 조성물 중 임의의 것은 상기 제1군 및/또는 제2군 β-자일로시다아제에 부가하여, 또는 그 대신에, 하나 이상의 β-자일로시다아제를 임의로 포함할 수 있다. 부가적인 β-자일로시다아제로서 임의의 β-자일로시다아제(EC 3.2.1.37)를 사용할 수 있다. 적합한 β-자일로시다아제는, 예를 들어, T. 에메르소니 Bxl1(Reen et al. 2003, Biochem Biophys Res Commun. 305(3):579-85), G. 스테아로테르모필루스 β-자일로시다아제(Shallom et al. 2005, Biochemistry 44:387-397), S. 테르모필리움 β-자일로시다아제(Zanoelo et al. 2004, J. Ind. Microbiol. Biotechnol. 31:170-176), T. 리그노룸(T. lignorum) β-자일로시다아제(Schmidt, 1998, Methods Enzymol. 160:662-671), A. 아와모리(A. awamori) β-자일로시다아제(Kurakake et al. 2005, Biochim. Biophys. Acta 1726:272-279), A. 베르시콜로르(A. versicolor) β-자일로시다아제(Andrade et al. 2004, Process Biochem. 39:1931-1938), 스트렙토마이세스 종 β-자일로시다아제(Pinphanichakarn et al. 2004, World J. Microbiol. Biotechnol. 20:727-733), T. 마리티마 β-자일로시다아제(Xue and Shao, 2004, Biotechnol. Lett. 26:1511-1515), 트리코더마 종 SY β-자일로시다아제(Kim et al. 2004, J. Microbiol. Biotechnol. 14:643-645), A. 니게르 β-자일로시다아제(Oguntimein and Reilly, 1980, Biotechnol. Bioeng. 22:1143-1154), 또는 P. 워트만니(P. wortmanni) β-자일로시다아제(Matsuo et al. 1987, Agric. Biol. Chem. 51:2367-2379)를 포함한다. 자일로시다아제(예를 들어, β-자일로시다아제) 활성을 갖는 폴리펩티드는 본 명세서에 제공된 자일로시다아제 중 어느 하나의 변종일 수 있다.
아라비노푸라노시다아제 활성은, 발색성 기질 4-니트로페닐 알파-L-아라비노푸라노시드(pNPA, 시그마-알드리치 N3641)에 의해 측정될 수 있다.
본 개시의 효소 블렌드/ 조성물과 같은, 본 명세서에 제공된 조성물 중 어느 하나는, 예를 들어 적합하게는, 아라비노푸라노시다아제 활성(예를 들어, L-α-아라비노푸라노시다아제 활성)을 갖는 하나 이상의 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제)를 포함할 수 있다. L-α-아라비노푸라노시다아제는, 예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종일 수 있다.
본 개시의 효소 블렌드/조성물은, 전술한 L-α-아라비노푸라노시다아제에 부가하여, 또는 그 대신에, 하나 이상의 L-α-아라비노푸라노시다아제를 임의로 포함할 수 있다. 부가적인 L-α-아라비노푸라노시다아제로서 임의의 적합한 유기체로부터의 L-α-아라비노푸라노시다아제(EC 3.2.1.55)를 사용할 수 있다. 적합한 L-α-아라비노푸라노시다아제는, 예를 들어, A. 오리제(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), A. 소제(A. sojae)(Oshima et al. J. Appl. Glycosci. 2005, 52:261-265), B. 브레비스(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), B. 스테아로테르모필루스(B. stearothermophilus)(Kim et al., J. Microbiol. Biotechnol. 2004, 14:474-482), B. 브레베(B. breve)(Shin et al., Appl. Environ. Microbiol. 2003, 69:7116-7123), B. 론굼(B. longum)(Margolles et al., Appl. Environ. Microbiol. 2003, 69:5096-5103), C. 테르모셀룸(Taylor et al., Biochem. J. 2006, 395:31-37), F. 옥시스포룸(Panagiotou et al., Can. J. Microbiol. 2003, 49:639-644), F. 옥시스포룸 f. 종 디안티(F. oxysporum f. sp. dianthi)(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), G. 스테아로테르모필루스(G. stearothermophilus) T-6(Shallom et al., J. Biol. Chem. 2002, 277:43667-43673), H. 불가레(H. vulgare)(Lee et al., J. Biol. Chem. 2003, 278:5377-5387), P. 크리소제눔(P. chrysogenum)(Sakamoto et al., Biophys. Acta 2003, 1621:204-210), 페니실리움 종(Rahman et al., Can. J. Microbiol. 2003, 49:58-64), P. 셀룰로사(P. cellulosa)(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), R. 푸실루스(R. pusillus)(Rahman et al., Carbohydr. Res. 2003, 338:1469-1476), S. 카르트레우시스(S. chartreusis), S. 테르모비올라쿠스(S. thermoviolacus), T. 에탄올리쿠스(T. ethanolicus), T. 자일라닐리티쿠스(T. xylanilyticus)(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), T. 푸스카(T. fusca)(Tuncer and Ball, Folia Microbiol. 2003, (Praha) 48:168-172), T. 마리티마(Miyazaki, Extremophiles 2005, 9:399-406), 트리코더마 종 SY (Jung et al. Agric. Chem. Biotechnol. 2005, 48:7-10), A. 카와치(Koseki et al., Biochim. Biophys. Acta 2006, 1760:1458-1464), F. 옥시스포룸 f. 종 디안티(Chacon-Martinez et al., Physiol.Mol. Plant Pathol. 2004,64:201-208), T. 자일라닐리티쿠스 (Debeche et al., Protein Eng. 2002, 15:21-28), H. 인솔렌스(H. insolens), M. 기간테우스(M. giganteus)(Sorensen et al., Biotechnol. Prog. 2007, 23:100-107), 또는 R. 사티부스(R. sativus)(Kotake et al. J. Exp. Bot. 2006, 57:2353-2362)의 L-α-아라비노푸라노시다아제를 포함한다. 아라비노푸라노시다아제 활성을 갖는 폴리펩티드는, 본 명세서에 기재된 아라비노푸라노시다아제 중 어느 하나의 변종일 수 있다.
본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 EG1(또는 그의 변종) 및/또는 T. 레세이 EG2(또는 그의 변종)를 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, 셀로바이오하이드롤라아제("CBH") 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종을 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, 및/또는 Tn3B를 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 및/또는 그의 변종을 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, 및/또는 AfuXyn5를 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 및/또는 그의 변종을 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드는 제1군 β-자일로시다아제 또는 제2군 β-자일로시다아제이며, 여기서 제1군 β-자일로시다아제는 Fv3A, Fv43A, 또는 그의 변종을 포함하고, 제2군 β-자일로시다아제는 Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종을 포함한다. 일부 태양에서, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드는 F. 베르티실리오이데스(F. verticillioides) Fv3A, F. 베르티실리오이데스 Fv43D, 또는 그의 변종을 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Af43A, Fv43B, Pf51A, Pa51A, 및/또는 Fv51A를 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 및/또는 그의 변종을 포함한다.
전체 셀룰라아제
본 개시의 효소 블렌드/조성물과 같은, 본 명세서에 제공된 조성물 중 임의의 것은 전체 셀룰라아제를 포함할 수 있다.
본 명세서에 사용되는 바와 같이, "전체 셀룰라아제"는, (1) 엔도글루카나아제, (2) 셀로바이오하이드롤라아제, 및 (3) β-글루코시다아제의 3개 이상의 상이한 효소 유형을 포함하거나, (1) 내부 β-1,4 결합의 절단을 촉매하여, 더 짧은 글루코올리고당류(glucooligosaccharide)를 생성시키는 엔도글루카나아제 활성, (2) 셀로바이오스 단위(β-1,4 글루코스-글루코스 이당류)의 "엑소"-유형 방출을 촉매하는 셀로바이오하이드롤라아제 활성, 및 (3) 짧은 셀로올리고당류(예를 들어, 셀로바이오스)로부터 글루코스 단량체의 방출을 촉매하는 β-글루코시다아제 활성의 3개 이상의 상이한 효소 활성을 포함하는, 천연 또는 비-천연 셀룰라아제-함유 조성물을 지칭한다. 전체 셀룰라아제는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, EG2(또는 그의 변종) 및/또는 EG4(또는 그의 변종)), 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, CBH1(또는 그의 변종) 및/또는 CBH2(또는 그의 변종)), 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Bgl1 또는 그의 변종)를 포함할 수 있다.
"천연 셀룰라아제-함유" 조성물은 천연 공급원에 의해 생성되는 것으로서, 이는 하나 이상의 셀로바이오하이드롤라아제-유형, 하나 이상의 엔도글루카나아제-유형, 및 하나 이상의 β-글루코시다아제-유형 구성요소 또는 활성을 포함하며, 여기서 각각의 이들 구성요소 또는 활성은 인공적으로 훼손되지 않은, 자연에서 생성되는 비율 및 수준으로 확인된다. 따라서 천연 셀룰라아제-함유 조성물은, 구성요소 효소의 비율 또는 수준이 자연에서 천연 유기체에 의해 생성되는 것으로부터 변경되지 않도록, 예를 들어, 셀룰로오스 분해효소에 대해 개질되지 않은 유기체에 의해 생성된 것이다. "비-천연 셀룰라아제-함유 조성물"은, (1) 구성요소 셀룰로오스 분해효소를 천연 비율 또는 비-천연(즉, 변경된) 비율로 조합하는 단계; 또는 (2) 하나 이상의 셀룰로오스 분해효소를 과발현시키거나 저발현시키도록 유기체를 개질하는 단계; 또는 (3) 하나 이상의 셀룰로오스 분해효소가 결실되도록 유기체를 개질하는 단계에 의해 생성된 조성물을 지칭한다. "비-천연 셀룰라아제 함유" 조성물은 또한, 천연 유기체가 비-천연 조건 하에 성장하고 변경된 수준 또는 비율의 효소를 생성시키도록 천연 유기체에 대한 배양 조건을 조정함으로써 생성시킨 조성물을 지칭할 수 있다. 따라서 일부 실시 형태에서, 본 개시의 전체 셀룰라아제 제제는 결실되고/되거나 과발현된 하나 이상의 EG 및/또는 CBH 및/또는 β-글루코시다아제를 가질 수 있다.
일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 엔도글루카나아제 IV 폴리펩티드)를 포함하는 비-천연 조성물 또는 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 엔도글루카나아제 IV 폴리펩티드로 보강된 전체 셀룰라아제)를 포함하는 비-천연 조성물이 제공되며, 여기서 조성물은 전체 셀룰라아제, 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 엔도글루카나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 셀로바이오하이드롤라아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-글루코시다아제)(예를 들어, β-글루코시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 자일라나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-자일로시다아제)(예를 들어, β-자일로시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 및/또는 아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제)(예를 들어, L-α-아라비노-푸라노시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드)를 추가로 포함한다. 다양한 효소 활성을 갖는 폴리펩티드는 상기에 기재되어 있다.
일부 태양에서, 전체 셀룰라아제는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드, 예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종을 포함한다. 일부 태양에서, 전체 셀룰라아제는 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드, 예를 들어, T. 레세이 CBH1, T. 레세이 CBH2, 또는 그의 변종을 포함한다. 일부 태양에서, 전체 셀룰라아제는 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드, 예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종을 포함한다.
본 개시에서, 전체 셀룰라아제 제제는 셀룰로오스계 재료를 가수분해할 수 있는 임의의 미생물로부터 얻어질 수 있다. 일부 실시 형태에서, 전체 셀룰라아제 제제는 진균 또는 박테리아 전체 셀룰라아제이다. 예를 들어, 전체 셀룰라아제 제제는 아크레모니움, 아스페르길루스, 크리소스포리움, 에메리셀라(Emericella), 푸사리움, 휴미콜라, 무코르, 마이셀리오프토라, 뉴로스포라, 페니실리움, 사이탈리디움, 티엘라비아, 톨리포클라디움, 트리코더마, 또는 효모 종으로부터 얻어질 수 있다.
전체 셀룰라아제 제제는, 예를 들어, 아스페르길루스 아쿨레아투스(Aspergillus aculeatus), 아스페르길루스 아와모리, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 또는 아스페르길루스 오리제 전체 셀룰라아제일 수 있다. 그밖에, 전체 셀룰라아제 제제는 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 또는 푸사리움 베네나툼 전체 셀룰라아제 제제일 수 있다. 전체 셀룰라아제 제제는 또한, 크리소스포리움 루크노엔스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 페니실리움 푸르푸로게눔, 페니실리움 푸니쿨로섬, 사이탈리디움 테르모필룸(Scytalidium thermophilum), 또는 티엘라비아 테레스트리스 전체 셀룰라아제 제제일 수 있다. 전체 셀룰라아제 제제는 또한, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 트리코더마 레세이(예를 들어, RL-P37(Sheir-Neiss G et al. Appl. Microbiol. Biotechnology, 1984, 20, pp.46-53), QM9414(ATCC 번호 26921), NRRL 15709, ATCC 13631, 56764, 56466, 56767), 또는 트리코더마 비리데(예를 들어, ATCC 32098 및 32086) 전체 셀룰라아제 제제일 수 있다.
전체 셀룰라아제 제제는 통합 균주 T. 레세이 H3A 또는 H3A/Eg4 #27(본 명세서의 실시예에 기재된 바와 같음) 제제일 수 있다.
적합하게는, 전체 셀룰라아제 제제는 T. 레세이 RutC30 전체 셀룰라아제 제제일 수 있으며, 이는 미국 미생물 보존센터(American Type Culture Collection)로부터 T. 레세이 ATCC 56765로서 입수가능하다. 예를 들어 적합하게는, 전체 셀룰라아제 제제는 또한 P. 푸니쿨로섬의 전체 셀룰라아제일 수 있으며, 이는 미국 미생물 보존센터로부터 P. 푸니쿨로섬 ATCC 번호: 10446으로서 입수가능하다.
전체 셀룰라아제 제제는 또한 상업적인 공급원으로부터 얻을 수 있다. 본 개시의 방법 및 조성물에 사용하기에 적합한 상업적인 셀룰라아제 제제의 예는, 예를 들어, 셀루클라스트(CELLUCLAST)(상표) 및 셀릭(Cellic)(상표)(노보자임즈 A/S(Novozymes A/S)) 및 라미넥스(LAMINEX)(상표) BG, 인디에이지(IndiAge)(상표) 44L, 프리마패스트(Primafast)(상표) 100, 프리마패스트(상표) 200, 스페자임(Spezyme)(상표) CP, 악셀러라아제(등록상표) 1000 및 악셀러라아제(등록상표) 1500(다니스코 US. 인코포레이티드, 제넨코)을 포함한다.
셀룰로오스계 재료를 가수분해할 수 있는 효소의 발현을 유발하는 임의의 공지 미생물 배양 방법, 특히 발효를 사용하여 적합한 전체 셀룰라아제 제제를 제조할 수 있다. 본 명세서에 사용되는 바와 같이, "발효"는 진탕 플라스크 배양, 소규모 또는 대규모 발효, 예를 들어, 관심의 대상인 셀룰라아제 및/또는 효소가 발현되고/되거나 단리되는 것을 가능하게 하는 조건 하에 적합한 배지 내에서 수행되는 실험실용 또는 산업용 발효기 내에서의 연속식, 회분식, 유가식, 또는 고체 상태 발효를 지칭한다. 일반적으로, 미생물은 셀룰로오스계 재료를 가수분해할 수 있는 효소의 생성에 적합한 세포 배양 배지 내에서 배양된다. 배양은 탄소 및 질소 공급원 및 무기 염류를 포함하는 영양 배지 내에서 공지의 절차 및 변동을 사용하여 이루어진다. 배양 배지, 온도 범위, 및 성장 및 셀룰라아제 생성을 위한 다른 조건은 공지되어 있다. 비제한적인 예로서, T. 레세이에 의한 셀룰라아제의 생성을 위한 전형적인 온도 범위는 24℃ 내지 28℃이다.
전체 셀룰라아제 제제는, 그것이 발효에 의해 생성된 그대로, 회수 및/또는 정제를 하지 않거나 최소로 하여 사용할 수 있다. 그러한 의미에서, 전체 셀룰라아제 제제는 전체 브로스 제형으로 사용할 수 있다. 예를 들어, 일단 셀룰라아제가 세포 배양 배지 내로 분비되면, 셀룰라아제를 함유하는 세포 배양 배지를 직접 사용할 수 있다. 전체 셀룰라아제 제제는, 소진된 세포 배양 배지, 세포외 효소, 및 세포를 포함하는, 발효 재료의 분획화되지 않은 내용물을 포함할 수 있다. 반면에, 전체 셀룰라아제 제제에는 또한, 다수의 일상적 단계 중에 추가의 가공, 예를 들어, 침전, 원심분리, 친화도 크로마토그래피, 여과 등을 적용할 수 있다. 예를 들어, 전체 셀룰라아제 제제를 농축한 후에, 추가의 정제 없이 사용할 수 있다. 전체 셀룰라아제 제제는, 예를 들어, 발효 후에 세포 생존 능력을 감소시키거나 세포를 살해하는 소정의 화학 약제를 포함하도록 제형화될 수 있다. 예를 들어, 공지 방법을 사용하여 세포를 용혈시키거나 투과화시킬 수 있다.
전체 셀룰라아제 제제의 엔도글루카나아제 활성은 카르복시메틸 셀룰로오스(CMC)를 기질로서 사용하여 결정할 수 있다. 적합한 어세이는 CMC에 작용하는 효소 혼합물에 의해 만들어진 환원성 단부의 생성을 측정하며, 여기서 1 단위는 1 ㎛oL의 산물/min을 유리시키는 효소의 양이다(Ghose, T. K., Pure & Appl. Chem. 1987, 59, pp. 257-268).
전체 셀룰라아제는 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드, 예를 들어, EG IV-보강된(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종으로 보강된 것과 같은 것) 셀룰라아제로 보강될 수 있다. 일반적으로, EG IV-보강된 전체 셀룰라아제는 EG IV 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 것) 및 전체 셀룰라아제 제제를 포함한다. EG IV-보강된 전체 셀룰라아제 조성물은 재조합 수단에 의해 생성될 수 있다. 예를 들어, 전체 셀룰라아제를 생성시킬 수 있는 미생물 내에서 EG IV를 발현시킴으로써 이러한 전체 셀룰라아제 제제를 달성할 수 있다. EG IV-보강된 전체 셀룰라아제 조성물은 또한, 예를 들어, 전체 셀룰라아제 제제 및 EG IV(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 것)를 포함할 수 있다. 예를 들어, EG IV-보강된(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종으로 보강된) 전체 셀룰라아제 조성물은, 적합하게는, 그 블렌드/조성물 내의 단백질의 총 중량을 기준으로 0.1 중량%, 1 중량%, 2 중량%, 5 중량%, 7 중량%, 10 중량%, 15 중량%, 또는 20 중량% 이상, 그리고 25 중량%, 30 중량%, 35 중량%, 40 중량%, 또는 50 중량% 이하의 EG IV를 포함할 수 있다.
전체 셀룰라아제는 β-글루코시다아제-보강된 셀룰라아제일 수 있다. 일반적으로, β-글루코시다아제-보강된 전체 셀룰라아제는 β-글루코시다아제 및 전체 셀룰라아제 제제를 포함한다. β-글루코시다아제-보강된 전체 셀룰라아제 조성물은 재조합 수단에 의해 생성될 수 있다. 예를 들어, 전체 셀룰라아제를 생성시킬 수 있는 미생물 내에서 β-글루코시다아제를 발현시킴으로써 이러한 전체 셀룰라아제 제제를 달성할 수 있다. β-글루코시다아제-보강된 전체 셀룰라아제 조성물은 또한, 예를 들어, 전체 셀룰라아제 제제 및 β-글루코시다아제를 포함할 수 있다. 예를 들어, β-글루코시다아제-보강된 전체 셀룰라아제 조성물은, 적합하게는, 그 블렌드/조성물 내의 단백질의 총 중량을 기준으로 0.1 중량%, 1 중량%, 2 중량%, 5 중량%, 7 중량%, 10 중량%, 15 중량%, 또는 20 중량% 이상, 그리고 25 중량%, 30 중량%, 35 중량%, 40 중량%, 또는 50 중량% 이하의 β-글루코시다아제를 포함할 수 있다.
소정의 진균은 엑소-셀로바이오하이드롤라아제 또는 CBH-유형 셀룰라아제, 엔도글루카나아제 또는 EG-유형 셀룰라아제, 및 β-글루코시다아제 또는 BG-유형 셀룰라아제를 포함하는 완전한 셀룰라아제 시스템을 생성시킨다(Schulein, 1988). 그러나, 간혹 이들 시스템에는 CBH-유형 셀룰라아제가 결여되어 있으며, 예를 들어, 박테리아 셀룰라아제 또한 전형적으로 CBH-유형 셀룰라아제를 포함하지 않거나 거의 포함하지 않는다. 부가적으로, EG 구성요소 및 CBH 구성요소는 상승적으로 상호작용하여 더 효율적으로 셀룰로오스를 분해하는 것으로 나타났다. 예를 들어, 문헌[Wood, 1985]을 참조한다. 다중-구성요소 또는 완전한 셀룰라아제 시스템 내의 상이한 구성요소, 즉, 다양한 엔도글루카나아제 및 엑소셀로바이오하이드롤라아제는, 일반적으로 상이한 특성, 예를 들어, 등전점, 분자량, 글리코실화도, 기질 특이성, 및 효소적 기능 패턴을 갖는다.
일부 태양에서, 셀룰라아제는 발효에 의해 생성된 그대로, 회수 및/또는 정제를 하지 않거나 최소로 하여 사용한다. 예를 들어, 일단 세포에 의해 셀룰라아제가 세포 배양 배지 내로 분비되면, 셀룰라아제를 함유하는 세포 배양 배지를 사용할 수 있다. 일부 태양에서, 전체 셀룰라아제 제제는, 세포 배양 배지, 세포외 효소, 및 세포를 포함하는, 발효 재료의 분획화되지 않은 내용물을 포함한다. 대안적으로, 전체 셀룰라아제 제제는 임의의 편리한 방법, 예를 들어, 침전, 원심분리, 친화도, 여과, 또는 당업계에 공지된 임의의 다른 방법에 의해 가공될 수 있다. 일부 태양에서는, 예를 들어, 전체 셀룰라아제 제제를 농축한 후 추가의 정제 없이 사용할 수 있다. 일부 태양에서, 전체 셀룰라아제 제제는 세포 생존 능력을 감소시키거나 세포를 살해하는 화학 약제를 포함한다. 일부 태양에서는, 당업계에 공지된 방법을 사용하여 세포를 용혈시키거나 투과화시킨다.
GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하는 조성물이 제공되며, 여기서 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드를 발현시키는 숙주 세포에 대해 이종성이다. 일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하는 조성물이 제공되며, 여기서 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포로부터 발현되고, 여기서 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 대해 내인성이다. 셀룰라아제 폴리펩티드는 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 EG1 또는 그의 변종, T. 레세이 EG2 또는 그의 변종), 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종), 또는 β-글루코시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있다. 헤미셀룰라아제 폴리펩티드는 자일라나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종), β-자일로시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종), 또는 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함할 수 있다.
일부 태양에서, 조성물은 발효 브로스로부터 얻어진다. 조성물은 균주의 발효 브로스로부터 얻어질 수 있으며, 여기서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 암호화하는 핵산은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 발현시키는 숙주 세포에 대해 이종성이다(예를 들어, 균주 내로 통합되거나 숙주 균주 내에서 벡터로부터 발현됨). 조성물은 통합 균주(예를 들어, 실시예에서와 같은 H3A/Eg4, #27)의 발효 브로스로부터 얻어질 수 있다.
GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물은 전체 셀룰라아제를 포함할 수 있다. 따라서, T. 레세이 Eg4(또는 그의 변종), T. 레세이 Bgl1(또는 그의 변종), T. 레세이 xyn3(또는 그의 변종), Fv3A(또는 그의 변종), Fv43D(또는 그의 변종), 및 Fv51A(또는 그의 변종)를 포함하는 조성물이 제공된다(예를 들어, 비-천연 조성물).
일부 태양에서, 조성물은 단리된 T. 레세이 Eg4를 포함한다. 일부 태양에서, 조성물은 단리된 T. 레세이 Bgl1, 단리된 T. 레세이 xyn3, 단리된 Fv3A, 단리된 Fv43D, 및 단리된 Fv51A 중 하나 이상(2, 3, 4, 또는 5개 이상)을 포함한다.
일부 태양에서, 조성물은 발효 브로스로부터 얻어진다. 일부 태양에서, 조성물은 통합 균주(예를 들어, 본 명세서에서 실시예에 기재된 바와 같은 H3A/Eg4, #27)의 발효 브로스로부터 얻어진다. T. 레세이 Eg4 또는 T. 레세이 Eg4를 암호화하는 핵산은 T. 레세이 Eg4를 발현시키는 숙주 세포에 대해 이종성일 수 있다. T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, Fv51A, 또는 그의 변종을 암호화하는 하나 이상의 핵산은 T. 레세이 Eg4를 발현시키는 숙주 세포와 같은 숙주 세포에 대해 이종성일 수 있다. 일부 태양에서, T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, Fv51A, 또는 그의 변종을 암호화하는 하나 이상의 핵산은 T. 레세이 Eg4를 발현시키는 숙주 세포와 같은 숙주 세포에 대해 내인성이다.
상기 조성물 중 임의 것에 관하여, 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 기재된다.
조성물 내의 구성요소(들)의 양
본 명세서에 제공된 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 비-천연 조성물(또는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 전체 셀룰라아제를 포함하는 비-천연 조성물)은 본 명세서에 기재된 바와 같이 다양한 구성요소를 포함할 수 있으며, 여기서 각각의 구성요소는 다양한 양으로 조성물 내에 존재한다.
본 명세서에 제공된 조성물 또는 방법 중 어느 하나의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 부재 하의 수율에 비교하여, 바이오매스 재료의 가수분해로부터의 발효가능한 당(들)의 수율을 증가시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상 만큼) 충분한 양으로 조성물 내에 존재한다. 본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 부재 하의 가수분해 중의 바이오매스 혼합물의 점도에 비교하여, 바이오매스 재료의 가수분해 중에 바이오매스 혼합물의 점도를 감소시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상 만큼) 충분한 양으로 조성물 내에 존재할 수 있다. 조성물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드, 및/또는 전체 셀룰라아제, 또는 그의 혼합물을 추가로 포함할 수 있다. 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 양, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들)의 양, β-글루코시다아제 활성을 갖는 폴리펩티드(들)의 양, 자일라나아제 활성을 갖는 폴리펩티드(들)의 양, β-자일로시다아제 활성을 갖는 폴리펩티드(들)의 양, L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들)의 양, 또는 전체 셀룰라아제의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종), 엔도글루카나아제 활성을 갖는 폴리펩티드(들), 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들), β-글루코시다아제 활성을 갖는 폴리펩티드(들), 자일라나아제 활성을 갖는 폴리펩티드(들), β-자일로시다아제 활성을 갖는 폴리펩티드(들), L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들), 또는 전체 셀룰라아제의 부재 하의 수율에 비교하여, 바이오매스 재료의 가수분해로부터의 발효가능한 당(들)의 수율을 증가시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상 만큼) 충분하다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 양, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들)의 양, β-글루코시다아제 활성을 갖는 폴리펩티드(들)의 양, 자일라나아제 활성을 갖는 폴리펩티드(들)의 양, β-자일로시다아제 활성을 갖는 폴리펩티드(들)의 양, L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들)의 양, 또는 전체 셀룰라아제의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종), 엔도글루카나아제 활성을 갖는 폴리펩티드(들), 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들), β-글루코시다아제 활성을 갖는 폴리펩티드(들), 자일라나아제 활성을 갖는 폴리펩티드(들), β-자일로시다아제 활성을 갖는 폴리펩티드(들), L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들), 또는 전체 셀룰라아제의 부재 하의 바이오매스 혼합물의 점도에 비교하여, 바이오매스 재료의 가수분해 중에 바이오매스 혼합물의 점도를 감소시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상 만큼) 충분하다.
GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것 이상인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드( 예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것 이하인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/ 조성물 중 임의의 것 내에) 상한 및 하한을 갖는 범위를 갖는 양으로 존재할 수 있다. 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드에 대한 하한은 조성물 내의 단백질의 총 중량의 약 0.01 중량%, 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것이다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드에 대한 상한은 조성물 내의 단백질의 총 중량의 약 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 또는 70 중량% 중 임의의 것일 수 있다. 일부 태양에서, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/ 조성물 중 임의의 것 내에) 존재할 수 있다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 조성물 내의 단백질의 총 중량의 약 10 중량% 또는 12 중량%로 존재할 수 있다. 조성물은 엔도글루카나아제 활성을 갖는 2개 이상의 폴리펩티드(예를 들어, T. 레세이 Eg4, T. 레세이 Eg1, 및/또는 T. 레세이 Eg2, 또는 그의 변종)를 가질 수 있으며, 여기서 엔도글루카나아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 30 중량%, 약 2 내지 약 20 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)이다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 발현시키는 숙주 세포에 대해 이종성 또는 내인성일 수 있다. 조성물 내에 포함된 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드는 단리될 수 있다.
일부 태양에서, 본 명세서에 기재된 효소 조성물(예를 들어, 효소 조성물)은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 전체 셀룰라아제 조성물이다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 전체 셀룰라아제의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것 이상인 양으로 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 전체 셀룰라아제의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것 이하인 양으로 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는 전체 셀룰라아제의 총 중량의 약 0.01 중량%, 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것의 하한, 및 전체 셀룰라아제의 총 중량의 약 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 또는 70 중량% 중 임의의 것의 상한을 갖는 양으로 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는 전체 셀룰라아제의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 13 중량%, 14 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것인 양으로 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는 전체 셀룰라아제의 총 중량의 약 10 중량% 또는 12 중량%인 양으로 존재한다.
일부 태양에서, 본 명세서에 제공된 조성물 중 임의의 것은 T. 레세이 Eg1 또는 그의 변종 및/또는 T. 레세이 Eg2 또는 그의 변종을 포함하는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드를 포함할 수 있다(예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드에 부가하여). 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량은, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 이상인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량은, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것 이하인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량은, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 상한 및 하한을 갖는 범위를 갖는 양으로 존재할 수 있다. 예를 들어, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량에 대한 하한은 조성물 내의 단백질의 총 중량의 약 0.01 중량%, 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것이다. 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량에 대한 상한은 조성물 내의 단백질의 총 중량의 약 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 또는 70 중량% 중 임의의 것일 수 있다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량은, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것인 양으로 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다.
일부 태양에서, 본 명세서에 제공된 조성물 중 임의의 것은 다양한 효소 활성을 가진 하나 이상의 폴리펩티드, 예를 들어, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들), 글루코시다아제 활성을 갖는 폴리펩티드(들)(예를 들어, β-글루코시다아제), 자일라나아제 활성을 갖는 폴리펩티드(들), 자일로시다아제 활성을 갖는 폴리펩티드(들), 및/또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들)를 포함할 수 있다. 일부 태양에는, 동일한 효소 활성을 갖는 다중 폴리펩티드가 존재할 수 있다. 상기 언급된 각각의 폴리펩티드(또는 특이적 효소 활성을 갖는 폴리펩티드의 총량, 예를 들어, 셀로바이오하이드롤라아제 활성, 글루코시다아제 활성(예를 들어, β-글루코시다아제), 자일라나아제 활성, 자일로시다아제 활성, 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것 이상인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 일부 태양에서, 상기 언급된 각각의 폴리펩티드(또는 특이적 효소 활성을 갖는 폴리펩티드의 총량, 예를 들어, 셀로바이오하이드롤라아제 활성, 글루코시다아제 활성(예를 들어, β-글루코시다아제), 자일라나아제 활성, 자일로시다아제 활성, 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량)는 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것 이하일 수 있다. 상기 언급된 각각의 폴리펩티드(또는 특이적 효소 활성을 갖는 폴리펩티드의 총량, 예를 들어, 셀로바이오하이드롤라아제 활성, 글루코시다아제 활성(예를 들어, β-글루코시다아제), 자일라나아제 활성, 자일로시다아제 활성, 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량)는, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 상한 및 하한을 갖는 범위를 갖는 양으로 존재할 수 있다. 예를 들어, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량에 대한 하한은 조성물 내의 단백질의 총 중량의 약 0.01 중량%, 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것이다. 상한은 조성물 내의 단백질의 총 중량의 약 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 또는 70 중량% 중 임의의 것일 수 있다. 일부 태양에서, 상기 언급된 각각의 폴리펩티드(또는 특이적 효소 활성을 갖는 폴리펩티드의 총량, 예를 들어, 셀로바이오하이드롤라아제 활성, 글루코시다아제 활성(예를 들어, β-글루코시다아제), 자일라나아제 활성, 자일로시다아제 활성, 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다.
일부 태양에서, 본 명세서에 제공된 조성물 중 임의의 것은 전체 셀룰라아제를 추가로 포함할 수 있다. 전체 셀룰라아제는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 80 중량%, 85 중량%, 90 중량%, 또는 95 중량% 중 임의의 것 이상인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 전체 셀룰라아제는, 조성물 내의 단백질의 총 중량의 약 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 80 중량%, 85 중량%, 90 중량%, 또는 95 중량% 중 임의의 것 이하인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/ 조성물 중 임의의 것 내에) 존재할 수 있다. 전체 셀룰라아제는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 80 중량%, 85 중량%, 90 중량%, 또는 95 중량% 중 임의의 것인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다.
본 명세서에 제공된 조성물 또는 방법 중 어느 하나의 일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 CBH1, T. 레세이 CBH2, 또는 그의 변종)는 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 70 중량%(예를 들어, 약 0.5 내지 약 60 중량%, 약 5 내지 약 70 중량%, 약 10 내지 약 60 중량%, 약 20 내지 약 50 중량%, 또는 약 30 내지 약 50 중량%)인 양으로 존재한다. 일부 태양에서, 조성물은 셀로바이오하이드롤라아제 활성을 갖는 2개 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1(또는 그의 변종) 및 T. 레세이 CBH2(또는 그의 변종))를 가지며, 여기서 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 70 중량%(예를 들어, 약 0.5 내지 약 60 중량%, 약 5 내지 약 70 중량%, 약 10 내지 약 60 중량%, 약 20 내지 약 50 중량%, 또는 약 30 내지 약 50 중량%)이다. 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 일부 태양에서, 조성물 내에 포함된 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 단리된다.
본 명세서에 제공된 조성물 또는 방법 중 어느 하나의 일부 태양에서, β-글루코시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)는 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 40 중량%, 약 1 내지 약 30 중량%, 약 2 내지 약 20 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)인 양으로 존재한다. 일부 태양에서, 조성물은 β-글루코시다아제 활성을 갖는 2개 이상의 폴리펩티드를 가지며, 여기서 β-글루코시다아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 40 중량%, 약 1 내지 약 30 중량%, 약 2 내지 약 20 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)이다. β-글루코시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 일부 태양에서, 조성물 내에 포함된 β-글루코시다아제 활성을 갖는 폴리펩티드는 단리된다.
본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, 자일라나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)는 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 40 중량%, 약 1 내지 약 40 중량%, 약 4 내지 약 30 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)인 양으로 존재할 수 있다. 조성물은 자일라나아제 활성을 갖는 2개 이상의 폴리펩티드를 가질 수 있으며, 여기서 자일라나아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 40 중량%, 약 1 내지 약 40 중량%, 약 4 내지 약 30 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)이다. 자일라나아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 조성물 내에 포함된 자일라나아제 활성을 갖는 폴리펩티드는 단리될 수 있다.
본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)는 조성물 내의 효소의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 40 중량%, 약 2 내지 약 30 중량%, 약 4 내지 약 20 중량%, 또는 약 5 내지 약 15 중량%)인 양으로 존재할 수 있다. 조성물은 L-α-아라비노푸라노시다아제 활성을 갖는 2개 이상의 폴리펩티드를 가질 수 있으며, 여기서 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 40 중량%, 약 2 내지 약 30 중량%, 약 4 내지 약 20 중량%, 또는 약 5 내지 약 15 중량%)이다. L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 이종성인 핵산으로부터 발현될 수 있다. 조성물 내에 포함된 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드는 단리될 수 있다.
본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, β-자일로시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)는 조성물 내의 효소의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 40 중량%, 약 4 내지 약 35 중량%, 약 5 내지 약 25 중량%, 또는 약 5 내지 약 20 중량%)인 양으로 존재할 수 있다. 조성물은 β-자일로시다아제 활성을 갖는 2개 이상의 폴리펩티드를 가질 수 있으며, 여기서 β-자일로시다아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 40 중량%, 약 4 내지 약 35 중량%, 약 5 내지 약 25 중량%, 또는 약 5 내지 약 20 중량%)이다. β-자일로시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 조성물 내에 포함된 β-자일로시다아제 활성을 갖는 폴리펩티드는 단리될 수 있다.
본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, 조성물 내의 전체 셀룰라아제는 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 100 중량%(예를 들어, 약 1 내지 약 95 중량%, 약 5 내지 약 90 중량%, 약 10 내지 약 85 중량%, 약 20 내지 약 80 중량%, 또는 약 30 내지 약 75 중량%)일 수 있다. 전체 셀룰라아제는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종, T. 레세이 Eg1 또는 그의 변종, T. 레세이 Eg2 또는 그의 변종)를 포함할 수 있다. 전체 셀룰라아제는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1 또는 그의 변종, T. 레세이 CBH2 또는 그의 변종)를 포함할 수 있다. 전체 셀룰라아제는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있다.
일부 태양에서, 본 발명의 조성물은 바이오매스 재료를 발효가능한 당(들)(예를 들어, 글루코스, 자일로스, 아라비노스, 및/또는 셀로바이오스)으로 전환시킬 수 있다. 일부 태양에서, 조성물은 칼코플루오르 어세이에 의해 결정할 때 0.1 이상(예를 들어, 0.1 내지 0.4)의 산물 분율을 달성할 수 있다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는 바이오매스 재료에 접촉되기 전에 함께 혼합된다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는 상이한 시간에 바이오매스 재료에 첨가된다(예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드가 바이오매스 재료에 첨가되기 전 또는 후에 바이오매스 재료에 첨가됨).
일부 태양에서, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물은 바이오매스 재료를 포함하는 혼합물이며, 예를 들어, 조성물은 가수분해 혼합물, 발효 혼합물, 또는 당화 혼합물이다. 이러한 혼합물은 발효가능한 당(들)을 추가로 포함할 수 있다.
다른 성분들
적합하게는, 본 개시의 효소 조성물은 하나 이상의 보조 단백질을 추가로 포함할 수 있다. 보조 단백질의 예는, 만난아제(예를 들어, 엔도만난아제, 엑소만난아제, 및 β-만노시다아제), 갈락타나아제(예를 들어, 엔도- 및 엑소-갈락타나아제), 아라비나아제(예를 들어, 엔도-아라비나아제 및 엑소-아라비나아제), 리그니나아제, 아밀라아제, 글루쿠로니다아제, 프로테아제, 에스테라아제(예를 들어, 페룰산 에스테라아제, 아세틸 자일란 에스테라아제, 쿠마르산 에스테라아제, 또는 펙틴 메틸 에스테라아제), 리파아제, 다른 글리코시드 하이드롤라아제, 자일로글루카나아제, CIP1, CIP2, 스왈레닌, 익스팬신, 및 셀룰로오스 분해 단백질(cellulose disrupting protein)을 제한 없이 포함한다. 예를 들어, 셀룰로오스 분해 단백질은 셀룰로오스 결합 모듈이다.
방법 및 공정
본 개시는, 본 개시의 효소, 효소 블렌드/조성물을 사용하는, 바이오매스 당화를 위한 방법 및 공정을 제공한다. 특히 본 개시는, 바이오매스 재료를 가수분해하기 위해 본 명세서에 제공된 폴리펩티드 또는 조성물 중 어느 하나를 사용하는 방법 및 공정을 제공한다. 추가로 본 개시는, 바이오매스 혼합물(예를 들어, 당화 공정 중에 바이오매스 기질 및 효소를 함유하는 바이오매스 혼합물)의 점도를 감소시키기 위해 본 명세서에 제공된 폴리펩티드 또는 조성물 중 어느 하나를 사용하는 방법을 제공한다. 일부 태양에는, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 비-천연 조성물과 접촉시키는 단계를 포함하는, 바이오매스 재료를 가수분해하는 방법이 제공된다. 일부 태양에서, 폴리펩티드는 바이오매스 재료를 가수분해하기에 충분한 양으로 존재한다.
본 명세서에 사용되는 바와 같이, 용어 "바이오매스"는 셀룰로오스 및/또는 헤미셀룰로오스를 포함하는 임의의 조성물(리그노셀룰로오스계 바이오매스 재료 중의 리그닌을 포함함)을 지칭한다. 본 명세서에 사용되는 바와 같이, 바이오매스는, 종자, 낟알, 괴경, 식물 폐기물, 또는 식품 가공 또는 산업적 가공의 부산물(예를 들어, 줄기), 옥수수(corn)(예를 들어, 속대, 대 등을 포함함), 초본류(grass)(예를 들어, 소르가스트룸 누탄스(Sorghastrum nutans)와 같은 인디언 그래스(Indian grass); 또는 스위치그래스(switchgrass), 예를 들어, 파니쿰 비르가툼(Panicum virgatum)과 같은 파니쿰 종을 포함함), 다년생 케인(perennial cane)(예를 들어, 물대), 목재(예를 들어, 우드칩(wood chip), 가공 폐기물을 포함함), 종이(종이 폐기물을 포함함), 펄프, 및 재활용 종이(예를 들어, 신문, 프린터 용지 등을 포함함)를 제한 없이 포함한다. 다른 바이오매스 재료는 감자, 대두(예를 들어, 평지씨), 보리, 호밀, 귀리, 밀, 비트(beet), 및 사탕수수 바가스(sugar cane bagasse)를 제한 없이 포함한다. 적합한 리그노셀룰로오스계 바이오매스 재료는, 종자, 낟알, 괴경, 식물 폐기물, 또는 식품 가공 또는 산업적 가공의 부산물(예를 들어, 줄기), 옥수수(예를 들어, 속대, 대 등을 포함함), 초본류(예를 들어, 소르가스트룸 누탄스와 같은 인디언 그래스; 또는 스위치그래스, 예를 들어, 파니쿰 비르가툼과 같은 파니쿰 종), 다년생 케인, 예를 들어, 물대, 목재(예를 들어, 우드칩, 가공 폐기물을 포함함), 종이, 펄프, 재활용 종이(예를 들어, 신문), 목재 펄프, 또는 톱밥을 제한 없이 포함한다. 초본류의 예는 인디언 그래스 또는 스위치그래스를 제한 없이 포함한다. 갈대의 예는 물대와 같은 소정의 다년생 케인을 제한 없이 포함한다. 종이 폐기물의 예는 폐기되거나 사용된 복사 용지, 컴퓨터 프린터 용지, 공책 용지, 메모 용지, 타자기 용지, 신문, 잡지, 판지, 및 종이계 포장 재료를 제한 없이 포함한다.
당화된 바이오매스는, 예를 들어, 미생물 발효 및/또는 화학 합성과 같은 공정을 통해, 다수의 바이오계 산물로 만들어질 수 있다. 본 명세서에 사용되는 바와 같이, "미생물 발효"는 적합한 조건 하에 발효 미생물을 성장시키고 수확하는 공정을 지칭한다. 발효 미생물은, 바이오계 산물의 생성을 위한 목적하는 발효 공정에 사용하기에 적합한 임의의 미생물일 수 있다. 적합한 발효 미생물은 사상 진균, 효모, 및 박테리아를 제한 없이 포함한다. 당화된 바이오매스는 발효 및/또는 화학 합성을 통해, 예를 들어, 연료(예를 들어, 바이오에탄올, 바이오부탄올, 바이오메탄올, 바이오프로판올, 바이오디젤, 제트 연료 등과 같은 바이오연료)로 만들어질 수 있다. 당화된 바이오매스는 또한, 발효 및/또는 화학 합성을 통해, 예를 들어, 범용 화학물질(예를 들어, 아스코르브산, 아이소프렌, 1,3-프로판다이올), 지질, 아미노산, 단백질, 및 효소로 만들어질 수 있다.
바이오매스 재료는 셀룰로오스, 헤미셀룰로오스, 또는 그의 혼합물을 포함할 수 있다. 예를 들어, 바이오매스 재료는 글루칸 및/또는 자일란을 포함할 수 있다.
일부 태양에는, 바이오매스 혼합물을 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 비-천연 조성물과 접촉시키는 단계를 포함하는, 바이오매스 혼합물의 점도를 감소시키는 방법이 제공된다. 폴리펩티드는 점도를 감소시키기에 충분한 양으로 존재한다. 바이오매스 혼합물은 바이오매스 재료(예를 들어, 전처리된 바이오매스 재료)를 포함할 수 있다. 바이오매스 혼합물은 본 명세서에 제공된 효소 조성물 중 임의의 것 또는 그의 혼합물과 같은 효소 조성물을 포함할 수 있다.
일부 태양에서, 본 명세서에 제공된 폴리펩티드, 조성물 중 임의의 것을 사용하여 바이오매스 재료와 같은 기질을 가수분해하거나 당화 공정 중에 기질-효소 혼합물의 점도를 감소시킬 수 있다. 기질은 바이오매스 재료일 수 있다. 기질은 단리된 셀룰로오스 또는 단리된 헤미셀룰로오스일 수 있다. 기질은 글루칸 및/또는 자일란일 수 있다. 일부 태양에서, 바이오매스 재료는 전처리된 바이오매스 재료이다.
바이오매스 재료의 전처리
자일란, 헤미셀룰로오스, 셀룰로오스 및/또는 리그닌 재료를 효소에 대해 더 접근가능하거나 민감하게 함으로써 본 개시의 효소(들) 및/또는 효소 블렌드/조성물에 의한 가수분해에 더 순응적이 되게 하기 위하여, 당화 전에 바이오매스 재료에 바람직하게는 하나 이상의 전처리 단계(들)를 적용한다.
전처리는 화학적, 물리적, 및 생물학적 전처리를 포함할 수 있다. 예를 들어, 물리적 전처리 기술은 다양한 유형의 밀링, 분쇄, 증기 처리(steaming)/증기 폭쇄(steam explosion), 조사(irradiation), 및 수소화 열분해(hydrothermolysis)를 제한 없이 포함할 수 있다. 화학적 전처리 기술은 묽은 산, 알칼린(alkaline), 유기 용매, 암모니아, 이산화황, 이산화탄소, 및 pH-제어 수소화 열분해를 제한 없이 포함할 수 있다. 생물학적 전처리 기술은 리그닌-가용화 미생물의 응용을 제한 없이 포함할 수 있다. 전처리는 수 분 내지 수 시간, 예를 들어 약 1 시간 내지 약 120 시간 동안 일어날 수 있다.
일부 태양에서, 본 명세서에 제공된 방법 또는 공정 중 임의의 것은 바이오매스 재료를 전처리하는 단계, 예를 들어, 바이오매스를 산 또는 염기로 전처리하는 단계를 추가로 포함할 수 있다. 산 또는 염기는 암모니아, 소듐 하이드록사이드, 또는 인산일 수 있다. 본 방법은 바이오매스 재료를 암모니아로 전처리하는 단계를 추가로 포함할 수 있다. 전처리는 증기 폭쇄, 펄핑(pulping), 연삭(grinding), 산 가수분해, 또는 그의 조합일 수 있다.
일 실시 형태에서, 전처리는 승온 및 묽은 산, 진한 산, 또는 묽은 알칼리 용액의 첨가에 의할 수 있다. 헤미셀룰로오스 구성요소를 적어도 부분적으로 가수분해하기에 충분한 시간 동안 전처리 용액을 첨가한 후에 중화시킬 수 있다.
예시적인 실시 형태에서, 전처리는 반응기 내에서 강산 및 금속 염의 묽은 용액을 포함하는 촉매를 바이오매스 재료에 적용하는 단계를 수반한다. 바이오매스 재료는, 예를 들어, 원재료 또는 건조 재료일 수 있다. 이러한 전처리는 셀룰로오스 가수분해의 활성화 에너지 또는 온도를 낮추어, 궁극적으로 발효가능한 당의 더 높은 수율을 가능하게 할 수 있다. 예를 들어, 미국 특허 제6,660,506호; 제6,423,145호를 참조한다.
다른 예시적인 전처리 방법은, 셀룰로오스의 글루코스로의 유의적인 탈중합화가 이루어지지 않으면서 주로 헤미셀룰로오스의 탈중합화를 유발하도록 선택된 온도 및 압력에서 수성 배지 내에서 제1 가수분해 단계를 바이오매스 재료에 적용함으로써 바이오매스를 가수분해하는 단계를 수반한다. 이 단계는 슬러리를 생성시키며, 그 안에서 액체 수성 상은 헤미셀룰로오스의 탈중합화로부터 생성되는 용해된 단당류를 함유하고, 고체 상은 셀룰로오스 및 리그닌을 함유한다. 이어서, 셀룰로오스의 주요 부분이 탈중합화되는 것을 가능하게 하는 조건 하에 제2 가수분해 단계를 슬러리에 적용하여, 셀룰로오스의 용해된/가용성 탈중합화 산물을 함유하는 액체 수성 상을 생성시킨다. 예를 들어, 미국 특허 제5,536,325호를 참조한다.
방법의 추가의 예는, 약 0.4% 내지 약 2%의 강산을 사용하는 묽은 산 가수분해의 하나 이상의 단계에 의해 바이오매스 재료를 가공한 후에; 산 가수분해된 재료의 미반응 고체 리그노셀룰로오스계 구성요소를 알칼린 탈리그닌화로 처리하는 단계를 포함한다. 예를 들어, 미국 특허 제6,409,841호를 참조한다.
전처리 방법의 다른 예는, 사전 가수분해 반응기 내에서 바이오매스(예를 들어, 리그노셀룰로오스계 재료)를 사전 가수분해하는 단계; 산성 액체를 고체 리그노셀룰로오스계 재료에 첨가하여 혼합물을 제조하는 단계; 혼합물을 반응 온도로 가열하는 단계; 리그노셀룰로오스계 재료로부터의 리그닌의 약 20% 이상을 함유하는 가용화된 부분, 및 셀룰로오스를 함유하는 고체 분획으로 리그노-셀룰로오스계 재료를 분획화하기에 충분한 기간 동안 반응 온도를 유지하는 단계; 반응 온도 또는 그 부근에서, 고체 분획으로부터 가용화된 부분을 분리하여 가용화된 부분을 제거하는 단계; 및 가용화된 부분을 회수하는 단계를 포함한다. 고체 분획 내의 셀룰로오스는 효소적 분해에 대해 더 순응적이 된다. 예를 들어, 미국 특허 제5,705,369호를 참조한다.
추가의 전처리 방법은 과산화수소 H2O2의 사용을 포함할 수 있다. 문헌[Gould, 1984, Biotech, and Bioengr. 26:46-52]을 참조한다.
전처리는 또한, 바이오매스 재료를 매우 낮은 농도에서 화학양론적 양의 소듐 하이드록사이드 및 암모늄 하이드록사이드와 접촉시키는 단계를 포함할 수 있다. 문헌[Teixeira et al., 1999, Appl. Biochem.and Biotech. 77-79:19-34]을 참조한다. 전처리는 또한, 약 9 내지 약 14의 pH에서 보통의 온도, 압력, 및 pH에서 리그노셀룰로오스를 화학물질(예를 들어, 소듐 카르보네이트 또는 포타슘 하이드록사이드와 같은 염기)과 접촉시키는 단계를 포함할 수 있다. PCT 공개 제WO2004/081185호를 참조한다.
암모니아를 전처리 방법에 사용할 수 있다. 이러한 전처리 방법은, 높은 고체 함량의 조건 하에 낮은 암모니아 농도를 바이오매스 재료에 적용하는 단계를 포함한다. 예를 들어, 미국 특허 공개 제20070031918호, PCT 공개 제WO 06110901호를 참조한다.
당화 공정 및 점도 감소
본 개시는, 바이오매스 혼합물의 점도를 감소시키기에 충분한 양으로 글리코실 하이드롤라아제 패밀리 61("GH61") 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물(예를 들어, 비-천연 조성물)과 바이오매스 혼합물을 접촉시키는 단계를 포함하는, 바이오매스 혼합물의 점도를 감소시키는 방법을 제공한다. 일부 태양에서, 바이오매스 혼합물은 바이오매스 재료, 발효가능한 당(들), 전체 셀룰라아제, 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물을 포함한다. 일부 태양에서 점도는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 부재 하의 바이오매스 혼합물의 점도에 비교하여 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상) 만큼 감소한다. 본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 바이오매스 재료는 헤미셀룰로오스, 셀룰로오스, 또는 그의 혼합물을 포함한다. 일부 태양에서, 바이오매스 재료는 글루칸, 자일란 및/또는 리그닌을 포함한다.
본 명세서에 제공된 방법 및 공정은 다양한 조건 하에 수행될 수 있다. 예를 들어, 본 명세서에 제공된 방법 중 임의의 것은 약 3.5 내지 약 7.0 의 pH, 예를 들어, 약 4.0 내지 약 6.5 의 pH, 약 4.4 내지 약 6.0 의 pH, 약 4.8 내지 약 5.6 의 pH, 또는 약 4.5 내지 약 5.5 의 pH의 범위의 pH에서 수행될 수 있다. 당업자에게 공지된 방법 중 임의의 것에 따라 염기 또는 산(예를 들어, 황산)을 사용하여, 바이오매스 재료를 함유하는 당화 혼합물을 목적하는 pH로 조정할 수 있다. 예를 들어, 전처리된 바이오매스 재료에 염기 또는 산(예를 들어, 황산)을 첨가하여 당화를 위한 목적하는 pH를 달성할 수 있다. 바이오매스 재료를 가수분해하거나 바이오매스 혼합물의 점도를 감소시키는 방법 중 임의의 것은 약 4.8 내지 약 5.6의 pH(예를 들어, 약 4.8, 4.9, 5.0, 5.1, 5.2, 5.3, 5.4, 5.5, 또는 5.6 중 임의의 것의 pH)에서 수행할 수 있다. 일부 태양에서, 본 방법은 바이오매스 혼합물의 pH를 약 4.0 내지 약 6.5의 pH(예를 들어, 약 4.5 내지 약 5.5의 pH)로 조정하는 단계를 추가로 포함한다.
본 명세서에 제공된 방법 및 공정은 임의의 길이의 시간, 예를 들어, 1 시간, 2 시간, 4 시간, 8 시간, 12 시간, 18 시간, 24 시간, 2 일, 3 일, 4 일, 5 일, 6 일, 7 일, 8 일, 10 일, 14 일, 3 주, 또는 4 주 동안 수행될 수 있다. 본 명세서에 기재된 당화 시간 중 임의의 것 후에, 발효가능한 당(들)의 양이 증가하고/하거나 당화 혼합물의 점도가 감소한다. 일부 태양에서, 본 방법은 약 2 시간 내지 약 7 일(예를 들어, 약 4 시간 내지 약 6 일, 약 8 시간 내지 약 5 일, 또는 약 8 시간 내지 약 3 일) 동안 수행된다.
바이오매스 재료를 전처리한 후에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 첨가할 수 있다. 다른 효소 조성물(예를 들어, 헤미셀룰로오스, 셀룰라아제, 또는 전체 셀룰라아제를 포함하는 효소 조성물)을 바이오매스 재료에 첨가하기 전 또는 후에, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 바이오매스 재료에 첨가할 수 있다. (a) 바이오매스 재료 및/또는 발효가능한 당 및 (b) 효소(예를 들어, 전체 셀룰라아제를 포함하는 셀룰라아제 또는 헤미셀룰라아제)를 함유하는 바이오매스 혼합물에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 첨가할 수 있다. 일부 태양에서는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 바이오매스 혼합물에 첨가하며, 여기서 바이오매스 재료는 소정의 기간(예를 들어, 약 5 분, 10 분, 30 분, 1 시간, 2 시간, 4 시간, 8 시간, 12 시간, 18 시간, 24 시간, 2 일, 3 일, 4 일, 또는 5 일 중 임의의 것) 동안 가수분해되었다.
GH61/엔도글루카나아제 활성을 갖는 단리된 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 당화 중에 바이오매스 재료에 첨가할 수 있다. 전체 셀룰라아제를 포함하는 조성물(예를 들어, 비-천연 조성물)을 당화 중에 바이오매스 재료에 첨가할 수 있으며, 여기서 전체 셀룰라아제는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함한다.
본 방법 중 어느 하나에 사용되는 바이오매스 재료는 액체 형태, 고체 형태, 또는 그의 혼합물일 수 있다. 본 방법 중 어느 하나에 사용되는 바이오매스 재료는 습윤 형태, 건조 형태, 다양한 수분도(degree of moisture)를 갖는 재료, 또는 그의 혼합물일 수 있다. 본 방법 중 어느 하나에 사용되는 바이오매스 재료는 건조 고체 형태(예를 들어, 시재료로서의 건조 고체 형태)일 수 있다. 바이오매스 재료는 하기 형태 중 임의의 것으로 가공될 수 있다: 당업자에게 공지된 임의의 방법에 따라 습윤 형태, 건조 형태, 고체 형태, 액체 형태, 또는 그의 혼합물.
본 방법 중 임의의 것에 사용되는 바이오매스 재료는, 가수분해 혼합물 또는 당화 혼합물의 총 중량의 약 0.5 중량%, 1 중량%, 5 중량%, 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 또는 60 중량% 중 임의의 것 이상의 양으로 당화 혼합물 내에 존재할 수 있으며, 여기서 바이오매스 재료의 양은 그의 고체 상태의 바이오매스 재료(또는 그의 건조 상태, 그의 건조 고체 상태, 그의 자연 상태, 또는 그의 가공되지 않은 상태의 바이오매스 재료)의 중량을 지칭한다. 바이오매스 재료는 또한, 바이오매스 재료를 함유하는 가수분해 혼합물의 약 0.5 중량% 내지 약 55 중량%, 1 중량% 내지 약 40 중량%, 5 중량% 내지 약 60 중량%, 약 10 중량% 내지 약 55 중량%, 약 10 중량% 내지 약 50 중량%, 약 15 중량% 내지 약 50 중량%, 약 15 중량% 내지 약 40 중량%, 약 15 중량% 내지 약 35 중량%, 약 15 중량% 내지 약 30 중량%, 약 20 중량% 내지 약 35 중량%, 또는 약 20 중량% 내지 약 30 중량%의 양으로 존재할 수 있으며, 여기서 바이오매스 재료의 양은 그의 고체 상태의 바이오매스 재료(또는 그의 건조 상태, 그의 건조 고체 상태, 그의 자연 상태, 또는 그의 가공되지 않은 상태의 바이오매스 재료)의 중량을 지칭한다. 본 방법 중 임의의 것에 사용되는 바이오매스 재료는 가수분해 혼합물 또는 당화 혼합물의 총 중량의 약 0.5 중량%, 1 중량%, 5 중량%, 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 또는 60 중량% 중 임의의 것의 양으로 당화 혼합물 내에 존재할 수 있으며, 여기서 바이오매스 재료의 양은 그의 고체 상태의 바이오매스 재료(또는 그의 건조 상태, 그의 건조 고체 상태, 그의 자연 상태, 또는 그의 가공되지 않은 상태의 바이오매스 재료)의 중량을 지칭한다.
가수분해 혼합물 또는 당화 혼합물은 바이오매스 재료, 효소(들)(예를 들어, 본 명세서에 제공된 폴리펩티드 중 어느 하나), 효소 조성물(예를 들어, 본 명세서에 제공된 조성물 중 어느 하나), 및/또는 당화에 필요한 구성요소와 같은 다른 구성요소를 포함한다.
"예시적인 조성물" 섹션에 상기 제공된 조성물 중 어느 하나와 같은, 본 명세서에 제공된 조성물 중 임의의 것을 본 명세서에 기재된 방법에 사용할 수 있다. 본 명세서에 제공된 방법 중 어느 하나에 사용되는 본 명세서에 기재된 조성물 중 임의의 것의 양은, 바이오매스 재료에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.05 mg 내지 약 50 mg, 약 0.1 mg 내지 약 40 mg, 약 0.2 mg 내지 약 30 mg, 약 0.5 mg 내지 약 25 mg, 약 1 mg 내지 약 25 mg, 약 2 mg 내지 약 25 mg, 약 5 mg 내지 약 25 mg, 또는 약 10 mg 내지 약 25 mg 단백질의 범위일 수 있다. 바이오매스 재료를 가수분해하는 방법 및/또는 바이오매스 혼합물의 점도를 감소시키는 방법에 사용되는 방법 중 어느 하나에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물은, 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.05 mg 내지 약 50 mg, 약 0.1 mg 내지 약 40 mg, 약 0.2 mg 내지 약 30 mg, 약 0.5 mg 내지 약 25 mg, 약 1 mg 내지 약 25 mg, 약 2 mg 내지 약 25 mg, 약 5 mg 내지 약 25 mg, 또는 약 10 mg 내지 약 25 mg 단백질의 양으로 존재할 수 있다.
일부 태양에서, 바이오매스 재료를 가수분해하는 방법 및/또는 바이오매스 혼합물의 점도를 감소시키는 방법 중 임의의 것에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물은, 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.05 mg, 0.1 mg, 0.2 mg, 0.5 mg, 1 mg, 2 mg, 5 mg, 7.5 mg, 10 mg, 12 mg, 14 mg, 15 mg, 16 mg, 17.5 mg, 18 mg, 20 mg, 22.5 mg, 25 mg, 27.g mg, 30 mg, 35 mg, 40 mg, 45 mg, 또는 50 mg 단백질 중 임의의 것 이상의 양으로 존재한다. 일부 태양에서, 바이오매스 재료를 가수분해하는 방법 및/또는 바이오매스 혼합물의 점도를 감소시키는 방법 중 임의의 것에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물은, 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.1 mg, 0.2 mg, 0.5 mg, 1 mg, 2 mg, 5 mg, 7.5 mg, 10 mg, 12 mg, 14 mg, 15 mg, 16 mg, 17.5 mg, 18 mg, 20 mg, 22.5 mg, 25 mg, 27.5 g mg, 30 mg, 35 mg, 40 mg, 45 mg, 50 mg, 55 mg, 60 mg, 65 mg, 75 mg, 또는 100 mg 단백질 중 임의의 것 이하의 양으로 존재한다. 일부 태양에서, 바이오매스 재료를 가수분해하는 방법 및/또는 바이오매스 혼합물의 점도를 감소시키는 방법 중 임의의 것에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물은, 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.05 mg, 0.1 mg, 0.2 mg, 0.5 mg, 1 mg, 2 mg, 5 mg, 7.5 mg, 10 mg, 12 mg, 14 mg, 15 mg, 16 mg, 17.5 mg, 18 mg, 20 mg, 22.5 mg, 25 mg, 27.5 g mg, 30 mg, 35 mg, 40 mg, 45 mg, 또는 50 mg 단백질 중 임의의 것의 양으로 존재한다. 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 양은, 당업자에게 공지된 임의의 방법을 사용하여 계산할 수 있다. 바이오매스 재료는 글루칸, 자일란, 및/또는 리그닌을 포함할 수 있다.
본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.1 mg 내지 약 50 mg 단백질(예를 들어, 약 0.2 mg 내지 약 40 mg 단백질, 약 0.5 mg 내지 약 30 mg 단백질, 약 1 mg 내지 약 20 mg 단백질, 또는 약 5 mg 내지 약 15 mg 단백질)이다. 본 명세서에 기재된 단백질 양은 조성물 내의 총 단백질의 중량을 지칭한다. 단백질은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하며, 조성물 내의 셀룰라아제 폴리펩티드(들) 및/또는 헤미셀룰라아제 폴리펩티드(들)와 같은 다른 효소 또한 포함할 수 있다.
본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 1 mg 내지 약 5 mg 단백질)이다.
본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Eg1, T. 레세이 Eg2, 및/또는 그의 변종)를 포함하며, 여기서 엔도글루카나아제 활성을 갖는 폴리펩티드의 총량은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 1 mg 내지 약 5 mg 단백질)이다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, T. 레세이 CBH2, 및/또는 그의 변종)를 포함하며, 여기서 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 1 mg 내지 약 5 mg 단백질)이다.
본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함하며, 여기서 β-글루코시다아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 0.5 mg 내지 약 5 mg 단백질)이다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함하며, 여기서 자일라나아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 0.5 mg 내지 약 5 mg 단백질)이다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3A, Fv43A, a Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)를 포함하며, 여기서 β-자일로시다아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 0.5 mg 내지 약 5 mg 단백질)이다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함하며, 여기서 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 0.5 mg 내지 약 5 mg 단백질)이다.
본 명세서에 제공된 방법 중 어느 하나에서, 바이오매스 혼합물의 점도는 본 명세서에 제공된 효소 조성물의 부재 하의 바이오매스 혼합물의 점도에 비교하여 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 이상 만큼 감소될 수 있다. 예를 들어, 바이오매스 혼합물을 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물과 접촉시키는 단계를 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)의 부재 하의 바이오매스 혼합물의 점도에 비교하여 점도가 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 이상 만큼 감소하는, 바이오매스 혼합물의 점도를 감소시키는 방법이 제공된다. 일부 태양에서는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)의 부재 하의 바이오매스 혼합물의 점도에 비교하여 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 만큼 점도가 감소한다. 본 명세서에 기재된 점도의 감소는 소정의 당화 기간 후에 나타난다. 예를 들어, 점도의 감소는 30 분, 1 시간, 2 시간, 4 시간, 8 시간, 12 시간, 18 시간, 24 시간, 2 일, 3 일, 4 일, 또는 5 일 당화 후에 나타난다. 점도를 측정하는 방법은 당업계에 공지되어 있다. 예를 들어, 점도는 육안으로 측정하거나, 브룩필드(Brookfield) 점도계(브룩필드 엔지니어링 인코포레이티드(Brookfield Engineering, Inc))와 같은 점도계에 의해 측정할 수 있다. 예를 들어, 암모니아로 전처리된 옥수수 속대를 기질로서 이용하는 점도계를 사용하여 당화 반응 혼합물의 점도를 측정할 수 있다. 점도계는 슬러리 내에서 스핀들을 일정한 속도로 회전시키기 위해 그것이 받는 저항(토크)을 측정할 수 있다.
본 명세서에 제공된 방법은 당화에 적합한 온도에서 수행될 수 있다. 예를 들어, 본 명세서에 기재된 방법 중 어느 하나는 약 20℃ 내지 약 75℃, 약 25℃ 내지 약 70℃, 약 30℃ 내지 약 65℃, 약 35℃ 내지 약 60℃, 약 37℃ 내지 약 60℃, 약 40℃ 내지 약 60℃, 약 40℃ 내지 약 55℃, 약 40℃ 내지 약 50℃, 또는 약 45℃ 내지 약 50℃에서 수행될 수 있다. 일부 태양에서, 본 명세서에 기재된 방법 중 어느 하나는 약 20℃, 약 25℃, 약 30℃, 약 35℃, 약 37℃, 약 40℃, 약 45℃, 약 48℃, 약 50℃, 약 55℃, 약 60℃, 약 65℃, 약 70℃, 또는 약 75℃에서 수행될 수 있다.
본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 본 방법은 발효가능한 당(들)을 생성시키는 단계를 포함하며, 여기서 발효가능한 당(들)의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 부재 하에 생성되는 발효가능한 당(들)의 양에 비교하여 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상) 만큼 증가한다.
본 명세서에는 또한, 바이오매스 재료의 가수분해 중에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 사용함으로써, 발효가능한 당(들)의 양을 증가시키는 방법(및/또는 바이오매스 재료로부터 발효가능한 당(들)으로의 전환, 예를 들어, 글루칸 전환을 증가시키는 방법)이 제공된다. 글루코스, 자일로스, 및/또는 셀로바이오스를 포함하나, 이로 제한되지 않는, 바이오매스 재료의 가수분해로부터 생성되는 다양한 발효가능한 당이 존재한다. 일부 태양에서, 바이오매스 재료의 가수분해로부터 생성되는 발효가능한 당(들)의 양은, 본 명세서에 제공된 효소 조성물의 부재 하의 발효가능한 당(들)의 양에 비교하여 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 이상 만큼 증가할 수 있다. 예를 들어, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물과 접촉시키는 단계(당화 공정을 개시하거나 촉진하기 위함)를 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)의 부재 하의 당화로부터의 발효가능한 당(들)의 양에 비교하여, 당화로부터의 발효가능한 당(들)의 양이 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 이상 만큼 증가하는, 발효가능한 당(들)의 양을 증가시키는 방법이 제공된다. 일부 태양에서는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)의 부재 하의 당화로부터의 발효가능한 당(들)의 양에 비교하여, 당화로부터의 발효가능한 당(들)의 양이 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 만큼 증가한다. 본 명세서에 기재된 바이오매스 재료의 가수분해로부터 생성되는 발효가능한 당(들)의 양의 증가는 소정 기간의 당화 후에 나타난다. 예를 들어, 발효가능한 당(들)의 양의 증가는 30 분, 1 시간, 2 시간, 4 시간, 8 시간, 12 시간, 18 시간, 24 시간, 2 일, 3 일, 4 일, 또는 5 일 당화 후에 나타난다. 발효가능한 당(들)의 양 및/또는 글루칸 전환을 측정하는 방법은 당업자에게 공지되어 있다.
당화 혼합물의 점도의 감소는 바람직한 발효가능한 당의 개선된 수율과 관련될 수 있다.
일부 태양에서, 본 방법은 바이오매스 재료를 전체 셀룰라아제를 포함하는 조성물과 접촉시키는 단계를 추가로 포함한다. 일부 태양에서, 바이오매스 재료를 전체 셀룰라아제를 포함하는 조성물과 추가로 접촉시키는 단계는, 바이오매스 재료를 글리코실 하이드롤라아제 패밀리 61("GH61") 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물과 접촉시키는 단계 전에, 후에, 또는 그와 동시에 수행된다.
본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 본 방법은 바이오매스 재료를 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물과 추가로 접촉시키는 단계를 포함한다. 일부 태양에서, 바이오매스 재료를 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물과 추가로 접촉시키는 단계는, 바이오매스 재료를 글리코실 하이드롤라아제 패밀리 61("GH61") 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물과 접촉시키는 단계 전에, 후에, 또는 그와 동시에 수행된다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물과 접촉시키기 전에 함께 혼합된다.
일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는 상이한 시간에 바이오매스 재료에 첨가된다(예를 들어, 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드가 바이오매스 재료에 첨가되기 전 또는 후에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)가 첨가됨).
예를 들어, 하기의 미국 특허 공개 제US20050054039호, 제US20050037459호, 제US20060205042호, 제US20050048619A1호, 및 제US20060218671호 중 어느 하나에 기재된 CBH 폴리펩티드를 사용하여, 더 높은 온도에서 증진된 셀룰로오스 전환을 달성할 수 있다. β-글루코시다아제를 과발현시키는 방법은 당업계에 공지되어 있다. 예를 들어, 미국 특허 제6,022,725호를 참조한다. 또한 예를 들어, 미국 특허 공개 제20050214920호를 참조한다.
화학물질, 미생물을 위한 발효 공급원료, 및 단백질의 생성을 위한 유도물질, 유기 산물, 화학물질 및 연료, 플라스틱, 및 다른 산물 또는 중간체로서의 단당류, 이당류, 및 다당류의 생성에 본 개시의 방법을 사용할 수 있다. 특히, 셀룰로오스 또는 헤미셀룰로오스의 부분적 또는 완전 가용화에 의해 가공 잔류물(주정박(dried distillers grain), 양조로부터의 잔류 곡물(spent grains from brewing), 사탕수수 바가스 등)의 가치를 증가시킬 수 있다. 에탄올에 부가하여, 셀룰로오스 및 헤미셀룰로오스로부터 생성될 수 있는 화학물질은, 아세톤, 아세테이트, 글리신, 라이신, 유기산(예를 들어, 락트산), 1,3-프로판다이올, 부탄다이올, 글리세롤, 에틸렌 글리콜, 푸르푸랄, 폴리하이드록시알카노에이트, 시스, 시스-뮤콘산, 동물 사료, 및 자일로스를 포함한다.
영업 방법
본 개시의 셀룰라아제 및/또는 헤미셀룰라아제 조성물은 산업적 설정 및/또는 상업적 설정에서 추가로 사용될 수 있다. 따라서, 본 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물을 제조하거나, 시판하거나, 달리 상업화하는 방법 또는 방법 또한 고려된다.
특정 실시 형태에서, 예를 들어, 본 명세서에 기재된 바와 같은 GH61 엔도글루카나아제 또는 그의 변종 중 하나 이상을 포함하는 본 발명의 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물은, 소정의 에탄올(바이오에탄올) 정제공장 또는 다른 생화학물질 또는 생물재료 제조업체에 공급되거나 판매될 수 있다. 첫번째 예에서, 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물은, 산업적 규모의 효소 제조에 전문화된 효소 제조 설비 내에서 제조될 수 있다. 이어서, 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물을 포장하거나 효소 제조업체의 고객에게 판매할 수 있다. 이러한 운영 전략을 본 명세서에서는 "상업 효소 공급 모델(merchant enzyme supply model)"이라고 명명한다.
다른 운영 전략에서, 본 발명의 비-천연 셀룰라아제 및 헤미셀룰라아제 조성물은 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조업체("현장")에, 또는 그 부근에 위치하는 현장에 효소 제조업체에 의해 구축된 최신 효소 생산 시스템 내에서 생산될 수 있다. 일부 실시 형태에서는, 효소 제조업체 및 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조업체에 의해 효소 공급 계약이 이행된다. 효소 제조업체는 본 명세서에 기재된 바와 같은 숙주 세포, 발현, 및 생산 방법을 이용하여 현장에서 효소 생산 시스템을 설계, 제어, 및 운영하여, 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물을 생산한다. 소정의 실시 형태에서, 바람직하게는 본 명세서에 기재된 바와 같이 적절한 전처리를 적용하는 적합한 바이오매스를, 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조 설비에서, 또는 그 부근에서 본 명세서의 당화 방법 및 효소 및/또는 효소 조성물을 사용하여 가수분해할 수 있다. 이어서, 생성되는 발효가능한 당에 동일한 설비 또는 부근의 설비에서 발효를 적용할 수 있다. 이러한 운영 전략을 본 명세서에서는 "현장 생물정제 모델(on-site biorefinery model)"이라고 명명한다.
현장 생물정제 모델은, 예를 들어, 상업 효소 공급자로부터의 효소 공급에 대한 최소의 의존을 가능하게 하는 자급 운영의 제공을 포함하는, 상업 효소 공급 모델에 비한 소정의 이점을 제공한다. 이는 결국 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조업체가 실시간 또는 근사 실시간 수요에 기초하여 효소 공급을 더 잘 제어하는 것을 가능하게 한다. 소정의 실시 형태에서는, 서로 가까이 위치하는 바이오에탄올 정제공장 및/또는 생화학물질/생물재료 제조업체 2개 사이에, 또는 2개 이상 사이에 현장 효소 생산 설비를 공유하여, 효소의 수송 및 보관 비용을 절감할 수 있다는 것을 고려한다. 또한, 이는 효소 생산 설비 현장에서 더 즉각적인 "드롭-인(drop-in)" 기술 개선을 가능하게 하여, 발효가능한 당 및 궁극적으로, 바이오에탄올 또는 생화학물질의 더 높은 수율에 대한 효소 조성물의 개선 사이의 시차를 감소시킨다.
현장 생물정제 모델은, 그것을 사용하여 본 개시의 셀룰라아제 및 비-천연 헤미셀룰라아제 조성물 뿐 아니라, 전분(예를 들어, 옥수수)을 가공하여 더 효율적이고 효과적으로 전분을 바이오에탄올 또는 생화학물질로 직접 전환할 수 있게 하는 효소 및 효소 조성물 또한 제조하고, 공급하고, 생산할 수 있다는 점에서, 바이오에탄올 및 생화학물질의 산업적 생산 및 상업화에 더 일반적인 응용가능성을 갖는다. 소정의 실시 형태에서, 전분-가공 효소는 현장 생물정제공장에서 생산된 후에, 바이오에탄올을 생산하기 위하여 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조 설비 내로 신속하고 용이하게 통합될 수 있다.
따라서 소정의 태양에서 본 발명은 또한, 효소(예를 들어, 소정의 GH61 엔도글루카나아제 및 그의 변종), 세포, 조성물(예를 들어, 적합한 GH61 엔도글루카나아제 또는 그의 변종을 포함함), 및 본 명세서의 공정을 소정의 바이오에탄올, 바이오연료, 생화학물질, 또는 다른 생물재료의 제조 및 시판에 응용하는 소정의 영업 방법에 관한 것이다. 일부 실시 형태에서, 본 발명은 이러한 효소, 세포, 조성물, 및 공정의 현장 생물정제 모델에서의 응용에 관한 것이다. 다른 실시 형태에서, 본 발명은 이러한 효소, 세포, 조성물, 및 공정의 상업 효소 공급 모델에서의 응용에 관한 것이다.
이와 관련하여, 본 개시는 본 발명의 효소 및/또는 효소 조성물의 상업적 설정에서의 용도를 제공한다. 예를 들어, 본 개시의 효소 및/또는 효소 조성물은, 효소 및/또는 조성물을 사용하는 전형적이거나 바람직한 방법에 대한 지침을 동반하여 적합한 시장에서 판매될 수 있다. 따라서 본 개시의 효소 및/또는 효소 조성물은 상업 효소 공급자 모델 내에서 사용되거나 상업화될 수 있으며, 여기서 본 개시의 효소 및/또는 효소 조성물은 바이오에탄올의 제조업체, 연료 정제공장, 또는 연료 또는 바이오-산물 생산에 종사하는 생화학물질 또는 생물재료 제조업체에 판매된다. 일부 태양에서, 본 개시의 효소 및/또는 효소 조성물은 현장 생물정제 모델을 사용하여 시판되거나 상업화될 수 있으며, 여기서 효소 및/또는 효소 조성물은 연료 정제공장 또는 생화학물질/생물재료 제조업체의 설비에, 또는 그 부근에 있는 설비에서 생산되거나 제조되고, 본 발명의 효소 및/또는 효소 조성물은 실시간 기반으로 연료 정제공장 또는 생화학물질/생물재료 제조업체의 특정 필요성에 맞추어진다. 또한 본 개시는, 목적하는 바이오-산물(예를 들어, 바이오연료, 생화학물질, 생물재료 등)을 제조하고 시판할 수 있도록 이들 제조업체에 효소 및/또는 효소 조성물을 사용하기 위한 기술적 지원 및/또는 지침을 제공하는 단계에 관한 것이다.
본 발명의 방법 및 조성물의 실시예가 하기에 이어진다. 상기 제공된 일반적 설명이 주어지면, 다른 다양한 실시 형태가 실시될 수 있음이 이해된다.
실시예
실시예 1: 어세이/방법
하기 실시예에는 하기의 어세이/방법을 일반적으로 사용하였다. 하기 제공된 프로토콜로부터의 임의의 변경은 특정 실시예에 나타낸다.
A. 바이오매스 기질의 전처리
국제 특허 공개 제WO06110901A호에 기재된 방법 및 가공 범위에 따라(달리 표시하지 않는 한) 옥수수 속대, 옥수수 대, 및 스위치 그래스를 효소적 가수분해 전에 전처리하였다. 전처리에 대한 이들 참고문헌은 또한 미국 특허 출원 공개 제20070031918-A1호, 제20070031919-A1호, 제20070031953-A1호, 및/또는 제20070037259-A1호의 개시에 포함된다.
암모니아 폭쇄(AFEX: Ammonia fiber explosion) 처리한 옥수수 대는 미시간 바이오테크놀로지 인스티튜트 인터내셔날(MBI: Michigan Biotechnology Institute International)로부터 입수하였다. 국립 재생 에너지 연구소(NREL: National Renewable Energy Laboratory) 절차, NREL LAP-002를 사용하여 MBI(Teymouri, F et al. Applied Biochemistry and Biotechnology, 2004, 113:951-963)에 의해 옥수수 대의 조성을 결정하였다. NREL 절차는, http://www.nrel.gov/ biomass/analytical_procedures.html에서 입수가능하다.
FPP 펄프 및 종이 기질은 프랑스 소재의 스머핏 카파 셀룰로오스 두 핀(SMURFIT KAPPA CELLULOSE DU PIN)으로부터 입수하였다.
증기 팽창된 사탕수수 바가스(SEB: steam expanded sugar-cane bagasse)는 선옵타(SunOpta)로부터 입수하였다(Glasser, WG et al. Biomass and Bioenergy 1998, 14(3): 219-235; Jollez, P et al. Advances in thermochemical biomass conversion, 1994, 2:1659-1669).
B. 바이오매스의 조성 분석
바이오매스 내의 구조 탄수화물 및 리그닌의 결정에 기재된 2-단계 산 가수분해 방법(National Renewable Energy Laboratory, Golden, CO 2008 http://www.nrel.gov/biomass/pdfs/42618.pdf)을 사용하여 바이오매스 기질의 조성을 측정하였다. 이 방법을 사용하여, 효소적 가수분해 결과를 기질의 시작 글루칸 및 자일란 함량으로부터의 이론적 수율에 대한 퍼센트 전환의 관점에서 본 명세서에 보고하였다.
C. 총 단백질 어세이
BCA 단백질 어세이는 분광 광도계로 단백질 농도를 측정하는 비색 어세이이다. BCA 단백질 어세이 키트(피어스 케미칼(Pierce Chemical), 제품 #23227)를 제조업체의 제안에 따라 사용하였다. 50 mM 소듐 아세테이트 완충제(pH 5)를 사용하여 시험관에 효소 희석액을 제조하였다. 1 mL의 15% 트라이클로로아세트산(TCA)을 함유하는 2 mL 에펜도르프 원심분리관에 희석된 효소 용액(0.1 mL)을 첨가하였다. 튜브를 보텍싱하고 얼음조에 10 min 동안 넣어 두었다. 이어서, 샘플을 14,000 rpm에서 6 min 동안 원심분리하였다. 상청액을 따라내고, 펠렛을 1 mL의 0.1 N NaOH에 재현탁하고, 펠렛이 용해될 때까지 튜브를 보텍싱하였다. 2 mg/mL의 스톡 용액으로부터 BSA 표준 용액을 제조하였다. 0.5 mL의 시약 B를 25 mL의 시약 A와 혼합함으로써 BCA 작업 용액을 제조하였다. 0.1 mL의 효소 재현탁 샘플을 3개의 에펜도르프 원심분리관에 첨가하였다. 2 mL의 피어스(Pierce) BCA 작업 용액을 각각의 샘플 및 BSA 표준 에펜도르프 튜브에 첨가하였다. 모든 튜브를 37℃ 수조에서 30 min 동안 인큐베이션하였다. 이어서, 샘플을 실온으로 냉각시키고(15 min) 분광 광도계에서 562 nm에서 흡광도를 측정하였다.
각각의 표준에 대한 단백질 흡광도의 평균값을 계산하였다. x-축을 흡광도로 하고 y-축을 농도(mg/mL)로 하여, 평균 단백질 표준을 플로팅하였다. 하기의 선형 수학식에 지점들을 적합시켰다:
y=mx +b
x- 값에 흡광도를 대입하여 효소 샘플의 원 농도를 계산하였다. 희석 배수를 곱하여 총 단백질 농도를 계산하였다.
정제된 샘플의 총 단백질을 A280에 의해 결정하였다(Pace, CN, et al. Protein Science, 1995, 4:2411-2423).
발효 산물의 총 단백질 함량은 간혹, 켈달(Kjeldahl)(rtech laboratories, www.rtechlabs.com )에 의해, 또는 두마스(DUMAS) 방법(트루스펙 CN(TruSpec CN), www.leco.com )(Sader, A.P.O. et al., Archives of Veterinary Science, 2004, 9(2):73-79)에 의해 자체적으로, 방출된 질소의 연소, 포집, 및 측정에 의한 총 질소로서 측정되었다. 복잡한 단백질-함유 샘플, 예를 들어, 발효 브로스의 경우, 평균 16%의 N 함량, 및 질소 대 단백질에 대해 6.25의 변환 인자를 사용하였다. 일부 경우에는, 간섭성 비-단백질 질소를 제거하기 위하여 총 침전가능한 단백질을 측정하였다. 12.5%의 최종 TCA 농도를 사용하였으며, 단백질-함유 TCA 펠렛은 0.1 M NaOH에 재현탁하였다.
일부 경우에는, 쿠마시 플러스- 더 베터 브래드포드 어세이(Coomassie Plus- the Better Bradford Assay)(일리노이주 록포드 소재의 써모 사이언티픽(Thermo Scientific), 제품 #23238)를 제조업체 권고사항에 따라 사용하였다. 다른 경우에는, 소 혈청 알부민을 보정물질로서 사용하여 바이크젤바움(Weichselbaum) 및 고날(Gornall)에 의해 개질된 뷰렛(Biuret) 방법(Weichselbaum, T. Amer. J. Clin. Path. 1960,16:40; Gornall, A. et al. J. Biol. Chem. 1949, 177:752)을 사용하여 총 단백질을 측정하였다.
D. ABTS를 사용하는 글루코스 결정
글루코스 결정을 위한 ABTS(2, 2'-아지노-비스(3-에틸렌티아졸린-6)-설폰산) 어세이는, 글루코스 옥시다아제가 O2의 존재 하에 화학양론적 양의 과산화수소(H2O2)를 생성시키면서 글루코스의 산화를 촉매한다는 원리에 기초한다. 이 반응 후에는 호스 라디시 퍼옥시다아제(HRP)가 촉매하는 ABTS의 산화가 이어지며, 이는 H2O2의 농도에 선형으로 관련된다. 산화된 ABTS의 발생은 녹색의 발색에 의해 나타나며, 이는 405 nm의 OD에서 정량화된다. ABTS 분말(시그마, #A1888-5g 2.74 mg/mL), 0.1 U/mL HRP(100 U/mL, 시그마, #P8375), 및 1 U/mL 글루코스 옥시다아제(옥시고(OxyGO)(등록상표) HP L5000, 5000 U/mL, 제넨코 디비전(Genencor Division), 다니스코 USA)의 혼합물을 50 mM Na 아세테이트 완충제(pH 5.0) 중에 제조하고 어두운 곳에 보관하였다(기질). 글루코스 표준(0, 2, 4, 6, 8, 10 nmol)을 50 mM Na 아세테이트 완충제(H 5.0) 중에 제조하고 각각의 표준 10 ㎕를 96-웰 평저(flat bottom) MTP에 삼중 실험으로 첨가하였다. 연속 희석된 샘플 10 ㎕ 또한 MTP에 첨가하였다. 100 ㎕의 ABTS 기질 용액을 각각의 웰에 첨가하고 플레이트를 분광 광도계 플레이트 판독기 상에 놓아 5 min 동안 405 nm에서 ABTS의 산화를 동력학적으로 판독하였다.
대안적으로 15 내지 30 min의 인큐베이션에 이어서 2% SDS를 함유하는 50 mM Na 아세테이트 완충제(pH 5.0)로 반응을 켄칭한 후에 405 nm에서 흡광도를 측정하였다.
E. HPLC에 의한 당 분석
원심분리하여 불용성 재료를 제거하는 단계, 0.22 ㎛ 나일론 필터(스핀-X(Spin-X) 원심분리관 필터, 뉴욕주 코닝 소재의 코닝 인코포레이티드(Corning Incorporated))를 통해 여과하는 단계, 및 가용성 당의 적절한 농도까지 증류수로 희석하는 단계에 의해 바이오매스 당화로부터의 샘플을 제조하였다. 6 x 50 mm SH-1011P 가드 컬럼을 가진 쇼덱스 슈가(Shodex Sugar) SH-G SH1011, 8 x 300 mm(www.shodex.net) 상에서 단량체 당을 결정하였다. 용매는 0.6 mL/min으로 흐르는 0.01 N H2SO4였다. 컬럼 온도는 50℃ 였고 검출은 굴절률에 의하였다. 대안적으로, 워터스(Waters) 2410 굴절률 검출기와 함께 바이오라드(Biorad) 아미넥스(Aminex) HPX-87H 컬럼을 사용하여 당을 분석하였다. 분석 시간은 20 min이었고, 주입 부피는 20 ㎕의 희석된 샘플이었으며, 이동상은 0.2 ㎛ 여과하고 탈기시킨 0.01 N 황산이었고, 유속은 0.6 mL/min이었으며 컬럼 온도는 60℃였다. 글루코스, 자일로스, 및 아라비노스의 외부 표준을 각각의 샘플 세트와 함께 진행시켰다.
올리고머성 당은 토소 바이오셉(Tosoh Biosep) G2000PW 컬럼 7.5 mm x 60 cm(www.tosohbioscience.de)를 사용하는 HPLC에서 크기 배제 크로마토그래피에 의해 분리되었다. 용매는 0.6 mL/min에서의 증류수였고 컬럼은 실온에서 진행시켰다. 크기 보정에 사용된 육탄당 표준은 스타키오스, 라피노스, 셀로바이오스, 및 글루코스였고; 오탄당은 자일로헥소오스, 자일로펜토오스, 자일로테트로오스, 자일로트라이오스, 자일로바이오스, 및 자일로스였다. 자일로-올리고머는 메가자임(www.megazyme.com)으로부터 입수하였다. 검출은 굴절률에 의하였으며, 정량적으로 보고된 경우에 결과는 피크 면적 단위 또는 퍼센트에 의한 상대 피크 면적으로서 보고된다.
상기의 원심분리하고 필터 청징화한 샘플의 가수분해에 의해 총 가용성 당을 결정하였다. 청징화한 샘플을 0.8 N H2SO4로 1 대 1 희석하고, 생성된 용액을 마개가 있는 바이알 내에서 1 h의 총 주기 시간 동안 121℃로 가압멸균하였다. 결과는 가수분해 중의 단량체 당의 손실에 대한 교정 없이 보고하였다.
F. 속대로부터의 올리고머 제조 및 효소 어세이
50 mM Na 아세테이트 완충제(pH 5.0)(pH는 1 N 황산으로 조정함) 내에서 글루칸 + 자일란 g 당 8 mg의 T. 레세이 Xyn3를 건조 중량 250 g의 묽은 암모니아로 전처리된 옥수수 속대와 함께 인큐베이션함으로써, 옥수수 속대의 T. 레세이 Xyn3 가수분해로부터의 올리고머를 제조하였다. 72 h 동안 48℃에서, 180 rpm으로 회전식 진탕하면서 반응을 진행시켰다. 상청액을 9,000 x G로 원심분리한 후, 0.22 ㎛ 날진(Nalgene) 필터를 통해 여과하여 가용성 당을 회수하였다. 후속의 효소 어세이를 위하여, T. 레세이 Xyn3 올리고머-함유 상청액의 100 ㎕ 분취량을 1 μg/㎕의 T. 레세이 통합 균주 H3A, 1 μg/㎕의 T. 레세이 통합 균주 H3A/EG4#27, 또는 물 대조군과 함께 에펜도르프 튜브 내에서 48℃에서 2.5 h 동안 인큐베이션하였다. 이어서, 상청액을 얼음 냉각 밀리Q(MilliQ) 물로 4X 희석하고, 여과하고, 올리고머로부터의 당 방출에 대해 HPLC로 분석하였다.
G. 옥수수 속대 당화 어세이
본 명세서의 전형적인 실시예에 있어서, 특정 실시예에 대해 달리 구체적으로 기재되지 않는 한, 옥수수 속대 당화는 하기의 절차에 따라 마이크로타이터 플레이트 체제에서 수행하였다. 바이오매스 기질, 예를 들어, 묽은 암모니아로 전처리된 옥수수 속대를 물 중에 희석하고 황산으로 pH를 조정하여 pH 5의 7% 셀룰로오스 슬러리를 생성시킨 후, 이를 추가의 가공 없이 어세이에 직접 사용하였다. 기질(예를 들어, 옥수수 속대) 내의 셀룰로오스의 그램(예를 들어, 상기 실시예 1A에 기재된 방법을 사용하는 것과 같은 관용적인 조성 분석 방법을 사용하여 결정되는 바와 같음) 당 mg 총 단백질에 기초하여 효소 샘플을 로딩하였다. 이어서, 효소를 50 mM 소듐 아세테이트(pH 5.0) 중에 희석하여, 목적하는 로딩 농도를 얻었다. 70 mg의 묽은 암모니아로 전처리된 옥수수 속대(웰 당 7% 셀룰로오스)에 40 ㎕의 효소 용액을 첨가하였다(웰 당 최종 4.5% 셀룰로오스와 등가임). 어세이 플레이트를 알루미늄 플레이트 실러로 덮고, 실온에서 혼합하여 50℃, 200 rpm에서 3 일("3d") 동안 인큐베이션하였다. 인큐베이션 기간의 종료시에, 각각의 웰에 100 ㎕의 100 mM 글리신 완충제(pH 10.0)를 첨가함으로써 당화 반응을 켄칭하였다. 플레이트를 5 min 동안 3,000 rpm으로 원심분리하였다. 이어서, 96-웰 HPLC 플레이트 내에서 10 ㎕의 상청액을 200 ㎕의 밀리Q 물에 첨가하고 HPLC를 사용하여 가용성 당을 측정하였다.
실시예 2: 트리코더마 레세이의 통합 발현 균주의 작제
하기 5개 유전자를 동시발현시킨 트리코더마 레세이의 통합 발현 균주를 작제하였다: T. 레세이 β-글루코시다아제 유전자 bgl1, T. 레세이 엔도자일라나아제 유전자 xyn3, F. 베르티실리오이데스 β-자일로시다아제 유전자 fv3A, F. 베르티실리오이데스 β-자일로시다아제 유전자 fv43D, 및 F. 베르티실리오이데스 α-아라비노푸라노시다아제 유전자 fv51A.
이들 상이한 유전자 및 T. 레세이의 형질전환을 위한 발현 카세트의 작제는 하기에 기재되어 있다.
A. β-글루코시다아제 발현 벡터의 작제
천연 T. 레세이 β-글루코시다아제 유전자 bgl1의 N-말단 부분은 DNA 2.0(미국 소재의 멘로 파크(Menlo Park))에 의해 코돈 최적화되었다. 이 합성 부분은 코딩 영역의 최초 447 염기로 이루어졌다. 프라이머 SK943 및 SK941을 사용하여 이 단편을 PCR 증폭하였다. 프라이머 SK940 및 SK942를 사용하여, T. 레세이 균주 RL-P37로부터 추출된 게놈 DNA 샘플(Sheir-Neiss, G et al. Appl. Microbiol. Biotechnol. 1984, 20:46-53)로부터 천연 bgl1 유전자의 나머지 영역을 PCR 증폭하였다. 프라이머 SK943 및 SK942를 사용하여 bgl1 유전자의 이들 2개 PCR 단편을 융합 PCR 반응 중에 함께 융합시켰다:
순방향 프라이머 SK943: (5'-CACCATGAGATATAGAACAGCTGCCGCT-3')(서열 번호 121)
역방향 프라이머 SK941: (5'-CGACCGCCCTGCGGAGTCTTGCCCAGTGGTCCCGCGACAG-3')(서열 번호 122)
순방향 프라이머(SK940): (5'-CTGTCGCGGGACCACTGGGCAAGACTCCGCAGGG CGGTCG-3')(서열 번호 123)
역방향 프라이머(SK942): (5'-CCTACGCTACCGACAGAGTG-3')(서열 번호 124)
생성된 융합 PCR 단편을 게이트웨이(Gateway)(등록상표) 엔트리 벡터 pENTR(상표)/D-TOPO(등록상표) 내로 클로닝하고, E. 콜라이 원 셧(E. coli One Shot)(등록상표) TOP10 화학적 적격 세포(Chemically Competent cell)(인비트로젠(Invitrogen)) 내로 형질전환시켜 중간체 벡터, pENTR-TOPO-Bgl1-(943/942)(도 8a)를 생성시켰다. 삽입된 DNA의 뉴클레오티드 서열을 결정하였다. 인비트로젠에 의해 약술된 LR 클로나아제(LR clonase)(등록상표) 반응 프로토콜을 사용하여, 정확한 bgl1 서열을 가진 pENTR-943/942 벡터를 pTrex3g와 재조합하였다. LR 클로나아제 반응 혼합물을 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠) 내로 형질전환시켜, 최종 발현 벡터, pTrex3g 943/942(도 8b)를 생성시켰다. 벡터는 또한, T. 레세이의 형질전환에 대한 선택가능한 표지자로서 아세트아미다아제를 암호화하는 아스페르길루스 니둘란스 amdS 유전자를 함유한다. 프라이머 SK745 및 SK771을 이용하는 PCR로 발현 카세트를 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.
순방향 프라이머 SK771: (5'-GTCTAGACTGGAAACGCAAC-3')(서열 번호 125)
역방향 프라이머 SK745: (5'-GAGTTGTGAAGTCGGTAATCC -3') (서열 번호 126)
B. 엔도자일라나아제 발현 카세트의 작제
프라이머 xyn3F-2 및 xyn3R-2를 사용하여, T. 레세이로부터 추출된 게놈 DNA 샘플로부터 천연 T. 레세이 엔도자일라나아제 유전자 xyn3을 PCR 증폭하였다.
순방향 프라이머 xyn3F-2: (5'-CACCATGAAAGCAAACGTCATCTTGTGCCTCCTGG-3')(서열 번호 127)
역방향 프라이머 (xyn3R-2): (5'-CTATTGTAAGATGCCAACAATGCTGTTATATGC CGGCTTGGGG-3')(서열 번호 128)
생성된 PCR 단편을 게이트웨이(등록상표) 엔트리 벡터 pENTR(상표)/D-TOPO(등록상표) 내로 클로닝하고, E. 콜라이 원 셧(등록상표) TOP10 내로 화학적으로 형질전환시켰다(도 8c). 삽입된 DNA의 뉴클레오티드 서열을 결정하였다. 인비트로젠에 의해 약술된 LR 클로나아제(등록상표) 반응 프로토콜을 사용하여, 정확한 xyn3 서열을 가진 pENTR/Xyn3 벡터를 pTrex3g와 재조합하였다. LR 클로나아제 반응 혼합물을 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠) 내로 형질전환시켜, 최종 발현 벡터, pTrex3g/Xyn3(도 8d)를 생성시켰다. 벡터는 또한, T. 레세이의 형질전환에 대한 선택가능한 표지자로서 아세트아미다아제를 암호화하는 아스페르길루스 니둘란스 amdS 유전자를 함유한다. 프라이머 SK745 및 SK822를 이용하는 PCR로 발현 카세트를 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.
순방향 프라이머 SK745: (5'-GAGTTGTGAAGTCGGTAATCC-3')(서열 번호 129)
역방향 프라이머 SK822: (5'-CACGAAGAGCGGCGATTC-3')(서열 번호 130)
C. β-자일로시다아제 Fv3A 발현 벡터의 작제
프라이머 MH124 및 MH125를 사용하여, F. 베르티실리오이데스 게놈 DNA 샘플로부터 F. 베르티실리오이데스 β-자일로시다아제 fv3A 유전자를 증폭하였다.
순방향 프라이머 MH124: (5'-CAC CCA TGC TGC TCA ATC TTC AG -3')(서열 번호 131)
역방향 프라이머 MH125: (5'-TTA CGC AGA CTT GGG GTC TTG AG -3')(서열 번호 132)
PCR 단편을 게이트웨이 (등록상표) 엔트리 벡터 pENTR(상표)/D-TOPO(등록상표) 내로 클로닝하고, E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠) 내로 형질전환시켜 중간체 벡터, pENTR-Fv3A(도 8e)를 생성시켰다. 삽입된 DNA의 뉴클레오티드 서열을 결정하였다. 인비트로젠에 의해 약술된 LR 클로나아제(등록상표) 반응 프로토콜을 사용하여, 정확한 fv3A 서열을 가진 pENTR-Fv3A 벡터를 pTrex6g(도 8f)와 재조합하였다. LR 클로나아제 반응 혼합물을 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠) 내로 형질전환시켜, 최종 발현 벡터, pTrex6g/Fv3A(도 8g)를 생성시켰다. 벡터는 또한, alsR로 표기되는 천연 T. 레세이 아세토락테이트 신타아제(als) 유전자의 클로리무론 에틸 내성 돌연변이체를 함유하며, 이는 그의 천연 프로모터 및 터미네이터와 함께 T. 레세이 의 형질전환에 대한 선택가능한 표지자로서 사용된다(제WO2008/039370 A1호). 프라이머 SK1334, SK1335, 및 SK1299로 발현 카세트를 PCR 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.
순방향 프라이머 SK1334: (5'-GCTTGAGTGTATCGTGTAAG -3')(서열 번호 133)
순방향 프라이머 SK1335: (5'-GCAACGGCAAAGCCCCACTTC -3')(서열 번호 134)
역방향 프라이머 SK1299: (5'-GTAGCGGCCGCCTCATCTCATCTCATCCATCC -3')(서열 번호 135)
D. β-자일로시다아제 Fv43D 발현 카세트의 작제
F. 베르티실리오이데스 β-자일로시다아제 Fv43D 발현 카세트의 작제를 위하여, 프라이머 SK1322 및 SK1297을 사용하여 F. 베르티실리오이데스 게놈 DNA 샘플로부터 fv43D 유전자 산물을 증폭하였다. 프라이머 SK1236 및 SK1321을 사용하여, 균주 RL-P37로부터 추출된 T. 레세이 게놈 DNA 샘플로부터 엔도글루카나아제 유전자 egl1의 프로모터의 영역을 PCR로 증폭하였다. 이어서, 프라이머 SK1236 및 SK1297을 사용하여, 융합 PCR 반응 중에 이들 2개의 PCR 증폭된 DNA 단편을 함께 융합시켰다. 생성된 융합 PCR 단편을 pCR-Blunt II-TOPO 벡터(인비트로젠) 내로 클로닝하여 플라스미드 TOPO Blunt/Pegl1-Fv43D(도 8h)를 제공하고, 이 플라스미드를 사용하여 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠)를 형질전환시켰다. 몇몇 E. 콜라이 클론으로부터 플라스미드 DNA를 추출하고 제한효소 분해(restriction digest)로 확인하였다.
순방향 프라이머 SK1322: (5'-CACCATGCAGCTCAAGTTTCTGTC-3')(서열 번호 136)
역방향 프라이머 SK1297: (5'-GGTTACTAGTCAACTGCCCGTTCTGTAGCGAG-3')(서열 번호 137)
순방향 프라이머 SK1236: (5'-CATGCGATCGCGACGTTTTGGTCAGGTCG-3')(서열 번호 138)
역방향 프라이머 SK1321: (5'-GACAGAAACTTGAGCTGCATGGTGTGGGACA ACAAGAAGG-3')(서열 번호 139)
TOPO Blunt/Pegl1-Fv43D로부터 프라이머 SK1236 및 SK1297로 발현 카세트를 PCR 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.
E. α-
아라비노푸라노시다아제
발현 카세트의
작제
F. 베르티실리오이데스 α-아라비노푸라노시다아제 유전자 fv51A 발현 카세트의 작제를 위하여, 프라이머 SK1159 및 SK1289를 사용하여 F. 베르티실리오이데스 게놈 DNA로부터 fv51A 유전자 산물을 증폭하였다. 프라이머 SK1236 및 SK1262를 사용하여, 균주 RL-P37로부터 추출된 T. 레세이 게놈 DNA 샘플로부터 엔도글루카나아제 유전자 egl1의 프로모터의 영역을 PCR로 증폭하였다. 이어서, 프라이머 SK1236 및 SK1289를 사용하여, 융합 PCR 반응 중에 이들 2개의 PCR 증폭된 DNA 단편을 함께 융합시켰다. 생성된 융합 PCR 단편을 pCR-Blunt II-TOPO 벡터(인비트로젠) 내로 클로닝하여 플라스미드 TOPO Blunt/Pegl1-Fv51A(도 8i)를 제공하고, 이 플라스미드를 사용하여 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠)를 형질전환시켰다.
순방향 프라이머 SK1159: (5'-CACCATGGTTCGCTTCAGTTCAATCCTAG-3')(서열 번호 140)
역방향 프라이머 SK1289: (5'-GTGGCTAGAAGATATCCAACAC-3')(서열 번호 141)
순방향 프라이머 SK1236: (5'-CATGCGATCGCGACGTTTTGGTCAGGTCG-3')(서열 번호 142)
역방향 프라이머 SK1262: (5'-GAACTGAAGCGAACCATGGTGTGGGACAACAAGAA GGAC-3')(서열 번호 143)
프라이머 SK1298 및 SK1289로 발현 카세트를 PCR 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.
순방향 프라이머 SK1298: (5'-GTAGTTATGCGCATGCTAGAC-')(서열 번호 144)
역방향 프라이머 SK1289: (5'-GTGGCTAGAAGATATCCAACAC-3')(서열 번호 145)
F. β-글루코시다아제 및 엔도자일라나아제를 위한 T. 레세이 발현 카세트의 동시형질전환
RL-P37로부터 유도되고(Sheir-Neiss, G et al. Appl. Microbiol. Biotechnol. 1984, 20:46-53) 높은 셀룰라아제 생성에 대해 선택된 트리코더마 레세이 돌연변이체 균주를, PEG-매개 형질전환(Penttila, M et al. Gene 1987, 61(2):155-64)을 사용하여 β-글루코시다아제 발현 카세트(cbh1 프로모터, T. 레세이 b-글루코시다아제1 유전자, cbh1 터미네이터, 및 amdS 표지자) 및 엔도자일라나아제 발현 카세트(cbh1 프로모터, T. 레세이 xyn3, 및 cbh1 터미네이터)로 동시형질전환시켰다. 다수의 형질전환체를 단리하여 b-글루코시다아제 및 엔도자일라나아제 생성에 대해 시험하였다. 다른 발현 카세트를 이용하는 형질전환에는 T. 레세이 균주 #229로 명명된 하나의 형질전환체를 사용하였다.
G. 2개의 β-자일로시다아제 및 하나의 α-아라비노푸라노시다아제를 위한 발현 카세트를 이용한 T. 레세이 균주 #229의 동시형질전환
T. 레세이 균주 #229를, 전기천공법(예를 들어, 제WO 08153712호 참조)을 사용하여 β-자일로시다아제 fv3A 발현 카세트(cbh1 프로모터, fv3A 유전자, cbh1 터미네이터, 및 alsR 표지자), β-자일로시다아제 fv43D 발현 카세트(egl1 프로모터, fv43D 유전자, 천연 fv43D 터미네이터), 및 fv51A α-아라비노푸라노시다아제 발현 카세트(egl1 프로모터, fv51A 유전자, fv51A 천연 터미네이터)로 동시형질전환시켰다. 클로리무론 에틸(80 ppm)을 함유하는 보겔스(Vogels) 아가 플레이트 상에서 형질전환체를 선택하였다. 보겔스 아가는 하기와 같이 제조하였다(리터 당):
50 x 보겔스 스톡 용액(하기 조제법) 20 mL
BBL 아가 20 g
탈이온 H2O로 980 mL까지 채움
멸균 후 첨가:
50% 글루코스 20 mL
50 x 보겔스 스톡 용액(리터 당):
750 mL 탈이온 H2O 중에, 하기와 같이 이어서 용해시킴:
Na3시트레이트*2H2O 125 g
KH2PO4(무수) 250 g
NH4NO3(무수) 100 g
MgSO4*7H2O 10 g
CaCl2*2H2O 5 g
보겔스 미량 요소 용액(하기 조제법) 5 mL
d-바이오틴 0.1 g
탈이온 H2O로 1 L까지 채움
보겔스 미량 요소 용액:
시트르산 50 g
ZnSO4.*7H2O 50 g
Fe(NH4)2SO4.*6H2O 10 g
CuSO4.5H2O 2.5 g
MnSO4.4H2O 0.5 g
H3BO3 0.5 g
Na2MoO4.2H2O 0.5 g
다수의 형질전환체를 단리하여 β- 자일로시다아제 및 L-α-아라비노푸라노시다아제 생성에 대해 시험하였다. 형질전환체를 또한, 실시예 1(상기)에 기재된 속대 당화 어세이에 따라 바이오매스 전환 성능에 대해 스크리닝하였다. 본 명세서에 기재된 T. 레세이 통합 발현 균주의 예는 H3A, 39A, A10A, 11A, 및 G9A이며, 이들은 T. 레세이 베타-글루코시다아제 1, T. 레세이 Xyn3, Fv3A, Fv51A, 및 Fv43D를 위한 모든 유전자를 상이한 비율로 발현시킨다. 다른 통합 T. 레세이 균주는 T. 레세이 베타-글루코시다아제 1, T. 레세이 Xyn3, Fv3A, Fv51A, 및 Fv43D를 위한 유전자의 대부분이 상이한 비율로 발현된 것들을 포함한다. 예를 들어, 웨스턴 블롯(Western Blot)에 의해 결정할 때, 하나는 과발현 T. 레세이 Xyn3이 결여되었고; 다른 하나는 Fv51A가 결여되었으며; 다른 2개는 Fv3A가 결여되었고, 하나는 과발현 Bgl1이 결여되었다(예를 들어 균주 H3A-5).
H. T. 레세이 통합 균주 H3A의 조성
T. 레세이 통합 균주 H3A의 발효는 하기의 단백질 T. 레세이 Xyn3, T. 레세이 Bgl 1, Fv3A, Fv51A, 및 Fv43D를 본 명세서에 기재되고 도 9에 나타낸 바와 같이 결정된 비율로 생성시킨다.
I. HPLC에 의한 단백질 분석
액체 크로마토그래피(LC) 및 질량 분석법(MS)을 수행하여, 발효 브로스 내에 함유된 효소를 분리하고, 동정하고, 정량화하였다. 효소 샘플을 S. 플리카투스(S. plicatus)(예를 들어, NEB P0702L)로부터 재조합에 의해 발현된 endoH 글리코시다아제로 먼저 처리하였다. EndoH는 μg 샘플 총 단백질 당 0.01 내지 0.03 μg endoH 단백질의 비율로 사용하였고, 3 h 동안 37℃에서(pH 4.5 내지 6.0) 인큐베이션하여 HPLC 분석 전에 N-연결된 글리코실화를 효소적으로 제거하였다. 이어서, HIC-페닐 컬럼 및 35 min에 걸친 고농도 염-대-저농도 염 구배를 가진 애질런트(Agilent) 1100 HPLC 시스템을 사용하는 소수성 상호작용 크로마토그래피를 위해 대략 50 μg의 단백질을 주입하였다. 고농도 염 완충제 A(20 mM 포타슘 포스페이트(pH 6.75)를 함유하는 4 M 암모늄 설페이트) 및 저농도 염 완충제 B(20 mM 포타슘 포스페이트(pH 6.75))를 사용하여 구배를 달성하였다. UV 광으로 222 nm에서 피크를 검출하였고, 분획을 수집하여 질량 분석법으로 동정하였다. 단백질 농도는 샘플의 총 적분 면적에 대한 각각의 피크 면적의 퍼센트로서 보고되어 있다.
J. 묽은 암모니아로 전처리된 옥수수 속대의 당화에 대한, T. 레세이 통합 균주 H3A의 발효 브로스에 정제 단백질을 첨가하는 단계의 효과
정제 단백질(및 하나의 비정제 단백질)을 스톡 용액으로부터 연속 희석하고 T. 레세이 통합 균주 H3A의 발효 브로스에 첨가하여, 전처리된 바이오매스의 당화에 대한 그의 이익을 결정하였다. 묽은 암모니아로 전처리된 옥수수 속대를 20% 고체(w/w)(웰 당 ~5 mg의 셀룰로오스)(pH 5)로 마이크로타이터 플레이트(MTP) 웰 내에 로딩하였다. 각각의 웰에 H3A 단백질(발효 브로스의 형태)을 20 mg 단백질/g 셀룰로오스로 첨가하였다. 10, 5, 2, 및 1 ㎕의 부피의 각각의 희석된 단백질(도 10)을 개별적인 웰 내에 첨가하고, 각각의 웰에 대한 액체 첨가가 총 10 ㎕이도록 물을 첨가하였다. 대조 웰은 10 ㎕의 물 또는 부가적인 H3A 발효 브로스 희석액의 첨가를 포함하였다. MTP를 포일로 실링하고 이노바 인큐베이터 진탕기 내에서 200 RPM 진탕을 동반하여 50℃에서 3 일 동안 인큐베이션하였다. 100 ㎕의 100 mM 글리신(pH 10)으로 샘플을 켄칭하였다. 켄칭한 샘플을 플라스틱 시일로 덮고 4℃에서 5 min 동안 3000 RPM으로 원심분리하였다. 켄칭된 반응 혼합물의 분취량(5 ㎕)을 100 ㎕의 물로 희석하고, 반응 혼합물 내에 생성된 글루코스의 농도를 HPLC를 사용하여 결정하였다. 20 mg/g의 H3A에 첨가된 단백질 농도의 함수로서 글루코스 데이터를 플로팅하였다(단백질 첨가의 농도는 상이한 시작 농도 및 부피에 의한 첨가로 인하여 가변적이었음). 결과는 도 11a 내지 11d에 나타낸다.
실시예 3: T. 레세이 균주의 작제
A. T. 레세이 균주 H3A/EG4#27의 작제 및 그에 대한 스크리닝
T. 레세이 egl1(또한 "Cel 7B"라고 명명됨) 프로모터, T. 레세이 eg4(또한 "TrEG4", 또는 "Cel 61A"라고 명명됨) 개방 해독틀, 및 트리코더마 레세이로부터의 cbh1(Cel 7A) 터미네이터 서열(도 12a), 및 아스페르길루스 니게르로부터의 sucA 선택가능한 표지자(Boddy et al., Curr. Genet. 1993, 24:60-66)를 함유하는 발현 카세트를 pCR Blunt II TOPO(인비트로젠) 내로 클로닝하였다(도 12b).
하기의 프라이머를 이용하는 PCR로 발현 카세트 Pegl1 - eg4-sucA를 증폭하였다:
SK1298: 5'-gtagttatgcgcatgctagac-3'(서열 번호 146)
214: 5'-CCGGCTCAGTATCAACCACTAAGCACAT-3'(서열 번호 147)
PCR 반응을 위한 폴리머라아제로서 Pfu Ultra II(스트라타진(Stratagene))를 사용하였다. 퀴아퀵(QIAquick) PCR 정제 키트(퀴아젠(Qiagen))로 제조업체의 프로토콜에 따라 PCR 반응의 산물을 정제하였다. 이어서, 스피드 백(speed vac)을 사용하여 PCR 반응의 산물을 1 내지 3 μg/㎕까지 농축하였다. 형질전환시킬 T. 레세이 숙주 균주(H3A)를 감자 덱스트로스 아가 플레이트 상에서 5 d 동안 28℃에서 완전 포자형성까지 성장시켰다. 2개 플레이트로부터의 포자를 밀리Q 물로 수확하고 40 ㎛ 세포 스트레이너(BD 팔콘(BD Falcon))를 통해 여과하였다. 포자를 50 mL 원추형 튜브에 이전하고 반복 원심분리에 의해 50 mL 물로 3회 세척하였다. 1.1 M 소르비톨 용액으로 최종 세척을 실행하였다. 1.1 M 소르비톨 용액을 사용하여 작은 부피(펠렛 부피의 2배 미만)에 포자를 재현탁하였다. 이어서, 포자 현탁액을 얼음 상에 보관하였다. 포자 현탁액(60 ㎕)을 10 내지 20 μg의 DNA와 혼합하고, 전기천공법 큐벳(인비트로젠으로부터의 E-셧(E-shot), 0.1 cm 표준 전기천공법 큐벳) 내에 이전하였다. 16 kV/cm, 25 μF, 400 Ω의 설정으로 바이오라드 진 펄서 X셀(Gene Pulser Xcell)을 사용하여 포자를 전기천공하였다. 전기천공법 후에, 포자 현탁액에 1 mL의 1.1.M 소르비톨 용액을 첨가하였다. 탄소 공급원으로서 2% 수크로스를 함유하는 보겔스 아가 상에 포자 현탁액을 플레이팅하였다(실시예 2G 참조).
형질전환 플레이트를 30℃에서 5 내지 7 d 동안 인큐베이션하였다. 초기 형질전환체를 수크로스가 있는 2차 보겔스 아가 플레이트 상에 재도말하고 30℃에서 부가적인 5 내지 7 d 동안 성장시켰다. 2차 선택 플레이트 상에서 성장하는 단일 콜로니를, 이어서 마이크로타이터 플레이트의 웰 내에서 제WO/2009/114380호에 기재된 방법을 사용하여 성장시켰다. 상청액을 SDS-PAGE 상에서 분석하여 당화 성능 스크리닝 전에 발현 수준을 확인하였다.
총 94개의 형질전환체가 균주 H3A 내에서 EG4를 과발현시켰다. 2개의 H3A 대조군 균주를 H3A/EG4 균주와 함께 마이크로타이터 플레이트 내에서 성장시켰다. 암모니아로 전처리된 옥수수 속대를 사용하여, EG4 단백질을 발현시키는 T. 레세이 균주의 성능 스크리닝을 수행하였다. 묽은 암모니아로 전처리된 옥수수 속대를 물 중에 현탁하고 황산을 이용하여 pH 5.0으로 조정하여 7% 셀룰로오스를 달성하였다. 슬러리를 평저 96 웰 마이크로타이터 플레이트(넌크(Nunc), 269787) 내에 분주하고 3,000 rpm에서 5 min 동안 원심분리하였다.
기질의 웰 당 20 ㎕의 H3A 또는 H3A/EG4 균주 배양 브로스를 첨가함으로써 옥수수 속대 당화 반응을 개시하였다. 옥수수 속대 당화 반응 혼합물을 알루미늄(E&K 사이언티픽(E&K scientific))으로 실링하고 5 min 동안 650 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 72 h 동안 이노바 인큐베이터에 넣어 두었다. 72-h 당화의 종료시에, 100 ㎕의 100 mM 글리신(pH 10.0)을 첨가함으로써 반응을 켄칭하였다. 이어서, 플레이트를 완전히 혼합하고 3,000 rpm에서 5 min 동안 원심분리하였다. HPLC 96-웰 마이크로타이터 플레이트(애질런트, 5042-1385) 내에서 200 ㎕의 물에 상청액(10 μL)을 첨가하였다. 가드 컬럼이 사전-설치된 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098)을 사용하여 HPLC로 글루코스, 자일로스, 셀로바이오스, 및 자일로바이오스 농도를 측정하였다.
옥수수 속대에 대한 스크리닝에 의해 하기의 H3A/EG4 균주가 H3A 대조군 균주에 비교하여 개선된 글루칸 및 자일란 전환을 갖는 것으로 동정되었다: 1, 2, 3, 4, 5, 6, 14, 22, 27, 43, 및 49(도 13).
선택된 H3A/EG4 균주를 진탕 플라스크 내에서 재성장시켰다. 진탕 플라스크 당 균주 당 총 30 mL의 단백질 배양 여과액을 수집하였다. 10 kDa 막 원심 농축기(사토리우스(Sartorious), VS2001)를 사용하여 배양 여과액을 10배 농축하고 실시예 1C에 기재된 바와 같이 BCA에 의해 총 단백질 농도를 결정하였다. 옥수수 속대 기질의 웰 당 셀룰로오스의 g 당 H3A/EG4 균주 샘플로부터의 단백질 2.5, 5, 10, 또는 20 mg을 사용하여 옥수수 속대 당화 반응을 수행하였다. 14 L 발효 규모에서 생성된 H3A 균주, 및 진탕 플라스크 규모에서 생성된 사전에 동정된 저성능 샘플(H3A/EG4 균주 #20)이 대조군으로서 포함되었다. 실시예 4(하기)에 기재된 바와 같이 당화 반응을 실행하였다. 모든 EG4 발현 균주로부터의 배양 상청액에 대하여, 단백질 용량의 증가에 따른 글루칸 전환의 증가가 관찰되었다(도 14). T. 레세이 통합 균주 H3A/EG4#27을 부가적인 당화 반응에 사용하였으며, 균주는 단일 콜로니를 감자 덱스트로스 플레이트(그로부터 단일 콜로니가 단리됨) 상에 도말함으로써 정제하였다.
실시예 4: 묽은 암모니아로 전처리된 옥수수 속대의 개선된 당화를 위한 T. 레세이 EG4 농도의 범위
바람직한 용량을 결정하기 위하여, T. 레세이 통합 균주 H3A/EG4 #27 또는 반응 혼합물에 첨가된 정제 EG4를 가진 H3A로부터의 발효 브로스를 사용하여 pH 5.3에서 묽은 암모니아로 전처리된 옥수수 속대(25% 고체, 8.7% 셀룰로오스, 7.3% 자일란)의 가수분해를 수행하였다. T. 레세이 통합 균주 H3A/EG4 #27 또는 H3A의 총 로딩은 글루칸(G) 및 자일란(X)의 그램 당 14 mg 단백질이었다.
도 15, 17a, 및 17b의 투여 차트에 따라 5 mL의 총 반응 부피로 20 mL 섬광 바이알 내에 반응 혼합물(총 질량 5 g)을 로딩하였다.
실험 1을 위한 구성을 도 15에 나타낸다. 원추형 튜브 내에서 밀리Q 물 및 6 N 황산을 혼합하여 각각의 바이알에 첨가하고 바이알을 선회시켜 내용물을 혼합하였다. 효소 샘플을 바이알에 첨가하고 바이알을 6 d 동안 50℃에서 인큐베이션하였다. 다양한 시점에서, 100㎕의 샘플을 바이알로부터 채취하여 900 ㎕의 5mM 황산으로 희석하고, 보텍싱하고, 원심분리하고, HPLC를 사용하여 가용성 당의 농도를 측정하기 위하여 상청액을 사용하였다. 글루칸 및 자일란 전환의 결과를 도 16a 및 16b에 각각 나타낸다.
실험 2를 위한 구성을 도 17a에 나타낸다. 바람직한 EG4 농도를 추가로 결정하기 위하여, T. 레세이 통합 균주 H3A/EG4 #27 또는 반응 혼합물에 첨가된(0.05 내지 1.0 mg 단백질/g G+X의 범위) 정제 EG4를 가진 H3A로부터의 발효 브로스를 사용하여 pH 5.3에서 묽은 암모니아 옥수수 속대(25% 고체, 8.7% 셀룰로오스, 7.3% 자일란)의 당화를 수행하였다 T. 레세이 통합 균주 H3A/EG4 #27 또는 H3A의 총 로딩은 14 mg 단백질/g 글루칸 + 자일란이었다. 실험 결과는 도 18a에 나타낸다.
실험 3을 위한 구성을 도 17b에 나타낸다. T. 레세이 Eg4의 바람직한 농도 범위를 더욱 추가로 적시하기 위하여, T. 레세이 통합 균주 H3A/EG4 #27 또는 0.1 내지 0.5 mg 단백질/g G+X 범위의 농도로 첨가된 정제 EG4를 가진 H3A를 사용하여 pH 5.3에서 묽은 암모니아 옥수수 속대(25% 고체, 8.7% 셀룰로오스, 및 7.3% 자일란)를 가수분해하였다. T. 레세이 통합 균주 H3A/EG4 #27 또는 H3A의 총 로딩은 글루칸 및 자일란의 g 당 14 mg 단백질이었다.
결과는 도 18b에 나타낸다.
실시예 5: 상이한 고체 로딩에서 묽은 암모니아로 전처리된 옥수수 대의 당화에 대한 T. 레세이 Eg4의 효과
묽은 암모니아로 전처리된 옥수수 대를, 7, 10, 15, 20, 및 25% 고체(%S)에서 3 일 동안 50℃, pH 5.3에서 T. 레세이 통합 균주 H3A 또는 H3A/EG4#27로부터의 발효 브로스(14 mg 단백질/g 글루칸 및 자일란)와 함께 인큐베이션하였다(20 mL 바이알 내의 5 g 총 습윤 바이오매스). 상기 실시예 4에 기재된 바와 같이 반응을 실행하였다. 글루코스 및 자일로스를 HPLC로 분석하였다. 결과는 도 19에 나타낸다. 최대 20% 고체의 모든 샘플이 제1일에 가시적으로 액화되었다.
실시예 6: 묽은 암모니아로 전처리된 옥수수 속대의 가수분해에 대한 T. 레세이 EG4의 과발현의 효과
균주 H3A/EG4 # 27 및 H3A로부터의 발효 브로스를 사용하여, 묽은 암모니아로 전처리된 옥수수 속대의 당화에 대한 균주 H3A 내의 T. 레세이 Eg4의 과발현의 효과를 시험하였다. 하기와 같이 20 mL 유리 바이알 내에서 3 g 규모로 옥수수 속대 당화를 수행하였다. 효소 제제, 1 N 황산, 및 50 mM 소듐 아세테이트 완충제(pH 5.0)(0.01% 소듐 아자이드 및 5 mM MnCl2를 가짐)를 첨가하여, 글루칸 + 자일란 그램 당 1.7 내지 21.0 mg 총 단백질로 변동하는 효소 로딩을 가진, 22% 건조 고체, pH 5.0, 3 g 총 반응 혼합물의 최종 슬러리를 제공하였다. 모든 당화 바이알을 180 rpm 회전을 동반하여 48℃에서 인큐베이션하였다. 72 h 후에, 12 mL의 여과된 밀리Q 물을 각각의 바이알에 첨가하여 전체 당화 반응 혼합물을 5배 희석하였다. 샘플을 14,000 x g에서 5 min 동안 원심분리한 후, 0.22 ㎛ 나일론 필터(스핀-X 원심분리관 필터, 뉴욕주 코닝 소재의 코닝 인코포레이티드)를 통해 여과하고, 여과된 밀리Q 물로 4배 추가 희석하여 최종 20X 희석액을 생성시켰다. 20 ㎕ 주입량을 HPLC로 분석하여 방출된 당을 측정하였다.
T. 레세이 Eg4의 첨가 또는 과발현은 H3A 단독에 비교하여 증진된 자일로스 및 글루코스 단량체 방출을 유발하였다(도 20 및 21). H3A/EG4#27을 상이한 용량으로 첨가하는 단계는, 균주 H3A에 비교하여, 또는 Eg4 + 일정한 1.12 mg Xyn3 / g 글루칸 + 자일란에 비교하여, 증가된 자일로스의 수율을 유발하였다(도 20).
H3A/EG4#27을 상이한 용량으로 첨가하는 단계는, 균주 H3A에 비교하여, 또는 Eg4 + 일정한 1.12 mg Xyn3 / g 글루칸 + 자일란에 비교하여, 증가된 글루코스의 수율을 유발하였다(도 21).
통합 균주 H3A/EG4# 27 또는 H3A에 의한 발효가능한 총 단량체(자일로스, 글루코스, 및 아라비노스) 방출에 대한 T. 레세이 Eg4의 효과를 도 22에 예시한다. H3A/EG4#27 통합 균주는, 통합 균주 H3A에 비교하여, 또는 Eg4 + 1.12 mg Xyn3/g 글루칸 + 자일란에 비교하여, 증진된 발효가능한 총 단량체 방출을 유발하였다.
실시예 7: 정제 T. 레세이 EG4는 묽은 암모니아로 전처리된 옥수수 속대에서 글루코스 방출을 유발한다
0.53 mg Xyn3 / g 글루칸 + 자일란의 존재 또는 부재 하에 1.05 g의 묽은 암모니아로 전처리된 옥수수 속대를 사용하여, 방출된 당의 농도에 대한 정제 T. 레세이 Eg4의 효과를 시험하였다. 실시예 6에 기재된 바와 같이 실험을 수행하였다. 결과는 도 23에 나타낸다. 결과는, 정제 T. 레세이 Eg4가 엔도글루카나아제, 셀로바이오하이드롤라아제, 및 β-글루코시다아제와 같은 다른 셀룰라아제의 작용 없이 글루코스 단량체의 방출을 유발한다는 것을 나타낸다.
또한, 정제 Eg4가 단독으로 첨가된(Xyn3은 첨가하지 않음) 묽은 암모니아로 전처리된 옥수수 속대를 사용하여 당화 실험을 수행하였다. 5 mL 바이알 내에서, 872 ㎕의 50 mM 소듐 아세테이트 완충제(pH 5.0)(0.01% 소듐 아자이드 및 5 mM MnCl2를 포함함), 165 mg의 묽은 암모니아로 전처리된 옥수수 속대(67.3% 건조 고체, 111 mg의 건조 고체가 첨가됨), 및 16.5 ㎕의 1 N 황산에 3.3 ㎕의 정제 Eg4(15.3 mg/mL)를 첨가하였다. 바이알을 48℃에서 인큐베이션하였으며 180 rpm으로 회전시켰다. 주기적으로 20 ㎕의 분취량을 채취하고, 필터 멸균된 2차 증류수로 10배 희석하고, 나일론 필터를 통해 여과한 후, 다이오넥스(Dionex) 이온 크로마토그래피 시스템 상에서 글루코스 방출에 대해 분석하였다. 기준(authentic) 글루코스 용액을 외부 표준으로서 사용하였다. 결과를 도 24에 나타내며, 이는 정제 Eg4의 첨가가 다른 셀룰라아제 또는 엔도자일라나아제의 부재 하에 48℃에서 72 h 인큐베이션에 걸쳐 묽은 암모니아로 전처리된 옥수수 속대로부터 글루코스 단량체의 방출을 유발함을 나타낸다.
실시예 8: 다양한 기질에 대한 T. 레세이 통합 균주 H3A 및 H3A/EG4 #27의 당화 성능
본 실험에서는, 글루칸 + 자일란의 g 당 14 mg 단백질로 투여된 T. 레세이 통합 균주 H3A 또는 H3A/EG4#27로부터의 발효 브로스를, 하기의 것들을 포함하는 상이한 기질에 대한 당화 성능에 대해 시험하였다: 묽은 암모니아로 전처리된 옥수수 속대, 세척된 묽은 암모니아로 전처리된 옥수수 속대, 암모니아 섬유 팽창된 옥수수 대(AFEX CS: ammonia fiber expanded corn stover), 증기 팽창된 사탕수수 바가스(SEB: steam expanded sugarcane bagasse), 및 크라프트(kraft)-전처리된 종이 펄프 FPP27(침엽수 산업용 미표백 펄프(softwood industrial unbleached pulp) 탈리그닌화-카파 13.5, 글루칸 81.9%, 자일란 8.0%, 클라손 리그닌(klason Lignin) 1.9%), FPP-31(활엽수 미표백 펄프(hardwood unbleached pulp) 탈리그닌화-카파 10.1, 글루칸 75.1%, 자일란 19.1%, 클라손 리그닌 2.2%), 및 FPP-37(침엽수 미표백 펄프 공기 건조-카파 82, 글루칸 71.4%, 자일란 8.7%, 클라손 리그닌 11.3%).
25 mL 유리 바이알 내에 0.1 M 소듐 시트레이트 완충제(pH 5.0) 중의 10 g의 최종 질량으로 당화 반응을 구성하고 50℃, 200 rpm에서 6 d 동안 인큐베이션하였다. 6 d의 종료시에, 100 ㎕의 분취량을 5 mM 황산 중에 1:10 희석하고 샘플을 HPLC로 분석하여 글루코스 및 자일로스 형성을 결정하였다. 결과는 도 25에 나타낸다.
실시예 9: 산으로 전처리된 옥수수 대의 당화에 대한 T. 레세이 EG4의 효과
산으로 전처리된 옥수수 대의 당화에 대한 Eg4의 효과를 시험하였다. 묽은 황산으로 전처리한 옥수수 대(Schell, DJ, et al., Appl. Biochem. Biotechnol. 2003, 105(1-3):69-85)를 NREL로부터 입수하여, 20% 고체로 조정하고 소다회 용액를 첨가하여 pH 5.0으로 조건화하였다. 마이크로타이터 플레이트 내에서 20% 총 고체를 사용하여 전처리된 기질의 당화를 수행하였다. 뷰렛 어세이에 의해 발효 브로스 중의 총 단백질을 측정하였다(상기 실시예 1 참조). 증가하는 양의 T. 레세이 통합 균주 H3A/EG4 #27 및 H3A로부터의 발효 브로스를 기질에 첨가하고, 50℃, 5 d, 200 RPM 진탕에서의 인큐베이션 후에 당화 성능을 측정하였다. HPLC를 사용하여 글루코스 형성(mg/g)을 측정하였다. 결과는 도 26에 나타낸다.
실시예 10: 묽은 암모니아로 전처리된 옥수수 잎, 줄기, 속대에 대한 T. 레세이 통합 균주 H3A 및 H3A/EG4#27의 당화 성능
묽은 암모니아로 전처리된 옥수수 대 잎, 줄기, 또는 속대에 대해 T. 레세이 통합 균주 H3A 및 H3A/EG4#27의 당화 성능을 비교하였다. 제WO06110901A호에 기재된 바와 같이 전처리를 수행하였다. 20 mL 바이알 내에서 글루칸+자일란의 g 당 14 mg 단백질을 사용하여 pH 5.3에서(6 N H2SO4로 pH를 조정함) 5 g의 총 질량(7% 고체)을 가수분해하였다. 50℃에서 당화 반응을 실행하고 제4일에 방출된 글루코스 및 자일로스에 대해 HPLC로 샘플을 분석하였다. 결과는 도 27에 나타낸다.
실시예 11: T. 레세이로부터 과발현된 EG4에 의한, 묽은 암모니아로 전처리된 옥수수 속대에 대한 당화 성능
묽은 암모니아로 전처리된 옥수수 속대를 사용하여 3 g 규모로 당화 반응을 수행하였다. 충분한 전처리된 속대 제제를 측정하여 20 mL 유리 바이알에 넣어 0.75 g 건조 고체를 제공하였다. 효소 제제, 1 N 황산, 및 50 mM 소듐 아세테이트 완충제(pH 5.0)(0.01% 소듐 아자이드를 가짐)를 첨가하여 3 g 총 반응 혼합물, 25% 건조 고체, pH 5.0의 최종 슬러리를 제공하였다. Eg4를 과발현시키는 T. 레세이 균주(Δcbh1 Δcbh2 Δeg1 Δeg2)( 국제 특허 공개 제WO 05/001036호 참조)로부터의 비정제 배양물 상청액으로서 부가적인 5%의 14 mg 단백질 로딩의 존재 또는 부재 하에, T. 레세이 통합 균주 H3A로부터의 세포외 단백질(발효 브로스)를 14 mg 단백질/ g(글루칸+자일란)으로 첨가하였다. 당화 반응 혼합물을 72 h 동안 50℃에서 인큐베이션하였다. 인큐베이션 후에, 반응 내용물을 3배 희석하고 여과하여 글루코스 및 자일로스 농도에 대해 HPLC로 분석하였다. 결과는 도 28에 나타낸다. Eg4를 과발현시키는 T. 레세이 균주로부터의 세포외 단백질의 형태로 Eg4 단백질을 H3A에 첨가하는 단계는, 단량체 글루코스의 방출을 실질적으로 증가시켰고 단량체 자일로스의 방출을 미약하게 증가시켰다.
실시예 12: 암모니아로 전처리된 스위치그래스에 대한 균주 H3A/EG4#27의 당화 성능
암모니아로 전처리된 스위치그래스(국제 특허 공개 제WO06110901A호)에 대한 균주 H3A/EG4#27의 당화 성능을, 증가하는 단백질 용량에서 균주 H3A(18.5% 고체)의 것과 비교하였다. 전처리된 스위치그래스 제제를 측정하여 20 mL 유리 바이알에 넣어 0.925 g의 건조 고체를 제공하였다. 1 N 황산 및 50 mM 소듐 아세테이트 완충제(pH 5.3)(0.01% 소듐 아자이드를 가짐)를 첨가하여 5 그램 총 반응 혼합물의 최종 슬러리를 제공하였다. 시험한 H3A의 효소 용량은 14, 20, 및 30 mg/g(글루칸 + 자일란)이었고; H3A-EG4 #27의 용량은 5, 8, 11, 14, 20, 및 30 mg/g(글루칸 + 자일란)이었다. 반응 혼합물은 50℃에서 3 d 동안 인큐베이션하였다. 인큐베이션 후에, 반응 내용물을 3배 희석하고 여과하여 글루코스 및 자일로스 농도에 대해 HPLC로 분석하였다. 스위치그래스 기질의 조성을 기준으로 글루칸 및 자일란의 전환을 계산하였다. 결과(도 29)는, 글루칸 전환에 있어서 H3A-EG4 #27의 성능이 동일한 효소 용량에서의 H3A보다 더 효과적임을 나타낸다.
실시예 13: 옥수수 속대 당화, 및 CMC 및 셀로바이오스 가수분해에 대한 T. 레세이 EG4 첨가의 효과
A. 옥수수 속대 당화:
묽은 암모니아로 전처리된 옥수수 속대를 20% 고체, 7% 셀룰로오스로 조정하고 마이크로타이터 플레이트에 웰 당 65 mg을 분주하였다. T. 레세이 CBH1을 5 mg 단백질/g 글루칸(최종)으로 함유하고, 관련 효소(CBH1 또는 Eg4)를 0, 1, 2, 3, 4, 및 5 mg/g 글루칸의 최종 농도로 함유하는 35 ㎕의 50 mM 소듐 아세테이트(pH 5.0) 완충제를 첨가함으로써 당화 반응을 개시하였다. Eg4 대조군은 EG4 만을 동일한 용량으로 수용하였으며, 따라서 이들 웰 내에 첨가된 총 단백질은 더 적었다. 마이크로타이터 플레이트를 알루미늄 플레이트 시일(E&K 사이언티픽)로 실링하고, 2 min 동안 600 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 72 h 동안 이노바 인큐베이터에 넣어 두었다.
72-h 당화의 종료시에, 100 ㎕의 100 mM 글리신(pH 10.0)을 첨가함으로써 플레이트를 켄칭하였다. 이어서, 플레이트를 3000 rpm에서 5 min 동안 원심분리하였다. HPLC 96 웰 마이크로타이터 플레이트(애질런트 5042-1385) 내에서 상청액(20 ㎕)을 100 ㎕의 물에 첨가하였다. 가드 컬럼이 사전-설치된 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098)을 사용하여 HPLC로 글루코스 및 셀로바이오스 농도를 측정하였다. 100 x (mg 셀로바이오스 + mg 글루코스)/기질 내의 총 글루칸에 의해 %글루칸 전환을 계산하였다(도 30).
B. CMC 가수분해:
카르복시메틸셀룰로오스(CMC, 시그마 C4888)를 50 mM 소듐 아세테이트(pH 5.0)로 1%까지 희석하였다. 96-웰 마이크로타이터 플레이트(넌크 #269787) 내에서, 100 ㎕의 1% CMC에 20, 10, 5, 2.5, 1.25, 및 0 mg/g의 최종 농도로 3개 T. 레세이 정제 효소(EG4, EG1, 및 CBH1) 각각을 별도로 첨가함으로써 가수분해 반응을 개시하였다. 50 mM 소듐 아세테이트(pH 5.0)를 각각의 웰에 첨가하여 150 ㎕의 최종 부피가 되게 하였다. CMC 가수분해 반응 혼합물을 알루미늄 플레이트 시일(E&K 사이언티픽)로 실링하고 2 min 동안 600 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 30 min 동안 이노바 인큐베이터에 넣어 두었다.
30 min 인큐베이션의 종료시에, 플레이트를 10 min 동안 얼음 물에 넣어 반응을 중지시키고, 샘플을 에펜도르프 튜브에 이전하였다. 각각의 튜브에 375 ㎕의 다이니트로살리실산(DNS) 용액을 첨가하였다(하기 참조). 이어서, 샘플을 10 min 동안 끓이고 스펙트라맥스 250(몰리큘라 디바이시즈)으로 540 nm에서 O.D를 측정하였다. 결과는 도 31에 나타낸다.
DNS 용액:
40 g 3.5-다이니트로살리실산(시그마, D0550)
8 g 페놀
2 g 소듐 설파이트(Na2SO3)
800 g Na-K 타르타레이트(로셀 염)
상기의 것들 전부를 2 L의 2% NaOH에 첨가한다
알루미늄 포일로 덮어서 밤새 교반한다
증류 탈이온수를 첨가하여 4 L의 최종 부피가 되게 한다
잘 혼합한다
암색병에 냉장 보관한다
C. 셀로바이오스 가수분해
셀로바이오스를 50 mM 소듐 아세테이트(pH 5.0)로 5 g/L까지 희석하였다. 100 ㎕의 셀로바이오스 용액(5 g/L)에 20, 10, 5, 2.5, 및 0 mg/g의 최종 농도로 2개 효소(EG4 및 BGL1) 각각을 별도로 첨가함으로써 가수분해 반응을 개시하였다. 소듐 아세테이트(pH 5.0)를 각각의 웰에 첨가하여 120 ㎕의 최종 부피가 되게 하였다. 반응 플레이트를 알루미늄 플레이트 시일(E&K 사이언티픽)로 실링하고 2 min 동안 600 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 2 h 동안 이노바 인큐베이터에 넣어 두었다.
2 h 가수분해 단계의 종료시에, 100 ㎕의 100 mM 글리신(pH 10.0)을 첨가함으로써 플레이트를 켄칭하였다. 이어서, 플레이트를 3000 rpm에서 5 min 동안 원심분리하였다. ABTS(2,2'-아지노-비스 3-에틸벤조티아졸린-6-설폰산) 어세이(실시예 1)에 의해 글루코스 농도를 측정하였다. 96-웰 마이크로타이터 플레이트(코닝 코스타(Corning costar) 9017 EIA/RIA 플레이트, 96 웰 평저, 중등도 결합) 내에서 10 ㎕의 상청액을 90 ㎕의 ABTS 용액에 첨가하였다. 스펙트라맥스 250(몰리큘라 디바이시즈)로 OD 420 nm를 측정하였다. 결과는 도 32에 나타낸다.
실시예 14: 다양한 셀룰라아제 혼합물과 혼합될 경우, 정제 EG4는 묽은 암모니아로 전처리된 옥수수 속대로부터의 글루코스 생성을 개선한다
글루칸 + 자일란의 g 당 0.53 mg T. 레세이 Xyn3의 존재 하에 1.05 g의 묽은 암모니아로 전처리된 옥수수 속대를 사용하여, 방출된 당의 농도에 대한 정제 셀룰라아제(T. 레세이 EG1, EG2, CBH1, CBH2, 및 Bgl1)와 조합된 정제 Eg4의 효과를 시험하였다. 0.111 g의 건조 속대 고체(10.5% 고체)를 함유하는 5 mL 바이알 내에 1.06-g 반응을 구성하였다. 효소 제제(도 33), 1 N 황산, 및 50 mM 소듐 아세테이트 완충제(pH 5.0)(0.01% 소듐 아자이드 및 5 mM MnCl2를 가짐)를 첨가하여 최종 반응 중량을 제공하였다. 반응 바이알을 180 rpm 회전을 동반하여 48℃에서 인큐베이션하였다. 72 h 후에, 여과된 밀리Q 물을 첨가하여 각각의 당화 반응 혼합물을 5배 희석하였다. 샘플을 14,000 x g에서 5 min 동안 원심분리한 후, 0.22 ㎛ 나일론 필터(스핀-X 원심분리관 필터, 뉴욕주 코닝 소재의 코닝 인코포레이티드)를 통해 여과하고, 여과된 밀리-Q 물로 4배 추가 희석하여 최종 20X 희석액을 생성시켰다. 20 ㎕ 주입량을 HPLC로 분석하여 방출된 당(글루코스, 셀로바이오스, 및 자일로스)을 측정하였다.
도 34는 각각의 조합으로 생성시킨 글루코스(a), 글루코스 + 셀로바이오스(b), 또는 자일로스(c)를 나타낸다. 정제 Eg4는 개별적인 셀룰라아제 및 혼합물의 성능을 개선하였다. 모든 정제 셀룰라아제가 존재한 경우, 글루칸 + 자일란 g 당 0.53 mg Eg4의 첨가는 거의 40% 만큼 전환을 개선하였다. CBH1, Egl1, 및 Bgl1의 조합에 Eg4를 첨가한 경우에도 또한 개선이 나타났다. 개별적인 셀룰라아제가 속대와 함께 존재한 경우, 총 글루코스 방출의 절대량은 셀룰라아제의 조합이 속대와 함께 존재한 실험으로부터 유발된 것보다 실질적으로 더 낮았으나, 각각의 경우에 Eg4의 존재 하의 퍼센트 개선은 유의적이었다. 정제 셀룰라아제에 T. 레세이 Eg4를 첨가하는 단계는 총 글루코스 방출에 하기의 퍼센트 개선을 유발하였다: Bgl1(121%), Egl2(112%), CBH2(239%), 및 CBH1(71%). 이는 Eg4가 바이오매스에 대한 셀룰라아제 성능을 개선하는 유의적이고 광범위한 효과를 가졌다는 것을 나타낸다.
실시예 15: EG4를 CBH1, CBH2, 및 EG2와 혼합한 경우에 관찰된 효과(기질: 묽은 암모니아로 전처리된 옥수수 속대)
96-웰 MTP(VWR) 내에서 옥수수 속대(웰 당 65 mg의 20% 고체, 7% 셀룰로오스)에 하기와 같이 효소 혼합물을 첨가함으로써, 묽은 암모니아로 전처리된 옥수수 속대 당화 반응 혼합물을 제조하였다. 80 ㎕의 50 mM 소듐 아세테이트(pH 5.0), 1 mg Bgl1/g 글루칸, 및 0.5 mg Xyn3/g 글루칸 백그라운드(background) 또한 모든 웰에 첨가하였다.
Eg4를 CBH1, CBH2, 및 EG2와 개별적으로 혼합하는 단계의 효과를 시험하기 위하여, CBH1, CBH2, 및 EG2 각각을 0, 1.25, 2.5, 5, 10, 및 20 mg/g 글루칸으로 첨가하고, 각각의 웰에 EG4를 20, 18.75, 17.5, 15, 10, 및 0 mg/g 글루칸의 농도로 첨가하여, 개별적인 웰 내의 총 단백질이 20 mg/g 글루칸이 되게 하였다. 대조군 웰은 CBH1 또는 CBH2 또는 EG2 또는 EG4 만을 동일한 용량으로 수용하였으며, 따라서 이들 웰에 첨가된 총 단백질은 20 mg/g 미만이었다.
셀룰라아제의 조합에 대한 Eg4의 효과를 시험하기 위하여, 상이한 비율(도 35 참조)의 CBH1, CBH2, 및 EG2의 혼합물을 0, 1.25, 2.5, 5, 10, 및 20 mg 단백질/g 글루칸으로 첨가하였고, EG4를 20, 18.75, 17.5, 15, 10, 및 0 mg 단백질/g 글루칸의 농도로 혼합물에 첨가함으로써, 개별적인 웰 내의 총 단백질이 20 mg 단백질/g 글루칸이 되도록 하였다. 상기와 같이, 대조군 웰은 하나의 첨가된 단백질 만을 수용하였으므로 총 단백질 첨가는 20 mg 단백질/g 미만이었다.
옥수수 속대 당화 반응 혼합물을 알루미늄 플레이트 시일(E&K 사이언티픽)로 실링하고 2 min 동안 600 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 72 h 동안 이노바 44 인큐베이터 진탕기(뉴 브런즈윅 사이언티픽(New Brunswick Scientific))에 넣어 두었다. 72-h 당화 단계의 종료시에, 100 ㎕의 100 mM 글리신(pH 10.0)을 첨가함으로써 플레이트를 켄칭하였다. 이어서, 플레이트를 3000 rpm에서 5 min 동안 원심분리하였다(로탄타(Rotanta) 460R 원심분리기, 헤티히 젠트리퓨겐(Hettich Zentrifugen)). HPLC 96-웰 마이크로타이터 플레이트(애질런트, 5042-1385) 내에서 20 ㎕의 상청액을 100 ㎕의 물에 첨가하였다. 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098) 및 가드 컬럼(바이오라드)을 사용하여, HPLC로 글루코스 및 셀로바이오스 농도를 측정하였다.
결과는 도 36의 표에 나타냈으며, 여기서 글루칸 전환(%)은 100 x (글루코스 + 셀룰로바이오스) / 총 글루칸으로서 정의된다.
본 실험은, Eg4가 CBH1, CBH2, 및/또는 EG2에 첨가될 경우에 묽은 암모니아로 전처리된 옥수수 속대의 당화의 개선에 유익했음을 나타낸다. 또한, Eg4 및 다른 효소(CBH1, CBH2, 또는 EG2)를 동일한 양으로 당화 혼합물에 첨가했을 경우에 최고의 개선이 관찰되었다. 또한, Eg4의 효과가 CBH1 및 CBH2 혼합물에 대해 실질적임이 관찰되었다. Eg4 대 CBH1 및 CBH2의 양이 1:1이었을 때 Eg4에 의한 최적의 개선이 관찰되었다.
실시예 16: EG4는 다양한 셀룰라아제 조성물의 당화 성능을 개선한다.
상업적인 셀룰라아제 효소 제제 스페자임(등록상표) CP, 악셀러라아제(등록상표)1500, 및 악셀러라아제(등록상표)듀엣(DUET)(제넨코 디비전, 다니스코 US)의 총 단백질 농도를 개질된 뷰렛 어세이(본 명세서에 기재됨)에 의해 결정하였다.
정제 T. 레세이 EG4를 각각의 효소 제제에 첨가한 후, 암모니아로 전처리된 옥수수 속대의 25% 고체 로딩을 사용하여, 기질 글루칸 및 자일란의 g 당 14 mg의 총 단백질(글루칸 및 자일란의 g 당 5 mg EG4 + 글루칸 및 자일란의 g 당 9 mg 전체 셀룰라아제)의 용량으로, 당화 성능에 대해 샘플을 어세이하였다. 20 mL 바이알 내에서 5 g의 총 반응 혼합물을 사용하여 pH 5에서, 200 rpm으로 설정된 회전식 진탕기 내에서 7 d 동안 50℃로 인큐베이션하여 당화 반응을 실행하였다. 당화 샘플을 5 mM 황산으로 10x 희석하고, 0.2 ㎛ 필터를 통해 여과한 후, HPLC에 주입하였다. 바이오라드 아미넥스 HPX-87H 이온 배제 컬럼(300 mm x 7.8 mm)을 사용하여 HPLC 분석을 수행하였다.
도 40에 예시된 바와 같이, 전체 셀룰라아제 내로의 정제 EG4의 치환은 시험한 모든 셀룰라아제 제품에서 글루칸 전환을 개선하였다. 도 41에 예시된 바와 같이, 자일란 전환은 Eg4 치환에 의해 영향을 받지 않는 것으로 나타났다.
실시예 17: 바이오매스 당화 중의 점도의 감소
본 실험에 사용된 바이오매스는 하기의 조성(표 2)을 가진 인비콘(Inbicon) 산성화 증기-팽창으로 전처리된 밀짚이었다:
전처리된 밀짚을 물에 희석하고, 황산을 이용하여 pH 5.0로 pH-조정하고, 그것의 10.5%의 고체 수준을, 제1 샘플에서 20.5 mg 단백질/바이오매스 기질 내의 g 셀룰로오스의 총 단백질 농도로 50℃에서 T. 레세이 H3A 균주(도 9)의 발효 브로스와 혼합하거나, 제2 샘플에서 18.5 mg 단백질/바이오매스 기질 내의 g 셀룰로오스의 총 단백질 농도로 T. 레세이 H3A(도 9)의 발효 브로스 및 2 mg/g 셀룰로오스의 정제 T. 레세이 Eg4와 혼합하였다. 브룩필드 점도계(브룩필드 엔지니어링 인코포레이티드)를 사용하여 최대 약 6 h 동안 점도 변화를 관찰하면서 점도 감소를 측정하였다. 결과는 도 42에 나타낸다.
실시예 18: 바이오매스 당화 중의 점도의 감소
본 실험에 사용된 바이오매스는 NREL로부터의 묽은 산으로 전처리된 옥수수 대(세척하지 않은 PCS)였다.
세척하지 않은 전처리된 옥수수 대를 50℃의 온도, 5.0의 pH, 및 20% 건조 고체의 고체 수준에서, 제1 샘플에서는 20 mg/바이오매스 기질 내의 g 셀룰로오스의 총 단백질 농도로 T. 레세이 H3A 균주(도 9)의 발효 브로스와 혼합하고, 제2 샘플에서는 또한 20 mg/g 셀룰로오스로 T. 레세이 H3A/Eg4 #27 통합 균주의 발효 브로스와 혼합하였다. 브룩필드 점도계(브룩필드 엔지니어링 인코포레이티드)를 사용하여 최대 160 h에 걸쳐 점도 변화를 관찰하면서 점도 감소를 측정하였다. 결과는 도 43에 나타낸다.
실시예 19: 바이오매스 당화 중의 점도의 감소
본 실험에 사용된 바이오매스는 묽은 암모니아로 전처리된 옥수수 속대였다.
하기 2개의 고체 로딩 조건에서 묽은 암모니아로 전처리된 옥수수 속대를 효소 조성물과 혼합하였다: 25% 건조 고체 및 30% 건조 고체. 구체적으로, 전처리된 바이오매스를 50℃ 및 pH 5.0에서 T. 레세이 H3A(도 9) 또는 H3A/Eg4 #27 균주의 발효 브로스로부터의 14 mg 단백질/g 셀룰로오스와 혼합하였다. 브룩필드 점도계(브룩필드 엔지니어링 인코포레이티드)를 사용하여 점도 감소를 측정하였다. 결과는 도 44에 나타낸다.
실시예 20: 당화 공정 중의 점도 감소 및 글루코스 생성에 대한 다양한 셀룰라아제의 효과 결정
본 연구는 당화 공정에 옵티매쉬(OPTIMASH)(상표) BG, 옵티매쉬(상표) TBG, 옵티매쉬(상표) VR과 같은 다양한 점도 감소 효소; 또는 악셀러라아제(등록상표) BG와 같은 베타-글루코시다아제를 바이오매스 기질 내의 g 셀룰로오스사용하였으며, 글루코스 생성 및 점도 감소에 대한 이들 점도 감소 효소의 효과를 결정하였다. H3A/EG4 통합 균주 #27로부터 생성된 효소 조성물 또한 포함되었다. 악셀러라아제(등록상표) 1500, 악셀러라아제(등록상표) 듀엣, 악셀러라아제(등록상표) BG, 옵티매쉬(상표) BG, 옵티매쉬(상표) TBG, 및 옵티매쉬(상표) VR은 다니스코 US 인코포레이티드, 제넨코로부터 입수가능한 제품이었다.
상기와 같이 전처리된 밀짚을 사용하였다. 조성물 분석을 수행하고 표 2에 열거하였다(실시예 17 참조).
전처리된 밀짚(25% 건조물)을 다양한 효소와 함께 반응 챔버 내에서 인큐베이션함으로써 당화 공정을 수행하였다. 문헌[Larsen et al., The IBUS Process- Lignocellulosic Bioethanol Close to A commercial Reality, (2008) Chem. Eng. Tech. 31(5):765-772]을 참조한다. 실험 조건은 표 3 및 4에 나타낸다. 각각의 챔버에서, 총 질량은 10 kg이었다. 밀짚의 초기 pH는 약 3.50였으며, Na2CO3를 첨가함으로써 pH 5.0으로 조정하였다. 시간에 따라 글루코스 농도를 측정하고 셀룰로오스 전환을 계산하였다.
[표 3]
[표 4]
첫번째 날("제1일")에는 실험 조건 1 내지 6을 수행하였고, 두번째 날("제2일")에는 실험 조건 7 내지 12를 수행하였다.
각각의 실험 조건에 있어서 글루코스 농도는 6 시간 당화 후에 측정하였다. 악셀러라아제(등록상표) 듀엣은 0.25 mL/g 셀룰로오스에서 6-h 당화 후에 40.8 g 글루코스/kg을 유발하였다. 도 45를 참조한다. 악셀러라아제(등록상표) 듀엣 + 옵티매쉬 BG(또는 TBG)(0.15 + 6)(즉, 0.15 mL 악셀러라아제(등록상표) 듀엣/g 셀룰로오스 + 6 g 옵티매쉬 BG(또는 TBG) / kg 건조물)에 대한 글루코스 농도는 0.22 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 1500에 대한 글루코스 농도와 유사하였다. 도 45를 참조한다. 0.15 + 6에서의 악셀러라아제(등록상표) 듀엣 + 악셀러라아제 BG(즉, 0.15 mL 악셀러라아제(등록상표) 듀엣/g 셀룰로오스 + 6 g 악셀러라아제 BG / kg 건조물)에 대한 글루코스 농도는 0.22 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 1500에 대한 글루코스 농도와 유사하였으며 0.15 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 듀엣에 대한 글루코스 농도보다 더 높았다. 도 45를 참조한다. 높은 농도의 악셀러라아제(등록상표) BG는 당화 반응 혼합물의 점도를 감소시킬 수 있었다. H3A/EG4 #27의 발효로부터 생성된 효소 조성물을 0.15 mL/g 셀룰로오스의 양으로 사용하여, 6-h 당화 후에 37.5 g/kg의 글루코스를 생성시켰으며, 이는 0.22 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 1500 및 0.15 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 듀엣에 대한 글루코스 생성보다 실질적으로 더 높았다. 도 45를 참조한다.
제1일의 실험의 다양한 실험 조건에 대한 글루코스 농도를 24-h 당화 후에 다시 측정하였다. 도 46을 참조한다. 제2일의 실험에서 실험 조건 7 내지 12에 대해 글루코스 농도 및 셀룰로오스 전환을 시간에 따라 측정하였으며, 결과는 도 47 및 48에 나타낸다.
제1일의 실험에서 점도는 6-h 당화 후에 육안으로 관찰하였으며, 표 6에 요약되어 있다. 더 많은 "+"는 덜 점성인 당화 반응 혼합물을 나타낸다. 일반적으로, 덜 점성인 당화 반응 혼합물(예를 들어, 더 묽은 슬러리)은 더 많은 글루코스 생성과 관련되었다.
[표 6]
제2일의 실험에서 다양한 챔버 내의 당화 반응 혼합물의 점도를, 각각의 챔버 내의 금속 부분의 가시성을 기준으로 육안으로 관찰하였다. 50℃에서 6-일의 당화 후에, 챔버 3 내의 당화 혼합물(실험 조건 9, 0.15 mL/g 셀룰로오스의 악셀러라아제(등록상표) 듀엣)은 챔버 1(실험 조건 7) 또는 2(실험 조건 8, 0.22 mL/g 셀룰로오스의 악셀러라아제(등록상표) 1500) 내의 당화 혼합물보다 더 점성이었다. 챔버 3 내의 금속 부분은 볼 수 없었다. 챔버 4 내의 당화 혼합물(실험 조건 10, 0.15 mL/g 셀룰로오스의 악셀러라아제 듀엣(등록상표) + 0.1 g/kg 건조물의 악셀러라아제(등록상표) BG)의 점도는 챔버 3 내의 당화 혼합물(0.15 mL/g 셀룰로오스의 악셀러라아제(등록상표) 듀엣)의 점도에 비교하여 감소되었다. 챔버 5 내의 당화 혼합물(실험 조건 11, 0.15 mL/g 셀룰로오스의 악셀러라아제 듀엣(등록상표) + 6 g/kg 건조물의 악셀러라아제 BG)의 점도는 챔버 4 내의 당화 혼합물(0.15 mL/g 셀룰로오스의 악셀러라아제(등록상표) 듀엣 + 0.1 g/kg 건조물의 악셀러라아제 BG)의 점도에 비교하여 더 감소되었다. 악셀러라아제 BG의 많은 양에도 불구하고, 당화 혼합물(챔버 5, 0.15 mL/g 셀룰로오스의 악셀러라아제 듀엣(등록상표) + 6 g/kg 건조물의 악셀러라아제 BG)은 0.22 mL/g 셀룰로오스의 악셀러라아제(등록상표) 1500(챔버 1 및 2)보다 여전히 더 점성이었다. . 그러나, H3A/EG4 #27의 발효로부터 생성된 효소 조성물의 첨가로, 당화 혼합물(챔버 6)의 점도가 챔버 4 또는 5 내의 당화 혼합물의 점도에 비교하여 실질적으로 감소했음이 의외로 밝혀졌다. 챔버 6 내의 금속 부분을 볼 수 있었다.
실시예 21: 당화 공정 중의 점도 감소 및 글루코스 생성에 대한 다양한 셀룰라아제의 효과 결정
인비콘 전처리된 밀짚(25% 건조물)을 다양한 효소와 함께 반응 챔버 내에서 인큐베이션함으로써 당화 공정을 수행하였다. 실험 조건은 표 7에 나타낸다. 각각의 챔버에서, 총 질량은 10 kg이다. 밀짚의 초기 pH는 약 3.50였으며, Na2CO3를 첨가함으로써 pH 5.0으로 조정하였다. 악셀러라아제(등록상표) 1500, 악셀러라아제(등록상표) 듀엣, 악셀러라아제(등록상표) BG, 옵티매쉬(상표) BG, 및 프리마패스트(등록상표) 루나(Luna)는 제넨코로부터 입수가능한 제품이다.
[표 7]
6 h, 24 h, 50 h, 및 6 d의 당화 후에 글루코스 농도를 측정하였다. 6 h, 24 h, 50 h, 및 6 d의 당화 후에 당화 반응 혼합물의 점도를 육안으로 관찰하고 당업자에게 공지된 방법을 사용하여 점도계로 측정하였다.
실험 조건 3 내지 16 각각의 글루코스 생성은 실험 조건 1의 글루코스 생성에 비교하여 증가된 것으로 밝혀졌다. 실험 조건 3 내지 16 각각의 점도는 실험 조건 1의 점도에 비교하여 감소된 것으로 추가로 밝혀졌다.
본 연구는 또한, 상기와 동일한 실험 조건을 이용하지만 장기적인 예비-가수분해 시간(예를 들어, 6 h, 9 h, 12 h, 24 h) 후에 당화 공정 중의 글루코스 생성 및 점도 감소를 시험하였다.
실시예 22: CBH1 및 EG4에 의한 아비셀 가수분해에 대한 아스코르브산 효과
도 39a에 열거하여 기재된 바와 같이, 정제 T. 레세이 CBH1(5 mg/g 최종 농도), 정제 T. 레세이 Eg4(10 mg/g 최종 농도), 아스코르브산(50 mM 스톡, 8.8 g/L 최종 농도), 및 망간 용액(10 mM 최종 농도)의 조합을 함께 혼합함으로써, 결정질 셀룰로오스(50mM 소듐 아세테이트(pH 5.0) 중의 10% 아비셀 50 ㎕) 반응을 개시하였다. 50 mM 소듐 아세테이트 완충제(pH 5.0)를 각각의 샘플에 첨가하여 300 μL의 최종 부피가 되게 하였다.
반응 에펜도르프 튜브를 보텍싱한 후, 50℃, 200 rpm에서 이노바 44 인큐베이터(뉴 브런즈윅 사이언티픽)에 넣어 두었다. 3개의 시점(2.5, 4.5, 24 h)에 각각의 튜브로부터 50 μL 샘플을 취하여 50 ㎕의 100 mM 글리신 완충제(pH 10.0)로 켄칭하였다. 샘플을 3000 rpm에서 5 분 동안 원심분리하고(로탄타 460R 원심분리기, 헤티히 젠트리퓨겐), HPLC 96-웰 마이크로타이터 플레이트(애질런트, 5042-1385) 내에서 상청액(20 μL)을 100 ㎕의 물에 첨가하였다. 가드 컬럼이 사전-설치된 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098)을 사용하여 HPLC로 글루코스 및 셀로바이오스 농도를 측정하였다. 결과는 도 37에 나타낸다.
그 다음에 CBH2 및 EG4에 의한 아비셀 가수분해에 대한 아스코르브산 효과를 측정하였다. 도 39b에 열거된 바와 같이, 정제 T. 레세이 CBH2(5 mg/g 최종 농도), 정제 T. 레세이 Eg4(10 mg/g 최종 농도), 아스코르브산(50 mM 스톡, 8.8 g/l 최종 농도), 및 망간 용액(10 mM 최종 농도)의 조합을 함께 혼합함으로써, 결정질 셀룰로오스(50mM 소듐 아세테이트(pH 5.0) 중의 10% 아비셀 80 ㎕) 반응을 개시하였다. 50 mM 소듐 아세테이트 완충제(pH 5.0)를 각각의 샘플에 첨가하여 500 μL의 최종 부피가 되게 하였다.
반응 에펜도르프 튜브를 보텍싱한 후, 50℃, 200 rpm에서 이노바 44 인큐베이터(뉴 브런즈윅 사이언티픽)에 넣어 두었다. 3개의 시점(5, 24, 48 h)에 각각의 튜브로부터 50 μL 샘플을 취하여 50 ㎕의 100 mM 글리신 완충제(pH 10.0)로 켄칭하였다. 샘플을 3000 rpm에서 5 분 동안 원심분리하고(로탄타 460R 원심분리기, 헤티히 젠트리퓨겐), HPLC 96-웰 마이크로타이터 플레이트(애질런트, 5042-1385) 내에서 상청액(20 μL)을 100 ㎕의 물에 첨가하였다. 가드 컬럼이 사전-설치된 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098)을 사용하여 HPLC로 글루코스 및 셀로바이오스 농도를 측정하였다. 결과는 도 38에 나타낸다.
SEQUENCE LISTING
<110> Danisco US Inc.
Mitchinson, Colin
Li, Mian
Kelemen, Bradley R.
Lantz, Suzanne E.
Wing, Keith D.
Hitz, William D.
<120> Method for Reducing Viscosity in Saccharification Process
<130> 31556-WO
<140> PCT/US12/29445
<141> 2012-03-16
<150> US 61/453,923
<151> 2011-03-17
<160> 162
<170> PatentIn version 3.5
<210> 1
<211> 246
<212> PRT
<213> Neurospora crassa
<400> 1
Met Arg Phe Asp Leu Leu Ala Leu Ser Ala Phe Ala Pro Leu Val Ala
1 5 10 15
Ala His Gly Ala Val Thr Ser Tyr Ile Ile Asp Gly Thr Thr Tyr Pro
20 25 30
Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Lys Thr Ile Gln Phe
35 40 45
Gln Trp Pro Asn Tyr Asp Pro Thr Met Thr Val Ser Asp Ala Lys Met
50 55 60
Arg Cys Asn Gly Gly Thr Ser Ala Gln Leu Ser Ala Thr Val Gln Ala
65 70 75 80
Gly Ser Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Glu Gln Gly
85 90 95
Pro Val Gln Val Trp Leu Phe Lys Cys Pro Gly Ala Phe Gly Ser Ser
100 105 110
Cys Lys Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Glu Met Gly Met
115 120 125
Trp Gly Gly Lys Leu Asn Ser Ala Asn Trp Gly Thr Ala Leu Ile Val
130 135 140
Lys Asn His Gln Trp Ser Ser Glu Ile Pro Lys Asn Met Ala Pro Gly
145 150 155 160
Asn Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr
165 170 175
Pro Gln Phe Tyr Ala Glu Cys Ala Gln Ile Val Val Gln Gly Ser Gly
180 185 190
Asn Ala Val Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Thr Tyr Ala
195 200 205
Pro Gln Asn Asp Pro Gly Val Thr Leu Thr Arg Asp Phe Lys Ile Asp
210 215 220
Ile Tyr Ser Ser Lys Ala Thr Thr Tyr Thr Pro Pro Gly Gly Arg Val
225 230 235 240
Trp Ser Gly Phe Gln Phe
245
<210> 2
<211> 238
<212> PRT
<213> Neurospora crassa
<400> 2
Met Lys Val Leu Ala Pro Leu Val Leu Ala Ser Ala Ala Ser Ala His
1 5 10 15
Thr Ile Phe Ser Ser Leu Glu Val Asn Gly Val Asn Gln Gly Leu Gly
20 25 30
Glu Gly Val Arg Val Pro Thr Tyr Asn Gly Pro Ile Glu Asp Val Thr
35 40 45
Ser Ala Ser Ile Ala Cys Asn Gly Ser Pro Asn Thr Val Ala Ser Thr
50 55 60
Ser Lys Val Ile Thr Val Gln Ala Gly Thr Asn Val Thr Ala Ile Trp
65 70 75 80
Arg Tyr Met Leu Ser Thr Thr Gly Asp Ser Pro Ala Asp Val Met Asp
85 90 95
Ser Ser His Lys Gly Pro Thr Ile Ala Tyr Leu Lys Lys Val Asp Asn
100 105 110
Ala Ala Thr Ala Ser Gly Val Gly Asn Gly Trp Phe Lys Ile Gln Gln
115 120 125
Asp Gly Met Asp Ser Ser Gly Val Trp Gly Thr Glu Arg Val Ile Asn
130 135 140
Gly Lys Gly Arg His Ser Ile Lys Ile Pro Glu Cys Ile Ala Pro Gly
145 150 155 160
Gln Tyr Leu Leu Arg Ala Glu Met Ile Ala Leu His Ala Ala Ser Asn
165 170 175
Tyr Pro Gly Ala Gln Phe Tyr Met Glu Cys Ala Gln Leu Asn Val Val
180 185 190
Gly Gly Thr Gly Ala Lys Thr Pro Ser Thr Val Ser Phe Pro Gly Ala
195 200 205
Tyr Ser Gly Ser Asp Pro Gly Val Lys Ile Ser Ile Tyr Trp Pro Pro
210 215 220
Val Thr Ser Tyr Thr Val Pro Gly Pro Ser Val Phe Thr Cys
225 230 235
<210> 3
<211> 231
<212> PRT
<213> Neurospora crassa
<400> 3
Met Leu Pro Ser Ile Ser Leu Leu Leu Ala Ala Ala Leu Gly Thr Ser
1 5 10 15
Ala His Tyr Thr Phe Pro Lys Val Trp Ala Asn Ser Gly Thr Thr Ala
20 25 30
Asp Trp Gln Tyr Val Arg Arg Ala Asp Asn Trp Gln Asn Asn Gly Phe
35 40 45
Val Asp Asn Val Asn Ser Gln Gln Ile Arg Cys Phe Gln Ser Thr His
50 55 60
Ser Pro Ala Gln Ser Thr Leu Ser Val Ala Ala Gly Thr Thr Ile Thr
65 70 75 80
Tyr Gly Ala Ala Pro Ser Val Tyr His Pro Gly Pro Met Gln Phe Tyr
85 90 95
Leu Ala Arg Val Pro Asp Gly Gln Asp Ile Asn Ser Trp Thr Gly Glu
100 105 110
Gly Ala Val Trp Phe Lys Ile Tyr His Glu Gln Pro Thr Phe Gly Ser
115 120 125
Gln Leu Thr Trp Ser Ser Asn Gly Lys Ser Ser Phe Pro Val Lys Ile
130 135 140
Pro Ser Cys Ile Lys Ser Gly Ser Tyr Leu Leu Arg Ala Glu His Ile
145 150 155 160
Gly Leu His Val Ala Gln Ser Ser Gly Ala Ala Gln Phe Tyr Ile Ser
165 170 175
Cys Ala Gln Leu Ser Ile Thr Gly Gly Gly Ser Thr Glu Pro Gly Ala
180 185 190
Asn Tyr Lys Val Ser Phe Pro Gly Ala Tyr Lys Ala Ser Asp Pro Gly
195 200 205
Ile Leu Ile Asn Ile Asn Tyr Pro Val Pro Thr Ser Tyr Lys Asn Pro
210 215 220
Gly Pro Ser Val Phe Thr Cys
225 230
<210> 4
<211> 344
<212> PRT
<213> Neurospora crassa
<400> 4
Met Lys Ser Ser Leu Leu Val Val Leu Thr Ala Gly Leu Ala Val Arg
1 5 10 15
Asp Ala Ile Ala His Ala Ile Phe Gln Gln Leu Trp Val Asp Gly Val
20 25 30
Asp Tyr Gly Ser Thr Cys Asn Arg Leu Pro Thr Ser Asn Ser Pro Val
35 40 45
Thr Asn Val Gly Ser Arg Asp Val Val Cys Asn Ala Gly Thr Arg Gly
50 55 60
Val Ser Gly Lys Cys Pro Val Lys Ala Gly Gly Thr Val Thr Val Glu
65 70 75 80
Met His Gln Gln Pro Gly Asp Arg Ser Cys Lys Ser Glu Ala Ile Gly
85 90 95
Gly Ala His Trp Gly Pro Val Gln Ile Tyr Leu Ser Lys Val Ser Asp
100 105 110
Ala Ser Thr Ala Asp Gly Ser Ser Gly Gly Trp Phe Lys Ile Phe Ser
115 120 125
Asp Ala Trp Ser Lys Lys Ser Gly Gly Arg Val Gly Asp Asp Asp Asn
130 135 140
Trp Gly Thr Arg Asp Leu Asn Ala Cys Cys Gly Arg Met Asp Val Leu
145 150 155 160
Ile Pro Lys Asp Leu Pro Ser Gly Asp Tyr Leu Leu Arg Ala Glu Ala
165 170 175
Leu Ala Leu His Thr Ala Gly Gln Ser Gly Gly Ala Gln Phe Tyr Ile
180 185 190
Ser Cys Tyr Gln Ile Thr Val Ser Gly Gly Gly Ser Ala Asn Tyr Ala
195 200 205
Thr Val Lys Phe Pro Gly Ala Tyr Arg Ala Ser Asp Pro Gly Ile Gln
210 215 220
Ile Asn Ile His Ala Val Val Ser Asn Tyr Val Ala Pro Gly Pro Ala
225 230 235 240
Val Val Ala Gly Gly Val Thr Lys Gln Ala Gly Ser Gly Cys Ile Gly
245 250 255
Cys Glu Ser Thr Cys Lys Val Gly Ser Ser Pro Ser Ala Val Ala Pro
260 265 270
Gly Gly Lys Pro Ala Ser Gly Gly Ser Asp Gly Asn Ala Pro Glu Val
275 280 285
Ala Glu Pro Ser Gly Gly Glu Gly Ser Pro Ser Ala Pro Gly Ala Cys
290 295 300
Glu Val Ala Ala Tyr Gly Gln Cys Gly Gly Asp Gln Tyr Ser Gly Cys
305 310 315 320
Thr Gln Cys Ala Ser Gly Tyr Thr Cys Lys Ala Val Ser Pro Pro Tyr
325 330 335
Tyr Ser Gln Cys Ala Pro Thr Ser
340
<210> 5
<211> 293
<212> PRT
<213> Neurospora crassa
<400> 5
Met Lys Phe Ser Ser Ala Leu Ala Phe Leu Ala Ala Ala Gly Ala Gln
1 5 10 15
Ala His Tyr Thr Phe Pro Lys Gly Tyr Ser Thr Gly Ala Val Ser Gly
20 25 30
Glu Tyr Glu His Ile Arg Met Thr Glu Asn His Tyr Asn Arg Gly Pro
35 40 45
Val Ala Asp Val Thr Ser Glu Ser Met Thr Cys Tyr Glu Leu Asn Pro
50 55 60
Gly Lys Gly Ala Pro Lys Thr Leu Ser Val Ala Ala Gly Ser Asn Tyr
65 70 75 80
Thr Phe Val Val Gly Asp Asn Ile Gly His Pro Gly Pro Leu His Phe
85 90 95
Tyr Met Ala Lys Val Pro Glu Gly Lys Thr Ala Ala Thr Phe Asp Gly
100 105 110
Lys Gly Ala Val Trp Phe Lys Ile Tyr Gln Asp Gly Pro Met Gly Leu
115 120 125
Gly Thr Gly Gln Leu Thr Trp Pro Ser Ala Gly Ala Thr Glu Val Ser
130 135 140
Val Lys Leu Pro Ser Cys Leu Glu Ser Gly Glu Tyr Leu Leu Arg Val
145 150 155 160
Glu His Ile Gly Leu His Ser Ala Gly Ser Val Gly Gly Ala Gln Leu
165 170 175
Tyr Ile Ala Cys Ala Gln Leu Asn Val Thr Gly Gly Thr Gly Thr Ile
180 185 190
Asn Thr Ser Gly Lys Leu Val Ser Phe Pro Gly Ala Tyr Lys Ala Thr
195 200 205
Asp Pro Gly Leu Leu Phe Asn Leu Tyr Tyr Pro Ala Pro Thr Ser Tyr
210 215 220
Thr Asn Pro Gly Pro Ala Val Ala Thr Cys Asp Gly Ala Ser Ala Pro
225 230 235 240
Ala Ala Pro Ala Pro Ala Pro Ser Ser Ala Ala Pro Ser Ala Pro Ala
245 250 255
Ala Ser Ala Pro Ser Ala Thr Val Pro Ala Val Ser Ala Thr Ser Ala
260 265 270
Ala Ala Val Gly Lys Ala Ser Ser Thr Pro Lys Lys Gly Cys Lys Arg
275 280 285
Ala Ala Arg Lys His
290
<210> 6
<211> 342
<212> PRT
<213> Neurospora crassa
<400> 6
Met Arg Ser Thr Leu Val Thr Gly Leu Ile Ala Gly Leu Leu Ser Gln
1 5 10 15
Gln Ala Ala Ala His Ala Thr Phe Gln Ala Leu Trp Val Asp Gly Ala
20 25 30
Asp Tyr Gly Ser Gln Cys Ala Arg Val Pro Pro Ser Asn Ser Pro Val
35 40 45
Thr Asp Val Thr Ser Asn Ala Met Arg Cys Asn Thr Gly Thr Ser Pro
50 55 60
Val Ala Lys Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Val Glu
65 70 75 80
Met His Gln Ser His Pro Pro Val Pro Thr Leu Thr Tyr Lys Gln Gln
85 90 95
Ala Asn Asp Arg Ser Cys Ser Ser Glu Ala Ile Gly Gly Ala His Tyr
100 105 110
Gly Pro Val Leu Val Tyr Met Ser Lys Val Ser Asp Ala Ala Ser Ala
115 120 125
Asp Gly Ser Ser Gly Trp Phe Lys Ile Phe Glu Asp Thr Trp Ala Lys
130 135 140
Lys Pro Ser Ser Ser Ser Gly Asp Asp Asp Phe Trp Gly Val Lys Asp
145 150 155 160
Leu Asn Ser Cys Cys Gly Lys Met Gln Val Lys Ile Pro Ser Asp Ile
165 170 175
Pro Ala Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala Leu His Thr
180 185 190
Ala Ala Ser Ala Gly Gly Ala Gln Leu Tyr Met Thr Cys Tyr Gln Ile
195 200 205
Ser Val Thr Gly Gly Gly Ser Ala Thr Pro Ala Thr Val Ser Phe Pro
210 215 220
Gly Ala Tyr Lys Ser Ser Asp Pro Gly Ile Leu Val Asp Ile His Ser
225 230 235 240
Ala Met Ser Thr Tyr Val Ala Pro Gly Pro Ala Val Tyr Ser Gly Gly
245 250 255
Ser Ser Lys Lys Ala Gly Ser Gly Cys Val Gly Cys Glu Ser Thr Cys
260 265 270
Lys Val Gly Ser Gly Pro Thr Gly Thr Ala Ser Ala Val Pro Val Ala
275 280 285
Ser Thr Ser Ala Ala Ala Gly Gly Gly Gly Gly Gly Gly Ser Gly Gly
290 295 300
Cys Ser Val Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly
305 310 315 320
Cys Thr Ser Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro
325 330 335
Tyr Tyr Ser Gln Cys Val
340
<210> 7
<211> 308
<212> PRT
<213> Neurospora crassa
<400> 7
Met Val Arg Ala Leu Arg Leu Leu Ala Ser Cys Ala Met Phe Ser Gln
1 5 10 15
Ala Leu Ala His Ser His Ile Leu Tyr Leu Ile Ile Asn Gly Gln Gln
20 25 30
Tyr Arg Gly Phe Asn Pro His Ala Pro Asp Ala Ile Thr Asn Ser Ile
35 40 45
Gly Trp Ser Thr Ser Ala Val Asp Asp Gly Phe Val Thr Pro Ser Asn
50 55 60
Tyr Ser Asn Pro Asp Ile Ile Cys His Arg Asp Gly Lys Pro Ala Lys
65 70 75 80
Ala His Ala Pro Val Lys Ala Gly Asp Lys Ile Gln Ile Gln Trp Asn
85 90 95
Gly Trp Pro Gln Ser His Lys Gly Pro Val Leu Ser Tyr Leu Ala Pro
100 105 110
Cys Ala Asn Thr Thr Asp Gly Cys Ala Ser Val Asp Lys Arg Lys Leu
115 120 125
Ser Trp Thr Lys Ile Asp Asp Ser Ser Pro Val Leu Leu Asp Glu Lys
130 135 140
Gly Gly Pro Pro Gly Arg Trp Ala Thr Asp Val Leu Ile Ala Gln Asn
145 150 155 160
Asn Thr Trp Leu Leu Gly Leu Pro Asn Asp Leu Glu Pro Gly Pro Tyr
165 170 175
Val Leu Arg His Glu Leu Ile Ala Leu His Tyr Ala Asn Leu Lys Asn
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Val Asn Leu Trp Val Glu Gly Pro
195 200 205
Gly Pro Lys Ala Ile Thr Val Gly Lys Glu Glu Val Val Val Ala Gly
210 215 220
Gln Lys Glu Gly Val Pro Ala Thr Ala Leu Tyr Lys Ala Thr Asp Pro
225 230 235 240
Gly Val Ala Ile Asp Ile Tyr Thr Ala Val Leu Ser Thr Tyr Val Ile
245 250 255
Pro Gly Pro Thr Leu Ala Pro Glu Ala Lys Pro Val Pro Val Thr Glu
260 265 270
Gln Gly Leu Lys Ser Thr Ile Thr Ala Val Gly Thr Pro Val Ile Val
275 280 285
Thr Arg Ala Thr Ser Thr Val Pro Met Pro Asn Gly Glu Thr Ala Ala
290 295 300
Ala Phe Lys Gly
305
<210> 8
<211> 322
<212> PRT
<213> Neurospora crassa
<400> 8
Met Lys Val Leu Ser Leu Leu Ala Ala Ala Ser Ala Ala Ser Ala His
1 5 10 15
Thr Ile Phe Val Gln Leu Glu Ala Asp Gly Thr Thr Tyr Pro Val Ser
20 25 30
Tyr Gly Ile Arg Thr Pro Ser Tyr Asp Gly Pro Ile Thr Asp Val Thr
35 40 45
Ser Asn Asp Leu Ala Cys Asn Gly Gly Pro Asn Pro Thr Thr Pro Ser
50 55 60
Asp Lys Ile Ile Thr Val Asn Ala Gly Ser Thr Val Lys Ala Ile Trp
65 70 75 80
Arg His Thr Leu Thr Ser Gly Ala Asp Asp Val Met Asp Ala Ser His
85 90 95
Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Asp Asp Ala Leu Thr
100 105 110
Asp Thr Gly Ile Gly Gly Gly Trp Phe Lys Ile Gln Glu Asp Gly Tyr
115 120 125
Asn Asn Gly Gln Trp Gly Thr Ser Thr Val Ile Thr Asn Gly Gly Phe
130 135 140
Gln Tyr Ile Asp Ile Pro Ala Cys Ile Pro Ser Gly Gln Tyr Leu Leu
145 150 155 160
Arg Ala Glu Met Ile Ala Leu His Ala Ala Ser Ser Thr Ala Gly Ala
165 170 175
Gln Leu Tyr Met Glu Cys Ala Gln Ile Asn Ile Val Gly Gly Thr Gly
180 185 190
Gly Thr Ala Leu Pro Ser Thr Thr Tyr Ser Ile Pro Gly Ile Tyr Lys
195 200 205
Ala Thr Asp Pro Gly Leu Leu Val Asn Ile Tyr Ser Met Ser Pro Ser
210 215 220
Ser Thr Tyr Thr Ile Pro Gly Pro Ala Lys Phe Thr Cys Pro Ala Gly
225 230 235 240
Asn Gly Gly Gly Ala Gly Gly Gly Gly Ser Thr Thr Thr Ala Lys Pro
245 250 255
Ala Ser Ser Thr Thr Ser Lys Ala Ala Ile Thr Ser Ala Val Thr Thr
260 265 270
Leu Lys Thr Ser Val Val Ala Pro Gln Pro Thr Gly Gly Cys Thr Ala
275 280 285
Ala Gln Trp Ala Gln Cys Gly Gly Met Gly Phe Ser Gly Cys Thr Thr
290 295 300
Cys Ala Ser Pro Tyr Thr Cys Lys Lys Met Asn Asp Tyr Tyr Ser Gln
305 310 315 320
Cys Ser
<210> 9
<211> 241
<212> PRT
<213> Neurospora crassa
<400> 9
Met Lys Thr Phe Ala Thr Leu Leu Ala Ser Ile Gly Leu Val Ala Ala
1 5 10 15
His Gly Phe Val Asp Asn Ala Thr Ile Gly Gly Gln Phe Tyr Gln Phe
20 25 30
Tyr Gln Pro Tyr Gln Asp Pro Tyr Met Gly Ser Pro Pro Asp Arg Ile
35 40 45
Ser Arg Lys Ile Pro Gly Asn Gly Pro Val Glu Asp Val Thr Ser Leu
50 55 60
Ala Ile Gln Cys Asn Ala Asp Ser Ala Pro Ala Lys Leu His Ala Ser
65 70 75 80
Ala Ala Ala Gly Ser Thr Val Thr Leu Arg Trp Thr Ile Trp Pro Asp
85 90 95
Ser His Val Gly Pro Val Ile Thr Tyr Met Ala Arg Cys Pro Asp Thr
100 105 110
Gly Cys Gln Asp Trp Thr Pro Ser Ala Ser Asp Lys Val Trp Phe Lys
115 120 125
Ile Lys Glu Gly Gly Arg Glu Gly Thr Ser Asn Val Trp Ala Ala Thr
130 135 140
Pro Leu Met Thr Ala Pro Ala Asn Tyr Glu Tyr Ala Ile Pro Ser Cys
145 150 155 160
Leu Lys Pro Gly Tyr Tyr Leu Val Arg His Glu Ile Ile Ala Leu His
165 170 175
Ser Ala Tyr Ser Tyr Pro Gly Ala Gln Phe Tyr Pro Gly Cys His Gln
180 185 190
Leu Gln Val Thr Gly Ser Gly Thr Lys Thr Pro Ser Ser Gly Leu Val
195 200 205
Ser Phe Pro Gly Ala Tyr Lys Ser Thr Asp Pro Gly Val Thr Tyr Asp
210 215 220
Ala Tyr Gln Ala Ala Thr Tyr Thr Ile Pro Gly Pro Ala Val Phe Thr
225 230 235 240
Cys
<210> 10
<211> 472
<212> PRT
<213> Neurospora crassa
<400> 10
Met Arg Ser Thr Thr Val Leu Ala Gly Leu Ala Thr Val Leu Ala Pro
1 5 10 15
Leu Ala Ser Ala His Thr Val Leu Thr Thr Val Phe Val Asn Asp Lys
20 25 30
Asn Gln Gly Asp Gly Thr Gly Val Arg Met Pro Met Asp Gly Asn Ile
35 40 45
Ala Asn Ala Pro Val Ile Asn Met Asn Ser Asp Asp Met Ile Cys Gly
50 55 60
Arg Asp Gly Leu Lys Lys Val Asn Tyr Ala Ile Pro Ala Thr Ala Gly
65 70 75 80
Ser Lys Met Thr Phe Glu Phe Arg Thr Tyr Val Asp Gly Ser Arg Pro
85 90 95
Gln Phe Ile Asp Lys Ser His Gln Gly Pro Ile Ser Val Tyr Ala Lys
100 105 110
Ala Val Ser Asp Phe Asp Gln Ser Pro Gly Gly Ser Gly Trp Phe Lys
115 120 125
Ile Trp His Asp Gly Tyr Asp Glu Ser Thr Gly Lys Trp Ala Val Gln
130 135 140
Lys Val Ile Asp Thr Asn Gly Leu Leu Ser Ile Ser Leu Pro Thr Gly
145 150 155 160
Met Pro Thr Gly Ala Tyr Leu Leu Arg Thr Glu Val Ile Ala Met Gln
165 170 175
Asn Val Thr Thr Lys Ala Asp Gly Asn Trp Tyr Cys Glu Pro Gln Phe
180 185 190
Tyr Val Asn Cys Ala Gln Val Tyr Val Gln Gly Ser Ser Ser Gly Pro
195 200 205
Leu Ser Ile Pro Lys Asp Lys Glu Thr Ser Ile Pro Gly His Val His
210 215 220
Pro Ser Asp Lys Gly Leu Asn Phe Asn Met Tyr Asp Met Lys Gly Leu
225 230 235 240
Leu Pro Tyr Gln Ile Pro Gly Pro Val Pro Phe Arg Pro Ala Ser Ser
245 250 255
Ser Ser Gly Ser Asn Ala Lys Ala Ala Leu Thr Thr Pro Thr Asn Phe
260 265 270
Pro Gly Ala Val Pro Asp Asn Cys Leu Leu Lys Asn Ala Asn Trp Cys
275 280 285
Gly Phe Glu Val Pro Asp Tyr Thr Asn Glu Asp Gly Cys Trp Ala Ser
290 295 300
Ala Asp Asn Cys Trp Ala Gln Ser Lys Lys Cys Phe Asp Ser Ala Pro
305 310 315 320
Pro Ser Gly Ile Lys Gly Cys Lys Ile Trp Glu Gln Glu Lys Cys Gln
325 330 335
Ala Leu Ala Asn Ser Cys Asp Ala Lys Gln Phe Thr Gly Pro Pro Asn
340 345 350
Lys Gly Lys Arg Trp Gly Asp Val Thr Glu Gln Ser Ser Val Gln Val
355 360 365
Pro Gly Val Met Lys Gly Ala Asp Leu Val Asp Thr Pro Val Val Asp
370 375 380
Thr Thr Ser Asn Gln Lys Ala Ala Ala Asn Asn Asn Val Val Ser Ile
385 390 395 400
Pro Ala Ala Thr Ala Thr Thr Phe Ile Thr Thr Ser Ser Ala Ala Pro
405 410 415
Ser Lys Pro Val Thr Thr Val Pro Ser Val Ala Ile Thr Thr Thr Thr
420 425 430
Ser Ala Ala Val Ala Ile Pro Thr Glu Thr Ala Ala Gln Asn Thr Leu
435 440 445
Ile Arg Cys Gly Arg Gly Asp Lys Asn Gln Arg Arg Ala Met His Ile
450 455 460
Asn Arg His Lys Arg Ala Asp Phe
465 470
<210> 11
<211> 326
<212> PRT
<213> Neurospora crassa
<400> 11
Met Lys Leu Ser Val Ala Ala Ala Leu Ser Leu Ala Ala Ser Glu Ala
1 5 10 15
Ser Ala His Tyr Ile Phe Gln Gln Val Gly Ala Gly Thr Ser Val Asn
20 25 30
Pro Val Trp Lys Tyr Ile Arg Lys His Thr Asn Tyr Asn Ser Pro Val
35 40 45
Thr Asp Leu Thr Ser Lys Asp Leu Val Cys Asn Val Gly Ala Ser Ala
50 55 60
Glu Gly Val Glu Thr Leu Ser Val Ala Ala Gly Ser Gln Val Thr Phe
65 70 75 80
Lys Thr Asp Thr Ala Val Tyr His Gln Gly Pro Thr Ser Val Tyr Leu
85 90 95
Ser Lys Ala Asp Gly Ser Leu Ser Asp Tyr Asp Gly Ser Gly Gly Trp
100 105 110
Phe Lys Ile Lys Asp Trp Gly Ala Thr Phe Pro Gly Gly Glu Trp Thr
115 120 125
Leu Ser Asp Thr Tyr Thr Phe Thr Ile Pro Ser Cys Ile Pro Ser Gly
130 135 140
Asp Tyr Leu Leu Arg Ile Gln Gln Ile Gly Ile His Asn Pro Trp Pro
145 150 155 160
Ala Gly Val Pro Gln Phe Tyr Leu Ser Cys Ala His Ile Ser Val Thr
165 170 175
Gly Gly Gly Ser Ala Ser Pro Ala Thr Val Ser Ile Pro Gly Ala Phe
180 185 190
Lys Glu Thr Asp Pro Gly Tyr Thr Val Asn Ile Tyr Ser Asn Phe Asn
195 200 205
Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Thr Cys Ser Gly Ser Gly
210 215 220
Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Thr Pro Pro Ser Gln
225 230 235 240
Pro Thr Thr Ser Thr Thr Leu Pro Thr Ser Ser Thr Val Val Ala Thr
245 250 255
Thr Leu Lys Thr Ser Thr Val Val Ala Thr Thr Lys Ser Ser Ser Ser
260 265 270
Thr Thr Ser Ser Ala Ser Ser Ser Gly Ser Gln Pro Thr Ser Pro Ser
275 280 285
Gly Cys Thr Val Ala Lys Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser
290 295 300
Gly Cys Thr Ser Cys Ala Ser Gly Ser Thr Cys Lys Val Gly Asn Asp
305 310 315 320
Tyr Tyr Ser Gln Cys Leu
325
<210> 12
<211> 359
<212> PRT
<213> Neurospora crassa
<400> 12
Met Lys Thr Gly Ser Ile Leu Ala Ala Leu Val Ala Ser Ala Ser Ala
1 5 10 15
His Thr Ile Phe Gln Lys Val Ser Val Asn Gly Ala Asp Gln Gly Gln
20 25 30
Leu Lys Gly Ile Arg Ala Pro Ala Asn Asn Asn Pro Val Thr Asp Val
35 40 45
Met Ser Ser Asp Ile Ile Cys Asn Ala Val Thr Met Lys Asp Ser Asn
50 55 60
Val Leu Thr Val Pro Ala Gly Ala Lys Val Gly His Phe Trp Gly His
65 70 75 80
Glu Ile Gly Gly Ala Ala Gly Pro Asn Asp Ala Asp Asn Pro Ile Ala
85 90 95
Ala Ser His Lys Gly Pro Ile Met Val Tyr Leu Ala Lys Val Asp Asn
100 105 110
Ala Ala Thr Thr Gly Thr Ser Gly Leu Lys Trp Phe Lys Val Ala Glu
115 120 125
Ala Gly Leu Ser Asn Gly Lys Trp Ala Val Asp Asp Leu Ile Ala Asn
130 135 140
Asn Gly Trp Ser Tyr Phe Asp Met Pro Thr Cys Ile Ala Pro Gly Gln
145 150 155 160
Tyr Leu Met Arg Ala Glu Leu Ile Ala Leu His Asn Ala Gly Ser Gln
165 170 175
Ala Gly Ala Gln Phe Tyr Ile Gly Cys Ala Gln Ile Asn Val Thr Gly
180 185 190
Gly Gly Ser Ala Ser Pro Ser Asn Thr Val Ser Phe Pro Gly Ala Tyr
195 200 205
Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gly Gly Ser Gly
210 215 220
Lys Thr Asp Asn Gly Gly Lys Pro Tyr Gln Ile Pro Gly Pro Ala Leu
225 230 235 240
Phe Thr Cys Pro Ala Gly Gly Ser Gly Gly Ser Ser Pro Ala Pro Ala
245 250 255
Thr Thr Ala Ser Thr Pro Lys Pro Thr Ser Ala Ser Ala Pro Lys Pro
260 265 270
Val Ser Thr Thr Ala Ser Thr Pro Lys Pro Thr Asn Gly Ser Gly Ser
275 280 285
Gly Thr Gly Ala Ala His Ser Thr Lys Cys Gly Gly Ser Lys Pro Ala
290 295 300
Ala Thr Thr Lys Ala Ser Asn Pro Gln Pro Thr Asn Gly Gly Asn Ser
305 310 315 320
Ala Val Arg Ala Ala Ala Leu Tyr Gly Gln Cys Gly Gly Lys Gly Trp
325 330 335
Thr Gly Pro Thr Ser Cys Ala Ser Gly Thr Cys Lys Phe Ser Asn Asp
340 345 350
Trp Tyr Ser Gln Cys Leu Pro
355
<210> 13
<211> 369
<212> PRT
<213> Neurospora crassa
<400> 13
Met Ala Arg Met Ser Ile Leu Thr Ala Leu Ala Gly Ala Ser Leu Val
1 5 10 15
Ala Ala His Gly His Val Ser Lys Val Ile Val Asn Gly Val Glu Tyr
20 25 30
Gln Asn Tyr Asp Pro Thr Ser Phe Pro Tyr Asn Ser Asn Pro Pro Thr
35 40 45
Val Ile Gly Trp Thr Ile Asp Gln Lys Asp Asn Gly Phe Val Ser Pro
50 55 60
Asp Ala Phe Asp Ser Gly Asp Ile Ile Cys His Lys Ser Ala Lys Pro
65 70 75 80
Ala Gly Gly His Ala Thr Val Lys Ala Gly Asp Lys Ile Ser Leu Gln
85 90 95
Trp Asp Gln Trp Pro Glu Ser His Lys Gly Pro Val Ile Asp Tyr Leu
100 105 110
Ala Ala Cys Asp Gly Asp Cys Glu Ser Val Asp Lys Thr Ala Leu Lys
115 120 125
Phe Phe Lys Ile Asp Gly Ala Gly Tyr Asp Ala Thr Asn Gly Trp Ala
130 135 140
Ser Asp Thr Leu Ile Lys Asp Gly Asn Ser Trp Val Val Glu Ile Pro
145 150 155 160
Glu Ser Ile Lys Pro Gly Asn Tyr Val Leu Arg His Glu Ile Ile Ala
165 170 175
Leu His Ser Ala Gly Gln Ala Asn Gly Ala Gln Asn Tyr Pro Gln Cys
180 185 190
Phe Asn Leu Lys Val Glu Gly Ser Gly Ser Thr Val Pro Ala Gly Val
195 200 205
Ala Gly Thr Glu Leu Tyr Lys Ala Thr Asp Ala Gly Ile Leu Phe Asp
210 215 220
Ile Tyr Lys Asn Asp Ile Ser Tyr Pro Val Pro Gly Pro Ser Leu Ile
225 230 235 240
Ala Gly Ala Ser Ser Ser Ile Ala Gln Ser Lys Met Ala Ala Thr Ala
245 250 255
Thr Ala Ser Ala Thr Leu Pro Gly Ala Thr Gly Gly Ser Asn Ser Pro
260 265 270
Ala Thr Ser Ala Ala Ala Ala Ala Pro Ala Thr Ser Ala Ala Ala Ala
275 280 285
Thr Ser Gln Val Gln Ala Ala Pro Ala Thr Thr Leu Val Thr Ser Thr
290 295 300
Lys Ala Ala Ala Pro Ala Thr Ser Ala Ala Ala Pro Ala Ala Pro Ala
305 310 315 320
Thr Ser Ala Ala Ala Gly Gly Ala Gly Gln Val Gln Ala Lys Gln Thr
325 330 335
Lys Trp Gly Gln Cys Gly Gly Asn Gly Phe Thr Gly Pro Thr Glu Cys
340 345 350
Glu Ser Gly Ser Thr Cys Thr Lys Tyr Asn Asp Trp Tyr Ser Gln Cys
355 360 365
Val
<210> 14
<211> 271
<212> PRT
<213> Sporotrichum thermophilum
<400> 14
Ala Leu Gly His Ser His Leu Gly Tyr Ile Ile Ile Asn Gly Glu Val
1 5 10 15
Tyr Gln Gly Phe Asp Pro Arg Pro Glu Gln Ala Asn Ser Pro Leu Arg
20 25 30
Val Gly Trp Ser Thr Gly Ala Ile Asp Asp Gly Phe Val Ala Pro Ala
35 40 45
Asn Tyr Ser Ser Pro Asp Ile Ile Cys His Ile Glu Gly Ala Ser Pro
50 55 60
Pro Ala His Ala Pro Val Arg Ala Gly Asp Arg Val His Val Gln Trp
65 70 75 80
Asn Gly Trp Pro Leu Gly His Val Gly Pro Val Leu Ser Tyr Leu Ala
85 90 95
Pro Cys Gly Gly Leu Glu Gly Ser Glu Ser Gly Cys Ala Gly Val Asp
100 105 110
Lys Arg Gln Leu Arg Trp Thr Lys Val Asp Asp Ser Leu Pro Ala Met
115 120 125
Glu Leu Arg Trp Ala Thr Asp Val Leu Ile Ala Ala Asn Asn Ser Trp
130 135 140
Gln Val Glu Ile Pro Arg Gly Leu Arg Asp Gly Pro Tyr Val Leu Arg
145 150 155 160
His Glu Ile Val Ala Leu His Tyr Ala Ala Glu Pro Gly Gly Ala Gln
165 170 175
Asn Tyr Pro Leu Cys Val Asn Leu Trp Val Glu Gly Gly Asp Gly Ser
180 185 190
Met Glu Leu Asp His Phe Asp Ala Thr Gln Phe Tyr Arg Pro Asp Asp
195 200 205
Pro Gly Ile Leu Leu Asn Val Thr Ala Gly Leu Arg Ser Tyr Ala Val
210 215 220
Pro Gly Pro Thr Leu Ala Ala Gly Ala Thr Pro Val Pro Tyr Ala Gln
225 230 235 240
Gln Asn Ile Ser Ser Ala Arg Ala Asp Gly Thr Pro Val Ile Val Thr
245 250 255
Arg Ser Thr Glu Thr Val Pro Phe Thr Ala Ala Pro Thr Pro Ala
260 265 270
<210> 15
<211> 330
<212> PRT
<213> Sporotrichum thermophilum
<400> 15
Met Ser Ser Phe Thr Ser Lys Gly Leu Leu Ser Ala Leu Met Gly Ala
1 5 10 15
Ala Thr Val Ala Ala His Gly His Val Thr Asn Ile Val Ile Asn Gly
20 25 30
Val Ser Tyr Gln Asn Phe Asp Pro Phe Thr His Pro Tyr Met Gln Asn
35 40 45
Pro Pro Thr Val Val Gly Trp Thr Ala Ser Asn Thr Asp Asn Gly Phe
50 55 60
Val Gly Pro Glu Ser Phe Ser Ser Pro Asp Ile Ile Cys His Lys Ser
65 70 75 80
Ala Thr Asn Ala Gly Gly His Ala Val Val Ala Ala Gly Asp Lys Val
85 90 95
Phe Ile Gln Trp Asp Thr Trp Pro Glu Ser His His Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Asp Cys Gly Asp Ala Gly Cys Glu Lys Val Asp Lys
115 120 125
Thr Thr Leu Lys Phe Phe Lys Ile Ser Glu Ser Gly Leu Leu Asp Gly
130 135 140
Thr Asn Ala Pro Gly Lys Trp Ala Ser Asp Thr Leu Ile Ala Asn Asn
145 150 155 160
Asn Ser Trp Leu Val Gln Ile Pro Pro Asn Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Gln Gln Asn
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Val Thr Gly Ser
195 200 205
Gly Thr Gln Lys Pro Ser Gly Val Leu Gly Thr Glu Leu Tyr Lys Ala
210 215 220
Thr Asp Ala Gly Ile Leu Ala Asn Ile Tyr Thr Ser Pro Val Thr Tyr
225 230 235 240
Gln Ile Pro Gly Pro Ala Ile Ile Ser Gly Ala Ser Ala Val Gln Gln
245 250 255
Thr Thr Ser Ala Ile Thr Ala Ser Ala Ser Ala Ile Thr Gly Ser Ala
260 265 270
Thr Ala Ala Pro Thr Ala Ala Thr Thr Thr Ala Ala Ala Ala Ala Thr
275 280 285
Thr Thr Thr Thr Ala Gly Ser Gly Ala Thr Ala Thr Pro Ser Thr Gly
290 295 300
Gly Ser Pro Ser Ser Ala Gln Pro Ala Pro Thr Thr Ala Ala Ala Thr
305 310 315 320
Ser Ser Pro Ala Arg Pro Thr Arg Cys Ala
325 330
<210> 16
<211> 342
<212> PRT
<213> Sporotrichum thermophilum
<400> 16
Met Ser Lys Ala Ser Ala Leu Leu Ala Gly Leu Thr Gly Ala Ala Leu
1 5 10 15
Val Ala Ala His Gly His Val Ser His Ile Val Val Asn Gly Val Tyr
20 25 30
Tyr Arg Asn Tyr Asp Pro Thr Thr Asp Trp Tyr Gln Pro Asn Pro Pro
35 40 45
Thr Val Ile Gly Trp Thr Ala Ala Asp Gln Asp Asn Gly Phe Val Glu
50 55 60
Pro Asn Ser Phe Gly Thr Pro Asp Ile Ile Cys His Lys Ser Ala Thr
65 70 75 80
Pro Gly Gly Gly His Ala Thr Val Ala Ala Gly Asp Lys Ile Asn Ile
85 90 95
Val Trp Thr Pro Glu Trp Pro Glu Ser His Ile Gly Pro Val Ile Asp
100 105 110
Tyr Leu Ala Ala Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Ser Ser
115 120 125
Leu Arg Trp Phe Lys Ile Asp Gly Ala Gly Tyr Asp Lys Ala Ala Gly
130 135 140
Arg Trp Ala Ala Asp Ala Leu Arg Ala Asn Gly Asn Ser Trp Leu Val
145 150 155 160
Gln Ile Pro Ser Asp Leu Lys Ala Gly Asn Tyr Val Leu Arg His Glu
165 170 175
Ile Ile Ala Leu His Gly Ala Gln Ser Pro Asn Gly Ala Gln Ala Tyr
180 185 190
Pro Gln Cys Ile Asn Leu Arg Val Thr Gly Gly Gly Ser Asn Leu Pro
195 200 205
Ser Gly Val Ala Gly Thr Ser Leu Tyr Lys Ala Thr Asp Pro Gly Ile
210 215 220
Leu Phe Asn Pro Tyr Val Ser Ser Pro Asp Tyr Thr Val Pro Gly Pro
225 230 235 240
Ala Leu Ile Ala Gly Ala Ala Ser Ser Ile Ala Gln Ser Thr Ser Val
245 250 255
Ala Thr Ala Thr Gly Thr Ala Thr Val Pro Gly Gly Gly Gly Ala Asn
260 265 270
Pro Thr Ala Thr Thr Thr Ala Ala Thr Ser Ala Ala Pro Ser Thr Thr
275 280 285
Leu Arg Thr Thr Thr Thr Ser Ala Ala Gln Thr Thr Ala Pro Pro Ser
290 295 300
Gly Asp Val Gln Thr Lys Tyr Gly Gln Cys Gly Gly Asn Gly Trp Thr
305 310 315 320
Gly Pro Thr Val Cys Ala Pro Gly Ser Ser Cys Ser Val Leu Asn Glu
325 330 335
Trp Tyr Ser Gln Cys Leu
340
<210> 17
<211> 323
<212> PRT
<213> Sporotrichum thermophilum
<400> 17
Met Lys Ser Phe Thr Leu Thr Thr Leu Ala Ala Leu Ala Gly Asn Ala
1 5 10 15
Ala Ala His Ala Thr Phe Gln Ala Leu Trp Val Asp Gly Val Asp Tyr
20 25 30
Gly Ala Gln Cys Ala Arg Leu Pro Ala Ser Asn Ser Pro Val Thr Asp
35 40 45
Val Thr Ser Asn Ala Ile Arg Cys Asn Ala Asn Pro Ser Pro Ala Arg
50 55 60
Gly Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Val Glu Met His
65 70 75 80
Gln Gln Pro Gly Asp Arg Ser Cys Ser Ser Glu Ala Ile Gly Gly Ala
85 90 95
His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Ser Asp Ala Ala
100 105 110
Ser Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Glu Asp Gly Trp
115 120 125
Ala Lys Asn Pro Ser Gly Gly Ser Gly Asp Asp Asp Tyr Trp Gly Thr
130 135 140
Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro Ala
145 150 155 160
Asp Leu Pro Ser Gly Asp Tyr Leu Leu Arg Ala Glu Ala Leu Ala Leu
165 170 175
His Thr Ala Gly Ser Ala Gly Gly Ala Gln Phe Tyr Met Thr Cys Tyr
180 185 190
Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Ser Pro Pro Thr Val Ser
195 200 205
Phe Pro Gly Ala Tyr Lys Ala Thr Asp Pro Gly Ile Leu Val Asn Ile
210 215 220
His Ala Pro Leu Ser Gly Tyr Thr Val Pro Gly Pro Ala Val Tyr Ser
225 230 235 240
Gly Gly Ser Thr Lys Lys Ala Gly Ser Ala Cys Thr Gly Cys Glu Ser
245 250 255
Thr Cys Ala Val Gly Ser Gly Pro Thr Ala Thr Val Ser Gln Ser Pro
260 265 270
Gly Ser Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Gly Cys Thr Val
275 280 285
Gln Lys Tyr Gln Gln Cys Gly Gly Gln Gly Tyr Thr Gly Cys Thr Asn
290 295 300
Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro Tyr Tyr Ser
305 310 315 320
Gln Cys Val
<210> 18
<211> 341
<212> PRT
<213> Neurospora crassa
<400> 18
Met Pro Ser Phe Thr Ser Lys Ser Leu Leu Ala Val Leu Ala Gly Ala
1 5 10 15
Ala Ser Val Ala Ala His Gly His Val Ser Asn Ile Val Ile Asn Gly
20 25 30
Glu Tyr Tyr Arg Gly Phe Asp Ser Ser Leu Asn Tyr Met Ala Asn Pro
35 40 45
Pro Ala Val Val Gly Trp Lys Ala Asn Asn Gln Asp Asn Gly Phe Val
50 55 60
Gly Pro Asp Ala Phe Ser Ser Pro Asp Ile Ile Cys His Lys Asp Ala
65 70 75 80
Thr Asn Ala Lys Gly His Ala Val Val Lys Ala Gly Asp Lys Ile Ser
85 90 95
Ile Gln Trp Glu Thr Trp Pro Glu Ser His Lys Gly Pro Val Ile Asp
100 105 110
Tyr Leu Ala Asn Cys Gly Ala Ser Gly Cys Glu Thr Val Asp Lys Thr
115 120 125
Ser Leu Glu Phe Phe Lys Ile Asp Glu Val Gly Leu Val Asp Gly Gln
130 135 140
Lys Trp Gly Ser Asp Gln Leu Ile Ala Asn Asn Asn Ser Trp Leu Val
145 150 155 160
Glu Ile Pro Pro Thr Ile Ala Pro Gly Phe Tyr Val Leu Arg His Glu
165 170 175
Ile Ile Ala Leu His Ser Ala Gly Gln Pro Asn Gly Ala Gln Asn Tyr
180 185 190
Pro Gln Cys Phe Asn Ile Gln Val Thr Gly Ser Gly Thr Glu Lys Pro
195 200 205
Ala Gly Val Lys Gly Thr Ala Leu Tyr Lys Pro Asp Asp Ala Gly Ile
210 215 220
Ser Val Asn Ile Tyr Gln Ser Leu Ser Ser Tyr Ser Ile Pro Gly Pro
225 230 235 240
Ala Leu Ile Lys Gly Ala Val Ser Val Ala Gln Ser His Ser Ala Val
245 250 255
Thr Ala Thr Ala Thr Ala Ile Thr Gly Leu Gly Asp Ala Pro Ala Ala
260 265 270
Thr Ala Ala Pro Ala Ala Thr Thr Ala Pro Ala Ala Ala Pro Ala Val
275 280 285
Thr Thr Ala Pro Ala Ala Ala Ala Pro Thr Lys Pro Ala Thr Thr Ala
290 295 300
Ala Ala Pro Gln Pro Thr Lys Pro Ala Lys Ser Gly Cys Gln Lys Arg
305 310 315 320
Arg Ala Ala Arg Arg Ala Ala Ala Leu Ala Arg Arg His Ala Arg Asp
325 330 335
Val Ala Phe Leu Asp
340
<210> 19
<211> 342
<212> PRT
<213> Aspergillus fumigatus
<400> 19
Met Arg His Val Gln Ser Thr Gln Leu Leu Ala Ala Leu Leu Leu Thr
1 5 10 15
Thr Arg Val Thr Ala His Gly His Val Thr Asn Ile Val Ile Asn Gly
20 25 30
Val Ser Tyr Arg Gly Trp Asn Ile Asp Ser Asp Pro Tyr Asn Pro Asp
35 40 45
Pro Pro Val Val Val Ala Trp Gln Thr Pro Asn Thr Ala Asn Gly Phe
50 55 60
Ile Ser Pro Asp Ala Tyr Gly Thr Asn Asp Ile Ile Cys His Leu Asn
65 70 75 80
Ala Thr Asn Ala Arg Gly His Ala Val Val Ala Ala Gly Asp Lys Ile
85 90 95
Ser Ile Gln Trp Thr Ala Trp Pro Asp Ser His His Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Arg Cys Gly Ser Ser Cys Glu Thr Val Asp Lys Thr
115 120 125
Thr Leu Glu Phe Phe Lys Ile Asp Gly Val Gly Leu Val Asp Gly Ser
130 135 140
Asn Pro Pro Gly Val Trp Gly Asp Asp Gln Leu Ile Ala Asp Asn Asn
145 150 155 160
Ser Trp Leu Val Glu Ile Pro Pro Thr Ile Ala Pro Gly Tyr Tyr Val
165 170 175
Leu Arg His Glu Leu Ile Ala Leu His Gly Ala Gly Ser Gln Asn Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Ile Thr Gly Ser Gly
195 200 205
Thr Ala Gln Pro Ser Gly Val Lys Gly Thr Glu Leu Tyr Ser Pro Thr
210 215 220
Asp Pro Gly Ile Leu Val Asn Ile Tyr Asn Ala Leu Ser Thr Tyr Ile
225 230 235 240
Val Pro Gly Pro Thr Leu Ile Pro Gly Ala Val Ser Val Val Gln Ser
245 250 255
Ser Ser Thr Ile Thr Ala Ser Gly Thr Pro Val Thr Gly Ser Gly Ser
260 265 270
Ala Pro Thr Thr Ser Ala Thr Thr Thr Leu Ser Thr Thr Thr Arg Ala
275 280 285
Thr Thr Thr Thr Thr Thr Thr Thr Ala Gly Ser Ser Thr Ser Val Gln
290 295 300
Ser Val Tyr Gly Gln Cys Gly Gly Ser Gly Trp Ser Gly Pro Thr Ala
305 310 315 320
Cys Val Thr Gly Ala Thr Cys Thr Ser Tyr Asn Ser Tyr Tyr Ser Gln
325 330 335
Cys Ile Pro Thr Ala Ser
340
<210> 20
<211> 330
<212> PRT
<213> Aspergillus fumigatus
<400> 20
Met Lys Leu Thr Ala Ser Ile Leu Phe Ser Leu Ala Ser Val Thr Pro
1 5 10 15
Leu Val Ser Gly His Tyr Val Phe Ser Lys Leu Ile Val Asp Gly Lys
20 25 30
Pro Thr Gln Asp Phe Glu Tyr Ile Arg Arg Asn Thr Asn Asn Tyr Met
35 40 45
Pro Thr Leu Pro Ser Glu Ile Leu Ser Asn Asp Phe Arg Cys Asn Lys
50 55 60
Gly Ser Met Gln Ser Ala Ala Asn Thr Lys Val Tyr Lys Val Ala Pro
65 70 75 80
Gly Thr Glu Leu Gly Phe Gln Leu Ala Tyr Gly Ala Glu Met Lys His
85 90 95
Pro Gly Pro Leu Gln Ile Tyr Met Ser Lys Ala Pro Gly Asp Val Arg
100 105 110
Ser Tyr Asp Gly Ser Gly Asp Trp Phe Lys Val His Gln Glu Gly Leu
115 120 125
Cys Ala Asp Thr Ser Lys Gly Ile Lys Asp Glu Asp Trp Cys Thr Trp
130 135 140
Gly Lys Asp Thr Ala Ser Phe Lys Ile Pro Gln Asp Thr Pro Ala Gly
145 150 155 160
Gln Tyr Leu Val Arg Val Glu His Ile Gly Leu His Arg Gly Phe Leu
165 170 175
Gly Glu Ala Glu Phe Tyr Phe Thr Cys Ala Gln Ile Glu Val Thr Gly
180 185 190
Ser Gly Ser Gly Ser Pro Ser Pro Thr Val Lys Ile Pro Gly Val Tyr
195 200 205
Lys Pro Asp Asp Pro Asn Val His Phe Asn Ile Trp Tyr Pro Thr Pro
210 215 220
Thr Ala Tyr Ser Leu Pro Gly Pro Ser Val Trp Thr Gly Gly Ser Ala
225 230 235 240
Gly Gly Ala Ser Pro Thr Ala Pro Ala Val Asn Asn Asn Ala Val Gln
245 250 255
Ala Ala Pro Thr Thr Met Thr Thr Val Ser Ser Pro Ala Asn Pro Thr
260 265 270
Ala Gly Ala Glu Ala Glu Ala Asp Cys Gly Ser Ser Glu Ser Ser Ser
275 280 285
Ala Val Ala Pro Glu Gly Thr Leu Lys Lys Trp Glu Gln Cys Gly Gly
290 295 300
Leu Asn Trp Thr Gly Ser Gly Ser Cys Glu Ala Arg Thr Thr Cys His
305 310 315 320
Gln Tyr Asn Pro Tyr Tyr Tyr Gln Cys Ile
325 330
<210> 21
<211> 364
<212> PRT
<213> Aspergillus fumigatus
<400> 21
Met Ser Gln Thr Lys Thr Leu Ser Leu Leu Ala Ala Leu Leu Ser Ala
1 5 10 15
Thr Arg Val Ala Ala His Gly His Val Thr Asn Val Val Val Asn Gly
20 25 30
Val Ser Tyr Ala Gly Phe Asp Ile Asn Ser Tyr Pro Tyr Met Ser Asp
35 40 45
Pro Pro Lys Val Ala Ala Trp Thr Thr Pro Asn Thr Gly Asn Gly Phe
50 55 60
Ile Ala Pro Ser Ala Tyr Asn Ser Pro Asp Ile Ile Cys His Gln Asn
65 70 75 80
Ala Thr Asn Ala Gln Ala Tyr Ile Glu Ile Ala Ala Gly Asp Arg Ile
85 90 95
Gln Leu Gln Trp Thr Ala Trp Pro Glu Ser His His Gly Pro Val Ile
100 105 110
Asp Met Leu Ala Ser Cys Gly Glu Ser Cys Thr Thr Val Asp Lys Thr
115 120 125
Ser Leu Lys Phe Phe Lys Ile Asp Gly Val Gly Leu Val Asp Asn Ser
130 135 140
Ala Val Pro Gly Thr Trp Gly Asp Asp Gln Leu Ile Ala Asn Ser Asn
145 150 155 160
Ser Trp Met Val Glu Ile Pro Lys Ser Ile Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Leu Ile Ala Leu His Ser Ala Phe Glu Thr Gly Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Lys Val Thr Gly Ser Gly
195 200 205
Thr Asp Ser Pro Ala Gly Thr Leu Gly Thr Glu Leu Tyr Thr Glu Ser
210 215 220
Asp Pro Gly Leu Leu Val Asp Ile Tyr Lys Ser Ile Ala Ser Tyr Ala
225 230 235 240
Val Pro Gly Pro Ala Met Tyr Thr Gly Ala Val Ser Ile Thr Gln Ser
245 250 255
Thr Ser Ala Ile Thr Ala Thr Gly Thr Ala Thr Val Gly Ser Gly Ala
260 265 270
Asp Ser Thr Pro Val Pro Ser Ser Ala Ala Ser Ser Glu Tyr Ser Thr
275 280 285
Val Ala Val Gln Val Pro Thr Thr Lys Ala Gln Tyr Thr Pro Val Pro
290 295 300
Ser Ser Ser Pro Ser Thr Phe Val Thr Ser Pro Ala Pro Thr Thr Ser
305 310 315 320
Val Pro Ser Gly Ser Ser Val Pro Val Thr Ser Asn Thr Ala Ala Pro
325 330 335
Leu Pro Thr Ala Ala Pro Gly Gly Thr Gln Thr Val Tyr Gly Gln Cys
340 345 350
Gly Gly Gln Asn Trp Thr Gly Pro Thr Tyr Ile Val
355 360
<210> 22
<211> 270
<212> PRT
<213> Thielavia terrestris
<400> 22
Leu Leu Ser Thr Leu Ala Gly Ala Ala Ser Val Ala Ala His Gly His
1 5 10 15
Val Ser Asn Ile Val Ile Asn Gly Val Ser Tyr Gln Gly Tyr Asp Pro
20 25 30
Thr Ser Phe Pro Tyr Met Gln Asn Pro Pro Ile Val Val Gly Trp Thr
35 40 45
Ala Ala Asp Thr Asp Asn Gly Phe Val Ala Pro Asp Ala Phe Ala Ser
50 55 60
Gly Asp Ile Ile Cys His Lys Asn Ala Thr Asn Ala Lys Gly His Ala
65 70 75 80
Val Val Ala Ala Gly Asp Lys Ile Phe Ile Gln Trp Asn Thr Trp Pro
85 90 95
Glu Ser His His Gly Pro Val Ile Asp Tyr Leu Ala Ser Cys Gly Ser
100 105 110
Ala Ser Cys Glu Thr Val Asp Lys Thr Lys Leu Glu Phe Phe Lys Ile
115 120 125
Asp Glu Val Gly Leu Val Asp Gly Ser Ser Ala Pro Gly Val Trp Gly
130 135 140
Ser Asp Gln Leu Ile Ala Asn Asn Asn Ser Trp Leu Val Glu Ile Pro
145 150 155 160
Pro Thr Ile Ala Pro Gly Asn Tyr Val Leu Arg His Glu Ile Ile Ala
165 170 175
Leu His Ser Ala Glu Asn Ala Asp Gly Ala Gln Asn Tyr Pro Gln Cys
180 185 190
Phe Asn Leu Gln Ile Thr Gly Thr Gly Thr Ala Thr Pro Ser Gly Val
195 200 205
Pro Gly Thr Ser Leu Tyr Thr Pro Thr Asp Pro Gly Ile Leu Val Asn
210 215 220
Ile Tyr Ser Ala Pro Ile Thr Tyr Thr Val Pro Gly Pro Ala Leu Ile
225 230 235 240
Ser Gly Ala Val Ser Ile Ala Gln Ser Ser Ser Ala Ile Thr Ala Ser
245 250 255
Gly Thr Ala Leu Thr Gly Ser Ala Thr Ala Pro Ala Ala Ala
260 265 270
<210> 23
<211> 330
<212> PRT
<213> Thielavia terrestris
<400> 23
Met Pro Pro Ala Leu Pro Gln Leu Leu Thr Thr Val Leu Thr Ala Leu
1 5 10 15
Thr Leu Gly Ser Thr Ala Leu Ala His Ser His Leu Ala Tyr Ile Ile
20 25 30
Val Asn Gly Lys Leu Tyr Gln Gly Phe Asp Pro Arg Pro His Gln Ala
35 40 45
Asn Tyr Pro Ser Arg Val Gly Trp Ser Thr Gly Ala Val Asp Asp Gly
50 55 60
Phe Val Thr Pro Ala Asn Tyr Ser Thr Pro Asp Ile Ile Cys His Ile
65 70 75 80
Ala Gly Thr Ser Pro Ala Gly His Ala Pro Val Arg Pro Gly Asp Arg
85 90 95
Ile His Val Gln Trp Asn Gly Trp Pro Val Gly His Ile Gly Pro Val
100 105 110
Leu Ser Tyr Leu Ala Arg Cys Glu Ser Asp Thr Gly Cys Thr Gly Gln
115 120 125
Asn Lys Thr Ala Leu Arg Trp Thr Lys Ile Asp Asp Ser Ser Pro Thr
130 135 140
Met Gln Asn Val Ala Gly Ala Gly Thr Gln Gly Glu Gly Thr Pro Gly
145 150 155 160
Lys Arg Trp Ala Thr Asp Val Leu Ile Ala Ala Asn Asn Ser Trp Gln
165 170 175
Val Ala Val Pro Ala Gly Leu Pro Thr Gly Ala Tyr Val Leu Arg Asn
180 185 190
Glu Ile Ile Ala Leu His Tyr Ala Ala Arg Lys Asn Gly Ala Gln Asn
195 200 205
Tyr Pro Leu Cys Met Asn Leu Trp Val Asp Ala Ser Gly Asp Asn Ser
210 215 220
Ser Val Ala Ala Thr Thr Ala Ala Val Thr Ala Gly Gly Leu Gln Met
225 230 235 240
Asp Ala Tyr Asp Ala Arg Gly Phe Tyr Lys Glu Asn Asp Pro Gly Val
245 250 255
Leu Val Asn Val Thr Ala Ala Leu Ser Ser Tyr Val Val Pro Gly Pro
260 265 270
Thr Val Ala Ala Gly Ala Thr Pro Val Pro Tyr Ala Gln Gln Ser Pro
275 280 285
Ser Val Ser Thr Ala Ala Gly Thr Pro Val Val Val Thr Arg Thr Ser
290 295 300
Glu Thr Ala Pro Tyr Thr Gly Ala Met Thr Pro Thr Val Ala Ala Arg
305 310 315 320
Met Lys Gly Arg Gly Tyr Asp Arg Arg Gly
325 330
<210> 24
<211> 315
<212> PRT
<213> Thielavia terrestris
<400> 24
Met Arg Thr Thr Phe Ala Ala Ala Leu Ala Ala Phe Ala Ala Gln Glu
1 5 10 15
Val Ala Gly His Ala Ile Phe Gln Gln Leu Trp Val Asp Gly Thr Asp
20 25 30
Tyr Ile Arg Ala Pro Leu Phe Leu Phe Gly Lys Cys Pro Val Lys Ala
35 40 45
Gly Gly Thr Val Thr Val Glu Met His Gln Gln Pro Gly Asp Arg Ser
50 55 60
Cys Asn Asn Glu Ala Ile Gly Gly Ala His Trp Gly Pro Val Gln Val
65 70 75 80
Tyr Leu Ser Lys Val Glu Asp Ala Ser Thr Ala Asp Gly Ser Thr Gly
85 90 95
Trp Phe Lys Ile Phe Ala Asp Thr Trp Ser Lys Lys Ala Gly Ser Ser
100 105 110
Val Gly Asp Asp Asp Asn Trp Gly Thr Arg Asp Leu Asn Ala Cys Cys
115 120 125
Gly Lys Met Gln Val Lys Ile Pro Ala Asp Ile Pro Ser Gly Asp Tyr
130 135 140
Leu Leu Arg Ala Glu Ala Leu Ala Leu His Thr Ala Gly Gln Val Gly
145 150 155 160
Gly Ala Gln Phe Tyr Met Ser Cys Tyr Gln Ile Thr Val Ser Gly Gly
165 170 175
Gly Ser Ala Ser Pro Ala Thr Val Lys Phe Pro Gly Ala Tyr Ser Ala
180 185 190
Asn Asp Pro Gly Ile His Ile Asn Ile His Ala Ala Val Ser Asn Tyr
195 200 205
Val Ala Pro Gly Pro Ala Val Tyr Ser Gly Gly Thr Thr Lys Val Ala
210 215 220
Gly Ser Gly Cys Gln Gly Cys Glu Asn Thr Cys Lys Val Gly Ser Ser
225 230 235 240
Pro Thr Ala Thr Ala Pro Ser Gly Lys Ser Gly Ala Gly Ser Asp Gly
245 250 255
Gly Ala Gly Thr Asp Gly Gly Ser Ser Ser Ser Ser Pro Asp Thr Gly
260 265 270
Ser Ala Cys Ser Val Gln Ala Tyr Gly Gln Cys Gly Gly Asn Gly Tyr
275 280 285
Ser Gly Cys Thr Gln Cys Ala Pro Gly Tyr Thr Cys Lys Ala Val Ser
290 295 300
Pro Pro Tyr Tyr Ser Gln Cys Ala Pro Ser Ser
305 310 315
<210> 25
<211> 349
<212> PRT
<213> Chaetomium globosum
<400> 25
Met Ser Lys Ala Ser Ala Leu Leu Ala Thr Leu Thr Gly Ala Ala Leu
1 5 10 15
Val Ala Ala His Gly His Val Ser His Ile Ile Val Asn Gly Val Tyr
20 25 30
Tyr Glu Asn Tyr Asp Pro Thr Thr His Trp Tyr Gln Pro Asn Pro Pro
35 40 45
Thr Val Ile Gly Trp Lys Ala Ala Gln Gln Asp Asn Gly Phe Val Glu
50 55 60
Pro Asn Asn Phe Gly Thr Ser Asp Ile Ile Cys His Lys Ser Gly Ser
65 70 75 80
Pro Gly Gly Gly His Ala Thr Val Ala Ala Gly Asp Lys Ile Ser Ile
85 90 95
Val Trp Asp Pro Glu Trp Pro Glu Ser His Ile Gly Pro Val Ile Asp
100 105 110
Tyr Leu Ala Ala Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Ala Ser
115 120 125
Leu Arg Phe Phe Lys Ile Asp Gly Ala Gly Tyr Asp Lys Thr Ala Gly
130 135 140
Arg Trp Ala Ala Asp Thr Leu Arg Ala Asn Gly Asn Ser Trp Leu Val
145 150 155 160
Gln Ile Pro Ala Asp Leu Lys Ala Gly Asn Tyr Val Leu Arg His Glu
165 170 175
Ile Ile Ala Leu His Gly Ala Ser Ser Pro Asn Gly Ala Gln Ala Tyr
180 185 190
Pro Gln Cys Ile Asn Leu Arg Val Thr Gly Ser Gly Thr Asn Ala Pro
195 200 205
Ser Gly Val Ala Gly Thr Ser Leu Tyr Arg Ala Ser Asp Ala Gly Ile
210 215 220
Leu Phe Asn Pro Tyr Val Ala Ser Pro Asn Tyr Pro Val Pro Gly Pro
225 230 235 240
Ala Leu Ile Ala Gly Ala Ala Ser Ser Val Ala Gln Ser Lys Ser Val
245 250 255
Ala Thr Ala Thr Ala Ser Ala Thr Leu Pro Gly Asn Asn Asn Gly Gly
260 265 270
Gly Pro Asn Pro Gln Pro Thr Thr Ala Thr Thr Thr Ala Asn Pro Gly
275 280 285
Val Ser Thr Thr Leu Arg Thr Ser Thr Ser Thr Ser Thr Ser Ala Gln
290 295 300
Val Thr Pro Pro Pro Thr Gly Gly Asn Ala Gln Thr Lys Tyr Gly Gln
305 310 315 320
Cys Gly Gly Ser Gly Trp Thr Gly Pro Thr Ala Cys Ala Ala Gly Ser
325 330 335
Ser Cys Ser Val Leu Asn Asp Trp Tyr Ala Gln Cys Val
340 345
<210> 26
<211> 249
<212> PRT
<213> Trichoderma reesei
<400> 26
Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser
1 5 10 15
Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr
20 25 30
Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly
35 40 45
His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly
50 55 60
Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys
65 70 75 80
Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn
85 90 95
Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro
100 105 110
Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn
115 120 125
Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr
130 135 140
Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys
145 150 155 160
Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe
165 170 175
Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met
180 185 190
Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr
195 200 205
Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr
210 215 220
Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr
225 230 235 240
Ile Pro Gly Pro Ala Leu Trp Gln Gly
245
<210> 27
<211> 344
<212> PRT
<213> Trichoderma reesei
<400> 27
Met Ile Gln Lys Leu Ser Asn Leu Leu Val Thr Ala Leu Ala Val Ala
1 5 10 15
Thr Gly Val Val Gly His Gly His Ile Asn Asp Ile Val Ile Asn Gly
20 25 30
Val Trp Tyr Gln Ala Tyr Asp Pro Thr Thr Phe Pro Tyr Glu Ser Asn
35 40 45
Pro Pro Ile Val Val Gly Trp Thr Ala Ala Asp Leu Asp Asn Gly Phe
50 55 60
Val Ser Pro Asp Ala Tyr Gln Asn Pro Asp Ile Ile Cys His Lys Asn
65 70 75 80
Ala Thr Asn Ala Lys Gly His Ala Ser Val Lys Ala Gly Asp Thr Ile
85 90 95
Leu Phe Gln Trp Val Pro Val Pro Trp Pro His Pro Gly Pro Ile Val
100 105 110
Asp Tyr Leu Ala Asn Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Thr
115 120 125
Thr Leu Glu Phe Phe Lys Ile Asp Gly Val Gly Leu Leu Ser Gly Gly
130 135 140
Asp Pro Gly Thr Trp Ala Ser Asp Val Leu Ile Ser Asn Asn Asn Thr
145 150 155 160
Trp Val Val Lys Ile Pro Asp Asn Leu Ala Pro Gly Asn Tyr Val Leu
165 170 175
Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Gln Ala Asn Gly Ala
180 185 190
Gln Asn Tyr Pro Gln Cys Phe Asn Ile Ala Val Ser Gly Ser Gly Ser
195 200 205
Leu Gln Pro Ser Gly Val Leu Gly Thr Asp Leu Tyr His Ala Thr Asp
210 215 220
Pro Gly Val Leu Ile Asn Ile Tyr Thr Ser Pro Leu Asn Tyr Ile Ile
225 230 235 240
Pro Gly Pro Thr Val Val Ser Gly Leu Pro Thr Ser Val Ala Gln Gly
245 250 255
Ser Ser Ala Ala Thr Ala Thr Ala Ser Ala Thr Val Pro Gly Gly Gly
260 265 270
Ser Gly Pro Thr Ser Arg Thr Thr Thr Thr Ala Arg Thr Thr Gln Ala
275 280 285
Ser Ser Arg Pro Ser Ser Thr Pro Pro Ala Thr Thr Ser Ala Pro Ala
290 295 300
Gly Gly Pro Thr Gln Thr Leu Tyr Gly Gln Cys Gly Gly Ser Gly Tyr
305 310 315 320
Ser Gly Pro Thr Arg Cys Ala Pro Pro Ala Thr Cys Ser Thr Leu Asn
325 330 335
Pro Tyr Tyr Ala Gln Cys Leu Asn
340
<210> 28
<211> 250
<212> PRT
<213> Aspergillus fumigatus
<400> 28
Met Thr Leu Ser Lys Ile Thr Ser Ile Ala Gly Leu Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Ser Gly Ile Val Ala Asp Gly
20 25 30
Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser Asn
35 40 45
Pro Pro Asp Thr Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly Phe
50 55 60
Val Asp Gly Thr Gly Tyr Gln Ser Pro Asp Ile Ile Cys His Arg Asp
65 70 75 80
Ala Lys Asn Gly Lys Leu Thr Ala Thr Val Ala Ala Gly Ser Gln Ile
85 90 95
Glu Phe Gln Trp Thr Thr Trp Pro Glu Ser His His Gly Pro Leu Ile
100 105 110
Thr Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ala Thr Val Asp Lys Thr
115 120 125
Thr Leu Lys Phe Val Lys Ile Ala Ala Gln Gly Leu Ile Asp Gly Ser
130 135 140
Asn Pro Pro Gly Val Trp Ala Asp Asp Glu Met Ile Ala Asn Asn Asn
145 150 155 160
Thr Ala Thr Val Thr Ile Pro Ala Ser Tyr Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Leu Asn Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Phe Asn Ile Gln Ile Thr Gly Gly Gly
195 200 205
Ser Ala Gln Gly Ser Gly Thr Ala Gly Thr Ser Leu Tyr Lys Asn Thr
210 215 220
Asp Pro Gly Ile Lys Phe Asp Ile Tyr Ser Asp Leu Ser Gly Gly Tyr
225 230 235 240
Pro Ile Pro Gly Pro Ala Leu Phe Asn Ala
245 250
<210> 29
<211> 226
<212> PRT
<213> Thielavia terrestris
<400> 29
Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val
1 5 10 15
Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln
20 25 30
Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp
35 40 45
Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala
50 55 60
Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala
65 70 75 80
Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg
85 90 95
Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val
100 105 110
Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr
115 120 125
Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys
130 135 140
Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His
145 150 155 160
Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala
180 185 190
Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile
195 200 205
Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe
210 215 220
Ser Cys
225
<210> 30
<211> 1044
<212> DNA
<213> Trichoderma reesei
<400> 30
atgatccaga agctttccaa ccttcttctc accgcactag cggtggcaac cggtgttgtt 60
ggacacggac acatcaacaa cattgtcgtc aacggagtgt actaccaggg atatgatcct 120
acatcgttcc catatgaatc tgacccgccc atagtggtgg gctggacggc tgccgatctt 180
gacaacggct tcgtctcacc cgacgcatat cagagcccgg acatcatctg ccacaagaat 240
gccaccaacg ccaaaggaca cgcgtccgtc aaggccggag acactattcc cctccagtgg 300
gtgccagttc cttggccgca cccaggcccc atcgtcgact acctggccaa ctgcaacggc 360
gactgcgaga ccgtggacaa gacgtccctt gagttcttca agattgacgg cgtcggtctc 420
atcagcggcg gagatccggg caactgggcc tcggacgtgt tgattgccaa caacaacacc 480
tgggttgtca agatccccga ggatctcgcc ccgggcaact acgtgcttcg ccacgagatc 540
atcgccttgc acagcgccgg gcaggcggac ggcgctcaga actaccctca gtgcttcaac 600
ctcgccgtcc caggctccgg atctctgcag ccgagcggcg tcaagggaac cgcgctctac 660
cactccgatg accccggtgt cctcatcaac atctacacca gccctcttgc gtacaccatt 720
cctggacctt ccgtggtatc aggcctcccc acgagtgtcg cccagggcag ctccgccgcg 780
acggccactg ccagcgccac tgttcctggc ggtagcggac cgggaaaccc gaccagtaag 840
actacgacga cggcgaggac gacacaggcc tcctctagca gggccagctc tactcctcct 900
gctactacgt cggcacctgg tggaggccca acccagactt tgtacggcca gtgtggtggc 960
agcggctaca gtggtcctac tcgatgcgcg ccgccggcca cttgctctac cttgaaccca 1020
tactacgccc agtgccttaa ctag 1044
<210> 31
<211> 471
<212> PRT
<213> Trichoderma reesei
<400> 31
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1 5 10 15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
50 55 60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65 70 75 80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
85 90 95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
100 105 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
115 120 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
130 135 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145 150 155 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
165 170 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
180 185 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
195 200 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
210 215 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225 230 235 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
245 250 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
260 265 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
275 280 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
290 295 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305 310 315 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
325 330 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
340 345 350
Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn
355 360 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
370 375 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385 390 395 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
405 410 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
420 425 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
435 440 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
450 455 460
Asn Ala Asn Pro Ser Phe Leu
465 470
<210> 32
<211> 513
<212> PRT
<213> Trichoderma reesei
<400> 32
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Arg Gly Thr Thr Thr Thr
450 455 460
Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln Ser
465 470 475 480
His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys
485 490 495
Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys
500 505 510
Leu
<210> 33
<211> 837
<212> PRT
<213> Trichoderma reesei
<400> 33
Met Lys Val Ser Arg Val Leu Ala Leu Val Leu Gly Ala Val Ile Pro
1 5 10 15
Ala His Ala Ala Phe Ser Trp Lys Asn Val Lys Leu Gly Gly Gly Gly
20 25 30
Gly Phe Val Pro Gly Ile Ile Phe His Pro Lys Thr Lys Gly Val Ala
35 40 45
Tyr Ala Arg Thr Asp Ile Gly Gly Leu Tyr Arg Leu Asn Ala Asp Asp
50 55 60
Ser Trp Thr Ala Val Thr Asp Gly Ile Ala Asp Asn Ala Gly Trp His
65 70 75 80
Asn Trp Gly Ile Asp Ala Val Ala Leu Asp Pro Gln Asp Asp Gln Lys
85 90 95
Val Tyr Ala Ala Val Gly Met Tyr Thr Asn Ser Trp Asp Pro Ser Asn
100 105 110
Gly Ala Ile Ile Arg Ser Ser Asp Arg Gly Ala Thr Trp Ser Phe Thr
115 120 125
Asn Leu Pro Phe Lys Val Gly Gly Asn Met Pro Gly Arg Gly Ala Gly
130 135 140
Glu Arg Leu Ala Val Asp Pro Ala Asn Ser Asn Ile Ile Tyr Phe Gly
145 150 155 160
Ala Arg Ser Gly Asn Gly Leu Trp Lys Ser Thr Asp Gly Gly Val Thr
165 170 175
Phe Ser Lys Val Ser Ser Phe Thr Ala Thr Gly Thr Tyr Ile Pro Asp
180 185 190
Pro Ser Asp Ser Asn Gly Tyr Asn Ser Asp Lys Gln Gly Leu Met Trp
195 200 205
Val Thr Phe Asp Ser Thr Ser Ser Thr Thr Gly Gly Ala Thr Ser Arg
210 215 220
Ile Phe Val Gly Thr Ala Asp Asn Ile Thr Ala Ser Val Tyr Val Ser
225 230 235 240
Thr Asn Ala Gly Ser Thr Trp Ser Ala Val Pro Gly Gln Pro Gly Lys
245 250 255
Tyr Phe Pro His Lys Ala Lys Leu Gln Pro Ala Glu Lys Ala Leu Tyr
260 265 270
Leu Thr Tyr Ser Asp Gly Thr Gly Pro Tyr Asp Gly Thr Leu Gly Ser
275 280 285
Val Trp Arg Tyr Asp Ile Ala Gly Gly Thr Trp Lys Asp Ile Thr Pro
290 295 300
Val Ser Gly Ser Asp Leu Tyr Phe Gly Phe Gly Gly Leu Gly Leu Asp
305 310 315 320
Leu Gln Lys Pro Gly Thr Leu Val Val Ala Ser Leu Asn Ser Trp Trp
325 330 335
Pro Asp Ala Gln Leu Phe Arg Ser Thr Asp Ser Gly Thr Thr Trp Ser
340 345 350
Pro Ile Trp Ala Trp Ala Ser Tyr Pro Thr Glu Thr Tyr Tyr Tyr Ser
355 360 365
Ile Ser Thr Pro Lys Ala Pro Trp Ile Lys Asn Asn Phe Ile Asp Val
370 375 380
Thr Ser Glu Ser Pro Ser Asp Gly Leu Ile Lys Arg Leu Gly Trp Met
385 390 395 400
Ile Glu Ser Leu Glu Ile Asp Pro Thr Asp Ser Asn His Trp Leu Tyr
405 410 415
Gly Thr Gly Met Thr Ile Phe Gly Gly His Asp Leu Thr Asn Trp Asp
420 425 430
Thr Arg His Asn Val Ser Ile Gln Ser Leu Ala Asp Gly Ile Glu Glu
435 440 445
Phe Ser Val Gln Asp Leu Ala Ser Ala Pro Gly Gly Ser Glu Leu Leu
450 455 460
Ala Ala Val Gly Asp Asp Asn Gly Phe Thr Phe Ala Ser Arg Asn Asp
465 470 475 480
Leu Gly Thr Ser Pro Gln Thr Val Trp Ala Thr Pro Thr Trp Ala Thr
485 490 495
Ser Thr Ser Val Asp Tyr Ala Gly Asn Ser Val Lys Ser Val Val Arg
500 505 510
Val Gly Asn Thr Ala Gly Thr Gln Val Ala Ile Ser Ser Asp Gly Gly
515 520 525
Ala Thr Trp Ser Ile Asp Tyr Ala Ala Asp Thr Ser Met Asn Gly Gly
530 535 540
Thr Val Ala Tyr Ser Ala Asp Gly Asp Thr Ile Leu Trp Ser Thr Ala
545 550 555 560
Ser Ser Gly Val Gln Arg Ser Gln Phe Gln Gly Ser Phe Ala Ser Val
565 570 575
Ser Ser Leu Pro Ala Gly Ala Val Ile Ala Ser Asp Lys Lys Thr Asn
580 585 590
Ser Val Phe Tyr Ala Gly Ser Gly Ser Thr Phe Tyr Val Ser Lys Asp
595 600 605
Thr Gly Ser Ser Phe Thr Arg Gly Pro Lys Leu Gly Ser Ala Gly Thr
610 615 620
Ile Arg Asp Ile Ala Ala His Pro Thr Thr Ala Gly Thr Leu Tyr Val
625 630 635 640
Ser Thr Asp Val Gly Ile Phe Arg Ser Thr Asp Ser Gly Thr Thr Phe
645 650 655
Gly Gln Val Ser Thr Ala Leu Thr Asn Thr Tyr Gln Ile Ala Leu Gly
660 665 670
Val Gly Ser Gly Ser Asn Trp Asn Leu Tyr Ala Phe Gly Thr Gly Pro
675 680 685
Ser Gly Ala Arg Leu Tyr Ala Ser Gly Asp Ser Gly Ala Ser Trp Thr
690 695 700
Asp Ile Gln Gly Ser Gln Gly Phe Gly Ser Ile Asp Ser Thr Lys Val
705 710 715 720
Ala Gly Ser Gly Ser Thr Ala Gly Gln Val Tyr Val Gly Thr Asn Gly
725 730 735
Arg Gly Val Phe Tyr Ala Gln Gly Thr Val Gly Gly Gly Thr Gly Gly
740 745 750
Thr Ser Ser Ser Thr Lys Gln Ser Ser Ser Ser Thr Ser Ser Ala Ser
755 760 765
Ser Ser Thr Thr Leu Arg Ser Ser Val Val Ser Thr Thr Arg Ala Ser
770 775 780
Thr Val Thr Ser Ser Arg Thr Ser Ser Ala Ala Gly Pro Thr Gly Ser
785 790 795 800
Gly Val Ala Gly His Tyr Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly
805 810 815
Pro Thr Gln Cys Val Ala Pro Tyr Val Cys Gln Lys Gln Asn Asp Tyr
820 825 830
Tyr Tyr Gln Cys Val
835
<210> 34
<211> 297
<212> PRT
<213> Staphylotrichum coccosporum
<400> 34
Met Arg Ser Ser Pro Phe Leu Arg Ala Ala Leu Ala Ala Ala Leu Pro
1 5 10 15
Leu Ser Ala His Ala Leu Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Pro Gly Lys Ala Ser Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Ser Ala Asp Trp Gln Arg Ile Ser Asp Phe Asn Ala
50 55 60
Lys Ser Gly Cys Asp Gly Gly Ser Ala Tyr Ser Cys Ala Asp Gln Thr
65 70 75 80
Pro Trp Ala Val Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ala
85 90 95
Ile Ala Gly Gly Ser Glu Ser Ser Trp Cys Cys Ala Cys Tyr Ala Leu
100 105 110
Thr Phe Asn Ser Gly Pro Val Ala Gly Lys Thr Met Val Val Gln Ser
115 120 125
Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn Gln Phe Asp Leu Ala Ile
130 135 140
Pro Gly Gly Gly Val Gly Ile Phe Asn Gly Cys Ala Ser Gln Phe Gly
145 150 155 160
Gly Leu Pro Gly Ala Gln Tyr Gly Gly Ile Ser Asp Arg Ser Gln Cys
165 170 175
Ser Ser Phe Pro Ala Pro Leu Gln Pro Gly Cys Gln Trp Arg Phe Asp
180 185 190
Trp Phe Gln Asn Ala Asp Asn Pro Thr Phe Thr Phe Gln Arg Val Gln
195 200 205
Cys Pro Ser Glu Leu Thr Ser Arg Thr Gly Cys Lys Arg Asp Asp Asp
210 215 220
Ala Ser Tyr Pro Val Phe Asn Pro Pro Ser Gly Gly Ser Pro Ser Thr
225 230 235 240
Thr Ser Thr Thr Thr Ser Ser Pro Ser Gly Pro Thr Gly Asn Pro Pro
245 250 255
Gly Gly Gly Gly Cys Thr Ala Gln Lys Trp Ala Gln Cys Gly Gly Thr
260 265 270
Gly Phe Thr Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys Gln Val
275 280 285
Gln Asn Gln Trp Tyr Ser Gln Cys Leu
290 295
<210> 35
<211> 2358
<212> DNA
<213> Fusarium verticillioides
<400> 35
atgctgctca atcttcaggt cgctgccagc gctttgtcgc tttctctttt aggtggattg 60
gctgaggctg ctacgccata tacccttccg gactgtacca aaggaccttt gagcaagaat 120
ggaatctgcg atacttcgtt atctccagct aaaagagcgg ctgctctagt tgctgctctg 180
acgcccgaag agaaggtggg caatctggtc aggtaaaata tacccccccc cataatcact 240
attcggagat tggagctgac ttaacgcagc aatgcaactg gtgcaccaag aatcggactt 300
ccaaggtaca actggtggaa cgaagccctt catggcctcg ctggatctcc aggtggtcgc 360
tttgccgaca ctcctcccta cgacgcggcc acatcatttc ccatgcctct tctcatggcc 420
gctgctttcg acgatgatct gatccacgat atcggcaacg tcgtcggcac cgaagcgcgt 480
gcgttcacta acggcggttg gcgcggagtc gacttctgga cacccaacgt caaccctttt 540
aaagatcctc gctggggtcg tggctccgaa actccaggtg aagatgccct tcatgtcagc 600
cggtatgctc gctatatcgt caggggtctc gaaggcgata aggagcaacg acgtattgtt 660
gctacctgca agcactatgc tggaaacgac tttgaggact ggggaggctt cacgcgtcac 720
gactttgatg ccaagattac tcctcaggac ttggctgagt actacgtcag gcctttccag 780
gagtgcaccc gtgatgcaaa ggttggttcc atcatgtgcg cctacaatgc cgtgaacggc 840
attcccgcat gcgcaaactc gtatctgcag gagacgatcc tcagagggca ctggaactgg 900
acgcgcgata acaactggat cactagtgat tgtggcgcca tgcaggatat ctggcagaat 960
cacaagtatg tcaagaccaa cgctgaaggt gcccaggtag cttttgagaa cggcatggat 1020
tctagctgcg agtatactac taccagcgat gtctccgatt cgtacaagca aggcctcttg 1080
actgagaagc tcatggatcg ttcgttgaag cgccttttcg aagggcttgt tcatactggt 1140
ttctttgacg gtgccaaagc gcaatggaac tcgctcagtt ttgcggatgt caacaccaag 1200
gaagctcagg atcttgcact cagatctgct gtggagggtg ctgttcttct taagaatgac 1260
ggcactttgc ctctgaagct caagaagaag gatagtgttg caatgatcgg attctgggcc 1320
aacgatactt ccaagctgca gggtggttac agtggacgtg ctccgttcct ccacagcccg 1380
ctttatgcag ctgagaagct tggtcttgac accaacgtgg cttggggtcc gacactgcag 1440
aacagctcat ctcatgataa ctggaccacc aatgctgttg ctgcggcgaa gaagtctgat 1500
tacattctct actttggtgg tcttgacgcc tctgctgctg gcgaggacag agatcgtgag 1560
aaccttgact ggcctgagag ccagctgacc cttcttcaga agctctctag tctcggcaag 1620
ccactggttg ttatccagct tggtgatcaa gtcgatgaca ccgctctttt gaagaacaag 1680
aagattaaca gtattctttg ggtcaattac cctggtcagg atggcggcac tgcagtcatg 1740
gacctgctca ctggacgaaa gagtcctgct ggccgactac ccgtcacgca atatcccagt 1800
aaatacactg agcagattgg catgactgac atggacctca gacctaccaa gtcgttgcca 1860
gggagaactt atcgctggta ctcaactcca gttcttccct acggctttgg cctccactac 1920
accaagttcc aagccaagtt caagtccaac aagttgacgt ttgacatcca gaagcttctc 1980
aagggctgca gtgctcaata ctccgatact tgcgcgctgc cccccatcca agttagtgtc 2040
aagaacaccg gccgcattac ctccgacttt gtctctctgg tctttatcaa gagtgaagtt 2100
ggacctaagc cttaccctct caagaccctt gcggcttatg gtcgcttgca tgatgtcgcg 2160
ccttcatcga cgaaggatat ctcactggag tggacgttgg ataacattgc gcgacgggga 2220
gagaatggtg atttggttgt ttatcctggg acttacactc tgttgctgga tgagcctacg 2280
caagccaaga tccaggttac gctgactgga aagaaggcta ttttggataa gtggcctcaa 2340
gaccccaagt ctgcgtaa 2358
<210> 36
<211> 766
<212> PRT
<213> Fusarium verticillioides
<400> 36
Met Leu Leu Asn Leu Gln Val Ala Ala Ser Ala Leu Ser Leu Ser Leu
1 5 10 15
Leu Gly Gly Leu Ala Glu Ala Ala Thr Pro Tyr Thr Leu Pro Asp Cys
20 25 30
Thr Lys Gly Pro Leu Ser Lys Asn Gly Ile Cys Asp Thr Ser Leu Ser
35 40 45
Pro Ala Lys Arg Ala Ala Ala Leu Val Ala Ala Leu Thr Pro Glu Glu
50 55 60
Lys Val Gly Asn Leu Val Ser Asn Ala Thr Gly Ala Pro Arg Ile Gly
65 70 75 80
Leu Pro Arg Tyr Asn Trp Trp Asn Glu Ala Leu His Gly Leu Ala Gly
85 90 95
Ser Pro Gly Gly Arg Phe Ala Asp Thr Pro Pro Tyr Asp Ala Ala Thr
100 105 110
Ser Phe Pro Met Pro Leu Leu Met Ala Ala Ala Phe Asp Asp Asp Leu
115 120 125
Ile His Asp Ile Gly Asn Val Val Gly Thr Glu Ala Arg Ala Phe Thr
130 135 140
Asn Gly Gly Trp Arg Gly Val Asp Phe Trp Thr Pro Asn Val Asn Pro
145 150 155 160
Phe Lys Asp Pro Arg Trp Gly Arg Gly Ser Glu Thr Pro Gly Glu Asp
165 170 175
Ala Leu His Val Ser Arg Tyr Ala Arg Tyr Ile Val Arg Gly Leu Glu
180 185 190
Gly Asp Lys Glu Gln Arg Arg Ile Val Ala Thr Cys Lys His Tyr Ala
195 200 205
Gly Asn Asp Phe Glu Asp Trp Gly Gly Phe Thr Arg His Asp Phe Asp
210 215 220
Ala Lys Ile Thr Pro Gln Asp Leu Ala Glu Tyr Tyr Val Arg Pro Phe
225 230 235 240
Gln Glu Cys Thr Arg Asp Ala Lys Val Gly Ser Ile Met Cys Ala Tyr
245 250 255
Asn Ala Val Asn Gly Ile Pro Ala Cys Ala Asn Ser Tyr Leu Gln Glu
260 265 270
Thr Ile Leu Arg Gly His Trp Asn Trp Thr Arg Asp Asn Asn Trp Ile
275 280 285
Thr Ser Asp Cys Gly Ala Met Gln Asp Ile Trp Gln Asn His Lys Tyr
290 295 300
Val Lys Thr Asn Ala Glu Gly Ala Gln Val Ala Phe Glu Asn Gly Met
305 310 315 320
Asp Ser Ser Cys Glu Tyr Thr Thr Thr Ser Asp Val Ser Asp Ser Tyr
325 330 335
Lys Gln Gly Leu Leu Thr Glu Lys Leu Met Asp Arg Ser Leu Lys Arg
340 345 350
Leu Phe Glu Gly Leu Val His Thr Gly Phe Phe Asp Gly Ala Lys Ala
355 360 365
Gln Trp Asn Ser Leu Ser Phe Ala Asp Val Asn Thr Lys Glu Ala Gln
370 375 380
Asp Leu Ala Leu Arg Ser Ala Val Glu Gly Ala Val Leu Leu Lys Asn
385 390 395 400
Asp Gly Thr Leu Pro Leu Lys Leu Lys Lys Lys Asp Ser Val Ala Met
405 410 415
Ile Gly Phe Trp Ala Asn Asp Thr Ser Lys Leu Gln Gly Gly Tyr Ser
420 425 430
Gly Arg Ala Pro Phe Leu His Ser Pro Leu Tyr Ala Ala Glu Lys Leu
435 440 445
Gly Leu Asp Thr Asn Val Ala Trp Gly Pro Thr Leu Gln Asn Ser Ser
450 455 460
Ser His Asp Asn Trp Thr Thr Asn Ala Val Ala Ala Ala Lys Lys Ser
465 470 475 480
Asp Tyr Ile Leu Tyr Phe Gly Gly Leu Asp Ala Ser Ala Ala Gly Glu
485 490 495
Asp Arg Asp Arg Glu Asn Leu Asp Trp Pro Glu Ser Gln Leu Thr Leu
500 505 510
Leu Gln Lys Leu Ser Ser Leu Gly Lys Pro Leu Val Val Ile Gln Leu
515 520 525
Gly Asp Gln Val Asp Asp Thr Ala Leu Leu Lys Asn Lys Lys Ile Asn
530 535 540
Ser Ile Leu Trp Val Asn Tyr Pro Gly Gln Asp Gly Gly Thr Ala Val
545 550 555 560
Met Asp Leu Leu Thr Gly Arg Lys Ser Pro Ala Gly Arg Leu Pro Val
565 570 575
Thr Gln Tyr Pro Ser Lys Tyr Thr Glu Gln Ile Gly Met Thr Asp Met
580 585 590
Asp Leu Arg Pro Thr Lys Ser Leu Pro Gly Arg Thr Tyr Arg Trp Tyr
595 600 605
Ser Thr Pro Val Leu Pro Tyr Gly Phe Gly Leu His Tyr Thr Lys Phe
610 615 620
Gln Ala Lys Phe Lys Ser Asn Lys Leu Thr Phe Asp Ile Gln Lys Leu
625 630 635 640
Leu Lys Gly Cys Ser Ala Gln Tyr Ser Asp Thr Cys Ala Leu Pro Pro
645 650 655
Ile Gln Val Ser Val Lys Asn Thr Gly Arg Ile Thr Ser Asp Phe Val
660 665 670
Ser Leu Val Phe Ile Lys Ser Glu Val Gly Pro Lys Pro Tyr Pro Leu
675 680 685
Lys Thr Leu Ala Ala Tyr Gly Arg Leu His Asp Val Ala Pro Ser Ser
690 695 700
Thr Lys Asp Ile Ser Leu Glu Trp Thr Leu Asp Asn Ile Ala Arg Arg
705 710 715 720
Gly Glu Asn Gly Asp Leu Val Val Tyr Pro Gly Thr Tyr Thr Leu Leu
725 730 735
Leu Asp Glu Pro Thr Gln Ala Lys Ile Gln Val Thr Leu Thr Gly Lys
740 745 750
Lys Ala Ile Leu Asp Lys Trp Pro Gln Asp Pro Lys Ser Ala
755 760 765
<210> 37
<211> 1338
<212> DNA
<213> Penicillium funiculosum
<400> 37
atgcttcagc gatttgctta tattttacca ctggctctat tgagtgttgg agtgaaagcc 60
gacaacccct ttgtgcagag catctacacc gctgatccgg caccgatggt atacaatgac 120
cgcgtttatg tcttcatgga ccatgacaac accggagcta cctactacaa catgacagac 180
tggcatctgt tctcgtcagc agatatggcg aattggcaag atcatggcat tccaatgagc 240
ctggccaatt tcacctgggc caacgcgaat gcgtgggccc cgcaagtcat ccctcgcaac 300
ggccaattct acttttatgc tcctgtccga cacaacgatg gttctatggc tatcggtgtg 360
ggagtgagca gcaccatcac aggtccatac catgatgcta tcggcaaacc gctagtagag 420
aacaacgaga ttgatcccac cgtgttcatc gacgatgacg gtcaggcata cctgtactgg 480
ggaaatccag acctgtggta cgtcaaattg aaccaagata tgatatcgta cagcgggagc 540
cctactcaga ttccactcac cacggctgga tttggtactc gaacgggcaa tgctcaacgg 600
ccgaccactt ttgaagaagc tccatgggta tacaaacgca acggcatcta ctatatcgcc 660
tatgcagccg attgttgttc tgaggatatt cgctactcca cgggaaccag tgccactggt 720
ccgtggactt atcgaggcgt catcatgccg acccaaggta gcagcttcac caatcacgag 780
ggtattatcg acttccagaa caactcctac tttttctatc acaacggcgc tcttcccggc 840
ggaggcggct accaacgatc tgtatgtgtg gagcaattca aatacaatgc agatggaacc 900
attccgacga tcgaaatgac caccgccggt ccagctcaaa ttgggactct caacccttac 960
gtgcgacagg aagccgaaac ggcggcatgg tcttcaggca tcactacgga ggtttgtagc 1020
gaaggcggaa ttgacgtcgg gtttatcaac aatggcgatt acatcaaagt taaaggcgta 1080
gctttcggtt caggagccca ttctttctca gcgcgggttg cttctgcaaa tagcggcggc 1140
actattgcaa tacacctcgg aagcacaact ggtacgctcg tgggcacttg tactgtcccc 1200
agcactggcg gttggcagac ttggactacc gttacctgtt ctgtcagtgg cgcatctggg 1260
acccaggatg tgtattttgt tttcggtggt agcggaacag gatacctgtt caactttgat 1320
tattggcagt tcgcataa 1338
<210> 38
<211> 445
<212> PRT
<213> Penicillium funiculosum
<400> 38
Met Leu Gln Arg Phe Ala Tyr Ile Leu Pro Leu Ala Leu Leu Ser Val
1 5 10 15
Gly Val Lys Ala Asp Asn Pro Phe Val Gln Ser Ile Tyr Thr Ala Asp
20 25 30
Pro Ala Pro Met Val Tyr Asn Asp Arg Val Tyr Val Phe Met Asp His
35 40 45
Asp Asn Thr Gly Ala Thr Tyr Tyr Asn Met Thr Asp Trp His Leu Phe
50 55 60
Ser Ser Ala Asp Met Ala Asn Trp Gln Asp His Gly Ile Pro Met Ser
65 70 75 80
Leu Ala Asn Phe Thr Trp Ala Asn Ala Asn Ala Trp Ala Pro Gln Val
85 90 95
Ile Pro Arg Asn Gly Gln Phe Tyr Phe Tyr Ala Pro Val Arg His Asn
100 105 110
Asp Gly Ser Met Ala Ile Gly Val Gly Val Ser Ser Thr Ile Thr Gly
115 120 125
Pro Tyr His Asp Ala Ile Gly Lys Pro Leu Val Glu Asn Asn Glu Ile
130 135 140
Asp Pro Thr Val Phe Ile Asp Asp Asp Gly Gln Ala Tyr Leu Tyr Trp
145 150 155 160
Gly Asn Pro Asp Leu Trp Tyr Val Lys Leu Asn Gln Asp Met Ile Ser
165 170 175
Tyr Ser Gly Ser Pro Thr Gln Ile Pro Leu Thr Thr Ala Gly Phe Gly
180 185 190
Thr Arg Thr Gly Asn Ala Gln Arg Pro Thr Thr Phe Glu Glu Ala Pro
195 200 205
Trp Val Tyr Lys Arg Asn Gly Ile Tyr Tyr Ile Ala Tyr Ala Ala Asp
210 215 220
Cys Cys Ser Glu Asp Ile Arg Tyr Ser Thr Gly Thr Ser Ala Thr Gly
225 230 235 240
Pro Trp Thr Tyr Arg Gly Val Ile Met Pro Thr Gln Gly Ser Ser Phe
245 250 255
Thr Asn His Glu Gly Ile Ile Asp Phe Gln Asn Asn Ser Tyr Phe Phe
260 265 270
Tyr His Asn Gly Ala Leu Pro Gly Gly Gly Gly Tyr Gln Arg Ser Val
275 280 285
Cys Val Glu Gln Phe Lys Tyr Asn Ala Asp Gly Thr Ile Pro Thr Ile
290 295 300
Glu Met Thr Thr Ala Gly Pro Ala Gln Ile Gly Thr Leu Asn Pro Tyr
305 310 315 320
Val Arg Gln Glu Ala Glu Thr Ala Ala Trp Ser Ser Gly Ile Thr Thr
325 330 335
Glu Val Cys Ser Glu Gly Gly Ile Asp Val Gly Phe Ile Asn Asn Gly
340 345 350
Asp Tyr Ile Lys Val Lys Gly Val Ala Phe Gly Ser Gly Ala His Ser
355 360 365
Phe Ser Ala Arg Val Ala Ser Ala Asn Ser Gly Gly Thr Ile Ala Ile
370 375 380
His Leu Gly Ser Thr Thr Gly Thr Leu Val Gly Thr Cys Thr Val Pro
385 390 395 400
Ser Thr Gly Gly Trp Gln Thr Trp Thr Thr Val Thr Cys Ser Val Ser
405 410 415
Gly Ala Ser Gly Thr Gln Asp Val Tyr Phe Val Phe Gly Gly Ser Gly
420 425 430
Thr Gly Tyr Leu Phe Asn Phe Asp Tyr Trp Gln Phe Ala
435 440 445
<210> 39
<211> 1593
<212> DNA
<213> Fusarium verticillioides
<400> 39
atgaaggtat actggctcgt ggcgtgggcc acttctttga cgccggcact ggctggcttg 60
attggacacc gtcgcgccac caccttcaac aatcctatca tctactcaga ctttccagat 120
aacgatgtat tcctcggtcc agataactac tactacttct ctgcttccaa cttccacttc 180
agcccaggag cacccgtttt gaagtctaaa gatctgctaa actgggatct catcggccat 240
tcaattcccc gcctgaactt tggcgacggc tatgatcttc ctcctggctc acgttattac 300
cgtggaggta cttgggcatc atccctcaga tacagaaaga gcaatggaca gtggtactgg 360
atcggctgca tcaacttctg gcagacctgg gtatacactg cctcatcgcc ggaaggtcca 420
tggtacaaca agggaaactt cggtgataac aattgctact acgacaatgg catactgatc 480
gatgacgatg ataccatgta tgtcgtatac ggttccggtg aggtcaaagt atctcaacta 540
tctcaggacg gattcagcca ggtcaaatct caggtagttt tcaagaacac tgatattggg 600
gtccaagact tggagggtaa ccgcatgtac aagatcaacg ggctctacta tatcctaaac 660
gatagcccaa gtggcagtca gacctggatt tggaagtcga aatcaccctg gggcccttat 720
gagtctaagg tcctcgccga caaagtcacc ccgcctatct ctggtggtaa ctcgccgcat 780
cagggtagtc tcataaagac tcccaatggt ggctggtact tcatgtcatt cacttgggcc 840
tatcctgccg gccgtcttcc ggttcttgca ccgattacgt ggggtagcga tggtttcccc 900
attcttgtca agggtgctaa tggcggatgg ggatcatctt acccaacact tcctggcacg 960
gatggtgtga caaagaattg gacaaggact gataccttcc gcggaacctc acttgctccg 1020
tcctgggagt ggaaccataa tccggacgtc aactccttca ctgtcaacaa cggcctgact 1080
ctccgcactg ctagcattac gaaggatatt taccaggcga ggaacacgct atctcaccga 1140
actcatggtg atcatccaac aggaatagtg aagattgatt tctctccgat gaaggacggc 1200
gaccgggccg ggctttcagc gtttcgagac caaagtgcat acatcggtat tcatcgagat 1260
aacggaaagt tcacaatcgc tacgaagcat gggatgaata tggatgagtg gaacggaaca 1320
acaacagacc tgggacaaat aaaagccaca gctaatgtgc cttctggaag gaccaagatc 1380
tggctgagac ttcaacttga taccaaccca gcaggaactg gcaacactat cttttcttac 1440
agttgggatg gagtcaagta tgaaacactg ggtcccaact tcaaactgta caatggttgg 1500
gcattcttta ttgcttaccg attcggcatc ttcaacttcg ccgagacggc tttaggaggc 1560
tcgatcaagg ttgagtcttt cacagctgca tag 1593
<210> 40
<211> 530
<212> PRT
<213> Fusarium verticillioides
<400> 40
Met Lys Val Tyr Trp Leu Val Ala Trp Ala Thr Ser Leu Thr Pro Ala
1 5 10 15
Leu Ala Gly Leu Ile Gly His Arg Arg Ala Thr Thr Phe Asn Asn Pro
20 25 30
Ile Ile Tyr Ser Asp Phe Pro Asp Asn Asp Val Phe Leu Gly Pro Asp
35 40 45
Asn Tyr Tyr Tyr Phe Ser Ala Ser Asn Phe His Phe Ser Pro Gly Ala
50 55 60
Pro Val Leu Lys Ser Lys Asp Leu Leu Asn Trp Asp Leu Ile Gly His
65 70 75 80
Ser Ile Pro Arg Leu Asn Phe Gly Asp Gly Tyr Asp Leu Pro Pro Gly
85 90 95
Ser Arg Tyr Tyr Arg Gly Gly Thr Trp Ala Ser Ser Leu Arg Tyr Arg
100 105 110
Lys Ser Asn Gly Gln Trp Tyr Trp Ile Gly Cys Ile Asn Phe Trp Gln
115 120 125
Thr Trp Val Tyr Thr Ala Ser Ser Pro Glu Gly Pro Trp Tyr Asn Lys
130 135 140
Gly Asn Phe Gly Asp Asn Asn Cys Tyr Tyr Asp Asn Gly Ile Leu Ile
145 150 155 160
Asp Asp Asp Asp Thr Met Tyr Val Val Tyr Gly Ser Gly Glu Val Lys
165 170 175
Val Ser Gln Leu Ser Gln Asp Gly Phe Ser Gln Val Lys Ser Gln Val
180 185 190
Val Phe Lys Asn Thr Asp Ile Gly Val Gln Asp Leu Glu Gly Asn Arg
195 200 205
Met Tyr Lys Ile Asn Gly Leu Tyr Tyr Ile Leu Asn Asp Ser Pro Ser
210 215 220
Gly Ser Gln Thr Trp Ile Trp Lys Ser Lys Ser Pro Trp Gly Pro Tyr
225 230 235 240
Glu Ser Lys Val Leu Ala Asp Lys Val Thr Pro Pro Ile Ser Gly Gly
245 250 255
Asn Ser Pro His Gln Gly Ser Leu Ile Lys Thr Pro Asn Gly Gly Trp
260 265 270
Tyr Phe Met Ser Phe Thr Trp Ala Tyr Pro Ala Gly Arg Leu Pro Val
275 280 285
Leu Ala Pro Ile Thr Trp Gly Ser Asp Gly Phe Pro Ile Leu Val Lys
290 295 300
Gly Ala Asn Gly Gly Trp Gly Ser Ser Tyr Pro Thr Leu Pro Gly Thr
305 310 315 320
Asp Gly Val Thr Lys Asn Trp Thr Arg Thr Asp Thr Phe Arg Gly Thr
325 330 335
Ser Leu Ala Pro Ser Trp Glu Trp Asn His Asn Pro Asp Val Asn Ser
340 345 350
Phe Thr Val Asn Asn Gly Leu Thr Leu Arg Thr Ala Ser Ile Thr Lys
355 360 365
Asp Ile Tyr Gln Ala Arg Asn Thr Leu Ser His Arg Thr His Gly Asp
370 375 380
His Pro Thr Gly Ile Val Lys Ile Asp Phe Ser Pro Met Lys Asp Gly
385 390 395 400
Asp Arg Ala Gly Leu Ser Ala Phe Arg Asp Gln Ser Ala Tyr Ile Gly
405 410 415
Ile His Arg Asp Asn Gly Lys Phe Thr Ile Ala Thr Lys His Gly Met
420 425 430
Asn Met Asp Glu Trp Asn Gly Thr Thr Thr Asp Leu Gly Gln Ile Lys
435 440 445
Ala Thr Ala Asn Val Pro Ser Gly Arg Thr Lys Ile Trp Leu Arg Leu
450 455 460
Gln Leu Asp Thr Asn Pro Ala Gly Thr Gly Asn Thr Ile Phe Ser Tyr
465 470 475 480
Ser Trp Asp Gly Val Lys Tyr Glu Thr Leu Gly Pro Asn Phe Lys Leu
485 490 495
Tyr Asn Gly Trp Ala Phe Phe Ile Ala Tyr Arg Phe Gly Ile Phe Asn
500 505 510
Phe Ala Glu Thr Ala Leu Gly Gly Ser Ile Lys Val Glu Ser Phe Thr
515 520 525
Ala Ala
530
<210> 41
<211> 1374
<212> DNA
<213> Fusarium verticillioides
<400> 41
atgcactacg ctaccctcac cactttggtg ctggctctga ccaccaacgt cgctgcacag 60
caaggcacag caactgtcga cctctccaaa aatcatggac cggcgaaggc ccttggttca 120
ggcttcatat acggctggcc tgacaacgga acaagcgtcg acacctccat accagatttc 180
ttggtaactg acatcaaatt caactcaaac cgcggcggtg gcgcccaaat cccatcactg 240
ggttgggcca gaggtggcta tgaaggatac ctcggccgct tcaactcaac cttatccaac 300
tatcgcacca cgcgcaagta taacgctgac tttatcttgt tgcctcatga cctctggggt 360
gcggatggcg ggcagggttc aaactccccg tttcctggcg acaatggcaa ttggactgag 420
atggagttat tctggaatca gcttgtgtct gacttgaagg ctcataatat gctggaaggt 480
cttgtgattg atgtttggaa tgagcctgat attgatatct tttgggatcg cccgtggtcg 540
cagtttcttg agtattacaa tcgcgcgacc aaactacttc ggtgagtcta ctactgatcc 600
atacgtattt acagtgagct gactggtcga attagaaaaa cacttcccaa aactcttctc 660
agtggcccag ccatggcaca ttctcccatt ctgtccgatg ataaatggca tacctggctt 720
caatcagtag cgggtaacaa gacagtccct gatatttact cctggcatca gattggcgct 780
tgggaacgtg agccggacag cactatcccc gactttacca ccttgcgggc gcaatatggc 840
gttcccgaga agccaattga cgtcaatgag tacgctgcac gcgatgagca aaatccagcc 900
aactccgtct actacctctc tcaactagag cgtcataacc ttagaggtct tcgcgcaaac 960
tggggtagcg gatctgacct ccacaactgg atgggcaact tgatttacag cactaccggt 1020
acctcggagg ggacttacta ccctaatggt gaatggcagg cttacaagta ctatgcggcc 1080
atggcagggc agagacttgt gaccaaagca tcgtcggact tgaagtttga tgtctttgcc 1140
actaagcaag gccgtaagat taagattata gccggcacga ggaccgttca agcaaagtat 1200
aacatcaaaa tcagcggttt ggaagtagca ggacttccta agatgggtac ggtaaaggtc 1260
cggacttatc ggttcgactg ggctgggccg aatggaaagg ttgacgggcc tgttgatttg 1320
ggggagaaga agtatactta ttcggccaat acggtgagca gcccctctac ttga 1374
<210> 42
<211> 439
<212> PRT
<213> Fusarium verticillioides
<400> 42
Met His Tyr Ala Thr Leu Thr Thr Leu Val Leu Ala Leu Thr Thr Asn
1 5 10 15
Val Ala Ala Gln Gln Gly Thr Ala Thr Val Asp Leu Ser Lys Asn His
20 25 30
Gly Pro Ala Lys Ala Leu Gly Ser Gly Phe Ile Tyr Gly Trp Pro Asp
35 40 45
Asn Gly Thr Ser Val Asp Thr Ser Ile Pro Asp Phe Leu Val Thr Asp
50 55 60
Ile Lys Phe Asn Ser Asn Arg Gly Gly Gly Ala Gln Ile Pro Ser Leu
65 70 75 80
Gly Trp Ala Arg Gly Gly Tyr Glu Gly Tyr Leu Gly Arg Phe Asn Ser
85 90 95
Thr Leu Ser Asn Tyr Arg Thr Thr Arg Lys Tyr Asn Ala Asp Phe Ile
100 105 110
Leu Leu Pro His Asp Leu Trp Gly Ala Asp Gly Gly Gln Gly Ser Asn
115 120 125
Ser Pro Phe Pro Gly Asp Asn Gly Asn Trp Thr Glu Met Glu Leu Phe
130 135 140
Trp Asn Gln Leu Val Ser Asp Leu Lys Ala His Asn Met Leu Glu Gly
145 150 155 160
Leu Val Ile Asp Val Trp Asn Glu Pro Asp Ile Asp Ile Phe Trp Asp
165 170 175
Arg Pro Trp Ser Gln Phe Leu Glu Tyr Tyr Asn Arg Ala Thr Lys Leu
180 185 190
Leu Arg Lys Thr Leu Pro Lys Thr Leu Leu Ser Gly Pro Ala Met Ala
195 200 205
His Ser Pro Ile Leu Ser Asp Asp Lys Trp His Thr Trp Leu Gln Ser
210 215 220
Val Ala Gly Asn Lys Thr Val Pro Asp Ile Tyr Ser Trp His Gln Ile
225 230 235 240
Gly Ala Trp Glu Arg Glu Pro Asp Ser Thr Ile Pro Asp Phe Thr Thr
245 250 255
Leu Arg Ala Gln Tyr Gly Val Pro Glu Lys Pro Ile Asp Val Asn Glu
260 265 270
Tyr Ala Ala Arg Asp Glu Gln Asn Pro Ala Asn Ser Val Tyr Tyr Leu
275 280 285
Ser Gln Leu Glu Arg His Asn Leu Arg Gly Leu Arg Ala Asn Trp Gly
290 295 300
Ser Gly Ser Asp Leu His Asn Trp Met Gly Asn Leu Ile Tyr Ser Thr
305 310 315 320
Thr Gly Thr Ser Glu Gly Thr Tyr Tyr Pro Asn Gly Glu Trp Gln Ala
325 330 335
Tyr Lys Tyr Tyr Ala Ala Met Ala Gly Gln Arg Leu Val Thr Lys Ala
340 345 350
Ser Ser Asp Leu Lys Phe Asp Val Phe Ala Thr Lys Gln Gly Arg Lys
355 360 365
Ile Lys Ile Ile Ala Gly Thr Arg Thr Val Gln Ala Lys Tyr Asn Ile
370 375 380
Lys Ile Ser Gly Leu Glu Val Ala Gly Leu Pro Lys Met Gly Thr Val
385 390 395 400
Lys Val Arg Thr Tyr Arg Phe Asp Trp Ala Gly Pro Asn Gly Lys Val
405 410 415
Asp Gly Pro Val Asp Leu Gly Glu Lys Lys Tyr Thr Tyr Ser Ala Asn
420 425 430
Thr Val Ser Ser Pro Ser Thr
435
<210> 43
<211> 1350
<212> DNA
<213> Fusarium verticillioides
<400> 43
atgtggctga cctccccatt gctgttcgcc agcaccctcc tgggcctcac tggcgttgct 60
ctagcagaca accccatcgt ccaagacatc tacaccgcag acccagcacc aatggtctac 120
aatggccgcg tctacctctt cacaggccat gacaacgacg gctctaccga cttcaacatg 180
acagactggc gtctcttctc gtcagcagac atggtcaact ggcagcacca tggtgtcccc 240
atgagcttaa agaccttcag ctgggccaac agcagagcct gggctggtca agtcgttgcc 300
cgaaacggaa agttttactt ctatgttcct gtccgtaatg ccaagacggg tggaatggct 360
attggtgtcg gtgttagtac caacatcctt gggccctaca ctgatgccct tggaaagcca 420
ttggtcgaga acaatgagat cgacccaact gtctacatcg acactgatgg ccaggcctat 480
ctctactggg gcaaccctgg attgtactac gtcaagctca accaagacat gctctcctac 540
agtggtagca tcaacaaagt atcgctcaca acagctggat tcggcagccg cccgaacaac 600
gcgcagcgtc ctactacttt cgaggaagga ccgtggctgt acaagcgtgg aaatctctac 660
tacatgatct acgcagccaa ctgctgttcc gaggacattc gctactcaac tggacccagc 720
gccactggac cttggactta ccgcggtgtc gtgatgaaca aggcgggtcg aagcttcacc 780
aaccatcctg gcatcatcga ctttgagaac aactcgtact tcttttacca caatggcgct 840
cttgatggag gtagcggtta tactcggtct gtggctgtcg agagcttcaa gtatggttcg 900
gacggtctga tccccgagat caagatgact acgcaaggcc cagcgcagct caagtctctg 960
aacccatatg tcaagcagga ggccgagact atcgcctggt ctgagggtat cgagactgag 1020
gtctgcagcg aaggtggtct caacgttgct ttcatcgaca atggtgacta catcaaggtc 1080
aagggagtcg actttggcag caccggtgca aagacgttca gcgcccgtgt tgcttccaac 1140
agcagcggag gcaagattga gcttcgactt ggtagcaaga ccggtaagtt ggttggtacc 1200
tgcacggtaa cgactacggg aaactggcag acttataaga ctgtggattg ccccgtcagt 1260
ggtgctactg gtacgagcga tctattcttt gtcttcacgg gctctgggtc tggctctctg 1320
ttcaacttca actggtggca gtttagctaa 1350
<210> 44
<211> 449
<212> PRT
<213> Fusarium verticillioides
<400> 44
Met Trp Leu Thr Ser Pro Leu Leu Phe Ala Ser Thr Leu Leu Gly Leu
1 5 10 15
Thr Gly Val Ala Leu Ala Asp Asn Pro Ile Val Gln Asp Ile Tyr Thr
20 25 30
Ala Asp Pro Ala Pro Met Val Tyr Asn Gly Arg Val Tyr Leu Phe Thr
35 40 45
Gly His Asp Asn Asp Gly Ser Thr Asp Phe Asn Met Thr Asp Trp Arg
50 55 60
Leu Phe Ser Ser Ala Asp Met Val Asn Trp Gln His His Gly Val Pro
65 70 75 80
Met Ser Leu Lys Thr Phe Ser Trp Ala Asn Ser Arg Ala Trp Ala Gly
85 90 95
Gln Val Val Ala Arg Asn Gly Lys Phe Tyr Phe Tyr Val Pro Val Arg
100 105 110
Asn Ala Lys Thr Gly Gly Met Ala Ile Gly Val Gly Val Ser Thr Asn
115 120 125
Ile Leu Gly Pro Tyr Thr Asp Ala Leu Gly Lys Pro Leu Val Glu Asn
130 135 140
Asn Glu Ile Asp Pro Thr Val Tyr Ile Asp Thr Asp Gly Gln Ala Tyr
145 150 155 160
Leu Tyr Trp Gly Asn Pro Gly Leu Tyr Tyr Val Lys Leu Asn Gln Asp
165 170 175
Met Leu Ser Tyr Ser Gly Ser Ile Asn Lys Val Ser Leu Thr Thr Ala
180 185 190
Gly Phe Gly Ser Arg Pro Asn Asn Ala Gln Arg Pro Thr Thr Phe Glu
195 200 205
Glu Gly Pro Trp Leu Tyr Lys Arg Gly Asn Leu Tyr Tyr Met Ile Tyr
210 215 220
Ala Ala Asn Cys Cys Ser Glu Asp Ile Arg Tyr Ser Thr Gly Pro Ser
225 230 235 240
Ala Thr Gly Pro Trp Thr Tyr Arg Gly Val Val Met Asn Lys Ala Gly
245 250 255
Arg Ser Phe Thr Asn His Pro Gly Ile Ile Asp Phe Glu Asn Asn Ser
260 265 270
Tyr Phe Phe Tyr His Asn Gly Ala Leu Asp Gly Gly Ser Gly Tyr Thr
275 280 285
Arg Ser Val Ala Val Glu Ser Phe Lys Tyr Gly Ser Asp Gly Leu Ile
290 295 300
Pro Glu Ile Lys Met Thr Thr Gln Gly Pro Ala Gln Leu Lys Ser Leu
305 310 315 320
Asn Pro Tyr Val Lys Gln Glu Ala Glu Thr Ile Ala Trp Ser Glu Gly
325 330 335
Ile Glu Thr Glu Val Cys Ser Glu Gly Gly Leu Asn Val Ala Phe Ile
340 345 350
Asp Asn Gly Asp Tyr Ile Lys Val Lys Gly Val Asp Phe Gly Ser Thr
355 360 365
Gly Ala Lys Thr Phe Ser Ala Arg Val Ala Ser Asn Ser Ser Gly Gly
370 375 380
Lys Ile Glu Leu Arg Leu Gly Ser Lys Thr Gly Lys Leu Val Gly Thr
385 390 395 400
Cys Thr Val Thr Thr Thr Gly Asn Trp Gln Thr Tyr Lys Thr Val Asp
405 410 415
Cys Pro Val Ser Gly Ala Thr Gly Thr Ser Asp Leu Phe Phe Val Phe
420 425 430
Thr Gly Ser Gly Ser Gly Ser Leu Phe Asn Phe Asn Trp Trp Gln Phe
435 440 445
Ser
<210> 45
<211> 1725
<212> DNA
<213> Fusarium verticillioides
<400> 45
atgcgcttct cttggctatt gtgccccctt ctagcgatgg gaagtgctct tcctgaaacg 60
aagacggatg tttcgacata caccaaccct gtccttccag gatggcactc ggatccatcg 120
tgtatccaga aagatggcct ctttctctgc gtcacttcaa cattcatctc cttcccaggt 180
cttcccgtct atgcctcaag ggatctagtc aactggcgtc tcatcagcca tgtctggaac 240
cgcgagaaac agttgcctgg cattagctgg aagacggcag gacagcaaca gggaatgtat 300
gcaccaacca ttcgatacca caagggaaca tactacgtca tctgcgaata cctgggcgtt 360
ggagatatta ttggtgtcat cttcaagacc accaatccgt gggacgagag tagctggagt 420
gaccctgtta ccttcaagcc aaatcacatc gaccccgatc tgttctggga tgatgacgga 480
aaggtttatt gtgctaccca tggcatcact ctgcaggaga ttgatttgga aactggagag 540
cttagcccgg agcttaatat ctggaacggc acaggaggtg tatggcctga gggtccccat 600
atctacaagc gcgacggtta ctactatctc atgattgccg agggtggaac tgccgaagac 660
cacgctatca caatcgctcg ggcccgcaag atcaccggcc cctatgaagc ctacaataac 720
aacccaatct tgaccaaccg cgggacatct gagtacttcc agactgtcgg tcacggtgat 780
ctgttccaag ataccaaggg caactggtgg ggtctttgtc ttgctactcg catcacagca 840
cagggagttt cacccatggg ccgtgaagct gttttgttca atggcacatg gaacaagggc 900
gaatggccca agttgcaacc agtacgaggt cgcatgcctg gaaacctcct cccaaagccg 960
acgcgaaacg ttcccggaga tgggcccttc aacgctgacc cagacaacta caacttgaag 1020
aagactaaga agatccctcc tcactttgtg caccatagag tcccaagaga cggtgccttc 1080
tctttgtctt ccaagggtct gcacatcgtg cctagtcgaa acaacgttac cggtagtgtg 1140
ttgccaggag atgagattga gctatcagga cagcgaggtc tagctttcat cggacgccgc 1200
caaactcaca ctctgttcaa atatagtgtt gatatcgact tcaagcccaa gtccgatgat 1260
caggaagctg gaatcaccgt tttccgcacg cagttcgacc atatcgatct tggcattgtt 1320
cgtcttccta caaaccaagg cagcaacaag aaatctaagc ttgccttccg attccgggcc 1380
acaggagctc agaatgttcc tgcaccgaag gtagtaccgg tccccgatgg ctgggagaag 1440
ggcgtaatca gtctacatat cgaggcagcc aacgcgacgc actacaacct tggagcttcg 1500
agccacagag gcaagactct cgacatcgcg acagcatcag caagtcttgt gagtggaggc 1560
acgggttcat ttgttggtag tttgcttgga ccttatgcta cctgcaacgg caaaggatct 1620
ggagtggaat gtcccaaggg aggtgatgtc tatgtgaccc aatggactta taagcccgtg 1680
gcacaagaga ttgatcatgg tgtttttgtg aaatcagaat tgtag 1725
<210> 46
<211> 574
<212> PRT
<213> Fusarium verticillioides
<400> 46
Met Arg Phe Ser Trp Leu Leu Cys Pro Leu Leu Ala Met Gly Ser Ala
1 5 10 15
Leu Pro Glu Thr Lys Thr Asp Val Ser Thr Tyr Thr Asn Pro Val Leu
20 25 30
Pro Gly Trp His Ser Asp Pro Ser Cys Ile Gln Lys Asp Gly Leu Phe
35 40 45
Leu Cys Val Thr Ser Thr Phe Ile Ser Phe Pro Gly Leu Pro Val Tyr
50 55 60
Ala Ser Arg Asp Leu Val Asn Trp Arg Leu Ile Ser His Val Trp Asn
65 70 75 80
Arg Glu Lys Gln Leu Pro Gly Ile Ser Trp Lys Thr Ala Gly Gln Gln
85 90 95
Gln Gly Met Tyr Ala Pro Thr Ile Arg Tyr His Lys Gly Thr Tyr Tyr
100 105 110
Val Ile Cys Glu Tyr Leu Gly Val Gly Asp Ile Ile Gly Val Ile Phe
115 120 125
Lys Thr Thr Asn Pro Trp Asp Glu Ser Ser Trp Ser Asp Pro Val Thr
130 135 140
Phe Lys Pro Asn His Ile Asp Pro Asp Leu Phe Trp Asp Asp Asp Gly
145 150 155 160
Lys Val Tyr Cys Ala Thr His Gly Ile Thr Leu Gln Glu Ile Asp Leu
165 170 175
Glu Thr Gly Glu Leu Ser Pro Glu Leu Asn Ile Trp Asn Gly Thr Gly
180 185 190
Gly Val Trp Pro Glu Gly Pro His Ile Tyr Lys Arg Asp Gly Tyr Tyr
195 200 205
Tyr Leu Met Ile Ala Glu Gly Gly Thr Ala Glu Asp His Ala Ile Thr
210 215 220
Ile Ala Arg Ala Arg Lys Ile Thr Gly Pro Tyr Glu Ala Tyr Asn Asn
225 230 235 240
Asn Pro Ile Leu Thr Asn Arg Gly Thr Ser Glu Tyr Phe Gln Thr Val
245 250 255
Gly His Gly Asp Leu Phe Gln Asp Thr Lys Gly Asn Trp Trp Gly Leu
260 265 270
Cys Leu Ala Thr Arg Ile Thr Ala Gln Gly Val Ser Pro Met Gly Arg
275 280 285
Glu Ala Val Leu Phe Asn Gly Thr Trp Asn Lys Gly Glu Trp Pro Lys
290 295 300
Leu Gln Pro Val Arg Gly Arg Met Pro Gly Asn Leu Leu Pro Lys Pro
305 310 315 320
Thr Arg Asn Val Pro Gly Asp Gly Pro Phe Asn Ala Asp Pro Asp Asn
325 330 335
Tyr Asn Leu Lys Lys Thr Lys Lys Ile Pro Pro His Phe Val His His
340 345 350
Arg Val Pro Arg Asp Gly Ala Phe Ser Leu Ser Ser Lys Gly Leu His
355 360 365
Ile Val Pro Ser Arg Asn Asn Val Thr Gly Ser Val Leu Pro Gly Asp
370 375 380
Glu Ile Glu Leu Ser Gly Gln Arg Gly Leu Ala Phe Ile Gly Arg Arg
385 390 395 400
Gln Thr His Thr Leu Phe Lys Tyr Ser Val Asp Ile Asp Phe Lys Pro
405 410 415
Lys Ser Asp Asp Gln Glu Ala Gly Ile Thr Val Phe Arg Thr Gln Phe
420 425 430
Asp His Ile Asp Leu Gly Ile Val Arg Leu Pro Thr Asn Gln Gly Ser
435 440 445
Asn Lys Lys Ser Lys Leu Ala Phe Arg Phe Arg Ala Thr Gly Ala Gln
450 455 460
Asn Val Pro Ala Pro Lys Val Val Pro Val Pro Asp Gly Trp Glu Lys
465 470 475 480
Gly Val Ile Ser Leu His Ile Glu Ala Ala Asn Ala Thr His Tyr Asn
485 490 495
Leu Gly Ala Ser Ser His Arg Gly Lys Thr Leu Asp Ile Ala Thr Ala
500 505 510
Ser Ala Ser Leu Val Ser Gly Gly Thr Gly Ser Phe Val Gly Ser Leu
515 520 525
Leu Gly Pro Tyr Ala Thr Cys Asn Gly Lys Gly Ser Gly Val Glu Cys
530 535 540
Pro Lys Gly Gly Asp Val Tyr Val Thr Gln Trp Thr Tyr Lys Pro Val
545 550 555 560
Ala Gln Glu Ile Asp His Gly Val Phe Val Lys Ser Glu Leu
565 570
<210> 47
<211> 2251
<212> DNA
<213> Podospora anserina
<400> 47
atgatccacc tcaagccagc cctcgcggcg ttgttggcgc tgtcgacgca atgtgtggct 60
attgatttgt ttgtcaagtc ttcggggggg aataagacga ctgatatcat gtatggtctt 120
atgcacgagg tatgtgtttt gcgagatctc ccttttgttt ttgcgcactg ctgacatgga 180
gactgcaaac aggatatcaa caactccggc gacggcggca tctacgccga gctaatctcc 240
aaccgcgcgt tccaagggag tgagaagttc ccctccaacc tcgacaactg gagccccgtc 300
ggtggcgcta cccttaccct tcagaagctt gccaagcccc tttcctctgc gttgccttac 360
tccgtcaatg ttgccaaccc caaggagggc aagggcaagg gcaaggacac caaggggaag 420
aaggttggct tggccaatgc tgggttttgg ggtatggatg tcaagaggca gaagtacact 480
ggtagcttcc acgttactgg tgagtacaag ggtgactttg aggttagctt gcgcagcgcg 540
attaccgggg agacctttgg caagaaggtg gtgaagggtg ggagtaagaa ggggaagtgg 600
accgagaagg agtttgagtt ggtgcctttc aaggatgcgc ccaacagcaa caacaccttt 660
gttgtgcagt gggatgccga ggtatgtgct tctttgatat tggctgagat agaagttggg 720
ttgacatgat gtggtgcagg gcgcaaagga cggatctttg gatctcaact tgatcagctt 780
gttccctccg acattcaagg gaaggaagaa tgggctgaga attgatcttg cgcagacgat 840
ggttgagctc aagccggtaa gtcctctcta gtcagaaaag tagagccttt gttaacgctt 900
gacagacctt cttgcgcttc cccggtggca acatgctcga gggtaacacc ttggacactt 960
ggtggaagtg gtacgagacc attggccctc tgaaggatcg cccgggcatg gctggtgtct 1020
gggagtacca gcaaaccctt ggcttgggtc tggtcgagta catggagtgg gccgatgaca 1080
tgaacttgga gcccagtatg tgatcccatt ttctggagtg acttctcttg ctaacgtatc 1140
cacagttgtc ggtgtcttcg ctggtcttgc cctcgatggc tcgttcgttc ccgaatccga 1200
gatgggatgg gtcatccaac aggctctcga cgaaatcgag ttcctcactg gcgatgctaa 1260
gaccaccaaa tggggtgccg tccgcgcgaa gcttggtcac cccaagcctt ggaaggtcaa 1320
gtgggttgag atcggtaacg aggattggct tgccggacgc cctgctggct tcgagtcgta 1380
catcaactac cgcttcccca tgatgatgaa ggccttcaac gaaaagtacc ccgacatcaa 1440
gatcatcgcc tcgccctcca tcttcgacaa catgacaatc cccgcgggtg ctgccggtga 1500
tcaccacccg tacctgactc ccgatgagtt cgttgagcga ttcgccaagt tcgataactt 1560
gagcaaggat aacgtgacgc tcatcggcga ggctgcgtcg acgcatccta acggtggtat 1620
cgcttgggag ggagatctca tgcccttgcc ttggtggggc ggcagtgttg ctgaggctat 1680
cttcttgatc agcactgaga gaaacggtga caagatcatc ggtgctactt acgcgcctgg 1740
tcttcgcagc ttggaccgct ggcaatggag catgacctgg gtgcagcatg ccgccgaccc 1800
ggccctcacc actcgctcga ccagttggta tgtctggaga atcctcgccc accacatcat 1860
ccgtgagacg ctcccggtcg atgccccggc cggcaagccc aactttgacc ctctgttcta 1920
cgttgccgga aagagcgaga gtggcaccgg tatcttcaag gctgccgtct acaactcgac 1980
tgaatcgatc ccggtgtcgt tgaagtttga tggtctcaac gagggagcgg ttgccaactt 2040
gacggtgctt actgggccgg aggatccgta tggatacaac gaccccttca ctggtatcaa 2100
tgttgtcaag gagaagacca ccttcatcaa ggccggaaag ggcggcaagt tcaccttcac 2160
cctgccgggc ttgagtgttg ctgtgttgga gacggccgac gcggtcaagg gtggcaaggg 2220
aaagggcaag ggcaagggaa agggtaactg a 2251
<210> 48
<211> 676
<212> PRT
<213> Podospora anserina
<400> 48
Met Ile His Leu Lys Pro Ala Leu Ala Ala Leu Leu Ala Leu Ser Thr
1 5 10 15
Gln Cys Val Ala Ile Asp Leu Phe Val Lys Ser Ser Gly Gly Asn Lys
20 25 30
Thr Thr Asp Ile Met Tyr Gly Leu Met His Glu Asp Ile Asn Asn Ser
35 40 45
Gly Asp Gly Gly Ile Tyr Ala Glu Leu Ile Ser Asn Arg Ala Phe Gln
50 55 60
Gly Ser Glu Lys Phe Pro Ser Asn Leu Asp Asn Trp Ser Pro Val Gly
65 70 75 80
Gly Ala Thr Leu Thr Leu Gln Lys Leu Ala Lys Pro Leu Ser Ser Ala
85 90 95
Leu Pro Tyr Ser Val Asn Val Ala Asn Pro Lys Glu Gly Lys Gly Lys
100 105 110
Gly Lys Asp Thr Lys Gly Lys Lys Val Gly Leu Ala Asn Ala Gly Phe
115 120 125
Trp Gly Met Asp Val Lys Arg Gln Lys Tyr Thr Gly Ser Phe His Val
130 135 140
Thr Gly Glu Tyr Lys Gly Asp Phe Glu Val Ser Leu Arg Ser Ala Ile
145 150 155 160
Thr Gly Glu Thr Phe Gly Lys Lys Val Val Lys Gly Gly Ser Lys Lys
165 170 175
Gly Lys Trp Thr Glu Lys Glu Phe Glu Leu Val Pro Phe Lys Asp Ala
180 185 190
Pro Asn Ser Asn Asn Thr Phe Val Val Gln Trp Asp Ala Glu Gly Ala
195 200 205
Lys Asp Gly Ser Leu Asp Leu Asn Leu Ile Ser Leu Phe Pro Pro Thr
210 215 220
Phe Lys Gly Arg Lys Asn Gly Leu Arg Ile Asp Leu Ala Gln Thr Met
225 230 235 240
Val Glu Leu Lys Pro Thr Phe Leu Arg Phe Pro Gly Gly Asn Met Leu
245 250 255
Glu Gly Asn Thr Leu Asp Thr Trp Trp Lys Trp Tyr Glu Thr Ile Gly
260 265 270
Pro Leu Lys Asp Arg Pro Gly Met Ala Gly Val Trp Glu Tyr Gln Gln
275 280 285
Thr Leu Gly Leu Gly Leu Val Glu Tyr Met Glu Trp Ala Asp Asp Met
290 295 300
Asn Leu Glu Pro Ile Val Gly Val Phe Ala Gly Leu Ala Leu Asp Gly
305 310 315 320
Ser Phe Val Pro Glu Ser Glu Met Gly Trp Val Ile Gln Gln Ala Leu
325 330 335
Asp Glu Ile Glu Phe Leu Thr Gly Asp Ala Lys Thr Thr Lys Trp Gly
340 345 350
Ala Val Arg Ala Lys Leu Gly His Pro Lys Pro Trp Lys Val Lys Trp
355 360 365
Val Glu Ile Gly Asn Glu Asp Trp Leu Ala Gly Arg Pro Ala Gly Phe
370 375 380
Glu Ser Tyr Ile Asn Tyr Arg Phe Pro Met Met Met Lys Ala Phe Asn
385 390 395 400
Glu Lys Tyr Pro Asp Ile Lys Ile Ile Ala Ser Pro Ser Ile Phe Asp
405 410 415
Asn Met Thr Ile Pro Ala Gly Ala Ala Gly Asp His His Pro Tyr Leu
420 425 430
Thr Pro Asp Glu Phe Val Glu Arg Phe Ala Lys Phe Asp Asn Leu Ser
435 440 445
Lys Asp Asn Val Thr Leu Ile Gly Glu Ala Ala Ser Thr His Pro Asn
450 455 460
Gly Gly Ile Ala Trp Glu Gly Asp Leu Met Pro Leu Pro Trp Trp Gly
465 470 475 480
Gly Ser Val Ala Glu Ala Ile Phe Leu Ile Ser Thr Glu Arg Asn Gly
485 490 495
Asp Lys Ile Ile Gly Ala Thr Tyr Ala Pro Gly Leu Arg Ser Leu Asp
500 505 510
Arg Trp Gln Trp Ser Met Thr Trp Val Gln His Ala Ala Asp Pro Ala
515 520 525
Leu Thr Thr Arg Ser Thr Ser Trp Tyr Val Trp Arg Ile Leu Ala His
530 535 540
His Ile Ile Arg Glu Thr Leu Pro Val Asp Ala Pro Ala Gly Lys Pro
545 550 555 560
Asn Phe Asp Pro Leu Phe Tyr Val Ala Gly Lys Ser Glu Ser Gly Thr
565 570 575
Gly Ile Phe Lys Ala Ala Val Tyr Asn Ser Thr Glu Ser Ile Pro Val
580 585 590
Ser Leu Lys Phe Asp Gly Leu Asn Glu Gly Ala Val Ala Asn Leu Thr
595 600 605
Val Leu Thr Gly Pro Glu Asp Pro Tyr Gly Tyr Asn Asp Pro Phe Thr
610 615 620
Gly Ile Asn Val Val Lys Glu Lys Thr Thr Phe Ile Lys Ala Gly Lys
625 630 635 640
Gly Gly Lys Phe Thr Phe Thr Leu Pro Gly Leu Ser Val Ala Val Leu
645 650 655
Glu Thr Ala Asp Ala Val Lys Gly Gly Lys Gly Lys Gly Lys Gly Lys
660 665 670
Gly Lys Gly Asn
675
<210> 49
<211> 1023
<212> DNA
<213> Gibberella zeae
<400> 49
atgaagtcca agttgttatt cccactcctc tctttcgttg gtcaaagtct tgccaccaac 60
gacgactgtc ctctcatcac tagtagatgg actgcggatc cttcggctca tgtctttaac 120
gacaccttgt ggctctaccc gtctcatgac atcgatgctg gatttgagaa tgatcctgat 180
ggaggccagt acgccatgag agattaccat gtctactcta tcgacaagat ctacggttcc 240
ctgccggtcg atcacggtac ggccctgtca gtggaggatg tcccctgggc ctctcgacag 300
atgtgggctc ctgacgctgc ccacaagaac ggcaaatact acctatactt ccctgccaaa 360
gacaaggatg atatcttcag aatcggcgtt gctgtctcac caacccccgg cggaccattc 420
gtccccgaca agagttggat ccctcacact ttcagcatcg accccgccag tttcgtcgat 480
gatgatgaca gagcctactt ggcatggggt ggtatcatgg gtggccagct tcaacgatgg 540
caggataaga acaagtacaa cgaatctggc actgagccag gaaacggcac cgctgccttg 600
agccctcaga ttgccaagct gagcaaggac atgcacactc tggcagagaa gcctcgcgac 660
atgctcattc ttgaccccaa gactggcaag ccgctccttt ctgaggatga agaccgacgc 720
ttcttcgaag gaccctggat tcacaagcgc aacaagattt actacctcac ctactctact 780
ggcacaaccc actatcttgt ctatgcgact tcaaagaccc cctatggtcc ttacacctac 840
cagggcagaa ttctggagcc agttgatggc tggactactc actctagtat cgtcaagtac 900
cagggtcagt ggtggctatt ttatcacgat gccaagacat ctggcaagga ctatcttcgc 960
caggtaaagg ctaagaagat ttggtacgat agcaaaggaa agatcttgac aaagaagcct 1020
tga 1023
<210> 50
<211> 340
<212> PRT
<213> Gibberella zeae
<400> 50
Met Lys Ser Lys Leu Leu Phe Pro Leu Leu Ser Phe Val Gly Gln Ser
1 5 10 15
Leu Ala Thr Asn Asp Asp Cys Pro Leu Ile Thr Ser Arg Trp Thr Ala
20 25 30
Asp Pro Ser Ala His Val Phe Asn Asp Thr Leu Trp Leu Tyr Pro Ser
35 40 45
His Asp Ile Asp Ala Gly Phe Glu Asn Asp Pro Asp Gly Gly Gln Tyr
50 55 60
Ala Met Arg Asp Tyr His Val Tyr Ser Ile Asp Lys Ile Tyr Gly Ser
65 70 75 80
Leu Pro Val Asp His Gly Thr Ala Leu Ser Val Glu Asp Val Pro Trp
85 90 95
Ala Ser Arg Gln Met Trp Ala Pro Asp Ala Ala His Lys Asn Gly Lys
100 105 110
Tyr Tyr Leu Tyr Phe Pro Ala Lys Asp Lys Asp Asp Ile Phe Arg Ile
115 120 125
Gly Val Ala Val Ser Pro Thr Pro Gly Gly Pro Phe Val Pro Asp Lys
130 135 140
Ser Trp Ile Pro His Thr Phe Ser Ile Asp Pro Ala Ser Phe Val Asp
145 150 155 160
Asp Asp Asp Arg Ala Tyr Leu Ala Trp Gly Gly Ile Met Gly Gly Gln
165 170 175
Leu Gln Arg Trp Gln Asp Lys Asn Lys Tyr Asn Glu Ser Gly Thr Glu
180 185 190
Pro Gly Asn Gly Thr Ala Ala Leu Ser Pro Gln Ile Ala Lys Leu Ser
195 200 205
Lys Asp Met His Thr Leu Ala Glu Lys Pro Arg Asp Met Leu Ile Leu
210 215 220
Asp Pro Lys Thr Gly Lys Pro Leu Leu Ser Glu Asp Glu Asp Arg Arg
225 230 235 240
Phe Phe Glu Gly Pro Trp Ile His Lys Arg Asn Lys Ile Tyr Tyr Leu
245 250 255
Thr Tyr Ser Thr Gly Thr Thr His Tyr Leu Val Tyr Ala Thr Ser Lys
260 265 270
Thr Pro Tyr Gly Pro Tyr Thr Tyr Gln Gly Arg Ile Leu Glu Pro Val
275 280 285
Asp Gly Trp Thr Thr His Ser Ser Ile Val Lys Tyr Gln Gly Gln Trp
290 295 300
Trp Leu Phe Tyr His Asp Ala Lys Thr Ser Gly Lys Asp Tyr Leu Arg
305 310 315 320
Gln Val Lys Ala Lys Lys Ile Trp Tyr Asp Ser Lys Gly Lys Ile Leu
325 330 335
Thr Lys Lys Pro
340
<210> 51
<211> 1047
<212> DNA
<213> Fusarium oxysporum
<400> 51
atgcagctca agtttctgtc ttcagcattg ctgttctctc tgaccagcaa atgcgctgcg 60
caagacacta atgacattcc tcccctgatc accgacctct ggtccgcaga tccctcggct 120
catgttttcg aaggcaagct ctgggtttac ccatctcacg acatcgaagc caatgttgtc 180
aacggcacag gaggcgctca atacgccatg agggattacc atacctactc catgaagagc 240
atctatggta aagatcccgt tgtcgaccac ggcgtcgctc tctcagtcga tgacgttccc 300
tgggcgaagc agcaaatgtg ggctcctgac gcagctcata agaacggcaa atattatctg 360
tacttccccg ccaaggacaa ggatgagatc ttcagaattg gagttgctgt ctccaacaag 420
cccagcggtc ctttcaaggc cgacaagagc tggatccctg gcacgtacag tatcgatcct 480
gctagctacg tcgacactga taacgaggcc tacctcatct ggggcggtat ctggggcggc 540
cagctccaag cctggcagga taaaaagaac tttaacgagt cgtggattgg agacaaggct 600
gctcctaacg gcaccaatgc cctatctcct cagatcgcca agctaagcaa ggacatgcac 660
aagatcaccg aaacaccccg cgatctcgtc attctcgccc ccgagacagg caagcctctt 720
caggctgagg acaacaagcg acgattcttc gagggccctt ggatccacaa gcgcggcaag 780
ctttactacc tcatgtactc caccggtgat acccacttcc ttgtctacgc tacttccaag 840
aacatctacg gtccttatac ctaccggggc aagattcttg atcctgttga tgggtggact 900
actcatggaa gtattgttga gtataaggga cagtggtggc ttttctttgc tgatgcgcat 960
acgtctggta aggattacct tcgacaggtg aaggcgagga agatctggta tgacaagaac 1020
ggcaagatct tgcttcaccg tccttag 1047
<210> 52
<211> 348
<212> PRT
<213> Fusarium oxysporum
<400> 52
Met Gln Leu Lys Phe Leu Ser Ser Ala Leu Leu Phe Ser Leu Thr Ser
1 5 10 15
Lys Cys Ala Ala Gln Asp Thr Asn Asp Ile Pro Pro Leu Ile Thr Asp
20 25 30
Leu Trp Ser Ala Asp Pro Ser Ala His Val Phe Glu Gly Lys Leu Trp
35 40 45
Val Tyr Pro Ser His Asp Ile Glu Ala Asn Val Val Asn Gly Thr Gly
50 55 60
Gly Ala Gln Tyr Ala Met Arg Asp Tyr His Thr Tyr Ser Met Lys Ser
65 70 75 80
Ile Tyr Gly Lys Asp Pro Val Val Asp His Gly Val Ala Leu Ser Val
85 90 95
Asp Asp Val Pro Trp Ala Lys Gln Gln Met Trp Ala Pro Asp Ala Ala
100 105 110
His Lys Asn Gly Lys Tyr Tyr Leu Tyr Phe Pro Ala Lys Asp Lys Asp
115 120 125
Glu Ile Phe Arg Ile Gly Val Ala Val Ser Asn Lys Pro Ser Gly Pro
130 135 140
Phe Lys Ala Asp Lys Ser Trp Ile Pro Gly Thr Tyr Ser Ile Asp Pro
145 150 155 160
Ala Ser Tyr Val Asp Thr Asp Asn Glu Ala Tyr Leu Ile Trp Gly Gly
165 170 175
Ile Trp Gly Gly Gln Leu Gln Ala Trp Gln Asp Lys Lys Asn Phe Asn
180 185 190
Glu Ser Trp Ile Gly Asp Lys Ala Ala Pro Asn Gly Thr Asn Ala Leu
195 200 205
Ser Pro Gln Ile Ala Lys Leu Ser Lys Asp Met His Lys Ile Thr Glu
210 215 220
Thr Pro Arg Asp Leu Val Ile Leu Ala Pro Glu Thr Gly Lys Pro Leu
225 230 235 240
Gln Ala Glu Asp Asn Lys Arg Arg Phe Phe Glu Gly Pro Trp Ile His
245 250 255
Lys Arg Gly Lys Leu Tyr Tyr Leu Met Tyr Ser Thr Gly Asp Thr His
260 265 270
Phe Leu Val Tyr Ala Thr Ser Lys Asn Ile Tyr Gly Pro Tyr Thr Tyr
275 280 285
Arg Gly Lys Ile Leu Asp Pro Val Asp Gly Trp Thr Thr His Gly Ser
290 295 300
Ile Val Glu Tyr Lys Gly Gln Trp Trp Leu Phe Phe Ala Asp Ala His
305 310 315 320
Thr Ser Gly Lys Asp Tyr Leu Arg Gln Val Lys Ala Arg Lys Ile Trp
325 330 335
Tyr Asp Lys Asn Gly Lys Ile Leu Leu His Arg Pro
340 345
<210> 53
<211> 1677
<212> DNA
<213> Aspergillus fumigatus
<400> 53
atggcagctc caagtttatc ctaccccaca ggtatccaat cgtataccaa tcctctcttc 60
cctggttggc actccgatcc cagctgtgcc tacgtagcgg agcaagacac ctttttctgc 120
gtgacgtcca ctttcattgc cttccccggt cttcctcttt atgcaagccg agatctgcag 180
aactggaaac tggcaagcaa tattttcaat cggcccagcc agatccctga tcttcgcgtc 240
acggatggac agcagtcggg tatctatgcg cccactctgc gctatcatga gggccagttc 300
tacttgatcg tttcgtacct gggcccgcag actaagggct tgctgttcac ctcgtctgat 360
ccgtacgacg atgccgcgtg gagcgatccg ctcgaattcg cggtacatgg catcgacccg 420
gatatcttct gggatcacga cgggacggtc tatgtcacgt ccgccgagga ccagatgatt 480
aagcagtaca cactcgatct gaagacgggg gcgattggcc cggttgacta cctctggaac 540
ggcaccggag gagtctggcc cgagggcccg cacatttaca agagagacgg atactactac 600
ctcatgatcg cagagggagg taccgagctc ggccactcgg agaccatggc gcgatctaga 660
acccggacag gtccctggga gccatacccg cacaatccgc tcttgtcgaa caagggcacc 720
tcggagtact tccagactgt gggccatgcg gacttgttcc aggatgggaa cggcaactgg 780
tgggccgtgg cgttgagcac ccgatcaggg cctgcatgga agaactatcc catgggtcgg 840
gagacggtgc tcgcccccgc cgcttgggag aagggtgagt ggcctgtcat tcagcctgtg 900
agaggccaaa tgcaggggcc gtttccacca ccaaataagc gagttcctcg cggcgagggc 960
ggatggatca agcaacccga caaagtggat ttcaggcccg gatcgaagat accggcgcac 1020
ttccagtact ggcgatatcc caagacagag gattttaccg tctcccctcg gggccacccg 1080
aatactcttc ggctcacacc ctccttttac aacctcaccg gaactgcgga cttcaagccg 1140
gatgatggcc tgtcgcttgt tatgcgcaaa cagaccgaca ccttgttcac gtacactgtg 1200
gacgtgtctt ttgaccccaa ggttgccgat gaagaggcgg gtgtgactgt tttccttacc 1260
cagcagcagc acatcgatct tggtattgtc cttctccaga caaccgaggg gctgtcgttg 1320
tccttccggt tccgcgtgga aggccgcggt aactacgaag gtcctcttcc agaagccacc 1380
gtgcctgttc ccaaggaatg gtgtggacag accatccggc ttgagattca ggccgtgagt 1440
gacaccgagt atgtctttgc ggctgccccg gctcggcacc ctgcacagag gcaaatcatc 1500
agccgcgcca actcgttgat tgtcagtggt gatacgggac ggtttactgg ctcgcttgtt 1560
ggcgtgtatg ccacgtcgaa cgggggtgcc ggatccacgc ccgcatatat cagcagatgg 1620
agatacgaag gacggggcca gatgattgat tttggtcgag tggtcccgag ctactga 1677
<210> 54
<211> 558
<212> PRT
<213> Aspergillus fumigatus
<400> 54
Met Ala Ala Pro Ser Leu Ser Tyr Pro Thr Gly Ile Gln Ser Tyr Thr
1 5 10 15
Asn Pro Leu Phe Pro Gly Trp His Ser Asp Pro Ser Cys Ala Tyr Val
20 25 30
Ala Glu Gln Asp Thr Phe Phe Cys Val Thr Ser Thr Phe Ile Ala Phe
35 40 45
Pro Gly Leu Pro Leu Tyr Ala Ser Arg Asp Leu Gln Asn Trp Lys Leu
50 55 60
Ala Ser Asn Ile Phe Asn Arg Pro Ser Gln Ile Pro Asp Leu Arg Val
65 70 75 80
Thr Asp Gly Gln Gln Ser Gly Ile Tyr Ala Pro Thr Leu Arg Tyr His
85 90 95
Glu Gly Gln Phe Tyr Leu Ile Val Ser Tyr Leu Gly Pro Gln Thr Lys
100 105 110
Gly Leu Leu Phe Thr Ser Ser Asp Pro Tyr Asp Asp Ala Ala Trp Ser
115 120 125
Asp Pro Leu Glu Phe Ala Val His Gly Ile Asp Pro Asp Ile Phe Trp
130 135 140
Asp His Asp Gly Thr Val Tyr Val Thr Ser Ala Glu Asp Gln Met Ile
145 150 155 160
Lys Gln Tyr Thr Leu Asp Leu Lys Thr Gly Ala Ile Gly Pro Val Asp
165 170 175
Tyr Leu Trp Asn Gly Thr Gly Gly Val Trp Pro Glu Gly Pro His Ile
180 185 190
Tyr Lys Arg Asp Gly Tyr Tyr Tyr Leu Met Ile Ala Glu Gly Gly Thr
195 200 205
Glu Leu Gly His Ser Glu Thr Met Ala Arg Ser Arg Thr Arg Thr Gly
210 215 220
Pro Trp Glu Pro Tyr Pro His Asn Pro Leu Leu Ser Asn Lys Gly Thr
225 230 235 240
Ser Glu Tyr Phe Gln Thr Val Gly His Ala Asp Leu Phe Gln Asp Gly
245 250 255
Asn Gly Asn Trp Trp Ala Val Ala Leu Ser Thr Arg Ser Gly Pro Ala
260 265 270
Trp Lys Asn Tyr Pro Met Gly Arg Glu Thr Val Leu Ala Pro Ala Ala
275 280 285
Trp Glu Lys Gly Glu Trp Pro Val Ile Gln Pro Val Arg Gly Gln Met
290 295 300
Gln Gly Pro Phe Pro Pro Pro Asn Lys Arg Val Pro Arg Gly Glu Gly
305 310 315 320
Gly Trp Ile Lys Gln Pro Asp Lys Val Asp Phe Arg Pro Gly Ser Lys
325 330 335
Ile Pro Ala His Phe Gln Tyr Trp Arg Tyr Pro Lys Thr Glu Asp Phe
340 345 350
Thr Val Ser Pro Arg Gly His Pro Asn Thr Leu Arg Leu Thr Pro Ser
355 360 365
Phe Tyr Asn Leu Thr Gly Thr Ala Asp Phe Lys Pro Asp Asp Gly Leu
370 375 380
Ser Leu Val Met Arg Lys Gln Thr Asp Thr Leu Phe Thr Tyr Thr Val
385 390 395 400
Asp Val Ser Phe Asp Pro Lys Val Ala Asp Glu Glu Ala Gly Val Thr
405 410 415
Val Phe Leu Thr Gln Gln Gln His Ile Asp Leu Gly Ile Val Leu Leu
420 425 430
Gln Thr Thr Glu Gly Leu Ser Leu Ser Phe Arg Phe Arg Val Glu Gly
435 440 445
Arg Gly Asn Tyr Glu Gly Pro Leu Pro Glu Ala Thr Val Pro Val Pro
450 455 460
Lys Glu Trp Cys Gly Gln Thr Ile Arg Leu Glu Ile Gln Ala Val Ser
465 470 475 480
Asp Thr Glu Tyr Val Phe Ala Ala Ala Pro Ala Arg His Pro Ala Gln
485 490 495
Arg Gln Ile Ile Ser Arg Ala Asn Ser Leu Ile Val Ser Gly Asp Thr
500 505 510
Gly Arg Phe Thr Gly Ser Leu Val Gly Val Tyr Ala Thr Ser Asn Gly
515 520 525
Gly Ala Gly Ser Thr Pro Ala Tyr Ile Ser Arg Trp Arg Tyr Glu Gly
530 535 540
Arg Gly Gln Met Ile Asp Phe Gly Arg Val Val Pro Ser Tyr
545 550 555
<210> 55
<211> 2320
<212> DNA
<213> Penicillium funiculosum
<400> 55
atgggaaaga tgtggcattc gatcttggtt gtgttgggct tattgtctgt cgggcatgcc 60
atcactatca acgtgtccca aagtggcggc aataagacca gtcctttgca atatggtctg 120
atgttcgagg taatccttct cttataccac atataaaagt tgcgtcattt ctaagacaag 180
tcaaggacat aaatcacggc ggtgatggcg gtctgtatgc agagcttgtt cgaaaccgag 240
cattccaagg tagcaccgtc tatccagcaa acctcgatgg atacgactcg gtcaatggag 300
caatcctagc gcttcagaat ttgacaaacc ctctatcacc ctccatgcct agctctctca 360
acgtcgccaa ggggtccaac aatggaagca tcggtttcgc aaatgaaggc tggtggggga 420
tagaagtcaa gccgcaaaga tacgcgggct cattctacgt ccagggggac tatcaaggag 480
atttcgacat ctctcttcag tcgaaattga cacaagaagt cttcgcaacg gcaaaagtca 540
ggtcctcggg caaacacgag gactgggttc aatacaagta cgagttggtg cccaaaaagg 600
cagcatcaaa caccaataac actctgacca ttacttttga ctcaaaggta tgttaaattt 660
tgggtttagt tcgatgtctg gcaattgtct tacgagaaac gtagggattg aaagacggat 720
ccttgaactt caacttgatc agcctatttc ccccaactta caacaatcgg cccaatggcc 780
taagaatcga cctggttgaa gctatggctg aactagaggg ggtaagctct tacaaatcaa 840
ctttatcttt acgaagacta atgtgaaaac ttagaaattt ctgcggtttc caggcggtag 900
cgatgtggaa ggtgtacaag ctccttactg gtataagtgg aatgaaacgg taggagatct 960
caaggaccgt tatagtaggc ccagtgcatg gacgtacgaa gaaagcaatg gaattggctt 1020
gattgagtac atgaattggt gtgatgacat ggggcttgag ccgagtgagt gtattccatt 1080
cagcgtcaaa tccagtgttc taatcataca catcagttct tgccgtatgg gatggacatt 1140
acctttcgaa cgaagtgata tcggaaaacg atttgcagcc atatatcgac gacaccctca 1200
accaactgga attcctgatg ggtgccccag atacgccata tggtagttgg cgtgcgtctc 1260
tgggctatcc gaagccgtgg acgattaact acgtcgagat tggaaacgaa gacaatctat 1320
acgggggact agaaacatac atcgcctacc ggtttcaggc atattacgac gctataacag 1380
ctaaatatcc ccatatgacg gtcatggaat ctttgacgga gatgcctggt ccggcggccg 1440
ctgcaagcga ttaccatcaa tattctactc ctgatgggtt tgtttcccag ttcaactact 1500
ttgatcagat gccagtcact aatagaacac tgaacggtat gaaaaccccc ccttttttaa 1560
atatgctttt aatggtatta accatctttc ataggagaga ttgcaaccgt ttatccaaat 1620
aatcctagta attcggtggc ctggggaagc ccattcccct tgtatccttg gtggattggg 1680
tccgttgcag aagctgtttt cctaattggt gaagagagga attcgccaaa gataatcggt 1740
gctagctacg tacggaattc tacttttcga gattttaaca ttggataaga aggactaacc 1800
tcaatacagg ctccaatgtt cagaaatatc aacaattggc agtggtctcc aacactcatc 1860
gcttttgacg ctgactcgtc gcgtacaagt cgttcaacaa gctggcatgt gatcaaggta 1920
tgctaatttt cctcctcatt caaacccgca gatgtgagct aactttccga agcttctctc 1980
gacaaacaaa atcacgcaaa atttacccac gacttggagt ggcggtgaca taggtccatt 2040
atactgggta gctggacgaa acgacaatac aggatcgaac atattcaagg ccgctgttta 2100
caacagcacc tcagacgtcc ctgtcaccgt tcaatttgca ggatgcaacg caaagagcgc 2160
aaatttgacc atcttgtcat ccgacgatcc gaacgcatcg aactaccctg gggggcccga 2220
agttgtgaag actgagatcc agtctgtcac tgcaaatgct catggagcat ttgagttcag 2280
tctcccgaac ctaagtgtgg ctgttctcaa aacggagtaa 2320
<210> 56
<211> 642
<212> PRT
<213> Penicillium funiculosum
<400> 56
Met Gly Lys Met Trp His Ser Ile Leu Val Val Leu Gly Leu Leu Ser
1 5 10 15
Val Gly His Ala Ile Thr Ile Asn Val Ser Gln Ser Gly Gly Asn Lys
20 25 30
Thr Ser Pro Leu Gln Tyr Gly Leu Met Phe Glu Asp Ile Asn His Gly
35 40 45
Gly Asp Gly Gly Leu Tyr Ala Glu Leu Val Arg Asn Arg Ala Phe Gln
50 55 60
Gly Ser Thr Val Tyr Pro Ala Asn Leu Asp Gly Tyr Asp Ser Val Asn
65 70 75 80
Gly Ala Ile Leu Ala Leu Gln Asn Leu Thr Asn Pro Leu Ser Pro Ser
85 90 95
Met Pro Ser Ser Leu Asn Val Ala Lys Gly Ser Asn Asn Gly Ser Ile
100 105 110
Gly Phe Ala Asn Glu Gly Trp Trp Gly Ile Glu Val Lys Pro Gln Arg
115 120 125
Tyr Ala Gly Ser Phe Tyr Val Gln Gly Asp Tyr Gln Gly Asp Phe Asp
130 135 140
Ile Ser Leu Gln Ser Lys Leu Thr Gln Glu Val Phe Ala Thr Ala Lys
145 150 155 160
Val Arg Ser Ser Gly Lys His Glu Asp Trp Val Gln Tyr Lys Tyr Glu
165 170 175
Leu Val Pro Lys Lys Ala Ala Ser Asn Thr Asn Asn Thr Leu Thr Ile
180 185 190
Thr Phe Asp Ser Lys Gly Leu Lys Asp Gly Ser Leu Asn Phe Asn Leu
195 200 205
Ile Ser Leu Phe Pro Pro Thr Tyr Asn Asn Arg Pro Asn Gly Leu Arg
210 215 220
Ile Asp Leu Val Glu Ala Met Ala Glu Leu Glu Gly Lys Phe Leu Arg
225 230 235 240
Phe Pro Gly Gly Ser Asp Val Glu Gly Val Gln Ala Pro Tyr Trp Tyr
245 250 255
Lys Trp Asn Glu Thr Val Gly Asp Leu Lys Asp Arg Tyr Ser Arg Pro
260 265 270
Ser Ala Trp Thr Tyr Glu Glu Ser Asn Gly Ile Gly Leu Ile Glu Tyr
275 280 285
Met Asn Trp Cys Asp Asp Met Gly Leu Glu Pro Ile Leu Ala Val Trp
290 295 300
Asp Gly His Tyr Leu Ser Asn Glu Val Ile Ser Glu Asn Asp Leu Gln
305 310 315 320
Pro Tyr Ile Asp Asp Thr Leu Asn Gln Leu Glu Phe Leu Met Gly Ala
325 330 335
Pro Asp Thr Pro Tyr Gly Ser Trp Arg Ala Ser Leu Gly Tyr Pro Lys
340 345 350
Pro Trp Thr Ile Asn Tyr Val Glu Ile Gly Asn Glu Asp Asn Leu Tyr
355 360 365
Gly Gly Leu Glu Thr Tyr Ile Ala Tyr Arg Phe Gln Ala Tyr Tyr Asp
370 375 380
Ala Ile Thr Ala Lys Tyr Pro His Met Thr Val Met Glu Ser Leu Thr
385 390 395 400
Glu Met Pro Gly Pro Ala Ala Ala Ala Ser Asp Tyr His Gln Tyr Ser
405 410 415
Thr Pro Asp Gly Phe Val Ser Gln Phe Asn Tyr Phe Asp Gln Met Pro
420 425 430
Val Thr Asn Arg Thr Leu Asn Gly Glu Ile Ala Thr Val Tyr Pro Asn
435 440 445
Asn Pro Ser Asn Ser Val Ala Trp Gly Ser Pro Phe Pro Leu Tyr Pro
450 455 460
Trp Trp Ile Gly Ser Val Ala Glu Ala Val Phe Leu Ile Gly Glu Glu
465 470 475 480
Arg Asn Ser Pro Lys Ile Ile Gly Ala Ser Tyr Ala Pro Met Phe Arg
485 490 495
Asn Ile Asn Asn Trp Gln Trp Ser Pro Thr Leu Ile Ala Phe Asp Ala
500 505 510
Asp Ser Ser Arg Thr Ser Arg Ser Thr Ser Trp His Val Ile Lys Leu
515 520 525
Leu Ser Thr Asn Lys Ile Thr Gln Asn Leu Pro Thr Thr Trp Ser Gly
530 535 540
Gly Asp Ile Gly Pro Leu Tyr Trp Val Ala Gly Arg Asn Asp Asn Thr
545 550 555 560
Gly Ser Asn Ile Phe Lys Ala Ala Val Tyr Asn Ser Thr Ser Asp Val
565 570 575
Pro Val Thr Val Gln Phe Ala Gly Cys Asn Ala Lys Ser Ala Asn Leu
580 585 590
Thr Ile Leu Ser Ser Asp Asp Pro Asn Ala Ser Asn Tyr Pro Gly Gly
595 600 605
Pro Glu Val Val Lys Thr Glu Ile Gln Ser Val Thr Ala Asn Ala His
610 615 620
Gly Ala Phe Glu Phe Ser Leu Pro Asn Leu Ser Val Ala Val Leu Lys
625 630 635 640
Thr Glu
<210> 57
<211> 739
<212> DNA
<213> Aspergillus fumigatus
<400> 57
atggtttctt tctcctacct gctgctggcg tgctccgcca ttggagctct ggctgccccc 60
gtcgaacccg agaccacctc gttcaatgag actgctcttc atgagttcgc tgagcgcgcc 120
ggcaccccaa gctccaccgg ctggaacaac ggctactact actccttctg gactgatggc 180
ggcggcgacg tgacctacac caatggcgcc ggtggctcgt actccgtcaa ctggaggaac 240
gtgggcaact ttgtcggtgg aaagggctgg aaccctggaa gcgctaggta ccgagctttg 300
tcaacgtcgg atgtgcagac ctgtggctga cagaagtaga accatcaact acggaggcag 360
cttcaacccc agcggcaatg gctacctggc tgtctacggc tggaccacca accccttgat 420
tgagtactac gttgttgagt cgtatggtac atacaacccc ggcagcggcg gtaccttcag 480
gggcactgtc aacaccgacg gtggcactta caacatctac acggccgttc gctacaatgc 540
tccctccatc gaaggcacca agaccttcac ccagtactgg tctgtgcgca cctccaagcg 600
taccggcggc actgtcacca tggccaacca cttcaacgcc tggagcagac tgggcatgaa 660
cctgggaact cacaactacc agattgtcgc cactgagggt taccagagca gcggatctgc 720
ttccatcact gtctactag 739
<210> 58
<211> 228
<212> PRT
<213> Aspergillus fumigatus
<400> 58
Met Val Ser Phe Ser Tyr Leu Leu Leu Ala Cys Ser Ala Ile Gly Ala
1 5 10 15
Leu Ala Ala Pro Val Glu Pro Glu Thr Thr Ser Phe Asn Glu Thr Ala
20 25 30
Leu His Glu Phe Ala Glu Arg Ala Gly Thr Pro Ser Ser Thr Gly Trp
35 40 45
Asn Asn Gly Tyr Tyr Tyr Ser Phe Trp Thr Asp Gly Gly Gly Asp Val
50 55 60
Thr Tyr Thr Asn Gly Ala Gly Gly Ser Tyr Ser Val Asn Trp Arg Asn
65 70 75 80
Val Gly Asn Phe Val Gly Gly Lys Gly Trp Asn Pro Gly Ser Ala Arg
85 90 95
Thr Ile Asn Tyr Gly Gly Ser Phe Asn Pro Ser Gly Asn Gly Tyr Leu
100 105 110
Ala Val Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr Tyr Val Val
115 120 125
Glu Ser Tyr Gly Thr Tyr Asn Pro Gly Ser Gly Gly Thr Phe Arg Gly
130 135 140
Thr Val Asn Thr Asp Gly Gly Thr Tyr Asn Ile Tyr Thr Ala Val Arg
145 150 155 160
Tyr Asn Ala Pro Ser Ile Glu Gly Thr Lys Thr Phe Thr Gln Tyr Trp
165 170 175
Ser Val Arg Thr Ser Lys Arg Thr Gly Gly Thr Val Thr Met Ala Asn
180 185 190
His Phe Asn Ala Trp Ser Arg Leu Gly Met Asn Leu Gly Thr His Asn
195 200 205
Tyr Gln Ile Val Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ala Ser
210 215 220
Ile Thr Val Tyr
225
<210> 59
<211> 1002
<212> DNA
<213> Aspergillus fumigatus
<400> 59
atgatctcca tttcctcgct cagctttgga ctcgccgcta tcgccggcgc atatgctctt 60
ccgagtgaca aatccgtcag cttagcggaa cgtcagacga tcacgaccag ccagacaggc 120
acaaacaatg gctactacta ttccttctgg accaacggtg ccggatcagt gcaatataca 180
aatggtgctg gtggcgaata tagtgtgacg tgggcgaacc agaacggtgg tgactttacc 240
tgtgggaagg gctggaatcc agggagtgac cagtaggcaa cgcccgagaa ctatagaaga 300
ggacgcaaag aaagcactaa actctctact agtgacatta ccttctctgg cagcttcaat 360
ccttccggaa atgcttacct gtccgtgtat ggatggacta ccaaccccct agtcgaatac 420
tacatcctcg agaactatgg cagttacaat cctggctcgg gcatgacgca caagggcacc 480
gtcaccagcg atggatccac ctacgacatc tatgagcacc aacaggtcaa ccagccttcg 540
atcgtcggca cggccacctt caaccaatac tggtccatcc gccaaaacaa gcgatccagc 600
ggcacagtca ccaccgcgaa tcacttcaag gcctgggcta gtctggggat gaacctgggt 660
acccataact atcagattgt ttccactgag ggatatgaga gcagcggtac ctcgaccatc 720
actgtctcgt ctggtggttc ttcttctggt ggaagtggtg gcagctcgtc tactacttcc 780
tcaggcagct cccctactgg tggctccggc agtgtaagtc ttcttccata tggttgtggc 840
tttatgtgta ttctgactgt gatagtgctc tgctttgtgg ggccagtgcg gtggaattgg 900
ctggtctggt cctacttgct gctcttcggg cacttgccag gtttcgaact cgtactactc 960
ccagtgcttg tagtaccttc ttgcagggtt atatccaagt ga 1002
<210> 60
<211> 286
<212> PRT
<213> Aspergillus fumigatus
<400> 60
Met Ile Ser Ile Ser Ser Leu Ser Phe Gly Leu Ala Ala Ile Ala Gly
1 5 10 15
Ala Tyr Ala Leu Pro Ser Asp Lys Ser Val Ser Leu Ala Glu Arg Gln
20 25 30
Thr Ile Thr Thr Ser Gln Thr Gly Thr Asn Asn Gly Tyr Tyr Tyr Ser
35 40 45
Phe Trp Thr Asn Gly Ala Gly Ser Val Gln Tyr Thr Asn Gly Ala Gly
50 55 60
Gly Glu Tyr Ser Val Thr Trp Ala Asn Gln Asn Gly Gly Asp Phe Thr
65 70 75 80
Cys Gly Lys Gly Trp Asn Pro Gly Ser Asp His Asp Ile Thr Phe Ser
85 90 95
Gly Ser Phe Asn Pro Ser Gly Asn Ala Tyr Leu Ser Val Tyr Gly Trp
100 105 110
Thr Thr Asn Pro Leu Val Glu Tyr Tyr Ile Leu Glu Asn Tyr Gly Ser
115 120 125
Tyr Asn Pro Gly Ser Gly Met Thr His Lys Gly Thr Val Thr Ser Asp
130 135 140
Gly Ser Thr Tyr Asp Ile Tyr Glu His Gln Gln Val Asn Gln Pro Ser
145 150 155 160
Ile Val Gly Thr Ala Thr Phe Asn Gln Tyr Trp Ser Ile Arg Gln Asn
165 170 175
Lys Arg Ser Ser Gly Thr Val Thr Thr Ala Asn His Phe Lys Ala Trp
180 185 190
Ala Ser Leu Gly Met Asn Leu Gly Thr His Asn Tyr Gln Ile Val Ser
195 200 205
Thr Glu Gly Tyr Glu Ser Ser Gly Thr Ser Thr Ile Thr Val Ser Ser
210 215 220
Gly Gly Ser Ser Ser Gly Gly Ser Gly Gly Ser Ser Ser Thr Thr Ser
225 230 235 240
Ser Gly Ser Ser Pro Thr Gly Gly Ser Gly Ser Cys Ser Ala Leu Trp
245 250 255
Gly Gln Cys Gly Gly Ile Gly Trp Ser Gly Pro Thr Cys Cys Ser Ser
260 265 270
Gly Thr Cys Gln Val Ser Asn Ser Tyr Tyr Ser Gln Cys Leu
275 280 285
<210> 61
<211> 1053
<212> DNA
<213> Fusarium verticillioides
<400> 61
atgcagctca agtttctgtc ttcagcattg ttgctgtctt tgaccggcaa ttgcgctgcg 60
caagacacta atgatatccc tcctctgatc accgacctct ggtctgcgga tccctcggct 120
catgttttcg agggcaaact ctgggtttac ccatctcacg acatcgaagc caatgtcgtc 180
aacggcaccg gaggcgctca gtacgccatg agagattatc acacctattc catgaagacc 240
atctatggaa aagatcccgt tatcgaccat ggcgtcgctc tgtcagtcga tgatgtccca 300
tgggccaagc agcaaatgtg ggctcctgac gcagcttaca agaacggcaa atattatctc 360
tacttccccg ccaaggataa agatgagatc ttcagaattg gagttgctgt ctccaacaag 420
cccagcggtc ctttcaaggc cgacaagagc tggatccccg gtacttacag tatcgatcct 480
gctagctatg tcgacactaa tggcgaggca tacctcatct ggggcggtat ctggggcggc 540
cagcttcagg cctggcagga tcacaagacc tttaatgagt cgtggctcgg cgacaaagct 600
gctcccaacg gcaccaacgc cctatctcct cagatcgcca agctaagcaa ggacatgcac 660
aagatcaccg agacaccccg cgatctcgtc atcctggccc ccgagacagg caagcccctt 720
caagcagagg acaataagcg acgatttttc gaggggccct gggttcacaa gcgcggcaag 780
ctgtactacc tcatgtactc taccggcgac acgcacttcc tcgtctacgc gacttccaag 840
aacatctacg gtccttatac ctatcagggc aagattctcg accctgttga tgggtggact 900
acgcatggaa gtattgttga gtacaaggga cagtggtggt tgttctttgc ggatgcgcat 960
acttctggaa aggattatct gagacaggtt aaggcgagga agatctggta tgacaaggat 1020
ggcaagattt tgcttactcg tcctaagatt tag 1053
<210> 62
<211> 350
<212> PRT
<213> Fusarium verticillioides
<400> 62
Met Gln Leu Lys Phe Leu Ser Ser Ala Leu Leu Leu Ser Leu Thr Gly
1 5 10 15
Asn Cys Ala Ala Gln Asp Thr Asn Asp Ile Pro Pro Leu Ile Thr Asp
20 25 30
Leu Trp Ser Ala Asp Pro Ser Ala His Val Phe Glu Gly Lys Leu Trp
35 40 45
Val Tyr Pro Ser His Asp Ile Glu Ala Asn Val Val Asn Gly Thr Gly
50 55 60
Gly Ala Gln Tyr Ala Met Arg Asp Tyr His Thr Tyr Ser Met Lys Thr
65 70 75 80
Ile Tyr Gly Lys Asp Pro Val Ile Asp His Gly Val Ala Leu Ser Val
85 90 95
Asp Asp Val Pro Trp Ala Lys Gln Gln Met Trp Ala Pro Asp Ala Ala
100 105 110
Tyr Lys Asn Gly Lys Tyr Tyr Leu Tyr Phe Pro Ala Lys Asp Lys Asp
115 120 125
Glu Ile Phe Arg Ile Gly Val Ala Val Ser Asn Lys Pro Ser Gly Pro
130 135 140
Phe Lys Ala Asp Lys Ser Trp Ile Pro Gly Thr Tyr Ser Ile Asp Pro
145 150 155 160
Ala Ser Tyr Val Asp Thr Asn Gly Glu Ala Tyr Leu Ile Trp Gly Gly
165 170 175
Ile Trp Gly Gly Gln Leu Gln Ala Trp Gln Asp His Lys Thr Phe Asn
180 185 190
Glu Ser Trp Leu Gly Asp Lys Ala Ala Pro Asn Gly Thr Asn Ala Leu
195 200 205
Ser Pro Gln Ile Ala Lys Leu Ser Lys Asp Met His Lys Ile Thr Glu
210 215 220
Thr Pro Arg Asp Leu Val Ile Leu Ala Pro Glu Thr Gly Lys Pro Leu
225 230 235 240
Gln Ala Glu Asp Asn Lys Arg Arg Phe Phe Glu Gly Pro Trp Val His
245 250 255
Lys Arg Gly Lys Leu Tyr Tyr Leu Met Tyr Ser Thr Gly Asp Thr His
260 265 270
Phe Leu Val Tyr Ala Thr Ser Lys Asn Ile Tyr Gly Pro Tyr Thr Tyr
275 280 285
Gln Gly Lys Ile Leu Asp Pro Val Asp Gly Trp Thr Thr His Gly Ser
290 295 300
Ile Val Glu Tyr Lys Gly Gln Trp Trp Leu Phe Phe Ala Asp Ala His
305 310 315 320
Thr Ser Gly Lys Asp Tyr Leu Arg Gln Val Lys Ala Arg Lys Ile Trp
325 330 335
Tyr Asp Lys Asp Gly Lys Ile Leu Leu Thr Arg Pro Lys Ile
340 345 350
<210> 63
<211> 1031
<212> DNA
<213> Penicillium funiculosum
<400> 63
atgagtcgca gcatccttcc gtacgcctct gttttcgccc tcctgggcgg ggctatcgcc 60
gaaccgtttt tggttctcaa tagcgatttt cccgatccca gtctcataga gacatccagc 120
ggatactatg cattcggtac caccggaaac ggagtcaatg cgcaggttgc ttcttcacca 180
gactttaata cctggacttt gctttccggc acagatgccc tcccgggacc atttccgtca 240
tgggtagctt cgtctccaca aatctgggcg ccagatgttt tggttaaggt atgttcttat 300
ggaataacag ttttaggagt aggtcagcca ggatattgac aaaattataa taggccgatg 360
gtacctatgt catgtacttt tcggcatctg ctgcgagtga ctcgggcaaa cactgcgttg 420
gtgccgcaac tgcgacctca ccggaaggac cttacacccc ggtcgatagc gctgttgcct 480
gtccattaga ccagggagga gctattgatg ccaatggatt tattgacacc gacggcacta 540
tatacgttgt atacaaaatt gatggaaaca gtctagacgg tgatggaacc acacatccta 600
cccccatcat gcttcaacaa atggaggcag acggaacaac cccaaccggc agcccaatcc 660
aactcattga ccgatccgac ctcgacggac ctttgatcga ggctcctagt ttgctcctct 720
ccaatggaat ctactacctc agtttctctt ccaactacta caacactaat tactacgaca 780
cttcatacgc ctatgcctcg tcgattactg gtccttggac caaacaatct gcgccttatg 840
cacccttgtt ggttactgga accgagacta gcaatgacgg cgcattgagc gcccctggtg 900
gtgccgattt ctccgtcgat ggcaccaaga tgttgttcca cgcaaacctc aatggacaag 960
atatctcggg cggacgcgcc ttatttgctg cgtcaattac tgaggccagc gatgtggtta 1020
cattgcagta g 1031
<210> 64
<211> 321
<212> PRT
<213> Penicillium funiculosum
<400> 64
Met Ser Arg Ser Ile Leu Pro Tyr Ala Ser Val Phe Ala Leu Leu Gly
1 5 10 15
Gly Ala Ile Ala Glu Pro Phe Leu Val Leu Asn Ser Asp Phe Pro Asp
20 25 30
Pro Ser Leu Ile Glu Thr Ser Ser Gly Tyr Tyr Ala Phe Gly Thr Thr
35 40 45
Gly Asn Gly Val Asn Ala Gln Val Ala Ser Ser Pro Asp Phe Asn Thr
50 55 60
Trp Thr Leu Leu Ser Gly Thr Asp Ala Leu Pro Gly Pro Phe Pro Ser
65 70 75 80
Trp Val Ala Ser Ser Pro Gln Ile Trp Ala Pro Asp Val Leu Val Lys
85 90 95
Ala Asp Gly Thr Tyr Val Met Tyr Phe Ser Ala Ser Ala Ala Ser Asp
100 105 110
Ser Gly Lys His Cys Val Gly Ala Ala Thr Ala Thr Ser Pro Glu Gly
115 120 125
Pro Tyr Thr Pro Val Asp Ser Ala Val Ala Cys Pro Leu Asp Gln Gly
130 135 140
Gly Ala Ile Asp Ala Asn Gly Phe Ile Asp Thr Asp Gly Thr Ile Tyr
145 150 155 160
Val Val Tyr Lys Ile Asp Gly Asn Ser Leu Asp Gly Asp Gly Thr Thr
165 170 175
His Pro Thr Pro Ile Met Leu Gln Gln Met Glu Ala Asp Gly Thr Thr
180 185 190
Pro Thr Gly Ser Pro Ile Gln Leu Ile Asp Arg Ser Asp Leu Asp Gly
195 200 205
Pro Leu Ile Glu Ala Pro Ser Leu Leu Leu Ser Asn Gly Ile Tyr Tyr
210 215 220
Leu Ser Phe Ser Ser Asn Tyr Tyr Asn Thr Asn Tyr Tyr Asp Thr Ser
225 230 235 240
Tyr Ala Tyr Ala Ser Ser Ile Thr Gly Pro Trp Thr Lys Gln Ser Ala
245 250 255
Pro Tyr Ala Pro Leu Leu Val Thr Gly Thr Glu Thr Ser Asn Asp Gly
260 265 270
Ala Leu Ser Ala Pro Gly Gly Ala Asp Phe Ser Val Asp Gly Thr Lys
275 280 285
Met Leu Phe His Ala Asn Leu Asn Gly Gln Asp Ile Ser Gly Gly Arg
290 295 300
Ala Leu Phe Ala Ala Ser Ile Thr Glu Ala Ser Asp Val Val Thr Leu
305 310 315 320
Gln
<210> 65
<211> 2186
<212> DNA
<213> Fusarium verticillioides
<400> 65
atggttcgct tcagttcaat cctagcggct gcggcttgct tcgtggctgt tgagtcagtc 60
aacatcaagg tcgacagcaa gggcggaaac gctactagcg gtcaccaata tggcttcctt 120
cacgaggttg gtattgacac accactggcg atgattggga tgctaacttg gagctaggat 180
atcaacaatt ccggtgatgg tggcatctac gctgagctca tccgcaatcg tgctttccag 240
tacagcaaga aataccctgt ttctctatct ggctggagac ccatcaacga tgctaagctc 300
tccctcaacc gtctcgacac tcctctctcc gacgctctcc ccgtttccat gaacgtgaag 360
cctggaaagg gcaaggccaa ggagattggt ttcctcaacg agggttactg gggaatggat 420
gtcaagaagc aaaagtacac tggctctttc tgggttaagg gcgcttacaa gggccacttt 480
acagcttctt tgcgatctaa ccttaccgac gatgtctttg gcagcgtcaa ggtcaagtcc 540
aaggccaaca agaagcagtg ggttgagcat gagtttgtgc ttactcctaa caagaatgcc 600
cctaacagca acaacacttt tgctatcacc tacgatccca aggtgagtaa caatcaaaac 660
tgggacgtga tgtatactga caatttgtag ggcgctgatg gagctcttga cttcaacctc 720
attagcttgt tccctcccac ctacaagggc cgcaagaacg gtcttcgagt tgatcttgcc 780
gaggctctcg aaggtctcca ccccgtaagg tttaccgtct cacgtgtatc gtgaacagtc 840
gctgacttgt agaaaagagc ctgctgcgct tccccggtgg taacatgctc gagggcaaca 900
ccaacaagac ctggtgggac tggaaggata ccctcggacc tctccgcaac cgtcctggtt 960
tcgagggtgt ctggaactac cagcagaccc atggtcttgg aatcttggag tacctccagt 1020
gggctgagga catgaacctt gaaatcagta ggttctataa aattcagtga cggttatgtg 1080
catgctaaca gatttcagtt gtcggtgtct acgctggcct ctccctcgac ggctccgtca 1140
cccccaagga ccaactccag cccctcatcg acgacgcgct cgacgagatc gaattcatcc 1200
gaggtcccgt cacttcaaag tggggaaaga agcgcgctga gctcggccac cccaagcctt 1260
tcagactctc ctacgttgaa gtcggaaacg aggactggct cgctggttat cccactggct 1320
ggaactctta caaggagtac cgcttcccca tgttcctcga ggctatcaag aaagctcacc 1380
ccgatctcac cgtcatctcc tctggtgctt ctattgaccc cgttggtaag aaggatgctg 1440
gtttcgatat tcctgctcct ggaatcggtg actaccaccc ttaccgcgag cctgatgttc 1500
ttgttgagga gttcaacctg tttgataaca ataagtatgg tcacatcatt ggtgaggttg 1560
cttctaccca ccccaacggt ggaactggct ggagtggtaa ccttatgcct tacccctggt 1620
ggatctctgg tgttggcgag gccgtcgctc tctgcggtta tgagcgcaac gccgatcgta 1680
ttcccggaac attctacgct cctatcctca agaacgagaa ccgttggcag tgggctatca 1740
ccatgatcca attcgccgcc gactccgcca tgaccacccg ctccaccagc tggtatgtct 1800
ggtcactctt cgcaggccac cccatgaccc atactctccc caccaccgcc gacttcgacc 1860
ccctctacta cgtcgctggt aagaacgagg acaagggaac tcttatctgg aagggtgctg 1920
cgtataacac caccaagggt gctgacgttc ccgtgtctct gtccttcaag ggtgtcaagc 1980
ccggtgctca agctgagctt actcttctga ccaacaagga gaaggatcct tttgcgttca 2040
atgatcctca caagggcaac aatgttgttg atactaagaa gactgttctc aaggccgatg 2100
gaaagggtgc tttcaacttc aagcttccta acctgagcgt cgctgttctt gagaccctca 2160
agaagggaaa gccttactct agctag 2186
<210> 66
<211> 660
<212> PRT
<213> Fusarium verticillioides
<400> 66
Met Val Arg Phe Ser Ser Ile Leu Ala Ala Ala Ala Cys Phe Val Ala
1 5 10 15
Val Glu Ser Val Asn Ile Lys Val Asp Ser Lys Gly Gly Asn Ala Thr
20 25 30
Ser Gly His Gln Tyr Gly Phe Leu His Glu Asp Ile Asn Asn Ser Gly
35 40 45
Asp Gly Gly Ile Tyr Ala Glu Leu Ile Arg Asn Arg Ala Phe Gln Tyr
50 55 60
Ser Lys Lys Tyr Pro Val Ser Leu Ser Gly Trp Arg Pro Ile Asn Asp
65 70 75 80
Ala Lys Leu Ser Leu Asn Arg Leu Asp Thr Pro Leu Ser Asp Ala Leu
85 90 95
Pro Val Ser Met Asn Val Lys Pro Gly Lys Gly Lys Ala Lys Glu Ile
100 105 110
Gly Phe Leu Asn Glu Gly Tyr Trp Gly Met Asp Val Lys Lys Gln Lys
115 120 125
Tyr Thr Gly Ser Phe Trp Val Lys Gly Ala Tyr Lys Gly His Phe Thr
130 135 140
Ala Ser Leu Arg Ser Asn Leu Thr Asp Asp Val Phe Gly Ser Val Lys
145 150 155 160
Val Lys Ser Lys Ala Asn Lys Lys Gln Trp Val Glu His Glu Phe Val
165 170 175
Leu Thr Pro Asn Lys Asn Ala Pro Asn Ser Asn Asn Thr Phe Ala Ile
180 185 190
Thr Tyr Asp Pro Lys Gly Ala Asp Gly Ala Leu Asp Phe Asn Leu Ile
195 200 205
Ser Leu Phe Pro Pro Thr Tyr Lys Gly Arg Lys Asn Gly Leu Arg Val
210 215 220
Asp Leu Ala Glu Ala Leu Glu Gly Leu His Pro Ser Leu Leu Arg Phe
225 230 235 240
Pro Gly Gly Asn Met Leu Glu Gly Asn Thr Asn Lys Thr Trp Trp Asp
245 250 255
Trp Lys Asp Thr Leu Gly Pro Leu Arg Asn Arg Pro Gly Phe Glu Gly
260 265 270
Val Trp Asn Tyr Gln Gln Thr His Gly Leu Gly Ile Leu Glu Tyr Leu
275 280 285
Gln Trp Ala Glu Asp Met Asn Leu Glu Ile Ile Val Gly Val Tyr Ala
290 295 300
Gly Leu Ser Leu Asp Gly Ser Val Thr Pro Lys Asp Gln Leu Gln Pro
305 310 315 320
Leu Ile Asp Asp Ala Leu Asp Glu Ile Glu Phe Ile Arg Gly Pro Val
325 330 335
Thr Ser Lys Trp Gly Lys Lys Arg Ala Glu Leu Gly His Pro Lys Pro
340 345 350
Phe Arg Leu Ser Tyr Val Glu Val Gly Asn Glu Asp Trp Leu Ala Gly
355 360 365
Tyr Pro Thr Gly Trp Asn Ser Tyr Lys Glu Tyr Arg Phe Pro Met Phe
370 375 380
Leu Glu Ala Ile Lys Lys Ala His Pro Asp Leu Thr Val Ile Ser Ser
385 390 395 400
Gly Ala Ser Ile Asp Pro Val Gly Lys Lys Asp Ala Gly Phe Asp Ile
405 410 415
Pro Ala Pro Gly Ile Gly Asp Tyr His Pro Tyr Arg Glu Pro Asp Val
420 425 430
Leu Val Glu Glu Phe Asn Leu Phe Asp Asn Asn Lys Tyr Gly His Ile
435 440 445
Ile Gly Glu Val Ala Ser Thr His Pro Asn Gly Gly Thr Gly Trp Ser
450 455 460
Gly Asn Leu Met Pro Tyr Pro Trp Trp Ile Ser Gly Val Gly Glu Ala
465 470 475 480
Val Ala Leu Cys Gly Tyr Glu Arg Asn Ala Asp Arg Ile Pro Gly Thr
485 490 495
Phe Tyr Ala Pro Ile Leu Lys Asn Glu Asn Arg Trp Gln Trp Ala Ile
500 505 510
Thr Met Ile Gln Phe Ala Ala Asp Ser Ala Met Thr Thr Arg Ser Thr
515 520 525
Ser Trp Tyr Val Trp Ser Leu Phe Ala Gly His Pro Met Thr His Thr
530 535 540
Leu Pro Thr Thr Ala Asp Phe Asp Pro Leu Tyr Tyr Val Ala Gly Lys
545 550 555 560
Asn Glu Asp Lys Gly Thr Leu Ile Trp Lys Gly Ala Ala Tyr Asn Thr
565 570 575
Thr Lys Gly Ala Asp Val Pro Val Ser Leu Ser Phe Lys Gly Val Lys
580 585 590
Pro Gly Ala Gln Ala Glu Leu Thr Leu Leu Thr Asn Lys Glu Lys Asp
595 600 605
Pro Phe Ala Phe Asn Asp Pro His Lys Gly Asn Asn Val Val Asp Thr
610 615 620
Lys Lys Thr Val Leu Lys Ala Asp Gly Lys Gly Ala Phe Asn Phe Lys
625 630 635 640
Leu Pro Asn Leu Ser Val Ala Val Leu Glu Thr Leu Lys Lys Gly Lys
645 650 655
Pro Tyr Ser Ser
660
<210> 67
<211> 2312
<212> DNA
<213> Chaetomium globosum
<400> 67
atggcgcccc tttcgcttcg ggccctctcg ctgctcgcgc tcacaggagc cgcagccgcg 60
gtgaccctat cggtcgcgaa ctctggcggt aatgatacgt ctccgtacat gtatggcatc 120
atgttcgagg acatcaatca gagcggtgac ggcgggctgt aagttctgtc gcggcttccc 180
ctgacaagct tgcatgatgc ttaactaaag tccttaggta cgccgagctg attcgcaacc 240
gagccttcca taatagctcc ctccaggcct ggaccgccgt gggggacagc actctcgagg 300
tcgtaacctc tgcaccgtta tcggatgccc tgcctcgctc ggtcaaggtc acgagtggaa 360
agggcaaggc gggcttgaag aatgccggct actggggaat ggacgtccag aagaccgaca 420
agtatagcgg cagcttctac tcgtacggcg cctacgacgg aaagtttacc ctctctctgg 480
tgtcggacat cacaaatgag accctggcca ccaccaagat caagtccagg tcggtggagc 540
atgcctggac cgagcacaag ttcgagcttc tcccgaccaa gagcgcggcg aacagcaaca 600
acagcttcgt gctggagttc cgcccctgcc accagacgga gctccagttc aacctcatca 660
gcttgttccc gccgacgtat aagaacaggc ccaacggcat gcgccgagag ctcatggaga 720
agctcgcaga cctcaagccc agtttccttc ggattccagg aggcaacaac ctgtaagtgc 780
ttccggcgaa actagcagta gttgcctgag agacactaat ctcagcgaac aacagcgagg 840
gcaactatgc tggcaactac tggaactggt caagcacact tggcccgctg accgaccggc 900
ccggtcgtga cggcgtgtgg acgtacgcca acacggacgg catcgggctg gtcgagtaca 960
tgcactgggc cgaggacctc gacgtggagg ttgtgctggc ggtcgccgca ggcctgtacc 1020
tgaacggcga tgtggtcccg gaggaggagc tgcacgtctt cgtggaggat gcgctgaacg 1080
agctcgagtt cctcatgggc gacgtctcga ccccttgggg cgcgcgccgc gctaagctcg 1140
gctaccccaa gccgtggaac atcaagttcg tcgaggtcgg caacgaggac aacctgtggg 1200
gcggcctcga ctcgtacaag agctaccggc tgaagacttt ctacgacgcc atcaaggcga 1260
agtaccccga catctccatc ttttcgtcga ccgacgagtt tgtgtacaag gagtcgggcc 1320
aggactacca caagtacacc cggccggact actccgtgtc ccagttcgac ctgtttgaca 1380
actgggccga cggccacccc atcatcatcg gagagtgagt gaacggcgac ccccacctcc 1440
ccctaacgcg ggatcgcgag ctgatagatc accccaggta tgcgaccatc cagaacaaca 1500
cgggcaagct cgaggacacg gactgggacg cgcccaagaa caagtggtcc aactggatcg 1560
gctccgtcgc cgaggccgtc ttcatcctcg gagccgagcg caacggcgac cgggtctggg 1620
gcaccacctt tgcgccgatc ctccagaacc tcaacagcta ccaatgggct gtaagtacat 1680
acatacatac cgcaccccca accccaaccc ccccaaagcg cacctccacc cacccaccca 1740
aacacaccac aactacctag ctaacccgcc acacaaacaa acagcccgac ctaatctcct 1800
tcaccgccaa cccggccgac accacgccca gcgtctcgta cccgatcatc cagctgctcg 1860
cctcgcaccg catcacgcac accctccccg tcagcagcgc cgacgccttc ggcccggcct 1920
actgggtggc cggtcgcggc gccgacgacg gctcgtacat cctcaaggcg gccgtgtaca 1980
acagcacggg gggtgcggat gtaccggtga gggtgcagtt tgaggcgggg ggtggtggtg 2040
gtggtggtgg tggtggtggt ggtggtggtg gtgatgggaa ggggaagggt aaagggaagg 2100
gaggggaggg tggtgagggt gtgaagaagg gtgaccgcgc gcagttgacc gtgttgacgg 2160
cgccggaggg gccctgggcg cataatacgc cggagaataa gggggcggtc aagacgacag 2220
tgacgacgtt gaaggccggg aggggtgggg tgtttgagtt tagtctgccg gatttgtcgg 2280
tggcggtgtt ggtggtggag ggggagaagt ga 2312
<210> 68
<211> 670
<212> PRT
<213> Chaetomium globosum
<400> 68
Met Ala Pro Leu Ser Leu Arg Ala Leu Ser Leu Leu Ala Leu Thr Gly
1 5 10 15
Ala Ala Ala Ala Val Thr Leu Ser Val Ala Asn Ser Gly Gly Asn Asp
20 25 30
Thr Ser Pro Tyr Met Tyr Gly Ile Met Phe Glu Asp Ile Asn Gln Ser
35 40 45
Gly Asp Gly Gly Leu Tyr Ala Glu Leu Ile Arg Asn Arg Ala Phe His
50 55 60
Asn Ser Ser Leu Gln Ala Trp Thr Ala Val Gly Asp Ser Thr Leu Glu
65 70 75 80
Val Val Thr Ser Ala Pro Leu Ser Asp Ala Leu Pro Arg Ser Val Lys
85 90 95
Val Thr Ser Gly Lys Gly Lys Ala Gly Leu Lys Asn Ala Gly Tyr Trp
100 105 110
Gly Met Asp Val Gln Lys Thr Asp Lys Tyr Ser Gly Ser Phe Tyr Ser
115 120 125
Tyr Gly Ala Tyr Asp Gly Lys Phe Thr Leu Ser Leu Val Ser Asp Ile
130 135 140
Thr Asn Glu Thr Leu Ala Thr Thr Lys Ile Lys Ser Arg Ser Val Glu
145 150 155 160
His Ala Trp Thr Glu His Lys Phe Glu Leu Leu Pro Thr Lys Ser Ala
165 170 175
Ala Asn Ser Asn Asn Ser Phe Val Leu Glu Phe Arg Pro Cys His Gln
180 185 190
Thr Glu Leu Gln Phe Asn Leu Ile Ser Leu Phe Pro Pro Thr Tyr Lys
195 200 205
Asn Arg Pro Asn Gly Met Arg Arg Glu Leu Met Glu Lys Leu Ala Asp
210 215 220
Leu Lys Pro Ser Phe Leu Arg Ile Pro Gly Gly Asn Asn Leu Glu Gly
225 230 235 240
Asn Tyr Ala Gly Asn Tyr Trp Asn Trp Ser Ser Thr Leu Gly Pro Leu
245 250 255
Thr Asp Arg Pro Gly Arg Asp Gly Val Trp Thr Tyr Ala Asn Thr Asp
260 265 270
Gly Ile Gly Leu Val Glu Tyr Met His Trp Ala Glu Asp Leu Asp Val
275 280 285
Glu Val Val Leu Ala Val Ala Ala Gly Leu Tyr Leu Asn Gly Asp Val
290 295 300
Val Pro Glu Glu Glu Leu His Val Phe Val Glu Asp Ala Leu Asn Glu
305 310 315 320
Leu Glu Phe Leu Met Gly Asp Val Ser Thr Pro Trp Gly Ala Arg Arg
325 330 335
Ala Lys Leu Gly Tyr Pro Lys Pro Trp Asn Ile Lys Phe Val Glu Val
340 345 350
Gly Asn Glu Asp Asn Leu Trp Gly Gly Leu Asp Ser Tyr Lys Ser Tyr
355 360 365
Arg Leu Lys Thr Phe Tyr Asp Ala Ile Lys Ala Lys Tyr Pro Asp Ile
370 375 380
Ser Ile Phe Ser Ser Thr Asp Glu Phe Val Tyr Lys Glu Ser Gly Gln
385 390 395 400
Asp Tyr His Lys Tyr Thr Arg Pro Asp Tyr Ser Val Ser Gln Phe Asp
405 410 415
Leu Phe Asp Asn Trp Ala Asp Gly His Pro Ile Ile Ile Gly Glu Tyr
420 425 430
Ala Thr Ile Gln Asn Asn Thr Gly Lys Leu Glu Asp Thr Asp Trp Asp
435 440 445
Ala Pro Lys Asn Lys Trp Ser Asn Trp Ile Gly Ser Val Ala Glu Ala
450 455 460
Val Phe Ile Leu Gly Ala Glu Arg Asn Gly Asp Arg Val Trp Gly Thr
465 470 475 480
Thr Phe Ala Pro Ile Leu Gln Asn Leu Asn Ser Tyr Gln Trp Ala Pro
485 490 495
Asp Leu Ile Ser Phe Thr Ala Asn Pro Ala Asp Thr Thr Pro Ser Val
500 505 510
Ser Tyr Pro Ile Ile Gln Leu Leu Ala Ser His Arg Ile Thr His Thr
515 520 525
Leu Pro Val Ser Ser Ala Asp Ala Phe Gly Pro Ala Tyr Trp Val Ala
530 535 540
Gly Arg Gly Ala Asp Asp Gly Ser Tyr Ile Leu Lys Ala Ala Val Tyr
545 550 555 560
Asn Ser Thr Gly Gly Ala Asp Val Pro Val Arg Val Gln Phe Glu Ala
565 570 575
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Asp
580 585 590
Gly Lys Gly Lys Gly Lys Gly Lys Gly Gly Glu Gly Gly Glu Gly Val
595 600 605
Lys Lys Gly Asp Arg Ala Gln Leu Thr Val Leu Thr Ala Pro Glu Gly
610 615 620
Pro Trp Ala His Asn Thr Pro Glu Asn Lys Gly Ala Val Lys Thr Thr
625 630 635 640
Val Thr Thr Leu Lys Ala Gly Arg Gly Gly Val Phe Glu Phe Ser Leu
645 650 655
Pro Asp Leu Ser Val Ala Val Leu Val Val Glu Gly Glu Lys
660 665 670
<210> 69
<211> 1002
<212> DNA
<213> Fusarium verticillioides
<400> 69
atgcgtcttc tatcgtttcc cagccatctc ctcgtggcct tcctaaccct caaagaggct 60
tcatccctcg ccctcagcaa acgggatagc cctgtcctcc ccggcctctg ggcggacccc 120
aacatcgcca tcgtcgacaa gacatactac atcttcccta ccaccgacgg tttcgaaggc 180
tggggcggca acgtcttcta ctggtggaaa tcaaaagatc tcgtatcatg gacaaagagc 240
gacaagccat tccttactct caatggtacg aatggcaacg ttccctgggc tacaggtaat 300
gcctgggctc ctgctttcgc tgctcgcgga ggcaagtatt acttctacca tagtgggaat 360
aatccctctg tgagtgatgg gcataagagt attggtgcgg cggtggctga tcatcctgag 420
gggccgtgga aggcacagga taagccgatg atcaagggaa cttctgatga ggagattgtc 480
agcaaccagg ctatcgatcc cgctgccttt gaagaccctg agactggaaa gtggtatatc 540
tactggggaa acggtgtccc cattgtcgca gagctcaacg acgacatggt ctctctcaaa 600
gcaggctggc acaaaatcac aggtcttcag aatttccgcg agggtctttt cgtcaactat 660
cgcgatggaa catatcatct gacatactct atcgacgata cgggctcaga gaactatcgc 720
gttgggtacg ctacggcgga taaccccatt ggaccttgga catatcgtgg tgttcttctg 780
gagaaggacg aatcgaaggg cattcttgct acgggacata actccatcat caacattcct 840
ggaacggatg agtggtatat cgcgtatcat cgcttccata ttcccgatgg aaatgggtat 900
aatagggaga ctacgattga tagggtaccc atcgacaagg atacgggttt gtttggaaag 960
gttacgccga ctttgcagag tgttgatcct aggcctttgt ag 1002
<210> 70
<211> 333
<212> PRT
<213> Fusarium verticillioides
<400> 70
Met Arg Leu Leu Ser Phe Pro Ser His Leu Leu Val Ala Phe Leu Thr
1 5 10 15
Leu Lys Glu Ala Ser Ser Leu Ala Leu Ser Lys Arg Asp Ser Pro Val
20 25 30
Leu Pro Gly Leu Trp Ala Asp Pro Asn Ile Ala Ile Val Asp Lys Thr
35 40 45
Tyr Tyr Ile Phe Pro Thr Thr Asp Gly Phe Glu Gly Trp Gly Gly Asn
50 55 60
Val Phe Tyr Trp Trp Lys Ser Lys Asp Leu Val Ser Trp Thr Lys Ser
65 70 75 80
Asp Lys Pro Phe Leu Thr Leu Asn Gly Thr Asn Gly Asn Val Pro Trp
85 90 95
Ala Thr Gly Asn Ala Trp Ala Pro Ala Phe Ala Ala Arg Gly Gly Lys
100 105 110
Tyr Tyr Phe Tyr His Ser Gly Asn Asn Pro Ser Val Ser Asp Gly His
115 120 125
Lys Ser Ile Gly Ala Ala Val Ala Asp His Pro Glu Gly Pro Trp Lys
130 135 140
Ala Gln Asp Lys Pro Met Ile Lys Gly Thr Ser Asp Glu Glu Ile Val
145 150 155 160
Ser Asn Gln Ala Ile Asp Pro Ala Ala Phe Glu Asp Pro Glu Thr Gly
165 170 175
Lys Trp Tyr Ile Tyr Trp Gly Asn Gly Val Pro Ile Val Ala Glu Leu
180 185 190
Asn Asp Asp Met Val Ser Leu Lys Ala Gly Trp His Lys Ile Thr Gly
195 200 205
Leu Gln Asn Phe Arg Glu Gly Leu Phe Val Asn Tyr Arg Asp Gly Thr
210 215 220
Tyr His Leu Thr Tyr Ser Ile Asp Asp Thr Gly Ser Glu Asn Tyr Arg
225 230 235 240
Val Gly Tyr Ala Thr Ala Asp Asn Pro Ile Gly Pro Trp Thr Tyr Arg
245 250 255
Gly Val Leu Leu Glu Lys Asp Glu Ser Lys Gly Ile Leu Ala Thr Gly
260 265 270
His Asn Ser Ile Ile Asn Ile Pro Gly Thr Asp Glu Trp Tyr Ile Ala
275 280 285
Tyr His Arg Phe His Ile Pro Asp Gly Asn Gly Tyr Asn Arg Glu Thr
290 295 300
Thr Ile Asp Arg Val Pro Ile Asp Lys Asp Thr Gly Leu Phe Gly Lys
305 310 315 320
Val Thr Pro Thr Leu Gln Ser Val Asp Pro Arg Pro Leu
325 330
<210> 71
<211> 1695
<212> DNA
<213> Fusarium verticillioides
<400> 71
atgctcttct cgctcgttct tcctaccctt gcctttcaag ccagcctggc gctcggcgat 60
acatccgtta ctgtcgacac cagccagaaa ctccaggtca tcgatggctt tggtgtctca 120
gaagcctacg gccacgccaa acaattccaa aacctcggtc ctggaccaca gaaagagggc 180
ctcgatcttc tcttcaacac tacaaccggc gcaggcttat ccatcatccg aaacaagatc 240
ggctgcgacg cctccaactc catcaccagc accaacaccg acaacccaga taagcaggct 300
gtttaccatt ttgacggcga tgatgatggt caggtatggt ttagcaaaca ggccatgagc 360
tatggtgtag atactatcta cgctaatgct tggtctgcgc ctgtatacat gaagtcagcc 420
cagagtatgg gccgtctctg cggtacacct ggtgtgtcgt gctcctctgg agattggaga 480
catcgttacg ttgagatgat agctgagtac ctctcctact acaagcaggc tggcatccca 540
gtgtcgcacg ttggattcct caatgagggt gacggctcgg actttatgct ctcaactgcc 600
gaacaggctg cagatgtcat tcctcttcta cacagcgctt tgcagtccaa gggccttggc 660
gatatcaaga tgacgtgctg tgataacatc ggttggaagt cacagatgga ctataccgcc 720
aagctggctg agcttgaggt ggagaagtat ctatctgtca tcacatccca cgagtactcc 780
agcagcccca accagcctat gaacactaca ttgccaacct ggatgtccga gggagctgcc 840
aatgaccagg catttgccac agcgtggtac gtcaacggcg gttccaacga aggtttcaca 900
tgggcagtca agatcgcaca aggcatcgtc aatgccgacc tctcagcgta tatctactgg 960
gagggcgttg agaccaacaa caaggggtct ctatctcacg tcatcgacac ggacggtacc 1020
aagtttacca tatcctcgat tctctgggcc attgctcact ggtcgcgcca tattcgccct 1080
ggtgcgcata gactttcgac ttcaggtgtt gtgcaagata cgattgttgg tgcgtttgag 1140
aacgttgatg gcagtgtcgt catggtgctc accaactctg gcactgctgc tcagactgtg 1200
gacctgggtg tttcgggaag tagcttctca acagctcagg ctttcacttc ggatgctgag 1260
gcgcagatgg tcgataccaa ggtgactctg tccgacggtc gtgtcaaggt tacggtcccg 1320
gtgcacggtg tcgtcactgt gaagctcaca acagcaaaaa gctccaaacc ggtctcaact 1380
gctgtttctg cgcaatctgc ccccactcca actagtgtta agcacacctt gactcaccag 1440
aagacttctt caacaacact ctcgaccgcc aaggccccaa cctccactca gactacctct 1500
gtagttgagt cagccaaggc ggtgaaatac cctgtccccc ctgtagcatc caagggatcc 1560
tcgaagagtg ctcccaagaa gggtaccaag aagaccacta cgaagaaggg ctcccaccaa 1620
tcgcacaagg cgcatagtgc tactcatcgt cgatgccgcc atggaagtta ccgtcgtggc 1680
cactgcacca actaa 1695
<210> 72
<211> 537
<212> PRT
<213> Fusarium verticillioides
<400> 72
Met Leu Phe Ser Leu Val Leu Pro Thr Leu Ala Phe Gln Ala Ser Leu
1 5 10 15
Ala Leu Gly Asp Thr Ser Val Thr Val Asp Thr Ser Gln Lys Leu Gln
20 25 30
Val Ile Asp Gly Phe Gly Val Ser Glu Ala Tyr Gly His Ala Lys Gln
35 40 45
Phe Gln Asn Leu Gly Pro Gly Pro Gln Lys Glu Gly Leu Asp Leu Leu
50 55 60
Phe Asn Thr Thr Thr Gly Ala Gly Leu Ser Ile Ile Arg Asn Lys Ile
65 70 75 80
Gly Cys Asp Ala Ser Asn Ser Ile Thr Ser Thr Asn Thr Asp Asn Pro
85 90 95
Asp Lys Gln Ala Val Tyr His Phe Asp Gly Asp Asp Asp Gly Gln Ser
100 105 110
Ala Gln Ser Met Gly Arg Leu Cys Gly Thr Pro Gly Val Ser Cys Ser
115 120 125
Ser Gly Asp Trp Arg His Arg Tyr Val Glu Met Ile Ala Glu Tyr Leu
130 135 140
Ser Tyr Tyr Lys Gln Ala Gly Ile Pro Val Ser His Val Gly Phe Leu
145 150 155 160
Asn Glu Gly Asp Gly Ser Asp Phe Met Leu Ser Thr Ala Glu Gln Ala
165 170 175
Ala Asp Val Ile Pro Leu Leu His Ser Ala Leu Gln Ser Lys Gly Leu
180 185 190
Gly Asp Ile Lys Met Thr Cys Cys Asp Asn Ile Gly Trp Lys Ser Gln
195 200 205
Met Asp Tyr Thr Ala Lys Leu Ala Glu Leu Glu Val Glu Lys Tyr Leu
210 215 220
Ser Val Ile Thr Ser His Glu Tyr Ser Ser Ser Pro Asn Gln Pro Met
225 230 235 240
Asn Thr Thr Leu Pro Thr Trp Met Ser Glu Gly Ala Ala Asn Asp Gln
245 250 255
Ala Phe Ala Thr Ala Trp Tyr Val Asn Gly Gly Ser Asn Glu Gly Phe
260 265 270
Thr Trp Ala Val Lys Ile Ala Gln Gly Ile Val Asn Ala Asp Leu Ser
275 280 285
Ala Tyr Ile Tyr Trp Glu Gly Val Glu Thr Asn Asn Lys Gly Ser Leu
290 295 300
Ser His Val Ile Asp Thr Asp Gly Thr Lys Phe Thr Ile Ser Ser Ile
305 310 315 320
Leu Trp Ala Ile Ala His Trp Ser Arg His Ile Arg Pro Gly Ala His
325 330 335
Arg Leu Ser Thr Ser Gly Val Val Gln Asp Thr Ile Val Gly Ala Phe
340 345 350
Glu Asn Val Asp Gly Ser Val Val Met Val Leu Thr Asn Ser Gly Thr
355 360 365
Ala Ala Gln Thr Val Asp Leu Gly Val Ser Gly Ser Ser Phe Ser Thr
370 375 380
Ala Gln Ala Phe Thr Ser Asp Ala Glu Ala Gln Met Val Asp Thr Lys
385 390 395 400
Val Thr Leu Ser Asp Gly Arg Val Lys Val Thr Val Pro Val His Gly
405 410 415
Val Val Thr Val Lys Leu Thr Thr Ala Lys Ser Ser Lys Pro Val Ser
420 425 430
Thr Ala Val Ser Ala Gln Ser Ala Pro Thr Pro Thr Ser Val Lys His
435 440 445
Thr Leu Thr His Gln Lys Thr Ser Ser Thr Thr Leu Ser Thr Ala Lys
450 455 460
Ala Pro Thr Ser Thr Gln Thr Thr Ser Val Val Glu Ser Ala Lys Ala
465 470 475 480
Val Lys Tyr Pro Val Pro Pro Val Ala Ser Lys Gly Ser Ser Lys Ser
485 490 495
Ala Pro Lys Lys Gly Thr Lys Lys Thr Thr Thr Lys Lys Gly Ser His
500 505 510
Gln Ser His Lys Ala His Ser Ala Thr His Arg Arg Cys Arg His Gly
515 520 525
Ser Tyr Arg Arg Gly His Cys Thr Asn
530 535
<210> 73
<211> 948
<212> DNA
<213> Fusarium verticillioides
<400> 73
atgtggaaac tcctcgtcag cggtcttgtc gccgtcgcgt ccctcagcgg cgtgaacgct 60
gcttatccta accctggtcc cgtcaccggc gatactcgtg ttcacgaccc tacggttgtc 120
aagactccca gcggtggata cttgctggct catactggcg ataacgtttc gctcaagact 180
tcttctgatc gaactgcttg gaaggatgca ggtgctgttt tccccaacgg tgcgccttgg 240
actacgcagt acaccaaggg cgacaagaac ctctgggccc ctgatatctc ctaccacaac 300
ggccagtact atctgtacta ctccgcctct tccttcggtc agcgtacctc tgccattttt 360
ctcgctacca gcaagaccgg tgcatccggc tcgtggacca accaaggcgt cgtcgtcgag 420
tccaacaaca acaacgacta caatgccatt gacggaaatc tctttgtcga ctctgatgga 480
aaatggtggc tctccttcgg ctctttctgg tccggcatca agctcatcca actcgacccc 540
aagaccggca agcgcaccgg ctcaagcatg tactccctcg ccaaacgcga cgcctccgtc 600
gaaggcgccg tcgaggctcc gttcatcacc aaacgcggaa gcacctacta cctctgggtg 660
tcgttcgaca agtgttgcca gggcgctgct agcacgtacc gtgtcatggt tggacggtcg 720
agcagcatta ctggtcctta tgttgacaag gctggtaagc agatgatgtc tggtggagga 780
acggagatta tggctagtca cggatctatt catggaccgg gacataatgc tgttttcact 840
gataacgatg cggacgttct tgtctatcat tactacgata acgctggcac agcgctgttg 900
ggcatcaact tgctcagata tgacaatggc tggcctgttg cttattag 948
<210> 74
<211> 315
<212> PRT
<213> Fusarium verticillioides
<400> 74
Met Trp Lys Leu Leu Val Ser Gly Leu Val Ala Val Ala Ser Leu Ser
1 5 10 15
Gly Val Asn Ala Ala Tyr Pro Asn Pro Gly Pro Val Thr Gly Asp Thr
20 25 30
Arg Val His Asp Pro Thr Val Val Lys Thr Pro Ser Gly Gly Tyr Leu
35 40 45
Leu Ala His Thr Gly Asp Asn Val Ser Leu Lys Thr Ser Ser Asp Arg
50 55 60
Thr Ala Trp Lys Asp Ala Gly Ala Val Phe Pro Asn Gly Ala Pro Trp
65 70 75 80
Thr Thr Gln Tyr Thr Lys Gly Asp Lys Asn Leu Trp Ala Pro Asp Ile
85 90 95
Ser Tyr His Asn Gly Gln Tyr Tyr Leu Tyr Tyr Ser Ala Ser Ser Phe
100 105 110
Gly Gln Arg Thr Ser Ala Ile Phe Leu Ala Thr Ser Lys Thr Gly Ala
115 120 125
Ser Gly Ser Trp Thr Asn Gln Gly Val Val Val Glu Ser Asn Asn Asn
130 135 140
Asn Asp Tyr Asn Ala Ile Asp Gly Asn Leu Phe Val Asp Ser Asp Gly
145 150 155 160
Lys Trp Trp Leu Ser Phe Gly Ser Phe Trp Ser Gly Ile Lys Leu Ile
165 170 175
Gln Leu Asp Pro Lys Thr Gly Lys Arg Thr Gly Ser Ser Met Tyr Ser
180 185 190
Leu Ala Lys Arg Asp Ala Ser Val Glu Gly Ala Val Glu Ala Pro Phe
195 200 205
Ile Thr Lys Arg Gly Ser Thr Tyr Tyr Leu Trp Val Ser Phe Asp Lys
210 215 220
Cys Cys Gln Gly Ala Ala Ser Thr Tyr Arg Val Met Val Gly Arg Ser
225 230 235 240
Ser Ser Ile Thr Gly Pro Tyr Val Asp Lys Ala Gly Lys Gln Met Met
245 250 255
Ser Gly Gly Gly Thr Glu Ile Met Ala Ser His Gly Ser Ile His Gly
260 265 270
Pro Gly His Asn Ala Val Phe Thr Asp Asn Asp Ala Asp Val Leu Val
275 280 285
Tyr His Tyr Tyr Asp Asn Ala Gly Thr Ala Leu Leu Gly Ile Asn Leu
290 295 300
Leu Arg Tyr Asp Asn Gly Trp Pro Val Ala Tyr
305 310 315
<210> 75
<211> 1352
<212> DNA
<213> Trichoderma reesei
<400> 75
atgaaagcaa acgtcatctt gtgcctcctg gcccccctgg tcgccgctct ccccaccgaa 60
accatccacc tcgaccccga gctcgccgct ctccgcgcca acctcaccga gcgaacagcc 120
gacctctggg accgccaagc ctctcaaagc atcgaccagc tcatcaagag aaaaggcaag 180
ctctactttg gcaccgccac cgaccgcggc ctcctccaac gggaaaagaa cgcggccatc 240
atccaggcag acctcggcca ggtgacgccg gagaacagca tgaagtggca gtcgctcgag 300
aacaaccaag gccagctgaa ctggggagac gccgactatc tcgtcaactt tgcccagcaa 360
aacggcaagt cgatacgcgg ccacactctg atctggcact cgcagctgcc tgcgtgggtg 420
aacaatatca acaacgcgga tactctgcgg caagtcatcc gcacccatgt ctctactgtg 480
gttgggcggt acaagggcaa gattcgtgct tgggtgagtt ttgaacacca catgcccctt 540
ttcttagtcc gctcctcctc ctcttggaac ttctcacagt tatagccgta tacaacattc 600
gacaggaaat ttaggatgac aactactgac tgacttgtgt gtgtgatggc gataggacgt 660
ggtcaatgaa atcttcaacg aggatggaac gctgcgctct tcagtctttt ccaggctcct 720
cggcgaggag tttgtctcga ttgcctttcg tgctgctcga gatgctgacc cttctgcccg 780
tctttacatc aacgactaca atctcgaccg cgccaactat ggcaaggtca acgggttgaa 840
gacttacgtc tccaagtgga tctctcaagg agttcccatt gacggtattg gtgagccacg 900
acccctaaat gtcccccatt agagtctctt tctagagcca aggcttgaag ccattcaggg 960
actgacacga gagccttctc tacaggaagc cagtcccatc tcagcggcgg cggaggctct 1020
ggtacgctgg gtgcgctcca gcagctggca acggtacccg tcaccgagct ggccattacc 1080
gagctggaca ttcagggggc accgacgacg gattacaccc aagttgttca agcatgcctg 1140
agcgtctcca agtgcgtcgg catcaccgtg tggggcatca gtgacaaggt aagttgcttc 1200
ccctgtctgt gcttatcaac tgtaagcagc aacaactgat gctgtctgtc tttacctagg 1260
actcgtggcg tgccagcacc aaccctcttc tgtttgacgc aaacttcaac cccaagccgg 1320
catataacag cattgttggc atcttacaat ag 1352
<210> 76
<211> 347
<212> PRT
<213> Trichoderma reesei
<400> 76
Met Lys Ala Asn Val Ile Leu Cys Leu Leu Ala Pro Leu Val Ala Ala
1 5 10 15
Leu Pro Thr Glu Thr Ile His Leu Asp Pro Glu Leu Ala Ala Leu Arg
20 25 30
Ala Asn Leu Thr Glu Arg Thr Ala Asp Leu Trp Asp Arg Gln Ala Ser
35 40 45
Gln Ser Ile Asp Gln Leu Ile Lys Arg Lys Gly Lys Leu Tyr Phe Gly
50 55 60
Thr Ala Thr Asp Arg Gly Leu Leu Gln Arg Glu Lys Asn Ala Ala Ile
65 70 75 80
Ile Gln Ala Asp Leu Gly Gln Val Thr Pro Glu Asn Ser Met Lys Trp
85 90 95
Gln Ser Leu Glu Asn Asn Gln Gly Gln Leu Asn Trp Gly Asp Ala Asp
100 105 110
Tyr Leu Val Asn Phe Ala Gln Gln Asn Gly Lys Ser Ile Arg Gly His
115 120 125
Thr Leu Ile Trp His Ser Gln Leu Pro Ala Trp Val Asn Asn Ile Asn
130 135 140
Asn Ala Asp Thr Leu Arg Gln Val Ile Arg Thr His Val Ser Thr Val
145 150 155 160
Val Gly Arg Tyr Lys Gly Lys Ile Arg Ala Trp Asp Val Val Asn Glu
165 170 175
Ile Phe Asn Glu Asp Gly Thr Leu Arg Ser Ser Val Phe Ser Arg Leu
180 185 190
Leu Gly Glu Glu Phe Val Ser Ile Ala Phe Arg Ala Ala Arg Asp Ala
195 200 205
Asp Pro Ser Ala Arg Leu Tyr Ile Asn Asp Tyr Asn Leu Asp Arg Ala
210 215 220
Asn Tyr Gly Lys Val Asn Gly Leu Lys Thr Tyr Val Ser Lys Trp Ile
225 230 235 240
Ser Gln Gly Val Pro Ile Asp Gly Ile Gly Ser Gln Ser His Leu Ser
245 250 255
Gly Gly Gly Gly Ser Gly Thr Leu Gly Ala Leu Gln Gln Leu Ala Thr
260 265 270
Val Pro Val Thr Glu Leu Ala Ile Thr Glu Leu Asp Ile Gln Gly Ala
275 280 285
Pro Thr Thr Asp Tyr Thr Gln Val Val Gln Ala Cys Leu Ser Val Ser
290 295 300
Lys Cys Val Gly Ile Thr Val Trp Gly Ile Ser Asp Lys Asp Ser Trp
305 310 315 320
Arg Ala Ser Thr Asn Pro Leu Leu Phe Asp Ala Asn Phe Asn Pro Lys
325 330 335
Pro Ala Tyr Asn Ser Ile Val Gly Ile Leu Gln
340 345
<210> 77
<211> 222
<212> PRT
<213> Trichoderma reesei
<400> 77
Met Val Ser Phe Thr Ser Leu Leu Ala Ala Ser Pro Pro Ser Arg Ala
1 5 10 15
Ser Cys Arg Pro Ala Ala Glu Val Glu Ser Val Ala Val Glu Lys Arg
20 25 30
Gln Thr Ile Gln Pro Gly Thr Gly Tyr Asn Asn Gly Tyr Phe Tyr Ser
35 40 45
Tyr Trp Asn Asp Gly His Gly Gly Val Thr Tyr Thr Asn Gly Pro Gly
50 55 60
Gly Gln Phe Ser Val Asn Trp Ser Asn Ser Gly Asn Phe Val Gly Gly
65 70 75 80
Lys Gly Trp Gln Pro Gly Thr Lys Asn Lys Val Ile Asn Phe Ser Gly
85 90 95
Ser Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Ser Val Tyr Gly Trp Ser
100 105 110
Arg Asn Pro Leu Ile Glu Tyr Tyr Ile Val Glu Asn Phe Gly Thr Tyr
115 120 125
Asn Pro Ser Thr Gly Ala Thr Lys Leu Gly Glu Val Thr Ser Asp Gly
130 135 140
Ser Val Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile
145 150 155 160
Ile Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Arg Asn His
165 170 175
Arg Ser Ser Gly Ser Val Asn Thr Ala Asn His Phe Asn Ala Trp Ala
180 185 190
Gln Gln Gly Leu Thr Leu Gly Thr Met Asp Tyr Gln Ile Val Ala Val
195 200 205
Glu Gly Tyr Phe Ser Ser Gly Ser Ala Ser Ile Thr Val Ser
210 215 220
<210> 78
<211> 797
<212> PRT
<213> Trichoderma reesei
<400> 78
Met Val Asn Asn Ala Ala Leu Leu Ala Ala Leu Ser Ala Leu Leu Pro
1 5 10 15
Thr Ala Leu Ala Gln Asn Asn Gln Thr Tyr Ala Asn Tyr Ser Ala Gln
20 25 30
Gly Gln Pro Asp Leu Tyr Pro Glu Thr Leu Ala Thr Leu Thr Leu Ser
35 40 45
Phe Pro Asp Cys Glu His Gly Pro Leu Lys Asn Asn Leu Val Cys Asp
50 55 60
Ser Ser Ala Gly Tyr Val Glu Arg Ala Gln Ala Leu Ile Ser Leu Phe
65 70 75 80
Thr Leu Glu Glu Leu Ile Leu Asn Thr Gln Asn Ser Gly Pro Gly Val
85 90 95
Pro Arg Leu Gly Leu Pro Asn Tyr Gln Val Trp Asn Glu Ala Leu His
100 105 110
Gly Leu Asp Arg Ala Asn Phe Ala Thr Lys Gly Gly Gln Phe Glu Trp
115 120 125
Ala Thr Ser Phe Pro Met Pro Ile Leu Thr Thr Ala Ala Leu Asn Arg
130 135 140
Thr Leu Ile His Gln Ile Ala Asp Ile Ile Ser Thr Gln Ala Arg Ala
145 150 155 160
Phe Ser Asn Ser Gly Arg Tyr Gly Leu Asp Val Tyr Ala Pro Asn Val
165 170 175
Asn Gly Phe Arg Ser Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly
180 185 190
Glu Asp Ala Phe Phe Leu Ser Ser Ala Tyr Thr Tyr Glu Tyr Ile Thr
195 200 205
Gly Ile Gln Gly Gly Val Asp Pro Glu His Leu Lys Val Ala Ala Thr
210 215 220
Val Lys His Phe Ala Gly Tyr Asp Leu Glu Asn Trp Asn Asn Gln Ser
225 230 235 240
Arg Leu Gly Phe Asp Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr
245 250 255
Tyr Thr Pro Gln Phe Leu Ala Ala Ala Arg Tyr Ala Lys Ser Arg Ser
260 265 270
Leu Met Cys Ala Tyr Asn Ser Val Asn Gly Val Pro Ser Cys Ala Asn
275 280 285
Ser Phe Phe Leu Gln Thr Leu Leu Arg Glu Ser Trp Gly Phe Pro Glu
290 295 300
Trp Gly Tyr Val Ser Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn
305 310 315 320
Pro His Asp Tyr Ala Ser Asn Gln Ser Ser Ala Ala Ala Ser Ser Leu
325 330 335
Arg Ala Gly Thr Asp Ile Asp Cys Gly Gln Thr Tyr Pro Trp His Leu
340 345 350
Asn Glu Ser Phe Val Ala Gly Glu Val Ser Arg Gly Glu Ile Glu Arg
355 360 365
Ser Val Thr Arg Leu Tyr Ala Asn Leu Val Arg Leu Gly Tyr Phe Asp
370 375 380
Lys Lys Asn Gln Tyr Arg Ser Leu Gly Trp Lys Asp Val Val Lys Thr
385 390 395 400
Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Val Leu
405 410 415
Leu Lys Asn Asp Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile
420 425 430
Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Met Gln Gly Asn
435 440 445
Tyr Tyr Gly Pro Ala Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys
450 455 460
Lys Ala Gly Tyr His Val Asn Phe Glu Leu Gly Thr Glu Ile Ala Gly
465 470 475 480
Asn Ser Thr Thr Gly Phe Ala Lys Ala Ile Ala Ala Ala Lys Lys Ser
485 490 495
Asp Ala Ile Ile Tyr Leu Gly Gly Ile Asp Asn Thr Ile Glu Gln Glu
500 505 510
Gly Ala Asp Arg Thr Asp Ile Ala Trp Pro Gly Asn Gln Leu Asp Leu
515 520 525
Ile Lys Gln Leu Ser Glu Val Gly Lys Pro Leu Val Val Leu Gln Met
530 535 540
Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ser Asn Lys Lys Val
545 550 555 560
Asn Ser Leu Val Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Val Ala
565 570 575
Leu Phe Asp Ile Leu Ser Gly Lys Arg Ala Pro Ala Gly Arg Leu Val
580 585 590
Thr Thr Gln Tyr Pro Ala Glu Tyr Val His Gln Phe Pro Gln Asn Asp
595 600 605
Met Asn Leu Arg Pro Asp Gly Lys Ser Asn Pro Gly Gln Thr Tyr Ile
610 615 620
Trp Tyr Thr Gly Lys Pro Val Tyr Glu Phe Gly Ser Gly Leu Phe Tyr
625 630 635 640
Thr Thr Phe Lys Glu Thr Leu Ala Ser His Pro Lys Ser Leu Lys Phe
645 650 655
Asn Thr Ser Ser Ile Leu Ser Ala Pro His Pro Gly Tyr Thr Tyr Ser
660 665 670
Glu Gln Ile Pro Val Phe Thr Phe Glu Ala Asn Ile Lys Asn Ser Gly
675 680 685
Lys Thr Glu Ser Pro Tyr Thr Ala Met Leu Phe Val Arg Thr Ser Asn
690 695 700
Ala Gly Pro Ala Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg
705 710 715 720
Leu Ala Asp Ile Lys Pro Gly His Ser Ser Lys Leu Ser Ile Pro Ile
725 730 735
Pro Val Ser Ala Leu Ala Arg Val Asp Ser His Gly Asn Arg Ile Val
740 745 750
Tyr Pro Gly Lys Tyr Glu Leu Ala Leu Asn Thr Asp Glu Ser Val Lys
755 760 765
Leu Glu Phe Glu Leu Val Gly Glu Glu Val Thr Ile Glu Asn Trp Pro
770 775 780
Leu Glu Glu Gln Gln Ile Lys Asp Ala Thr Pro Asp Ala
785 790 795
<210> 79
<211> 744
<212> PRT
<213> Trichoderma reesei
<400> 79
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1 5 10 15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
20 25 30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
35 40 45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
50 55 60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65 70 75 80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
85 90 95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
100 105 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
115 120 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
130 135 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
165 170 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
195 200 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
210 215 220
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225 230 235 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
245 250 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
260 265 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
275 280 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
290 295 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305 310 315 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
325 330 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
340 345 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
355 360 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
370 375 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385 390 395 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
405 410 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
420 425 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
435 440 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
450 455 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465 470 475 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
485 490 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
500 505 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
515 520 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
530 535 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545 550 555 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
565 570 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
580 585 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
595 600 605
Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
610 615 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625 630 635 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
645 650 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
660 665 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
675 680 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
690 695 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705 710 715 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
725 730 735
Leu Thr Ser Thr Leu Ser Val Ala
740
<210> 80
<211> 2031
<212> DNA
<213> Podospora anserina
<400> 80
atgatccacc tcaagccagc cctcgcggcg ttgttggcgc tgtcgacgca atgtgtggct 60
attgatttgt ttgtcaagtc ttcggggggg aataagacga ctgatatcat gtatggtctt 120
atgcacgagg atatcaacaa ctccggcgac ggcggcatct acgccgagct aatctccaac 180
cgcgcgttcc aagggagtga gaagttcccc tccaacctcg acaactggag ccccgtcggt 240
ggcgctaccc ttacccttca gaagcttgcc aagccccttt cctctgcgtt gccttactcc 300
gtcaatgttg ccaaccccaa ggagggcaag ggcaagggca aggacaccaa ggggaagaag 360
gttggcttgg ccaatgctgg gttttggggt atggatgtca agaggcagaa gtacactggt 420
agcttccacg ttactggtga gtacaagggt gactttgagg ttagcttgcg cagcgcgatt 480
accggggaga cctttggcaa gaaggtggtg aagggtggga gtaagaaggg gaagtggacc 540
gagaaggagt ttgagttggt gcctttcaag gatgcgccca acagcaacaa cacctttgtt 600
gtgcagtggg atgccgaggg cgcaaaggac ggatctttgg atctcaactt gatcagcttg 660
ttccctccga cattcaaggg aaggaagaat gggctgagaa ttgatcttgc gcagacgatg 720
gttgagctca agccgacctt cttgcgcttc cccggtggca acatgctcga gggtaacacc 780
ttggacactt ggtggaagtg gtacgagacc attggccctc tgaaggatcg cccgggcatg 840
gctggtgtct gggagtacca gcaaaccctt ggcttgggtc tggtcgagta catggagtgg 900
gccgatgaca tgaacttgga gcccattgtc ggtgtcttcg ctggtcttgc cctcgatggc 960
tcgttcgttc ccgaatccga gatgggatgg gtcatccaac aggctctcga cgaaatcgag 1020
ttcctcactg gcgatgctaa gaccaccaaa tggggtgccg tccgcgcgaa gcttggtcac 1080
cccaagcctt ggaaggtcaa gtgggttgag atcggtaacg aggattggct tgccggacgc 1140
cctgctggct tcgagtcgta catcaactac cgcttcccca tgatgatgaa ggccttcaac 1200
gaaaagtacc ccgacatcaa gatcatcgcc tcgccctcca tcttcgacaa catgacaatc 1260
cccgcgggtg ctgccggtga tcaccacccg tacctgactc ccgatgagtt cgttgagcga 1320
ttcgccaagt tcgataactt gagcaaggat aacgtgacgc tcatcggcga ggctgcgtcg 1380
acgcatccta acggtggtat cgcttgggag ggagatctca tgcccttgcc ttggtggggc 1440
ggcagtgttg ctgaggctat cttcttgatc agcactgaga gaaacggtga caagatcatc 1500
ggtgctactt acgcgcctgg tcttcgcagc ttggaccgct ggcaatggag catgacctgg 1560
gtgcagcatg ccgccgaccc ggccctcacc actcgctcga ccagttggta tgtctggaga 1620
atcctcgccc accacatcat ccgtgagacg ctcccggtcg atgccccggc cggcaagccc 1680
aactttgacc ctctgttcta cgttgccgga aagagcgaga gtggcaccgg tatcttcaag 1740
gctgccgtct acaactcgac tgaatcgatc ccggtgtcgt tgaagtttga tggtctcaac 1800
gagggagcgg ttgccaactt gacggtgctt actgggccgg aggatccgta tggatacaac 1860
gaccccttca ctggtatcaa tgttgtcaag gagaagacca ccttcatcaa ggccggaaag 1920
ggcggcaagt tcaccttcac cctgccgggc ttgagtgttg ctgtgttgga gacggccgac 1980
gcggtcaagg gtggcaaggg aaagggcaag ggcaagggaa agggtaactg a 2031
<210> 81
<211> 2031
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic codon optimized cDNA
<400> 81
atgatccacc tcaagcccgc cctcgccgcc ctcctcgccc tcagcaccca atgcgtcgcc 60
atcgacctct tcgtcaagag cagcggcggc aacaagacca ccgacatcat gtacggcctc 120
atgcacgagg acatcaacaa cagcggcgac ggcggcatct acgccgagct gatcagcaac 180
cgcgccttcc agggcagcga gaagttcccc agcaacctcg acaactggtc ccccgtcggc 240
ggcgccaccc tcaccctcca gaagctcgcc aagcccctgt cctctgccct cccctactcc 300
gtcaacgtcg ccaaccccaa ggagggtaag ggtaagggca aggacaccaa gggcaagaag 360
gtcggcctcg ccaacgccgg cttttggggc atggacgtca agcgccagaa atacaccggc 420
agcttccacg tcaccggcga gtacaagggc gacttcgagg tcagcctccg cagcgccatt 480
accggcgaga ccttcggcaa gaaggtcgtc aagggcggca gcaagaaggg caagtggacc 540
gagaaggagt tcgagctggt ccccttcaag gacgccccca acagcaacaa caccttcgtc 600
gtccagtggg acgccgaggg cgccaaggac ggcagcctcg acctcaacct catcagcctc 660
ttcccgccca ccttcaaggg ccgcaagaac ggcctccgca tcgacctcgc ccagaccatg 720
gtcgagctga agcccacctt cctccgcttt cccggcggca acatgctcga gggcaacacc 780
ctcgacacct ggtggaagtg gtacgagacc atcggccccc tgaaggaccg ccctggcatg 840
gccggcgtct gggagtacca gcagacgctg ggcctcggcc tggtcgagta catggagtgg 900
gccgacgaca tgaacctcga gcccatcgtc ggcgtctttg ctggcctggc cctggatggc 960
agctttgtcc ccgagagcga gatgggctgg gtcatccagc aggctctcga tgagatcgag 1020
ttcctcaccg gcgacgccaa gaccaccaag tggggcgccg tccgcgccaa gctcggccac 1080
cctaagccct ggaaggtcaa atgggtcgag atcggcaacg aggactggct cgccggccga 1140
cctgccggct tcgagagcta catcaactac cgcttcccca tgatgatgaa ggccttcaac 1200
gagaaatacc ccgacatcaa gatcattgcc agcccctcca tcttcgacaa catgaccatt 1260
ccagccggtg ctgccggtga ccaccacccc tacctcaccc ccgacgaatt tgtcgagcgc 1320
ttcgccaagt tcgacaacct cagcaaggac aacgtcaccc tcattggcga ggccgccagc 1380
acccacccca acggcggcat tgcctgggag ggcgacctca tgcccctgcc ctggtggggc 1440
ggcagcgtcg ccgaggccat cttcctcatc agcaccgagc gcaacggcga caagatcatc 1500
ggcgccacct acgcccctgg cctccgatct ctcgaccgct ggcagtggag catgacctgg 1560
gtccagcacg ccgccgaccc tgccctcacc acccgcagca ccagctggta cgtctggcgc 1620
atcctcgccc accacatcat tcgcgagacc ctccccgtcg acgcccccgc cggcaagccc 1680
aacttcgacc ccctcttcta cgtcgctggc aagtcggaga gcggcaccgg catcttcaag 1740
gccgccgtct acaacagcac cgagagcatc cccgtcagcc tcaagttcga cggcctcaac 1800
gagggcgccg tcgccaacct caccgtcctc accggccccg aggaccccta cggctacaac 1860
gaccccttca ccggcatcaa cgtcgtcaag gaaaagacca ccttcatcaa ggccggcaag 1920
ggcggcaagt tcacctttac cctccccggc ctctctgtcg ccgtcctcga gaccgccgac 1980
gccgtgaagg gtggcaaggg aaagggaaag ggcaagggta agggtaacta a 2031
<210> 82
<211> 1020
<212> DNA
<213> Gibberella zeae
<400> 82
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc taccaacgac 60
gactgtcctc tcatcactag tagatggact gcggatcctt cggctcatgt ctttaacgac 120
accttgtggc tctacccgtc tcatgacatc gatgctggat ttgagaatga tcctgatgga 180
ggccagtacg ccatgagaga ttaccatgtc tactctatcg acaagatcta cggttccctg 240
ccggtcgatc acggtacggc cctgtcagtg gaggatgtcc cctgggcctc tcgacagatg 300
tgggctcctg acgctgccca caagaacggc aaatactacc tatacttccc tgccaaagac 360
aaggatgata tcttcagaat cggcgttgct gtctcaccaa cccccggcgg accattcgtc 420
cccgacaaga gttggatccc tcacactttc agcatcgacc ccgccagttt cgtcgatgat 480
gatgacagag cctacttggc atggggtggt atcatgggtg gccagcttca acgatggcag 540
gataagaaca agtacaacga atctggcact gagccaggaa acggcaccgc tgccttgagc 600
cctcagattg ccaagctgag caaggacatg cacactctgg cagagaagcc tcgcgacatg 660
ctcattcttg accccaagac tggcaagccg ctcctttctg aggatgaaga ccgacgcttc 720
ttcgaaggac cctggattca caagcgcaac aagatttact acctcaccta ctctactggc 780
acaacccact atcttgtcta tgcgacttca aagaccccct atggtcctta cacctaccag 840
ggcagaattc tggagccagt tgatggctgg actactcact ctagtatcgt caagtaccag 900
ggtcagtggt ggctatttta tcacgatgcc aagacatctg gcaaggacta tcttcgccag 960
gtaaaggcta agaagatttg gtacgatagc aaaggaaaga tcttgacaaa gaagccttga 1020
<210> 83
<211> 1038
<212> DNA
<213> Fusarium oxysporum
<400> 83
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcaagacact 60
aatgacattc ctcccctgat caccgacctc tggtccgcag atccctcggc tcatgttttc 120
gaaggcaagc tctgggttta cccatctcac gacatcgaag ccaatgttgt caacggcaca 180
ggaggcgctc aatacgccat gagggattac catacctact ccatgaagag catctatggt 240
aaagatcccg ttgtcgacca cggcgtcgct ctctcagtcg atgacgttcc ctgggcgaag 300
cagcaaatgt gggctcctga cgcagctcat aagaacggca aatattatct gtacttcccc 360
gccaaggaca aggatgagat cttcagaatt ggagttgctg tctccaacaa gcccagcggt 420
cctttcaagg ccgacaagag ctggatccct ggcacgtaca gtatcgatcc tgctagctac 480
gtcgacactg ataacgaggc ctacctcatc tggggcggta tctggggcgg ccagctccaa 540
gcctggcagg ataaaaagaa ctttaacgag tcgtggattg gagacaaggc tgctcctaac 600
ggcaccaatg ccctatctcc tcagatcgcc aagctaagca aggacatgca caagatcacc 660
gaaacacccc gcgatctcgt cattctcgcc cccgagacag gcaagcctct tcaggctgag 720
gacaacaagc gacgattctt cgagggccct tggatccaca agcgcggcaa gctttactac 780
ctcatgtact ccaccggtga tacccacttc cttgtctacg ctacttccaa gaacatctac 840
ggtccttata cctaccgggg caagattctt gatcctgttg atgggtggac tactcatgga 900
agtattgttg agtataaggg acagtggtgg cttttctttg ctgatgcgca tacgtctggt 960
aaggattacc ttcgacaggt gaaggcgagg aagatctggt atgacaagaa cggcaagatc 1020
ttgcttcacc gtccttag 1038
<210> 84
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic motif for GH61 endoglucanase family
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa can be Ile, Leu, Met, or Val
<220>
<221> misc_feature
<222> (3)..(6)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa can be Ile, Leu, Met, or Val
<220>
<221> misc_feature
<222> (11)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa can be Glu or Gln
<220>
<221> misc_feature
<222> (15)..(18)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa can be His, Asn, or Gln
<400> 84
Xaa Pro Xaa Xaa Xaa Xaa Gly Xaa Tyr Xaa Xaa Arg Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa
<210> 85
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic motif for GH61 endoglucanase family
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa can be Ile, Leu, Met, or Val
<220>
<221> misc_feature
<222> (3)..(7)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (9)..(9)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa can be Ile, Leu, Met, or Val
<220>
<221> misc_feature
<222> (12)..(12)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (14)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa can be Glu or Gln
<220>
<221> misc_feature
<222> (16)..(19)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa can be His, Asn or Gln
<400> 85
Xaa Pro Xaa Xaa Xaa Xaa Xaa Gly Xaa Tyr Xaa Xaa Arg Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa
20
<210> 86
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic motif for GH61 endoglucanase family
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa can be Ile, Leu, Met or Val
<220>
<221> misc_feature
<222> (3)..(6)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa can be Ile, Leu, Met or Val
<220>
<221> misc_feature
<222> (11)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa can be Glu or Gln
<220>
<221> misc_feature
<222> (15)..(17)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa can be His, Asn or Gln
<400> 86
Xaa Pro Xaa Xaa Xaa Xaa Gly Xaa Tyr Xaa Xaa Arg Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Ala Xaa
<210> 87
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic motif for GH61 endoglucanase family
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa can be Ile, Leu, Met or Val
<220>
<221> misc_feature
<222> (3)..(7)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (9)..(9)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa can be Ile, Leu, Met or Val
<220>
<221> misc_feature
<222> (12)..(12)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (14)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa can be Glu or Gln
<220>
<221> misc_feature
<222> (16)..(18)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa can be His, Asn or Gln
<400> 87
Xaa Pro Xaa Xaa Xaa Xaa Xaa Gly Xaa Tyr Xaa Xaa Arg Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Ala Xaa
20
<210> 88
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic motif for GH61 endoglucanase family
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa can be Phe or Trp
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa can be Thr or Phe
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa can be Ala, Ile or Val
<400> 88
Xaa Xaa Lys Xaa
1
<210> 89
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic motif for GH61 endoglucanase family
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (6)..(8)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa can be Tyr or Trp
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa can be Ala, Ile, Leu, Met or Val
<400> 89
His Xaa Xaa Gly Pro Xaa Xaa Xaa Xaa Xaa
1 5 10
<210> 90
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic motif for GH61 endoglucanase family
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (5)..(7)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa can be Tyr or Trp
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa can be Ala, Ile, Leu, Met or Val
<400> 90
His Xaa Gly Pro Xaa Xaa Xaa Xaa Xaa
1 5
<210> 91
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic motif for GH61 endoglucanase family
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa can be Glu or Gln
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (4)..(5)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa can be Glu, His, Gln or Asn
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa can be Phe, Ile, Leu or Val
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa can be Ile, Leu or Val
<400> 91
Xaa Xaa Tyr Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa
1 5 10
<210> 92
<211> 1920
<212> DNA
<213> Penicillium funiculosum
<400> 92
atgtaccgga agctcgccgt gatcagcgcc ttcctggcga ctgctcgcgc catcaccatc 60
aacgtcagcc agagcggcgg caacaagacc agcccgctcc agtacggcct catgttcgag 120
gacatcaacc acggcggcga cggcggcctc tacgccgagc tggtccggaa ccgggccttc 180
cagggcagca ccgtctaccc ggccaacctc gacggctacg actcggtgaa cggcgcgatt 240
ctcgcgctcc agaacctcac caacccgctc agcccgagca tgccctcgtc gctgaacgtc 300
gccaagggct cgaacaacgg cagcatcggc ttcgccaacg aggggtggtg gggcatcgag 360
gtcaagccgc agcggtacgc cggcagcttc tacgtccagg gcgactacca gggcgacttc 420
gacatcagcc tccagagcaa gctcacccag gaggtcttcg cgacggcgaa ggtccggtcg 480
agcggcaagc acgaggactg ggtccagtac aagtacgagc tggtcccgaa gaaggccgcc 540
agcaacacca acaacaccct caccatcacc ttcgacagca agggcctcaa ggacggcagc 600
ctcaacttca acctcatcag cctcttcccg ccgacctaca acaaccggcc gaacggcctc 660
cggatcgacc tcgtcgaggc catggcggag ctggagggca agttcctccg cttccccggc 720
ggctcggacg tggagggcgt ccaggccccg tactggtaca agtggaacga gaccgtcggc 780
gacctcaagg accgctactc gcgcccgagc gcctggacct acgaggagag caacggcatc 840
ggcctcatcg agtacatgaa ctggtgcgac gacatgggcc tcgagccgat cctcgccgtc 900
tgggacggcc actacctcag caacgaggtc atcagcgaga acgacctcca gccgtacatc 960
gacgacaccc tcaaccagct cgagttcctc atgggcgccc cggacactcc ctacgggtct 1020
tggagggcta gcctcggcta cccgaagccg tggaccatca actacgtcga gatcggcaac 1080
gaggacaacc tctacggcgg cctcgagacc tacatcgcct accggttcca ggcctactac 1140
gacgccatca ccgccaagta cccgcacatg accgtcatgg agagcctcac cgagatgccc 1200
ggccccgctg ccgcggcgtc ggactaccac cagtactcga cgcccgacgg cttcgtcagc 1260
cagttcaact acttcgacca gatgccggtc accaaccgca cgctgaacgg cgagatcgcc 1320
accgtctacc ccaacaaccc gagcaactcg gtggcgtggg gcagcccgtt cccgctctac 1380
ccgtggtgga tcgggtccgt ggctgaggcc gtcttcctca tcggcgagga gcggaacagc 1440
ccgaagatca tcggcgccag ctacgccccc atgttccgca acattaacaa ctggcagtgg 1500
agcccgaccc tgatcgcctt cgacgccgac agcagccgga cgtcgcgctc tacttcctgg 1560
cacgtcatca agctcctcag caccaacaag atcacccaga acctgcccac gacgtggtct 1620
gggggggaca tcggcccgct ctactgggtc gccggccgga acgacaacac cggcagcaac 1680
atcttcaagg ccgccgtcta caacagcacc agcgacgtcc cggtcaccgt ccagttcgcc 1740
ggctgcaacg ccaagagcgc caacctcacc atcctctcgt cggacgaccc caacgccagc 1800
aactacccgg gcggccccga ggtcgtcaag accgagatcc agagcgtcac cgccaacgcc 1860
cacggcgcct tcgagttcag cctcccgaac ctgtcggtgg ctgtgctgaa gacggagtag 1920
<210> 93
<211> 2260
<212> DNA
<213> Podospora anserina
<400> 93
atggctcttc aaaccttctt cctgctggcg gcagccatgc tggccaacgc agagacaaca 60
ggcgaaaagg tctctcggca agcaccgtct ggcgctcaag catgggccgc cgcccactcc 120
caggctgccg ccactctggc cagaatgtca cagcaagaca agatcaacat ggtcacgggc 180
attggctggg acagagggcc ttgcgtggga aacacagctg ccatcagctc catcaactat 240
cctcaaatct gtcttcagga tggaccattg ggcattcgct tcggcactgg taccaccgcc 300
ttcacacctg gcgtccaagc tgcttcgaca tgggacgttg atctgatccg gcagcgcggt 360
gcttacctgg gcgccgaagc caagggctgc ggcattcaca tccttttggg gcccgttgcc 420
ggtgccctgg gcaagattcc ccacggcggt cgcaactggg agggatttgg cgccgacccc 480
taccttgccg gtattgccat gaaggagacc atcgagggta ttcagtcagc aggcgtccag 540
gccaacgcca agcactacat tgcaaacgaa caagagctca accgcgagac catgagcagc 600
aatgtggatg accgcactca gcacgagctc tacctctggc cctttgccga cgccgtgcac 660
gccaacgtcg ccagcgtcat gtgcagttac aacaagctca atggcacgtg ggcttgcgag 720
aatgacaagg ctctgaatca gatcttgaag aaggagctcg gattccaggg ctacgttctc 780
agcgactgga atgctcagca cagcactgct ctgtctgcta acagtggtct ggacatgact 840
atgcccggta ccgatttcaa cggccgcaat gtctactggg gccctcaact gaacaacgct 900
gtcaacgccg gccaggttca gagatccaga ctagacgaca tgtgcaagag aatcttggct 960
ggctggtact tgctcggtca gaaccagggc tatcccgcca tcaacatcag ggccaacgtt 1020
cagggcaacc ataaggagaa cgtacgtgct gttgccagag acggcatcgt cttgctgaag 1080
aacgatggaa ttctgccgct ttccaagccg agaaagattg ctgtcgtggg ctcccactcc 1140
gtcaacaatc cccagggaat caacgcctgt gttgacaagg gctgcaatgt tggcaccctt 1200
ggcatgggct ggggttcagg cagcgtcaac tacccctatc tcgtgtcccc gtacgatgct 1260
ctccggactc gtgctcaggc cgatggcaca caaatcagcc tccacaacac tgacagcacc 1320
aacggtgtgt caaacgttgt gtctgacgct gatgctgttg ttgttgtcat cactgccgat 1380
tctggtgaag ggtacatcac tgtcgagggc cacgctggcg accgcagcca ccttgacccg 1440
tggcacaatg gcaaccaact tgttcaggct gccgcggctg ccaacaagaa cgtcatcgtt 1500
gttgtgcaca gtgttggcca gatcaccctg gagactatcc tcaacaccaa tggagtccgc 1560
gcgattgtgt gggctggtct tccgggccaa gagaatggca acgctcttgt tgatgttctc 1620
tacggcttgg tttcgccatc tggaaagctt ccctacacca ttggcaagag ggagtcggac 1680
tatggcacag ccgttgttcg tggggatgat aacttcaggg agggcctttt tgttgactac 1740
cgtcactttg acaatgccag gatcgagccg cgctatgagt ttggctttgg tctttgtaag 1800
ttccagcggc ggagttgggt ttgatttcaa gctttcctaa cctgataaaa cagcttacac 1860
caatttcacc ttctccgaca tcaagattac ttccaatgtc aagccggggc ccgctactgg 1920
ccagaccatt cccggcggac ctgccgacct gtgggaggac gttgcgacag tcactgcaac 1980
catcaccaac tcgggtgctg tcgagggcgc tgaggttgcc cagctttaca tcggcctgcc 2040
gtcctcggct cctgcctctc ccccgaagca gctgcgtgga ttttccaagc tgaagctggc 2100
cccgggtgcc agcggcactg ccacattcaa cctcagacgc agagatctca gctattggga 2160
tacccgcctc cagaactggg tcgtgcccag cggcaacttt gtcgtcagcg tcggcgccag 2220
ctcgagagat atccgcttga cgggcaccat cacggcgtag 2260
<210> 94
<211> 733
<212> PRT
<213> Podospora anserina
<400> 94
Met Ala Leu Gln Thr Phe Phe Leu Leu Ala Ala Ala Met Leu Ala Asn
1 5 10 15
Ala Glu Thr Thr Gly Glu Lys Val Ser Arg Gln Ala Pro Ser Gly Ala
20 25 30
Gln Ala Trp Ala Ala Ala His Ser Gln Ala Ala Ala Thr Leu Ala Arg
35 40 45
Met Ser Gln Gln Asp Lys Ile Asn Met Val Thr Gly Ile Gly Trp Asp
50 55 60
Arg Gly Pro Cys Val Gly Asn Thr Ala Ala Ile Ser Ser Ile Asn Tyr
65 70 75 80
Pro Gln Ile Cys Leu Gln Asp Gly Pro Leu Gly Ile Arg Phe Gly Thr
85 90 95
Gly Thr Thr Ala Phe Thr Pro Gly Val Gln Ala Ala Ser Thr Trp Asp
100 105 110
Val Asp Leu Ile Arg Gln Arg Gly Ala Tyr Leu Gly Ala Glu Ala Lys
115 120 125
Gly Cys Gly Ile His Ile Leu Leu Gly Pro Val Ala Gly Ala Leu Gly
130 135 140
Lys Ile Pro His Gly Gly Arg Asn Trp Glu Gly Phe Gly Ala Asp Pro
145 150 155 160
Tyr Leu Ala Gly Ile Ala Met Lys Glu Thr Ile Glu Gly Ile Gln Ser
165 170 175
Ala Gly Val Gln Ala Asn Ala Lys His Tyr Ile Ala Asn Glu Gln Glu
180 185 190
Leu Asn Arg Glu Thr Met Ser Ser Asn Val Asp Asp Arg Thr Gln His
195 200 205
Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val His Ala Asn Val Ala
210 215 220
Ser Val Met Cys Ser Tyr Asn Lys Leu Asn Gly Thr Trp Ala Cys Glu
225 230 235 240
Asn Asp Lys Ala Leu Asn Gln Ile Leu Lys Lys Glu Leu Gly Phe Gln
245 250 255
Gly Tyr Val Leu Ser Asp Trp Asn Ala Gln His Ser Thr Ala Leu Ser
260 265 270
Ala Asn Ser Gly Leu Asp Met Thr Met Pro Gly Thr Asp Phe Asn Gly
275 280 285
Arg Asn Val Tyr Trp Gly Pro Gln Leu Asn Asn Ala Val Asn Ala Gly
290 295 300
Gln Val Gln Arg Ser Arg Leu Asp Asp Met Cys Lys Arg Ile Leu Ala
305 310 315 320
Gly Trp Tyr Leu Leu Gly Gln Asn Gln Gly Tyr Pro Ala Ile Asn Ile
325 330 335
Arg Ala Asn Val Gln Gly Asn His Lys Glu Asn Val Arg Ala Val Ala
340 345 350
Arg Asp Gly Ile Val Leu Leu Lys Asn Asp Gly Ile Leu Pro Leu Ser
355 360 365
Lys Pro Arg Lys Ile Ala Val Val Gly Ser His Ser Val Asn Asn Pro
370 375 380
Gln Gly Ile Asn Ala Cys Val Asp Lys Gly Cys Asn Val Gly Thr Leu
385 390 395 400
Gly Met Gly Trp Gly Ser Gly Ser Val Asn Tyr Pro Tyr Leu Val Ser
405 410 415
Pro Tyr Asp Ala Leu Arg Thr Arg Ala Gln Ala Asp Gly Thr Gln Ile
420 425 430
Ser Leu His Asn Thr Asp Ser Thr Asn Gly Val Ser Asn Val Val Ser
435 440 445
Asp Ala Asp Ala Val Val Val Val Ile Thr Ala Asp Ser Gly Glu Gly
450 455 460
Tyr Ile Thr Val Glu Gly His Ala Gly Asp Arg Ser His Leu Asp Pro
465 470 475 480
Trp His Asn Gly Asn Gln Leu Val Gln Ala Ala Ala Ala Ala Asn Lys
485 490 495
Asn Val Ile Val Val Val His Ser Val Gly Gln Ile Thr Leu Glu Thr
500 505 510
Ile Leu Asn Thr Asn Gly Val Arg Ala Ile Val Trp Ala Gly Leu Pro
515 520 525
Gly Gln Glu Asn Gly Asn Ala Leu Val Asp Val Leu Tyr Gly Leu Val
530 535 540
Ser Pro Ser Gly Lys Leu Pro Tyr Thr Ile Gly Lys Arg Glu Ser Asp
545 550 555 560
Tyr Gly Thr Ala Val Val Arg Gly Asp Asp Asn Phe Arg Glu Gly Leu
565 570 575
Phe Val Asp Tyr Arg His Phe Asp Asn Ala Arg Ile Glu Pro Arg Tyr
580 585 590
Glu Phe Gly Phe Gly Leu Ser Tyr Thr Asn Phe Thr Phe Ser Asp Ile
595 600 605
Lys Ile Thr Ser Asn Val Lys Pro Gly Pro Ala Thr Gly Gln Thr Ile
610 615 620
Pro Gly Gly Pro Ala Asp Leu Trp Glu Asp Val Ala Thr Val Thr Ala
625 630 635 640
Thr Ile Thr Asn Ser Gly Ala Val Glu Gly Ala Glu Val Ala Gln Leu
645 650 655
Tyr Ile Gly Leu Pro Ser Ser Ala Pro Ala Ser Pro Pro Lys Gln Leu
660 665 670
Arg Gly Phe Ser Lys Leu Lys Leu Ala Pro Gly Ala Ser Gly Thr Ala
675 680 685
Thr Phe Asn Leu Arg Arg Arg Asp Leu Ser Tyr Trp Asp Thr Arg Leu
690 695 700
Gln Asn Trp Val Val Pro Ser Gly Asn Phe Val Val Ser Val Gly Ala
705 710 715 720
Ser Ser Arg Asp Ile Arg Leu Thr Gly Thr Ile Thr Ala
725 730
<210> 95
<211> 2551
<212> DNA
<213> Fusarium verticillioides
<400> 95
atgtttcctt cttccatatc ttgtttggcg gccctgagtc tgatgagcca gggtctacta 60
gctcagagcc aaccggaaaa tgtcatcacc gatgatacct acttctacgg tcaatcgcca 120
ccagtgtatc ctacacgtaa gcactctctc tgatttccca acgaaagcaa tactgatctc 180
ttgaccagcg gaacaggtag acaccggctc atgggctgcc gctgtagcca aagccaagaa 240
cttggtgtcc cagttgactc ttgaagagaa agtcaacttg actacaggag gccagacgac 300
caccggctgc tctggcttca tccctggcat tccccgtgta ggctttccag gactgtgttt 360
agcagacgct ggcaacggtg tccgcaacac agattatgtg agctcgtttc cctccgggat 420
tcatgtcggt gcaagctgga atccggagtt gacctacagc cggagctact acatgggtgc 480
tgaggccaaa gccaagggcg ttaacatcct tctcggtcca gtatttggac ctttgggccg 540
agtagttgaa ggtggacgca actgggaggg gttttccaat gatccctacc tggcgggtaa 600
attagggcat gaagctgtcg ccggtatcca agacgccgga gttgttgcat gcggaaaaca 660
tttccttgct caagagcagg agacccatag acttgcggcg tctgtcactg gggctgatgc 720
aatctcatca aatctcgatg acaagacact ccatgaatta tatctctggt aagcacatca 780
tatcttggct gagtagatga accttactaa cacccgaact gggcttttcg ctgatgcagt 840
ccacgccgga cttgccagtg tgatgtgcag ctacaacaga gcaaacaatt cacacgcctg 900
ccaaaactcg aagcttctca atggccttct caagggcgag ttaggattcc agggttttgt 960
cgtctcggac tggggcgcac agcaatctgg tatggcttca gcattggctg gcctggatgt 1020
tgtcatgccc agctcgatct tgtggggtgc caaccttacc cttggtgtga acaacggaac 1080
tattcccgag tcacaggttg acaatatggt tacacggtac gcgaagtctc agccttactt 1140
ctcaattctt ttgaactgac aatcgtgtag gctccttgca acttggtatc agttgaacca 1200
ggaccaagac accgaagccc caggtcacgg actcgctgcc aagctttggg agcctcaccc 1260
agtagtcgac gctcgcaacg caagctccaa gcctactatc tgggacggtg cagtcgaggg 1320
ccatgttctt gttaagaaca ccaacaacgc actgccattc aagcccaaca tgaaactcgt 1380
ttctttgttc ggatactctc acaaagctcc tgataagaac atcccagacc ccgcccaagg 1440
catgttctcc gcttggtcta tcggtgccca atccgccaac atcactgagc tgaacctcgg 1500
ctttctcgga aatttgagtc tcacatactc cgccatcgcg cccaacggaa ccatcatctc 1560
gggtggaggc tcgggtgcca gcgcttggac tctgttcagc tcacccttcg atgcattcgt 1620
ttctcgggcg aagaaagagg gtactgcgct tttctgggat tttgagagct gggatcctta 1680
tgtgaaccct acatctgaag cttgcatcgt tgctggtaat gcatgggcta gcgaaggctg 1740
ggatagacct gcaacctatg atgcctatac tgatgagctc atcaataacg tcgctgacaa 1800
gtgcgctaac actattgttg ttcttcacaa tgctggaaca cgacttgtgg atggcttctt 1860
tggtcacccc aacgtcaccg ctattatcta cgctcatctc ccaggtcagg atagtggaga 1920
tgctctggta tctttgctct atggcgatga gaacccatct ggtcgcctcc cttacaccgt 1980
tgcccgcaac gagacggatt atggtcacct gctgaagcca gacttgactc tcgcccccaa 2040
ccagtaccaa cactttcccc agtccgactt ctccgagggt attttcattg actaccgaca 2100
tttcgatgct aagaacatca cgcctcgctt cgagtttggt ttcggcttga gctacacaac 2160
ctttgagtac gctagtctcc agatctcaaa gtcccaggcc cagacaccgg aatacccagc 2220
tggtgctctt accgagggag gccgttcaga tttgtgggac gtcgttgcta ctgtcacagc 2280
aagcgtcagg aacactgggt ctgtcgacgg caaggaggtt gcacagctat acgttggtgt 2340
tccaggtggt cctatgagac agctacgtgg ctttacgaaa ccagctatta aggctggaga 2400
gacggctaca gtgacctttg agcttactcg ccgcgacttg agtgtctggg atgttaatgc 2460
gcaggagtgg caacttcagc aaggcaacta tgctatctac gttggccgaa gtagtcgaga 2520
tttgcctctg caaagtacct tgagcatcta g 2551
<210> 96
<211> 780
<212> PRT
<213> Fusarium verticillioides
<400> 96
Met Phe Pro Ser Ser Ile Ser Cys Leu Ala Ala Leu Ser Leu Met Ser
1 5 10 15
Gln Gly Leu Leu Ala Gln Ser Gln Pro Glu Asn Val Ile Thr Asp Asp
20 25 30
Thr Tyr Phe Tyr Gly Gln Ser Pro Pro Val Tyr Pro Thr His Thr Gly
35 40 45
Ser Trp Ala Ala Ala Val Ala Lys Ala Lys Asn Leu Val Ser Gln Leu
50 55 60
Thr Leu Glu Glu Lys Val Asn Leu Thr Thr Gly Gly Gln Thr Thr Thr
65 70 75 80
Gly Cys Ser Gly Phe Ile Pro Gly Ile Pro Arg Val Gly Phe Pro Gly
85 90 95
Leu Cys Leu Ala Asp Ala Gly Asn Gly Val Arg Asn Thr Asp Tyr Val
100 105 110
Ser Ser Phe Pro Ser Gly Ile His Val Gly Ala Ser Trp Asn Pro Glu
115 120 125
Leu Thr Tyr Ser Arg Ser Tyr Tyr Met Gly Ala Glu Ala Lys Ala Lys
130 135 140
Gly Val Asn Ile Leu Leu Gly Pro Val Phe Gly Pro Leu Gly Arg Val
145 150 155 160
Val Glu Gly Gly Arg Asn Trp Glu Gly Phe Ser Asn Asp Pro Tyr Leu
165 170 175
Ala Gly Lys Leu Gly His Glu Ala Val Ala Gly Ile Gln Asp Ala Gly
180 185 190
Val Val Ala Cys Gly Lys His Phe Leu Ala Gln Glu Gln Glu Thr His
195 200 205
Arg Leu Ala Ala Ser Val Thr Gly Ala Asp Ala Ile Ser Ser Asn Leu
210 215 220
Asp Asp Lys Thr Leu His Glu Leu Tyr Leu Cys Val Met Cys Ser Tyr
225 230 235 240
Asn Arg Ala Asn Asn Ser His Ala Cys Gln Asn Ser Lys Leu Leu Asn
245 250 255
Gly Leu Leu Lys Gly Glu Leu Gly Phe Gln Gly Phe Val Val Ser Asp
260 265 270
Trp Gly Ala Gln Gln Ser Gly Met Ala Ser Ala Leu Ala Gly Leu Asp
275 280 285
Val Val Met Pro Ser Ser Ile Leu Trp Gly Ala Asn Leu Thr Leu Gly
290 295 300
Val Asn Asn Gly Thr Ile Pro Glu Ser Gln Val Asp Asn Met Val Thr
305 310 315 320
Arg Leu Leu Ala Thr Trp Tyr Gln Leu Asn Gln Asp Gln Asp Thr Glu
325 330 335
Ala Pro Gly His Gly Leu Ala Ala Lys Leu Trp Glu Pro His Pro Val
340 345 350
Val Asp Ala Arg Asn Ala Ser Ser Lys Pro Thr Ile Trp Asp Gly Ala
355 360 365
Val Glu Gly His Val Leu Val Lys Asn Thr Asn Asn Ala Leu Pro Phe
370 375 380
Lys Pro Asn Met Lys Leu Val Ser Leu Phe Gly Tyr Ser His Lys Ala
385 390 395 400
Pro Asp Lys Asn Ile Pro Asp Pro Ala Gln Gly Met Phe Ser Ala Trp
405 410 415
Ser Ile Gly Ala Gln Ser Ala Asn Ile Thr Glu Leu Asn Leu Gly Phe
420 425 430
Leu Gly Asn Leu Ser Leu Thr Tyr Ser Ala Ile Ala Pro Asn Gly Thr
435 440 445
Ile Ile Ser Gly Gly Gly Ser Gly Ala Ser Ala Trp Thr Leu Phe Ser
450 455 460
Ser Pro Phe Asp Ala Phe Val Ser Arg Ala Lys Lys Glu Gly Thr Ala
465 470 475 480
Leu Phe Trp Asp Phe Glu Ser Trp Asp Pro Tyr Val Asn Pro Thr Ser
485 490 495
Glu Ala Cys Ile Val Ala Gly Asn Ala Trp Ala Ser Glu Gly Trp Asp
500 505 510
Arg Pro Ala Thr Tyr Asp Ala Tyr Thr Asp Glu Leu Ile Asn Asn Val
515 520 525
Ala Asp Lys Cys Ala Asn Thr Ile Val Val Leu His Asn Ala Gly Thr
530 535 540
Arg Leu Val Asp Gly Phe Phe Gly His Pro Asn Val Thr Ala Ile Ile
545 550 555 560
Tyr Ala His Leu Pro Gly Gln Asp Ser Gly Asp Ala Leu Val Ser Leu
565 570 575
Leu Tyr Gly Asp Glu Asn Pro Ser Gly Arg Leu Pro Tyr Thr Val Ala
580 585 590
Arg Asn Glu Thr Asp Tyr Gly His Leu Leu Lys Pro Asp Leu Thr Leu
595 600 605
Ala Pro Asn Gln Tyr Gln His Phe Pro Gln Ser Asp Phe Ser Glu Gly
610 615 620
Ile Phe Ile Asp Tyr Arg His Phe Asp Ala Lys Asn Ile Thr Pro Arg
625 630 635 640
Phe Glu Phe Gly Phe Gly Leu Ser Tyr Thr Thr Phe Glu Tyr Ala Ser
645 650 655
Leu Gln Ile Ser Lys Ser Gln Ala Gln Thr Pro Glu Tyr Pro Ala Gly
660 665 670
Ala Leu Thr Glu Gly Gly Arg Ser Asp Leu Trp Asp Val Val Ala Thr
675 680 685
Val Thr Ala Ser Val Arg Asn Thr Gly Ser Val Asp Gly Lys Glu Val
690 695 700
Ala Gln Leu Tyr Val Gly Val Pro Gly Gly Pro Met Arg Gln Leu Arg
705 710 715 720
Gly Phe Thr Lys Pro Ala Ile Lys Ala Gly Glu Thr Ala Thr Val Thr
725 730 735
Phe Glu Leu Thr Arg Arg Asp Leu Ser Val Trp Asp Val Asn Ala Gln
740 745 750
Glu Trp Gln Leu Gln Gln Gly Asn Tyr Ala Ile Tyr Val Gly Arg Ser
755 760 765
Ser Arg Asp Leu Pro Leu Gln Ser Thr Leu Ser Ile
770 775 780
<210> 97
<211> 2487
<212> DNA
<213> Fusarium verticillioides
<400> 97
atggctagca ttcgatctgt gttggtctcg ggtcttttgg ccgcgggtgt caatgcccaa 60
gcctacgatg cgagtgatcg cgctgaagat gctttcagct gggtccagcc caagaacacc 120
actattcttg gacagtacgg ccattcgcct cattaccctg ccagtatgtt caccaactac 180
accaagtgac actgaggctg tactgacatt ctagacaatg ctactggcaa gggctgggaa 240
gatgccttcg ccaaggctca aaactttgtc tcccaactaa ccctcgagga aaaggccgac 300
atggtcacag gaactccagg tccttgcgtc ggcaacatcg tcgccattcc ccgtctcaac 360
ttcaacggtc tctgtcttca cgacggcccc ctcgccatcc gagtagcaga ctacgccagt 420
gttttccccg ctggtgtatc agccgcttca tcgtgggaca aggacctcct ctaccagcgc 480
ggtctcgcca tgggtcaaga gttcaaggcc aagggtgctc acatcctcct cggccccgtc 540
gccggtcctc ttggccgctc ggcatactct ggtcgtaact gggagggttt ctcgccggac 600
ccttacctca ctggtattgc gatggaggag actatcatgg gacatcaaga tgctggtgtt 660
caggctactg cgaagcactt tatcggtaat gagcaggagg tcatgcgaaa ccctactttt 720
gtcaaggatg ggtatattgg tgaggttgac aaggaggctc tttcgtctaa catggatgat 780
cgaaccatgc acgagcttta cctctggccc tttgccaatg ctgttcatgc caaggcttcc 840
agcatgatgt gctcgtacca gcgtctcaac ggctcctacg cctgccagaa ctcaaaggtc 900
ctcaacggaa ttctgcgtga tgagcttggt ttccagggct acgtcatgtc agattggggt 960
gccacccacg ccggtgttgc tgccatcaac agcggtctcg acatggacat gcccggtggt 1020
atcggtgcct acggaacata ctttaccaag tccttcttcg gcggcaacct cacccgcgcc 1080
gtcaccaacg gcaccctcga cgagacccgc gtcaacgaca tgatcacccg catcatgact 1140
ccctacttct ggctcggcca ggacaaggac tatccctccg tcgacccctc cagcggtgat 1200
ctcaacacct tcagccccaa gagctcctgg ttccgcgagt tcaacctcac cggcgagcgc 1260
agccgtgacg tccgcggtaa ccacggcgac ttgatccgca agcacggcgc cgagtctacc 1320
gtccttctca agaacgagaa gaacgccctt cccctcaaga agcccaagtc catcgctgtc 1380
tttggcaacg atgctggtga tatcactgag ggtttctaca accagaatga ctacgaattt 1440
ggcactcttg ttgctggtgg tggctctgga actggtcgtt tgacatacct tgtttcgcct 1500
ctagccgcca tcaatgctcg tgctaagcag gacggtactc ttgttcagca gtggatgaac 1560
aacactctta ttgctaccac caacgtcact gatctctgga tccctgctac tcccgatgtc 1620
tgcctcgttt tcttgaagac ttgggctgag gaggctgctg atcgtgagca cctctccgtt 1680
gactgggacg gtaatgatgt tgttgagtct gttgccaagt actgcaataa cactgtcgtc 1740
gtcactcact cttctggtat caacactctt ccttgggctg accaccccaa cgtcaccgct 1800
attctcgctg cccacttccc cggtcaggag tctggcaact ccctcgttga cctcctctac 1860
ggcgatgtca acccctctgg tcgtcttccc tacaccatcg ccttcaacgg caccgactac 1920
aacgctcccc ccaccactgc cgtcaacacc accggcaagg aggactggca gtcttggttc 1980
gacgagaagc tcgagattga ctaccgctac ttcgacgcgc acaacatctc cgtccgctac 2040
gaattcggct tcggtctctc ctactccacc ttcgaaatct ccgacatctc cgctgagcca 2100
ctcgcatccg acattacctc ccagcccgag gatctccccg tgcagcccgg cggcaacccc 2160
gccctctggg agaccgtcta caacgtgacc gtctccgtct ccaacacggg caaggtcgac 2220
ggcgccactg tcccccagct atacgtgaca ttccccgaca gcgcgcctgc cggtacacca 2280
cccaagcagc tccgtgggtt cgacaaggtc ttccttgagg ctggcgagag caagagtgtc 2340
agctttgagc tgatgcgccg tgatctgagc tactgggata tcatttctca gaagtggctc 2400
atccctgagg gagagtttac tattcgtgtt ggattcagca gtcgggactt gaaggaggag 2460
acaaaggtta ctgttgttga ggcgtaa 2487
<210> 98
<211> 811
<212> PRT
<213> Fusarium verticillioides
<400> 98
Met Ala Ser Ile Arg Ser Val Leu Val Ser Gly Leu Leu Ala Ala Gly
1 5 10 15
Val Asn Ala Gln Ala Tyr Asp Ala Ser Asp Arg Ala Glu Asp Ala Phe
20 25 30
Ser Trp Val Gln Pro Lys Asn Thr Thr Ile Leu Gly Gln Tyr Gly His
35 40 45
Ser Pro His Tyr Pro Ala Asn Asn Ala Thr Gly Lys Gly Trp Glu Asp
50 55 60
Ala Phe Ala Lys Ala Gln Asn Phe Val Ser Gln Leu Thr Leu Glu Glu
65 70 75 80
Lys Ala Asp Met Val Thr Gly Thr Pro Gly Pro Cys Val Gly Asn Ile
85 90 95
Val Ala Ile Pro Arg Leu Asn Phe Asn Gly Leu Cys Leu His Asp Gly
100 105 110
Pro Leu Ala Ile Arg Val Ala Asp Tyr Ala Ser Val Phe Pro Ala Gly
115 120 125
Val Ser Ala Ala Ser Ser Trp Asp Lys Asp Leu Leu Tyr Gln Arg Gly
130 135 140
Leu Ala Met Gly Gln Glu Phe Lys Ala Lys Gly Ala His Ile Leu Leu
145 150 155 160
Gly Pro Val Ala Gly Pro Leu Gly Arg Ser Ala Tyr Ser Gly Arg Asn
165 170 175
Trp Glu Gly Phe Ser Pro Asp Pro Tyr Leu Thr Gly Ile Ala Met Glu
180 185 190
Glu Thr Ile Met Gly His Gln Asp Ala Gly Val Gln Ala Thr Ala Lys
195 200 205
His Phe Ile Gly Asn Glu Gln Glu Val Met Arg Asn Pro Thr Phe Val
210 215 220
Lys Asp Gly Tyr Ile Gly Glu Val Asp Lys Glu Ala Leu Ser Ser Asn
225 230 235 240
Met Asp Asp Arg Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asn
245 250 255
Ala Val His Ala Lys Ala Ser Ser Met Met Cys Ser Tyr Gln Arg Leu
260 265 270
Asn Gly Ser Tyr Ala Cys Gln Asn Ser Lys Val Leu Asn Gly Ile Leu
275 280 285
Arg Asp Glu Leu Gly Phe Gln Gly Tyr Val Met Ser Asp Trp Gly Ala
290 295 300
Thr His Ala Gly Val Ala Ala Ile Asn Ser Gly Leu Asp Met Asp Met
305 310 315 320
Pro Gly Gly Ile Gly Ala Tyr Gly Thr Tyr Phe Thr Lys Ser Phe Phe
325 330 335
Gly Gly Asn Leu Thr Arg Ala Val Thr Asn Gly Thr Leu Asp Glu Thr
340 345 350
Arg Val Asn Asp Met Ile Thr Arg Ile Met Thr Pro Tyr Phe Trp Leu
355 360 365
Gly Gln Asp Lys Asp Tyr Pro Ser Val Asp Pro Ser Ser Gly Asp Leu
370 375 380
Asn Thr Phe Ser Pro Lys Ser Ser Trp Phe Arg Glu Phe Asn Leu Thr
385 390 395 400
Gly Glu Arg Ser Arg Asp Val Arg Gly Asn His Gly Asp Leu Ile Arg
405 410 415
Lys His Gly Ala Glu Ser Thr Val Leu Leu Lys Asn Glu Lys Asn Ala
420 425 430
Leu Pro Leu Lys Lys Pro Lys Ser Ile Ala Val Phe Gly Asn Asp Ala
435 440 445
Gly Asp Ile Thr Glu Gly Phe Tyr Asn Gln Asn Asp Tyr Glu Phe Gly
450 455 460
Thr Leu Val Ala Gly Gly Gly Ser Gly Thr Gly Arg Leu Thr Tyr Leu
465 470 475 480
Val Ser Pro Leu Ala Ala Ile Asn Ala Arg Ala Lys Gln Asp Gly Thr
485 490 495
Leu Val Gln Gln Trp Met Asn Asn Thr Leu Ile Ala Thr Thr Asn Val
500 505 510
Thr Asp Leu Trp Ile Pro Ala Thr Pro Asp Val Cys Leu Val Phe Leu
515 520 525
Lys Thr Trp Ala Glu Glu Ala Ala Asp Arg Glu His Leu Ser Val Asp
530 535 540
Trp Asp Gly Asn Asp Val Val Glu Ser Val Ala Lys Tyr Cys Asn Asn
545 550 555 560
Thr Val Val Val Thr His Ser Ser Gly Ile Asn Thr Leu Pro Trp Ala
565 570 575
Asp His Pro Asn Val Thr Ala Ile Leu Ala Ala His Phe Pro Gly Gln
580 585 590
Glu Ser Gly Asn Ser Leu Val Asp Leu Leu Tyr Gly Asp Val Asn Pro
595 600 605
Ser Gly Arg Leu Pro Tyr Thr Ile Ala Phe Asn Gly Thr Asp Tyr Asn
610 615 620
Ala Pro Pro Thr Thr Ala Val Asn Thr Thr Gly Lys Glu Asp Trp Gln
625 630 635 640
Ser Trp Phe Asp Glu Lys Leu Glu Ile Asp Tyr Arg Tyr Phe Asp Ala
645 650 655
His Asn Ile Ser Val Arg Tyr Glu Phe Gly Phe Gly Leu Ser Tyr Ser
660 665 670
Thr Phe Glu Ile Ser Asp Ile Ser Ala Glu Pro Leu Ala Ser Asp Ile
675 680 685
Thr Ser Gln Pro Glu Asp Leu Pro Val Gln Pro Gly Gly Asn Pro Ala
690 695 700
Leu Trp Glu Thr Val Tyr Asn Val Thr Val Ser Val Ser Asn Thr Gly
705 710 715 720
Lys Val Asp Gly Ala Thr Val Pro Gln Leu Tyr Val Thr Phe Pro Asp
725 730 735
Ser Ala Pro Ala Gly Thr Pro Pro Lys Gln Leu Arg Gly Phe Asp Lys
740 745 750
Val Phe Leu Glu Ala Gly Glu Ser Lys Ser Val Ser Phe Glu Leu Met
755 760 765
Arg Arg Asp Leu Ser Tyr Trp Asp Ile Ile Ser Gln Lys Trp Leu Ile
770 775 780
Pro Glu Gly Glu Phe Thr Ile Arg Val Gly Phe Ser Ser Arg Asp Leu
785 790 795 800
Lys Glu Glu Thr Lys Val Thr Val Val Glu Ala
805 810
<210> 99
<211> 3269
<212> DNA
<213> Fusarium verticillioides
<400> 99
atgaagctga attgggtcgc cgcagccctg tctataggtg ctgctggcac tgacagcgca 60
gttgctcttg cttctgcagt tccagacact ttggctggtg taaaggtcag ttttttttca 120
ccatttcctc gtctaatctc agccttgttg ccatatcgcc cttgttcgct cggacgccac 180
gcaccagatc gcgatcattt cctcccttgc agccttggtt cctcttacga tcttccctcc 240
gcaattatca gcgcccttag tctacacaaa aacccccgag acagtctttc attgagtttg 300
tcgacatcaa gttgcttctc aactgtgcat ttgcgtggct gtctacttct gcctctagac 360
aaccaaatct gggcgcaatt gaccgctcaa accttgttca aataaccttt tttattcgag 420
acgcacattt ataaatatgc gcctttcaat aataccgact ttatgcgcgg cggctgctgt 480
ggcggttgat cagaaagctg acgctcaaaa ggttgtcacg agagatacac tcgcatactc 540
gccgcctcat tatccttcac catggatgga ccctaatgct gttggctggg aggaagctta 600
cgccaaagcc aagagctttg tgtcccaact cactctcatg gaaaaggtca acttgaccac 660
tggtgttggg taagcagctc cttgcaaaca gggtatctca atcccctcag ctaacaactt 720
ctcagatggc aaggcgaacg ctgtgtagga aacgtgggat caattcctcg tctcggtatg 780
cgaggtctct gtctccagga tggtcctctt ggaattcgtc tgtccgacta caacagcgct 840
tttcccgctg gcaccacagc tggtgcttct tggagcaagt ctctctggta tgagagaggt 900
ctcctgatgg gcactgagtt caaggagaag ggtatcgata tcgctcttgg tcctgctact 960
ggacctcttg gtcgcactgc tgctggtgga cgaaactggg aaggcttcac cgttgatcct 1020
tatatggctg gccacgccat ggccgaggcc gtcaagggta ttcaagacgc aggtgtcatt 1080
gcttgtgcta agcattacat cgcaaacgag cagggtaagc cacttggacg atttgaggaa 1140
ttgacagaga actgaccctc ttgtagagca cttccgacag agtggcgagg tccagtcccg 1200
caagtacaac atctccgagt ctctctcctc caacctggat gacaagacta tgcacgagct 1260
ctacgcctgg cccttcgctg acgccgtccg cgccggcgtc ggttccgtca tgtgctcgta 1320
caaccagatc aacaactcgt acggttgcca gaactccaag ctcctcaacg gtatcctcaa 1380
ggacgagatg ggcttccagg gtttcgtcat gagcgattgg gcggcccagc ataccggtgc 1440
cgcttctgcc gtcgctggtc tcgatatgag catgcctggt gacactgcct tcgacagcgg 1500
atacagcttc tggggcggaa acttgactct ggctgtcatc aacggaactg ttcccgcctg 1560
gcgagttgat gacatggctc tgcgaatcat gtctgccttc ttcaaggttg gaaagacgat 1620
agaggatctt cccgacatca acttctcctc ctggacccgc gacaccttcg gcttcgtgca 1680
tacatttgct caagagaacc gcgagcaggt caactttgga gtcaacgtcc agcacgacca 1740
caagagccac atccgtgagg ccgctgccaa gggaagcgtc gtgctcaaga acaccgggtc 1800
ccttcccctc aagaacccaa agttcctcgc tgtcattggt gaggacgccg gtcccaaccc 1860
tgctggaccc aatggttgtg gtgaccgtgg ttgcgataat ggtaccctgg ctatggcttg 1920
gggctcggga acttcccaat tcccttactt gatcaccccc gatcaagggc tctctaatcg 1980
agctactcaa gacggaactc gatatgagag catcttgacc aacaacgaat gggcttcagt 2040
acaagctctt gtcagccagc ctaacgtgac cgctatcgtt ttcgccaatg ccgactctgg 2100
tgagggatac attgaagtcg acggaaactt tggtgatcgc aagaacctca ccctctggca 2160
gcagggagac gagctcatca agaacgtgtc gtccatatgc cccaacacca ttgtagttct 2220
gcacaccgtc ggccctgtcc tactcgccga ctacgagaag aaccccaaca tcactgccat 2280
cgtctgggct ggtcttcccg gccaagagtc aggcaatgcc atcgctgatc tcctctacgg 2340
caaggtcagc cctggccgat ctcccttcac ttggggccgc acccgcgaga gctacggtac 2400
tgaggttctt tatgaggcga acaacggccg tggcgctcct caggatgact tctctgaggg 2460
tgtcttcatc gactaccgtc acttcgaccg acgatctcca agcaccgatg gaaagagctc 2520
tcccaacaac accgctgctc ctctctacga gttcggtcac ggtctatctt ggtccacctt 2580
tgagtactct gacctcaaca tccagaagaa cgtcgagaac ccctactctc ctcccgctgg 2640
ccagaccatc cccgccccaa cctttggcaa cttcagcaag aacctcaacg actacgtgtt 2700
ccccaagggc gtccgataca tctacaagtt catctacccc ttcctcaaca cctcctcatc 2760
cgccagcgag gcatccaacg atggtggcca gtttggtaag actgccgaag agttcctccc 2820
tcccaacgcc ctcaacggct cagcccagcc tcgtcttccc gcctctggtg ccccaggtgg 2880
taaccctcaa ttgtgggaca tcttgtacac cgtcacagcc acaatcacca acacaggcaa 2940
cgccacctcc gacgagattc cccagctgta tgtcagcctc ggtggcgaga acgagcccat 3000
ccgtgttctc cgcggtttcg accgtatcga gaacattgct cccggccaga gcgccatctt 3060
caacgctcaa ttgacccgtc gcgatctgag taactgggat acaaatgccc agaactgggt 3120
catcactgac catcccaaga ctgtctgggt tggaagcagc tctcgcaagc tgcctctcag 3180
cgccaagttg gagtaagaaa gccaaacaag ggttgttttt tggactgcaa ttttttggga 3240
ggacatagta gccgcgcgcc agttacgtc 3269
<210> 100
<211> 899
<212> PRT
<213> Fusarium verticillioides
<400> 100
Met Lys Leu Asn Trp Val Ala Ala Ala Leu Ser Ile Gly Ala Ala Gly
1 5 10 15
Thr Asp Ser Ala Val Ala Leu Ala Ser Ala Val Pro Asp Thr Leu Ala
20 25 30
Gly Val Lys Lys Ala Asp Ala Gln Lys Val Val Thr Arg Asp Thr Leu
35 40 45
Ala Tyr Ser Pro Pro His Tyr Pro Ser Pro Trp Met Asp Pro Asn Ala
50 55 60
Val Gly Trp Glu Glu Ala Tyr Ala Lys Ala Lys Ser Phe Val Ser Gln
65 70 75 80
Leu Thr Leu Met Glu Lys Val Asn Leu Thr Thr Gly Val Gly Trp Gln
85 90 95
Gly Glu Arg Cys Val Gly Asn Val Gly Ser Ile Pro Arg Leu Gly Met
100 105 110
Arg Gly Leu Cys Leu Gln Asp Gly Pro Leu Gly Ile Arg Leu Ser Asp
115 120 125
Tyr Asn Ser Ala Phe Pro Ala Gly Thr Thr Ala Gly Ala Ser Trp Ser
130 135 140
Lys Ser Leu Trp Tyr Glu Arg Gly Leu Leu Met Gly Thr Glu Phe Lys
145 150 155 160
Glu Lys Gly Ile Asp Ile Ala Leu Gly Pro Ala Thr Gly Pro Leu Gly
165 170 175
Arg Thr Ala Ala Gly Gly Arg Asn Trp Glu Gly Phe Thr Val Asp Pro
180 185 190
Tyr Met Ala Gly His Ala Met Ala Glu Ala Val Lys Gly Ile Gln Asp
195 200 205
Ala Gly Val Ile Ala Cys Ala Lys His Tyr Ile Ala Asn Glu Gln Glu
210 215 220
His Phe Arg Gln Ser Gly Glu Val Gln Ser Arg Lys Tyr Asn Ile Ser
225 230 235 240
Glu Ser Leu Ser Ser Asn Leu Asp Asp Lys Thr Met His Glu Leu Tyr
245 250 255
Ala Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ser Val Met
260 265 270
Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Gln Asn Ser Lys
275 280 285
Leu Leu Asn Gly Ile Leu Lys Asp Glu Met Gly Phe Gln Gly Phe Val
290 295 300
Met Ser Asp Trp Ala Ala Gln His Thr Gly Ala Ala Ser Ala Val Ala
305 310 315 320
Gly Leu Asp Met Ser Met Pro Gly Asp Thr Ala Phe Asp Ser Gly Tyr
325 330 335
Ser Phe Trp Gly Gly Asn Leu Thr Leu Ala Val Ile Asn Gly Thr Val
340 345 350
Pro Ala Trp Arg Val Asp Asp Met Ala Leu Arg Ile Met Ser Ala Phe
355 360 365
Phe Lys Val Gly Lys Thr Ile Glu Asp Leu Pro Asp Ile Asn Phe Ser
370 375 380
Ser Trp Thr Arg Asp Thr Phe Gly Phe Val His Thr Phe Ala Gln Glu
385 390 395 400
Asn Arg Glu Gln Val Asn Phe Gly Val Asn Val Gln His Asp His Lys
405 410 415
Ser His Ile Arg Glu Ala Ala Ala Lys Gly Ser Val Val Leu Lys Asn
420 425 430
Thr Gly Ser Leu Pro Leu Lys Asn Pro Lys Phe Leu Ala Val Ile Gly
435 440 445
Glu Asp Ala Gly Pro Asn Pro Ala Gly Pro Asn Gly Cys Gly Asp Arg
450 455 460
Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser Gly Thr Ser
465 470 475 480
Gln Phe Pro Tyr Leu Ile Thr Pro Asp Gln Gly Leu Ser Asn Arg Ala
485 490 495
Thr Gln Asp Gly Thr Arg Tyr Glu Ser Ile Leu Thr Asn Asn Glu Trp
500 505 510
Ala Ser Val Gln Ala Leu Val Ser Gln Pro Asn Val Thr Ala Ile Val
515 520 525
Phe Ala Asn Ala Asp Ser Gly Glu Gly Tyr Ile Glu Val Asp Gly Asn
530 535 540
Phe Gly Asp Arg Lys Asn Leu Thr Leu Trp Gln Gln Gly Asp Glu Leu
545 550 555 560
Ile Lys Asn Val Ser Ser Ile Cys Pro Asn Thr Ile Val Val Leu His
565 570 575
Thr Val Gly Pro Val Leu Leu Ala Asp Tyr Glu Lys Asn Pro Asn Ile
580 585 590
Thr Ala Ile Val Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly Asn Ala
595 600 605
Ile Ala Asp Leu Leu Tyr Gly Lys Val Ser Pro Gly Arg Ser Pro Phe
610 615 620
Thr Trp Gly Arg Thr Arg Glu Ser Tyr Gly Thr Glu Val Leu Tyr Glu
625 630 635 640
Ala Asn Asn Gly Arg Gly Ala Pro Gln Asp Asp Phe Ser Glu Gly Val
645 650 655
Phe Ile Asp Tyr Arg His Phe Asp Arg Arg Ser Pro Ser Thr Asp Gly
660 665 670
Lys Ser Ser Pro Asn Asn Thr Ala Ala Pro Leu Tyr Glu Phe Gly His
675 680 685
Gly Leu Ser Trp Ser Thr Phe Glu Tyr Ser Asp Leu Asn Ile Gln Lys
690 695 700
Asn Val Glu Asn Pro Tyr Ser Pro Pro Ala Gly Gln Thr Ile Pro Ala
705 710 715 720
Pro Thr Phe Gly Asn Phe Ser Lys Asn Leu Asn Asp Tyr Val Phe Pro
725 730 735
Lys Gly Val Arg Tyr Ile Tyr Lys Phe Ile Tyr Pro Phe Leu Asn Thr
740 745 750
Ser Ser Ser Ala Ser Glu Ala Ser Asn Asp Gly Gly Gln Phe Gly Lys
755 760 765
Thr Ala Glu Glu Phe Leu Pro Pro Asn Ala Leu Asn Gly Ser Ala Gln
770 775 780
Pro Arg Leu Pro Ala Ser Gly Ala Pro Gly Gly Asn Pro Gln Leu Trp
785 790 795 800
Asp Ile Leu Tyr Thr Val Thr Ala Thr Ile Thr Asn Thr Gly Asn Ala
805 810 815
Thr Ser Asp Glu Ile Pro Gln Leu Tyr Val Ser Leu Gly Gly Glu Asn
820 825 830
Glu Pro Ile Arg Val Leu Arg Gly Phe Asp Arg Ile Glu Asn Ile Ala
835 840 845
Pro Gly Gln Ser Ala Ile Phe Asn Ala Gln Leu Thr Arg Arg Asp Leu
850 855 860
Ser Asn Trp Asp Thr Asn Ala Gln Asn Trp Val Ile Thr Asp His Pro
865 870 875 880
Lys Thr Val Trp Val Gly Ser Ser Ser Arg Lys Leu Pro Leu Ser Ala
885 890 895
Lys Leu Glu
<210> 101
<211> 2370
<212> DNA
<213> Trichoderma reesei
<400> 101
atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60
agtcagtata gctggtccca tactgggatg tgatatgtat cctggagaca ccatgctgac 120
tcttgaatca aggtagctca acatcggggg cctcggctga ggcagttgta cctcctgcag 180
ggactccatg gggaaccgcg tacgacaagg cgaaggccgc attggcaaag ctcaatctcc 240
aagataaggt cggcatcgtg agcggtgtcg gctggaacgg cggtccttgc gttggaaaca 300
catctccggc ctccaagatc agctatccat cgctatgcct tcaagacgga cccctcggtg 360
ttcgatactc gacaggcagc acagccttta cgccgggcgt tcaagcggcc tcgacgtggg 420
atgtcaattt gatccgcgaa cgtggacagt tcatcggtga ggaggtgaag gcctcgggga 480
ttcatgtcat acttggtcct gtggctgggc cgctgggaaa gactccgcag ggcggtcgca 540
actgggaggg cttcggtgtc gatccatatc tcacgggcat tgccatgggt caaaccatca 600
acggcatcca gtcggtaggc gtgcaggcga cagcgaagca ctatatcctc aacgagcagg 660
agctcaatcg agaaaccatt tcgagcaacc cagatgaccg aactctccat gagctgtata 720
cttggccatt tgccgacgcg gttcaggcca atgtcgcttc tgtcatgtgc tcgtacaaca 780
aggtcaatac cacctgggcc tgcgaggatc agtacacgct gcagactgtg ctgaaagacc 840
agctggggtt cccaggctat gtcatgacgg actggaacgc acagcacacg actgtccaaa 900
gcgcgaattc tgggcttgac atgtcaatgc ctggcacaga cttcaacggt aacaatcggc 960
tctggggtcc agctctcacc aatgcggtaa atagcaatca ggtccccacg agcagagtcg 1020
acgatatggt gactcgtatc ctcgccgcat ggtacttgac aggccaggac caggcaggct 1080
atccgtcgtt caacatcagc agaaatgttc aaggaaacca caagaccaat gtcagggcaa 1140
ttgccaggga cggcatcgtt ctgctcaaga atgacgccaa catcctgccg ctcaagaagc 1200
ccgctagcat tgccgtcgtt ggatctgccg caatcattgg taaccacgcc agaaactcgc 1260
cctcgtgcaa cgacaaaggc tgcgacgacg gggccttggg catgggttgg ggttccggcg 1320
ccgtcaacta tccgtacttc gtcgcgccct acgatgccat caataccaga gcgtcttcgc 1380
agggcaccca ggttaccttg agcaacaccg acaacacgtc ctcaggcgca tctgcagcaa 1440
gaggaaagga cgtcgccatc gtcttcatca ccgccgactc gggtgaaggc tacatcaccg 1500
tggagggcaa cgcgggcgat cgcaacaacc tggatccgtg gcacaacggc aatgccctgg 1560
tccaggcggt ggccggtgcc aacagcaacg tcattgttgt tgtccactcc gttggcgcca 1620
tcattctgga gcagattctt gctcttccgc aggtcaaggc cgttgtctgg gcgggtcttc 1680
cttctcagga gagcggcaat gcgctcgtcg acgtgctgtg gggagatgtc agcccttctg 1740
gcaagctggt gtacaccatt gcgaagagcc ccaatgacta taacactcgc atcgtttccg 1800
gcggcagtga cagcttcagc gagggactgt tcatcgacta taagcacttc gacgacgcca 1860
atatcacgcc gcggtacgag ttcggctatg gactgtgtaa gtttgctaac ctgaacaatc 1920
tattagacag gttgactgac ggatgactgt ggaatgatag cttacaccaa gttcaactac 1980
tcacgcctct ccgtcttgtc gaccgccaag tctggtcctg cgactggggc cgttgtgccg 2040
ggaggcccga gtgatctgtt ccagaatgtc gcgacagtca ccgttgacat cgcaaactct 2100
ggccaagtga ctggtgccga ggtagcccag ctgtacatca cctacccatc ttcagcaccc 2160
aggacccctc cgaagcagct gcgaggcttt gccaagctga acctcacgcc tggtcagagc 2220
ggaacagcaa cgttcaacat ccgacgacga gatctcagct actgggacac ggcttcgcag 2280
aaatgggtgg tgccgtcggg gtcgtttggc atcagcgtgg gagcgagcag ccgggatatc 2340
aggctgacga gcactctgtc ggtagcgtag 2370
<210> 102
<211> 744
<212> PRT
<213> Trichoderma reesei
<400> 102
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1 5 10 15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
20 25 30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
35 40 45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
50 55 60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65 70 75 80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
85 90 95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
100 105 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
115 120 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
130 135 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
165 170 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
195 200 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
210 215 220
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225 230 235 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
245 250 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
260 265 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
275 280 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
290 295 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305 310 315 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
325 330 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
340 345 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
355 360 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
370 375 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385 390 395 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
405 410 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
420 425 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
435 440 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
450 455 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465 470 475 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
485 490 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
500 505 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
515 520 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
530 535 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545 550 555 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
565 570 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
580 585 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
595 600 605
Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
610 615 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625 630 635 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
645 650 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
660 665 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
675 680 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
690 695 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705 710 715 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
725 730 735
Leu Thr Ser Thr Leu Ser Val Ala
740
<210> 103
<211> 2625
<212> DNA
<213> Trichoderma reesei
<400> 103
atgaagacgt tgtcagtgtt tgctgccgcc cttttggcgg ccgtagctga ggccaatccc 60
tacccgcctc ctcactccaa ccaggcgtac tcgcctcctt tctacccttc gccatggatg 120
gaccccagtg ctccaggctg ggagcaagcc tatgcccaag ctaaggagtt cgtctcgggc 180
ttgactctct tggagaaggt caacctcacc accggtgttg gctggatggg tgagaagtgc 240
gttggaaacg ttggtaccgt gcctcgcttg ggcatgcgaa gtctttgcat gcaggacggc 300
cccctgggtc tccgattcaa cacgtacaac agcgctttca gcgttggctt gacggccgcc 360
gccagctgga gccgacacct ttgggttgac cgcggtaccg ctctgggctc cgaggcaaag 420
ggcaagggtg tcgatgttct tctcggaccc gtggctggcc ctctcggtcg caaccccaac 480
ggaggccgta acgtcgaggg tttcggctcg gatccctatc tggcgggttt ggctctggcc 540
gataccgtga ccggaatcca gaacgcgggc accatcgcct gtgccaagca cttcctcctc 600
aacgagcagg agcatttccg ccaggtcggc gaagctaacg gttacggata ccccatcacc 660
gaggctctgt cttccaacgt tgatgacaag acgattcacg aggtgtacgg ctggcccttc 720
caggatgctg tcaaggctgg tgtcgggtcc ttcatgtgct cgtacaacca ggtcaacaac 780
tcgtacgctt gccaaaactc caagctcatc aacggcttgc tcaaggagga gtacggtttc 840
caaggctttg tcatgagcga ctggcaggcc cagcacacgg gtgtcgcgtc tgctgttgcc 900
ggtctcgata tgaccatgcc tggtgacacc gccttcaaca ccggcgcatc ctactttgga 960
agcaacctga cgcttgctgt tctcaacggc accgtccccg agtggcgcat tgacgacatg 1020
gtgatgcgta tcatggctcc cttcttcaag gtgggcaaga cggttgacag cctcattgac 1080
accaactttg attcttggac caatggcgag tacggctacg ttcaggccgc cgtcaatgag 1140
aactgggaga aggtcaacta cggcgtcgat gtccgcgcca accatgcgaa ccacatccgc 1200
gaggttggcg ccaagggaac tgtcatcttc aagaacaacg gcatcctgcc ccttaagaag 1260
cccaagttcc tgaccgtcat tggtgaggat gctggcggca accctgccgg ccccaacggc 1320
tgcggtgacc gcggctgtga cgacggcact cttgccatgg agtggggatc tggtactacc 1380
aacttcccct acctcgtcac ccccgacgcg gccctgcaga gccaggctct ccaggacggc 1440
acccgctacg agagcatcct gtccaactac gccatctcgc agacccaggc gctcgtcagc 1500
cagcccgatg ccattgccat tgtctttgcc aactcggata gcggcgaggg ctacatcaac 1560
gtcgatggca acgagggcga ccgcaagaac ctgacgctgt ggaagaacgg cgacgatctg 1620
atcaagactg ttgctgctgt caaccccaag acgattgtcg tcatccactc gaccggcccc 1680
gtgattctca aggactacgc caaccacccc aacatctctg ccattctgtg ggccggtgct 1740
cctggccagg agtctggcaa ctcgctggtc gacattctgt acggcaagca gagcccgggc 1800
cgcactccct tcacctgggg cccgtcgctg gagagctacg gagttagtgt tatgaccacg 1860
cccaacaacg gcaacggcgc tccccaggat aacttcaacg agggcgcctt catcgactac 1920
cgctactttg acaaggtggc tcccggcaag cctcgcagct cggacaaggc tcccacgtac 1980
gagtttggct tcggactgtc gtggtcgacg ttcaagttct ccaacctcca catccagaag 2040
aacaatgtcg gccccatgag cccgcccaac ggcaagacga ttgcggctcc ctctctgggc 2100
agcttcagca agaaccttaa ggactatggc ttccccaaga acgttcgccg catcaaggag 2160
tttatctacc cctacctgag caccactacc tctggcaagg aggcgtcggg tgacgctcac 2220
tacggccaga ctgcgaagga gttcctcccc gccggtgccc tggacggcag ccctcagcct 2280
cgctctgcgg cctctggcga acccggcggc aaccgccagc tgtacgacat tctctacacc 2340
gtgacggcca ccattaccaa cacgggctcg gtcatggacg acgccgttcc ccagctgtac 2400
ctgagccacg gcggtcccaa cgagccgccc aaggtgctgc gtggcttcga ccgcatcgag 2460
cgcattgctc ccggccagag cgtcacgttc aaggcagacc tgacgcgccg tgacctgtcc 2520
aactgggaca cgaagaagca gcagtgggtc attaccgact accccaagac tgtgtacgtg 2580
ggcagctcct cgcgcgacct gccgctgagc gcccgcctgc catga 2625
<210> 104
<211> 874
<212> PRT
<213> Trichoderma reesei
<400> 104
Met Lys Thr Leu Ser Val Phe Ala Ala Ala Leu Leu Ala Ala Val Ala
1 5 10 15
Glu Ala Asn Pro Tyr Pro Pro Pro His Ser Asn Gln Ala Tyr Ser Pro
20 25 30
Pro Phe Tyr Pro Ser Pro Trp Met Asp Pro Ser Ala Pro Gly Trp Glu
35 40 45
Gln Ala Tyr Ala Gln Ala Lys Glu Phe Val Ser Gly Leu Thr Leu Leu
50 55 60
Glu Lys Val Asn Leu Thr Thr Gly Val Gly Trp Met Gly Glu Lys Cys
65 70 75 80
Val Gly Asn Val Gly Thr Val Pro Arg Leu Gly Met Arg Ser Leu Cys
85 90 95
Met Gln Asp Gly Pro Leu Gly Leu Arg Phe Asn Thr Tyr Asn Ser Ala
100 105 110
Phe Ser Val Gly Leu Thr Ala Ala Ala Ser Trp Ser Arg His Leu Trp
115 120 125
Val Asp Arg Gly Thr Ala Leu Gly Ser Glu Ala Lys Gly Lys Gly Val
130 135 140
Asp Val Leu Leu Gly Pro Val Ala Gly Pro Leu Gly Arg Asn Pro Asn
145 150 155 160
Gly Gly Arg Asn Val Glu Gly Phe Gly Ser Asp Pro Tyr Leu Ala Gly
165 170 175
Leu Ala Leu Ala Asp Thr Val Thr Gly Ile Gln Asn Ala Gly Thr Ile
180 185 190
Ala Cys Ala Lys His Phe Leu Leu Asn Glu Gln Glu His Phe Arg Gln
195 200 205
Val Gly Glu Ala Asn Gly Tyr Gly Tyr Pro Ile Thr Glu Ala Leu Ser
210 215 220
Ser Asn Val Asp Asp Lys Thr Ile His Glu Val Tyr Gly Trp Pro Phe
225 230 235 240
Gln Asp Ala Val Lys Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Asn
245 250 255
Gln Val Asn Asn Ser Tyr Ala Cys Gln Asn Ser Lys Leu Ile Asn Gly
260 265 270
Leu Leu Lys Glu Glu Tyr Gly Phe Gln Gly Phe Val Met Ser Asp Trp
275 280 285
Gln Ala Gln His Thr Gly Val Ala Ser Ala Val Ala Gly Leu Asp Met
290 295 300
Thr Met Pro Gly Asp Thr Ala Phe Asn Thr Gly Ala Ser Tyr Phe Gly
305 310 315 320
Ser Asn Leu Thr Leu Ala Val Leu Asn Gly Thr Val Pro Glu Trp Arg
325 330 335
Ile Asp Asp Met Val Met Arg Ile Met Ala Pro Phe Phe Lys Val Gly
340 345 350
Lys Thr Val Asp Ser Leu Ile Asp Thr Asn Phe Asp Ser Trp Thr Asn
355 360 365
Gly Glu Tyr Gly Tyr Val Gln Ala Ala Val Asn Glu Asn Trp Glu Lys
370 375 380
Val Asn Tyr Gly Val Asp Val Arg Ala Asn His Ala Asn His Ile Arg
385 390 395 400
Glu Val Gly Ala Lys Gly Thr Val Ile Phe Lys Asn Asn Gly Ile Leu
405 410 415
Pro Leu Lys Lys Pro Lys Phe Leu Thr Val Ile Gly Glu Asp Ala Gly
420 425 430
Gly Asn Pro Ala Gly Pro Asn Gly Cys Gly Asp Arg Gly Cys Asp Asp
435 440 445
Gly Thr Leu Ala Met Glu Trp Gly Ser Gly Thr Thr Asn Phe Pro Tyr
450 455 460
Leu Val Thr Pro Asp Ala Ala Leu Gln Ser Gln Ala Leu Gln Asp Gly
465 470 475 480
Thr Arg Tyr Glu Ser Ile Leu Ser Asn Tyr Ala Ile Ser Gln Thr Gln
485 490 495
Ala Leu Val Ser Gln Pro Asp Ala Ile Ala Ile Val Phe Ala Asn Ser
500 505 510
Asp Ser Gly Glu Gly Tyr Ile Asn Val Asp Gly Asn Glu Gly Asp Arg
515 520 525
Lys Asn Leu Thr Leu Trp Lys Asn Gly Asp Asp Leu Ile Lys Thr Val
530 535 540
Ala Ala Val Asn Pro Lys Thr Ile Val Val Ile His Ser Thr Gly Pro
545 550 555 560
Val Ile Leu Lys Asp Tyr Ala Asn His Pro Asn Ile Ser Ala Ile Leu
565 570 575
Trp Ala Gly Ala Pro Gly Gln Glu Ser Gly Asn Ser Leu Val Asp Ile
580 585 590
Leu Tyr Gly Lys Gln Ser Pro Gly Arg Thr Pro Phe Thr Trp Gly Pro
595 600 605
Ser Leu Glu Ser Tyr Gly Val Ser Val Met Thr Thr Pro Asn Asn Gly
610 615 620
Asn Gly Ala Pro Gln Asp Asn Phe Asn Glu Gly Ala Phe Ile Asp Tyr
625 630 635 640
Arg Tyr Phe Asp Lys Val Ala Pro Gly Lys Pro Arg Ser Ser Asp Lys
645 650 655
Ala Pro Thr Tyr Glu Phe Gly Phe Gly Leu Ser Trp Ser Thr Phe Lys
660 665 670
Phe Ser Asn Leu His Ile Gln Lys Asn Asn Val Gly Pro Met Ser Pro
675 680 685
Pro Asn Gly Lys Thr Ile Ala Ala Pro Ser Leu Gly Ser Phe Ser Lys
690 695 700
Asn Leu Lys Asp Tyr Gly Phe Pro Lys Asn Val Arg Arg Ile Lys Glu
705 710 715 720
Phe Ile Tyr Pro Tyr Leu Ser Thr Thr Thr Ser Gly Lys Glu Ala Ser
725 730 735
Gly Asp Ala His Tyr Gly Gln Thr Ala Lys Glu Phe Leu Pro Ala Gly
740 745 750
Ala Leu Asp Gly Ser Pro Gln Pro Arg Ser Ala Ala Ser Gly Glu Pro
755 760 765
Gly Gly Asn Arg Gln Leu Tyr Asp Ile Leu Tyr Thr Val Thr Ala Thr
770 775 780
Ile Thr Asn Thr Gly Ser Val Met Asp Asp Ala Val Pro Gln Leu Tyr
785 790 795 800
Leu Ser His Gly Gly Pro Asn Glu Pro Pro Lys Val Leu Arg Gly Phe
805 810 815
Asp Arg Ile Glu Arg Ile Ala Pro Gly Gln Ser Val Thr Phe Lys Ala
820 825 830
Asp Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Thr Lys Lys Gln Gln
835 840 845
Trp Val Ile Thr Asp Tyr Pro Lys Thr Val Tyr Val Gly Ser Ser Ser
850 855 860
Arg Asp Leu Pro Leu Ser Ala Arg Leu Pro
865 870
<210> 105
<211> 2577
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic codon optimized nucleotide sequence
<400> 105
atgcgcaacg gcctcctcaa ggtcgccgcc ttagccgctg ccagcgccgt caacggcgag 60
aacctcgcct acagcccccc cttctacccc agcccctggg ccaacggcca gggcgactgg 120
gccgaggcct accagaaggc cgtccagttc gtcagccagc tcaccctcgc cgagaaggtc 180
aacctcacca ccggcaccgg ctgggagcag gaccgctgcg tcggccaggt cggcagcatc 240
ccccgcttag gcttccccgg cctctgcatg caggacagcc ccctcggcgt ccgcgacacc 300
gactacaaca gcgccttccc tgccggcgtt aacgtcgccg ccacctggga ccgcaactta 360
gcctaccgca gaggcgtcgc catgggcgag gaacaccgcg gcaagggcgt cgacgtccag 420
ttaggccccg tcgccggccc cttaggccgc tctcctgatg ccggccgcaa ctgggagggc 480
ttcgcccccg accccgtcct caccggcaac atgatggcca gcaccatcca gggcatccag 540
gatgctggcg tcattgcctg cgccaagcac ttcatcctct acgagcagga acacttccgc 600
cagggcgccc aggacggcta cgacatcagc gacagcatca gcgccaacgc cgacgacaag 660
accatgcacg agttatacct ctggcccttc gccgatgccg tccgcgccgg tgtcggcagc 720
gtcatgtgca gctacaacca ggtcaacaac agctacgcct gcagcaacag ctacaccatg 780
aacaagctcc tcaagagcga gttaggcttc cagggcttcg tcatgaccga ctggggcggc 840
caccacagcg gcgtcggctc tgccctcgcc ggcctcgaca tgagcatgcc cggcgacatt 900
gccttcgaca gcggcacgtc tttctggggc accaacctca ccgttgccgt cctcaacggc 960
tccatccccg agtggcgcgt cgacgacatg gccgtccgca tcatgagcgc ctactacaag 1020
gtcggccgcg accgctacag cgtccccatc aacttcgaca gctggaccct cgacacctac 1080
ggccccgagc actacgccgt cggccagggc cagaccaaga tcaacgagca cgtcgacgtc 1140
cgcggcaacc acgccgagat catccacgag atcggcgccg cctccgccgt cctcctcaag 1200
aacaagggcg gcctccccct cactggcacc gagcgcttcg tcggtgtctt tggcaaggat 1260
gctggcagca acccctgggg cgtcaacggc tgcagcgacc gcggctgcga caacggcacc 1320
ctcgccatgg gctggggcag cggcaccgcc aactttccct acctcgtcac ccccgagcag 1380
gccatccagc gcgaggtcct cagccgcaac ggcaccttca ccggcatcac cgacaacggc 1440
gccttagccg agatggccgc tgccgcctct caggccgaca cctgcctcgt ctttgccaac 1500
gccgactccg gcgagggcta catcaccgtc gatggcaacg agggcgaccg caagaacctc 1560
accctctggc agggcgccga ccaggtcatc cacaacgtca gcgccaactg caacaacacc 1620
gtcgtcgtct tacacaccgt cggccccgtc ctcatcgacg actggtacga ccaccccaac 1680
gtcaccgcca tcctctgggc cggtttaccc ggtcaggaaa gcggcaacag cctcgtcgac 1740
gtcctctacg gccgcgtcaa ccccggcaag acccccttca cctggggcag agcccgcgac 1800
gactatggcg cccctctcat cgtcaagcct aacaacggca agggcgcccc ccagcaggac 1860
ttcaccgagg gcatcttcat cgactaccgc cgcttcgaca agtacaacat cacccccatc 1920
tacgagttcg gcttcggcct cagctacacc accttcgagt tcagccagtt aaacgtccag 1980
cccatcaacg cccctcccta cacccccgcc agcggcttta cgaaggccgc ccagagcttc 2040
ggccagccct ccaatgccag cgacaacctc taccctagcg acatcgagcg cgtccccctc 2100
tacatctacc cctggctcaa cagcaccgac ctcaaggcca gcgccaacga ccccgactac 2160
ggcctcccca ccgagaagta cgtccccccc aacgccacca acggcgaccc ccagcccatt 2220
gaccctgccg gcggtgcccc tggcggcaac cccagcctct acgagcccgt cgcccgcgtc 2280
accaccatca tcaccaacac cggcaaggtc accggcgacg aggtccccca gctctatgtc 2340
agcttaggcg gccctgacga cgcccccaag gtcctccgcg gcttcgaccg catcaccctc 2400
gcccctggcc agcagtacct ctggaccacc accctcactc gccgcgacat cagcaactgg 2460
gaccccgtca cccagaactg ggtcgtcacc aactacacca agaccatcta cgtcggcaac 2520
agcagccgca acctccccct ccaggccccc ctcaagccct accccggcat ctgatga 2577
<210> 106
<211> 857
<212> PRT
<213> Talaromyces emersonii
<400> 106
Met Arg Asn Gly Leu Leu Lys Val Ala Ala Leu Ala Ala Ala Ser Ala
1 5 10 15
Val Asn Gly Glu Asn Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Asp Trp Ala Glu Ala Tyr Gln Lys Ala Val
35 40 45
Gln Phe Val Ser Gln Leu Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Gln Asp Arg Cys Val Gly Gln Val Gly Ser Ile
65 70 75 80
Pro Arg Leu Gly Phe Pro Gly Leu Cys Met Gln Asp Ser Pro Leu Gly
85 90 95
Val Arg Asp Thr Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val
100 105 110
Ala Ala Thr Trp Asp Arg Asn Leu Ala Tyr Arg Arg Gly Val Ala Met
115 120 125
Gly Glu Glu His Arg Gly Lys Gly Val Asp Val Gln Leu Gly Pro Val
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Ala Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ala Pro Asp Pro Val Leu Thr Gly Asn Met Met Ala Ser Thr Ile
165 170 175
Gln Gly Ile Gln Asp Ala Gly Val Ile Ala Cys Ala Lys His Phe Ile
180 185 190
Leu Tyr Glu Gln Glu His Phe Arg Gln Gly Ala Gln Asp Gly Tyr Asp
195 200 205
Ile Ser Asp Ser Ile Ser Ala Asn Ala Asp Asp Lys Thr Met His Glu
210 215 220
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ser
225 230 235 240
Val Met Cys Ser Tyr Asn Gln Val Asn Asn Ser Tyr Ala Cys Ser Asn
245 250 255
Ser Tyr Thr Met Asn Lys Leu Leu Lys Ser Glu Leu Gly Phe Gln Gly
260 265 270
Phe Val Met Thr Asp Trp Gly Gly His His Ser Gly Val Gly Ser Ala
275 280 285
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Ala Phe Asp Ser
290 295 300
Gly Thr Ser Phe Trp Gly Thr Asn Leu Thr Val Ala Val Leu Asn Gly
305 310 315 320
Ser Ile Pro Glu Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ser
325 330 335
Ala Tyr Tyr Lys Val Gly Arg Asp Arg Tyr Ser Val Pro Ile Asn Phe
340 345 350
Asp Ser Trp Thr Leu Asp Thr Tyr Gly Pro Glu His Tyr Ala Val Gly
355 360 365
Gln Gly Gln Thr Lys Ile Asn Glu His Val Asp Val Arg Gly Asn His
370 375 380
Ala Glu Ile Ile His Glu Ile Gly Ala Ala Ser Ala Val Leu Leu Lys
385 390 395 400
Asn Lys Gly Gly Leu Pro Leu Thr Gly Thr Glu Arg Phe Val Gly Val
405 410 415
Phe Gly Lys Asp Ala Gly Ser Asn Pro Trp Gly Val Asn Gly Cys Ser
420 425 430
Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly Trp Gly Ser Gly
435 440 445
Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln Arg
450 455 460
Glu Val Leu Ser Arg Asn Gly Thr Phe Thr Gly Ile Thr Asp Asn Gly
465 470 475 480
Ala Leu Ala Glu Met Ala Ala Ala Ala Ser Gln Ala Asp Thr Cys Leu
485 490 495
Val Phe Ala Asn Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Asp Gly
500 505 510
Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp Gln Gly Ala Asp Gln
515 520 525
Val Ile His Asn Val Ser Ala Asn Cys Asn Asn Thr Val Val Val Leu
530 535 540
His Thr Val Gly Pro Val Leu Ile Asp Asp Trp Tyr Asp His Pro Asn
545 550 555 560
Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly Asn
565 570 575
Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Lys Thr Pro
580 585 590
Phe Thr Trp Gly Arg Ala Arg Asp Asp Tyr Gly Ala Pro Leu Ile Val
595 600 605
Lys Pro Asn Asn Gly Lys Gly Ala Pro Gln Gln Asp Phe Thr Glu Gly
610 615 620
Ile Phe Ile Asp Tyr Arg Arg Phe Asp Lys Tyr Asn Ile Thr Pro Ile
625 630 635 640
Tyr Glu Phe Gly Phe Gly Leu Ser Tyr Thr Thr Phe Glu Phe Ser Gln
645 650 655
Leu Asn Val Gln Pro Ile Asn Ala Pro Pro Tyr Thr Pro Ala Ser Gly
660 665 670
Phe Thr Lys Ala Ala Gln Ser Phe Gly Gln Pro Ser Asn Ala Ser Asp
675 680 685
Asn Leu Tyr Pro Ser Asp Ile Glu Arg Val Pro Leu Tyr Ile Tyr Pro
690 695 700
Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ala Asn Asp Pro Asp Tyr
705 710 715 720
Gly Leu Pro Thr Glu Lys Tyr Val Pro Pro Asn Ala Thr Asn Gly Asp
725 730 735
Pro Gln Pro Ile Asp Pro Ala Gly Gly Ala Pro Gly Gly Asn Pro Ser
740 745 750
Leu Tyr Glu Pro Val Ala Arg Val Thr Thr Ile Ile Thr Asn Thr Gly
755 760 765
Lys Val Thr Gly Asp Glu Val Pro Gln Leu Tyr Val Ser Leu Gly Gly
770 775 780
Pro Asp Asp Ala Pro Lys Val Leu Arg Gly Phe Asp Arg Ile Thr Leu
785 790 795 800
Ala Pro Gly Gln Gln Tyr Leu Trp Thr Thr Thr Leu Thr Arg Arg Asp
805 810 815
Ile Ser Asn Trp Asp Pro Val Thr Gln Asn Trp Val Val Thr Asn Tyr
820 825 830
Thr Lys Thr Ile Tyr Val Gly Asn Ser Ser Arg Asn Leu Pro Leu Gln
835 840 845
Ala Pro Leu Lys Pro Tyr Pro Gly Ile
850 855
<210> 107
<211> 2586
<212> DNA
<213> Aspergillus niger
<400> 107
atgcgcttca ccagcatcga ggccgtcgcc ctcaccgccg tcagcctcgc cagcgccgac 60
gagttagcct acagcccccc ctactacccc agcccctggg ccaacggcca gggcgactgg 120
gccgaggcct accagcgcgc cgtcgacatc gtcagccaga tgaccctcgc cgagaaggtc 180
aacctcacca ccggcaccgg ctgggagtta gagttatgcg tcggccagac tggtggcgtc 240
ccccgcctcg gcatccccgg catgtgcgcc caggacagcc ccctcggcgt ccgcgacagc 300
gactacaaca gcgccttccc tgccggcgtc aacgtcgccg ccacctggga caagaacctc 360
gcctacctcc gcggccaggc catgggccag gaattcagcg acaagggcgc cgacatccag 420
ttaggccccg ctgccggccc tttaggccgc tctcccgacg gcggcagaaa ctgggagggc 480
ttcagccccg accccgctct cagcggcgtc ctcttcgccg agactatcaa gggcatccag 540
gatgctggcg tcgtcgccac cgccaagcac tacattgcct acgagcagga acacttccgc 600
caggcccccg aggcccaggg ctacggcttc aacatcaccg agagcggcag cgccaacctc 660
gacgacaaga ccatgcacga gttatacctc tggcccttcg ccgacgccat tagagctggc 720
gctggtgctg tcatgtgcag ctacaaccag atcaacaaca gctacggctg ccagaacagc 780
tacaccctca acaagctcct caaggccgag ttaggcttcc agggcttcgt catgtccgac 840
tgggccgccc accacgccgg cgtcagcggc gccttagccg gcctcgacat gagcatgccc 900
ggcgacgtcg actacgacag cggcaccagc tactggggca ccaacctcac catcagcgtc 960
ctcaacggca ccgtccccca gtggcgcgtc gacgacatgg ccgtccgcat catggccgcc 1020
tactacaagg tcggccgcga ccgcctctgg acccccccca acttcagcag ctggacccgc 1080
gacgagtacg gcttcaagta ctactacgtc agcgagggcc cctatgagaa ggtcaaccag 1140
ttcgtcaacg tccagcgcaa ccacagcgag ttaatccgcc gcatcggcgc cgacagcacc 1200
gtcctcctca agaacgacgg cgccctcccc ctcaccggca aggaacgcct cgtcgccctc 1260
atcggcgagg acgccggcag caacccctac ggcgccaacg gctgcagcga ccgcggctgc 1320
gacaacggca ccctcgccat gggctggggc agcggcaccg ccaacttccc ttacctcgtc 1380
acccccgagc aggccatcag caacgaggtc ctcaagaaca agaacggcgt ctttaccgcc 1440
accgacaact gggccatcga ccagatcgag gccttagcca agaccgcctc tgtcagcctc 1500
gtctttgtca acgccgacag cggcgagggc tacatcaacg tcgacggcaa cctcggcgac 1560
cgccgcaacc tcaccctctg gcgcaacggc gacaacgtca tcaaggccgc cgccagcaac 1620
tgcaacaaca ccatcgtcat catccacagc gtcggccccg tcctcgtcaa cgagtggtac 1680
gacaacccca acgtcaccgc catcctctgg ggcggcttac ccggccagga aagcggcaac 1740
agcctcgccg acgtcctcta cggccgcgtc aaccctggcg ccaagagccc cttcacctgg 1800
ggcaagaccc gcgaggccta tcaggactac ctctacaccg agcccaacaa cggcaacggc 1860
gccccccagg aagatttcgt cgagggcgtc tttatcgact accgcggctt tgacaagcgc 1920
aacgagactc ccatctacga gttcggctac ggcctcagct acaccacctt caactacagc 1980
aacctccagg tcgaggtcct cagcgcccct gcctacgagc ccgccagcgg cgagactgag 2040
gccgccccca ccttcggcga ggtcggcaac gccagcgact acttataccc cgacggcctc 2100
cagcgcatca ccaagttcat ctacccctgg ctcaacagca ccgacctcga ggccagcagc 2160
ggcgacgcct cttacggcca ggacgcctcc gactacctcc ccgagggtgc caccgacggc 2220
agcgctcagc ccatcttacc tgccggtggc ggtgctggcg gcaaccccag actctacgac 2280
gagctgatcc gcgtcagcgt caccatcaag aacaccggca aggtcgctgg tgacgaggtc 2340
ccccagctct acgtcagctt aggcggccct aacgagccca agatcgtcct ccgccagttc 2400
gagcgcatca ccctccagcc cagcaaggaa actcagtgga gcaccaccct cactcgccgc 2460
gacctcgcca actggaacgt cgagactcag gactgggaga tcaccagcta ccccaagatg 2520
gtctttgccg gcagcagcag ccgcaagctc cccctccgcg ccagcctccc caccgtccac 2580
tgatga 2586
<210> 108
<211> 860
<212> PRT
<213> Aspergillus niger
<400> 108
Met Arg Phe Thr Ser Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu
1 5 10 15
Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Asp Trp Ala Glu Ala Tyr Gln Arg Ala Val
35 40 45
Asp Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Gly Ile Pro Gly Met Cys Ala Gln Asp Ser Pro Leu Gly
85 90 95
Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Tyr
195 200 205
Gly Phe Asn Ile Thr Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr
210 215 220
Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly
225 230 235 240
Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val
275 280 285
Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp
290 295 300
Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Tyr
355 360 365
Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Phe Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly
435 440 445
Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Ser Asn Glu Val Leu Lys Asn Lys Asn Gly Val Phe Thr Ala
465 470 475 480
Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile
500 505 510
Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg
515 520 525
Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr
530 535 540
Ile Val Ile Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr
545 550 555 560
Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln
595 600 605
Asp Tyr Leu Tyr Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu
610 615 620
Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Asn Leu Gln Val Glu Val Leu Ser Ala Pro Ala Tyr
660 665 670
Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val
675 680 685
Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Asp Gly Leu Gln Arg Ile Thr
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu Ala Ser Ser
705 710 715 720
Gly Asp Ala Ser Tyr Gly Gln Asp Ala Ser Asp Tyr Leu Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Ala
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe
785 790 795 800
Glu Arg Ile Thr Leu Gln Pro Ser Lys Glu Thr Gln Trp Ser Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Thr Gln Asp Trp
820 825 830
Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Ala Gly Ser Ser Ser Arg
835 840 845
Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His
850 855 860
<210> 109
<211> 3203
<212> DNA
<213> Fusarium oxysporum
<400> 109
atgaagctga actgggtcgc cgcagccctc tctataggtg ctgctggcac tgatggtgca 60
gttgctcttg cttctgaagt tccaggcact ttggctggtg taaaggtcgg tttttttacc 120
atttcctcac ctaatctcag ccttgttgcc atatcgccct tattcgctcg gacgctacgc 180
accaaatcgc gatcatttcc tcccttgcag ccttgttttc ttttttcgat cttccctccg 240
caatcgccag cacccttagc ctacacaaaa acccccgaga cagtctcatt gagtttgtcg 300
acatcaagtt gcttctcaag tgtgcatttg cgtggctgtc tacttctgcc tctagaccac 360
caaatctggg cgcaattgat cgctcaaacc ttgttcgaat aagcctttta ttcgagacgt 420
ccaattttta cagagaatgt acctttcaat aataccgacg ttatgcgcgg cggtggctgc 480
tgtgatggtt gttgatcaga atactgacgc tcaaaaggtt gtcacgagag atacactcgc 540
acactcacct cctcactatc cttcaccatg gatggatcct aatgccattg gctgggagga 600
agcttacgcc aaagcaaaga actttgtgtc ccagctcact ctcctcgaaa aggtcaactt 660
gaccactggt gttgggtaag tagctccttg cgaacagtgc atctcggtct ccttgactaa 720
cgactctctc aggtggcaag gcgaacgctg tgtaggaaac gtgggatcaa ttcctcgtct 780
tggtatgcga ggtctttgtc ttcaggatgg tcctcttgga attcgtctgt ccgattacaa 840
cagtgctttt cccgctggca ccacagctgg tgcttcttgg agcaagtctc tctggtatga 900
gaggggtctt ctgatgggaa ctgagttcaa ggggaagggt atcgatatcg ctcttggccc 960
tgctactggt cctcttggcc gcactgctgc tggtggacga aactgggagg gctttaccgt 1020
tgatccttat atggctggcc atgccatggc cgaggccgtc aagggcatcc aagacgcagg 1080
tgtcattgct tgtgctaagc attacatcgc aaacgagcaa ggtaagccaa ttggacggtt 1140
tgggaaatcg acagagaact gacccccttg tagagcactt ccgacagagt ggcgaggtcc 1200
agtcccgcaa gtacaacatc tccgagtctc tctcctccaa cctggacgac aagactttgc 1260
acgagctcta cgcctggccc tttgctgatg ccgtccgcgc tggcgtcggt tcagtcatgt 1320
gctcttacaa tcagatcaac aactcgtacg gttgccagaa ctccaagctc ctcaacggta 1380
tcctcaagga cgagatgggt ttccagggct tcgtcatgag cgattgggcg gcccagcaca 1440
ccggtgctgc ttctgccgtc gctggtcttg atatgagcat gcctggtgac accgcgttcg 1500
acagtggata tagcttctgg ggtggaaacc tgactcttgc tgtcatcaac ggaactgttc 1560
ccgcctggcg agttgatgac atggctctgc gaatcatgtc ggccttcttc aaggttggaa 1620
agacggtaga ggacctcccc gacatcaact tctcctcctg gacccgcgac accttcggct 1680
tcgtccaaac atttgctcaa gagaaccgcg aacaagtcaa ctttggagtt aacgtccagc 1740
acgaccacaa gaaccacatc cgtgagtctg ccgccaaggg aagcgtcatc ctcaagaaca 1800
ccggctccct tcccctcaac aatcccaagt tcctcgctgt cattggtgag gacgccggtc 1860
ccaaccctgc tggacccaat ggttgcggcg accgtggttg cgacaatggt accctggcta 1920
tggcttgggg ctcgggaact tctcaattcc cttacttgat cacacccgac caaggtctcc 1980
agaaccgagc tgcccaagac ggaactcgat atgagagcat cttgaccaac aacgaatggg 2040
cccagacaca ggctcttgtc agccaaccca acgtgaccgc tatcgttttt gccaacgccg 2100
actctggtga gggttacatt gaagtcgacg gaaacttcgg tgatcgcaag aacctcaccc 2160
tctggcaaca gggagacgag ctcatcaaga acgtctcgtc catctgcccc aacaccattg 2220
tcgttctgca taccgtcggc cctgtcctgc tcgccgacta cgagaagaac cccaacatca 2280
ccgccatcgt ctgggctggt cttcccggcc aagagtctgg caatgccatc gctgatctcc 2340
tctacggcaa ggtaagccct ggccgatctc ccttcacttg gggccgcacc cgtgagagct 2400
acggtaccga ggttctttat gaggcgaaca acggccgtgg cgctcctcag gatgacttct 2460
cggagggtgt cttcattgac taccgtcact ttgatcgacg atctcccagc accgatggca 2520
agagcgctcc caacaacacc gctgctcctc tctacgagtt cggtcatggt ctgtcttgga 2580
ctacctttga gtattcagac ctcaacatcc agaagaacgt taactccacc tactctcctc 2640
ctgctggtca gaccattcct gccccaacct ttggcaactt cagcaagaac ctcaacgact 2700
acgtgttccc taagggtgtc cgatacatct acaagttcat ctaccccttc ctgaacactt 2760
cctcatccgc cagcgaggca tctaacgacg gcggccagtt tggtaagact gccgaagagt 2820
tcctacctcc aaacgccctc aacggctcag cccagcctcg tcttccctct tctggtgccc 2880
caggcggtaa ccctcaattg tgggatatcc tgtacaccgt cacagccaca atcaccaaca 2940
caggcaacgc cacctccgac gagattcccc agctgtatgt cagcctcggt ggcgagaacg 3000
aacccgttcg tgtcctccgc ggtttcgacc gtatcgagaa cattgctccc ggccagagcg 3060
ccatcttcaa cgctcaattg acccgtcgcg atctgagcaa ctgggatgtg gatgcccaga 3120
actgggttat caccgaccat ccaaagacgg tgtgggttgg aagtagttct cgcaagctgc 3180
ctctcagcgc caagttggaa taa 3203
<210> 110
<211> 899
<212> PRT
<213> Fusarium oxysporum
<400> 110
Met Lys Leu Asn Trp Val Ala Ala Ala Leu Ser Ile Gly Ala Ala Gly
1 5 10 15
Thr Asp Gly Ala Val Ala Leu Ala Ser Glu Val Pro Gly Thr Leu Ala
20 25 30
Gly Val Lys Asn Thr Asp Ala Gln Lys Val Val Thr Arg Asp Thr Leu
35 40 45
Ala His Ser Pro Pro His Tyr Pro Ser Pro Trp Met Asp Pro Asn Ala
50 55 60
Ile Gly Trp Glu Glu Ala Tyr Ala Lys Ala Lys Asn Phe Val Ser Gln
65 70 75 80
Leu Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly Val Gly Trp Gln
85 90 95
Gly Glu Arg Cys Val Gly Asn Val Gly Ser Ile Pro Arg Leu Gly Met
100 105 110
Arg Gly Leu Cys Leu Gln Asp Gly Pro Leu Gly Ile Arg Leu Ser Asp
115 120 125
Tyr Asn Ser Ala Phe Pro Ala Gly Thr Thr Ala Gly Ala Ser Trp Ser
130 135 140
Lys Ser Leu Trp Tyr Glu Arg Gly Leu Leu Met Gly Thr Glu Phe Lys
145 150 155 160
Gly Lys Gly Ile Asp Ile Ala Leu Gly Pro Ala Thr Gly Pro Leu Gly
165 170 175
Arg Thr Ala Ala Gly Gly Arg Asn Trp Glu Gly Phe Thr Val Asp Pro
180 185 190
Tyr Met Ala Gly His Ala Met Ala Glu Ala Val Lys Gly Ile Gln Asp
195 200 205
Ala Gly Val Ile Ala Cys Ala Lys His Tyr Ile Ala Asn Glu Gln Glu
210 215 220
His Phe Arg Gln Ser Gly Glu Val Gln Ser Arg Lys Tyr Asn Ile Ser
225 230 235 240
Glu Ser Leu Ser Ser Asn Leu Asp Asp Lys Thr Leu His Glu Leu Tyr
245 250 255
Ala Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ser Val Met
260 265 270
Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Gln Asn Ser Lys
275 280 285
Leu Leu Asn Gly Ile Leu Lys Asp Glu Met Gly Phe Gln Gly Phe Val
290 295 300
Met Ser Asp Trp Ala Ala Gln His Thr Gly Ala Ala Ser Ala Val Ala
305 310 315 320
Gly Leu Asp Met Ser Met Pro Gly Asp Thr Ala Phe Asp Ser Gly Tyr
325 330 335
Ser Phe Trp Gly Gly Asn Leu Thr Leu Ala Val Ile Asn Gly Thr Val
340 345 350
Pro Ala Trp Arg Val Asp Asp Met Ala Leu Arg Ile Met Ser Ala Phe
355 360 365
Phe Lys Val Gly Lys Thr Val Glu Asp Leu Pro Asp Ile Asn Phe Ser
370 375 380
Ser Trp Thr Arg Asp Thr Phe Gly Phe Val Gln Thr Phe Ala Gln Glu
385 390 395 400
Asn Arg Glu Gln Val Asn Phe Gly Val Asn Val Gln His Asp His Lys
405 410 415
Asn His Ile Arg Glu Ser Ala Ala Lys Gly Ser Val Ile Leu Lys Asn
420 425 430
Thr Gly Ser Leu Pro Leu Asn Asn Pro Lys Phe Leu Ala Val Ile Gly
435 440 445
Glu Asp Ala Gly Pro Asn Pro Ala Gly Pro Asn Gly Cys Gly Asp Arg
450 455 460
Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser Gly Thr Ser
465 470 475 480
Gln Phe Pro Tyr Leu Ile Thr Pro Asp Gln Gly Leu Gln Asn Arg Ala
485 490 495
Ala Gln Asp Gly Thr Arg Tyr Glu Ser Ile Leu Thr Asn Asn Glu Trp
500 505 510
Ala Gln Thr Gln Ala Leu Val Ser Gln Pro Asn Val Thr Ala Ile Val
515 520 525
Phe Ala Asn Ala Asp Ser Gly Glu Gly Tyr Ile Glu Val Asp Gly Asn
530 535 540
Phe Gly Asp Arg Lys Asn Leu Thr Leu Trp Gln Gln Gly Asp Glu Leu
545 550 555 560
Ile Lys Asn Val Ser Ser Ile Cys Pro Asn Thr Ile Val Val Leu His
565 570 575
Thr Val Gly Pro Val Leu Leu Ala Asp Tyr Glu Lys Asn Pro Asn Ile
580 585 590
Thr Ala Ile Val Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly Asn Ala
595 600 605
Ile Ala Asp Leu Leu Tyr Gly Lys Val Ser Pro Gly Arg Ser Pro Phe
610 615 620
Thr Trp Gly Arg Thr Arg Glu Ser Tyr Gly Thr Glu Val Leu Tyr Glu
625 630 635 640
Ala Asn Asn Gly Arg Gly Ala Pro Gln Asp Asp Phe Ser Glu Gly Val
645 650 655
Phe Ile Asp Tyr Arg His Phe Asp Arg Arg Ser Pro Ser Thr Asp Gly
660 665 670
Lys Ser Ala Pro Asn Asn Thr Ala Ala Pro Leu Tyr Glu Phe Gly His
675 680 685
Gly Leu Ser Trp Thr Thr Phe Glu Tyr Ser Asp Leu Asn Ile Gln Lys
690 695 700
Asn Val Asn Ser Thr Tyr Ser Pro Pro Ala Gly Gln Thr Ile Pro Ala
705 710 715 720
Pro Thr Phe Gly Asn Phe Ser Lys Asn Leu Asn Asp Tyr Val Phe Pro
725 730 735
Lys Gly Val Arg Tyr Ile Tyr Lys Phe Ile Tyr Pro Phe Leu Asn Thr
740 745 750
Ser Ser Ser Ala Ser Glu Ala Ser Asn Asp Gly Gly Gln Phe Gly Lys
755 760 765
Thr Ala Glu Glu Phe Leu Pro Pro Asn Ala Leu Asn Gly Ser Ala Gln
770 775 780
Pro Arg Leu Pro Ser Ser Gly Ala Pro Gly Gly Asn Pro Gln Leu Trp
785 790 795 800
Asp Ile Leu Tyr Thr Val Thr Ala Thr Ile Thr Asn Thr Gly Asn Ala
805 810 815
Thr Ser Asp Glu Ile Pro Gln Leu Tyr Val Ser Leu Gly Gly Glu Asn
820 825 830
Glu Pro Val Arg Val Leu Arg Gly Phe Asp Arg Ile Glu Asn Ile Ala
835 840 845
Pro Gly Gln Ser Ala Ile Phe Asn Ala Gln Leu Thr Arg Arg Asp Leu
850 855 860
Ser Asn Trp Asp Val Asp Ala Gln Asn Trp Val Ile Thr Asp His Pro
865 870 875 880
Lys Thr Val Trp Val Gly Ser Ser Ser Arg Lys Leu Pro Leu Ser Ala
885 890 895
Lys Leu Glu
<210> 111
<211> 3134
<212> DNA
<213> Gibberella zeae
<400> 111
atgaaggcca attggcttgc cgcggccgtt tatttggctg ctggcaccga tgctgcagtc 60
cctgacactt tggcaggagt caatgtaagc tactcttcaa tttcatctca tctcaacttt 120
gccaggccac aacaactttt cttcactcac gatcttttca ccataaacgc aacagtttca 180
caaaaaataa agcccaaatc atgtctctga tcgttgaact cgccatcttc gtttacatcg 240
cggttgtctt tttcttcttg tacttctcat tcgttgttgt tctctacatt ttcgactggc 300
tgtttagcct tgagattctt ctcactcccc gtgatgccta gatcactctc tgaggcgttt 360
aatctacttg tagagatgcg cctctcattt gttgtgtcgc tagtcgcgat agttgctgga 420
attgcagtcc ttgatcttcc tactgacact caaaagctcg ttgcgcggga cacactcgct 480
cactctcctc ctcactatcc ctcgccatgg atggacccta acgctgtcgg ctgggaggac 540
gcctacgcca aggccaagga ctttgtctcc cagatgactc tcctagaaaa ggtcaacttg 600
accactggtg ttgggtaagt aacgagcgac aagacgtcta caatccacta acacgatctc 660
tagatggcag ggcgaacgtt gtgttggaaa cgtgggatct atccctcgtc tcggtatgcg 720
aggcctctgt ctccaggatg gtcctctcgg aattcgcttc tccgactaca acagcgcttt 780
ccctactggt gtcaccgctg gtgcttcttg gagtaaggcc ctttggtacg agcgaggacg 840
attgatgggt accgagttta aggagaaggg tatcgatatt gctctcggcc ctgcaactgg 900
tcctctcggt cgccacgctg ctggtggacg aaactgggaa ggcttcactg tcgaccccta 960
cgccgctggc catgctatgg ctgagactgt caagggtatc caagattctg gagtcattgc 1020
ttgtgctaag cattacatcg caaacgagca aggtatgtac aggcccattc aatggcttca 1080
ggaacgaaaa ctaactctta atagaacact tccgtcaacg aggcgatgtc atgtctcaaa 1140
agttcaacat ttccgagtct ctgtcttcca accttgacga taagactatg cacgagctct 1200
acaactggcc tttcgccgac gccgtccgcg ccggtgttgg ctccattatg tgctcttaca 1260
accaggtcaa caactcatat gcttgccaga actccaagct cctcaacggc atcctcaagg 1320
acgagatggg tttccagggt ttcgtcatga gcgattggca ggctcagcac accggtgccg 1380
cctccgctgt tgccggtctt gacatgacca tgcctggtga caccgagttc aacactggct 1440
tcagcttctg gggtggaaac ctgaccctcg ctgttatcaa cggtactgtt cccgcctgga 1500
gaatcgacga catggctacc cgaattatgg ctgctttctt caaggttggc cgatctgttg 1560
aggaggaacc cgacatcaac ttctcagctt ggactcgtga tgagtatggc ttcgtccaga 1620
cctacgccca agagaaccga gaaaaggtca actttgctgt taatgtccag cacgaccaca 1680
agcgccacat tcgcgaggct ggcgcaaagg gatccgtcgt cctcaagaac actggctcac 1740
ttcctcttaa gaagccccag ttcctcgctg tcattggaga ggacgctggt tccaaccctg 1800
ccggacccaa cggttgcgct gaccgtggat gcgacaacgg tactcttgcc atggcatggg 1860
gttccggaac ctctcaattc ccctaccttg tcacccccga ccaaggcatc tcgctccagg 1920
ctattcagga cggtactcgt tatgagagca tcctcaacaa caaccagtgg ccccagacac 1980
aagctcttgt cagccagccc aacgtcaccg ccattgtctt tgccaatgcc gattctggtg 2040
agggctacat cgaggttgac ggcaactacg gcgaccgcaa gaacctcact ctgtggaagc 2100
aaggcgatga gctcatcaag aacgtctctg ctatctgccc caacaccatt gtggtccttc 2160
acaccgttgg ccccgtcctt ctaaccgagt ggcacaacaa ccccaacatc accgccattg 2220
tttgggctgg tgtgcctgga caggagtccg gtaacgccat cgccgacatc ctctacggca 2280
agaccagccc tggacgttct cccttcacct ggggtcgcac ttatgacagc tatggcacca 2340
aggttctcta caaggccaac aatggagagg gtgcccctca agaggacttt gtcgagggca 2400
acttcatcga ctaccgccac tttgaccgac aatcccccag caccaacgga aagagtgcca 2460
ccaacgactc ttctgctcct ctctacgagt tcggtttcgg tctgtcctgg actacctttg 2520
agtactctga tctcaaagtc gagtctgtca gcaacgcctc ttacagcccc tctgtcggaa 2580
acaccattcc tgcccctacc tacggcaact tcagcaagaa cctggacgat tacacattcc 2640
cctcaggtgt ccgatacctc tacaagttca tctaccccta cctcaacacc tcttcctccg 2700
ctgagaaggc ttccggcgat gtcaagggca gatttggtga gaccggcgac gagttcctcc 2760
ctcccaacgc tctcaacggt tcatcgcagc ctcgtcttcc ttccagtggt gctcccggcg 2820
gtaaccctca gctctgggac attatgtaca ccgtcactgc caccatcacc aacactggtg 2880
acgctacctc ggatgaggtt ccccagctgt acgtcagcct cggtggtgag ggcgagcctg 2940
tccgtgtcct ccgtggcttc gagcgtcttg aaaacattgc tcctggtgag agtgccacat 3000
tcaccgctca gcttactcgc cgtgacctga gcaactggga cgtcaacgtc cagaactggg 3060
tcatcaccga tcacgccaag aagatctggg tcggcagcag ctctcgcaat ctgcccctca 3120
gcgccgacct gtag 3134
<210> 112
<211> 886
<212> PRT
<213> Gibberella zeae
<400> 112
Met Lys Ala Asn Trp Leu Ala Ala Ala Val Tyr Leu Ala Ala Gly Thr
1 5 10 15
Asp Ala Ala Val Pro Asp Thr Leu Ala Gly Val Asn Leu Val Ala Arg
20 25 30
Asp Thr Leu Ala His Ser Pro Pro His Tyr Pro Ser Pro Trp Met Asp
35 40 45
Pro Asn Ala Val Gly Trp Glu Asp Ala Tyr Ala Lys Ala Lys Asp Phe
50 55 60
Val Ser Gln Met Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly Val
65 70 75 80
Gly Trp Gln Gly Glu Arg Cys Val Gly Asn Val Gly Ser Ile Pro Arg
85 90 95
Leu Gly Met Arg Gly Leu Cys Leu Gln Asp Gly Pro Leu Gly Ile Arg
100 105 110
Phe Ser Asp Tyr Asn Ser Ala Phe Pro Thr Gly Val Thr Ala Gly Ala
115 120 125
Ser Trp Ser Lys Ala Leu Trp Tyr Glu Arg Gly Arg Leu Met Gly Thr
130 135 140
Glu Phe Lys Glu Lys Gly Ile Asp Ile Ala Leu Gly Pro Ala Thr Gly
145 150 155 160
Pro Leu Gly Arg His Ala Ala Gly Gly Arg Asn Trp Glu Gly Phe Thr
165 170 175
Val Asp Pro Tyr Ala Ala Gly His Ala Met Ala Glu Thr Val Lys Gly
180 185 190
Ile Gln Asp Ser Gly Val Ile Ala Cys Ala Lys His Tyr Ile Ala Asn
195 200 205
Glu Gln Glu His Phe Arg Gln Arg Gly Asp Val Met Ser Gln Lys Phe
210 215 220
Asn Ile Ser Glu Ser Leu Ser Ser Asn Leu Asp Asp Lys Thr Met His
225 230 235 240
Glu Leu Tyr Asn Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly
245 250 255
Ser Ile Met Cys Ser Tyr Asn Gln Val Asn Asn Ser Tyr Ala Cys Gln
260 265 270
Asn Ser Lys Leu Leu Asn Gly Ile Leu Lys Asp Glu Met Gly Phe Gln
275 280 285
Gly Phe Val Met Ser Asp Trp Gln Ala Gln His Thr Gly Ala Ala Ser
290 295 300
Ala Val Ala Gly Leu Asp Met Thr Met Pro Gly Asp Thr Glu Phe Asn
305 310 315 320
Thr Gly Phe Ser Phe Trp Gly Gly Asn Leu Thr Leu Ala Val Ile Asn
325 330 335
Gly Thr Val Pro Ala Trp Arg Ile Asp Asp Met Ala Thr Arg Ile Met
340 345 350
Ala Ala Phe Phe Lys Val Gly Arg Ser Val Glu Glu Glu Pro Asp Ile
355 360 365
Asn Phe Ser Ala Trp Thr Arg Asp Glu Tyr Gly Phe Val Gln Thr Tyr
370 375 380
Ala Gln Glu Asn Arg Glu Lys Val Asn Phe Ala Val Asn Val Gln His
385 390 395 400
Asp His Lys Arg His Ile Arg Glu Ala Gly Ala Lys Gly Ser Val Val
405 410 415
Leu Lys Asn Thr Gly Ser Leu Pro Leu Lys Lys Pro Gln Phe Leu Ala
420 425 430
Val Ile Gly Glu Asp Ala Gly Ser Asn Pro Ala Gly Pro Asn Gly Cys
435 440 445
Ala Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
450 455 460
Gly Thr Ser Gln Phe Pro Tyr Leu Val Thr Pro Asp Gln Gly Ile Ser
465 470 475 480
Leu Gln Ala Ile Gln Asp Gly Thr Arg Tyr Glu Ser Ile Leu Asn Asn
485 490 495
Asn Gln Trp Pro Gln Thr Gln Ala Leu Val Ser Gln Pro Asn Val Thr
500 505 510
Ala Ile Val Phe Ala Asn Ala Asp Ser Gly Glu Gly Tyr Ile Glu Val
515 520 525
Asp Gly Asn Tyr Gly Asp Arg Lys Asn Leu Thr Leu Trp Lys Gln Gly
530 535 540
Asp Glu Leu Ile Lys Asn Val Ser Ala Ile Cys Pro Asn Thr Ile Val
545 550 555 560
Val Leu His Thr Val Gly Pro Val Leu Leu Thr Glu Trp His Asn Asn
565 570 575
Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Val Pro Gly Gln Glu Ser
580 585 590
Gly Asn Ala Ile Ala Asp Ile Leu Tyr Gly Lys Thr Ser Pro Gly Arg
595 600 605
Ser Pro Phe Thr Trp Gly Arg Thr Tyr Asp Ser Tyr Gly Thr Lys Val
610 615 620
Leu Tyr Lys Ala Asn Asn Gly Glu Gly Ala Pro Gln Glu Asp Phe Val
625 630 635 640
Glu Gly Asn Phe Ile Asp Tyr Arg His Phe Asp Arg Gln Ser Pro Ser
645 650 655
Thr Asn Gly Lys Ser Ala Thr Asn Asp Ser Ser Ala Pro Leu Tyr Glu
660 665 670
Phe Gly Phe Gly Leu Ser Trp Thr Thr Phe Glu Tyr Ser Asp Leu Lys
675 680 685
Val Glu Ser Val Ser Asn Ala Ser Tyr Ser Pro Ser Val Gly Asn Thr
690 695 700
Ile Pro Ala Pro Thr Tyr Gly Asn Phe Ser Lys Asn Leu Asp Asp Tyr
705 710 715 720
Thr Phe Pro Ser Gly Val Arg Tyr Leu Tyr Lys Phe Ile Tyr Pro Tyr
725 730 735
Leu Asn Thr Ser Ser Ser Ala Glu Lys Ala Ser Gly Asp Val Lys Gly
740 745 750
Arg Phe Gly Glu Thr Gly Asp Glu Phe Leu Pro Pro Asn Ala Leu Asn
755 760 765
Gly Ser Ser Gln Pro Arg Leu Pro Ser Ser Gly Ala Pro Gly Gly Asn
770 775 780
Pro Gln Leu Trp Asp Ile Met Tyr Thr Val Thr Ala Thr Ile Thr Asn
785 790 795 800
Thr Gly Asp Ala Thr Ser Asp Glu Val Pro Gln Leu Tyr Val Ser Leu
805 810 815
Gly Gly Glu Gly Glu Pro Val Arg Val Leu Arg Gly Phe Glu Arg Leu
820 825 830
Glu Asn Ile Ala Pro Gly Glu Ser Ala Thr Phe Thr Ala Gln Leu Thr
835 840 845
Arg Arg Asp Leu Ser Asn Trp Asp Val Asn Val Gln Asn Trp Val Ile
850 855 860
Thr Asp His Ala Lys Lys Ile Trp Val Gly Ser Ser Ser Arg Asn Leu
865 870 875 880
Pro Leu Ser Ala Asp Leu
885
<210> 113
<211> 2796
<212> DNA
<213> Nectria haematococca
<400> 113
atgcggttca ccgtccttct cgcggcattt tcggggcttg tccccatggt tggttcgcaa 60
gctgaccaga aaccactaca gctcggtgtg aacaataaca ctctggcgca ttcacctcct 120
cactatcctt cgccatggat ggatcctgct gctcctggct gggaggaagc ctatctcaag 180
gcgaaagatt ttgtttcaca gcttaccctt cttgaaaagg tcaacttgac cactggtgtt 240
gggtgagtca cttgttttcc tctctcctga cgtgacactt tgctttggcc tgcttcctat 300
atcgtctact agcattgcta acactcgagg cagatggatg ggcgaacgtt gcgtcggcaa 360
cgtgggttca ctccctcgtt ttggaatgcg tggtctctgc atgcaggatg gccccctcgg 420
catccgcttg tctgactata actctgcctt tcctactggt attacagctg gtgcctcttg 480
gagccgtgcc ctttggtacc aacgtggcct cctgatgggc accgagcatc gtgaaaaagg 540
catcgacgtt gcacttgggc ctgctactgg tcctcttggt cgtactccta ctggcggccg 600
caactgggag ggtttctcgg ttgatcccta cgttgctggc gttgccatgg ccgagactgt 660
tagcggcatt caagatggtg gtactatcgc ctgtgctaag cactacatcg gcaacgaaca 720
aggtatgcct cttcacttct cctcgctgat aaatctgctc acaacaacct agagcaccat 780
cgccaagccc ccgaatccat tggccgcggc tacaacatca ccgagtccct gtcgtcgaac 840
gttgatgaca agaccctcca cgagctctat ctctggccgt tcgcagatgc cgtcaaggct 900
ggtgttggtg ctatcatgtg ttcctaccag cagctgaaca actcttacgg ttgccaaaac 960
tctaagcttc tcaacggaat tctcaaggac gagctaggat tccagggctt cgtcatgagt 1020
gactggcaag cccaacatgc tggagctgct accgctgttg caggccttga catgaccatg 1080
cccggtgaca ctttgttcaa caccggatac agcttctggg gtggtaacct gaccctcgct 1140
gtagtcaatg gcactgttcc cgactggcgt attgacgaca tggctatgag aatcatggca 1200
gctttcttca aggttggcaa gactgttgag gaccttcctg acatcaactt ttcttcttgg 1260
tctcgagaca cttttggcta cgttcaagcc gctgcccaag agaactggga acagatcaac 1320
ttcggagttg atgttcgtca cgaccacagc gaacacattc gactctcggc cgccaagggc 1380
accgtcctcc ttaagaactc tggctcattg cctctgaaga agcccaagtt ccttgccgtc 1440
gttggcgagg acgccggccc gaaccctgct ggccccaacg gctgtaacga ccgcggatgt 1500
aacaacggca ctctggccat gtcctggggc tcaggaacag cccagttccc ttacctcgtt 1560
actcccgact cagcgctaca gaaccaggct gtcctcgacg gcactcgcta cgagagtgtc 1620
ttgcggaaca accagtggga acagacacgc agtctcatta gccaacctaa cgtgacggct 1680
attgtgtttg ccaatgccaa ttccggagag ggatatatcg atgttgacgg caacgaaggc 1740
gatcggaaga atttgacctt gtggaacgag ggtgatgacc taattaagaa cgtctcctca 1800
atctgcccca acaccattgt tgttctgcac actgttggcc ctgtcatcct gacggaatgg 1860
tatgacaacc cgaacattac cgccatagtg tgggctggtg tacctggaca ggagtccggc 1920
aatgctcttg tggacatcct ttatggcaaa acaagccctg gtcgctctcc cttcacatgg 1980
ggtcgcaccc gaaagagtta cggcactgat gtcctatacg agcccaacaa tggtcagggt 2040
gctcctcaag atgatttcac ggagggagtc tttatcgact atcgtcattt tgaccaggtt 2100
tctcctagca ccgacggcag caagtctaat gatgagtcca gtcccatcta cgagtttggc 2160
catggtctgt cctggaccac gtttgagtac tctgaactca acattcaagc tcacaacaag 2220
attcccttcg atcctcctat tggcgagacg attgccgctc cggtccttgg caactacagt 2280
accgaccttg ccgattacac gttccccgat ggaattcgct acatctacca gttcatctat 2340
ccctggttga atacttcttc ttccggaaga gaggcttctg gcgatcccga ctacggaaag 2400
acggccgaag agttcctgcc ccccggagct ctcgacgggt cagctcagcc gcgacctcca 2460
tcctctggtg ctccaggtgg aaaccctcat ctttgggatg tgttgtacac tgttagtgct 2520
atcatcacca acactggcaa cgccacctcg gacgagatcc cgcagctcta cgttagtctc 2580
ggtggcgaga acgagcccgt ccgcgtcctt cgcgggttcg accgaattga gaacattgcg 2640
cctggccaga gtgtcagatt cacaactgac atcactcgcc gcgacctgag caactgggac 2700
gtcgtctctc agaactgggt cattacagac tacgagaaga ccgtatatgt cgggagcagc 2760
tcccgcaacc tgcctctcaa ggcaaccctg aagtaa 2796
<210> 114
<211> 880
<212> PRT
<213> Nectria haematococca
<400> 114
Met Arg Phe Thr Val Leu Leu Ala Ala Phe Ser Gly Leu Val Pro Met
1 5 10 15
Val Gly Ser Gln Ala Asp Gln Lys Pro Leu Gln Leu Gly Val Asn Asn
20 25 30
Asn Thr Leu Ala His Ser Pro Pro His Tyr Pro Ser Pro Trp Met Asp
35 40 45
Pro Ala Ala Pro Gly Trp Glu Glu Ala Tyr Leu Lys Ala Lys Asp Phe
50 55 60
Val Ser Gln Leu Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly Val
65 70 75 80
Gly Trp Met Gly Glu Arg Cys Val Gly Asn Val Gly Ser Leu Pro Arg
85 90 95
Phe Gly Met Arg Gly Leu Cys Met Gln Asp Gly Pro Leu Gly Ile Arg
100 105 110
Leu Ser Asp Tyr Asn Ser Ala Phe Pro Thr Gly Ile Thr Ala Gly Ala
115 120 125
Ser Trp Ser Arg Ala Leu Trp Tyr Gln Arg Gly Leu Leu Met Gly Thr
130 135 140
Glu His Arg Glu Lys Gly Ile Asp Val Ala Leu Gly Pro Ala Thr Gly
145 150 155 160
Pro Leu Gly Arg Thr Pro Thr Gly Gly Arg Asn Trp Glu Gly Phe Ser
165 170 175
Val Asp Pro Tyr Val Ala Gly Val Ala Met Ala Glu Thr Val Ser Gly
180 185 190
Ile Gln Asp Gly Gly Thr Ile Ala Cys Ala Lys His Tyr Ile Gly Asn
195 200 205
Glu Gln Glu His His Arg Gln Ala Pro Glu Ser Ile Gly Arg Gly Tyr
210 215 220
Asn Ile Thr Glu Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Leu His
225 230 235 240
Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Lys Ala Gly Val Gly
245 250 255
Ala Ile Met Cys Ser Tyr Gln Gln Leu Asn Asn Ser Tyr Gly Cys Gln
260 265 270
Asn Ser Lys Leu Leu Asn Gly Ile Leu Lys Asp Glu Leu Gly Phe Gln
275 280 285
Gly Phe Val Met Ser Asp Trp Gln Ala Gln His Ala Gly Ala Ala Thr
290 295 300
Ala Val Ala Gly Leu Asp Met Thr Met Pro Gly Asp Thr Leu Phe Asn
305 310 315 320
Thr Gly Tyr Ser Phe Trp Gly Gly Asn Leu Thr Leu Ala Val Val Asn
325 330 335
Gly Thr Val Pro Asp Trp Arg Ile Asp Asp Met Ala Met Arg Ile Met
340 345 350
Ala Ala Phe Phe Lys Val Gly Lys Thr Val Glu Asp Leu Pro Asp Ile
355 360 365
Asn Phe Ser Ser Trp Ser Arg Asp Thr Phe Gly Tyr Val Gln Ala Ala
370 375 380
Ala Gln Glu Asn Trp Glu Gln Ile Asn Phe Gly Val Asp Val Arg His
385 390 395 400
Asp His Ser Glu His Ile Arg Leu Ser Ala Ala Lys Gly Thr Val Leu
405 410 415
Leu Lys Asn Ser Gly Ser Leu Pro Leu Lys Lys Pro Lys Phe Leu Ala
420 425 430
Val Val Gly Glu Asp Ala Gly Pro Asn Pro Ala Gly Pro Asn Gly Cys
435 440 445
Asn Asp Arg Gly Cys Asn Asn Gly Thr Leu Ala Met Ser Trp Gly Ser
450 455 460
Gly Thr Ala Gln Phe Pro Tyr Leu Val Thr Pro Asp Ser Ala Leu Gln
465 470 475 480
Asn Gln Ala Val Leu Asp Gly Thr Arg Tyr Glu Ser Val Leu Arg Asn
485 490 495
Asn Gln Trp Glu Gln Thr Arg Ser Leu Ile Ser Gln Pro Asn Val Thr
500 505 510
Ala Ile Val Phe Ala Asn Ala Asn Ser Gly Glu Gly Tyr Ile Asp Val
515 520 525
Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp Asn Glu Gly
530 535 540
Asp Asp Leu Ile Lys Asn Val Ser Ser Ile Cys Pro Asn Thr Ile Val
545 550 555 560
Val Leu His Thr Val Gly Pro Val Ile Leu Thr Glu Trp Tyr Asp Asn
565 570 575
Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Val Pro Gly Gln Glu Ser
580 585 590
Gly Asn Ala Leu Val Asp Ile Leu Tyr Gly Lys Thr Ser Pro Gly Arg
595 600 605
Ser Pro Phe Thr Trp Gly Arg Thr Arg Lys Ser Tyr Gly Thr Asp Val
610 615 620
Leu Tyr Glu Pro Asn Asn Gly Gln Gly Ala Pro Gln Asp Asp Phe Thr
625 630 635 640
Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Gln Val Ser Pro Ser
645 650 655
Thr Asp Gly Ser Lys Ser Asn Asp Glu Ser Ser Pro Ile Tyr Glu Phe
660 665 670
Gly His Gly Leu Ser Trp Thr Thr Phe Glu Tyr Ser Glu Leu Asn Ile
675 680 685
Gln Ala His Asn Lys Ile Pro Phe Asp Pro Pro Ile Gly Glu Thr Ile
690 695 700
Ala Ala Pro Val Leu Gly Asn Tyr Ser Thr Asp Leu Ala Asp Tyr Thr
705 710 715 720
Phe Pro Asp Gly Ile Arg Tyr Ile Tyr Gln Phe Ile Tyr Pro Trp Leu
725 730 735
Asn Thr Ser Ser Ser Gly Arg Glu Ala Ser Gly Asp Pro Asp Tyr Gly
740 745 750
Lys Thr Ala Glu Glu Phe Leu Pro Pro Gly Ala Leu Asp Gly Ser Ala
755 760 765
Gln Pro Arg Pro Pro Ser Ser Gly Ala Pro Gly Gly Asn Pro His Leu
770 775 780
Trp Asp Val Leu Tyr Thr Val Ser Ala Ile Ile Thr Asn Thr Gly Asn
785 790 795 800
Ala Thr Ser Asp Glu Ile Pro Gln Leu Tyr Val Ser Leu Gly Gly Glu
805 810 815
Asn Glu Pro Val Arg Val Leu Arg Gly Phe Asp Arg Ile Glu Asn Ile
820 825 830
Ala Pro Gly Gln Ser Val Arg Phe Thr Thr Asp Ile Thr Arg Arg Asp
835 840 845
Leu Ser Asn Trp Asp Val Val Ser Gln Asn Trp Val Ile Thr Asp Tyr
850 855 860
Glu Lys Thr Val Tyr Val Gly Ser Ser Ser Arg Asn Leu Pro Leu Lys
865 870 875 880
<210> 115
<211> 3169
<212> DNA
<213> Verticillium dahliae
<400> 115
atgaagctga ccctcgctac tgccttactg gcagccagcg ggtgtgtctc tgcgggacaa 60
cccaagctca aggtacgtac ttgcctcttt ttcacaagga aaccaaaccc gcaccataat 120
ggtgattgag cagtcgtgct ttcctcaacc cgaatcaaac ccatgccgtg ttcgcgcatg 180
ccctttcgat cgtctgttgt gtgtgaaccc acgctcttca agcatcgcac atagcaccac 240
tccatcttca ttttcgagca atttcgggcc gcagagagcg gtctttcact tcaccacaat 300
cgttcatgcc tcgtgcccca ctgccatgtt tcttcccagt attctacttc tgagagcctt 360
gaccaccgtt gtcgacatct cgtcgccaag gctcgttgac acggactctg tttcccttgg 420
aattaatatt cgaaacaatg ctgaccagca tcctcagcgc cagactaaca gctctagcga 480
gctcgccttt tcccctccgc actacccttc tccatggatg aacccccaag cgactgggtg 540
ggaggacgcc tacgcccgtg ccagagaggt ggtagagcag atgactctgc tcgaaaaggt 600
caacctgacg acaggtgtcg ggtaagcttc acagaccccg tcttgccatc caaagtcatc 660
tgacagaatc ctagctggag cggtgatctc tgcgtcggaa acgtcggctc gatcccccga 720
atcggctgga gggggctttg tttgcaggat ggcccacagg gtatccgttt cgcggactac 780
gtctcgtact tcacttcgag ccagacagcc ggcgctacct gggaccgagg gcttctgtac 840
cagcgcgctc acgccattgg cgccgaagga gtagccaagg gcgtcgacgt cgtcctcggg 900
cccgccattg gccctctagg tcgccttccc gccggaggtc gtaactggga gggtttcgcc 960
gtggaccctt acctcagtgg cgttgctgtc gccgaatccg tcaggggcat ccaggatgct 1020
ggtgctattg ccaacgtcaa gcactacatc gtcaatgagc aggaacattt ccgccaggct 1080
ggcgaggctc aaggttacgg ctacgatgtc gacgaggcat tatcgtcgaa cgttgacgac 1140
aagaccatgc atgagcttta cctttggcca tttgcagacg ctgtccgtgc tggagccggc 1200
agtgtcatgt gttcttatca acaggtgggg gcaataccat tctctcctct ttccttgcag 1260
acagtgcact gaccgacctt ttttgcccaa gatcaacaac agttacggct gtcaaaactc 1320
acatcttctg aatgggctcc tcaaggacga actcggcttt caggggttcg tcctcagcga 1380
ttggcaagcg cagcatgctg gtgctgccac tgccgttgct ggacttgaca tggccatgcc 1440
cggtgacact cgcttcaaca ccggagtcgc cttctggggc gctaacctta ccaatgccat 1500
tttgaacggc accgttcccg aatatcggct cgatgacatg gccatgcgta ttatggcggc 1560
ctttttcaaa gttggaaaga ccctggacga tgttcctgac atcaacttct cgtcttggac 1620
aaaagacacc atcggcccgc tgcactgggc ggcccaggac aatgtgcagg tcatcaacca 1680
acacgttgat gtccgtcaag accacggcgc cctcattcgc accatcgctg cccgcggtac 1740
tgtcttacta aaaaatgagg gatcactgcc tctgaacaag ccgaaatttg ttgctgtcat 1800
tggtgaagat gctggccctc gtcctgttgg tcccaatggc tgccctgatc agggttgcaa 1860
taacggcact ctggctgctg gatggggatc tggcaccgcc agtttccctt atctcatcac 1920
tcctgatagt gctcttcagt ttcaagccgt ttcggatggc tcgcgatacg aaagcatcct 1980
cagcaactgg gattatgagc gcacagaggc cttggtttcc caggcggatg ctactgctct 2040
ggttttcgtc aatgcaaact ctggcgaagg atatatcagc gttgatggaa acgaaggtga 2100
tcgcaagaac ctcactctct ggaatggagg agacgagctt attcaacgag tcgctgcggc 2160
caacaacaac accatcgtca tcatccattc ggttggtccc gttctagtca ctgactggta 2220
cgagaatccc aatatcacgg ctatcatctg ggccggctta cccggacagg agtctggcaa 2280
ctctatcgcc gatattcttt acggccgcgt gaaccctggt ggcaagacac ctttcacctg 2340
gggtccaact gttgagagct acggcgttga cgtcctgaga gagcccaaca atggcaatgg 2400
tgctccccag agcgatttcg acgagggagt cttcatcgat taccgttggt ttgaccggca 2460
gtcgggtgtt gataacaatg catcagcgcc gaggaacagc agcagcagcc acgccccaat 2520
cttcgagttt ggctatggcc tttcgtacac aacctttgaa ttctccaatc ttcagattga 2580
gaggcatgac gttcacgatt acgtccctac cactgggcag acgagccctg cgccgagatt 2640
tggtgctaac tacagtacga actacgacga ctacgtcttt cccgagggcg aaatccgtta 2700
catctatcaa cacatctacc catacctcaa ttcctcagac ccaaaggagg cattggctga 2760
tcctaaatac ggccaaactg cagaagagtt cctcccagag ggcgctcttg atgcctcacc 2820
gcagcctagg ctcccagctt ctggagggcc cggaggcaac ccaatgcttt gggacgtcat 2880
attcacggtc accgcgaccg tgaccaacac gggtaaggtt gctggggacg aagtggcaca 2940
gctttacgtt tctcttggtg gacctgacga tccgattcga gtcctccgtg ggttcgaccg 3000
cattcacatc gcgcctggag cctcgcaaac cttccgtgcg gaactcacgc gccgggacct 3060
cagcaactgg gatgttgtca cgcaaaattg gttcatcagc cagtacgaaa agacggtctt 3120
tgtcgggagc tcatcccgaa acctccctct cagcactcgc ctcgaatag 3169
<210> 116
<211> 890
<212> PRT
<213> Verticillium dahliae
<400> 116
Met Lys Leu Thr Leu Ala Thr Ala Leu Leu Ala Ala Ser Gly Cys Val
1 5 10 15
Ser Ala Gly Gln Pro Lys Leu Lys His Pro Gln Arg Gln Thr Asn Ser
20 25 30
Ser Ser Glu Leu Ala Phe Ser Pro Pro His Tyr Pro Ser Pro Trp Met
35 40 45
Asn Pro Gln Ala Thr Gly Trp Glu Asp Ala Tyr Ala Arg Ala Arg Glu
50 55 60
Val Val Glu Gln Met Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly
65 70 75 80
Val Gly Trp Ser Gly Asp Leu Cys Val Gly Asn Val Gly Ser Ile Pro
85 90 95
Arg Ile Gly Trp Arg Gly Leu Cys Leu Gln Asp Gly Pro Gln Gly Ile
100 105 110
Arg Phe Ala Asp Tyr Val Ser Tyr Phe Thr Ser Ser Gln Thr Ala Gly
115 120 125
Ala Thr Trp Asp Arg Gly Leu Leu Tyr Gln Arg Ala His Ala Ile Gly
130 135 140
Ala Glu Gly Val Ala Lys Gly Val Asp Val Val Leu Gly Pro Ala Ile
145 150 155 160
Gly Pro Leu Gly Arg Leu Pro Ala Gly Gly Arg Asn Trp Glu Gly Phe
165 170 175
Ala Val Asp Pro Tyr Leu Ser Gly Val Ala Val Ala Glu Ser Val Arg
180 185 190
Gly Ile Gln Asp Ala Gly Ala Ile Ala Asn Val Lys His Tyr Ile Val
195 200 205
Asn Glu Gln Glu His Phe Arg Gln Ala Gly Glu Ala Gln Gly Tyr Gly
210 215 220
Tyr Asp Val Asp Glu Ala Leu Ser Ser Asn Val Asp Asp Lys Thr Met
225 230 235 240
His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Ala
245 250 255
Gly Ser Val Met Cys Ser Tyr Gln Gln Ile Asn Asn Ser Tyr Gly Cys
260 265 270
Gln Asn Ser His Leu Leu Asn Gly Leu Leu Lys Asp Glu Leu Gly Phe
275 280 285
Gln Gly Phe Val Leu Ser Asp Trp Gln Ala Gln His Ala Gly Ala Ala
290 295 300
Thr Ala Val Ala Gly Leu Asp Met Ala Met Pro Gly Asp Thr Arg Phe
305 310 315 320
Asn Thr Gly Val Ala Phe Trp Gly Ala Asn Leu Thr Asn Ala Ile Leu
325 330 335
Asn Gly Thr Val Pro Glu Tyr Arg Leu Asp Asp Met Ala Met Arg Ile
340 345 350
Met Ala Ala Phe Phe Lys Val Gly Lys Thr Leu Asp Asp Val Pro Asp
355 360 365
Ile Asn Phe Ser Ser Trp Thr Lys Asp Thr Ile Gly Pro Leu His Trp
370 375 380
Ala Ala Gln Asp Asn Val Gln Val Ile Asn Gln His Val Asp Val Arg
385 390 395 400
Gln Asp His Gly Ala Leu Ile Arg Thr Ile Ala Ala Arg Gly Thr Val
405 410 415
Leu Leu Lys Asn Glu Gly Ser Leu Pro Leu Asn Lys Pro Lys Phe Val
420 425 430
Ala Val Ile Gly Glu Asp Ala Gly Pro Arg Pro Val Gly Pro Asn Gly
435 440 445
Cys Pro Asp Gln Gly Cys Asn Asn Gly Thr Leu Ala Ala Gly Trp Gly
450 455 460
Ser Gly Thr Ala Ser Phe Pro Tyr Leu Ile Thr Pro Asp Ser Ala Leu
465 470 475 480
Gln Phe Gln Ala Val Ser Asp Gly Ser Arg Tyr Glu Ser Ile Leu Ser
485 490 495
Asn Trp Asp Tyr Glu Arg Thr Glu Ala Leu Val Ser Gln Ala Asp Ala
500 505 510
Thr Ala Leu Val Phe Val Asn Ala Asn Ser Gly Glu Gly Tyr Ile Ser
515 520 525
Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp Asn Gly
530 535 540
Gly Asp Glu Leu Ile Gln Arg Val Ala Ala Ala Asn Asn Asn Thr Ile
545 550 555 560
Val Ile Ile His Ser Val Gly Pro Val Leu Val Thr Asp Trp Tyr Glu
565 570 575
Asn Pro Asn Ile Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly Gln Glu
580 585 590
Ser Gly Asn Ser Ile Ala Asp Ile Leu Tyr Gly Arg Val Asn Pro Gly
595 600 605
Gly Lys Thr Pro Phe Thr Trp Gly Pro Thr Val Glu Ser Tyr Gly Val
610 615 620
Asp Val Leu Arg Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp
625 630 635 640
Phe Asp Glu Gly Val Phe Ile Asp Tyr Arg Trp Phe Asp Arg Gln Ser
645 650 655
Gly Val Asp Asn Asn Ala Ser Ala Pro Arg Asn Ser Ser Ser Ser His
660 665 670
Ala Pro Ile Phe Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu
675 680 685
Phe Ser Asn Leu Gln Ile Glu Arg His Asp Val His Asp Tyr Val Pro
690 695 700
Thr Thr Gly Gln Thr Ser Pro Ala Pro Arg Phe Gly Ala Asn Tyr Ser
705 710 715 720
Thr Asn Tyr Asp Asp Tyr Val Phe Pro Glu Gly Glu Ile Arg Tyr Ile
725 730 735
Tyr Gln His Ile Tyr Pro Tyr Leu Asn Ser Ser Asp Pro Lys Glu Ala
740 745 750
Leu Ala Asp Pro Lys Tyr Gly Gln Thr Ala Glu Glu Phe Leu Pro Glu
755 760 765
Gly Ala Leu Asp Ala Ser Pro Gln Pro Arg Leu Pro Ala Ser Gly Gly
770 775 780
Pro Gly Gly Asn Pro Met Leu Trp Asp Val Ile Phe Thr Val Thr Ala
785 790 795 800
Thr Val Thr Asn Thr Gly Lys Val Ala Gly Asp Glu Val Ala Gln Leu
805 810 815
Tyr Val Ser Leu Gly Gly Pro Asp Asp Pro Ile Arg Val Leu Arg Gly
820 825 830
Phe Asp Arg Ile His Ile Ala Pro Gly Ala Ser Gln Thr Phe Arg Ala
835 840 845
Glu Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Val Thr Gln Asn
850 855 860
Trp Phe Ile Ser Gln Tyr Glu Lys Thr Val Phe Val Gly Ser Ser Ser
865 870 875 880
Arg Asn Leu Pro Leu Ser Thr Arg Leu Glu
885 890
<210> 117
<211> 2418
<212> DNA
<213> Podospora anserina
<400> 117
atgaaactca ataagccatt cctggccatt tatttggctt tcaacttggc cgaggcttcg 60
aaaactccgg attgcatcag tggtccgctg gcaaagacct tggcatgtga tacaacggcg 120
tcacctcctg cgcgagcagc tgctcttgtg caggctttaa atatcacgga aaagcttgtg 180
aatctagtgg agtatgtcaa gtcaagagaa gctcctttag ggatttcaat tcagctaatc 240
actcctcata gcatgagcct cggtgcagaa aggatcggcc ttccagctta tgcttggtgg 300
aacgaagctc ttcatggtgt tgccgcgtcg cctggggtct ccttcaatca ggccggacaa 360
gaattctcac acgctacttc atttgcgaat actattacgc tagcagccgc ctttgacaat 420
gacctggttt acgaggtggc ggataccatc agcactgaag cgcgagcgtt cagcaatgcc 480
gagctcgctg gactggatta ctggacgcct aacatcaacc cgtacaaaga tccgagatgg 540
gggaggggcc atgaggtttg ttaccttagc cttcttttcc gtgccgtgca gttgctgaga 600
actcaaaaga cacccggaga agatccggta cacatcaaag gctacgtcca agcacttctc 660
gagggtctag aagggagaga caagatcaga aaggtgattg ccacttgtaa acactttgca 720
gcctatgatt tggagagatg gcaaggggct cttagataca ggttcaatgc tgttgtgacc 780
tcgcaggatc tttcggagta ctacctccaa ccgtttcaac aatgcgctcg agacagcaag 840
gtcgggtctt tcatgtgctc atataatgcg ctcaacggaa caccggcatg tgcaagcacg 900
tatttgatgg acgacatcct tcgaaaacac tggaattgga ccgagcacaa caactatata 960
acgagcgact gtaatgctat tcaggacttc ctccccaact ttcacaactt cagccaaact 1020
ccagctcaag ccgccgctga tgcttataac gccggtacag acaccgtctg tgaggtgcct 1080
ggataccccc cactcacaga tgtaatcgga gcatacaatc agtctctgct gtcagaggaa 1140
attatcgacc gagcacttcg cagattatac gaaggcctca tccgagctgg ctatctcgac 1200
tcagcctccc cacatccata caccaaaatc tcatggtccc aagtaaacac ccccaaagcc 1260
caagccctgg ctctccagtc cgccaccgac gggatagtcc ttctcaaaaa caacggcctc 1320
cttcccctag acctcaccaa caaaaccata gccctcatag gccactgggc caatgcaacc 1380
cgccaaatgc taggcggcta cagcggtatc cccccttact acgccaaccc aatctatgca 1440
gccacccagc tcaacgtcac ttttcatcac gccccaggac cggtgaacca gtcatctccc 1500
tccacaaatg acacctggac ctcccccgcc ctctccgcgg cttccaaatc ggatatcatc 1560
ctctacctcg gcggcaccga cctctccatc gcagccgaag accgagacag agactccatc 1620
gcctggccat ccgctcaact ttccttgtta acctccctcg cccagatggg aaaacccaca 1680
atcgtagcaa gactaggcga ccaagtagac gacacccccc tgctctccaa cccaaacatc 1740
tcctccatcc tatgggtagg ctacccaggc caatcaggcg gaacagccct cttgaacatc 1800
atcaccggag tcagctcccc cgccgctcga ctgcccgtca cagtctaccc agaaacttac 1860
acctccctca tccccctgac agccatgtcc ctccgcccaa cctccgcccg cccaggccgg 1920
acttacaggt ggtacccctc ccccgtgctc cccttcggcc acggcctcca ctacacaacc 1980
tttaccgcca aattcggcgt ctttgagtcc ctcaccatca acattgccga actcgtttcc 2040
aactgtaacg aacgatacct cgacctctgc cggttcccgc aggtgtccgt ctgggtgtcg 2100
aatacgggag aactcaaatc tgactatgtc gcccttgttt ttgtcagggg tgagtacgga 2160
ccggagccgt acccgatcaa gacgctggtg gggtacaagc ggataaggga tatcgagccg 2220
gggactacgg gggcggcgcc ggtgggggtg gtggtggggg atttggctag ggtggatttg 2280
ggggggaata gggttttgtt tccggggaag tatgagtttc tgctggatgt ggaggggggg 2340
agggataggg ttgtgatcga gttggttggg gaggaggtgg tgttggagaa gttccctcag 2400
ccgcctgcgg cgggttga 2418
<210> 118
<211> 805
<212> PRT
<213> Podospora anserina
<400> 118
Met Lys Leu Asn Lys Pro Phe Leu Ala Ile Tyr Leu Ala Phe Asn Leu
1 5 10 15
Ala Glu Ala Ser Lys Thr Pro Asp Cys Ile Ser Gly Pro Leu Ala Lys
20 25 30
Thr Leu Ala Cys Asp Thr Thr Ala Ser Pro Pro Ala Arg Ala Ala Ala
35 40 45
Leu Val Gln Ala Leu Asn Ile Thr Glu Lys Leu Val Asn Leu Val Glu
50 55 60
Tyr Val Lys Ser Arg Glu Ala Pro Leu Gly Ile Ser Ile Gln Leu Ile
65 70 75 80
Thr Pro His Ser Met Ser Leu Gly Ala Glu Arg Ile Gly Leu Pro Ala
85 90 95
Tyr Ala Trp Trp Asn Glu Ala Leu His Gly Val Ala Ala Ser Pro Gly
100 105 110
Val Ser Phe Asn Gln Ala Gly Gln Glu Phe Ser His Ala Thr Ser Phe
115 120 125
Ala Asn Thr Ile Thr Leu Ala Ala Ala Phe Asp Asn Asp Leu Val Tyr
130 135 140
Glu Val Ala Asp Thr Ile Ser Thr Glu Ala Arg Ala Phe Ser Asn Ala
145 150 155 160
Glu Leu Ala Gly Leu Asp Tyr Trp Thr Pro Asn Ile Asn Pro Tyr Lys
165 170 175
Asp Pro Arg Trp Gly Arg Gly His Glu Val Cys Tyr Leu Ser Leu Leu
180 185 190
Phe Arg Ala Val Gln Leu Leu Arg Thr Gln Lys Thr Pro Gly Glu Asp
195 200 205
Pro Val His Ile Lys Gly Tyr Val Gln Ala Leu Leu Glu Gly Leu Glu
210 215 220
Gly Arg Asp Lys Ile Arg Lys Val Ile Ala Thr Cys Lys His Phe Ala
225 230 235 240
Ala Tyr Asp Leu Glu Arg Trp Gln Gly Ala Leu Arg Tyr Arg Phe Asn
245 250 255
Ala Val Val Thr Ser Gln Asp Leu Ser Glu Tyr Tyr Leu Gln Pro Phe
260 265 270
Gln Gln Cys Ala Arg Asp Ser Lys Val Gly Ser Phe Met Cys Ser Tyr
275 280 285
Asn Ala Leu Asn Gly Thr Pro Ala Cys Ala Ser Thr Tyr Leu Met Asp
290 295 300
Asp Ile Leu Arg Lys His Trp Asn Trp Thr Glu His Asn Asn Tyr Ile
305 310 315 320
Thr Ser Asp Cys Asn Ala Ile Gln Asp Phe Leu Pro Asn Phe His Asn
325 330 335
Phe Ser Gln Thr Pro Ala Gln Ala Ala Ala Asp Ala Tyr Asn Ala Gly
340 345 350
Thr Asp Thr Val Cys Glu Val Pro Gly Tyr Pro Pro Leu Thr Asp Val
355 360 365
Ile Gly Ala Tyr Asn Gln Ser Leu Leu Ser Glu Glu Ile Ile Asp Arg
370 375 380
Ala Leu Arg Arg Leu Tyr Glu Gly Leu Ile Arg Ala Gly Tyr Leu Asp
385 390 395 400
Ser Ala Ser Pro His Pro Tyr Thr Lys Ile Ser Trp Ser Gln Val Asn
405 410 415
Thr Pro Lys Ala Gln Ala Leu Ala Leu Gln Ser Ala Thr Asp Gly Ile
420 425 430
Val Leu Leu Lys Asn Asn Gly Leu Leu Pro Leu Asp Leu Thr Asn Lys
435 440 445
Thr Ile Ala Leu Ile Gly His Trp Ala Asn Ala Thr Arg Gln Met Leu
450 455 460
Gly Gly Tyr Ser Gly Ile Pro Pro Tyr Tyr Ala Asn Pro Ile Tyr Ala
465 470 475 480
Ala Thr Gln Leu Asn Val Thr Phe His His Ala Pro Gly Pro Val Asn
485 490 495
Gln Ser Ser Pro Ser Thr Asn Asp Thr Trp Thr Ser Pro Ala Leu Ser
500 505 510
Ala Ala Ser Lys Ser Asp Ile Ile Leu Tyr Leu Gly Gly Thr Asp Leu
515 520 525
Ser Ile Ala Ala Glu Asp Arg Asp Arg Asp Ser Ile Ala Trp Pro Ser
530 535 540
Ala Gln Leu Ser Leu Leu Thr Ser Leu Ala Gln Met Gly Lys Pro Thr
545 550 555 560
Ile Val Ala Arg Leu Gly Asp Gln Val Asp Asp Thr Pro Leu Leu Ser
565 570 575
Asn Pro Asn Ile Ser Ser Ile Leu Trp Val Gly Tyr Pro Gly Gln Ser
580 585 590
Gly Gly Thr Ala Leu Leu Asn Ile Ile Thr Gly Val Ser Ser Pro Ala
595 600 605
Ala Arg Leu Pro Val Thr Val Tyr Pro Glu Thr Tyr Thr Ser Leu Ile
610 615 620
Pro Leu Thr Ala Met Ser Leu Arg Pro Thr Ser Ala Arg Pro Gly Arg
625 630 635 640
Thr Tyr Arg Trp Tyr Pro Ser Pro Val Leu Pro Phe Gly His Gly Leu
645 650 655
His Tyr Thr Thr Phe Thr Ala Lys Phe Gly Val Phe Glu Ser Leu Thr
660 665 670
Ile Asn Ile Ala Glu Leu Val Ser Asn Cys Asn Glu Arg Tyr Leu Asp
675 680 685
Leu Cys Arg Phe Pro Gln Val Ser Val Trp Val Ser Asn Thr Gly Glu
690 695 700
Leu Lys Ser Asp Tyr Val Ala Leu Val Phe Val Arg Gly Glu Tyr Gly
705 710 715 720
Pro Glu Pro Tyr Pro Ile Lys Thr Leu Val Gly Tyr Lys Arg Ile Arg
725 730 735
Asp Ile Glu Pro Gly Thr Thr Gly Ala Ala Pro Val Gly Val Val Val
740 745 750
Gly Asp Leu Ala Arg Val Asp Leu Gly Gly Asn Arg Val Leu Phe Pro
755 760 765
Gly Lys Tyr Glu Phe Leu Leu Asp Val Glu Gly Gly Arg Asp Arg Val
770 775 780
Val Ile Glu Leu Val Gly Glu Glu Val Val Leu Glu Lys Phe Pro Gln
785 790 795 800
Pro Pro Ala Ala Gly
805
<210> 119
<211> 721
<212> PRT
<213> Thermotoga neapolitana
<400> 119
Met Glu Lys Val Asn Glu Ile Leu Ser Gln Leu Thr Leu Glu Glu Lys
1 5 10 15
Val Lys Leu Val Val Gly Val Gly Leu Pro Gly Leu Phe Gly Asn Pro
20 25 30
His Ser Arg Val Ala Gly Ala Ala Gly Glu Thr His Pro Val Pro Arg
35 40 45
Val Gly Leu Pro Ala Phe Val Leu Ala Asp Gly Pro Ala Gly Leu Arg
50 55 60
Ile Asn Pro Thr Arg Glu Asn Asp Glu Asn Thr Tyr Tyr Thr Thr Ala
65 70 75 80
Phe Pro Val Glu Ile Met Leu Ala Ser Thr Trp Asn Arg Glu Leu Leu
85 90 95
Glu Glu Val Gly Lys Ala Met Gly Glu Glu Val Arg Glu Tyr Gly Val
100 105 110
Asp Val Leu Leu Ala Pro Ala Met Asn Ile His Arg Asn Pro Leu Cys
115 120 125
Gly Arg Asn Phe Glu Tyr Tyr Ser Glu Asp Pro Val Leu Ser Gly Glu
130 135 140
Met Ala Ser Ser Phe Val Lys Gly Val Gln Ser Gln Gly Val Gly Ala
145 150 155 160
Cys Ile Lys His Phe Val Ala Asn Asn Gln Glu Thr Asn Arg Met Val
165 170 175
Val Asp Thr Ile Val Ser Glu Arg Ala Leu Arg Glu Ile Tyr Leu Arg
180 185 190
Gly Phe Glu Ile Ala Val Lys Lys Ser Lys Pro Trp Ser Val Met Ser
195 200 205
Ala Tyr Asn Lys Leu Asn Gly Lys Tyr Cys Ser Gln Asn Glu Trp Leu
210 215 220
Leu Lys Lys Val Leu Arg Glu Glu Trp Gly Phe Glu Gly Phe Val Met
225 230 235 240
Ser Asp Trp Tyr Ala Gly Asp Asn Pro Val Glu Gln Leu Lys Ala Gly
245 250 255
Asn Asp Leu Ile Met Pro Gly Lys Ala Tyr Gln Val Asn Thr Glu Arg
260 265 270
Arg Asp Glu Ile Glu Glu Ile Met Glu Ala Leu Lys Glu Gly Lys Leu
275 280 285
Ser Glu Glu Val Leu Asp Glu Cys Val Arg Asn Ile Leu Lys Val Leu
290 295 300
Val Asn Ala Pro Ser Phe Lys Asn Tyr Arg Tyr Ser Asn Lys Pro Asp
305 310 315 320
Leu Glu Lys His Ala Lys Val Ala Tyr Glu Ala Gly Ala Glu Gly Val
325 330 335
Val Leu Leu Arg Asn Glu Glu Ala Leu Pro Leu Ser Glu Asn Ser Lys
340 345 350
Ile Ala Leu Phe Gly Thr Gly Gln Ile Glu Thr Ile Lys Gly Gly Thr
355 360 365
Gly Ser Gly Asp Thr His Pro Arg Tyr Ala Ile Ser Ile Leu Glu Gly
370 375 380
Ile Lys Glu Arg Gly Leu Asn Phe Asp Glu Glu Leu Ala Lys Thr Tyr
385 390 395 400
Glu Asp Tyr Ile Lys Lys Met Arg Glu Thr Glu Glu Tyr Lys Pro Arg
405 410 415
Arg Asp Ser Trp Gly Thr Ile Ile Lys Pro Lys Leu Pro Glu Asn Phe
420 425 430
Leu Ser Glu Lys Glu Ile His Lys Leu Ala Lys Lys Asn Asp Val Ala
435 440 445
Val Ile Val Ile Ser Arg Ile Ser Gly Glu Gly Tyr Asp Arg Lys Pro
450 455 460
Val Lys Gly Asp Phe Tyr Leu Ser Asp Asp Glu Thr Asp Leu Ile Lys
465 470 475 480
Thr Val Ser Arg Glu Phe His Glu Gln Gly Lys Lys Val Ile Val Leu
485 490 495
Leu Asn Ile Gly Ser Pro Val Glu Val Val Ser Trp Arg Asp Leu Val
500 505 510
Asp Gly Ile Leu Leu Val Trp Gln Ala Gly Gln Glu Thr Gly Arg Ile
515 520 525
Val Ala Asp Val Leu Thr Gly Arg Ile Asn Pro Ser Gly Lys Leu Pro
530 535 540
Thr Thr Phe Pro Arg Asp Tyr Ser Asp Val Pro Ser Trp Thr Phe Pro
545 550 555 560
Gly Glu Pro Lys Asp Asn Pro Gln Lys Val Val Tyr Glu Glu Asp Ile
565 570 575
Tyr Val Gly Tyr Arg Tyr Tyr Asp Thr Phe Gly Val Glu Pro Ala Tyr
580 585 590
Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Tyr Ser Asp Leu
595 600 605
Asn Val Ser Phe Asp Gly Glu Thr Leu Arg Val Gln Tyr Arg Ile Glu
610 615 620
Asn Thr Gly Gly Arg Ala Gly Lys Glu Val Ser Gln Val Tyr Ile Lys
625 630 635 640
Ala Pro Lys Gly Lys Ile Asp Lys Pro Phe Gln Glu Leu Lys Ala Phe
645 650 655
His Lys Thr Arg Leu Leu Asn Pro Gly Glu Ser Glu Glu Val Val Leu
660 665 670
Glu Ile Pro Val Arg Asp Leu Ala Ser Phe Asn Gly Glu Glu Trp Val
675 680 685
Val Glu Ala Gly Glu Tyr Glu Val Arg Val Gly Ala Ser Ser Arg Asn
690 695 700
Ile Lys Leu Lys Gly Thr Phe Ser Val Gly Glu Glu Arg Arg Phe Lys
705 710 715 720
Pro
<210> 120
<211> 17
<212> PRT
<213> Trichoderma reesei
<400> 120
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala
<210> 121
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 121
caccatgaga tatagaacag ctgccgct 28
<210> 122
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 122
cgaccgccct gcggagtctt gcccagtggt cccgcgacag 40
<210> 123
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 123
ctgtcgcggg accactgggc aagactccgc agggcggtcg 40
<210> 124
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 124
cctacgctac cgacagagtg 20
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 125
gtctagactg gaaacgcaac 20
<210> 126
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 126
gagttgtgaa gtcggtaatc c 21
<210> 127
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 127
caccatgaaa gcaaacgtca tcttgtgcct cctgg 35
<210> 128
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 128
ctattgtaag atgccaacaa tgctgttata tgccggcttg ggg 43
<210> 129
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 129
gagttgtgaa gtcggtaatc c 21
<210> 130
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 130
cacgaagagc ggcgattc 18
<210> 131
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 131
cacccatgct gctcaatctt cag 23
<210> 132
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 132
ttacgcagac ttggggtctt gag 23
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 133
gcttgagtgt atcgtgtaag 20
<210> 134
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 134
gcaacggcaa agccccactt c 21
<210> 135
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 135
gtagcggccg cctcatctca tctcatccat cc 32
<210> 136
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 136
caccatgcag ctcaagtttc tgtc 24
<210> 137
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 137
ggttactagt caactgcccg ttctgtagcg ag 32
<210> 138
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 138
catgcgatcg cgacgttttg gtcaggtcg 29
<210> 139
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 139
gacagaaact tgagctgcat ggtgtgggac aacaagaagg 40
<210> 140
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 140
caccatggtt cgcttcagtt caatcctag 29
<210> 141
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 141
gtggctagaa gatatccaac ac 22
<210> 142
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 142
catgcgatcg cgacgttttg gtcaggtcg 29
<210> 143
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 143
gaactgaagc gaaccatggt gtgggacaac aagaaggac 39
<210> 144
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 144
gtagttatgc gcatgctaga c 21
<210> 145
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 145
gtggctagaa gatatccaac ac 22
<210> 146
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 146
gtagttatgc gcatgctaga c 21
<210> 147
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 147
ccggctcagt atcaaccact aagcacat 28
<210> 148
<211> 250
<212> PRT
<213> Thermoascus aurantiacus
<400> 148
Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
20 25 30
Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser
35 40 45
Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly
50 55 60
Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg
65 70 75 80
Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr
85 90 95
Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val
100 105 110
Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys
115 120 125
Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp
130 135 140
Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn
145 150 155 160
Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly
195 200 205
Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp
210 215 220
Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr
225 230 235 240
Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly
245 250
<210> 149
<211> 799
<212> DNA
<213> Thermoascus aurantiacus
<400> 149
atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60
ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120
acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180
atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240
tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300
agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360
tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420
tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480
caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540
caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600
tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660
cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720
cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780
tcctctgtat actggttaa 799
<210> 150
<211> 532
<212> PRT
<213> Aspergillus fumigatus
<400> 150
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
<210> 151
<211> 452
<212> PRT
<213> Aspergillus fumigatus
<400> 151
Met His Gln Arg Ala Leu Leu Phe Ser Ala Leu Ala Val Ala Ala Asn
1 5 10 15
Ala Gln Gln Val Gly Thr Gln Thr Pro Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Thr Ala Ala Gly Ser Cys Ser Gln Gln Ser Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Ser Thr Lys Asp Thr
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asn Thr Glu Leu Cys Pro Asp
65 70 75 80
Asn Glu Ser Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ala
85 90 95
Gly Thr Tyr Gly Val Thr Thr Ser Gly Ser Glu Leu Lys Leu Ser Phe
100 105 110
Val Thr Gly Ala Asn Val Gly Ser Arg Leu Tyr Leu Met Gln Asp Asp
115 120 125
Glu Thr Tyr Gln His Phe Asn Leu Leu Asn His Glu Phe Thr Phe Asp
130 135 140
Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe
145 150 155 160
Val Ala Met Asp Ala Asp Gly Gly Met Ser Lys Tyr Pro Ser Asn Lys
165 170 175
Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg
180 185 190
Asp Leu Lys Phe Ile Asn Gly Met Ala Asn Val Glu Gly Trp Glu Pro
195 200 205
Ser Ser Ser Asp Lys Asn Ala Gly Val Gly Gly His Gly Ser Cys Cys
210 215 220
Pro Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Val Thr
225 230 235 240
Pro His Pro Cys Asp Asp Val Ser Gln Thr Met Cys Ser Gly Asp Ala
245 250 255
Cys Gly Gly Thr Tyr Ser Glu Ser Arg Tyr Ala Gly Thr Cys Asp Pro
260 265 270
Asp Gly Cys Asp Phe Asn Pro Phe Arg Met Gly Asn Glu Ser Phe Tyr
275 280 285
Gly Pro Gly Lys Ile Val Asp Thr Lys Ser Lys Met Thr Val Val Thr
290 295 300
Gln Phe Ile Thr Ala Asp Gly Thr Asp Ser Gly Ala Leu Ser Glu Ile
305 310 315 320
Lys Arg Leu Tyr Val Gln Asn Gly Lys Val Ile Ala Asn Ser Val Ser
325 330 335
Asn Val Ala Gly Val Ser Gly Asn Ser Ile Thr Ser Asp Phe Cys Thr
340 345 350
Ala Gln Lys Lys Ala Phe Gly Asp Glu Asp Ile Phe Ala Lys His Gly
355 360 365
Gly Leu Ser Gly Met Gly Lys Ala Leu Ser Glu Met Val Leu Ile Met
370 375 380
Ser Ile Trp Asp Asp His His Ser Ser Met Met Trp Leu Asp Ser Thr
385 390 395 400
Tyr Pro Thr Asp Ala Asp Pro Ser Lys Pro Gly Val Ala Arg Gly Thr
405 410 415
Cys Glu His Gly Ala Gly Asp Pro Glu Asn Val Glu Ser Gln His Pro
420 425 430
Asp Ala Ser Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser
435 440 445
Thr Tyr Glu Gly
450
<210> 152
<211> 450
<212> PRT
<213> Chaetosphaeridium globosum
<400> 152
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu Met Ser
1 5 10 15
Leu Val Ser Ala Gln Gly Val Gly Thr Ser Thr Ser Glu Thr His Pro
20 25 30
Lys Ile Thr Trp Lys Lys Cys Ser Ser Gly Gly Ser Cys Ser Thr Val
35 40 45
Asn Ala Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Asn Ala
50 55 60
Asp Ser Lys Asn Cys Tyr Asp Gly Asn Glu Trp Thr Asp Ala Cys Thr
65 70 75 80
Ser Ser Asp Asp Cys Thr Ser Lys Cys Val Leu Glu Gly Ala Glu Tyr
85 90 95
Gly Lys Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Ser Leu Lys
100 105 110
Phe Leu Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe Tyr
115 120 125
Leu Met Asn Gly Ala Ser Lys Tyr Gln Met Phe Thr Leu Met Asn Asn
130 135 140
Glu Phe Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys Gly Leu Asn
145 150 155 160
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala Ser
165 170 175
Tyr Ser Thr Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Ala Asn Tyr
195 200 205
Asp Gly Trp Thr Pro Ser Ser Asn Asp Ala Asn Ala Gly Val Gly Ala
210 215 220
Leu Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala His
225 230 235 240
Ala Phe Ala Phe Thr Pro His Ala Cys Glu Asn Asn Asn Tyr His Val
245 250 255
Cys Glu Asp Thr Thr Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
260 265 270
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Val Gly
275 280 285
Asn Thr Asp Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys
290 295 300
Phe Thr Val Val Ser Gln Phe Gln Glu Asn Lys Leu Thr Gln Phe Phe
305 310 315 320
Val Gln Asn Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys His Glu Gly
325 330 335
Leu Pro Thr Glu Ser Ser Asp Ile Thr Pro Glu Leu Cys Ser Ala Met
340 345 350
Pro Glu Val Phe Gly Asp Arg Asp Arg Phe Ala Glu Val Gly Gly Phe
355 360 365
Asp Ala Leu Asn Lys Ala Leu Ala Val Pro Met Val Leu Val Met Ser
370 375 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385 390 395 400
Pro Pro Glu Lys Ala Gly Thr Pro Gly Gly Asp Arg Gly Pro Cys Ala
405 410 415
Gln Asp Ser Gly Val Pro Ser Glu Val Glu Ser Gln Tyr Pro Asp Ala
420 425 430
Thr Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
435 440 445
Gln Val
450
<210> 153
<211> 452
<212> PRT
<213> Chaetosphaeridium globosum
<400> 153
Met Tyr Arg Gln Val Ala Thr Ala Leu Ser Phe Ala Ser Leu Val Leu
1 5 10 15
Gly Gln Gln Val Gly Thr Leu Thr Ala Glu Thr His Pro Ser Leu Pro
20 25 30
Ile Glu Val Cys Thr Ala Pro Gly Ser Cys Thr Lys Glu Asp Thr Thr
35 40 45
Val Val Leu Asp Ala Asn Trp Arg Trp Thr His Val Thr Asp Gly Tyr
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Ala Trp Asn Glu Thr Ala Cys Pro Asp
65 70 75 80
Gly Lys Thr Cys Ala Ala Asn Cys Ala Ile Asp Gly Ala Glu Tyr Glu
85 90 95
Lys Thr Tyr Gly Ile Thr Thr Pro Glu Glu Gly Ala Leu Arg Leu Asn
100 105 110
Phe Val Thr Glu Ser Asn Val Gly Ser Arg Val Tyr Leu Met Ala Gly
115 120 125
Glu Asp Lys Tyr Arg Leu Phe Asn Leu Leu Asn Lys Glu Phe Thr Met
130 135 140
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Val Tyr
145 150 155 160
Phe Ser Glu Met Asp Glu Asp Gly Gly Met Ser Arg Phe Glu Gly Asn
165 170 175
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ser Glu Gly Trp Gly
195 200 205
Gly Glu Asp Gly Asn Ser Gly Thr Gly Lys Tyr Gly Thr Cys Cys Ala
210 215 220
Glu Met Asp Ile Trp Glu Ala Asn Leu Asp Ala Thr Ala Tyr Thr Pro
225 230 235 240
His Pro Cys Lys Val Thr Glu Gln Thr Arg Cys Glu Asp Asp Thr Glu
245 250 255
Cys Gly Ala Gly Asp Ala Arg Tyr Glu Gly Leu Cys Asp Arg Asp Gly
260 265 270
Cys Asp Phe Asn Ser Phe Arg Leu Gly Asn Lys Glu Phe Tyr Gly Pro
275 280 285
Glu Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Leu Val Thr Gln Phe
290 295 300
Val Thr Ala Asp Gly Thr Asp Thr Gly Ala Leu Gln Ser Ile Arg Arg
305 310 315 320
Phe Tyr Val Gln Asp Gly Thr Val Ile Pro Asn Ser Glu Thr Val Val
325 330 335
Glu Gly Val Asp Pro Thr Asn Glu Ile Thr Asp Asp Phe Cys Ala Gln
340 345 350
Gln Lys Thr Ala Phe Gly Asp Asn Asn His Phe Lys Thr Ile Gly Gly
355 360 365
Leu Pro Ala Met Gly Lys Ser Leu Glu Lys Met Val Leu Val Leu Ser
370 375 380
Ile Trp Asp Asp His Ala Val Tyr Met Asn Trp Leu Asp Ser Asn Tyr
385 390 395 400
Pro Thr Asp Ala Asp Pro Thr Lys Pro Gly Val Ala Arg Gly Arg Cys
405 410 415
Asp Pro Glu Ala Gly Val Pro Glu Thr Val Glu Ala Ala His Pro Asp
420 425 430
Ala Tyr Val Ile Tyr Ser Asn Ile Lys Ile Gly Ala Leu Asn Ser Thr
435 440 445
Phe Ala Ala Ala
450
<210> 154
<211> 526
<212> PRT
<213> Thielavia terrestris
<400> 154
Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala
1 5 10 15
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser
20 25 30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
35 40 45
Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp
65 70 75 80
Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser
85 90 95
Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe
100 105 110
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Gly Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr
165 170 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val
195 200 205
Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr
210 215 220
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225 230 235 240
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
245 250 255
Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
260 265 270
Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn
275 280 285
Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe
290 295 300
Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn
325 330 335
Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys
340 345 350
Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys
355 360 365
Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Tyr Pro Thr Asp Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly
405 410 415
Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala
420 425 430
Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly
450 455 460
Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser
465 470 475 480
Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly
485 490 495
Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro
500 505 510
Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu
515 520 525
<210> 155
<211> 455
<212> PRT
<213> Thielavia terrestris
<400> 155
Met Leu Ser Lys Ile Leu Ala Leu Gly Ala Leu Ala Gly Ala Ala Val
1 5 10 15
Ala Gln Gln Ala Gly Thr Gln Thr Ala Glu Asn His Pro Lys Met Ser
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Ser Cys Thr Thr Val Gln Gly Glu
35 40 45
Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Lys Asn Gly Tyr
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asn Thr Thr Ile Cys Ser Asp
65 70 75 80
Ala Lys Ser Cys Ala Ala Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
85 90 95
Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Thr Leu Lys Phe
100 105 110
Val Thr Lys Gly Ser Tyr Ser Thr Asn Ile Gly Ser Arg Leu Tyr Met
115 120 125
Met Ala Ser Ser Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Lys Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ala Met Asp Glu Asp Gly Gly Met Ser Lys Tyr
165 170 175
Ser Ala Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Ser Ala
195 200 205
Gln Trp Thr Pro Ser Ser Asn Asp Gln Asn Ala Gly Val Gly Gln Tyr
210 215 220
Gly Ser Cys Cys Ala Glu Met Asp Ile Trp Tyr Ala Asn Ser Ile Ser
225 230 235 240
Ala Ala Val Thr Pro His Pro Cys Glu Thr Val Glu Gln His Gln Cys
245 250 255
Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Gly Asp Arg Tyr Gly Gly
260 265 270
Asp Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly Val
275 280 285
Lys Asp Phe Tyr Gly Pro Ser Met Thr Val Asp Thr Thr Lys Lys Phe
290 295 300
Thr Val Val Thr Gln Phe Ile Lys Gly Ser Asp Gly Glu Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Val Ile Glu Asn Ala Asn
325 330 335
Ser Thr Ile Pro Asn Asn Pro Gly Asn Ser Ile Thr Pro Asp Phe Cys
340 345 350
Lys Ala Gln Lys Val Ala Phe Gly Asp Arg Asp Val Phe Asn Glu Lys
355 360 365
Gly Gly Phe Pro Gln Phe Ser Lys Ala Val Gln Thr Pro Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Tyr Pro Val Asp Ala Asp Pro Ser Glu Pro Gly Lys Ala Arg
405 410 415
Gly Thr Cys Asp Thr Ser Ser Gly Val Pro Lys Asp Val Glu Ala Asn
420 425 430
Gln Ala Ser Asn Gln Val Ile Tyr Ser Asn Ile Lys Phe Gly Pro Ile
435 440 445
Gly Ser Thr Phe Lys Gln Ser
450 455
<210> 156
<211> 482
<212> PRT
<213> Sporotrichum thermophile
<400> 156
Met Ala Lys Lys Leu Phe Ile Thr Ala Ala Leu Ala Ala Ala Val Leu
1 5 10 15
Ala Ala Pro Val Ile Glu Glu Arg Gln Asn Cys Gly Ala Val Trp Thr
20 25 30
Gln Cys Gly Gly Asn Gly Trp Gln Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Ala Gln Asn Glu Trp Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Ser Gln Val Thr Ser Ser Thr Thr Pro Ser Ser Thr Ser Thr Ser Gln
65 70 75 80
Arg Ser Thr Ser Thr Ser Ser Ser Thr Thr Arg Ser Gly Ser Ser Ser
85 90 95
Ser Ser Ser Thr Thr Pro Pro Pro Val Ser Ser Pro Val Thr Ser Ile
100 105 110
Pro Gly Gly Ala Thr Ser Thr Ala Ser Tyr Ser Gly Asn Pro Phe Ser
115 120 125
Gly Val Arg Leu Phe Ala Asn Asp Tyr Tyr Arg Ser Glu Val His Asn
130 135 140
Leu Ala Ile Pro Ser Met Thr Gly Thr Leu Ala Ala Lys Ala Ser Ala
145 150 155 160
Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile
165 170 175
Asp Thr Leu Met Val Gln Thr Leu Ser Gln Val Arg Ala Leu Asn Lys
180 185 190
Ala Gly Ala Asn Pro Pro Tyr Ala Ala Gln Leu Val Val Tyr Asp Leu
195 200 205
Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile
210 215 220
Ala Asn Gly Gly Ala Ala Asn Tyr Arg Ser Tyr Ile Asp Ala Ile Arg
225 230 235 240
Lys His Ile Ile Glu Tyr Ser Asp Ile Arg Ile Ile Leu Val Ile Glu
245 250 255
Pro Asp Ser Met Ala Asn Met Val Thr Asn Met Asn Val Ala Lys Cys
260 265 270
Ser Asn Ala Ala Ser Thr Tyr His Glu Leu Thr Val Tyr Ala Leu Lys
275 280 285
Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala
290 295 300
Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe
305 310 315 320
Ala Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ala Val Arg Gly Leu
325 330 335
Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Ser Ala Pro
340 345 350
Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu
355 360 365
Ala Phe Ser Pro Leu Leu Asn Ser Ala Gly Phe Pro Ala Arg Phe Ile
370 375 380
Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp
385 390 395 400
Gly Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr
405 410 415
Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp Val Lys Pro
420 425 430
Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp
435 440 445
Tyr His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly
450 455 460
Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro
465 470 475 480
Pro Phe
<210> 157
<211> 395
<212> PRT
<213> Sporotrichum thermophile
<400> 157
Met Lys Phe Val Gln Ser Ala Thr Leu Ala Phe Ala Ala Thr Ala Leu
1 5 10 15
Ala Ala Pro Ser Arg Thr Thr Pro Gln Lys Pro Arg Gln Ala Ser Ala
20 25 30
Gly Cys Ala Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Phe Gln
35 40 45
Gln Tyr Thr Leu His Pro Asn Asn Phe Tyr Arg Ala Glu Val Glu Ala
50 55 60
Ala Ala Glu Ala Ile Ser Asp Ser Ala Leu Ala Glu Lys Ala Arg Lys
65 70 75 80
Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Thr Ile Glu Asn Ile
85 90 95
Gly Arg Leu Glu Pro Ala Leu Glu Asp Val Pro Cys Glu Asn Ile Val
100 105 110
Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys Ala
115 120 125
Ser Asn Gly Glu Leu Lys Val Gly Glu Leu Asp Arg Tyr Lys Thr Glu
130 135 140
Tyr Ile Asp Lys Ile Ala Glu Ile Leu Lys Ala His Ser Asn Thr Ala
145 150 155 160
Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr Asn
165 170 175
Ser Asp Leu Gln Thr Cys Gln Gln Ser Ala Ser Gly Tyr Arg Glu Gly
180 185 190
Val Ala Tyr Ala Leu Lys Gln Leu Asn Leu Pro Asn Val Val Met Tyr
195 200 205
Ile Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu Lys
210 215 220
Pro Gly Ala Gln Glu Leu Ala Ser Val Tyr Lys Ser Ala Gly Ser Pro
225 230 235 240
Ser Gln Val Arg Gly Ile Ser Thr Asn Val Ala Gly Trp Asn Ala Trp
245 250 255
Asp Gln Glu Pro Gly Glu Phe Ser Asp Ala Ser Asp Ala Gln Tyr Asn
260 265 270
Lys Cys Gln Asn Glu Lys Ile Tyr Ile Asn Thr Phe Gly Ala Glu Leu
275 280 285
Lys Ser Ala Gly Met Pro Asn His Ala Ile Ile Asp Thr Gly Arg Asn
290 295 300
Gly Val Thr Gly Leu Arg Asp Glu Trp Gly Asp Trp Cys Asn Val Asn
305 310 315 320
Gly Ala Gly Phe Gly Val Arg Pro Thr Ala Asn Thr Gly Asp Glu Leu
325 330 335
Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr
340 345 350
Ser Asp Ser Ser Ala Ala Arg Tyr Asp Ser Phe Cys Gly Lys Pro Asp
355 360 365
Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Gln Ala Tyr Phe
370 375 380
Glu Met Leu Leu Lys Asn Ala Asn Pro Ser Phe
385 390 395
<210> 158
<211> 481
<212> PRT
<213> Thielavia terrestris
<400> 158
Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu
1 5 10 15
Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser
20 25 30
Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly
35 40 45
Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg
65 70 75 80
Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr
85 90 95
Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro
100 105 110
Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly
115 120 125
Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu
130 135 140
Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val
145 150 155 160
Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp
165 170 175
Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys
180 185 190
Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro
195 200 205
Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala
210 215 220
Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser
225 230 235 240
Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro
245 250 255
Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala
260 265 270
Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln
275 280 285
Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly
290 295 300
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala
305 310 315 320
Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala
325 330 335
Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser
340 345 350
Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala
355 360 365
Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr
370 375 380
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly
385 390 395 400
Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr
405 410 415
Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly
420 425 430
Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr
435 440 445
His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr
450 455 460
Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro
465 470 475 480
Phe
<210> 159
<211> 2394
<212> DNA
<213> Trichoderma reesei
<400> 159
atggtgaata acgcagctct tctcgccgcc ctgtcggctc tcctgcccac ggccctggcg 60
cagaacaatc aaacatacgc caactactct gctcagggcc agcctgatct ctaccccgag 120
acacttgcca cgctcacact ctcgttcccc gactgcgaac atggccccct caagaacaat 180
ctcgtctgtg actcatcggc cggctatgta gagcgagccc aggccctcat ctcgctcttc 240
accctcgagg agctcattct caacacgcaa aactcgggcc ccggcgtgcc tcgcctgggt 300
cttccgaact accaagtctg gaatgaggct ctgcacggct tggaccgcgc caacttcgcc 360
accaagggcg gccagttcga atgggcgacc tcgttcccca tgcccatcct cactacggcg 420
gccctcaacc gcacattgat ccaccagatt gccgacatca tctcgaccca agctcgagca 480
ttcagcaaca gcggccgtta cggtctcgac gtctatgcgc caaacgtcaa tggcttccga 540
agccccctct ggggccgtgg ccaggagacg cccggcgaag acgccttttt cctcagctcc 600
gcctatactt acgagtacat cacgggcatc cagggtggcg tcgaccctga gcacctcaag 660
gttgccgcca cggtgaagca ctttgccgga tacgacctcg agaactggaa caaccagtcc 720
cgtctcggtt tcgacgccat cataactcag caggacctct ccgaatacta cactccccag 780
ttcctcgctg cggcccgtta tgcaaagtca cgcagcttga tgtgcgcata caactccgtc 840
aacggcgtgc ccagctgtgc caacagcttc ttcctgcaga cgcttttgcg cgagagctgg 900
ggcttccccg aatggggata cgtctcgtcc gattgcgatg ccgtctacaa cgttttcaac 960
cctcatgact acgccagcaa ccagtcgtca gccgccgcca gctcactgcg agccggcacc 1020
gatatcgact gcggtcagac ttacccgtgg cacctcaacg agtcctttgt ggccggcgaa 1080
gtctcccgcg gcgagatcga gcggtccgtc acccgtctgt acgccaacct cgtccgtctc 1140
ggatacttcg acaagaagaa ccagtaccgc tcgctcggtt ggaaggatgt cgtcaagact 1200
gatgcctgga acatctcgta cgaggctgct gttgagggca tcgtcctgct caagaacgat 1260
ggcactctcc ctctgtccaa gaaggtgcgc agcattgctc tgatcggacc atgggccaat 1320
gccacaaccc aaatgcaagg caactactat ggccctgccc catacctcat cagccctctg 1380
gaagctgcta agaaggccgg ctatcacgtc aactttgaac tcggcacaga gatcgccggc 1440
aacagcacca ctggctttgc caaggccatt gctgccgcca agaagtcgga tgccatcatc 1500
tacctcggtg gaattgacaa caccattgaa caggagggcg ctgaccgcac ggacattgct 1560
tggcccggta atcagctgga tctcatcaag cagctcagcg aggtcggcaa accccttgtc 1620
gtcctgcaaa tgggcggtgg tcaggtagac tcatcctcgc tcaagagcaa caagaaggtc 1680
aactccctcg tctggggcgg atatcccggc cagtcgggag gcgttgccct cttcgacatt 1740
ctctctggca agcgtgctcc tgccggccga ctggtcacca ctcagtaccc ggctgagtat 1800
gttcaccaat tcccccagaa tgacatgaac ctccgacccg atggaaagtc aaaccctgga 1860
cagacttaca tctggtacac cggcaaaccc gtctacgagt ttggcagtgg tctcttctac 1920
accaccttca aggagactct cgccagccac cccaagagcc tcaagttcaa cacctcatcg 1980
atcctctctg ctcctcaccc cggatacact tacagcgagc agattcccgt cttcaccttc 2040
gaggccaaca tcaagaactc gggcaagacg gagtccccat atacggccat gctgtttgtt 2100
cgcacaagca acgctggccc agccccgtac ccgaacaagt ggctcgtcgg attcgaccga 2160
cttgccgaca tcaagcctgg tcactcttcc aagctcagca tccccatccc tgtcagtgct 2220
ctcgcccgtg ttgattctca cggaaaccgg attgtatacc ccggcaagta tgagctagcc 2280
ttgaacaccg acgagtctgt gaagcttgag tttgagttgg tgggagaaga ggtaacgatt 2340
gagaactggc cgttggagga gcaacagatc aaggatgcta cacctgacgc ataa 2394
<210> 160
<211> 780
<212> DNA
<213> Trichoderma reesei
<400> 160
atggtctcct tcacctccct cctcgccggc gtcgccgcca tctcgggcgt cttggccgct 60
cccgccgccg aggtcgaatc cgtggctgtg gagaagcgcc agacgattca gcccggcacg 120
ggctacaaca acggctactt ctactcgtac tggaacgatg gccacggcgg cgtgacgtac 180
accaatggtc ccggcgggca gttctccgtc aactggtcca actcgggcaa ctttgtcggc 240
ggcaagggat ggcagcccgg gaccaagaac aagtaagact acctactctt accccctttg 300
accaacacag cacaacacaa tacaacacat gtgactacca atcatggaat cggatctaac 360
agctgtgttt taaaaaaaag ggtcatcaac ttctcgggaa gctacaaccc caacggcaac 420
agctacctct ccgtgtacgg ctggtcccgc aaccccctga tcgagtacta catcgtcgag 480
aactttggca cctacaaccc gtccacgggc gccaccaagc tgggcgaggt cacctccgac 540
ggcagcgtct acgacattta ccgcacgcag cgcgtcaacc agccgtccat catcggcacc 600
gccacctttt accagtactg gtccgtccgc cgcaaccacc gctcgagcgg ctccgtcaac 660
acggcgaacc acttcaacgc gtgggctcag caaggcctga cgctcgggac gatggattac 720
cagattgttg ccgtggaggg ttactttagc tctggctctg cttccatcac cgtcagctaa 780
<210> 161
<211> 368
<212> PRT
<213> Thielavia terrestris
<400> 161
Met Pro Ser Phe Ala Ser Lys Thr Leu Leu Ser Thr Leu Ala Gly Ala
1 5 10 15
Ala Ser Val Ala Ala His Gly His Val Ser Asn Ile Val Ile Asn Gly
20 25 30
Val Ser Tyr Gln Gly Tyr Asp Pro Thr Ser Phe Pro Tyr Met Gln Asn
35 40 45
Pro Pro Ile Val Val Gly Trp Thr Ala Ala Asp Thr Asp Asn Gly Phe
50 55 60
Val Ala Pro Asp Ala Phe Ala Ser Gly Asp Ile Ile Cys His Lys Asn
65 70 75 80
Ala Thr Asn Ala Lys Gly His Ala Val Val Ala Ala Gly Asp Lys Ile
85 90 95
Phe Ile Gln Trp Asn Thr Trp Pro Glu Ser His His Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Ser Cys Gly Ser Ala Ser Cys Glu Thr Val Asp Lys
115 120 125
Thr Lys Leu Glu Phe Phe Lys Ile Asp Glu Val Gly Leu Val Asp Gly
130 135 140
Ser Ser Ala Pro Gly Val Trp Gly Ser Asp Gln Leu Ile Ala Asn Asn
145 150 155 160
Asn Ser Trp Leu Val Glu Ile Pro Pro Thr Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Glu Asn Ala Asp
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Ile Thr Gly Thr
195 200 205
Gly Thr Ala Thr Pro Ser Gly Val Pro Gly Thr Ser Leu Tyr Thr Pro
210 215 220
Thr Asp Pro Gly Ile Leu Val Asn Ile Tyr Ser Ala Pro Ile Thr Tyr
225 230 235 240
Thr Val Pro Gly Pro Ala Leu Ile Ser Gly Ala Val Ser Ile Ala Gln
245 250 255
Ser Ser Ser Ala Ile Thr Ala Ser Gly Thr Ala Leu Thr Gly Ser Ala
260 265 270
Thr Ala Pro Ala Ala Ala Ala Ala Thr Thr Thr Ser Thr Thr Asn Ala
275 280 285
Ala Ala Ala Ala Thr Ser Ala Ala Ala Ala Ala Gly Thr Ser Thr Thr
290 295 300
Thr Thr Ser Ala Ala Ala Val Val Gln Thr Ser Ser Ser Ser Ser Ser
305 310 315 320
Ala Pro Ser Ser Ala Ala Ala Ala Ala Thr Thr Thr Ala Ala Ala Ser
325 330 335
Ala Arg Pro Thr Gly Cys Ser Ser Gly Arg Ser Arg Lys Gln Pro Arg
340 345 350
Arg His Ala Arg Asp Met Val Val Ala Arg Gly Ala Glu Glu Ala Asn
355 360 365
<210> 162
<211> 520
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic consensus sequence
<220>
<221> misc_feature
<222> (19)..(21)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (37)..(37)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (46)..(46)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (49)..(49)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (53)..(56)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (73)..(73)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (109)..(111)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (128)..(134)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (139)..(140)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (154)..(163)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (167)..(172)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (220)..(225)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (244)..(245)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (247)..(247)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (253)..(255)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (257)..(272)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (275)..(275)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (290)..(296)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (298)..(299)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (301)..(301)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (313)..(313)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (321)..(321)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (324)..(334)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (338)..(339)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (342)..(342)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (351)..(351)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (353)..(353)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (355)..(355)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (359)..(364)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (366)..(368)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (370)..(383)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (385)..(386)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (388)..(388)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (392)..(396)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (398)..(399)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (401)..(446)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (453)..(453)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (455)..(457)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (460)..(460)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (462)..(463)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (466)..(466)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (468)..(468)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (470)..(497)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (499)..(510)
<223> Xaa can be any naturally occurring amino acid or skipped
<220>
<221> misc_feature
<222> (515)..(520)
<223> Xaa can be any naturally occurring amino acid or skipped
<400> 162
Met Lys Ser Ser Ala Ser Leu Leu Leu Leu Ala Ala Leu Ala Gly Ala
1 5 10 15
Ala Ala Xaa Xaa Xaa Val Ala Ala His Gly His Val Val Asn Gly Val
20 25 30
Ile Asn Gly Val Xaa Tyr Gln Gly Tyr Asp Pro Thr Thr Xaa Pro Tyr
35 40 45
Xaa Asn Asn Pro Xaa Xaa Xaa Xaa Pro Ser Val Val Gly Trp Cys Asn
50 55 60
Ala Gly Thr Asp Asn Gly Phe Val Xaa Pro Asp Ala Tyr Ala Ser Pro
65 70 75 80
Asp Ile Ile Cys His Lys Gly Ala Thr Asn Ala Lys Gly His Ala Thr
85 90 95
Val Ala Ala Gly Asp Lys Ile Ser Ile Gln Trp Thr Xaa Xaa Xaa Trp
100 105 110
Pro Glu Ser His Lys Gly Pro Val Ile Asp Tyr Leu Ala Lys Cys Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Gly Gly Cys Thr Xaa Xaa Thr Val Asp Lys
130 135 140
Thr Ser Leu Gly Trp Phe Lys Ile Asp Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Gly Val Gly Xaa Xaa Xaa Xaa Xaa Xaa Asp Pro Gly Val
165 170 175
Trp Ala Thr Asp Asp Leu Ile Ala Asn Asn Asn Ser Trp Leu Val Lys
180 185 190
Ile Pro Ser Asp Ile Ala Pro Gly Asn Tyr Val Leu Arg His Glu Ile
195 200 205
Ile Ala Leu His Ser Ala Gly Ser Ala Asn Gly Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Ala Gln Asn Tyr Pro Gln Cys Ala Asn Leu Gln Val Thr Gly Ser
225 230 235 240
Gly Ser Ala Xaa Xaa Ser Xaa Pro Ser Gly Val Lys Xaa Xaa Xaa Pro
245 250 255
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
260 265 270
Gly Thr Xaa Leu Tyr Lys Ala Thr Asp Pro Gly Ile Leu Val Asn Ile
275 280 285
Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa Xaa Ser Xaa Tyr Thr Val
290 295 300
Pro Gly Pro Ala Val Ile Thr Gly Xaa Ala Ser Ser Val Ala Gln Ser
305 310 315 320
Xaa Ser Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Ala
325 330 335
Thr Xaa Xaa Ala Val Xaa Pro Gly Gly Thr Ala Pro Ala Pro Xaa Ala
340 345 350
Xaa Thr Xaa Ala Ser Thr Xaa Xaa Xaa Xaa Xaa Xaa Thr Xaa Xaa Xaa
355 360 365
Thr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala
370 375 380
Xaa Xaa Gly Xaa Ser Ala Pro Xaa Xaa Xaa Xaa Xaa Cys Xaa Xaa Ala
385 390 395 400
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
405 410 415
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
420 425 430
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Tyr Gly
435 440 445
Gln Cys Gly Gly Xaa Gly Xaa Xaa Xaa Thr Gly Xaa Thr Xaa Xaa Cys
450 455 460
Ala Xaa Gly Xaa Thr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
465 470 475 480
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
485 490 495
Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Tyr Tyr
500 505 510
Ser Gln Xaa Xaa Xaa Xaa Xaa Xaa
515 520
Claims (43)
- a. 바이오매스(biomass) 재료
b.
i. 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 서열 동일성이 65% 이상이거나;
ii. 서열 번호 27의 잔기 22 내지 344에 대해 서열 동일성이 65% 이상이거나
iii. 서열 번호 84 내지 91로 구성된 군으로부터 선택된 하나 이상의 아미노산 서열 모티프를 포함하거나;
iv. (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91; 및 (14) 서열 번호 85, 88, 90, 및 91로 구성된 군으로부터 선택된 하나 이상의 서열 모티프를 포함하거나;
v. 서열 번호 30에 대해 서열 동일성이 65% 이상인 폴리뉴클레오티드 서열 또는 그의 상보체(complement)에 의해 암호화되거나;
vi. 높은 엄격성 조건 하에 서열 번호 30 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드 서열에 의해 암호화되는; 엔도글루카나아제 활성을 갖는 글리코실 하이드롤라아제 패밀리(family) 61 효소를 포함하는 효소 조성물을 포함하며;
여기서, 글리코실 하이드롤리아제 패밀리 61 효소가 없는 바이오매스 당화 혼합물보다 더 낮은 점도를 갖고/갖거나, 글리코실 하이드롤라아제 패밀리 61 효소를 갖지 않거나 더 낮은 수준으로 갖는 혼합물 내의 당화 수준에 비교하여 혼합물 내의 당화 수준을 증가시킬 수 있는, 바이오매스 당화 혼합물. - 제1항에 있어서, 바이오매스의 당화를 유발하기에 충분한 기간 동안 혼합물을 인큐베이션한 후의 발효가능한 당(fermentable sugar)의 수율에 의해 당화 수준이 측정되는 바이오매스 당화 혼합물.
- 제1항 또는 제2항에 있어서, 글리코실 하이드롤라아제 패밀리 61 효소가 사상 진균으로부터 유도되는 바이오매스 당화 혼합물.
- 제3항에 있어서, 사상 진균이 트리코더마, 휴미콜라, 푸사리움, 아스페르길루스, 뉴로스포라, 페니실리움, 세팔로스포리움, 아클리아, 포도스포라, 엔도티아, 무코르, 코클리오볼루스, 피리쿨라리아, 크리소스포리움, 아스페르길루스 아와모리, 아스페르길루스 푸미가투스, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리제, 크리소스포리움 루크노엔스, 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 푸사리움 베네나툼, 브제르칸데라 아두스타, 세리포리옵시스 아네이리나, 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아, 세리포리옵시스 길베센스, 세리포리옵시스 판노신타, 세리포리옵시스 리불로사, 세리포리옵시스 서브루파, 세리포리옵시스 서브베르미스포라, 코프리누스 시네레우스, 코리올루스 히르수투스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 뉴로스포라 인터미디아, 페니실리움 푸르푸로게눔, 페니실리움 카네센스, 페니실리움 솔리툼, 페니실리움 푸니쿨로섬 파네로카에테 크리소스포리움, 플레비아 라디아테, 플레우로투스 에린기, 탈라로마이세스 플라부스, 티엘라비아 테레스트리스, 트라메테스 빌로사, 트라메테스 베르시콜로르, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 트리코더마 레세이, 트리코더마 비리데, 지오스미티아 에메르소니, 또는 G. 스테아로테르모필루스의 군으로부터 선택된 것인 바이오매스 당화 혼합물.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 효소 조성물이 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드 및 베타-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드를 추가로 포함하는 바이오매스 당화 혼합물.
- 제5항에 있어서, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드가 T. 레세이 CBH1, Af 7A(서열 번호 150), Af7B(서열 번호 151), Cg7A(서열 번호 152), Cg7B(서열 번호 153), Tt7A(서열 번호 154), Tt7B(서열 번호 155), T. 레세이 CBH2, Tt6A(서열 번호 156), St6A(서열 번호 157), St6B(서열 번호 158), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드인 바이오매스 당화 혼합물.
- 제5항 또는 제6항에 있어서, 베타-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드가
a. Fv3C(서열 번호 100), Pa3D(서열 번호 94), Fv3G(서열 번호 96), Fv3D(서열 번호 98), Tr3A(서열 번호 102), Tr3B(서열 번호 104), Te3A(서열 번호 106), An3A(서열 번호 108), Fo3A(서열 번호 110), Gz3A(서열 번호 112), Nh3A(서열 번호 114), Vd3A(서열 번호 116), Pa3G(서열 번호 118), Tn3B(서열 번호 119), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드; 또는
b. (1) 서열 번호 99, 93, 95, 97, 101, 103, 105, 107, 109, 111, 113, 115, 또는 117에 대해 90% 이상의 서열 동일성을 갖거나; (2) 높은 엄격성 조건 하에 서열 번호 99, 93, 95, 97, 101, 103, 105, 107, 109, 111, 113, 115, 또는 117, 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드인 바이오매스 당화 혼합물. - 제7항 내지 제9항 중 어느 한 항에 있어서, 효소 조성물이 (1) 자일라나아제 활성을 갖는 폴리펩티드, (2) 베타-자일로시다아제 활성을 갖는 폴리펩티드; 및 (3) L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드 중 하나 이상 또는 전부를 추가로 포함하는 바이오매스 당화 혼합물.
- 제8항에 있어서, 자일라나아제 활성을 갖는 폴리펩티드가
a. T. 레세이 Xyn3(서열 번호 76), T. 레세이 Xyn2(서열 번호 77), AfuXyn2(서열 번호 58), AfuXyn5(서열 번호 60), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드; 또는
b. (1) 서열 번호 75, 57, 또는 59에 대해 90% 이상의 서열 동일성을 갖거나; (2) 높은 엄격성 조건 하에 서열 번호 75, 57, 또는 59, 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드인 바이오매스 당화 혼합물. - 제8항에 있어서, 베타-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드가
a. Fv3A(서열 번호 36), Fv43A(서열 번호 44), Pf43A(서열 번호 38), Fv43D(서열 번호 62), Fv39A(서열 번호 42), Fv43E(서열 번호 40), Fo43A(서열 번호 52), Fv43B(서열 번호 46), Pa51A(서열 번호 48), Gz43A(서열 번호 50), T. 레세이 Bxl1(서열 번호 78), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드; 또는
b. (1) 서열 번호 35, 43, 37, 61, 41, 39, 51, 45, 47, 49, 또는 159에 대해 90% 이상의 서열 동일성을 갖거나; (2) 높은 엄격성 조건 하에 서열 번호 35, 43, 37, 61, 41, 39, 51, 45, 47, 49, 159, 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드인 바이오매스 당화 혼합물. - 제8항에 있어서, L-알파-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드가
a. Af43A(서열 번호 54), Fv43B(서열 번호 46), Pf51A(서열 번호 56), Pa51A(서열 번호 48), Fv51A(서열 번호 66), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드; 또는
b. (1) 서열 번호 53, 45, 55, 47, 또는 65에 대해 90% 이상의 서열 동일성을 갖거나; (2) 높은 엄격성 조건 하에 서열 번호 53, 45, 55, 47, 또는 65, 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드인 바이오매스 당화 혼합물. - 제1항 내지 제11항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량을 기준으로 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 15 중량%의 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드; 또는 (2) 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 1 ㎎ 내지 약 5 ㎎의 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 바이오매스 당화 혼합물.
- 제5항 내지 제12항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 80 중량%, 약 5 중량% 내지 약 70 중량%, 약 10 중량% 내지 약 60 중량%, 약 20 중량% 내지 약 50 중량%, 또는 약 25 중량% 내지 약 50 중량%; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎인 양으로 셀룰로바이오하이드롤라아제를 포함하고; (1) 효소 조성물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 30 중량%, 약 2 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎인 양으로 베타-글루코시다아제를 포함하는 바이오매스 당화 혼합물.
- 제8항 내지 제13항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량을 기준으로 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 40 중량%, 약 4 중량% 내지 약 30 중량%, 약 5 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%의 자일라나아제 활성을 갖는 폴리펩티드; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎의 자일라나아제 활성을 갖는 폴리펩티드를 포함하는 바이오매스 당화 혼합물.
- 제8항 내지 제14항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량을 기준으로 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 40 중량%, 약 2 중량% 내지 약 30 중량%, 약 4 중량% 내지 약 20 중량%, 또는 약 5 중량% 내지 약 15 중량%의 베타-자일로시다아제 활성을 갖는 폴리펩티드; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎의 베타-자일로시다아제 활성을 갖는 폴리펩티드를 포함하는 바이오매스 당화 혼합물.
- 제8항 내지 제15항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량을 기준으로 약 0.1 중량% 내지 약 50 중량%, 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 40 중량%, 약 2 중량% 내지 약 30 중량%, 약 4 중량% 내지 약 20 중량%, 또는 약 5 중량% 내지 약 15 중량%의 L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎의 L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드를 포함하는 바이오매스 당화 혼합물.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 효소 조성물이 전체 셀룰라아제(whole cellulase) 조성물인 바이오매스 당화 혼합물.
- 제17항에 있어서, 전체 셀룰라아제 조성물이 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 발현시키는 숙주 세포로부터 유도되는 바이오매스 당화 혼합물.
- 제18항에 있어서, GH61 패밀리 효소 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드가 숙주 세포에 대해 이종성인 바이오매스 당화 혼합물.
- 제17항 내지 제19항 중 어느 한 항에 있어서, 전체 셀룰라아제 조성물이 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드, 및 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 추가로 발현시키는 숙주 세포로부터 유도되는 바이오매스 당화 혼합물.
- 제20항에 있어서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드 및/또는 베타-글루코시다아제를 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드가 숙주 세포에 대해 이종성인 바이오매스 당화 혼합물.
- 제17항 내지 제21항 중 어느 한 항에 있어서, 전체 셀룰라아제 조성물이 (1) 베타-자일로시다아제 활성을 갖는 펩티드를 암호화하는 폴리뉴클레오티드; (2) 자일라나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드; 및 (3) L-알파-아라비노푸라노시다아제 활성을 갖는 폴리뉴클레오티드 펩티드 중 하나 이상 또는 전부를 발현시키는 숙주 세포로부터 유도되는 바이오매스 당화 혼합물.
- 제22항에 있어서, 베타-자일로시다아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드, 자일라나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드, 또는 L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드가 숙주 세포에 대해 이종성인 바이오매스 당화 혼합물.
- 제17항 내지 제23항 중 어느 한 항에 있어서, 효소 조성물이 전체 브로스 제형(whole broth formulation)인 바이오매스 당화 혼합물.
- 제1항 내지 제24항 중 어느 한 항에 있어서, (1) GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; (2) 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; (3) 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; (4) 베타-자일로시다아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; (5) 자일라나아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; 및 (6) L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드를 암호화하는 유전자 중 하나 이상 또는 전부가 숙주 세포의 유전 물질 내로 통합된 바이오매스 당화 혼합물.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 숙주 세포가 박테리아 숙주 세포, 효모 숙주 세포, 또는 진균 숙주 세포인 바이오매스 당화 혼합물.
- 제26항에 있어서, 숙주 세포가 사상 진균 숙주 세포인 바이오매스 당화 혼합물.
- 제27항에 있어서, 사상 진균 숙주 세포가 아스페르길루스 니게르, 아스페르길루스 오리제, 크리소스포리움 루크노엔스, 트리코더마 레세이, 아스페르길루스 아와모리, 아스페르길루스 푸미가투스, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 푸사리움 베네나툼, 브제르칸데라 아두스타, 세리포리옵시스 아네이리나, 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아, 세리포리옵시스 길베센스, 세리포리옵시스 판노신타, 세리포리옵시스 리불로사, 세리포리옵시스 서브루파, 세리포리옵시스 서브베르미스포라, 코프리누스 시네레우스, 코리올루스 히르수투스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 뉴로스포라 인터미디아, 페니실리움 푸르푸로게눔, 페니실리움 카네센스, 페니실리움 솔리툼, 페니실리움 푸니쿨로섬 파네로카에테 크리소스포리움, 플레비아 라디아테, 플레우로투스 에린기, 탈라로마이세스 플라부스, 티엘라비아 테레스트리스, 트라메테스 빌로사, 트라메테스 베르시콜로르, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 또는 트리코더마 비리데의 세포로부터 선택된 것인 바이오매스 당화 혼합물.
- 제1항 내지 제28항 중 어느 한 항에 있어서, 먼저 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물을 블렌딩한 후에 효소 조성물을 바이오매스와 혼합하는 단계에 의해 제조되는 바이오매스 당화 혼합물.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 바이오매스 재료가 헤미셀룰로오스, 셀룰로오스, 또는 헤미셀룰로오스와 셀룰로오스의 혼합물을 포함하는 바이오매스 당화 혼합물.
- 제1항 내지 제30항 중 어느 한 항에 있어서, 바이오매스 재료가 글루칸, 자일란 및/또는 리그닌을 포함하는 바이오매스 당화 혼합물.
- 제1항 내지 제30항 중 어느 한 항에 있어서, 바이오매스 재료가 종자, 낟알, 괴경, 식물 폐기물, 식품 가공 또는 산업적 가공의 부산물, 옥수수 속대(corn cob), 옥수수 대(corn stover), 초본류(grass), 소르가스트룸 누탄스, 스위치그래스, 다년생 케인, 목재, 우드칩(wood chip), 목재 가공 폐기물, 톱밥, 종이, 종이 폐기물, 펄프, 및 재활용 종이, 감자, 대두, 보리, 호밀, 귀리, 밀, 비트(beet), 사탕수수 바가스(sugar cane bagasse) 및 짚으로부터 선택되는 바이오매스 당화 혼합물.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 바이오매스 재료에 산 또는 염기를 이용하는 전처리를 적용하는 바이오매스 당화 혼합물.
- 제33항에 있어서, 전처리된 바이오매스를 효소 조성물과 혼합하기 전에 약 4.0 내지 6.5의 pH로 조정하는 바이오매스 당화 혼합물.
- 제1항 내지 제34항 중 어느 한 항에 있어서, 바이오매스 재료가 혼합물의 총 중량에 대한 그의 고체 상태의 바이오매스 재료의 양을 기준으로 약 5 중량% 내지 약 60 중량%, 약 10 중량% 내지 약 50 중량%, 약 15 중량% 내지 약 40 중량%, 약 15 중량% 내지 약 30 중량%, 또는 약 20 중량% 내지 약 30 중량%의 양으로 혼합물 내에 존재하는 바이오매스 당화 혼합물.
- 바이오매스 당화 혼합물 내의 바이오매스 재료를 가수분해하기에 적합한 조건 하에 충분한 기간 동안 제1항 내지 제35항 중 어느 한 항의 바이오매스 당화 혼합물을 인큐베이션하는 단계를 포함하는, 바이오매스 재료를 가수분해하는 방법.
- 제36항에 있어서, 바이오매스 당화 혼합물 내의 바이오매스 재료를 가수분해하기에 적합한 조건이, (1) 약 3.5 내지 약 7.0의 pH; (2) 약 2 시간 이상의 지속기간; 및/또는 (3) 약 20℃ 내지 약 75℃의 온도를 포함하는 방법.
- 제36항 또는 제37항에 있어서, 충분한 기간이 약 8 시간 내지 약 72 시간의 기간을 포함하는 방법.
- 제36항 내지 제38항 중 어느 한 항에 있어서, 2 시간 초과의 임의의 주어진 시간에, 바이오매스 당화 혼합물에 의해 생성되는 발효가능한 당의 양이, 동일한 양 및 유형의 바이오매스 재료, 및 동일한 조성의 효소 구성요소를 포함하나 GH61/엔도글루카나아제가 없는 대조군 바이오매스 당화 혼합물에 의해 생성되는 발효가능한 당의 양에 비교하여 약 5% 이상 만큼 증가되는 방법.
- 제39항에 있어서, 바이오매스 당화에 의해 생성되는 발효가능한 당의 양이, 대조군 바이오매스 당화 혼합물에 의해 생성되는 발효가능한 당에 비교하여 약 10% 이상 만큼 증가되는 방법.
- 제36항 내지 제40항 중 어느 한 항에 있어서, 바이오매스 재료가 그의 고체 상태에서 약 10 중량% 내지 약 50 중량%의 양으로 존재하는 방법.
- 제41항에 있어서, 바이오매스 당화 혼합물의 점도가, 동일한 양 및 유형의 바이오매스 재료, 및 동일한 조성의 효소 구성요소를 포함하나 GH61/엔도글루카나아제가 없는 대조군 바이오매스 당화 혼합물의 점도에 비교하여 적어도 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 또는 그 이상 만큼 감소되는 방법.
- 상업 효소 공급 모델(merchant enzyme supply model) 또는 현장 생물정제 모델(on-site bio-refinery model)에서 바이오매스 재료를 발효가능한 당으로 전환시키기 위한, 제1항 내지 제35항 중 어느 한 항의 조성물의 사용 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161453923P | 2011-03-17 | 2011-03-17 | |
US61/453,923 | 2011-03-17 | ||
PCT/US2012/029445 WO2012125925A2 (en) | 2011-03-17 | 2012-03-16 | Method for reducing viscosity in saccharification process |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140017612A true KR20140017612A (ko) | 2014-02-11 |
Family
ID=45922826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137027241A KR20140017612A (ko) | 2011-03-17 | 2012-03-16 | 당화 공정에서 점도를 감소시키는 방법 |
Country Status (15)
Country | Link |
---|---|
US (3) | US20140134677A1 (ko) |
EP (1) | EP2686434B1 (ko) |
JP (2) | JP6290626B2 (ko) |
KR (1) | KR20140017612A (ko) |
CN (1) | CN103842515A (ko) |
BR (1) | BR112013023757A2 (ko) |
CA (1) | CA2830508A1 (ko) |
DK (1) | DK2686434T3 (ko) |
HK (1) | HK1198659A1 (ko) |
MX (1) | MX2013010512A (ko) |
RU (1) | RU2013146245A (ko) |
SG (1) | SG192098A1 (ko) |
UA (1) | UA115306C2 (ko) |
WO (1) | WO2012125925A2 (ko) |
ZA (1) | ZA201305619B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160087438A (ko) * | 2015-01-13 | 2016-07-22 | 대한민국(농촌진흥청장) | 신규 페니실리움 솔리텀 m2439 균주 및 이의 용도 |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7056721B2 (en) * | 2001-12-18 | 2006-06-06 | Genencor International, Inc. | EGVI endoglucanase and nucleic acids encoding the same |
MX2012003091A (es) | 2009-09-23 | 2012-04-30 | Danisco Us Inc | Enzimas de glicosil hidrolasa novedosas y usos de las mismas. |
DK2602317T3 (da) | 2009-11-20 | 2017-11-13 | Danisco Us Inc | Beta-glucosidasevarianter med forbedrede egenskaber |
CN102686736B (zh) | 2009-12-23 | 2017-05-31 | 丹尼斯科美国公司 | 提高同步糖化发酵反应效率的方法 |
US9493802B2 (en) | 2010-08-20 | 2016-11-15 | Codexis, Inc. | Use of glycohydrolase 61 protein variants with improved thermostability for processing cellulose |
MX2013010512A (es) | 2011-03-17 | 2013-10-07 | Danisco Inc | Metodo para reducir la viscosidad en un proceso de sacarificacion. |
BR112014004171A2 (pt) * | 2011-08-22 | 2018-11-06 | Codexis Inc | variantes da proteína glicósideo hidrolase gh61 e cofatores que aumentam a atividade de gh61 |
JP2013169154A (ja) * | 2012-02-17 | 2013-09-02 | Toyota Motor Corp | セルロース系バイオマス分解増強活性ポリペプチド |
CN104245926B (zh) | 2012-04-27 | 2021-05-07 | 诺维信股份有限公司 | Gh61多肽变体以及编码其的多核苷酸 |
EP2914719A1 (en) * | 2012-10-31 | 2015-09-09 | Danisco US Inc. | Compositions and methods of use |
CA2892054A1 (en) | 2012-12-07 | 2014-06-12 | Ling Hua | Compositions and methods of use |
ES2738514T3 (es) | 2013-01-11 | 2020-01-23 | Dsm Ip Assets Bv | Procedimiento para la hidrólisis enzimática de material lignocelulósico |
HRP20220917T1 (hr) | 2013-02-04 | 2022-10-28 | Dsm Ip Assets B.V. | Polipeptid koji razgrađuje ugljikohidrate i njegova upotreba |
EP2964760B1 (en) | 2013-03-08 | 2021-05-12 | Novozymes A/S | Cellobiohydrolase variants and polynucleotides encoding same |
WO2014140171A1 (en) * | 2013-03-14 | 2014-09-18 | Dsm Ip Assets B.V. | Novel cell wall deconstruction enzymes of thielavia australiensis and uses thereof |
CA2910239A1 (en) | 2013-05-10 | 2014-11-13 | Novozymes A/S | Polypeptides having xylanase activity and polynucleotides encoding same |
US10167460B2 (en) | 2013-07-29 | 2019-01-01 | Danisco Us Inc | Variant enzymes |
JP6325214B2 (ja) * | 2013-08-29 | 2018-05-16 | アサヒグループホールディングス株式会社 | セルラーゼの製造方法及び液体培地 |
AU2014315208A1 (en) | 2013-09-04 | 2016-01-28 | Novozymes A/S | Processes for increasing enzymatic hydrolysis of cellulosic material |
WO2015081139A1 (en) | 2013-11-26 | 2015-06-04 | Novozymes A/S | Enzyme compositions and uses thereof |
FR3014903B1 (fr) * | 2013-12-17 | 2017-12-01 | Ifp Energies Now | Procede d'hydrolyse enzymatique avec production in situ de glycosides hydrolases par des microorganismes genetiquement modifies (mgm) et non mgm |
DK3092312T3 (en) | 2014-01-07 | 2019-03-04 | Novozymes As | INSURANCE OF MAN-MADE CELLULOSE-CONTAINING MATERIALS |
DK3152315T3 (en) | 2014-06-06 | 2018-11-26 | Novozymes As | ENZYME COMPOSITIONS AND APPLICATIONS THEREOF |
WO2016030480A1 (en) | 2014-08-28 | 2016-03-03 | Renescience A/S | Solubilization of msw with blend enzymes |
BR112017004251A2 (pt) * | 2014-09-05 | 2017-12-12 | Novozymes As | variantes de módulos de ligação a carboidrato e polinucleotídeos que os codificam |
US10066244B2 (en) | 2014-09-23 | 2018-09-04 | Novozymes A/S | Process for producing ethanol and fermenting organisms |
US10557127B2 (en) | 2015-02-24 | 2020-02-11 | Novozymes A/S | Cellobiohydrolase variants and polynucleotides encoding same |
BR112017018461A2 (pt) | 2015-03-12 | 2018-04-17 | Novozymes As | processos para hidrólise multiestágio, para produção de um produto de fermentação, e, para aumento de rendimento de açúcar de hidrólise. |
WO2016145350A1 (en) | 2015-03-12 | 2016-09-15 | Novozymes A/S | Multi-stage enzymatic hydrolysis of lignocellulosic biomass |
BR112017019331A2 (pt) | 2015-03-12 | 2018-06-05 | Beta Renewables Spa | processos para sacarificação de múltiplos estágios de um material lignocelulósico e para melhorar um rendimento de glicose ou xilose de sacarificação de um material lignocelulósico em um reator de tanque continuamente agitado |
US10519520B2 (en) | 2015-05-27 | 2019-12-31 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
MX2017016625A (es) | 2015-07-07 | 2018-05-15 | Danisco Us Inc | Induccion de la expresion genica usando una mezcla de azucar de alta concentracion. |
WO2017019491A1 (en) | 2015-07-24 | 2017-02-02 | Novozymes Inc. | Polypeptides having beta-xylosidase activity and polynucleotides encoding same |
EP3325616A1 (en) | 2015-07-24 | 2018-05-30 | Novozymes, Inc. | Polypeptides having arabinofuranosidase activity and polynucleotides encoding same |
CN108350044B (zh) | 2015-09-22 | 2022-05-24 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽以及对其进行编码的多核苷酸 |
WO2017076421A1 (en) | 2015-11-02 | 2017-05-11 | Renescience A/S | Solubilization of msw with blend enzymes |
WO2018053058A1 (en) | 2016-09-14 | 2018-03-22 | Danisco Us Inc. | Lignocellulosic biomass fermentation-based processes |
JP7285780B2 (ja) | 2016-10-04 | 2023-06-02 | ダニスコ・ユーエス・インク | 誘導基質の非存在下における糸状菌細胞内でのタンパク質の産生 |
CN110381746B (zh) | 2016-12-21 | 2023-12-01 | 杜邦营养生物科学有限公司 | 使用热稳定丝氨酸蛋白酶的方法 |
CN107328883A (zh) * | 2017-09-05 | 2017-11-07 | 南京凯通粮食生化研究设计有限公司 | 一种鼠李糖生产企业快速准确测定鼠李糖含量的方法 |
WO2019074828A1 (en) | 2017-10-09 | 2019-04-18 | Danisco Us Inc | CELLOBIOSE DEHYDROGENASE VARIANTS AND METHODS OF USE |
EP3781697A1 (en) | 2018-04-20 | 2021-02-24 | Renescience A/S | Method for determining chemical compounds in waste |
CN110713998B (zh) * | 2019-11-29 | 2021-11-02 | 江南大学 | 一种阿拉伯木聚糖降解酶系的制备方法及其应用 |
WO2022096406A1 (en) | 2020-11-04 | 2022-05-12 | Renescience A/S | Method for enzymatic and/or microbial processing of waste comprising recirculation of process water |
EP4015640A1 (en) * | 2020-12-16 | 2022-06-22 | Clariant Produkte (Deutschland) GmbH | Process for the production of a filamentous fungus whole broth enzyme composition with low viscosity |
EP4015642A1 (en) * | 2020-12-16 | 2022-06-22 | Clariant Produkte (Deutschland) GmbH | Process for the production of a filamentous fungus whole broth enzyme composition with low biomass formation and high protein yield |
EP4015641A1 (en) * | 2020-12-16 | 2022-06-22 | Clariant Produkte (Deutschland) GmbH | Process for the production of a filamentous fungus whole broth enzyme composition with low biomass formation and high protein yield |
CN112522117B (zh) * | 2020-12-29 | 2022-06-28 | 中国科学院成都生物研究所 | 一株粪壳菌及其应用 |
WO2023225459A2 (en) | 2022-05-14 | 2023-11-23 | Novozymes A/S | Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections |
Family Cites Families (135)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1358599A (en) | 1970-12-22 | 1974-07-03 | Monacelli Umberto | Gun for firing tacks |
US5366558A (en) | 1979-03-23 | 1994-11-22 | Brink David L | Method of treating biomass material |
DK187280A (da) | 1980-04-30 | 1981-10-31 | Novo Industri As | Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode |
GB2095275B (en) | 1981-03-05 | 1985-08-07 | Kao Corp | Enzyme detergent composition |
GB2094826B (en) | 1981-03-05 | 1985-06-12 | Kao Corp | Cellulase enzyme detergent composition |
US4797361A (en) | 1983-10-24 | 1989-01-10 | Lehigh University | Microorganism and process |
US5648263A (en) | 1988-03-24 | 1997-07-15 | Novo Nordisk A/S | Methods for reducing the harshness of a cotton-containing fabric |
JP2728531B2 (ja) | 1988-03-24 | 1998-03-18 | ノボ ノルディスク アクティーゼルスカブ | セルラーゼ調製品 |
CA1333777C (en) | 1988-07-01 | 1995-01-03 | Randy M. Berka | Aspartic proteinase deficient filamentous fungi |
US5536655A (en) | 1989-09-26 | 1996-07-16 | Midwest Research Institute | Gene coding for the E1 endoglucanase |
DK494089D0 (ko) | 1989-10-06 | 1989-10-06 | Novo Nordisk As | |
DK16490D0 (da) | 1990-01-19 | 1990-01-19 | Novo Nordisk As | Enzym |
DK115890D0 (da) | 1990-05-09 | 1990-05-09 | Novo Nordisk As | Enzym |
WO1991017243A1 (en) | 1990-05-09 | 1991-11-14 | Novo Nordisk A/S | A cellulase preparation comprising an endoglucanase enzyme |
DE69133100T3 (de) | 1990-12-10 | 2015-09-03 | Danisco Us Inc. | Verbesserte saccharifizierung von zellulose durch klonierung und vervielfältigung des beta-glukosidase genes aus trichoderma reesei |
US6103464A (en) | 1990-12-10 | 2000-08-15 | Genencor International, Inc. | Method of detecting DNA encoding a β-glucosidase from a filamentous fungus |
EP0507369B1 (en) | 1991-03-18 | 1998-05-20 | Gist-Brocades N.V. | Cloning and expression of acetyl xylan esterases from fungal origin |
US5405769A (en) | 1993-04-08 | 1995-04-11 | National Research Council Of Canada | Construction of thermostable mutants of a low molecular mass xylanase |
DK81293D0 (da) | 1993-07-06 | 1993-07-06 | Novo Nordisk As | Enzym |
DK83993D0 (ko) | 1993-07-13 | 1993-07-13 | Novo Nordisk As | |
US5437992A (en) | 1994-04-28 | 1995-08-01 | Genencor International, Inc. | Five thermostable xylanases from microtetraspora flexuosa for use in delignification and/or bleaching of pulp |
US6099844A (en) | 1994-08-22 | 2000-08-08 | Triarco Industries, Inc. | Increasing yield of extractable substances from botanicals with an enzyme composition |
US5705369A (en) | 1994-12-27 | 1998-01-06 | Midwest Research Institute | Prehydrolysis of lignocellulose |
NZ303162A (en) | 1995-03-17 | 2000-01-28 | Novo Nordisk As | Enzyme preparations comprising an enzyme exhibiting endoglucanase activity appropriate for laundry compositions for textiles |
WO1997000964A1 (en) | 1995-06-23 | 1997-01-09 | Danisco Ingredients A/S (Danisco A/S) | Novel beta-xylosidase, nucleotide sequence encoding it, and use thereof |
CN1152025A (zh) * | 1995-12-13 | 1997-06-18 | 高广仁 | 啤酒生产中添加纤维素酶的糖化工艺 |
US7883872B2 (en) | 1996-10-10 | 2011-02-08 | Dyadic International (Usa), Inc. | Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose |
US5811381A (en) | 1996-10-10 | 1998-09-22 | Mark A. Emalfarb | Cellulase compositions and methods of use |
CA2295849C (en) | 1997-07-11 | 2011-02-08 | Genencor International, Inc. | Trichoderma reesei swollenin protein and encoding dna sequence |
US20020084046A1 (en) | 1998-09-29 | 2002-07-04 | Jay Chiehlung Hsu | Enzymatic paper and process of making thereof |
CA2345356C (en) | 1998-10-06 | 2012-10-02 | Mark Aaron Emalfarb | Transformation system in the field of filamentous fungal hosts |
US6409841B1 (en) | 1999-11-02 | 2002-06-25 | Waste Energy Integrated Systems, Llc. | Process for the production of organic products from diverse biomass sources |
US6248535B1 (en) | 1999-12-20 | 2001-06-19 | University Of Southern California | Method for isolation of RNA from formalin-fixed paraffin-embedded tissue specimens |
NZ520022A (en) | 1999-12-30 | 2005-01-28 | Genencor Int | Protein and DNA sequences for XYL-IV from Trichoderma reesei |
US6423145B1 (en) | 2000-08-09 | 2002-07-23 | Midwest Research Institute | Dilute acid/metal salt hydrolysis of lignocellulosics |
DE10043662A1 (de) | 2000-08-30 | 2001-02-22 | Saechsisches Inst Fuer Angewan | Verfahren zur enzymatischen Aktivierung von lignocellulosen Faserstoffen zur Herstellung von Werkstoffen |
JP2004527261A (ja) | 2001-05-18 | 2004-09-09 | ノボザイムス アクティーゼルスカブ | セロビアーゼ活性を有するポリペプチド及びそれをコードするポリヌクレオチド |
US6982159B2 (en) | 2001-09-21 | 2006-01-03 | Genencor International, Inc. | Trichoderma β-glucosidase |
US7005289B2 (en) | 2001-12-18 | 2006-02-28 | Genencor International, Inc. | BGL5 β-glucosidase and nucleic acids encoding the same |
US7045331B2 (en) | 2001-12-18 | 2006-05-16 | Genencor International, Inc. | EGVII endoglucanase and nucleic acids encoding the same |
US7049125B2 (en) | 2001-12-18 | 2006-05-23 | Genencor International, Inc. | EGVIII endoglucanase and nucleic acids encoding the same |
US7056721B2 (en) | 2001-12-18 | 2006-06-06 | Genencor International, Inc. | EGVI endoglucanase and nucleic acids encoding the same |
US7045332B2 (en) | 2001-12-18 | 2006-05-16 | Genencor International, Inc. | BGL4 β-glucosidase and nucleic acids encoding the same |
US20040005674A1 (en) | 2002-04-30 | 2004-01-08 | Athenix Corporation | Methods for enzymatic hydrolysis of lignocellulose |
DK2322607T3 (en) | 2002-08-16 | 2015-12-14 | Danisco Us Inc | NOVEL HYPROCREA JECORINA CBH1 cellulase WITH INCREASED THERMAL STABILITY COMPREHENSIVE SUBSTITUTION OR DELETION FOR POSITION S113 |
US7371558B2 (en) | 2002-10-04 | 2008-05-13 | E.I. Du Pont De Nemours And Company | Process for the biological production of 1,3-propanediol with high yield |
AU2003291395A1 (en) | 2002-11-07 | 2004-06-03 | Genencor International, Inc. | Bgl6 beta-glucosidase and nucleic acids encoding the same |
US7407788B2 (en) | 2002-11-21 | 2008-08-05 | Danisco A/S, Genencor Division | BGL7 beta-glucosidase and nucleic acids encoding the same |
AU2003219956A1 (en) | 2003-02-27 | 2004-09-28 | Midwest Research Institute | Superactive cellulase formulation using cellobiohydrolase-1 from penicillium funiculosum |
US20040231060A1 (en) | 2003-03-07 | 2004-11-25 | Athenix Corporation | Methods to enhance the activity of lignocellulose-degrading enzymes |
EP1606392A4 (en) | 2003-03-21 | 2007-10-17 | Genencor Int | NEW CBH1 HOMOLOGO AND CBH1 CELLULASE VARIANTS |
SI1627050T1 (sl) | 2003-04-01 | 2014-01-31 | Danisco Us Inc. | Varianta humicola grisea cbh1.1 |
EP1862626B1 (en) | 2003-05-29 | 2011-09-14 | Genencor International, Inc. | Novel trichoderma genes |
US20050048619A1 (en) | 2003-08-25 | 2005-03-03 | Novozymes Biotech, Inc. | Variants of glycoside hydrolases |
CN101415823B (zh) * | 2003-09-15 | 2012-10-17 | 金克克国际有限公司 | 修饰酶、生产修饰酶的方法及其用途 |
CN1902310B (zh) | 2003-10-28 | 2011-09-21 | 诺维信股份有限公司 | 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸 |
EP1700917B1 (en) | 2003-12-03 | 2016-04-13 | Meiji Seika Pharma Co., Ltd. | Endoglucanase stce and cellulase preparation containing the same |
DK1713825T3 (da) * | 2004-01-30 | 2012-11-05 | Novozymes Inc | Polypeptider med cellulolytisk forøgende aktivitet og polynukleotider der koder for samme |
BRPI0507431B1 (pt) * | 2004-02-06 | 2021-07-27 | Novozymes, Inc | Célula hospedeira microbiana recombinante, construto de ácido nucleico, vetor de expressão recombinante, composição detergente, e, métodos para produzir o polipeptídeo gh61, para degradar um material celulósico e para produzir um produto de fermentação |
US8097445B2 (en) | 2004-03-25 | 2012-01-17 | Danisco Us Inc. | Exo-endo cellulase fusion protein |
EP2354222A1 (en) | 2004-03-25 | 2011-08-10 | Genencor International, Inc. | Cellulase fusion protein and heterologous cellulase fusion construct encoding the same |
SI3219806T1 (sl) | 2004-03-25 | 2020-08-31 | Novoyzmes, Inc. | Postopki za degradiranje ali pretvorbo polisaharidov rastlinske celične stene |
CA2567485C (en) | 2004-05-27 | 2015-01-06 | Genencor International, Inc. | Acid-stable alpha amylases having granular starch hydrolyzing activity and enzyme compositions |
WO2005118769A1 (en) | 2004-06-03 | 2005-12-15 | Novozymes A/S | Mashing process and enzyme composition useful therein |
US20060075522A1 (en) | 2004-07-31 | 2006-04-06 | Jaclyn Cleveland | Genes and uses for plant improvement |
ES2554467T3 (es) | 2004-12-30 | 2015-12-21 | Danisco Us Inc. | Variantes de celulasas CBH2 de Hypocrea jecorina |
ATE492633T1 (de) | 2005-01-06 | 2011-01-15 | Novozymes Inc | Polypeptide mit cellobiohydrolaseaktivität und dafür kodierende polynukleotide |
US7781191B2 (en) | 2005-04-12 | 2010-08-24 | E. I. Du Pont De Nemours And Company | Treatment of biomass to obtain a target chemical |
CN101160409B (zh) | 2005-04-12 | 2013-04-24 | 纳幕尔杜邦公司 | 获得可发酵糖的生物质处理方法 |
EP1877568B9 (en) | 2005-04-26 | 2021-05-12 | Novozymes A/S | Hydrolysis of arabinoxylan |
CN101321857A (zh) * | 2005-09-30 | 2008-12-10 | 诺维信股份有限公司 | 用于增强纤维素材料降解或转化的方法 |
FI120045B (fi) * | 2005-12-22 | 2009-06-15 | Roal Oy | Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit |
US7256032B2 (en) | 2005-12-22 | 2007-08-14 | Ab Enzymes Oy | Enzymes |
NZ571087A (en) * | 2006-02-10 | 2012-04-27 | Verenium Corp | Cellulolytic enzymes, nucleic acids encoding them and methods for making and using them |
WO2008008793A2 (en) | 2006-07-10 | 2008-01-17 | Dyadic International Inc. | Methods and compositions for degradation of lignocellulosic material |
US8017373B2 (en) | 2006-08-31 | 2011-09-13 | Iogen Energy Corporation | Process for enzymatic hydrolysis of pretreated lignocellulosic feedstocks |
US8138321B2 (en) | 2006-09-22 | 2012-03-20 | Danisco Us Inc. | Acetolactate synthase (ALS) selectable marker from Trichoderma reesei |
US7993884B2 (en) | 2006-10-10 | 2011-08-09 | The United States Of America As Represented By The Secretary Of Agriculture | Beta-xylosidase for conversion of plant cell wall carbohydrates to simple sugars |
WO2008147396A2 (en) | 2006-11-13 | 2008-12-04 | Danisco Us Inc., Genencor Division | Method for improving yield of cellulose conversion processes |
WO2008140749A2 (en) | 2007-05-10 | 2008-11-20 | Novozymes, Inc. | Compositions and methods for enhancing the degradation or conversion of cellulose-containing material |
EP2152892B1 (en) | 2007-05-21 | 2013-05-01 | Danisco US, Inc., Genencor Division | Method for introducing nucleic acids into fungal cells |
CN103436509A (zh) | 2007-05-31 | 2013-12-11 | 诺维信股份有限公司 | 提高多肽的纤维素分解增强活性的方法 |
CN101784659B (zh) * | 2007-05-31 | 2016-05-18 | 诺维信股份有限公司 | 具有纤维素分解增强活性的多肽和编码它的多核苷酸 |
US9969993B2 (en) | 2007-05-31 | 2018-05-15 | Novozymes, Inc. | Filamentous fungal host cells and methods of recombinantly producing proteins |
EA018049B1 (ru) | 2007-06-08 | 2013-05-30 | ДАНИСКО ЮЭс, ИНК., ДЖЕНЕНКОР ДИВИЖН | Система экспрессии гетерологичных и гомологичных целлюлаз |
WO2009003167A1 (en) | 2007-06-27 | 2008-12-31 | Novozymes A/S | Methods for producing fermentation products |
EP2380988A3 (en) | 2007-07-10 | 2012-04-11 | Mosanto Technology LLC | Transgenic plants with enhanced agronomic traits |
US8551751B2 (en) | 2007-09-07 | 2013-10-08 | Dyadic International, Inc. | BX11 enzymes having xylosidase activity |
US7819976B2 (en) | 2007-08-22 | 2010-10-26 | E. I. Du Pont De Nemours And Company | Biomass treatment method |
JP5300092B2 (ja) | 2007-09-07 | 2013-09-25 | ダニスコ・ユーエス・インク | ベータ‐グルコシダーゼ強化糸状菌全セルラーゼ組成物及び使用方法 |
BRPI0817811A2 (pt) | 2007-10-03 | 2014-10-14 | Verenium Corp | Xilanases, ácidos nucleicos que codificam as mesmas e métodos para fabricação e uso das mesmas. |
CN101821397A (zh) | 2007-10-12 | 2010-09-01 | 丹尼斯科美国公司 | 从发酵微生物中提高有机物产生的方法和组合物 |
WO2009074685A1 (en) * | 2007-12-12 | 2009-06-18 | Novozymes A/S | Enzymatic degradation of biomass substrates comprising mannan |
AU2008334945C1 (en) | 2007-12-13 | 2013-09-05 | Danisco Us Inc. | Compositions and methods for producing isoprene |
US8323944B2 (en) * | 2007-12-19 | 2012-12-04 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
EP2245050A2 (en) * | 2007-12-19 | 2010-11-03 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US10676751B2 (en) | 2008-02-29 | 2020-06-09 | The Trustees Of The University Of Pennsylvania | Production and use of plant degrading materials |
KR101768225B1 (ko) | 2008-03-07 | 2017-08-14 | 다니스코 유에스 인크. | 트리코데르마에서의 카탈라아제 발현 |
JP5690713B2 (ja) | 2008-03-21 | 2015-03-25 | ダニスコ・ユーエス・インク | バイオマスの加水分解促進用ヘミセルラーゼ強化組成物 |
US20110165635A1 (en) | 2008-04-21 | 2011-07-07 | Chromatin, Inc. | Methods and materials for processing a feedstock |
MX2010011722A (es) | 2008-04-29 | 2010-11-30 | Danisco Inc | Composiciones de swolenina y metodos para incrementar la eficiencia de una celulasa. |
WO2009149202A2 (en) | 2008-06-06 | 2009-12-10 | Danisco Us Inc., Genencor Division | Compositions and methods comprising cellulase variants with reduced affinity to non-cellulosic materials |
WO2010059424A2 (en) * | 2008-11-18 | 2010-05-27 | Novozymes, Inc. | Methods and compositions for degrading cellulosic material |
CN102300986A (zh) * | 2008-12-04 | 2011-12-28 | 诺维信股份有限公司 | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 |
CN102325889A (zh) * | 2008-12-19 | 2012-01-18 | 诺维信股份有限公司 | 增加纤维素材料水解的方法 |
MX2011008495A (es) | 2009-02-20 | 2011-09-21 | Danisco Us Inc | Formulaciones de caldo de fermentacion. |
CA2750920A1 (en) * | 2009-02-27 | 2010-09-02 | Iogen Energy Corporation | Novel lignin-resistant cellulase enzymes |
EP2417264A2 (en) * | 2009-04-08 | 2012-02-15 | Danisco US Inc. | Endoglucanase for reducing the viscosity of a plant material slurry |
US8129591B2 (en) * | 2009-04-30 | 2012-03-06 | Novozymes, Inc. | Polypeptides having xylanase activity and polynucleotides encoding same |
CA2763031A1 (en) * | 2009-05-29 | 2010-12-02 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
KR20120062643A (ko) | 2009-06-03 | 2012-06-14 | 다니스코 유에스 인크. | 향상된 발현, 활성 및/또는 안정성을 갖는 셀룰라아제 변이체, 및 이의 용도 |
EP2443235A4 (en) | 2009-06-16 | 2013-07-31 | Codexis Inc | ß-glucosidase VARIANTS |
MX2012003091A (es) | 2009-09-23 | 2012-04-30 | Danisco Us Inc | Enzimas de glicosil hidrolasa novedosas y usos de las mismas. |
CN101671698A (zh) * | 2009-10-12 | 2010-03-17 | 天津科技大学 | 用木聚糖酶提高淀粉质原料酒精发酵速度和出酒率的方法 |
DK2602317T3 (da) | 2009-11-20 | 2017-11-13 | Danisco Us Inc | Beta-glucosidasevarianter med forbedrede egenskaber |
CN102686736B (zh) | 2009-12-23 | 2017-05-31 | 丹尼斯科美国公司 | 提高同步糖化发酵反应效率的方法 |
US8647850B2 (en) * | 2009-12-23 | 2014-02-11 | E I Du Pont De Nemours And Company | Process for simultaneous saccharification and fermentation for production of ethanol |
US8906235B2 (en) | 2010-04-28 | 2014-12-09 | E I Du Pont De Nemours And Company | Process for liquid/solid separation of lignocellulosic biomass hydrolysate fermentation broth |
US8721794B2 (en) | 2010-04-28 | 2014-05-13 | E I Du Pont De Nemours And Company | Production of high solids syrup from lignocellulosic biomass hydrolysate fermentation broth |
CN105441414A (zh) | 2010-06-01 | 2016-03-30 | 加州理工学院 | 稳定的功能嵌合纤维二糖水解酶i类酶 |
EP2397491A1 (en) | 2010-06-21 | 2011-12-21 | Technische Universität Wien | LeaA from Trichoderma reesei |
US8629325B2 (en) | 2010-08-30 | 2014-01-14 | Novozymes A/S | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
US8476048B2 (en) * | 2010-12-17 | 2013-07-02 | E I Du Pont De Nemours And Company | Xylose utilizing zymomonas mobilis with improved ethanol production in biomass hydrolysate medium |
MX2013010512A (es) | 2011-03-17 | 2013-10-07 | Danisco Inc | Metodo para reducir la viscosidad en un proceso de sacarificacion. |
US20140073017A1 (en) | 2011-03-17 | 2014-03-13 | Danisco Us Inc. | Cellulase compositions and methods of using the same for improved conversion of lignocellulosic biomass into fermentable sugars |
CN103502444A (zh) | 2011-03-17 | 2014-01-08 | 丹尼斯科美国公司 | 糖基水解酶及其在生物质水解方面的用途 |
BR112013027242A2 (pt) | 2011-05-10 | 2016-11-29 | Danisco Us Inc | anidrases carbônicas termoestáveis e métodos de uso das mesmas |
BR112014004171A2 (pt) | 2011-08-22 | 2018-11-06 | Codexis Inc | variantes da proteína glicósideo hidrolase gh61 e cofatores que aumentam a atividade de gh61 |
CA2858373A1 (en) | 2011-12-13 | 2013-06-20 | Danisco Us Inc. | Enzyme cocktails prepared from mixed cultures |
KR20150079676A (ko) | 2012-10-31 | 2015-07-08 | 다니스코 유에스 인크. | 마그나포르테 그리세아로부터의 베타-글루코시다제 |
EP2914719A1 (en) | 2012-10-31 | 2015-09-09 | Danisco US Inc. | Compositions and methods of use |
BR112015013647A2 (pt) | 2012-12-12 | 2017-11-14 | Danisco Us Inc | variante isolada de uma enzima celobio-hidrolase (cbh) parental, polinucleotídeo isolado, vetor, célula hospedeira, composição detergente, aditivo alimentar, método para hidrolisar um substrato celulósico, sobrenadante de cultura celular, métodos de produção de um polipeptídeo cbh variante e sobrenadante de cultura celular |
ES2727390T3 (es) | 2013-05-20 | 2019-10-15 | Abengoa Bioenergia Nuevas Tecnologias Sa | Expresión de enzimas beta-xilosidasas recombinantes |
US10167460B2 (en) | 2013-07-29 | 2019-01-01 | Danisco Us Inc | Variant enzymes |
CN105829530A (zh) | 2013-12-04 | 2016-08-03 | 丹尼斯科美国公司 | 包含β-葡萄糖苷酶多肽的组合物及其使用方法 |
-
2012
- 2012-03-16 MX MX2013010512A patent/MX2013010512A/es unknown
- 2012-03-16 CA CA2830508A patent/CA2830508A1/en not_active Abandoned
- 2012-03-16 JP JP2013558209A patent/JP6290626B2/ja not_active Expired - Fee Related
- 2012-03-16 DK DK12711517.8T patent/DK2686434T3/da active
- 2012-03-16 WO PCT/US2012/029445 patent/WO2012125925A2/en active Application Filing
- 2012-03-16 KR KR1020137027241A patent/KR20140017612A/ko not_active Application Discontinuation
- 2012-03-16 RU RU2013146245/10A patent/RU2013146245A/ru not_active Application Discontinuation
- 2012-03-16 SG SG2013056122A patent/SG192098A1/en unknown
- 2012-03-16 US US14/004,877 patent/US20140134677A1/en not_active Abandoned
- 2012-03-16 EP EP12711517.8A patent/EP2686434B1/en active Active
- 2012-03-16 BR BR112013023757A patent/BR112013023757A2/pt not_active Application Discontinuation
- 2012-03-16 UA UAA201312128A patent/UA115306C2/uk unknown
- 2012-03-16 CN CN201280013810.XA patent/CN103842515A/zh active Pending
-
2013
- 2013-07-24 ZA ZA2013/05619A patent/ZA201305619B/en unknown
-
2014
- 2014-12-02 HK HK14112152.3A patent/HK1198659A1/xx unknown
-
2015
- 2015-08-06 US US14/819,989 patent/US10190108B2/en active Active
-
2017
- 2017-12-08 JP JP2017236222A patent/JP2018075020A/ja active Pending
-
2018
- 2018-12-10 US US16/214,195 patent/US20190249160A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160087438A (ko) * | 2015-01-13 | 2016-07-22 | 대한민국(농촌진흥청장) | 신규 페니실리움 솔리텀 m2439 균주 및 이의 용도 |
Also Published As
Publication number | Publication date |
---|---|
JP2014511673A (ja) | 2014-05-19 |
RU2013146245A (ru) | 2015-04-27 |
EP2686434B1 (en) | 2021-07-14 |
US20140134677A1 (en) | 2014-05-15 |
CA2830508A1 (en) | 2012-09-20 |
US20170096651A1 (en) | 2017-04-06 |
JP6290626B2 (ja) | 2018-03-14 |
EP2686434A2 (en) | 2014-01-22 |
HK1198659A1 (en) | 2015-05-22 |
DK2686434T3 (da) | 2021-10-11 |
MX2013010512A (es) | 2013-10-07 |
CN103842515A (zh) | 2014-06-04 |
US20190249160A1 (en) | 2019-08-15 |
SG192098A1 (en) | 2013-08-30 |
ZA201305619B (en) | 2014-10-29 |
BR112013023757A2 (pt) | 2017-06-06 |
US10190108B2 (en) | 2019-01-29 |
JP2018075020A (ja) | 2018-05-17 |
WO2012125925A2 (en) | 2012-09-20 |
WO2012125925A3 (en) | 2012-12-27 |
UA115306C2 (uk) | 2017-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10190108B2 (en) | Method for reducing viscosity in saccharification process | |
AU2019200618B2 (en) | Cellulolytic enzyme compositions and uses thereof | |
KR20140027154A (ko) | 글리코실 가수분해효소 및 바이오매스 가수분해를 위한 그의 용도 | |
EP3296394B1 (en) | Novel glycosyl hydrolase enzymes and uses thereof | |
AU2012228968B2 (en) | Cellulase compositions and methods of using the same for improved conversion of lignocellulosic biomass into fermentable sugars | |
AU2012228968A1 (en) | Cellulase compositions and methods of using the same for improved conversion of lignocellulosic biomass into fermentable sugars | |
AU2012229042A1 (en) | Glycosyl hydrolase enzymes and uses thereof for biomass hydrolysis | |
EP2794871A1 (en) | Endoglucanase 1b (eg1b) variants | |
AU2016203478A1 (en) | Method for reducing viscosity in saccharification process | |
AU2012229030A1 (en) | Method for reducing viscosity in saccharification process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |