KR20140017612A

KR20140017612A - 당화 공정에서 점도를 감소시키는 방법

Info

Publication number: KR20140017612A
Application number: KR1020137027241A
Authority: KR
Inventors: 콜린 미친슨; 미안 리; 브래들리 알 켈먼; 수잔 이 랜츠; 키스 디 윙; 윌리엄 디 히츠
Original assignee: 다니스코 유에스 인크.
Priority date: 2011-03-17
Filing date: 2012-03-16
Publication date: 2014-02-11
Also published as: JP2014511673A; RU2013146245A; EP2686434B1; US20140134677A1; CA2830508A1; US20170096651A1; JP6290626B2; EP2686434A2; HK1198659A1; DK2686434T3; MX2013010512A; CN103842515A; US20190249160A1; SG192098A1; ZA201305619B; BR112013023757A2; US10190108B2; JP2018075020A; WO2012125925A2; WO2012125925A3

Abstract

본 발명은, 글리코실 하이드롤라아제 패밀리 61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물과 같이 바이오매스의 가수분해에 사용될 수 있는 조성물, 바이오매스 재료를 가수분해하는 방법, 및 글리코실 하이드롤라아제 패밀리 61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물을 사용하여 바이오매스 혼합물의 점도를 감소시키는 방법에 관한 것이다.

Description

당화 공정에서 점도를 감소시키는 방법 {METHOD FOR REDUCING VISCOSITY IN SACCHARIFICATION PROCESS}

관련 출원과의 상호 참조

본 출원은 본 명세서에 전체적으로 참고로 포함되는 미국 가출원 제61/453,923호(출원일: 2011년 3월 17일)에 대한 우선권을 주장한다.

본 발명은 바이오매스의 가수분해에 유용한 조성물, 이러한 조성물을 사용하여 바이오매스 재료를 가수분해하는 방법, 및 바이오매스 당화 혼합물의 점도를 감소시키는 방법에 관한 것이다.

재생가능한 리그노셀룰로오스계 바이오매스를 발효가능한 당으로 생물전환시키고, 이어서 이를 발효시켜 액체 연료에 대 대안으로서의 알코올(예를 들어, 에탄올)을 생성시키는 것은, 석유 파동이 발생했던 1970년대 이후로 연구자들의 지대한 관심을 끌어 왔다(Bungay, H. R., "Energy: the biomass options". NY: Wiley; 1981; Olsson L, Hahn-Hagerdal B. Enzyme Microb Technol 1996,18:312-31; Zaldivar, J et al., Appl Microbiol Biotechnol 2001, 56: 17-34; Galbe, M et al., Appl Microbiol Biotechnol 2002, 59:618-28). 리그노셀룰로오스계 바이오매스 재료로부터 당을 생성시키는 것은, 당을 에탄올로 발효시키고 증류하는 후속 단계를 갖는 것으로 얼마 전부터 공지되어 있다. 독일, 일본, 및 소비에트 연방과 같은 나라에서 연료가 귀했던 제2차 세계 대전 무렵에 많은 선행 개발이 일어났다. 이들 초기 공정은 주로 산 가수분해에 관한 것이었으며, 이는 조작 및 설계가 복잡했고, 전형적으로 온도, 압력, 및/또는 산 농도와 같은 공정 중의 작은 변동에 민감했다. 이들 초기 공정의 종합적인 논의는 문헌["Production of Sugars from Wood Using High-pressure Hydrogen Chloride", Biotechnology and Bioengineering, Volume XXV, 2757-2773 (1983)]에서 확인된다.

제2차 세계 대전으로부터 1970년대 초반까지의 기간에 풍부한 석유의 공급은 에탄올 전환 연구를 둔화시켰다. 그러나, 1973년의 석유 파동으로 인하여, 연구자들은 목재 및 농업 부산물을 에탄올 생산에 이용하기 위한 공정을 개발하기 위하여 그들의 노력을 증가시켰다. 이들 연구는, 해외 석유 생산에 대한 미국의 의존도를 감소시키고, 연료의 옥탄가를 증가시키며, 환경적 조치로서 배기가스 오염물질을 감소시키기 위한 가솔린 첨가제로서의 에탄올 개발에 있어서 특히 중요했다.

"석유 파동"과 동시에, 미국 환경 보호국(U.S. Environmental Protection Agency)은 납 첨가제의 감소를 요구하는 규제를 공포하였다. 에탄올이 사실상 납의 대체물인 한, 일부 정제공장은 에탄올을 치환물로서 선택하였으며, 이는 고가의 자본 설비 투자 없이 정제공장의 운영에 용이하게 도입되는 그의 역량 때문이다.

수십년 전에 개발된 고압 및 고온 가스 당화 공정은 계속 개선되고 있다. 현재의 새로운 연구는 효소적 전환 공정에 크게 집중하며, 이는 중온성 및 고온성 진균, 효모, 및 박테리아와 같은 다양한 유기체로부터, 셀룰로오스를 발효가능한 당으로 분해하는 효소를 채용한다. 이들 공정에는, 주로 상업화를 위한 그들의 규모 확대 능력 및 에탄올 생성의 효율에 대한 불확실성이 남아 있다.

셀룰로오스 및 헤미셀룰로오스는 광합성에 의해 생성되는 가장 풍부한 식물 재료이다. 그들은 중합체성 기질을 단량체성 당으로 가수분해할 수 있는 효소를 생성시키는 박테리아, 효모, 및 진균을 포함하는 다수의 미생물에 의해 에너지원으로서의 용도로 분해될 수 있다(Aro et al., 2001). 유기체는 종종 그들이 어떤 당을 사용하는지에 관해 제한적이며, 이는 전환 중에 어느 당이 가장 잘 생성되는지를 좌우한다. 비-재생가능한 자원의 한계에 접근함에 따라, 주요 재생가능한 에너지 자원이 될 셀룰로오스의 막대한 잠재력이 인식된다(Krishna et al., 2001). 생물학적 공정을 통한 셀룰로오스의 효과적인 이용은 식품, 원료, 및 연료의 부족을 잠재적으로 극복할 수 있다(Ohmiya et al., 1997).

셀룰라아제는 셀룰로오스(베타-1,4-글루칸 또는 베타 D-글루코시드 결합)를 가수분해하여 글루코스, 셀로바이오스, 셀로올리고당류(cellooligosaccharide) 등의 형성을 유발하는 효소이다. 셀룰라아제는 전통적으로 하기의 3개 주요 부류로 나누어졌다: 엔도글루카나아제(EC 3.2.1.4)("EG"), 엑소글루카나아제 또는 셀로바이오하이드롤라아제(EC 3.2.1.91)("CBH"), 및 베타-글루코시다아제([베타] -D-글루코사이드 글루코하이드롤라아제; EC 3.2.1.21)("BG")(Knowles et al., 1987; Shulein, 1988). 엔도글루카나아제는 셀룰로오스 섬유의 무정형 부분에 주로 작용하는 반면에, 셀로바이오하이드롤라아제는 결정질 셀룰로오스 또한 분해할 수 있다.

기계 펄프의 처리에서(Pere et al., 1996), 원료 첨가제로서의 용도를 위해(WO 91/04673), 그리고 습식 도정(grain wet milling)에서, 셀룰라아제는 또한 셀룰로오스 바이오매스의 에탄올로의 분해에 유용한 것으로 나타났다(여기서 셀룰라아제는 셀룰로오스를 글루코스로 분해하고, 효모 또는 다른 미생물이 글루코스를 에탄올로 추가 발효시킴). 분리 당화 발효(separate saccharification and fermentation)는, 바이오매스, 예를 들어, 옥수수 대(corn stover)에 존재하는 셀룰로오스를 글루코스로 전환시키고, 이어서 효모 균주가 글루코스를 에탄올로 전환시키는 공정이다. 동시 당화 발효(simultaneous saccharification and fermentation)는, 바이오매스, 예를 들어, 옥수수 대에 존재하는 셀룰로오스를 글루코스로 전환시키고, 동시에 동일한 반응기 내에서, 효모 균주가 글루코스를 에탄올로 전환시키는 공정이다. 셀룰로오스의 용이하게 입수가능한 공급원으로부터의 에탄올 생성은, 안정하고 재생가능한 연료 공급원을 제공한다.

셀룰라아제는 다수의 박테리아, 효모, 및 진균에 의해 생성된다. 소정의 진균은 셀룰로오스의 결정질 형태를 분해할 수 있는 완전한 셀룰라아제 시스템(즉, 전체 셀룰라아제)을 생성시킨다. 그러나, 전체 셀룰라아제, 특히 천연적인 것은 효율적인 분해를 반드시 달성하지는 못하는데, 이는 이러한 효율을 위해 필요한 모든 구성요소/활성, 예를 들어, CBH, EG, 및 BG 분류 각각으로부터의 활성을 그것이 포함하지 않을 수 있기 때문이다(Filho et al., 1996). 개별적인 CBH, EG, 및 BG 구성요소 단독으로는 효율적인 가수분해를 일으키지 않지만, EG-유형 셀룰라아제와 CBH- 유형 셀룰라아제의 조합은 상호작용하여 단독으로 사용된 어느 하나의 효소보다 더 효율적으로 셀룰로오스를 분해하는 것으로 공지되어 있다(Wood, 1985; Baker et al., 1994; Nieves et al., 1995).

셀룰라아제는, 세제 조성물의 세정 능력 증진, 유연제로서의 용도, 면직물의 촉감 및 외관 개선 등을 위한 직물의 처리에 유용한 것으로 당업계에 공지되어 있다(Kumar et al., 1997). 개선된 세정 성능을 가지며(미국 특허 제4,435,307호; 영국 출원 제2,095,275호 및 제2,094,826호) 직물의 촉감 및 외관을 개선하기 위해 직물의 처리에 사용하기 위한(미국 특허 제5,648,263호, 제5,691,178호, 및 제5,776,757호, 및 영국 출원 제1,358,599호) 셀룰라아제-함유 세제 조성물이 기재되어 있다.

그러므로, 진균 및 박테리아에서 생성되는 셀룰라아제는 중요한 관심을 받아 왔다. 특히, 트리코더마 종(Trichoderma spp.)(예를 들어, T. 롱지브라치아툼(T. longibrachiatum) 또는 T. 레세이(T. reesei))의 발효는 셀룰로오스의 결정질 형태를 분해할 수 있는 완전한 셀룰라아제 시스템을 생성시키는 것으로 나타났다. 수년에 걸쳐, 전통적인 돌연변이유발, 스크리닝, 선택, 및 고도로 개량된 대규모 저가 발효 조건의 개발에 의해 트리코더마 셀룰라아제 생성이 개선되어 왔다. 트리코더마 종의 다중-구성요소 셀룰라아제 시스템은 셀룰로오스를 글루코스로 가수분해할 수 있는 반면에, 효율적인 셀룰로오스 가수분해를 위한 상이한 특성을 가진 다른 미생물, 특히 박테리아 균주로부터의 셀룰라아제가 존재하며, 산업적 규모의 셀룰라아제 생성을 위해 이들 단백질을 사상 진균에서 발현시키는 것이 유리할 것이다. 그러나, 많은 연구들의 결과는 사상 진균으로부터 박테리아 효소를 발현시키는 수율이 낮다는 것을 입증한다(Jeeves et al., 1991).

글루코스 및 셀로바이오스와 같은 가용성 당은 화학물질 및 생물학적 산물의 생성을 위한 많은 용도를 갖는다. 셀룰로오스 가수분해의 최적화는 더 적은 효소의 사용을 가능하게 하며 가용성 당의 생성을 위한 비용 효율성을 개선하였다.

리그노셀룰로오스계 바이오매스의 발효가능한 당으로의 효율적인 전환은, 비용-효율적이고 환경-친화적인 방식의 바이오에탄올 생성의 핵심이다. 특히 증류를 위한 에너지 및 가공 비용을 감소시키기 위하여, 실행가능한 공정에 의해 생성되는 최소 에탄올 농도는 4%(w/v) 이상이어야 한다. 건조물 고체 함량이 높은 기질을 가공함으로써 이렇게 증가된 에탄올 농도를 달성할 수 있다. 그러나 건조물 함량이 높은 바이오매스의 당화에 연계된 통상의 문제는, 펌핑할 수 없거나 취급 중에 많은 에너지 투입을 필요로 하는 슬러리를 유발하는, 슬러리의 높은 점도이다. 높은 고체 함량의 취급을 처리할 경우, 1) 제한된 물질 전달을 동반하는 불충분한 혼합, 2) 아세트산, 푸르푸랄, 5-하이드록시메틸 푸르푸랄, 페놀계 리그닌 분해와 같은 저해제의 농도 증가, 3) 글루코스, 셀로바이오스, 에탄올과 같은 산물 저해, 및 4) 발효 미생물 생존 능력과 같은 문제가 발생할 것이다. 높은 점도는 공정 내의 건조 물질 수준을 제한하여, 에너지 및 물 소비량을 증가시키고, 분리 효율, 증발 및 열교환, 및 궁극적으로 에탄올 수율을 감소시킨다. 그러므로, 점도의 감소가 유익하며, 효소는 높은 점도를 유발하는 가용성/불용성 화합물의 분해에 있어서 중심 역할을 담당한다.

당화 공정의 점도를 감소시키고/감소시키거나 고체 로딩(solid loading)을 증가시키기 위한 연구가 진행되었다. 예를 들어, 바이오매스 기질 로딩 내의 고체 수준을 증가시키기 위하여 다수의 연구가 유가식 운전(fed-batch operation)을 이용하였다. 중력식 혼합 반응기(gravimetric mixing reactor) 설계가 사용되었으며, 이는 40% 이하의 고체 농도에서 전처리된 밀짚의 회분식 효소적 액화 및 가수분해를 가능하게 하였다. 다량의 기질의 가수분해, 가수분해 중의 상대적으로 낮은 점도, 및 공정 중의 상대적으로 높은 글루코스 농도를 달성하기 위하여, 이러한 유가식 전략은 효소적 가수분해 중에 바이오매스 기질 또는 기질 + 효소를 순차적으로 로딩한다. 대안적으로, 효소의 최적 온도, 예를 들어 50℃에서 소정의 기간 동안 리그노셀룰로오스계 바이오매스의 효소적 예비-가수분해를 실행하여 슬러리의 점도를 감소시킴으로써, 펌핑 및 교반을 가능하게 할 수 있다. 예비-가수분해 중의 점도의 감소는 후속의 발효 또는 SSF를 가능하게 만든다.

다수의 접근법의 개발에도 불구하고, 점도를 감소시키고 바람직한 발효가능한 당의 수율을 개선하기 위한 부가적 방식에 대한 필요성이 당업계에 남아 있다.

특허, 특허 출원, 및 간행물을 포함하는, 본 명세서에 인용된 모든 참고문헌은 전체적으로 참고로 포함된다.

본 개시는, 소정의 엔도글루카나아제 효소(예를 들어, 글리코실 하이드롤라아제 패밀리 61("GH61")/엔도글루카나아제 활성을 갖는 폴리펩티드, 예를 들어 T. 레세이 엔도글루카나아제("Eg4"))를 바이오매스 당화 혼합물에 포함시키는 것이 혼합물의 점도를 실질적으로 감소시킨다는 의외의 발견에 부분적으로 기초한다. 본 개시는 또한, 주어진 바이오매스 기질로부터 당화 및 바람직한 발효가능한 당의 수율을 실질적으로 개선하기 위해 이러한 효소(들)를 포함시키는 것에 관한 것이다.

본 명세서에는, 글리코실 하이드롤라아제 패밀리 61("GH61")/ 엔도글루카나아제 활성을 갖는 폴리펩티드가 제공된다. "GH61/엔도글루카나아제 활성"은, 폴리펩티드가 GH61 활성 및/또는 엔도글루카나아제 활성을 갖는다는 것을 의미한다. 일부 태양에서, 폴리펩티드는 단리된다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 다양한 종으로부터의 GH61 엔도글루카나아제 또는 엔도글루카나아제 IV("EG IV"), 또는 GH61 엔도글루카나아제에 상응하는(예를 들어, 그것과 상동성을 공유하고/하거나, 작용성 도메인을 공유하고/하거나, GH61 모티프(들)를 공유하고/하거나, 보존적 잔기를 공유하는) 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드)이다. 이러한 종은 트리코더마, 휴미콜라(Humicola), 푸사리움(Fusarium), 아스페르길루스(Aspergillus), 뉴로스포라(Neurospora), 페니실리움(Penicillium), 세팔로스포리움(Cephalosporium), 아클리아(Achlya), 포도스포라(Podospora), 엔도티아(Endothia), 무코르(Mucor), 코클리오볼루스(Cochliobolus), 피리쿨라리아(Pyricularia), 크리소스포리움(Chrysosporium), 아스페르길루스 아와모리(Aspergillus awamori), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 포에티두스(Aspergillus foetidus), 아스페르길루스 자포니쿠스(Aspergillus japonicus), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 오리제(Aspergillus oryzae), 크리소스포리움 루크노엔스(Chrysosporium lucknowense), 푸사리움 박트리디오이데스(Fusarium bactridioides), 푸사리움 세레알리스(Fusarium cerealis), 푸사리움 크루크웰렌스(Fusarium crookwellense), 푸사리움 컬모룸(Fusarium culmorum), 푸사리움 그라미네아룸(Fusarium graminearum), 푸사리움 그라미눔(Fusarium graminum), 푸사리움 헤테로스포룸(Fusarium heterosporum), 푸사리움 네군디(Fusarium negundi), 푸사리움 옥시스포룸(Fusarium oxysporum), 푸사리움 레티쿨라툼(Fusarium reticulatum), 푸사리움 로제움(Fusarium roseum), 푸사리움 삼부치눔(Fusarium sambucinum), 푸사리움 사르코크로움(Fusarium sarcochroum), 푸사리움 스포로트리키오이데스(Fusarium sporotrichioides), 푸사리움 설푸리움(Fusarium sulphureum), 푸사리움 토룰로섬(Fusarium torulosum), 푸사리움 트리코테치오이데스(Fusarium trichothecioides), 푸사리움 베네나툼(Fusarium venenatum), 브제르칸데라 아두스타(Bjerkandera adusta), 세리포리옵시스 아네이리나(Ceriporiopsis aneirina), 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아(Ceriporiopsis caregiea), 세리포리옵시스 길베센스(Ceriporiopsis gilvescens), 세리포리옵시스 판노신타(Ceriporiopsis pannocinta), 세리포리옵시스 리불로사(Ceriporiopsis rivulosa), 세리포리옵시스 서브루파(Ceriporiopsis subrufa), 세리포리옵시스 서브베르미스포라(Ceriporiopsis subvermispora), 코프리누스 시네레우스(Coprinus cinereus), 코리올루스 히르수투스(Coriolus hirsutus), 휴미콜라 인솔렌스(Humicola insolens), 휴미콜라 라누기노사(Humicola lanuginosa), 무코르 미에헤이(Mucor miehei), 마이셀리오프토라 테르모필라(Myceliophthora thermophila), 뉴로스포라 크라사(Neurospora crassa), 뉴로스포라 인터미디아(Neurospora intermedia), 페니실리움 푸르푸로게눔(Penicillium purpurogenum), 페니실리움 카네센스(Penicillium canescens), 페니실리움 솔리툼(Penicillium solitum), 페니실리움 푸니쿨로섬(Penicillium funiculosum) 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 플레비아 라디아테(Phlebia radiate), 플레우로투스 에린기(Pleurotus eryngii), 탈라로마이세스 플라부스(Talaromyces flavus), 티엘라비아 테레스트리스(Thielavia terrestris), 트라메테스 빌로사(Trametes villosa), 트라메테스 베르시콜로르(Trametes versicolor), 트리코더마 하르지아눔(Trichoderma harzianum), 트리코더마 코닌기(Trichoderma koningii), 트리코더마 롱지브라치아툼, 트리코더마 레세이, 트리코더마 비리데(Trichoderma viride), 지오스미티아 에메르소니(Geosmithia emersonii), 또는 G. 스테아로테르모필루스(G. stearothermophilus)를 포함한다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 본 개시의 도 1에 나타낸 아미노산 서열을 가진 폴리펩티드로 구성된 군으로부터 선택된 GH61 엔도글루카나아제이다. 예를 들어, 적합한 GH61 엔도글루카나아제는 그들의 젠뱅크(GenBank) 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움(S. thermophilum) 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스(A. fumigatus) Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), A. 푸미가투스 Afu6g09540으로부터의 NCBI Ref: XP_750843.1의 엔도글루카나아제, A. 푸미가투스 EDP47167의 엔도글루카나아제, T. 테레스트리스(T. terrestris) 16380의 엔도글루카나아제, T. 테레스트리스 155418의 엔도글루카나아제, T. 테레스트리스 68900의 엔도글루카나아제, C. 글로보섬(C. globosum)으로부터의 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293으로부터의 젠뱅크 등록: XP_752040을 가진 엔도글루카나아제로 명명되는 것들을 포함한다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열 동일성을 갖는 아미노산 서열을 포함한다. 소정의 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로 구성된 군으로부터 선택된 하나 이상의 서열 모티프(들)를 포함하는 아미노산 서열을 포함한다. 일부 실시 형태에서, 폴리펩티드는 길이가 약 100개 이상(예를 들어, 적어도 약 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 240개, 또는 그 이상)의 아미노산 잔기이다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는, 예를 들어, 도 1에 열거된 것들로부터 선택된 것과 같은 GH61 엔도글루카나아제의 변종이다. 적합한 폴리펩티드는, 예를 들어, 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 또는 EAA29347.1, 또는 S. 테르모필리움 24630의 St61, S. 테르모필리움 23839c의 St61A, S. 테르모필리움 46583의 St61B, S. 테르모필리움 80312의 St61D, A. 푸미가투스 Afu3g03870의 Afu61a(NCBI Ref: XP_748707), A. 푸미가투스 Afu6g09540의 효소(NCBI Ref: XP_750843.1), A. 푸미가투스 EDP47167의 효소, T. 테레스트리스 16380의 효소, T. 테레스트리스 155418의 효소, T. 테레스트리스 68900의 효소, 및 C. 글로보섬 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293의 효소(젠뱅크 등록: XP_752040을 가짐)를 포함한다. 일부 태양에서, GH61/. 엔도글루카나아제 활성을 갖는 폴리펩티드는, 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 효소의 변종이다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는,: (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로부터 선택된 하나 이상의 서열 모티프를 포함하는, 길이가 약 100개 이상(예를 들어, 적어도 약 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 240개 이상)의 아미노산 잔기인 효소의 변종일 수 있다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 GH61 엔도글루카나아제의 변종일 수 있으며, 여기서 변종은 서열 번호 1 내지 18 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상)의 동일성을 갖는 아미노산 서열을 갖는다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, GH61 엔도글루카나아제의 변종을 포함하는 단리된 폴리펩티드)는 엔도글루카나아제 활성을 갖는다. 변종은 서열 번호 84 내지 91로부터 선택된 하나 이상의 모티프(1, 2, 3, 4, 5, 6, 7, 또는 8개 이상의 모티프)를 포함할 수 있다. 본 개시의 목적상, 효소는 그들의 작용성에 의해 지칭될 수 있다. 예를 들어, 엔도글루카나아제 폴리펩티드는 또한, 엔도글루카나아제 활성을 갖는 폴리펩티드로 지칭될 수 있으며, 그 역도 성립한다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로부터 선택된 하나 이상의 서열 모티프(들)를 포함한다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(변종을 포함함)는 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함한다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함한다.

본 명세서에는 또한, EG IV 폴리펩티드의 변종이 제공된다. 예를 들어, 이러한 변종은 서열 번호 1 내지 29 및 148 중 어느 하나, 또는 그의 성숙한 폴리펩티드에 대한 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열 동일성을 가질 수 있다. 예를 들어, 본 명세서에는 T. 레세이 Eg4 폴리펩티드의 변종이 제공된다. 이러한 변종은 서열 번호 27의 잔기 22 내지 344에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 서열 동일성을 가질 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 단리된다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 엔도글루카나아제 활성을 갖는다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232 중 약 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 또는 12개 중 임의의 것 이상)에 상응하는 잔기, 또는 다른 폴리펩티드 중 임의의 것 내의 임의의 상응하는 보존된 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232에 상응하는 잔기를 포함한다. 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343 중 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 중 임의의 것 이상)에 상응하는 잔기를 포함할 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343에 상응하는 잔기를 포함한다. 폴리펩티드 또는 그의 변종은 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함할 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함한다.

본 명세서에는 또한, 본 명세서의 폴리펩티드 중 어느 하나를 암호화하는 핵산 또는 폴리뉴클레오티드가 제공된다. 예를 들어, 본 개시는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열 동일성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 제공한다. 예를 들어, 본 개시는 서열 번호 30에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 동일성을 갖는 단리된 핵산을 본 명세서에 제공한다. 상기 핵산을 포함하는 발현 카세트, 벡터, 및 세포 또한 제공된다.

본 명세서에는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물(예를 들어, 비-천연 조성물) 또한 제공된다. 일부 태양에서, 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 전체 셀룰라아제를 포함한다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드는, 예를 들어, T. 레세이 엔도글루카나아제 IV("T. 레세이 Eg4") 또는 그의 변종이다. T. 레세이 Eg4의 변종은 본 명세서에 제공된 변종 중 임의의 것일 수 있다.

일부 태양에서, 효소 조성물은 셀룰라아제 조성물이다. 효소 조성물은 하나 이상의 헤미셀룰라아제를 추가로 포함할 수 있으므로, 또한 헤미셀룰라아제 조성물일 수 있다. 일부 태양에서, 효소 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 셀룰라아제 폴리펩티드(들)를 포함한다. 일부 태양에서, 하나 이상의 셀룰라아제 폴리펩티드는 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드, 또는 β-글루코시다아제 활성을 갖는 폴리펩티드이다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 헤미셀룰라아제 폴리펩티드(들)를 추가로 포함한다. 일부 태양에서, 하나 이상의 헤미셀룰라아제 폴리펩티드는 자일라나아제 활성을 갖는 폴리펩티드, β-자일로시다아제 활성을 갖는 폴리펩티드, 또는 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드, 또는 조합된 자일라나아제/β-자일로시다아제 활성, 조합된 β-자일로시다아제/L-α-아라비노푸라노시다아제 활성, 또는 조합된 자일라나아제/ L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드이다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 셀룰라아제 폴리펩티드(들) 및 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 헤미셀룰라아제 폴리펩티드(들)를 포함한다.

일부 태양에서, 효소 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하며 엔도글루카나아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, β-글루코시다아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, 자일라나아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, β-자일로시다아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드, 및/또는 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상(예를 들어, 2, 3, 4, 또는 5개 이상)의 폴리펩티드를 추가로 포함한다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함한다. 일부 태양에서, 조성물은 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 추가로 포함한다. 일부 태양에서, 조성물은 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레(S. thermophile) 6A, 6B, 또는 그의 변종)를 추가로 포함한다. 일부 태양에서, 조성물은 GH61 효소(예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종) 이외의 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드를 추가로 포함한다.

조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있다. 조성물 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드, 및 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함할 수 있다.

본 명세서에 기재된 조성물 중 어느 하나는 전체 셀룰라아제를 포함할 수 있다. 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 전체 셀룰라아제를 포함하는 조성물이 제공된다. 대안적으로, 전체 셀룰라아제 + GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물이 제공된다. 일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드, 및 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드 이외의 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드, 및 β-글루코시다아제 활성을 갖는 폴리펩티드를 포함하는 조성물이 제공된다. 조성물은 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함한다. 예를 들어, 조성물은 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드, 및/또는 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종), 및 전체 셀룰라아제를 포함할 수 있다. 일부 태양에는, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종), 및 헤미셀룰라아제 활성을 갖는 하나 이상의 다른 폴리펩티드를 포함하는 조성물이 제공된다.

일부 태양에서, 전체 셀룰라아제는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 아닌 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종)를 포함한다. 전체 셀룰라아제는 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있다. 전체 셀룰라아제는 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있다.

일부 태양에서, 본 명세서에 기재된 조성물 중 어느 하나에서, 엔도글루카나아제 활성을 갖지만 GH61/엔도글루카나아제 활성을 갖는 것은 아닌 하나 이상의 폴리펩티드는, 예를 들어, T. 레세이 EG1(또는 그의 변종) 및/또는 T. 레세이 EG2(또는 그의 변종)이다. 일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종이다. 일부 태양에서, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, 및/또는 Tn3B, 또는 그의 변종이다. 일부 태양에서, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, 및/또는 AfuXyn5, 또는 그의 변종이다. 일부 태양에서, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, 제1군(Group 1) β-자일로시다아제 또는 제2군(Group 2) β-자일로시다아제이며, 여기서 제1군 β-자일로시다아제는 Fv3A, Fv43A 폴리펩티드, 또는 그의 변종일 수 있고, 제2군 β-자일로시다아제는 Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1 폴리펩티드, 또는 그의 변종일 수 있다. 일부 태양에서, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드는, 예를 들어, Fv3A(또는 그의 변종) 및/또는 Fv43D(또는 그의 변종)이다. 일부 태양에서, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Af43A, Fv43B, Pf51A, Pa51A, 및/또는 Fv51A, 또는 그의 변종일 수 있다.

일부 태양에는, GH61/ 엔도글루카나아제 활성을 갖는 단리된 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물이 제공된다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 숙주 세포에 의해 발현되며, 여기서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 핵산이 숙주 세포 내로 조작되어 있다. 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 숙주 세포에 의해 발현되며, 그 폴리펩티드를 암호화하는 핵산은 숙주 세포에 대해 이종성이다.

일부 태양에는, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고, 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하는 조성물이 제공되며, 여기서 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 의해 발현되고, 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 대해 이종성이다. 일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하는 조성물이 제공되며, 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 의해 발현되고, 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 대해 내인성이다. 일부 태양에서, 셀룰라아제 폴리펩티드는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드와는 상이한 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종), 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종), 또는 β-글루코시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함한다. 일부 태양에서, 헤미셀룰라아제 폴리펩티드는 자일라나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종), β-자일로시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종), 또는 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함한다.

일부 태양에서, 조성물은 발효 브로스로부터 제조된다. 일부 태양에서, 조성물은 통합 균주(integrated strain)(예를 들어, 본 명세서에서 실시예에 기재된 바와 같은 H3A/Eg4, #27)의 발효 브로스로부터 제조되며, 여기서 GH61 엔도글루카나아제 유전자는 숙주 균주의 유전 물질 내로 통합된다. 일부 태양에서, 조성물은 균주의 발효 브로스로부터 제조되며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 암호화하는 핵산은 숙주 세포에 대해 이종성이고, 여기서 GH61 엔도글루카나아제는, 예를 들어, 균주 내로 통합되거나, 숙주 균주 내로 도입된 벡터에 의해 발현된다.

GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 본 명세서에 제공된 조성물 또는 방법 중 어느 하나는 전체 셀룰라아제일 수 있다. 조성물은 최소 생성 후 가공(post-production processing)(예를 들어, 정제, 여과, 세포 살해 단계(cell kill step), 및/또는 한외여과 등)이 적용되는 발효 브로스일 수 있으며, 전체 브로스 제형으로서 사용된다.

일부 태양에는, T. 레세이 Eg4, T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, 및 Fv51A, 또는 그들 각각의 변종을 포함하는 조성물(예를 들어, 비-천연 조성물)이 제공된다. 조성물은 전체 셀룰라아제일 수 있다. 조성물은 최소 생성 후 가공(예를 들어, 여과, 정제, 한외여과, 세포-살해 단계 등)이 적용되는 발효 브로스일 수 있으며, 따라서 전체 브로스 제형으로서 사용된다. 일부 태양에서, 조성물은 단리된 T. 레세이 Eg4 또는 그의 변종을 포함한다. 일부 태양에서, 조성물은 단리된 T. 레세이 Bgl1, 단리된 T. 레세이 xyn3, 단리된 Fv3A, 단리된 Fv43D, 및 단리된 Fv51A 중 하나 이상을 포함한다. 예를 들어, 정제되거나 단리된 폴리펩티드의 단순 첨가 또는 혼합에 의해 상기 폴리펩티드 중 임의의 것을 조성물 내로 도입할 수 있다. 대안적으로, 적합한 재조합 기술을 사용하여 본 명세서의 폴리펩티드가 숙주 균주에 의해 발현될 수 있으며, 소정의 상기 폴리펩티드는 숙주 세포 내에서 그들의 천연 수준에 비교하여 과발현되거나 저발현될 수 있다. 일부 태양에서, 상기 폴리펩티드 중 어느 하나를 암호화하는 유전자는 숙주 균주 내로 통합될 수 있다. 일부 태양에서, 본 개시의 조성물은 숙주 균주의 발효 브로스로부터 제조된다. 일부 태양에서, 조성물은 통합 균주(예를 들어, 본 명세서에서 실시예에 기재된 바와 같은 H3A/Eg4, #27)의 발효 브로스로부터 얻어진다. 일부 실시 형태에서, 발효 브로스에는 최소 생성 후 가공이 적용되며, 전체 브로스 제형으로서 사용된다. 일부 태양에서, GH61 엔도글루카나아제를 암호화하는 핵산은 숙주 세포에 대해 이종성이다. 일부 태양에서, T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, 또는 Fv51A를 암호화하는 하나 이상의 핵산은 본 발명의 GH61 엔도글루카나아제를 발현시키는 숙주 세포에 대해 이종성이다. 일부 태양에서, T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, 또는 Fv51A를 암호화하는 하나 이상의 핵산은 GH61 엔도글루카나아제를 발현시키는 숙주 세포에 대해 내인성이다.

GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는, 그 안의 효소적 구성요소 또는 다른 구성요소의 유형 및 농도의 관점에서 유사하나 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(들)가 없는 대조군 효소 조성물 또는 대조군 바이오매스 당화 혼합물에 의해 달성되는 수율에 비교하여, 바이오매스 재료의 가수분해로부터의 발효가능한 당(들)의 수율을 증가시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상 만큼) 충분한 양으로 효소 조성물 또는 바이오매스 당화 혼합물 내에 존재할 수 있다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드는, 그 안의 효소적 구성요소 또는 다른 구성요소의 유형 및 농도의 관점에서 유사하나 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없는 대조군 혼합물의 점도에 비교하여, 그 안의 바이오매스 재료의 가수분해 중에 바이오매스 당화 혼합물의 점도를 감소시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상 만큼) 충분한 양으로 효소 조성물 또는 바이오매스 당화 혼합물 내에 존재할 수 있다. 일부 태양에서, 효소 조성물 또는 바이오매스 당화 혼합물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드를, 폴리펩티드가 접촉되는 바이오매스 재료의 가수분해를 유발하기에 충분한 총량으로 포함한다. 효소 조성물 또는 바이오매스 당화 혼합물은 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드, 및/또는 전체 셀룰라아제, 또는 그의 혼합물을, 폴리펩티드가 접촉되는 바이오매스 재료의 가수분해를 유발하기에 충분한 총량으로 추가로 포함할 수 있다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 효소 조성물 또는 바이오매스 당화 혼합물내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 0.5 중량% 내지 약 30 중량%, 약 1 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 20 중량%, 약 7 중량% 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)인 양으로 존재한다. 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 8 중량%, 약 10 중량%, 또는 약 12 중량%인 양으로 존재한다. 효소 조성물 또는 바이오매스 당화 혼합물은 GH61/ 엔도글루카나아제 활성을 갖는 하나 초과의 폴리펩티드를 포함할 수 있다. 예를 들어, 효소 조성물 또는 바이오매스 당화 혼합물은 T. 레세이 Eg4 또는 그의 변종과 더불어 T. 레세이 Eg7(또는 그의 변종)을 포함할 수 있으며, 여기서 GH61/엔도글루카나아제(Eg4 + Eg7) 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 0.5 중량% 내지 약 30 중량%, 약 2 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 20 중량%, 약 7 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%)이다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(들)는 숙주 세포에 대해 이종성이거나 내인성인 폴리뉴클레오티드로부터 발현될 수 있다. 대안적으로, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입될 수 있다.

일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)는 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 80 중량%(예를 들어, 약 5 중량% 내지 약 70 중량%, 약 10 중량% 내지 약 60 중량%, 약 20 중량% 내지 약 50 중량%, 또는 약 25 중량% 내지 약 50 중량%)인 양으로 존재한다. 효소 조성물 또는 바이오매스 당화 혼합물은 셀로바이오하이드롤라아제 활성을 갖는 하나 초과의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있으며, 여기서 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 80 중량%(예를 들어, 약 5 중량% 내지 약 70 중량%, 약 10 중량% 내지 약 60 중량%, 약 20 중량% 내지 약 50 중량%, 또는 약 25 중량% 내지 약 50 중량%)이다. 일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현된다. 일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입될 수 있다.

효소 조성물 또는 바이오매스 당화 혼합물은 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있으며, 여기서 β-글루코시다아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 1 중량% 내지 약 30 중량%, 약 2 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%)이다. β-글루코시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 대안적으로, β-글루코시다아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입될 수 있다.

일부 태양에서, 효소 조성물 또는 바이오매스 당화 혼합물은 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함할 수 있으며, 여기서 자일라나아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 1 중량% 내지 약 40 중량%, 약 4 중량% 내지 약 30 중량%, 약 5 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%)이다. 자일라나아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 일부 태양에서, 자일라나아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입되거나 혼합될 수 있다.

효소 조성물 또는 바이오매스 당화 혼합물은 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함할 수 있으며, 여기서 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 1 중량% 내지 약 40 중량%, 약 2 중량% 내지 약 30 중량%, 약 4 중량% 내지 약 20 중량%, 또는 약 5 중량% 내지 약 15 중량%)이다. L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 일부 태양에서, L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입되거나 혼합될 수 있다.

효소 조성물 또는 바이오매스 당화 혼합물은 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어,Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)를 포함할 수 있으며, 여기서 β-자일로시다아제 활성을 갖는 폴리펩티드의 총량은 효소 조성물 또는 바이오매스 당화 혼합물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%(예를 들어, 약 1 중량% 내지 약 40 중량%, 약 4 중량% 내지 약 35 중량%, 약 5 중량% 내지 약 25 중량%, 또는 약 5 중량% 내지 약 20 중량%)이다. β-자일로시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 대안적으로, β-자일로시다아제 활성을 갖는 폴리펩티드는 단리되거나 정제된 형태로 효소 조성물 또는 바이오매스 당화 혼합물 내로 도입될 수 있다.

일부 태양에서, 본 명세서에 제공되는 효소 조성물은 전체 셀룰라아제일 수 있다. 전체 셀룰라아제는, 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Eg4, Eg1, Eg2, Eg7, 또는 그의 변종과 같은 것)를 포함할 수 있다. 전체 셀룰라아제는 또한, 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있다. 전체 셀룰라아제는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 추가로 포함할 수 있다. 전체 셀룰라아제는 숙주 세포의 발효 브로스의 형태로 사용될 수 있다. 브로스에는, 예를 들어, 여과, 정제, 한외여과, 세포-살해 단계 등을 포함하는 최소 생성 후 가공이 적용될 수 있으며, 따라서 브로스를 전체 브로스 제형으로 바이오매스 가수분해에 사용할 수 있다.

일부 태양에서, 본 명세서에 제공되는 효소 조성물은 바이오매스 재료를 발효가능한 당(들)(예를 들어, 글루코스, 자일로스, 아라비노스, 및/또는 셀로바이오스)으로 전환시킬 수 있다. 일부 태양에서, 효소 조성물은 본 명세서에 기재된 칼코플루오르 어세이(calcofluor assay)에 의해 결정할 때 약 0.1 이상(예를 들어, 0.1 내지 0.4)의 산물 분율(fraction product)을 달성할 수 있다.

일부 태양에서, 효소 조성물은 셀룰라아제 조성물 또는 헤미셀룰라아제 조성물일 수 있다. 효소 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함할 수 있고, 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함할 수 있으며, 여기서 GH61/엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드 및 하나 이상의 셀룰라아제 폴리펩티드, 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는, 바이오매스 당화 혼합물 내의 바이오매스 기질과 접촉시켜 가수분해하기 위해 혼합물을 사용하기 전에 혼합물 내로 블렌딩된다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드, 하나 이상의 셀룰라아제 폴리펩티드, 및 하나 이상의 헤미셀룰라아제 폴리펩티드는, 상이한 시간에 바이오매스 재료에 첨가된다. 예를 들어, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드는, 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드가 바이오매스 재료에 첨가되기 전 또는 후에 동일한 바이오매스 재료에 첨가된다.

일부 태양에서, 본 발명의 조성물은 GH61/엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드 및 바이오매스 재료를, 예를 들어, 혼합물 내에 포함한다. 예를 들어, 조성물은 가수분해 혼합물, 발효 브로스/혼합물, 또는 바이오매스 당화 혼합물일 수 있다. 혼합물은 하나 이상의 발효가능한 당(들)을 포함할 수 있다.

본 명세서에는 또한, 생성되는 바이오매스 당화 혼합물 내의 바이오매스 재료를 가수분해하기에 충분한 양으로 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물(예를 들어, 비-천연 조성물)과 바이오매스 재료를 접촉시키는 단계를 포함하는, 바이오매스 재료를 가수분해하는 방법이 제공된다.

본 명세서에는 또한, 혼합물의 점도를 감소시키기에 충분한 양으로 조성물 내에 존재하는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물(예를 들어, 비-천연 조성물)과 혼합물을 접촉시키는 단계를 포함하는, 바이오매스 혼합물, 및/또는 바이오매스 당화 혼합물의 점도를 감소시키는 방법이 제공된다. 일부 태양에서, 바이오매스 혼합물 또는 바이오매스 당화 혼합물은 바이오매스 재료, 임의로 또한 발효가능한 당(들), 전체 셀룰라아제, 및/또는 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물을 포함한다. 혼합물의 점도는, 혼합물에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없는 점을 제외하고는 동일한 구성요소를 동일한 농도로 포함하는 대조군 혼합물의 점도에 비교하여 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상) 만큼 감소될 수 있다. 바이오매스 재료는 헤미셀룰로오스, 셀룰로오스, 또는 그의 혼합물을 포함할 수 있다. 바이오매스 재료는 글루칸, 자일란 및/또는 리그닌, 또는 그의 혼합물을 포함할 수 있다.

일부 태양에서는, 바이오매스 재료를 산 또는 염기로 적합하게 처리하거나 전처리할 수 있다. 일부 태양에서, 염기는 암모니아이다. 본 발명의 방법은 바이오매스 혼합물의 pH를 약 4.0 내지 약 6.5의 pH(예를 들어, 약 4.5 내지 약 5.5의 pH)로 조정하는 단계를 추가로 포함할 수 있다. 일부 태양에서, 본 방법은 약 4.0 내지 약 6.5의 pH(예를 들어, 약 4.5 내지 약 5.5의 pH)에서 수행된다. 일부 태양에서, 약 2 h 내지 약 7 d(예를 들어, 약 4 h 내지 약 6 d, 약 8 h 내지 약 5 d, 또는 약 8 h 내지 약 3 d) 동안 수행된다. 이러한 pH 조정은 바이오매스 혼합물을 폴리펩티드 또는 효소 조성물과 접촉시키기 전에 적합하게 실행될 수 있다.

일부 태양에서, 바이오매스 재료는 당화 혼합물 내에 높은 고체 수준으로 존재하며, 예를 들어, 그의 고체 상태의 바이오매스 재료는 당화 혼합물 내의 효소 + 바이오매스 재료의 총 중량의 약 5 중량% 내지 약 60 중량% 이상(예를 들어, 약 10 중량% 내지 약 50 중량%, 약 15 중량% 내지 약 40 중량%, 약 15 중량% 내지 약 30 중량%, 또는 약 20 중량% 내지 약 30 중량%)을 구성한다. 그의 고체 상태의 바이오매스 재료의 중량은, 그의 건조 상태, 그의 건조 고체 상태, 그의 자연적 상태, 또는 그의 가공되지 않은 상태, 또는 바이오매스가 효소 조성물 내의 폴리펩티드와 접촉되기 전의, 바이오매스 재료의 중량을 의미한다. 바람직하게는, 그의 고체 상태의 바이오매스 재료는 당화 혼합물 내의 효소 + 바이오매스 재료의 총 중량의 약 15 중량% 이상, 더욱 더 바람직하게는 약 20 중량% 또는 25 중량% 이상을 구성한다.

일부 태양에서, 본 방법은 발효가능한 당(들)을 생성시키는 단계를 포함한다. 본 발명의 방법을 사용하여 발효가능한 당(들)의 양을 증가된 수준으로 생성시킬 수 있다. 예를 들어, 본 명세서의 방법 또는 조성물을 사용하여 생성시킨 발효가능한 당(들)의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없다는 점을 제외하고는 동일한 폴리펩티드 구성요소를 동일한 농도로 포함하는 효소 조성물에 의해 동일한 바이오매스 재료가 가수분해될 경우에 생성되는 발효가능한 당(들)의 양에 비교하여 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상) 만큼 증가된다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없다는 점을 제외하고는 동일한 구성요소를 동일한 농도로 갖는 효소 조성물에 의한 동일한 바이오매스 재료로부터의 발효가능한 당(들)의 수율에 비교하여, 발효가능한 당(들)의 수율을 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상) 만큼 증가시키기에 충분하다. 일부 태양에서, 바이오매스 당화 혼합물 내의 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 없다는 점을 제외하고는 동일한 바이오매스 및 동일한 패널의 폴리펩티드를 동일한 농도로 포함하는 대조군 바이오매스 당화 혼합물의 점도에 비교하여, 혼합물의 점도를 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 이상) 만큼 감소시키기에 충분하다.

일부 태양에서, 당화 또는 가수분해 공정에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물의 양은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.1 mg 내지 약 50 mg 단백질(예를 들어, 약 0.2 mg 내지 약 40 mg 단백질, 약 0.5 mg 내지 약 30 mg 단백질, 약 1 mg 내지 약 20 mg 단백질, 또는 약 5 mg 내지 약 15 mg 단백질)이다. 본 명세서에 기재된 단백질 양은 효소 조성물 또는 바이오매스 당화 혼합물 내의 총 단백질의 중량을 지칭한다. 단백질은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하며 셀룰라아제 폴리펩티드(들) 및/또는 헤미셀룰라아제 폴리펩티드(들)와 같은 다른 효소를 포함할 수 있다. 일부 태양에서, 가수분해 또는 당화 공정에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 1 mg 내지 약 5 mg)의 단백질이다.

가수분해 또는 당화 공정에서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Eg1, T. 레세이 Eg2, 및/또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 1 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.

가수분해 또는 당화 공정에서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드 및 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 1 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.

일부 태양에서, 가수분해 또는 당화 공정에서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 0.5 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.

가수분해 또는 당화 공정에서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 약 0.5 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.

가수분해 또는 당화 공정에 사용되는 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 및/또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 0.5 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.

가수분해 또는 당화 공정에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 및/또는 그의 변종)를 포함하는 효소 조성물 또는 바이오매스 당화 혼합물은, 바이오매스 재료 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg, 약 0.5 mg 내지 약 10 mg, 또는 약 0.5 mg 내지 약 5 mg)의 단백질을 함유할 수 있다.

일부 태양에서, 본 발명의 방법은 약 30℃ 내지 약 65℃(예를 들어, 약 35℃ 내지 약 60℃, 약 40℃ 내지 약 60℃, 또는 약 45℃ 내지 약 55℃)의 온도에서 수행된다.

본 발명의 방법은 바이오매스 재료를 전체 셀룰라아제를 포함하는 효소 조성물과 접촉시키는 단계를 추가로 포함할 수 있다. 일부 태양에서, 바이오매스 재료를 전체 셀룰라아제를 포함하는 조성물과 추가로 접촉시키는 단계는, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물과 접촉시키는 단계 전에, 그 후에, 또는 그와 동시에 수행된다.

일부 태양에서, 본 발명의 방법은 바이오매스 재료를 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물과 접촉시키는 단계를 추가로 포함한다. 바이오매스 재료를 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물과 접촉시키는 단계는, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물과 접촉시키는 단계 전에, 그 후에, 또는 그와 동시에 수행될 수 있다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는, 바이오매스 재료에 접촉시키기 위해 혼합물을 사용하기 전에 혼합물 내로 블렌딩된다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는, 상이한 시간에 바이오매스 재료에 첨가된다. 예를 들어, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는, 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 첨가하기 전 또는 후에 첨가된다.

일부 태양에서는, 산업적 설정 및/또는 상업적 설정 양자 모두에서 본 발명을 응용하는 방법을 고려한다. 따라서, 적합한 GH61 엔도글루카나아제를 포함하는 본 조성물을 제조하거나, 시판하거나, 달리 상업화하는 방법 또는 방법은 본 개시의 범위 내에 있다. 본 방법은, 예를 들어, 조성물 또는 GH61 엔도글루카나아제 폴리펩티드 또는 그의 변종의 상업용 효소 공급 모델에서의 응용을 포함하며, 여기서 효소 및 변종은 본 발명의 조성물과 더불어 셀룰로오스계 당 제조사, 소정의 에탄올(바이오에탄올) 정제공장, 또는 다른 생화학물질 또는 생물재료 제조업체에 공급되거나 판매된다. 일부 태양에서 본 방법은 또한, 조성물 또는 GH61 엔도글루카나아제 폴리펩티드 또는 그의 변종의 현장 생물정제 모델에서의 응용일 수 있으며, 여기서 본 발명의 폴리펩티드 또는 변종, 또는 비-천연 셀룰라아제 및 헤미셀룰라아제 조성물은 셀룰로오스계 당 공장, 바이오에탄올 정제공장, 또는 생화학물질/생물재료 제조업체에, 또는 그 부근에 위치하는 현장에서 효소 제조업체에 의해 구축된 효소 생산 시스템에 의해 생산된다. 일부 태양에서, 바람직하게는 본 명세서에 기재된 바와 같이 적절한 전처리를 적용하는 적합한 바이오매스 기질은, 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조 설비에서, 또는 그 부근에서 본 명세서의 당화 방법 및 효소 및/또는 효소 조성물을 사용하여 가수분해할 수 있다. 이어서, 생성되는 발효가능한 당에 동일한 설비 또는 부근의 설비에서 발효를 적용할 수 있다.

본 명세서에 기재된 실시 형태의 특성 중 하나, 일부, 또는 전부를 조합하여 본 발명의 다른 실시 형태를 형성할 수 있음이 이해되어야 한다. 본 발명의 이들 태양 및 다른 태양은 당업자에게 자명해질 것이다.

도면의 간단한 설명

도면은 단지 예시를 목적으로 하며, 어떤 방식으로든 본 교시의 범주를 제한하고자 하는 것이 아님을, 당업자는 이해할 것이다.

<도 1>

도 1: GH61/엔도글루카나아제 활성을 갖는 다양한 폴리펩티드의 소정의 아미노산 서열을 도시한다.

<도 2>

도 2: 도 1(서열 번호 1 내지 28)에 제공된 것들과 같은, GH61/엔도글루카나아제 활성을 갖는 다양한 폴리펩티드의 다수의 아미노산 서열을 비교하는 클러스탈V(ClustalV)(PAM250)를 사용하여 퍼센트 동일성 및 상이성(divergence)을 도시한다.

<도 3>

도 3: 도 1(서열 번호 1 내지 28)에 제공된 것들과 같은 GH61/엔도글루카나아제 활성을 갖는 다양한 폴리펩티드의 정렬을 도시한다.

<도 4a 내지 4b>

도 4a 내지 4b: 도 4a는 T. 레세이 Eg4(서열 번호 30)의 뉴클레오티드 서열을 도시한다. 도 4b는 T. 레세이 Eg4(서열 번호 27)의 아미노산 서열을 도시한다. 예상되는 신호 서열은 밑줄로, 예상되는 보존된 도메인은 굵은체로, 그리고 예상되는 링커는 이탤릭체로 표시되어 있다.

<도 5>

도 5: T. 레세이 Eg4(TrEG4)(서열 번호 27)과 T. 레세이 Eg7(TrEG7, 또는 TrEGb)(서열 번호 26) 및 TtEG(서열 번호 29)의 아미노산 서열 정렬을 도시한다.

<도 6a 내지 6b>

도 6a 내지 6b: 도 6a는, 서열 정렬 및 TrEG7(프로틴 데이터 뱅크(Protein Data Bank) 등록: pdb:2vtc에서의 결정 구조) 및 TtEG(프로틴 데이터 뱅크 등록: pdb:3EII에서의 결정 구조)의 공지 구조로부터 추론된, T. 레세이 Eg4(TrEg4)의 보존된 잔기를 제공한다. 도 6b는, Tr6A 및 Tr7A의 공지 서열과의 서열 정렬로부터 추론된 보존된 CBM 도메인 잔기를 제공한다.

<도 7>

도 7은 다수의 GH61 엔도글루카나아제의 아미노산 서열 모티프를 열거한다. 서열 모티프 내의 각각의 "a"는, 알라닌, 알지닌, 아스파라긴, 아스파르트산, 시스테인, 글루탐산, 글루타민, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 타이로신, 또는 발린 중 어느 하나일 수 있는 아미노산을 나타낸다.

<도 8a 내지 8i>

도 8a 내지 8i: 도 8a는 pENTR-TOPO-Bgl1-943/942 플라스미드를 도시한다. 도 8b는 pTrex3g 943/942 발현 벡터를 도시한다. 도 8c는 pENTR/ T. 레세이 Xyn3 플라스미드를 도시한다. 도 8d는 pTrex3g/T. 레세이 Xyn3 발현 벡터를 도시한다. 도 8e는 pENTR-Fv3A 플라스미드를 도시한다. 도 8f는 pTrex6g 플라스미드를 도시한다. 도 8g는 pTrex6g/Fv3A 발현 벡터를 도시한다. 도 8h는 TOPO Blunt/Pegl1-Fv43D 플라스미드를 도시한다. 도 8i는 TOPO Blunt/Pegl1-Fv51A 플라스미드를 도시한다.

<도 9>

도 9: T. 레세이 통합 균주 H3A의 효소 조성물을 제공한다.

<도 10>

도 10: 실시예 2에서 각각의 샘플에 개별적으로 첨가된 효소(정제 또는 비정제), 및 이들 효소의 스톡 단백질 농도를 열거한다

<도 11a 내지 11d>

도 11a 내지 11d: 도 11a는, 실시예 2에 따라 T. 레세이 통합 균주 H3A에 첨가된 도 10의 다양한 정제 또는 비-정제 효소를 포함하는 효소 조성물을 첨가하는 단계에 의한 묽은 암모니아로 전처리된 옥수수 속대(corncob)의 당화 후의 글루코스 방출을 도시한다. 도 11b는, 실시예 2에 따라 T. 레세이 통합 균주 H3A에 첨가된 도 10의 다양한 정제 또는 비-정제 효소를 포함하는 효소 조성물을 첨가하는 단계에 의한 묽은 암모니아로 전처리된 옥수수 속대의 당화 후의 셀로바이오스 방출을 도시한다. 도 11c는, 실시예 2에 따라 T. 레세이 통합 균주 H3A에 첨가된 도 10의 다양한 정제 또는 비-정제 효소를 포함하는 효소 조성물을 첨가하는 단계에 의한 묽은 암모니아로 전처리된 옥수수 속대의 당화 후의 자일로바이오스 방출을 도시한다. 도 11d는, 실시예 2에 따라 T. 레세이 통합 균주 H3A에 첨가된 도 10의 다양한 정제 또는 비-정제 효소를 포함하는 효소 조성물을 첨가하는 단계에 의한 묽은 암모니아로 전처리된 옥수수 속대의 당화 후의 자일로스 방출을 도시한다.

<도 12a 내지 12b>

도 12a 내지 12b: 도 12a는, 실시예 3에 기재된 바와 같은 발현 카세트 Pegl1-eg4-sucA를 도시한다. 도 12b는, 실시예 3에 기재된 바와 같은, 발현 카세트 pEG1-EG4-sucA를 함유하는 pCR Blunt II TOPO의 플라스미드 맵을 도시한다.

<도 13>

도 13: 실시예 3에 따라 T. 레세이 Eg4를 발현시키는 T. 레세이 통합 균주 H3A 형질전환체에 의해 생성된 효소를 포함하는 효소 조성물에 의한, 글루칸 및 자일란의 셀로바이오스, 글루코스, 자일로바이오스, 및 자일로스로의 전환의 양 또는 백분율을 도시한다.

<도 14>

도 14: T. 레세이 Eg4를 발현시키는 H3A 형질전환체에 의해 생성된 효소 조성물의 증가하는 양을 사용하여 관찰한, 증가된 퍼센트 글루칸 전환을 도시한다. 실험적 상세 사항은 실시예 3에 기재되어 있다.

<도 15>

도 15: 실시예 4(실험 1)에 대한 T. 레세이 Eg4 투여 차트를 제공한다. 샘플 "#27"은 실시예 4에 기재된 바와 같은 H3A/Eg4 통합 균주이다. 첨가된 정제 T. 레세이 Eg4의 양은 "샘플 설명" 하에 중량% 또는 질량(mg 단백질/g G+X 단위)에 의해 열거되어 있다.

<도 16a 내지 16b>

도 16a 내지 16b: 도 16a는, 실시예 4에 따른 묽은 암모니아로 전처리된 옥수수 속대의 당화에서 글루코스 방출에 대한 T. 레세이 Eg4의 효과를 도시한다. 도 16b는, 묽은 암모니아로 전처리된 옥수수 속대의 당화에서 자일로스 방출에 대한 T. 레세이 Eg4의 효과를 도시한다. 이들 도면의 Y-축은 반응 혼합물 내에 방출되는 글루코스 또는 자일로스의 농도를 지칭한다. X 축은 효소 조성물 샘플의 명칭/간단한 설명을 열거한다. 이는 실시예 4(실험 1)에 따른 것이다.

<도 17a 내지 17b>

도 17a 내지 17b: 도 17a는 실시예 4(실험 2)에 대한 다른 T. 레세이 Eg4 투여 차트를 제공한다. 샘플은 도 15의 것들과 유사하게 기재되어 있다. 첨가된 정제 T. 레세이 Eg4의 양은 실시예 4, 실험 1(상기)의 것들보다 더 작은 증분으로 변동되었다. 도 17b는 실시예 4(실험 3)에 대한 다른 T. 레세이 Eg4 투여 차트를 제공한다. 샘플은 도 16 및 17a의 것들과 유사하게 기재되어 있다. 첨가된 정제 T. 레세이 Eg4의 양은 실시예 4, 실험 1 및 2(상기)의 것들보다 더욱 더 미세한 증분으로 변동되었다.

<도 18a 내지 18b>

도 18a 내지 18b: 도 18a는, 실시예 4에 기재된 바와 같은, 묽은 암모니아로 전처리된 옥수수 속대의 당화로부터의 글루코스 방출에 대한 다양한 양(0.05 mg/g 내지 1.0 mg/g)의 T. 레세이 Eg4의 효과를 도시한다. 도 18b는, 실시예 4에 기재된 바와 같은, 묽은 암모니아로 전처리된 옥수수 속대의 당화로부터의 글루코스 방출에 대한 다양한 양(0.1 mg/g 내지 0.5 mg/g)의 T. 레세이 Eg4의 효과를 도시한다.

<도 19>

도 19: 실시예 5에 기재된 바와 같은, 묽은 암모니아로 전처리된 옥수수 대의 상이한 고체 로딩의 당화로부터의 글루코스/ 자일로스 방출에 대한 효소 조성물 내의 T. 레세이 Eg4의 효과를 도시한다. 고체 로딩은 x-축 상에 #%로서 열거되어 있다.

<도 20>

도 20: 실시예 6에 따른, 묽은 암모니아로 전처리된 옥수수 속대로부터 T. 레세이 Eg4를 포함하는 효소 조성물을 사용하여 방출된 자일로스 단량체의 백분율 수율을 제공한다.

<도 21>

도 21: 실시예 6에 따른, 묽은 암모니아로 전처리된 옥수수 속대로부터 T. 레세이 Eg4를 포함하는 효소 조성물을 사용하여 방출된 글루코스 단량체의 백분율 수율을 제공한다.

<도 22>

도 22: 실시예 6에 따른, 묽은 암모니아로 전처리된 옥수수 속대로부터 T. 레세이 Eg4를 포함하는 효소 조성물을 사용하여 방출된 발효가능한 총 단량체의 수율(mg/ml)을 제공한다.

<도 23>

도 23: T. 레세이 Eg4가 없는 효소 조성물 대 T. 레세이 Eg4를 0.53 mg/g으로 포함하는 것에 의한 가수분해의 결과로서 방출된 글루코스의 양을 비교한다. 실험은 실시예 7에 기재되어 있다.

<도 24>

도 24: 실시예 7에 따라, 암모니아로 전처리된 옥수수 속대를 정제 T. 레세이 Eg4를 단독으로 사용하여 처리한 결과로서의 글루코스 단량체 방출을 도시한다.

<도 25>

도 25: T. 레세이 통합 균주 H3A 및 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 14 mg/g의 효소 용량에서의 당화 성능을 도시하고 비교한다. 이는 실시예 8의 기재에 따른 것이다.

<도 26>

도 26: 산으로 전처리된 옥수수 대에 대한, T. 레세이 통합 균주 H3A 및 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 다양한 효소 용량에서의 당화 성능을 도시한다. 이는 실시예 9의 기재에 따른 것이다.

<도 27>

도 27: 실시예 10에 따른, 묽은 암모니아로 전처리된 옥수수 잎, 줄기, 또는 속대에 대한, T. 레세이 통합 균주 H3A 및 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 당화 성능을 도시한다.

<도 28>

도 28: 방출된 글루코스 또는 자일로스의 양의 관점에서, T. 레세이 통합 균주 H3A 및 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 당화 성능을 비교한다. 이는 실시예 11에 따른 것이다.

<도 29>

도 29: T. 레세이 통합 균주 H3A/Eg4(균주 #27)에 의해 생성된 효소 조성물의 증가하는 양에서 퍼센트 글루칸 및 자일란 전환의 변화를 도시한다. 이는 실시예 12의 기재에 따른 것이다.

<도 30>

도 30: 묽은 암모니아로 전처리된 옥수수 속대 당화에 대한 T. 레세이 Eg4 첨가의 효과를 열거하는 표이다. 실험 조건은 실시예 13에 기재되어 있다.

<도 31>

도 31: T. 레세이 Eg4에 의한 CMC 가수분해를 도시한다. 실험 조건은 실시예 13에 기재되어 있다.

<도 32>

도 32: T. 레세이 Eg4에 의한 셀로바이오스 가수분해를 도시한다. 실험 조건은 실시예 13에 기재되어 있다.

<도 33>

도 33: 당화를 위한 다양한 효소 조성물의 양을 도시한다. 실험 조건은 실시예 14에 기재되어 있다.

<도 34>

도 34: 도 33에 상응하는 각각의 효소 조성물로 생성시킨 글루코스, 글루코스 + 셀로바이오스, 또는 자일로스의 양을 도시한다. 실험 조건은 실시예 14에 기재되어 있다.

<도 35>

도 35: 실시예 15에 기재된 바와 같은, CBH1, CBH2, 및 T. 레세이 Eg2 혼합물의 다양한 비율을 도시한다.

<도 36>

도 36: 다양한 효소 조성물을 사용하는 글루칸 전환(%)을 도시한다. 실험 조건은 실시예 15에 기재되어 있다.

<도 37>

도 37은, 실시예 22에 따라 CBH I의 존재 또는 부재 하에 T. 레세이 Eg4를 포함하는 조성물을 사용하여 아비셀(Avicel)을 처리하는 경우에 아스코르브산의 효과를 도시한다.

<도 38>

도 38: 실시예 22에 따라, CBH II의 존재/부재 하에 T. 레세이 Eg4를 포함하는 조성물을 사용하여 아비셀을 처리하는 경우에 아스코르브산의 효과를 도시한다.

<도 39a 내지 39b>

도 39a 내지 39b: 도 39a는 실시예 22의 실험에 사용된 기질 및 다양한 효소의 양을 도시하며, 그 결과는 도 37에 도시되어 있다. 도 39b는 실시예 22의 실험에 사용된 기질 및 다양한 효소의 양을 도시하며, 그 결과는 도 38에 도시되어 있다.

<도 40>

도 40: 실시예 16에 기재된 실험에 따라, 다양한 효소 조성물을 사용하는 옥수수 속대 가수분해로부터의 글루코스 생성을 도시한다.

<도 41>

도 41: 실시예 16의 기재에 따라 다양한 효소 조성물을 사용하는 옥수수 속대 가수분해로부터의 자일로스 생성을 도시한다.

<도 42>

도 42: 실시예 17의 기재에 따라 H3A, 및 정제 Eg4가 첨가된 H3A를 사용하는 당화 혼합물의 시간에 대한 점도를 도시한다.

<도 43>

도 43: 실시예 18의 기재에 따라 H3A 및 H3A/Eg4#27을 사용하는 당화 혼합물의 시간에 대한 점도를 도시한다.

<도 44>

도 44: 실시예19의 기재에 따라, H3A 또는 H3A/Eg4#27 브로스의 발효 브로스를 14 mg/g 셀룰로오스로 사용하는, 25% 및 30% 고체에서의 묽은 암모니아로 전처리된 옥수수 속대의 당화의 점도를 도시한다.

<도 45>

도 45: 실시예 20에 따라 다양한 효소 조성물을 사용하는, 6-h 당화, 25% 건조물, 50℃, pH 5.0에서의 글루코스 농도를 도시한다.

<도 46>

도 46: 실시예 20에 따라 다양한 효소 조성물을 사용하는, 24-시간 당화, 25% 건조물, 50℃, pH 5.0에서의 글루코스 농도를 도시한다.

<도 47>

도 47: 실시예 20에 따라 다양한 효소 조성물을 사용하는, 25% 건조물, 50℃, pH 5.0에서의 당화에서 시간에 대한 글루코스 농도를 도시한다.

<도 48>

도 48: 실시예 20에 따라 다양한 효소 조성물을 사용하는, 25% 건조물, 50℃, pH 5.0에서의 당화에서 시간에 대한 글루칸 전환을 도시한다.

<도 49>

도 49는 본 개시에 동정된 서열의 요약을 제공한다.

<도 50a 내지 50b>

도 50a 내지 50b: 도 50a는 Fv3A를 암호화하는 뉴클레오티드 서열(서열 번호 35)을 도시한다. 도 50b는 Fv3A 아미노산 서열(서열 번호 36)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 51a 내지 51b>

도 51a 내지 51b: 도 51a는 Pf43A를 암호화하는 뉴클레오티드 서열(서열 번호 37)을 도시한다. 도 51b는 Pf43A 아미노산 서열(서열 번호 38)을 도시한다. 예상되는 신호 서열은 밑줄로, 예상되는 보존된 도메인은 굵은체로, 예상되는 탄수화물 결합 모듈("CBM": carbohydrate binding module)은 대문자로, 그리고 CD와 CBM을 분리하는 예상되는 링커는 이탤릭체로 표시되어 있다.

<도 52a 내지 52b>

도 52a 내지 52b: 도 52a는 Fv43E를 암호화하는 뉴클레오티드 서열(서열 번호 39)을 도시한다. 도 52b는 Fv43E 아미노산 서열(서열 번호 40)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 53a 내지 53b>

도 53a 내지 53b: 도 53a는 Fv39A를 암호화하는 뉴클레오티드 서열(서열 번호 41)을 도시한다. 도 53b는 Fv39A 아미노산 서열(서열 번호 42)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 53a 내지 53b>

도 54a 내지 54b: 도 54a는 Fv43A를 암호화하는 뉴클레오티드 서열(서열 번호 43)을 도시한다. 도 54b는 Fv43A 아미노산 서열(서열 번호 44)을 도시한다. 예상되는 신호 서열은 밑줄로, 예상되는 보존된 도메인은 굵은체로, 예상되는 CBM은 대문자로, 그리고 보존된 도메인과 CBM을 연결하는 예상되는 링커는 이탤릭체로 표시되어 있다.

<도 55a 내지 55b>

도 55a 내지 55b: 도 55a는 Fv43B를 암호화하는 뉴클레오티드 서열(서열 번호 45)을 도시한다. 도 55b는 Fv43B 아미노산 서열(서열 번호 46)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 볼드체로 표시되어 있다.

<도 56a 내지 56b>

도 56a 내지 56b: 도 56a는 Pa51A를 암호화하는 뉴클레오티드 서열(서열 번호 47)을 도시한다. 도 56b는 Pa51A 아미노산 서열(서열 번호 48)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다. 예상되는 L-α-아라비노푸라노시다아제 보존된 도메인은 굵은체로 표시되어 있다. T. 레세이에서의 발현을 위하여, 게놈 DNA를 코돈 최적화하였다(도 73c 참조).

<도 57a 내지 57b>

도 57a 내지 57b: 도 57a는 Gz43A를 암호화하는 뉴클레오티드 서열(서열 번호 49)을 도시한다. 도 57b는 Gz43A 아미노산 서열(서열 번호 50)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다. T. 레세이에서의 발현을 위하여, 예상되는 신호 서열을 T. 레세이 CBH1 신호 서열(myrklavisaflatara(서열 번호 120))로 대체하였다.

<도 58a 내지 58b>

도 58a 내지 58b: 도 58a는 Fo43A를 암호화하는 뉴클레오티드 서열(서열 번호 51)을 도시한다. 도 58b는 Fo43A 아미노산 서열(서열 번호 52)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다. T. 레세이에서의 발현을 위하여, 예상되는 신호 서열을 T. 레세이 CBH1 신호 서열(myrklavisaflatara(서열 번호120))로 대체하였다.

<도 59a 내지 59b>

도 59a 내지 59b: 도 59a는 Af43A를 암호화하는 뉴클레오티드 서열(서열 번호 53)을 도시한다. 도 59b는 Af43A 아미노산 서열(서열 번호 54)을 도시한다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 60a 내지 60b>

도 60a 내지 60b: 도 60a는 Pf51A를 암호화하는 뉴클레오티드 서열(서열 번호 55)을 도시한다. 도 60b는 Pf51A 아미노산 서열(서열 번호 56)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 L-α-아라비노푸라노시다아제 보존된 도메인은 굵은체로 표시되어 있다. T. 레세이에서의 발현을 위하여, 예상되는 신호 서열을 코돈 최적화된 T. 레세이 CBH1 신호 서열(myrklavisaflatara(서열 번호 120))(밑줄)로 대체하였고, Pf51A 뉴클레오티드 서열을 발현을 위해 코돈 최적화하였다.

<도 61a 내지 61b>

도 61a 내지 61b: 도 61a는 AfuXyn2를 암호화하는 뉴클레오티드 서열(서열 번호 57)을 도시한다. 도 61b는 AfuXyn2 아미노산 서열(서열 번호 58)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 GH11 보존된 도메인은 굵은체로 표시되어 있다.

<도 62a 내지 62b>

도 62a 내지 62b: 도 62a는 AfuXyn5를 암호화하는 뉴클레오티드 서열(서열 번호 59)을 도시한다. 도 62b는 AfuXyn5 아미노산 서열(서열 번호 60)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 GH11 보존된 도메인은 굵은체로 표시되어 있다. 도 63a 내지 63b: 도 63a는 Fv43D를 암호화하는 뉴클레오티드 서열(서열 번호 61)을 도시한다. 도 63b는 Fv43D 아미노산 서열(서열 번호 62)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 64a 내지 64b>

도 64a 내지 64b: 도 64a는 Pf43B를 암호화하는 뉴클레오티드 서열(서열 번호 63)을 도시한다. 도 64b는 Pf43B 아미노산 서열(서열 번호 64)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 65a 내지 65b>

도 65a 내지 65b: 도 65a는 Fv51A를 암호화하는 뉴클레오티드 서열(서열 번호 65)을 도시한다. 도 65b는 Fv51A 아미노산 서열(서열 번호 66)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 L-α-아라비노푸라노시다아제 보존된 도메인은 굵은체로 표시되어 있다.

<도 66a 내지 66b>

도 66a 내지 66b: 도 66a는 Cg51B를 암호화하는 뉴클레오티드 서열(서열 번호 67)을 도시한다. 도 66b는 Cg51B 아미노산 서열(서열 번호 68)을 도시한다. 예상되는 상응하는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 67a 내지 67b>

도 67a 내지 67b: 도 67a는 Fv43C를 암호화하는 뉴클레오티드 서열(서열 번호 69)을 도시한다. 도 67b는 Fv43C 아미노산 서열(서열 번호 70)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 68a 내지 68b>

도 68a 내지 68b: 도 68a는 Fv30A를 암호화하는 뉴클레오티드 서열(서열 번호 71)을 도시한다. 도 68b는 Fv30A 아미노산 서열(서열 번호 72)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다.

<도 69a 내지 69b>

도 69a 내지 69b: 도 69a는 Fv43F를 암호화하는 뉴클레오티드 서열(서열 번호 73)을 도시한다. 도 69b는 Fv43F 아미노산 서열(서열 번호 74)을 도시한다. 예상되는 신호 서열은 밑줄로 표시되어 있다.

<도 70a 내지 70b>

도 70a 내지 70b: 도 70a는 T. 레세이 Xyn3을 암호화하는 뉴클레오티드 서열(서열 번호 75)을 도시한다. 도 70b는 Xyn3 아미노산 서열(서열 번호 76)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 71a 내지 71b>

도 71a 내지 71b: 도 71a는 T. 레세이 Xyn2의 아미노산 서열(서열 번호 77)을 도시한다. 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다. 코딩 서열은 문헌[

et al. Biotechnology, 1992, 10:1461-65]에서 확인할 수 있다. 도 71b는 Xyn2를 암호화하는 뉴클레오티드 서열(서열 번호 160)을 도시한다.

<도 72a 내지 72b>

도 72a 내지 72b: 도 72a는 T. 레세이 Bxl1의 아미노산 서열(서열 번호 78)을 도시한다. 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다. 코딩 서열은 문헌[Margolles-Clark et al. Appl. Environ. Microbiol. 1996, 62(10):3840-46]에서 확인할 수 있다. 도 72b는 Bxl1을 암호화하는 뉴클레오티드 서열(서열 번호 159)을 도시한다.

<도 73a 내지 73f>

도 73a 내지 73f: 도 73a는 T. 레세이 Bgl1의 아미노산 서열(서열 번호 79)을 도시한다. 신호 서열은 밑줄로 표시되어 있다. 예상되는 보존된 도메인은 굵은체로 표시되어 있다. 코딩 서열은 문헌[Barnett et al. Bio-Technology, 1991, 9(6):562-567]에서 확인할 수 있다. 도 73b는 Pa51A에 대해 추정되는 cDNA(서열 번호 80)를 도시한다. 도 73c는 Pa51A에 대해 코돈 최적화된 cDNA(서열 번호 81)를 도시한다. 도 73d: 성숙한 Gz43A를 암호화하는 게놈 DNA의 업스트림에 있는 CBH1 신호 서열(밑줄)을 포함하는 작제물에 대한 코딩 서열(서열 번호 82)을 도시한다. 도 73e: 성숙한 Fo43A를 암호화하는 게놈 DNA의 업스트림에 있는 CBH1 신호 서열(밑줄)을 포함하는 작제물에 대한 코딩 서열(서열 번호 83)을 도시한다. 도 73f: 성숙한 Pf51A를 암호화하는 코돈 최적화된 DNA의 업스트림에 있는 CBH1 신호 서열(밑줄)을 포함하는 작제물에 대한 코돈 최적화된 코딩 서열(서열 번호 92)을 도시한다.

<도 74a 내지 74b>

도 74a 내지 74b: 도 74a는 Pa3D를 암호화하는 뉴클레오티드 서열(서열 번호 93)을 도시한다. 도 74b는 Pa3D의 아미노산 서열(서열 번호 94)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 75a 내지 75b>

도 75a 내지 75b: 도 75a는 Fv3G를 암호화하는 뉴클레오티드 서열(서열 번호 95)을 도시한다. 도 75b는 Fv3G의 아미노산 서열(서열 번호 96)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 76a 내지 76b>

도 76a 내지 76b: 도 76a는 Fv3D를 암호화하는 뉴클레오티드 서열(서열 번호 97)을 도시한다. 도 76b는 Fv3D의 아미노산 서열(서열 번호 98)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 77a 내지 77b>

도 77a 내지 77b: 도 77a는 Fv3C를 암호화하는 뉴클레오티드 서열(서열 번호 99)을 도시한다. 도 77b는 Fv3C의 아미노산 서열(서열 번호 100)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 78a 내지 78b>

도 78a 내지 78b: 도 78a는 Tr3A를 암호화하는 뉴클레오티드 서열(서열 번호 101)을 도시한다. 도 78b는 Tr3A의 아미노산 서열(서열 번호 102)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 79a 내지 79b>

도 79a 내지 79b: 도 79a는 Tr3B를 암호화하는 뉴클레오티드 서열(서열 번호 103)을 도시한다. 도 79b는 Tr3B의 아미노산 서열(서열 번호 104)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 80a 내지 80b>

도 80a 내지 80b: 도 80a는 Te3A를 암호화하는 뉴클레오티드 서열(서열 번호 105)을 도시한다. 도 80b는 Te3A의 아미노산 서열(서열 번호 106)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 81a 내지 81b>

도 81a 내지 81b: 도 81a는 An3A를 암호화하는 뉴클레오티드 서열(서열 번호 107)을 도시한다. 도 81b는An3A의 아미노산 서열(서열 번호 108)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 82a 내지 82b>

도82a 내지 82b: 도 82a는 Fo3A를 암호화하는 뉴클레오티드 서열(서열 번호 109)을 도시한다. 도 82b는 Fo3A의 아미노산 서열(서열 번호 110)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 83a 내지 83b>

도 83a 내지 83b: 도 83a는 Gz3A를 암호화하는 뉴클레오티드 서열(서열 번호 111)을 도시한다. 도 83b는 Gz3A의 아미노산 서열(서열 번호 112)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 84a 내지 84b>

도 84a 내지 84b: 도 84a는 Nh3A를 암호화하는 뉴클레오티드 서열(서열 번호 113)을 도시한다. 도 84b는 Nh3A의 아미노산 서열(서열 번호 114)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 85a 내지 85b>

도 85a 내지 85b: 도 85a는 Vd3A를 암호화하는 뉴클레오티드 서열(서열 번호 115)을 도시한다. 도 85b는 Vd3A의 아미노산 서열(서열 번호 116)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 86a 내지 86b>

도 86a 내지 86b: 도 86a는 Pa3G를 암호화하는 뉴클레오티드 서열(서열 번호 117)을 도시한다. 도 86b는 Pa3G의 아미노산 서열(서열 번호 118)을 도시한다. 예상되는 신호 서열은 밑줄로, 그리고 예상되는 보존된 도메인은 굵은체로 표시되어 있다.

<도 87>

도 87: Tn3B를 암호화하는 아미노산 서열(서열 번호 119)을 도시한다. 표준 신호 예상 프로그램, 시그널 P(Signal P)(www.cbs.dtu.dk/services/ SignalP/)는 예상되는 신호를 제공하지 않았다.

<도 88>

도 88: T. 레세이 Eg4(서열 번호 27)와 Tr6A(서열 번호 31)와 Tr7A(서열 번호 32)의 CBM 도메인의 부분적 아미노산 서열 정렬을 도시한다.

<도 89a 내지 89c>

도 89a 내지 89c: 도 89a는 T. 레세이로부터의 Eg6의 아미노산 서열(서열 번호 33)을 도시한다. 굵은체로 표시된 아미노산 서열은 예상되는 신호 펩티드 서열이다. 도 89b는 S. 코코스포룸(S. coccosporum) 엔도글루카나아제의 아미노산 서열(서열 번호 34)을 도시한다. 도 89c는 테르모아스쿠스 아우란티아쿠스(Thermoascus aurantiacus)로부터의 GH61A 를 암호화하는 뉴클레오티드 서열(서열 번호 149)을 도시한다.

<도 90a 내지 90i>

도 90a 내지 90i: 도 90a는, T. 레세이의 CBH1의 상동체인 Afu7A의 아미노산 서열(서열 번호 150)을 도시한다. 도 90b는 T. 레세이의 CBH1의 상동체인 Afu7B의 아미노산 서열(서열 번호 151)을 도시한다. 도 90c는 T. 레세이의 CBH1의 상동체인 Cg7A의 아미노산 서열(서열 번호 152)을 도시한다. 도 90d는 T. 레세이의 CBH1의 상동체인 Cg7B의 아미노산 서열(서열 번호 153)을 도시한다. 도 90e는 T. 레세이의 CBH1의 상동체인 Tt7A의 아미노산 서열(서열 번호 154)을 도시한다. 도 90f는 T. 레세이의 CBH1의 상동체인 Tt7B의 아미노산 서열(서열 번호 155)을 도시한다. 도 90g는 T. 레세이의 CBH2의 상동체인 St6A의 아미노산 서열(서열 번호 156)을 도시한다. 도 90h는 T. 레세이의 CBH2의 상동체인 St6B의 아미노산 서열(서열 번호 157)을 도시한다. 도 90i는 T. 레세이의 CBH2의 상동체인 Tt6A의 아미노산 서열(서열 번호 158)을 도시한다.

[발명의 상세한 설명]

달리 정의되지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자가 통상적으로 이해하는 의미를 갖는다. 문헌[Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED., John Wiley and Sons, New York (1994)] 및 문헌[Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N.Y. (1991)]은, 본 발명에 사용되는 다수의 용어의 일반적 사전을 당업자에게 제공한다. 본 명세서에 기재된 것과 유사하거나 균등한 임의의 방법 및 재료가 본 발명의 실시에 사용될 수 있지만, 바람직한 방법 및 재료가 기술된다. 수치 범위는 범위를 정의하는 숫자를 포함한다. 본 발명은 기재된 특정 방법론, 프로토콜, 및 시약으로 제한되지 않으며, 이는 그들이 변동될 수 있기 때문이다.

본 명세서에 제공된 제목은, 본 명세서에 전체로서 참고로 포함될 수 있는 본 발명의 다양한 태양 또는 실시 형태를 제한하지 않는다. 따라서, 하기에 정의되는 용어를 본 명세서에 전체로서 참고로 더욱 완전히 정의한다.

본 개시는 글리코실 하이드롤라아제 패밀리 61("GH61")/엔도글루카나아제 활성을 갖는 폴리펩티드, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드, 본 명세서에 제공되는 폴리펩티드를 암호화하는 뉴클레오티드, 본 명세서에 제공되는 뉴클레오티드를 함유하는 벡터, 및 본 명세서에 제공되는 뉴클레오티드 및/또는 벡터를 함유하는 세포를 포함하는 조성물을 제공한다. 본 개시는, 본 명세서에 제공되는 조성물을 사용하여 바이오매스 재료를 가수분해하는 방법, 및 바이오매스-함유 혼합물의 점도를 감소시키는 방법을 추가로 제공한다.

본 명세서에 사용되는 바와 같이, DNA 또는 RNA와 같은 핵산에 관하여 용어 "단리된"은, 핵산의 자연적 공급원에 존재하는 다른 DNA 또는 RNA로부터 분리된 분자를 각각 지칭한다. 또한, "단리된 핵산"은, 단편으로서는 천연적이 아니며 자연적 상태에서는 발견되지 않을 핵산 단편을 포함하고자 한다. 용어 "단리된"은 또한, 다른 세포 단백질로부터 단리된 폴리펩티드를 지칭하기 위해 본 명세서에 사용되며, 이는 정제 및 재조합 폴리펩티드 양자 모두를 포괄하고자 한다. 본 명세서에 사용되는 바와 같이, 용어 "단리된"은 또한, 재조합 DNA 기술에 의해 생성되는 경우에 세포 재료, 바이러스 재료, 또는 배양 배지가 실질적으로 없을 수 있는 핵산 또는 폴리펩티드를 지칭한다. 본 명세서에 사용되는 바와 같이, 용어 "단리된"은, 화학적으로 합성되는 경우에 화학적 전구체 또는 다른 화학물질이 실질적으로 없을 수 있는 핵산 또는 폴리펩티드를 부가적으로 지칭한다.

본 명세서에 사용되는 바와 같이, 폴리펩티드 X의 "변종"은, 하나 이상의 변경된 아미노산 잔기를 가진 폴리펩티드 X의 아미노산 서열을 갖는 폴리펩티드를 지칭한다. 변종은 보존적 또는 비보존적 변화를 가질 수 있다. 생물학적 활성에 영향을 미치지 않으면서 어느 아미노산 잔기를 치환하거나, 삽입하거나, 결실시킬 수 있는지를 결정하는 지침은 당업계에 공지된 컴퓨터 프로그램, 예를 들어, 레이저진(LASERGENE) 소프트웨어(DNA스타(DNASTAR))를 사용하여 확인할 수 있다. 본 발명의 변종은 전구체 효소 아미노산 서열과 비교하여 변경된 아미노산 서열을 포함하는 폴리펩티드를 포함하며, 여기서 변종 효소는 전구체 효소의 특징적인 셀룰로오스 분해 성질을 보유하지만 일부 특정 측면에서는 변경된 특성, 예를 들어, 전구체 효소에 비교하여 증가되거나 감소된 pH 최적점, 증가되거나 감소된 산화 안정성; 증가되거나 감소된 열안정성, 및 하나 이상의 기질에 대한 특이적 활성의 증가되거나 감소된 수준을 가질 수 있다.

본 명세서에 사용되는 바와 같이, 숙주 세포에 대해 "이종성"인 폴리펩티드 또는 핵산은 숙주 세포에서 자연적으로 발생하지 않는 폴리펩티드 또는 핵산을 지칭한다.

본 명세서에서 값 또는 파라미터에 "약"을 언급하는 것은, 그 값 또는 파라미터 자체에 관한 변동을 포함(및 기재)하는 것이다. 예를 들어, "약 X"를 언급하는 기재는 "X"의 기재를 포함한다.

본 명세서 및 첨부된 특허청구범위에 사용되는 바와 같이, 문맥이 명백하게 달리 지시하지 않는 한, 단수 형태("a," "or," 및 "the")는 복수 지시대상(plural referent)을 포함한다.

본 명세서에 기재된 방법 및 조성물의 태양 및 변형은, 태양 및 변형으로 "구성되는" 것 및/또는 "본질적으로 구성되는" 것을 포함한다는 것이 이해된다.

폴리펩티드

본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)를 제공한다. 예를 들어, 본 개시는 다양한 종으로부터의 GH61 엔도글루카나아제 또는 그의 변종, 다양한 종으로부터의 엔도글루카나아제 IV(또는 엔도글루카나아제 4) 폴리펩티드(본 명세서에서는 또한 "Eg4" 또는 "EG4"로서 기재되며, 이들은 본 명세서에서 호환적으로 사용됨) 또는 그의 변종, 및 트리코더마 레세이 Eg4 폴리펩티드 또는 그의 변종을 제공한다. 일부 태양에서, 폴리펩티드는 단리된다.

글리코시드 하이드롤라아제 패밀리 61("GH61") 효소

글리코시드 하이드롤라아제 패밀리 61("GH61") 효소는 진핵 생물에서 동정되었다. 약한 엔도글루카나아제 활성이 히포크레아 제코리나(Hypocrea jecorina)로부터의 Cel61A에 대해 관찰되었으며(Karlsson et al, Eur J Biochem, 2001, 268(24):6498-6507), 따라서 이는 GH61/엔도글루카나아제 활성을 갖는 것으로 언급된다. GH61 폴리펩티드는 셀룰라아제에 의한 리그노셀룰로오스계 기질의 효소적 가수분해를 가능하게 한다(Harris et al, 2010, Biochemistry, 49(15) 3305-16). 키틴 분해에 참여하는 상동성 폴리펩티드에 대한 연구는 GH61 폴리펩티드가, 전자 공여 기질을 필요로 하며 2가 금속 이온이 참여하는 산화성 가수분해 기전을 채용할 수 있을 것으로 예상한다(Vaaje-Kolstad, 2010, Science, 330(6001), 219-22). 이는 리그노셀룰로오스계 기질 분해에 대한 GH61 폴리펩티드의 상승적 효과가 2가 이온에 의존성이라는 관찰과 일치한다(Harris et al, 2010, Biochemistry, 49(15) 3305-16). 다수의 GH61 폴리펩티드의 입수가능한 구조가 다수의 보존된 아미노산 잔기에 의해 결합된 2가 원자를 갖는다(Karkehabadi, 2008, J. Mol. Biol., 383(1) 144-54; Harris et al, 2010, Biochemistry, 49(15) 3305-16). GH61 폴리펩티드는, 보존된 잔기에 의해 형성되며 기질 결합에 참여할 수 있는 금속 결합 부위에 편평한 표면을 갖는 것으로 보고되었다(Karkehabadi, 2008, J. Mol. Biol., 383(1), 144-54).

본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)를 제공하며, 이는 다양한 종으로부터의 GH61 엔도글루카나아제 또는 엔도글루카나아제 IV("EG IV")일 수 있거나, 또한 GH61 엔도글루카나아제에 상응하는(그것과 상동성을 공유하고/하거나, 작용성 도메인을 공유하고/하거나, GH61 모티프(들)를 공유하고/하거나, 보존적 잔기를 공유하는) 다양한 종으로부터의 폴리펩티드(예를 들어, 트리코더마 레세이 Eg4 폴리펩티드)일 수 있다. 이러한 종은 트리코더마, 휴미콜라, 푸사리움, 아스페르길루스, 뉴로스포라, 페니실리움, 세팔로스포리움, 아클리아, 포도스포라, 엔도티아, 무코르, 코클리오볼루스, 피리쿨라리아, 크리소스포리움, 아스페르길루스 아와모리, 아스페르길루스 푸미가투스, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리제, 크리소스포리움 루크노엔스, 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 푸사리움 베네나툼, 브제르칸데라 아두스타, 세리포리옵시스 아네이리나, 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아, 세리포리옵시스 길베센스, 세리포리옵시스 판노신타, 세리포리옵시스 리불로사, 세리포리옵시스 서브루파, 세리포리옵시스 서브베르미스포라, 코프리누스 시네레우스, 코리올루스 히르수투스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 뉴로스포라 인터미디아, 페니실리움 푸르푸로게눔, 페니실리움 카네센스, 페니실리움 솔리툼, 페니실리움 푸니쿨로섬 파네로카에테 크리소스포리움, 플레비아 라디아테, 플레우로투스 에린기, 탈라로마이세스 플라부스, 티엘라비아 테레스트리스, 트라메테스 빌로사, 트라메테스 베르시콜로르, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 트리코더마 레세이, 트리코더마 비리데, 지오스미티아 에메르소니, 또는 G. 스테아로테르모필루스를 포함한다.

GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 도 1에 열거된 다수의 GH61 엔도글루카나아제를 포함한다. 예를 들어, 적합한 GH61 엔도글루카나아제는, 예를 들어, 그들의 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스 Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), NCBI Ref: XP_750843.1을 갖는 A. 푸미가투스 Afu6g09540으로부터의 엔도글루카나아제, A. 푸미가투스 EDP47167로부터의 엔도글루카나아제, T. 테레스트리스 16380으로부터의 엔도글루카나아제, T. 테레스트리스 155418로부터의 엔도글루카나아제, T. 테레스트리스 68900으로부터의 엔도글루카나아제, C. 글로보섬으로부터의 Cg61A(등록 번호 EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 젠뱅크 등록 번호 XP_752040를 가진 A. 푸미가투스 Af293으로부터의 엔도글루카나아제를 포함하는 도 1에 열거된 다양한 서열에 약 60% 이상 동일한 아미노산 서열을 포함하는 것들을 포함한다. 일부 태양에서, 본 발명의 적합한 GH61 엔도글루카나아제 폴리펩티드는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 태양에서, 본 발명의 적합한 GH61 엔도글루카나아제 폴리펩티드는, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로부터 선택된 아미노산 서열 모티프 중 하나 이상을 포함한다. 폴리펩티드는 길이가 100개 이상(예를 들어, 110, 120, 130, 140, 150, 160, 170, 180, 200, 220, 250개 이상)의 잔기일 수 있다.

본 명세서에 제공된 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 또한, GH61 엔도글루카나아제의 변종, 예를 들어, 본 개시의 도 1에 나타낸 아미노산 서열을 가진 폴리펩티드 중 임의의 것일 수 있다. 예를 들어, 적합한 GH61 엔도글루카나아제는 그들의 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스(A. fumigatus) Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), NCBI Ref: XP_750843.1을 가진 A. 푸미가투스 Afu6g09540으로부터의 엔도글루카나아제, A. 푸미가투스 EDP47167로부터의 엔도글루카나아제, T. 테레스트리스 16380으로부터의 엔도글루카나아제, T. 테레스트리스 155418로부터의 엔도글루카나아제, T. 테레스트리스 68900으로부터의 엔도글루카나아제, C. 글로보섬으로부터의 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293으로부터의 젠뱅크 등록: XP_752040을 가진 엔도글루카나아제를 포함한다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 EG IV의 변종이다. 일부 태양에서, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 GH61 엔도글루카나아제의 변종이며, 여기서 변종은 서열 번호 1 내지 29 및 148의 아미노산 서열 중 어느 하나에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 동일성을 갖는 아미노산 서열을 갖는다.

서열 번호 1 내지 29 및 148의 아미노산 서열을 사용하는 정렬을 수행하고 정렬 결과를 도 3에 나타낸다. 도 2는 폴리펩티드의 아미노산 서열의 비교로부터 퍼센트 동일성 및 상이성 결과를 나타낸다. 정렬은 GH61 엔도글루카나아제 폴리펩티드가 소정의 서열 모티프를 공유함을 나타냈으며, 이러한 모티프는 본 개시의 도 7에 나타낸다.

따라서, 본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)를 제공하며, 이는 GH61 엔도글루카나아제 또는 그의 변종일 수 있고, 변종은 서열 번호 84 내지 91로부터 선택된 하나 이상의 모티프(2, 3, 4, 5, 6, 7, 또는 8개 중 임의의 것 이상)를 포함할 수 있다. 서열 번호 84 내지 91(도 7에 기재됨)을 가진 서열 모티프 내의 각각의 "a"는, 알라닌, 알지닌, 아스파라긴, 아스파르트산, 시스테인, 글루탐산, 글루타민, 글리신, 히스티딘, 아이소류신, 류신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 타이로신, 또는 발린 중 어느 하나일 수 있는 아미노산을 나타낸다. 예를 들어, 일부 태양에서 본 개시는, 서열 번호 84, 85, 86, 87, 88, 89, 90, 및 91 중 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개)과 같은 하나 이상의 서열 모티프를 포함하는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)를 제공한다. 일부 태양에서 본 개시는, 약 10개 이상, 예를 들어, 약 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 또는 350개 중 임의의 것 이상의 잔기의 영역에 걸쳐, 또는 미성숙한 폴리펩티드의 전체 길이, 전체 길이의 성숙한 폴리펩티드, 보존된 도메인의 전체 길이, 및/또는 전체 길이의 CBM에 걸쳐, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90 및 91로 구성된 군으로부터 선택된 서열 모티프 중 하나 이상을 포함하는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)를 제공한다. 보존된 도메인은 예상되는 촉매 도메인("CD")일 수 있다. 예시적인 폴리펩티드는 또한, 길이가 약 10개 이상, 예를 들어, 약 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 또는 600개 중 임의의 것 이상의 잔기인 단편을 포함한다. 단편은 보존된 도메인 및/또는 CBM을 포함할 수 있다. 단편이 보존된 도메인 및 효소의 CBM을 포함하는 경우에, 단편은 그 둘을 분리하는 링커를 임의로 포함한다. 링커는 천연 링커 또는 이종성 링커일 수 있다. 일부 태양에서, 폴리펩티드는 GH61/엔도글루카나아제 활성을 갖는다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 GH61 엔도글루카나아제 또는 그의 변종, 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 효소 또는 그의 변종, EG IV 또는 그의 변종, 또는 T. 레세이 Eg4 또는 그의 변종이다. 본 명세서에 기재된 변종은 엔도글루카나아제 활성을 갖는다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(변종을 포함함)는 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함할 수 있다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(변종을 포함함)는 촉매 도메인(예를 들어, 작용 촉매 도메인)을 포함할 수 있다.

T. 레세이 Eg4는 GH61 엔도글루카나아제 폴리펩티드이다. T. 레세이 Eg4의 아미노산 서열(서열 번호 27)을 도 1, 4b, 및 5에 나타낸다. 서열 번호 27은 미성숙한 T. 레세이 Eg4의 서열이다. T. 레세이 Eg4는 서열 번호 27의 잔기 1 내지 21(밑줄)에 상응하는 예상되는 신호 서열을 가지며; 신호 서열의 절단은 서열 번호 27의 잔기 22 내지 344에 상응하는 서열을 갖는 성숙한 폴리펩티드를 생성시킬 것으로 예상된다. 예상되는 보존된 도메인은 서열 번호 27의 잔기 22 내지 256 및 307 내지 343에 상응하며, 후자는 예상되는 탄수화물-결합 도메인(CBM)이다. 예를 들어, 카르복시 메틸 셀룰로오스를 기질로서 사용하는 효소적 어세이에서, T. 레세이 Eg4는 엔도글루카나아제 활성을 갖는 것으로 나타났다. 엔도글루카나아제 활성을 측정하는 방법 또한 당업자에게 공지되어 있다.

본 개시는 트리코더마 레세이 Eg4 폴리펩티드의 변종을 추가로 제공하며, 이는 서열 번호 27의 잔기 22 내지 344 중에서 약 50개 이상(예를 들어, 약 55, 60, 65, 70, 75, 100, 125, 150, 175, 200, 250, 또는 300개 이상)의 연속 아미노산 잔기에 대해 약 60% 이상(예를 들어, 약 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 서열 동일성을 갖는 서열을 포함할 수 있다. 예를 들어, 본 개시는 T. 레세이 Eg4 폴리펩티드의 변종을 제공한다. 이러한 변종은 서열 번호 27의 잔기 22 내지 344에 대해 약 70% 이상(예를 들어, 약 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 이상)의 동일성을 가질 수 있다. 폴리펩티드 또는 그의 변종은 단리될 수 있다. 폴리펩티드 또는 그의 변종은 엔도글루카나아제 활성을 가질 수 있다.

다수의 공지 엔도글루카나아제, 예를 들어, T. 테레스트리스로부터의 엔도글루카나아제(등록 번호 ACE10234, 본 명세서에서는 또한 "TtEG"로 명명됨)(서열 번호 29), 및 T. 레세이 로부터의 다른 엔도글루카나아제 Eg7(등록 번호 ADA26043.1)(본 명세서에서는 또한 "TrEGb" 또는 "TrEG7"로 명명됨)과 T. 레세이 Eg4의 아미노산 서열 정렬(도 5 참조)에 기초하여, T. 레세이 Eg4 잔기 H22, H107, H184, Q193, 및 Y195는 금속 배위 잔기(metal coordinator residue)로서 작용할 것으로 예상되었고; 잔기 D61 및 G63은 보존된 표면 잔기일 것으로 예상되었으며; 잔기 Y232는 활성에 참여할 것으로 예상되었다. T. 레세이 Eg4 A 내의 예상되는 보존된 잔기를 도 6a 및 6b에 나타낸다. T. 레세이 Eg4 폴리펩티드의 변종은, 천연 T. 레세이 Eg4에 비교하여, 잔기 H22, H107, H184, Q193, Y195, D61, G63, 및 Y232에서 변경되지 않을 수 있다. 도 5의 정렬에 나타낸 바와 같이, T. 레세이 Eg4 폴리펩티드의 변종은, TrEGb, TtEG, 및 T. 레세이 Eg4 중에서 보존된 아미노산 잔기의 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 이상에서 변경되지 않을 수 있다. T. 레세이 Eg4 폴리펩티드의 변종은 천연 T. 레세이 Eg4의 예상되는 보존된 도메인 전체를 포함할 수 있다. 도 5 및 6을 참조한다. T. 레세이 Eg4 폴리펩티드의 예시적인 변종은, 도 4b에 나타낸 성숙한 T. 레세이 Eg4 서열(예를 들어, 서열 번호 27의 잔기 22 내지 344)에 대해 약 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 중 임의의 것 이상의 동일성을 갖는 서열을 포함한다. 일부 태양에서, T. 레세이 Eg4 폴리펩티드의 변종은 엔도글루카나아제(예를 들어, 엔도글루카나아제 IV(EGIV)) 활성을 갖는다.

일부 태양에서, T. 레세이 Eg4 폴리펩티드의 변종은 엔도글루카나아제 활성을 가지며, 서열 번호 27의 아미노산 서열에 대해, 또는 서열 번호 27의 잔기 (i) 22 내지 255, (ii) 22 내지 343, (iii) 307 내지 343, (iv) 307 내지 344, 또는 (v) 22 내지 344에 대해, 약 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 중 임의의 것 이상의 서열 동일성을 가진 아미노산 서열을 포함한다.

일부 태양에서, 폴리펩티드 또는 그의 변종은, 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232 중 약 3개 이상의 잔기(예를 들어, 약 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개 중 임의의 것 이상)에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은, 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343 중 3개 이상의 잔기(예를 들어, 약 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 중 임의의 것 이상)에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함한다. 적합하게는, 폴리펩티드는 엔도글루카나아제 활성을 갖는다.

아미노산 치환을 사용하여, GH61 엔도글루카나아제의 변종, 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 엔도글루카나아제, EG IV, 또는 트리코더마 레세이 Eg4 폴리펩티드를 제조할 수 있다. 보존적 치환을 하기 표에서 "보존적 치환"의 제목 하에 나타낸다. 치환은 또한, 하기 표에 나타낸 예시적인 치환일 수 있다.

[표 1]

(a) 예를 들어, 시트 또는 나선형 입체 형태(conformation)로서의 치환 영역 내의 폴리펩티드 골격의 구조, (b) 표적 부위에서의 분자의 전하 또는 소수성, 또는 (c) 측쇄의 크기(bulk)를 유지함에 대한 그들의 효과가 유의적으로 상이한 치환을 선택함으로써, 폴리펩티드의 효소적 특성의 실질적인 개질이 수행된다. 천연 잔기는 통상의 측쇄 특성에 기초하여 하기의 군으로 나누어진다:

(1) 비-극성: 노르류신, Met, Ala, Val, Leu, Ile;

(2) 전하가 없는 극성: Cys, Ser, Thr, Asn, Gln;

(3) 산성(음성 하전됨): Asp, Glu;

(4) 염기성(양성 하전됨): Lys, Arg;

(5) 쇄 배향에 영향을 주는 잔기: Gly, Pro; 및

(6) 방향족: Trp, Tyr, Phe, His.

이들 부류 중 하나의 구성원을 다른 부류로 교체함으로써 비-보존적 치환을 실행한다. 분자의 산화 안정성을 개선하고 비정상적인 가교결합을 방지하기 위하여, 폴리펩티드의 적절한 입체 형태를 유지하는 데에 참여하지 않는 임의의 시스테인 잔기 또한 일반적으로 세린으로 치환할 수 있다. 역으로, 시스테인 결합(들)을 폴리펩티드에 첨가하여 그의 안정성을 개선할 수 있다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리되거나, 합성되거나, 재조합된 폴리펩티드)는 융합 또는 키메릭 폴리펩티드이며, 이는 폴리펩티드에 대해 전형적으로 이종성인(예를 들어, 본 개시의 폴리펩티드와는 상이한 공급원으로부터 유도됨) 하나 이상의 융합 세그먼트에 부착된 본 개시의 폴리펩티드의 도메인을 포함한다. 적합한 융합 또는 키메릭 세그먼트는, 폴리펩티드의 안정성을 증진하고/하거나, 다른 바람직한 생물학적 활성 또는 증진된 수준의 바람직한 생물학적 활성을 제공하고/하거나, 폴리펩티드의 정제(예를 들어, 친화도 크로마토그래피에 의함)를 용이하게 할 수 있는 세그먼트를 제한 없이 포함한다. 적합한 융합 세그먼트는, 목적하는 작용(예를 들어, 증가된 안정성, 용해도, 기능, 또는 생물학적 활성을 부여하고/하거나; 폴리펩티드의 정제를 단순화함)을 갖는 임의의 크기의 도메인일 수 있다. 본 발명의 융합 또는 혼성 폴리펩티드는 2개 이상의 융합 또는 키메릭 세그먼트로부터 작제할 수 있으며, 이들 각각 또는 이들 중 2개 이상은 상이한 공급원 또는 미생물로부터 유도된다. 융합 또는 혼성 세그먼트는 본 개시의 폴리펩티드의 도메인(들)의 아미노 말단 및/또는 카르복실 말단에 연결될 수 있다. 융합 세그먼트는 절단에 민감할 수 있다. 이러한 민감성을 갖는 것에는 일부 이점이 존재할 수 있으며, 예를 들어, 그것은 관심의 대상인 폴리펩티드의 간단한 회수를 가능하게 할 수 있다. 폴리펩티드를 암호화하는 융합 핵산으로 형질감염된 재조합 세포를 배양함으로써 융합 폴리펩티드를 생성시킬 수 있으며, 이는 폴리펩티드의 카르복실 말단부(terminal end) 또는 아미노 말단부에 부착된 융합 세그먼트, 또는 카르복실 말단부 및 아미노 말단부 양자 모두에 부착된 융합 세그먼트, 또는 그의 도메인을 포함한다.

따라서, 본 개시의 폴리펩티드는 또한, 유전자 융합(예를 들어, 과발현되고, 가용성인, 발현 산물의 활성 형태), 돌연변이 유발된 유전자(예를 들어, 유전자 전사 및 번역을 증진하는 코돈 개질을 갖는 유전자), 및 절단된 유전자(예를 들어, 신호 서열이 제거되거나 이종성 신호 서열로 치환된 유전자)의 발현 산물을 포함한다.

불용성 기질을 이용하는 글리코실 하이드롤라아제는 종종 모듈형 효소(modular enzyme)이다. 그들은 하나 이상의 비-촉매 탄수화물-결합 도메인(CBM)에 첨부된 촉매 모듈을 포함할 수 있다. 사실상, CBM은 글리코실 하이드롤라아제와 그의 표적 기질 다당류와의 상호작용을 촉진하는 것으로 생각된다. 따라서 본 개시는, 예를 들어, "스플라이스드-인(spliced-in)" 이종성 CBM의 결과로서 다중 기질을 갖는 키메릭 효소를 포함하는, 변경된 기질 특이성을 갖는 키메릭 효소를 제공한다. 본 개시의 키메릭 효소의 이종성 CBM을 또한 모듈형으로 설계함으로써 그들이 촉매 모듈 또는 촉매 도메인( 예를 들어, 활성 부위에서의 "CD")에 첨부되도록 할 수 있으며, 이는 아마도 글리코실 하이드롤라아제에 대해 이종성 또는 상동성일 수 있다.

따라서, 본 개시는 CBM/CD 모듈을 포함하거나 이들로 구성된 펩티드 및 폴리펩티드를 제공하며, 이는 상동적으로 쌍을 이루거나 연결되어 키메릭(이종성) CBM/CD 쌍을 형성할 수 있다. 따라서, 이들 키메릭 폴리펩티드/펩티드를 사용하여 관심의 대상인 효소의 성능을 개선하거나 변경할 수 있다.

일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드가 제공되며, 이는 본 개시의 도 1에 나타낸 서열을 가진 폴리펩티드 중 어느 하나의 하나 이상의 CD 및/또는 CBM을 포함한다. 예를 들어, 도 1의 적합한 GH61 엔도글루카나아제 폴리펩티드는, 그들의 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스 Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), A. 푸미가투스 Afu6g09540으로부터의 NCBI Ref: XP_750843.1의 엔도글루카나아제, A. 푸미가투스 EDP47167의 엔도글루카나아제, T. 테레스트리스 16380의 엔도글루카나아제, T. 테레스트리스 155418의 엔도글루카나아제, T. 테레스트리스 68900의 엔도글루카나아제, C. 글로보섬으로부터의 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293으로부터의 젠뱅크 등록: XP_752040을 가진 엔도글루카나아제를 포함한다. 적합하게는, 폴리펩티드는 2개 이상의 상이한 폴리펩티드로부터의 작용성 도메인을 포함하는 융합 폴리펩티드일 수 있다(예를 들어, 하나의 폴리펩티드로부터의 CBM이 다른 폴리펩티드로부터의 CD에 연결됨).

적합하게는, 본 개시의 폴리펩티드는 "실질적으로 순수한" 형태로 얻어지고/얻어지거나 사용될 수 있다. 예를 들어, 본 개시의 폴리펩티드는 주어진 조성물 내의 총 단백질의 약 80 중량% 이상(예를 들어, 약 85 중량%, 90 중량%, 91 중량%, 92 중량%, 93 중량%, 94 중량%, 95 중량%, 96 중량%, 97 중량%, 98 중량%, 또는 99 중량% 중 임의의 것 이상)을 구성하며, 이는 또한 완충제 또는 용액과 같은 다른 성분을 포함한다.

또한 적합하게는, 본 개시의 폴리펩티드는 배양 브로스(예를 들어, 사상 진균 배양 브로스) 내에서 얻어지고/얻어지거나 사용될 수 있다. 배양 브로스는 조작된 효소 조성물일 수 있으며, 예를 들어, 본 개시의 이종성 폴리펩티드를 발현시키도록 조작된 재조합 숙주 세포에 의해, 또는 본 개시의 내인성 폴리펩티드를 내인성 발현 수준보다 더 많거나 적은 양으로(예를 들어, 내인성 발현 수준보다 1-, 2-, 3-, 4-, 5-, 또는 그 이상의 배수로 더 많거나 적은 양으로) 발현시키도록 조작된 재조합 숙주 세포에 의해 배양 브로스가 생성될 수 있다. 또한, 배양 브로스는 본 개시의 복수의 폴리펩티드를 목적하는 비율로 발현시키도록 조작된 소정의 "통합" 숙주 세포 균주에 의해 생성될 수 있다.

핵산, 발현 카세트, 벡터, 및 숙주 세포

본 개시는 상기 제공된 폴리펩티드, 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드, GH61 엔도글루카나아제 또는 그의 변종, EG IV 또는 그의 변종, T. 레세이 Eg4 또는 그의 변종을 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 제공한다. 소정의 태양에서 본 개시는, 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 폴리펩티드, 또는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 이상의 동일성을 갖는 폴리펩티드를 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 제공한다.

소정의 태양에서 본 개시는, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로부터 선택된 하나 이상의 서열 모티프를 포함하는 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함) 중 어느 하나를 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 제공한다. 본 개시는, CBM 도메인(예를 들어, 작용성 CBM 도메인) 및/또는 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함하는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)를 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 추가로 제공한다.

본 개시는, T. 레세이 Eg4 폴리펩티드의 변종을 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 추가로 제공한다. 이러한 변종은 서열 번호 27의 잔기 22 내지 344에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상)의 서열 동일성을 가질 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 엔도글루카나아제 활성을 갖는다. 폴리펩티드 또는 그의 변종은, 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232 중 약 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 또는 12개 중 임의의 것 이상)에 상응하는 잔기를 포함할 수 있다. 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232에 상응하는 잔기를 포함할 수 있다. 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343 중 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 중 임의의 것 이상)에 상응하는 잔기를 포함할 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343에 상응하는 잔기를 포함한다.

본 개시는, 약 10개 이상, 예를 들어, 약 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 또는 1050개 중 임의의 것 이상의 뉴클레오티드의 영역에 걸쳐 서열 번호 30의 핵산 서열에 대해 약 70% 이상, 예를 들어, 약 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%; 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상의 동일성, 또는 완전한(100%) 동일성을 갖는 핵산 서열을 포함하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)을 제공한다. 일부 태양에서, 본 개시는 본 명세서에 제공된 폴리펩티드 중 어느 하나를 암호화하는 핵산을 제공한다. 본 명세서에는 또한, 서열 번호 30에 대해 약 80% 이상(예를 들어, 약 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상)의 동일성을 갖는 단리된 핵산이 제공된다.

일부 태양에는, 서열 번호 27의 아미노산 서열에 대해, 또는 서열 번호 27의 잔기 (i) 22 내지 255, (ii) 22 내지 343, (iii) 307 내지 343, (iv) 307 내지 344, 또는 (v) 22 내지 344에 대해, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산)이 제공된다. 일부 태양에는, 서열 번호 30에 대해 70% 이상(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상)의 서열 동일성을 갖는 핵산(예를 들어, 단리되거나, 합성되거나, 재조합된 핵산), 또는 높은 엄격성 조건 하에 서열 번호 30의 상보체(complement), 또는 그의 단편에 혼성화될 수 있는 핵산이 제공된다. 본 명세서에 사용되는 바와 같이, 용어 "낮은 엄격성, 중간 엄격성, 높은 엄격성, 또는 매우 높은 엄격성 조건 하에 혼성화되다"는, 혼성화 및 세척을 위한 조건을 기재한다. 혼성화 반응을 수행하기 위한 지침은 문헌[Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1 - 6.3.6]에서 확인할 수 있다. 그 참고문헌에는 수성 및 비수성 방법이 기재되어 있으며, 둘 중의 어느 방법이든 사용할 수 있다. 본 명세서에 언급된 특정 혼성화 조건은 하기와 같다: 1) 낮은 엄격성 혼성화 조건: 6X 소듐 클로라이드/소듐 시트레이트(SSC) 중에 약 45℃, 이어서 0.2X SSC, 0.1% SDS 중에 50℃ 이상에서 2회 세척(낮은 엄격성 조건에 있어서 세척 온도는 55℃로 증가시킬 수 있음); 2) 중간 엄격성 혼성화 조건: 6X SSC 중에 약 45℃, 이어서 0.2X SSC, 0.1% SDS 중에 60℃에서 1회 이상 세척; 3) 높은 엄격성 혼성화 조건: 6X SSC 중에 약 45℃, 이어서 0.2.X SSC, 0.1% SDS 중에 65℃에서 1회 이상 세척; 및 바람직하게는, 4) 매우 높은 엄격성 혼성화 조건: 65℃에서 0.5M 소듐 포스페이트, 7% SDS, 이어서 0.2X SSC, 1% SDS에서 65℃에서 1회 이상 세척. 달리 특정되지 않는 한, 매우 높은 엄격성 조건 (4)가 바람직한 조건이다.

본 개시는 또한, 상기 핵산 중 임의의 것을 포함하는 발현 카세트 및/또는 벡터를 제공한다. 본 개시의 효소와 같은 폴리펩티드를 암호화하는 핵산은 프로모터에 작동적으로 연결될 수 있다. 구체적으로, 사상 진균 숙주에서의 재조합 발현을 목적으로 하는 경우, 프로모터는 사상 진균 프로모터일 수 있다. 핵산은, 예를 들어, 이종성 프로모터의 제어 하에 있을 수 있다. 핵산은 또한, 구성성 또는 유도성 프로모터의 제어 하에 발현될 수 있다. 사용할 수 있는 프로모터의 예는, 셀룰라아제 프로모터, 자일라나아제 프로모터, 1818 프로모터(트리코더마의 EST 맵핑에 의해 고발현 단백질로서 이전에 동정됨)를 포함하나, 이로 제한되지 않는다. 예를 들어 적합하게는, 프로모터는 셀로바이오하이드롤라아제, 엔도글루카나아제, 또는 β-글루코시다아제 프로모터일 수 있다. 특히 적합한 프로모터는, 예를 들어, T. 레세이 셀로바이오하이드롤라아제, 엔도글루카나아제, 또는 β-글루코시다아제 프로모터일 수 있다. 예를 들어, 프로모터는 셀로바이오하이드롤라아제 I(cbh1) 프로모터이다. 프로모터의 비제한적인 예는 cbh1, cbh2, egl1, egl2, egl3, egl4, egl5, pki1, gpd1, xyn1, 또는 xyn2 프로모터를 포함한다. 프로모터의 부가적인 비제한적인 예는 T. 레세이 cbh1, cbh2, egl1, egl2, egl3, egl4, egl5, pki1, gpd1, xyn1, 또는 xyn2 프로모터를 포함한다.

본 명세서에 사용되는 바와 같이, 용어 "작동적으로 연결된"은, 프로모터가 선택된 DNA의 발현을 조절하는 것을 가능하게 하기 위하여, 선택된 뉴클레오티드 서열(예를 들어, 본 명세서에 기재된 폴리펩티드를 암호화하는)이 프로모터에 근접하여 존재함을 의미한다. 부가적으로, 전사 및 번역의 방향에 대하여 프로모터는 선택된 뉴클레오티드 서열의 업스트림에 위치한다. "작동적으로 연결된"은, 적당한 분자(예를 들어, 전사 활성화 단백질)가 조절 서열(들)에 결합될 경우에 유전자 발현을 허용하는 방식으로 뉴클레오티드 서열 및 조절 서열(들)이 연결됨을 의미한다.

본 개시는, 본 명세서에 기재된 폴리뉴클레오티드 벡터, 또는 발현 카세트 중 임의의 것을 함유하는 숙주 세포를 추가로 제공한다. 본 개시는 또한, 본 개시의 하나 이상의 폴리펩티드를 발현시키기 위해 사용할 수 있는 숙주 세포를 제공한다. 적합한 숙주 세포는 임의의 미생물의 세포(예를 들어, 박테리아, 원생 생물, 조류, 진균(예를 들어, 효모 또는 사상 진균), 또는 다른 미생물의 세포)를 포함하며, 바람직하게는 박테리아, 효모, 또는 사상 진균의 세포이다.

박테리아 속의 적합한 숙주 세포는 에스케리키아(Escherichia), 바실러스(Bacillus), 락토바실러스(Lactobacillus), 슈도모나스(Pseudomonas), 및 스트렙토마이세스(Streptomyces)의 세포를 포함하나, 이로 제한되지 않는다. 박테리아 종의 적합한 세포는, 예를 들어, 에스케리키아 콜라이(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 바실러스 리케니포르미스(Bacillus licheniformis), 락토바실러스 브레비스(Lactobacillus brevis), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 또는 스트렙토마이세스 리비단스(Streptomyces lividans)의 세포를 포함한다.

효모 속의 적합한 숙주 세포는, 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 칸디다(Candida), 한세눌라(Hansenula), 피치아(Pichia), 클루이베로마이세스(Kluyveromyces), 및 파피아(Phaffia)의 세포를 포함하나, 이로 제한되지 않는다. 효모 종의 적합한 세포는, 사카로마이세스 세레비시아(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 칸디다 알비칸스(Candida albicans), 한세눌라 폴리모르파(Hansenula polymorpha), 피치아 파스토리스(Pichia pastoris), P. 카나덴시스(P. canadensis), 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus), 및 파피아 로도자이마(Phaffia rhodozyma)의 세포를 포함하나, 이로 제한되지 않는다.

사상 진균의 적합한 숙주 세포는 아문(subdivision) 유미코티나(Eumycotina)의 모든 사상 형태를 포함한다. 사상 진균 속의 적합한 세포는, 아크레모니움(Acremonium), 아스페르길루스, 아우레오바시디움(Aureobasidium), 브제르칸데라, 세리포리옵시스, 크리소포리움(Chrysoporium), 코프리누스, 코리울루스, 코리나스쿠스(Corynascus), 케토미움(Chaetomium), 크립토코커스(Cryptococcus), 필로바시디움(Filobasidium), 푸사리움, 지베렐라(Gibberella), 휴미콜라, 마그나포르테(Magnaporthe), 무코르, 마이셀리오프토라, 무코르, 네오칼리마스틱스(Neocallimastix), 뉴로스포라, 파에실로마이세스(Paecilomyces), 페니실리움, 파네로카에테, 플레비아, 피로마이세스(Piromyces), 플레우로투스, 스키탈디움(Scytaldium), 스키조필룸(Schizophyllum), 스포로트리쿰(Sporotrichum), 탈라로마이세스, 테르모아스쿠스, 티엘라비아, 톨리포클라디움(Tolypocladium), 트라메테스, 및 트리코더마의 세포를 포함하나, 이로 제한되지 않는다. 사상 진균 종의 적합한 세포는, 아스페르길루스 아와모리, 아스페르길루스 푸미가투스, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리제, 크리소스포리움 루크노엔스, 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 푸사리움 베네나툼, 브제르칸데라 아두스타, 세리포리옵시스 아네이리나, 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아, 세리포리옵시스 길베센스, 세리포리옵시스 판노신타, 세리포리옵시스 리불로사, 세리포리옵시스 서브루파, 세리포리옵시스 서브베르미스포라, 코프리누스 시네레우스, 코리올루스 히르수투스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 뉴로스포라 인터미디아, 페니실리움 푸르푸로게눔, 페니실리움 카네센스, 페니실리움 솔리툼, 페니실리움 푸니쿨로섬 파네로카에테 크리소스포리움, 플레비아 라디아테, 플레우로투스 에린기, 탈라로마이세스 플라부스, 티엘라비아 테레스트리스, 트라메테스 빌로사, 트라메테스 베르시콜로르, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 트리코더마 레세이, 및 트리코더마 비리데의 세포를 포함하나, 이로 제한되지 않는다.

본 개시는 숙주 세포, 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 재조합에 의해 발현시키도록 조작된, 재조합 진균 숙주 세포 또는 재조합 사상 진균을 제공한다.

본 개시는 또한, 재조합 숙주 세포, 예를 들어, 재조합 진균 숙주 세포 또는 재조합 미생물, 예를 들어, T. 레세이 Xyn3, T. 레세이 Bgl1(또한 "Tr3A"라고 명명됨), Fv3A, Fv43D, 및 Fv51A 폴리펩티드를 재조합에 의해 발현시키도록 조작된, 재조합 T. 레세이와 같은 사상 진균을 제공한다. 예를 들어 적합하게는, 재조합 숙주 세포는 T. 레세이 숙주 세포이다. 적합하게는, 재조합 진균은 재조합 T. 레세이이다. 본 개시는, 예를 들어, T. 레세이 Eg4, T. 레세이 Xyn3, T. 레세이 Bgl1, Fv3A, Fv43D, 및 Fv51A 폴리펩티드를 재조합에 의해 발현시키도록 조작된 T. 레세이 숙주 세포를 제공한다. 대안적으로, 본 개시는 또한, 예를 들어, 아스페르길루스(예를 들어, A. 오리제(A. oryzae), A. 니게르(A. niger)) 숙주 세포 또는 본 명세서에 기재된 폴리펩티드를 재조합에 의해 발현시키도록 조작된 재조합 아스페르길루스인 재조합 숙주 세포 또는 재조합 미생물을 제공한다.

부가적으로 본 개시는, 당화에 적합한 비율로 적합한 효소를 포함하는 효소 블렌드를 발현시키도록 조작된 재조합 숙주 세포 또는 재조합 유기체를 제공한다. 재조합 숙주 세포는, 예를 들어, 진균 숙주 세포 또는 박테리아 숙주 세포이다. 재조합 진균은, 예를 들어, 재조합 T. 레세이, A. 오리제, A. 니게르, 또는 효모이다. 재조합 진균 숙주 세포는, 예를 들어, T. 레세이, A. 오리제, A. 니게르, 또는 효모 세포일 수 있다 재조합 박테리아 숙주 세포는, 예를 들어, 바실러스 서브틸리스, 또는 E. 콜라이 세포일 수 있다. 재조합 박테리아 유기체는, 예를 들어, 바실러스 서브틸리스 또는 E. 콜라이일 수 있다. 적합한 효소 블렌드 내에 존재하는 효소 비율/양의 예는 하기와 같이 본 명세서에 기재되어 있다.

조성물

본 개시는 또한, 셀룰라아제(들) 및/또는 헤미셀룰라아제(들)를 함유하는 효소 조성물과 같은 조성물(예를 들어, 비-천연 조성물)을 제공하며, 이를 사용하여 바이오매스 재료를 가수분해하고/하거나 바이오매스 혼합물(예를 들어, 효소 및 기질을 함유하는 바이오매스 당화 혼합물)의 점도를 감소시킬 수 있다.

셀룰라아제는 셀룰로오스(베타-1,4-글루칸 또는 베타 D-글루코시드 결합) 중합체를 글루코스, 셀로바이오스, 셀로올리고당류 등으로 가수분해할 수 있는 효소를 포함한다. 셀룰라아제는 전통적으로 하기의 3개 주요 부류로 나누어졌다: 엔도글루카나아제(EC 3.2.1.4)("EG"), 엑소글루카나아제 또는 셀로바이오하이드롤라아제(EC 3.2.1.91)("CBH"), 및 β-글루코시다아제(β-D-글루코사이드 글루코하이드롤라아제; EC 3.2.1.21)("BG")(Knowles et al., 1987, Trends in Biotechnology 5(9):255-261; Shulein, 1988, Methods in Enzymology, 160:234-242). 엔도글루카나아제는 셀룰로오스 섬유의 무정형 부분에 주로 작용하는 반면에, 셀로바이오하이드롤라아제는 결정질 셀룰로오스 또한 분해할 수 있다. 헤미셀룰라아제는, 예를 들어, 자일라나아제, β-자일로시다아제, 및 L-α-아라비노푸라노시다아제를 포함한다.

본 발명의 조성물은 하나 초과의 효소를 포함하는 다중-효소 블렌드일 수 있다. 적합하게는, 본 발명의 효소 조성물은 다른 미생물, 식물, 또는 유기체로부터 유도된 하나 이상의 부가적인 효소를 포함할 수 있다. 상승적 효소 조합 및 관련 방법이 고려된다. 본 개시는 다양한 유형의 바이오매스 재료를 분해하기 위한 효소 조성물에 포함된 효소의 최적 비율을 확인하는 방법을 포함한다. 이들 방법은, 예를 들어, 다양한 기질(예를 들어, 리그노셀룰로오스계 기질)을, 그들을 구성하는 발효가능한 당으로 효율적으로 전환시키는 단계를 달성하기 위해 본 발명의 효소 조성물에 포함될 효소의 최적 비율 또는 상대적 중량을 확인하기 위한 시험을 포함한다.

더 고등한 식물의 세포벽은 다양한 탄수화물 중합체(CP: carbohydrate polymer) 구성요소로 이루어져 있다. 이들 CP는 공유적 수단 및 비-공유적 수단을 통해 상호작용하여, 경성 세포벽을 형성하고 식물 내의 팽압에 저항하기 위해 필요한 구조적 견고성을 제공한다. 식물에서 발견되는 주요 CP는 셀룰로오스이며, 이는 세포벽의 구조적 골격을 형성한다. 셀룰로오스 생합성 중에, 폴리-β-1,4-D-글루코스의 쇄는 수소 결합 및 소수성 상호작용을 통해 자가 회합(self-associate)하여 셀룰로오스 미세섬유를 형성하며, 이는 추가로 자가 회합하여 더 큰 섬유를 형성한다. 셀룰로오스 미세섬유는 종종 구조적으로 불규칙하며, 변동 결정성(varying crystallinity)의 영역을 함유한다. 셀룰로오스 섬유의 결정화도는, 그의 구성요소 셀룰로오스 쇄 중에, 그리고 그 사이에 수소 결합이 얼마나 확고하게 정연한지에 따라 달라진다. 덜 정연한 결합을 가짐으로써 더 접근가능한 글루코스 쇄를 가진 영역을 무정형 영역이라고 지칭한다. 글루코스로의 셀룰로오스 탈중합화에 대한 일반적 모델은 최소 3개의 구별되는 효소적 활성을 포함한다. 접근가능한 단부의 수를 증가시키는 공정 중에, 엔도글루카나아제는 셀룰로오스 쇄를 더 짧은 쇄로 내부에서 절단하며, 이는 온전한 셀룰로오스 쇄보다 엑소글루카나아제 활성에 대해 더 민감하다. 이들 엑소글루카나아제(예를 들어, 셀로바이오하이드롤라아제)는 환원성 단부 또는 비-환원성 단부에 대해 특이적이며, 대부분의 경우에 셀로바이오스(글루코스의 이량체)를 유리시킨다. 이어서, 축적되는 셀로바이오스에 셀로바이아제(예를 들어, β-1,4-글루코시다아제)에 의한 글루코스로의 절단을 적용한다. 셀룰로오스는 무수-글루코스만을 함유한다. 반면에, 헤미셀룰로오스는 다수의 상이한 당 단량체를 함유한다. 예를 들어, 글루코스 이외에, 헤미셀룰로오스 내의 당 단량체는 자일로스, 만노스, 갈락토스, 람노스, 및 아라비노스 또한 포함할 수 있다. 헤미셀룰로오스는 주로 D-펜토오스 당을 함유하며, 간혹 소량의 L-당을 함유한다. 자일로스는 전형적으로 가장 많은 양으로 존재하나, 마누론산 및 갈락투론산 또한 존재하는 경향이 있다. 헤미셀룰로오스는 자일란, 글루쿠로노자일란, 아라비노자일란, 글루코만난, 및 자일로글루칸을 포함한다.

본 개시의 조성물(예를 들어, 효소 및 다중-효소 조성물)은 셀룰로오스 재료(예를 들어, 글루칸) 및/또는 헤미셀룰로오스 재료(예를 들어, 자일란, 아라비노자일란, 및 자일란-함유 기질 또는 아라비노자일란-함유 기질)의 당화에 사용될 수 있다. 적합하게는, 효소 블렌드/조성물은 비-천연 조성물이다.

본 명세서에 제공된 효소 조성물은 자일란-가수분해 효소, 헤미셀룰로오스-가수분해 효소 및/또는 셀룰로오스-가수분해 효소의 혼합물을 포함할 수 있으며, 이는 글루카나아제; 셀로바이오하이드롤라아제; L-α-아라비노푸라노시다아제; 자일라나아제; β-글루코시다아제; 및 β-자일로시다아제를 포함하는, 하나 이상의 셀룰라아제, 몇몇 셀룰라아제, 또는 모든 셀룰라아제를 포함한다. 본 개시는 또한, 비-천연 조성물일 수 있는 효소 조성물을 제공한다. 본 명세서에 사용되는 바와 같이, 용어 "효소 조성물"은, (1) 발효 브로스 또는 부분적으로 또는 완전히 단리되거나 정제된 형태의 구성요소 효소를 조합함으로써 제조된 조성물; (2) 하나 이상의 구성요소 효소를 발현시키도록 개질된 유기체에 의해 생성된 조성물; (소정의 실시 형태에서는, 하나 이상의 구성요소 효소를 발현시키기 위해 사용되는 유기체는 하나 이상의 유전자가 결실되도록 개질될 수 있고; 소정의 다른 실시 형태에서는, 하나 이상의 구성요소 효소를 발현시키기 위해 사용되는 유기체는 자일란 가수분해, 헤미셀룰로오스 가수분해, 및/또는 셀룰로오스 가수분해에 영향을 미치는 단백질을 추가로 포함할 수 있음); (3) 당화 또는 발효 반응 중에 구성요소 효소를 동시에, 별도로, 또는 순차적으로 조합함으로써 제조된 조성물; (4) 예를 들어, 당화 또는 발효 반응 중에 원위치 생성된 효소 혼합물; (5) 상기 (1) 내지 (4) 중 임의의 것 또는 전부에 따라 생성된 조성물을 지칭한다.

본 명세서에 사용되는 바와 같이, 용어 "발효 브로스"는, 발효에 이어서 회수 및/또는 정제를 적용하지 않거나 최소로 적용하는, 발효에 의해 생성된 효소 제제를 지칭한다. 예를 들어, 미생물 배양물을 포화될 때까지 성장시켜, 단백질 합성(예를 들어, 효소의 발현)이 가능하도록 탄소-제한 조건 하에 인큐베이션한다. 이어서, 일단 효소(들)가 세포 배양 배지 내로 분비되면, 발효 브로스를 사용할 수 있다. 본 개시의 발효 브로스는 발효 종료시에 유도된 발효 재료의 분획화되지 않거나 분획화된 내용물을 함유할 수 있다. 예를 들어, 본 발명의 발효 브로스는 분획화되지 않으며, 미생물 세포(예를 들어, 사상 진균 세포)에 발효 공정이 적용된 후에 존재하는 소진된 배양 배지 및 세포 파편을 포함한다. 적합하게는, 발효 브로스는 소진된 세포 배양 배지, 세포외 효소, 및 생존하거나 살해된 미생물 세포를 함유할 수 있다. 대안적으로, 발효 브로스를 분획화하여 미생물 세포를 제거할 수 있다. 그러한 경우에, 발효 브로스는, 예를 들어, 소진된 세포 배양 배지 및 세포외 효소를 포함한다.

본 명세서에 제공된 셀룰라아제 조성물과 같은 효소 조성물은 칼코플루오르 어세이에 의해 결정할 때 0.1 이상(예를 들어 0.1 내지 0.4)의 산물 분율을 달성할 수 있다. 사용된 모든 화학물질은 분석용 등급이었다. 아비셀 PH-101은 FMC 바이오폴리머(FMC BioPolymer)(펜실베니아주 필라델피아 소재)로부터 구입하였다. 셀로바이오스 및 칼코플루오르 화이트는 시그마(Sigma)(미주리주 세인트루이스 소재)로부터 구입하였다. 인산으로 스웰링된 셀룰로오스(PASC: Phosphoric acid swollen cellulose)는 문헌[Walseth, TAPPI 1971, 35:228] 및 문헌[Wood, Biochem. J. 1971, 121:353-362]의 수정된 프로토콜을 사용하여 아비셀 PH-101로부터 제조하였다. 약술하면, 아비셀을 진한 인산에 가용화시킨 후에 차가운 탈이온수를 사용하여 침전시켰다. 셀룰로오스를 수집하고 추가의 물로 세척하여 pH를 중화시킨 후에, 그것을 50 mM 소듐 아세테이트(pH 5) 중의 1% 고체로 희석하였다. 모든 효소 희석은 50 mM 소듐 아세테이트 완충제(pH 5.0) 내로 실행하였다. GC220 셀룰라아제(다니스코 US 인코포레이티드(Danisco US Inc), 제넨코(Genencor))를 2.5, 5, 10, 및 15 mg 단백질/G PASC로 희석하여, 선형 보정 곡선을 생성시켰다. 보정 곡선의 범위 내에 들어오도록, 즉, 0.1 내지 0.4의 산물 분율의 응답을 얻도록, 시험할 샘플을 희석하였다. 96-웰 마이크로타이터 플레이트 내에서 150 ㎕의 차가운 1% PASC를 20 ㎕의 효소 용액에 첨가하였다. 플레이트를 덮고 이노바(Innova) 인큐베이터/진탕기 내에서 2 h 동안 50℃, 200 rpm에서 배양하였다. 100 mM 글리신(pH 10) 중의 50 μg/mL 칼코플루오르 100 ㎕로 반응을 켄칭(quenching)하였다. 형광 마이크로플레이트 판독기(몰리큘라 디바이시즈(Molecular Devices)의 스펙트라맥스(SpectraMax) M5) 상에서 여기 파장 Ex = 365 nm 및 방출 파장 Em = 435 nm로 형광을 판독하였다. 하기 수학식에 따라 결과를 산물 분율로서 표시한다:

FP = 1 - (Fl 샘플 - Fl 완충제 w/ 셀로바이오스)/(Fl 제로 효소 - Fl 완충제 w/셀로바이오스),

여기서 FP는 산물 분율이고, Fl = 형광 단위이다.

본 명세서에 구체적으로 기재된 효소 중 임의의 것을 본 명세서에 기재된 효소 중 임의의 하나 이상 또는 입수가능하고 적합한 임의의 다른 효소와 조합하여, 적합한 다중-효소 블렌드/조성물을 생성시킬 수 있다. 본 개시는 하기에 열거된 특정 예시적인 조합으로 한정되거나 제한되지 않는다.

예시적인 조성물

GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 비-천연 조성물이 제공된다. 본 발명은 또한, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 엔도글루카나아제 IV(예를 들어, T. 레세이 Eg4 폴리펩티드-보강된 전체 셀룰라아제)와 같은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드로 보강된 전체 셀룰라아제)를 포함하는 전체 셀룰라아제를 포함하는 비-천연 조성물을 제공한다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는, 본 명세서에 제공된 임의의 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드일 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 T. 레세이 Eg4 또는 그의 변종이다. T. 레세이 Eg4의 변종은 상기 제공된 변종 중 임의의 것일 수 있다.

도면을 포함하는 본 개시에서, 엔도글루카나아제는 "Eg" 또는 "Egl"이라고 본 명세서에서 호환적으로 지칭된다.

본 명세서에 사용되는 바와 같이, 용어 "천연 조성물"은, 하나 이상의 효소적 구성요소 또는 활성을 포함하는 천연 공급원에 의해 생성된 조성물을 지칭하며, 여기서 각각의 구성요소 또는 활성은, 그것이 인공적으로 개질되지 않은, 훼손되지 않은, 자연에서 발견되는 바와 같이 천연 공급원에 의해 생성되는 비율 및 수준으로 확인된다. 따라서 천연 조성물은, 구성요소 효소의 비율 또는 수준이 천연 유기체에 의해 그의 천연 환경에서 생성된 것으로부터 변경되지 않도록, 예를 들어, 셀룰로오스 분해효소 또는 헤미셀룰로오스 분해효소에 대해 개질되지 않은 유기체에 의해 생성된 것이다. 반면에, "비-천연 조성물"은, (1) 구성요소 셀룰로오스 분해효소 또는 헤미셀룰로오스 분해효소를 천연 비율 또는 비-천연(즉, 변경된) 비율로 조합하는 단계; 또는 (2) 하나 이상의 내인성 또는 외인성 효소를 발현시키거나, 과발현시키거나, 저발현시키도록 유기체를 개질하는 단계; 또는 (3) 하나 이상의 내인성 효소가 결실되도록 유기체를 개질하는 단계에 의해 생성된 조성물을 지칭한다. "비-천연 조성물"은 또한, 천연의 개질되지 않은 유기체이지만 조성물 내의 효소의 양이 그의 천연 서식지에서 성장한 천연 유기체에 의해 제조된 조성물 내에 존재하는 것과는 상이하도록, 유기체의 천연 환경과는 상이한 인공 배지 또는 환경에서 배양된 유기체에 의해 생성된 조성물을 지칭한다.

GH61 엔도글루카나아제 폴리펩티드 또는 그의 변종 중 어느 하나를 본 명세서에 기재된 조성물 중 임의의 것에 사용할 수 있다. 적합한 GH61 엔도글루카나아제는 본 개시의 도1에 나타낸 폴리펩티드 중 하나를 포함할 수 있다. 적합한 GH61 엔도글루카나아제는 그들의 젠뱅크 등록 번호 CAB97283.2, CAD70347.1, CAD21296.1, CAE81966.1, CAF05857.1, EAA26873.1, EAA29132.1, EAA30263.1, EAA33178.1, EAA33408.1, EAA34466.1, EAA36362.1, EAA29018.1, 및 EAA29347.1로 표시되는 것들, 또는 S. 테르모필리움 24630으로부터의 St61, S. 테르모필리움 23839c로부터의 St61A, S. 테르모필리움 46583으로부터의 St61B, S. 테르모필리움 80312로부터의 St61D, A. 푸미가투스 Afu3g03870으로부터의 Afu61a(NCBI Ref: XP_748707), A. 푸미가투스 Afu6g09540으로부터의 NCBI Ref: XP_750843.1의 엔도글루카나아제, A. 푸미가투스 EDP47167의 엔도글루카나아제, T. 테레스트리스 16380의 엔도글루카나아제, T. 테레스트리스 155418의 엔도글루카나아제, T. 테레스트리스 68900의 엔도글루카나아제, C. 글로보섬으로부터의 Cg61A(EAQ86340.1), T. 레세이 Eg7, T. 레세이 Eg4, 및 A. 푸미가투스 Af293으로부터의 젠뱅크 등록: XP_752040을 가진 엔도글루카나아제를 포함한다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 단리된 폴리펩티드)는 GH61 엔도글루카나아제 또는 EG IV의 변종이다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는 서열 번호 1 내지 29 및 148 중 어느 하나를 포함하는 것, 또는 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 동일성을 갖는 폴리펩티드를 포함하는 것이다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는 서열 번호 84 내지 91로부터 선택된 하나 이상의 모티프(2, 3, 4, 5, 6, 7, 또는 8 중 임의의 것 이상)를 포함할 수 있다. 그것은, (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 85, 88, 및 89; (7) 서열 번호 84, 88, 및 90; (8) 서열 번호 85, 88, 및 90; (9) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91: 및 (14) 서열 번호 85, 88, 90, 및 91로 구성된 군으로부터 선택된 하나 이상의 서열 모티프(들)를 포함할 수 있다.

본 명세서에 기재된 조성물 또는 방법 중 어느 하나의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(GH61 엔도글루카나아제의 변종을 포함함)는 서열 번호 27의 잔기 22 내지 344에 대해 약 60% 이상(예를 들어, 약 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 92.5%, 95%, 96%, 97%, 98%, 또는 99% 중 임의의 것 이상)의 서열 동일성을 가질 수 있다. 일부 태양에서, 폴리펩티드 또는 그의 변종은, 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232 중 약 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 또는 12개 중 임의의 것 이상)에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 H22, D61, G63, C77, H107, R177, E179, H184, Q193, C198, Y195, 및 Y232에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은, 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343 중 5개 이상의 잔기(예를 들어, 약 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개 중 임의의 것 이상)에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 서열 번호 27의 G313, Q314, C315, G316, G317, S321, G322, P323, T324, C326, A327, T331, C332, N336, Y338, Y339, Q341, C342, 및 L343에 상응하는 잔기를 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 CBM 도메인(예를 들어, 작용성 CBM 도메인)을 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 촉매 도메인(예를 들어, 작용성 촉매 도메인)을 포함한다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 단리된다. 일부 태양에서, 폴리펩티드 또는 그의 변종은 엔도글루카나아제 활성을 갖는다.

일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 엔도글루카나아제 IV, 예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종이다. 예를 들어, 본 개시는 T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 비-천연 조성물을 제공한다. T. 레세이 Eg4 폴리펩티드의 변종은 본 명세서에 기재된 T. 레세이 Eg4 폴리펩티드의 변종 중 어느 하나일 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 서열 번호 27의 아미노산 서열 또는 서열 번호 27의 잔기 22 내지 344를 포함한다.

일부 태양에는, 글리코실 하이드롤라아제 패밀리 61("GH61")/ 엔도글루카나아제 활성(예를 들어, T. 레세이 Eg4 또는 그의 변종)을 갖는 단리된(또는 실질적으로 정제된) 폴리펩티드를 포함하는 조성물이 제공된다. 폴리펩티드를 생성시키고, 폴리펩티드를 회수하고, 폴리펩티드를 단리하거나 정제하는 방법은 당업자에게 공지되어 있다.

본 명세서에 기재된 조성물 또는 방법 중 임의의 것의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 숙주 세포로부터 발현되며, 여기서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 핵산이 숙주 세포 내로 조작되어 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 발현시키는 숙주 세포에 대해 이종성이다.

본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드, 또는 그의 혼합물을 포함하는 조성물을 제공한다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 셀룰라아제 폴리펩티드(들)를 포함한다. 일부 태양에서, 셀룰라아제 폴리펩티드는 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드, 또는 β-글루코시다아제 활성을 갖는 폴리펩티드이다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 헤미셀룰라아제 폴리펩티드(들)를 포함한다. 일부 태양에서, 헤미셀룰라아제 폴리펩티드는 자일라나아제 활성을 갖는 폴리펩티드, β-자일로시다아제 활성을 갖는 폴리펩티드, 또는 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드이다. 일부 태양에서, 조성물은 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 셀룰라아제 폴리펩티드(들) 및 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 또는 8개 이상)의 헤미셀룰라아제 폴리펩티드(들)를 추가로 포함한다. 본 명세서에 제공된 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 제공된다.

본 개시의 방법 및 조성물에 따라 사용하기 위한 셀룰라아제 및 헤미셀룰라아제는, 특히, 하기의 유기체 중 하나 이상으로부터 얻어지거나 재조합에 의해 생성될 수 있다: 크리니펠리스 스카펠라(Crinipellis scapella), 마크로포미나 파세올리나(Macrophomina phaseolina), 마이셀리오프토라 테르모필라, 소르다리아 피미콜라(Sordaria fimicola), 볼루텔라 콜레토트리코이데스(Volutella colletotrichoides), 티엘라비아 테레스트리스, 아크레모니움 종, 엑시디아 글란둘로사(Exidia glandulosa), 포메스 포멘타리우스(Fomes fomentarius), 스폰지펠리스 종(Spongipellis sp.), 리조플릭티스 로제아(Rhizophlyctis rosea), 리조무코르 푸실루스(Rhizomucor pusillus), 파이코마이세스 니테우스(Phycomyces niteus), 케토스틸룸 프레세니(Chaetostylum fresenii), 디플로디아 고시피나(Diplodia gossypina), 울로스포라 빌그라미(Ulospora bilgramii), 사코볼루스 딜루텔루스(Saccobolus dilutellus), 페니실리움 베루쿨로섬(Penicillium verruculosum), 페니실리움 크리소제눔(Penicillium chrysogenum), 테르모마이세스 베루코수스(Thermomyces verrucosus), 디아포르테 신제네시아(Diaporthe syngenesia), 콜레토트리쿰 라게나리움(Colletotrichum lagenarium), 니그로스포라 종(Nigrospora sp.), 자일라리아 하이포자일론(Xylaria hypoxylon), 넥트리아 피네아(Nectria pinea), 소르다리아 마크로스포라(Sordaria macrospora), 티엘라비아 테르모필라(Thielavia thermophila), 케토미움 모로룸(Chaetomium mororum), 케토미움 비르센스(Chaetomium virscens), 케토미움 브라질리엔시스(Chaetomium brasiliensis), 케토미움 쿠니콜로룸(Chaetomium cunicolorum), 시스파스토스포라 보니넨시스(Syspastospora boninensis), 클라도리눔 포에쿤디시뭄(Cladorrhinum foecundissimum), 사이탈리디움 테르모필라(Scytalidium thermophila), 글리오클라디움 카테눌라툼(Gliocladium catenulatum), 푸사리움 옥시스포룸 아종 리코페르시시(Fusarium oxysporum ssp. lycopersici), 푸사리움 옥시스포룸 아종 파시플로라(Fusarium oxysporum ssp. passiflora), 푸사리움 솔라니(Fusarium solani), 푸사리움 안구이오이데스(Fusarium anguioides), 푸사리움 포에(Fusarium poae), 휴미콜라 니그레센스(Humicola nigrescens), 휴미콜라 그리세아(Humicola grisea), 파네올루스 레티루기스(Panaeolus retirugis), 트라메테스 산구이네아(Trametes sanguinea), 스키조필룸 코무네(Schizophyllum commune), 트리코테시움 로제움(Trichothecium roseum), 마이크로스페롭시스 종(Microsphaeropsis sp.), 악소볼루스 스틱토이데우스 spej.(Acsobolus stictoideus spej.), 포로니아 푼크타타(Poronia punctata), 노둘리스포룸 종(Nodulisporum sp.), 트리코더마 종(예를 들어, 트리코더마 레세이), 및 실린드로카르폰 종(Cylindrocarpon sp.).

본 개시에서, 셀룰라아제 또는 헤미셀룰라아제는 셀룰로오스계 재료를 가수분해할 수 있는 효소의 발현을 유발하는 임의의 공지 미생물 발효 방법(들)으로부터 제조될 수 있다. 발효는 진탕 플라스크 배양, 소규모 또는 대규모 발효, 예를 들어, 셀룰라아제가 발현되거나 단리되는 것을 가능하게 하는 조건 하에 적합한 배지 내에서 수행되는, 실험실용 또는 산업용 발효기 내에서의 연속식, 회분식, 유가식, 또는 고체 상태 발효를 포함할 수 있다. 일반적으로, 미생물은 셀룰로오스계 재료를 가수분해할 수 있는 효소의 생성에 적합한 세포 배양 배지 내에서 배양된다. 배양은 탄소 및 질소 공급원, 및 무기 염류를 포함하는 적합한 영양 배지 내에서 당업계에 공지된 절차를 사용하여 이루어진다. 적합한 배양 배지, 온도 범위, 및 성장 및 셀룰라아제 생성에 적합한 다른 조건은 당업계에 공지되어 있다. 비제한적인 예로서, T. 레세이에 의한 셀룰라아제의 생성을 위한 통상의 온도 범위는 24℃ 내지 28℃이다.

본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 엔도글루카나아제 IV 폴리펩티드)를 포함하는 비-천연 조성물을 제공하며, 여기서 조성물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 엔도글루카나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 셀로바이오하이드롤라아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-글루코시다아제)(예를 들어, β-글루코시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 자일라나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-자일로시다아제)(예를 들어, β-자일로시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 및/또는 아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제)(예를 들어, L-α-아라비노푸라노시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드)를 추가로 포함한다. 본 명세서에 제공된 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 제공된다.

본 개시는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, 예를 들어 T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 엔도글루카나아제 IV 폴리펩티드로 보강된 전체 셀룰라아제)를 포함하는 전체 셀룰라아제를 포함하는 비-천연 조성물을 제공하며, 여기서 조성물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 엔도글루카나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 셀로바이오하이드롤라아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-글루코시다아제)(예를 들어, β-글루코시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 자일라나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-자일로시다아제)(예를 들어, β-자일로시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 및/또는 아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제)(예를 들어, L-α-아라비노푸라노시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드)를 추가로 포함한다. 본 명세서에 제공된 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 제공된다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함한다. 일부 태양에서, 자일라나아제 활성을 갖는 폴리펩티드는 T. 레세이 Xyn3이다. 조성물은 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, 및/또는 Tn3B)를 추가로 포함할 수 있다. 조성물은 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 및/또는 그의 변종)를 추가로 포함할 수 있다. 조성물은 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 추가로 포함할 수 있다. 조성물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 EG1(또는 그의 변종) 및/또는 T. 레세이 EG2(또는 그의 변종))를 추가로 포함할 수 있다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함한다. 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(또는 2개 이상의 폴리펩티드)(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함할 수 있으며, 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(또는 2개 이상의 폴리펩티드)(예를 들어, T. 레세이 EG1(또는 그의 변종) 및/또는 T. 레세이 EG2(또는 그의 변종))를 추가로 포함한다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(또는 2개 이상의 폴리펩티드)(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, 및/또는 T. 레세이 Bxl1)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(또는 2개 이상의 폴리펩티드)(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 및/또는 그의 변종)를 포함할 수 있다. 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(2개 이상의 폴리펩티드)(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함할 수 있다.

일부 태양에서, 본 명세서에 기재된 폴리펩티드 중 임의의 것(예를 들어, 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드, 글루코시다아제 활성을 갖는 폴리펩티드(예를 들어, β-글루코시다아제), 자일라나아제 활성을 갖는 폴리펩티드, 자일로시다아제 활성을 갖는 폴리펩티드(예를 들어, β-자일로시다아제), 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제))은 본 명세서에 기재된 전체 셀룰라아제와 같은 전체 셀룰라아제의 구성요소일 수 있다. 본 명세서에 기재된 폴리펩티드 중 임의의 것은 상응하는 폴리펩티드(들)를 암호화하는 내인성 또는 외인성 유전자를 발현시킴으로써 생성시킬 수 있다. 일부 상황에서, 폴리펩티드(들)는 과발현되거나 저발현될 수 있다.

상기 조성물 중 임의 것에 관하여, 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 제공된다.

엔도글루카나아제 활성을 갖는 폴리펩티드

엔도글루카나아제 활성을 갖는 폴리펩티드는 내부 β-1,4 결합의 절단을 촉매하는 폴리펩티드를 포함한다. 엔도글루카나아제("EG")는 EC 3.2.1.4로 분류되는 셀룰라아제 효소의 군을 지칭한다. EG 효소는 셀룰로오스의 내부 베타-1,4 글루코시드 결합을 가수분해한다. EG는 셀룰로오스, 셀룰로오스 유도체(예를 들어, 카르복시 메틸 셀룰로오스), 리케닌의 1,4-베타-D-글리코시드 결합, 시리얼(cereal) 베타-D-글루칸 또는 자일로글루칸과 같은 혼합 베타-1,3 글루칸, 및 셀룰로오스계 구성요소를 함유하는 다른 식물 재료의 베타-1,4 결합의 내부가수분해(endohydrolysis)를 촉매한다. 문헌[Ghose, 1987, Pure and Appl. Chem. 59: 257-268]의 절차에 따라 카르복시메틸 셀룰로오스(CMC) 가수분해를 사용하여 EG 활성을 결정할 수 있다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 EG1(젠뱅크 등록 번호 HM641862.1) 및/또는 T. 레세이 EG2 폴리펩티드(젠뱅크 등록 번호 ABA64553.1)를 포함한다.

다른 예에서는, 열안정성 T. 테레스트리스 엔도글루카나아제(Kvesitadaze et al., Applied Biochem. Biotech. 1995, 50:137-143)를 본 개시의 방법 및 조성물에 사용한다. 그밖에, T. 레세이 EG3(젠뱅크 등록 번호 AAA34213.1)(Okada et al. Appl. Environ. Microbiol. 1988, 64:555-563), EG5(젠뱅크 등록 번호 AAP57754)(Saloheimo et al. Molecular Microbiology 1994, 13:219-228), EG6(도 89a)(미국 특허 공개 제20070213249호), 또는 EG7(젠뱅크 등록 번호 AAP57753)(미국 특허 공개 제20090170181호), A. 셀룰로라이티쿠스(A. cellulolyticus) EI 엔도글루카나아제(스위스-프롯(Swiss-Prot) 엔트리 P54583.1)(미국 특허 제5,536,655호), H. 인솔렌스 엔도글루카나아제 V(EGV)(프로틴 데이터 뱅크 엔트리 4ENG), S. 코코스포룸 엔도글루카나아제(도 89b)(미국 특허 공개 제20070111278호), A.아쿨레아투스(A. aculeatus) 엔도글루카나아제 F1-CMC(스위스-프롯 엔트리 P22669.1)(Ooi et al. Nucleic Acid Res. 1990, 18:5884), A. 카와치(A. kawachii) IFO 4308 엔도글루카나아제 CMCase-1(스위스-프롯 엔트리 Q96WQ8.1)(Sakamoto et al. Curr. Genet. 1995, 27:435-439), E. 카로토바라 엔도글루카나아제 CelS(젠뱅크 등록 번호 AAA24817.1)(Saarilahti et al. Gene 1990, 90:9-14); 또는 A. 테르모필룸(A. thermophilum) ALKO4245 엔도글루카나아제(미국 특허 공개 제20070148732호) 또한 사용할 수 있다. 부가적인 적합한 엔도글루카나아제는 예를 들어, 제WO 91/17243호, 제WO 91/17244호, 제WO 91/10732호, 미국 특허 제6,001,639호에 기재되어 있다. 엔도글루카나아제 활성을 갖는 폴리펩티드는 본 명세서에 제공된 엔도글루카나아제 중 어느 하나의 변종일 수 있다.

셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드

셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 1,4-D-글루칸 셀로바이오하이드롤라아제(E.C. 3.2.1.91) 활성을 갖는 폴리펩티드를 포함하며, 이는 셀룰로오스, 셀로테트리오스, 또는 임의의 베타-1,4-결합 글루코스 함유 중합체의 1,4-베타-D-글루코시드 결합의 가수분해를 촉매하여 쇄의 단부로부터 셀로바이오스를 방출한다. 본 발명의 목적상, 셀로바이오하이드롤라아제 활성은, 문헌[Lever et al., 1972, Anal. Biochem. 47: 273-279]의 PHBAH 방법에 의해 측정되는 바와 같이 셀룰로오스로부터의 수용성 환원당의 방출에 의해 결정될 수 있다. 카르복시메틸 셀룰로오스 또는 하이드록시에틸 셀룰로오스와 같은 치환된 셀룰로오스로부터의 환원당 방출의 유사한 측정에 의해, 셀로바이오하이드롤라아제의 엑소글루카나아제 공격 모드와 엔도글루카나아제 공격 모드를 구별할 수 있다(Ghose, 1987, Pure & Appl. Chem. 59: 257-268). 진정한 셀로바이오하이드롤라아제는, 비치환된 셀룰로오스 대 치환된 셀룰로오스에 대한 활성의 비율이 매우 높을 것이다(Bailey et al, 1993, Biotechnol. Appl. Biochem. 17: 65-76).

적합한 CBH는, A. 비스포루스(A. bisporus) CBH1(스위스 프롯 등록 번호 Q92400), A. 아쿨레아투스 CBH1(스위스 프롯 등록 번호 O59843), A. 니둘란스(A. nidulans) CBHA(젠뱅크 등록 번호 AF420019) 또는 CBHB(젠뱅크 등록 번호 AF420020), A.니게르 CBHA(젠뱅크 등록 번호 AF156268) 또는 CBHB(젠뱅크 등록 번호 AF156269), C. 푸르푸레아(C. purpurea) CBH1(스위스 프롯 등록 번호 O00082), C. 카르보나룸(C. carbonarum) CBH1(스위스 프롯 등록 번호 Q00328), C. 파라시티카(C. parasitica) CBH1(스위스 프롯 등록 번호 Q00548), F. 옥시스포룸(F. oxysporum) CBH1(Cel7A)(스위스 프롯 등록 번호 P46238), H. 그리세아(H. grisea) CBH1.2(젠뱅크 등록 번호 U50594), H. 그리세아 변종 테르모이데아(H.grisea var. thermoidea) CBH1(젠뱅크 등록 번호 D63515), CBHI.2(젠뱅크 등록 번호 AF123441), 또는 exo1(젠뱅크 등록 번호 AB003105), M. 알보마이세스(M. albomyces) Cel7B(젠뱅크 등록 번호 AJ515705), N. 크라사(N. crassa) CBHI(젠뱅크 등록 번호 X77778), P. 푸니쿨로섬(P. funiculosum) CBHI(Cel7A)(젠뱅크 등록 번호 AJ312295)(미국 특허 공개 제20070148730), P. 잔티넬룸(P. janthinellum) CBHI(젠뱅크 등록 번호 S56178), P.크리소스포리움 CBH(젠뱅크 등록 번호 M22220), 또는 CBHI-2(Cel7D)(젠뱅크 등록 번호 L22656), T. 에메르소니(T. emersonii) CBH1A(젠뱅크 등록 번호 AF439935), T. 비리데(T. viride) CBH1(젠뱅크 등록 번호 X53931), 또는 V. 볼바세아(V. volvacea) V14 CBH1(젠뱅크 등록 번호 AF156693)로부터 선택될 수 있다. 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 본 명세서에 제공된 CBH 중 어느 하나의 변종일 수 있다.

일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 CBH 1(스위스-프롯 엔트리 P62694.1)(또는 그의 변종) 및/또는 T. 레세이 CBH2(스위스-프롯 엔트리 P07987.1)(또는 그의 변종) 폴리펩티드를 포함한다. 문헌[Shoemaker et al. Bio/Technology 1983, 1:691-696]을 참조하고; 또한 문헌[Teeri et al. Bio/Technology 1983, 1:696-699], A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B(이들은 T. 레세이 CBH1의 상동체임); T. 테레스트리스 6A, S. 테르모필레 6A, 6B(이들은 T. 레세이 CBH2의 상동체임), 또는 그의 변종을 참조한다.

글루코시다아제 활성을 갖는 폴리펩티드

글루코시다아제 활성을 갖는 폴리펩티드는 베타-D-글루코사이드 글루코하이드롤라아제(E.C. 3.2.1.21) 활성을 갖는 폴리펩티드를 포함하며, 이는 베타-D-글루코스의 방출을 동반하여 셀로바이오스의 가수분해를 촉매한다. 본 발명의 목적상, 당업계에 공지된 방법, 예를 들어, HPLC에 의해 β-글루코시다아제 활성을 측정할 수 있다. 글루코시다아제 활성을 갖는 폴리펩티드는 GH 패밀리 1, 3, 9, 또는 48의 구성원을 제한 없이 포함하는 소정의 GH 패밀리의 구성원을 포함하며, 이는 셀로바이오스의 가수분해를 촉매하여 β-D-글루코스를 방출한다. 글루코시다아제 활성을 갖는 폴리펩티드는, 재조합 수단에 의해 다수의 미생물로부터 얻어지거나 상업적 공급원으로부터 구입한 β-글루코시다아제와 같은 β-글루코시다아제를 포함한다. 미생물로부터의 β-글루코시다아제의 예는, 박테리아 및 진균으로부터 얻어진 것들을 제한 없이 포함한다. 예를 들어, 적합하게는, β-글루코시다아제는 사상 진균으로부터 얻어진다. 일부 태양에서, 글루코시다아제 활성(예를 들어, β-글루코시다아제 활성)을 갖는 하나 이상의 폴리펩티드는 T. 레세이 Bgl1 폴리펩티드이다.

β-글루코시다아제는, 특히, A. 아쿨레아투스(Kawaguchi et al . Gene 1996, 173: 287-288), A. 카와치(Iwashita et al . Appl. Environ. Microbiol. 1999, 65: 5546-5553), A. 오리제(제WO 2002/095014호), C. 비아조테아(C. biazotea)(Wong et al. Gene, 1998, 207:79-86), P. 푸니쿨로섬(제WO 2004/078919호), S. 피불리게라(S. fibuligera)(Machida et al. Appl. Environ. Microbiol. 1988, 54: 3147-3155), S. 폼베(Wood et al. Nature 2002, 415: 871-880), 또는 T. 레세이(예를 들어, β-글루코시다아제 1(미국 특허 제6,022,725호), β-글루코시다아제 3(미국 특허 제6,982,159호), β- 글루코시다아제 4(미국 특허 제7,045,332호), β-글루코시다아제 5(미국 특허 제7,005,289호), β-글루코시다아제 6(미국 특허 공개 제20060258554호), β-글루코시다아제 7(미국 특허 공개 제20060258554호))로부터 얻어지거나 재조합에 의해 생성될 수 있다. β-글루코시다아제 활성을 갖는 폴리펩티드는 본 명세서에 제공된 β-글루코시다아제 중 어느 하나의 변종일 수 있다.

β-글루코시다아제를 암호화하는 내인성 또는 외인성 유전자를 발현시킴으로써 β-글루코시다아제를 생성시킬 수 있다. 예를 들어, β-글루코시다아제는, 예를 들어, 그램-양성 유기체(예를 들어, 바실러스 또는 악티노마이세테스(Actinomycetes)), 또는 진핵 숙주(예를 들어, 트리코더마, 아스페르길루스, 사카로마이세스, 또는 피치아)에 의해 세포외 공간 내로 분비될 수 있다. 일부 상황에서, β-글루코시다아제는 과발현되거나 저발현될 수 있다.

또한, β-글루코시다아제는 상업적 공급원으로부터 얻을 수 있다. 사용하기에 적합한 상업적 β-글루코시다아제 제제의 예는, 예를 들어, 악셀러라아제(Accellerase)(등록상표) BG(다니스코 US 인코포레이티드, 제넨코) 중의 T. 레세이 β-글루코시다아제; 노보자임(NOVOZYM)(상표) 188(A. 니게르로부터의 β-글루코시다아제); 메가자임(Megazyme)(아일랜드 소재의 메가자임 인터내셔날 아일랜드 리미티드(Megazyme International Ireland Ltd.))으로부터의 아그로박테리움 종(Agrobacterium sp.) β-글루코시다아제, 및 T. 마리티마(T. maritima) β-글루코시다아제를 포함한다.

β-글루코시다아제 활성은, 문헌[Chen et al., Biochimica et Biophysica Acta 1992, 121:54-60]에 의해 기재된 어세이와 같은 당업계에 공지된 다수의 적합한 수단에 의해 결정될 수 있으며, 여기서 1 pNPG는 50℃(122℉) 및 pH 4.8에서 4-니트로페닐-β-D-글루코피라노시드로부터 10 min 후에 유리된 1 ㎛oL의 니트로페놀을 의미한다.

자일라나아제 활성을 갖는 폴리펩티드

자일라나아제 활성은, 비색 아조-버치우드 자일란 어세이(azo-birchwood xylan assay)(S-AXBL, 아일랜드 소재의 메가자임 인터내셔날 아일랜드 리미티드)를 사용함으로써 측정할 수 있다.

자일라나아제 활성을 갖는 폴리펩티드는, 예를 들어, Xyn, Xyn2, AfuXyn2, 및/또는 AfuXyn5 폴리펩티드, 또는 그의 변종으로부터 선택된 제 A군 자일라나아제(Group A xylanase)를 포함할 수 있다.

본 명세서에 기재된 조성물 중 임의의 것은, 하나 이상의 제A군 자일라나아제에 부가하여, 또는 그 대신에, 하나 이상의 자일라나아제를 임의로 포함할 수 있다. 부가적인 하나 이상의 자일라나아제로서 임의의 자일라나아제(EC 3.2.1.8)를 사용할 수 있다. 적합한 자일라나아제는, 예를 들어, C. 사카로라이티쿰(C. saccharolyticum) 자일라나아제(Luthi et al. 1990, Appl. Environ. Microbiol. 56(9):2677-2683), T. 마리티마 자일라나아제(Winterhalter & Liebel, 1995, Appl. Environ. Microbiol. 61(5):1810-1815), 테르마토가 종(Thermatoga Sp.) 균주 FJSS-B.1 자일라나아제(Simpson et al. 1991, Biochem. J. 277, 413-417), B. 서큘란스(B. circulans) 자일라나아제(BcX)(미국 특허 제5,405,769호), A. 니게르 자일라나아제(Kinoshita et al. 1995, Journal of Fermentation and Bioengineering 79(5):422-428), S.리비단스 자일라나아제(Shareck et al. 1991, Gene 107:75-82; Morosoli et al. 1986 Biochem. J. 239:587-592; Kluepfel et al. 1990, Biochem. J. 287:45-50), B. 서브틸리스 자일라나아제(Bernier et al. 1983, Gene 26(1):59-65), C. 피미(C. fimi) 자일라나아제(Clarke et al., 1996, FEMS Microbiology Letters 139:27-35), P. 플루오레센스(P. fluorescens) 자일라나아제(Gilbert et al. 1988, Journal of General Microbiology 134:3239-3247), C. 테르모셀룸(C. thermocellum) 자일라나아제(Dominguez et al., 1995, Nature Structural Biology 2:569-576), B. 푸밀루스(B. pumilus) 자일라나아제(Nuyens et al. Applied Microbiology and Biotechnology 2001, 56:431-434; Yang et al. 1998, Nucleic Acids Res. 16(14B):7187), C. 아세토부틸리쿰(C. acetobutylicum) P262 자일라나아제(Zappe et al. 1990, Nucleic Acids Res. 18(8):2179), 또는 T. 하르지아눔(T. harzianum) 자일라나아제(Rose et al. 1987, J. Mol. Biol.194(4):755-756)를 포함한다. 자일라나아제 활성을 갖는 폴리펩티드는 본 명세서에 제공된 자일라나아제 중 어느 하나의 변종일 수 있다.

자일로시다아제(예를 들어, β-자일로시다아제) 활성을 갖는 폴리펩티드

자일로시다아제(예를 들어, β-자일로시다아제) 활성은, 발색성 기질 4-니트로페닐 베타-D-자일로피라노시드(pNPX, 시그마-알드리치(Sigma-Aldrich) N2132)를 사용함으로써 측정할 수 있다.

자일로시다아제(예를 들어, β-자일로시다아제) 활성을 갖는 폴리펩티드는 제1군 β-자일로시다아제 효소(예를 들어, Fv3A 또는 Fv43A) 또는 제2군 β-자일로시다아제 효소(예를 들어, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)일 수 있다. 일부 태양에서, 적합하게는, 본 명세서에 제공된 조성물 중 임의의 것은 하나 이상의 제1군 β-자일로시다아제 및 하나 이상의 제2군 β-자일로시다아제를 포함할 수 있다.

본 개시의 효소 블렌드/조성물과 같은, 본 명세서에 제공된 조성물 중 임의의 것은 상기 제1군 및/또는 제2군 β-자일로시다아제에 부가하여, 또는 그 대신에, 하나 이상의 β-자일로시다아제를 임의로 포함할 수 있다. 부가적인 β-자일로시다아제로서 임의의 β-자일로시다아제(EC 3.2.1.37)를 사용할 수 있다. 적합한 β-자일로시다아제는, 예를 들어, T. 에메르소니 Bxl1(Reen et al. 2003, Biochem Biophys Res Commun. 305(3):579-85), G. 스테아로테르모필루스 β-자일로시다아제(Shallom et al. 2005, Biochemistry 44:387-397), S. 테르모필리움 β-자일로시다아제(Zanoelo et al. 2004, J. Ind. Microbiol. Biotechnol. 31:170-176), T. 리그노룸(T. lignorum) β-자일로시다아제(Schmidt, 1998, Methods Enzymol. 160:662-671), A. 아와모리(A. awamori) β-자일로시다아제(Kurakake et al. 2005, Biochim. Biophys. Acta 1726:272-279), A. 베르시콜로르(A. versicolor) β-자일로시다아제(Andrade et al. 2004, Process Biochem. 39:1931-1938), 스트렙토마이세스 종 β-자일로시다아제(Pinphanichakarn et al. 2004, World J. Microbiol. Biotechnol. 20:727-733), T. 마리티마 β-자일로시다아제(Xue and Shao, 2004, Biotechnol. Lett. 26:1511-1515), 트리코더마 종 SY β-자일로시다아제(Kim et al. 2004, J. Microbiol. Biotechnol. 14:643-645), A. 니게르 β-자일로시다아제(Oguntimein and Reilly, 1980, Biotechnol. Bioeng. 22:1143-1154), 또는 P. 워트만니(P. wortmanni) β-자일로시다아제(Matsuo et al. 1987, Agric. Biol. Chem. 51:2367-2379)를 포함한다. 자일로시다아제(예를 들어, β-자일로시다아제) 활성을 갖는 폴리펩티드는 본 명세서에 제공된 자일로시다아제 중 어느 하나의 변종일 수 있다.

아라비노푸라노시다아제 활성은, 발색성 기질 4-니트로페닐 알파-L-아라비노푸라노시드(pNPA, 시그마-알드리치 N3641)에 의해 측정될 수 있다.

본 개시의 효소 블렌드/ 조성물과 같은, 본 명세서에 제공된 조성물 중 어느 하나는, 예를 들어 적합하게는, 아라비노푸라노시다아제 활성(예를 들어, L-α-아라비노푸라노시다아제 활성)을 갖는 하나 이상의 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제)를 포함할 수 있다. L-α-아라비노푸라노시다아제는, 예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종일 수 있다.

본 개시의 효소 블렌드/조성물은, 전술한 L-α-아라비노푸라노시다아제에 부가하여, 또는 그 대신에, 하나 이상의 L-α-아라비노푸라노시다아제를 임의로 포함할 수 있다. 부가적인 L-α-아라비노푸라노시다아제로서 임의의 적합한 유기체로부터의 L-α-아라비노푸라노시다아제(EC 3.2.1.55)를 사용할 수 있다. 적합한 L-α-아라비노푸라노시다아제는, 예를 들어, A. 오리제(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), A. 소제(A. sojae)(Oshima et al. J. Appl. Glycosci. 2005, 52:261-265), B. 브레비스(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), B. 스테아로테르모필루스(B. stearothermophilus)(Kim et al., J. Microbiol. Biotechnol. 2004, 14:474-482), B. 브레베(B. breve)(Shin et al., Appl. Environ. Microbiol. 2003, 69:7116-7123), B. 론굼(B. longum)(Margolles et al., Appl. Environ. Microbiol. 2003, 69:5096-5103), C. 테르모셀룸(Taylor et al., Biochem. J. 2006, 395:31-37), F. 옥시스포룸(Panagiotou et al., Can. J. Microbiol. 2003, 49:639-644), F. 옥시스포룸 f. 종 디안티(F. oxysporum f. sp. dianthi)(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), G. 스테아로테르모필루스(G. stearothermophilus) T-6(Shallom et al., J. Biol. Chem. 2002, 277:43667-43673), H. 불가레(H. vulgare)(Lee et al., J. Biol. Chem. 2003, 278:5377-5387), P. 크리소제눔(P. chrysogenum)(Sakamoto et al., Biophys. Acta 2003, 1621:204-210), 페니실리움 종(Rahman et al., Can. J. Microbiol. 2003, 49:58-64), P. 셀룰로사(P. cellulosa)(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), R. 푸실루스(R. pusillus)(Rahman et al., Carbohydr. Res. 2003, 338:1469-1476), S. 카르트레우시스(S. chartreusis), S. 테르모비올라쿠스(S. thermoviolacus), T. 에탄올리쿠스(T. ethanolicus), T. 자일라닐리티쿠스(T. xylanilyticus)(Numan & Bhosle, J. Ind. Microbiol. Biotechnol. 2006, 33:247-260), T. 푸스카(T. fusca)(Tuncer and Ball, Folia Microbiol. 2003, (Praha) 48:168-172), T. 마리티마(Miyazaki, Extremophiles 2005, 9:399-406), 트리코더마 종 SY (Jung et al. Agric. Chem. Biotechnol. 2005, 48:7-10), A. 카와치(Koseki et al., Biochim. Biophys. Acta 2006, 1760:1458-1464), F. 옥시스포룸 f. 종 디안티(Chacon-Martinez et al., Physiol.Mol. Plant Pathol. 2004,64:201-208), T. 자일라닐리티쿠스 (Debeche et al., Protein Eng. 2002, 15:21-28), H. 인솔렌스(H. insolens), M. 기간테우스(M. giganteus)(Sorensen et al., Biotechnol. Prog. 2007, 23:100-107), 또는 R. 사티부스(R. sativus)(Kotake et al. J. Exp. Bot. 2006, 57:2353-2362)의 L-α-아라비노푸라노시다아제를 포함한다. 아라비노푸라노시다아제 활성을 갖는 폴리펩티드는, 본 명세서에 기재된 아라비노푸라노시다아제 중 어느 하나의 변종일 수 있다.

본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 EG1(또는 그의 변종) 및/또는 T. 레세이 EG2(또는 그의 변종)를 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, 셀로바이오하이드롤라아제("CBH") 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종을 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, 및/또는 Tn3B를 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 및/또는 그의 변종을 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, 및/또는 AfuXyn5를 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드는 T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 및/또는 그의 변종을 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드는 제1군 β-자일로시다아제 또는 제2군 β-자일로시다아제이며, 여기서 제1군 β-자일로시다아제는 Fv3A, Fv43A, 또는 그의 변종을 포함하고, 제2군 β-자일로시다아제는 Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종을 포함한다. 일부 태양에서, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드는 F. 베르티실리오이데스(F. verticillioides) Fv3A, F. 베르티실리오이데스 Fv43D, 또는 그의 변종을 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Af43A, Fv43B, Pf51A, Pa51A, 및/또는 Fv51A를 포함한다. 본 명세서에 기재된 조성물 중 어느 하나의 일부 태양에서, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드는 Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 및/또는 그의 변종을 포함한다.

전체 셀룰라아제

본 개시의 효소 블렌드/조성물과 같은, 본 명세서에 제공된 조성물 중 임의의 것은 전체 셀룰라아제를 포함할 수 있다.

본 명세서에 사용되는 바와 같이, "전체 셀룰라아제"는, (1) 엔도글루카나아제, (2) 셀로바이오하이드롤라아제, 및 (3) β-글루코시다아제의 3개 이상의 상이한 효소 유형을 포함하거나, (1) 내부 β-1,4 결합의 절단을 촉매하여, 더 짧은 글루코올리고당류(glucooligosaccharide)를 생성시키는 엔도글루카나아제 활성, (2) 셀로바이오스 단위(β-1,4 글루코스-글루코스 이당류)의 "엑소"-유형 방출을 촉매하는 셀로바이오하이드롤라아제 활성, 및 (3) 짧은 셀로올리고당류(예를 들어, 셀로바이오스)로부터 글루코스 단량체의 방출을 촉매하는 β-글루코시다아제 활성의 3개 이상의 상이한 효소 활성을 포함하는, 천연 또는 비-천연 셀룰라아제-함유 조성물을 지칭한다. 전체 셀룰라아제는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, EG2(또는 그의 변종) 및/또는 EG4(또는 그의 변종)), 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, CBH1(또는 그의 변종) 및/또는 CBH2(또는 그의 변종)), 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Bgl1 또는 그의 변종)를 포함할 수 있다.

"천연 셀룰라아제-함유" 조성물은 천연 공급원에 의해 생성되는 것으로서, 이는 하나 이상의 셀로바이오하이드롤라아제-유형, 하나 이상의 엔도글루카나아제-유형, 및 하나 이상의 β-글루코시다아제-유형 구성요소 또는 활성을 포함하며, 여기서 각각의 이들 구성요소 또는 활성은 인공적으로 훼손되지 않은, 자연에서 생성되는 비율 및 수준으로 확인된다. 따라서 천연 셀룰라아제-함유 조성물은, 구성요소 효소의 비율 또는 수준이 자연에서 천연 유기체에 의해 생성되는 것으로부터 변경되지 않도록, 예를 들어, 셀룰로오스 분해효소에 대해 개질되지 않은 유기체에 의해 생성된 것이다. "비-천연 셀룰라아제-함유 조성물"은, (1) 구성요소 셀룰로오스 분해효소를 천연 비율 또는 비-천연(즉, 변경된) 비율로 조합하는 단계; 또는 (2) 하나 이상의 셀룰로오스 분해효소를 과발현시키거나 저발현시키도록 유기체를 개질하는 단계; 또는 (3) 하나 이상의 셀룰로오스 분해효소가 결실되도록 유기체를 개질하는 단계에 의해 생성된 조성물을 지칭한다. "비-천연 셀룰라아제 함유" 조성물은 또한, 천연 유기체가 비-천연 조건 하에 성장하고 변경된 수준 또는 비율의 효소를 생성시키도록 천연 유기체에 대한 배양 조건을 조정함으로써 생성시킨 조성물을 지칭할 수 있다. 따라서 일부 실시 형태에서, 본 개시의 전체 셀룰라아제 제제는 결실되고/되거나 과발현된 하나 이상의 EG 및/또는 CBH 및/또는 β-글루코시다아제를 가질 수 있다.

일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 엔도글루카나아제 IV 폴리펩티드)를 포함하는 비-천연 조성물 또는 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 엔도글루카나아제 IV 폴리펩티드로 보강된 전체 셀룰라아제)를 포함하는 비-천연 조성물이 제공되며, 여기서 조성물은 전체 셀룰라아제, 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 엔도글루카나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 셀로바이오하이드롤라아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-글루코시다아제)(예를 들어, β-글루코시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, 자일라나아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, β-자일로시다아제)(예를 들어, β-자일로시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드), 및/또는 아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, L-α-아라비노푸라노시다아제)(예를 들어, L-α-아라비노-푸라노시다아제 활성을 갖는 2, 3, 4, 또는 5개 이상의 폴리펩티드)를 추가로 포함한다. 다양한 효소 활성을 갖는 폴리펩티드는 상기에 기재되어 있다.

일부 태양에서, 전체 셀룰라아제는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드, 예를 들어, T. 레세이 EG1, T. 레세이 EG2, 또는 그의 변종을 포함한다. 일부 태양에서, 전체 셀룰라아제는 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드, 예를 들어, T. 레세이 CBH1, T. 레세이 CBH2, 또는 그의 변종을 포함한다. 일부 태양에서, 전체 셀룰라아제는 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드, 예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종을 포함한다.

본 개시에서, 전체 셀룰라아제 제제는 셀룰로오스계 재료를 가수분해할 수 있는 임의의 미생물로부터 얻어질 수 있다. 일부 실시 형태에서, 전체 셀룰라아제 제제는 진균 또는 박테리아 전체 셀룰라아제이다. 예를 들어, 전체 셀룰라아제 제제는 아크레모니움, 아스페르길루스, 크리소스포리움, 에메리셀라(Emericella), 푸사리움, 휴미콜라, 무코르, 마이셀리오프토라, 뉴로스포라, 페니실리움, 사이탈리디움, 티엘라비아, 톨리포클라디움, 트리코더마, 또는 효모 종으로부터 얻어질 수 있다.

전체 셀룰라아제 제제는, 예를 들어, 아스페르길루스 아쿨레아투스(Aspergillus aculeatus), 아스페르길루스 아와모리, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 또는 아스페르길루스 오리제 전체 셀룰라아제일 수 있다. 그밖에, 전체 셀룰라아제 제제는 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 또는 푸사리움 베네나툼 전체 셀룰라아제 제제일 수 있다. 전체 셀룰라아제 제제는 또한, 크리소스포리움 루크노엔스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 페니실리움 푸르푸로게눔, 페니실리움 푸니쿨로섬, 사이탈리디움 테르모필룸(Scytalidium thermophilum), 또는 티엘라비아 테레스트리스 전체 셀룰라아제 제제일 수 있다. 전체 셀룰라아제 제제는 또한, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 트리코더마 레세이(예를 들어, RL-P37(Sheir-Neiss G et al. Appl. Microbiol. Biotechnology, 1984, 20, pp.46-53), QM9414(ATCC 번호 26921), NRRL 15709, ATCC 13631, 56764, 56466, 56767), 또는 트리코더마 비리데(예를 들어, ATCC 32098 및 32086) 전체 셀룰라아제 제제일 수 있다.

전체 셀룰라아제 제제는 통합 균주 T. 레세이 H3A 또는 H3A/Eg4 #27(본 명세서의 실시예에 기재된 바와 같음) 제제일 수 있다.

적합하게는, 전체 셀룰라아제 제제는 T. 레세이 RutC30 전체 셀룰라아제 제제일 수 있으며, 이는 미국 미생물 보존센터(American Type Culture Collection)로부터 T. 레세이 ATCC 56765로서 입수가능하다. 예를 들어 적합하게는, 전체 셀룰라아제 제제는 또한 P. 푸니쿨로섬의 전체 셀룰라아제일 수 있으며, 이는 미국 미생물 보존센터로부터 P. 푸니쿨로섬 ATCC 번호: 10446으로서 입수가능하다.

전체 셀룰라아제 제제는 또한 상업적인 공급원으로부터 얻을 수 있다. 본 개시의 방법 및 조성물에 사용하기에 적합한 상업적인 셀룰라아제 제제의 예는, 예를 들어, 셀루클라스트(CELLUCLAST)(상표) 및 셀릭(Cellic)(상표)(노보자임즈 A/S(Novozymes A/S)) 및 라미넥스(LAMINEX)(상표) BG, 인디에이지(IndiAge)(상표) 44L, 프리마패스트(Primafast)(상표) 100, 프리마패스트(상표) 200, 스페자임(Spezyme)(상표) CP, 악셀러라아제(등록상표) 1000 및 악셀러라아제(등록상표) 1500(다니스코 US. 인코포레이티드, 제넨코)을 포함한다.

셀룰로오스계 재료를 가수분해할 수 있는 효소의 발현을 유발하는 임의의 공지 미생물 배양 방법, 특히 발효를 사용하여 적합한 전체 셀룰라아제 제제를 제조할 수 있다. 본 명세서에 사용되는 바와 같이, "발효"는 진탕 플라스크 배양, 소규모 또는 대규모 발효, 예를 들어, 관심의 대상인 셀룰라아제 및/또는 효소가 발현되고/되거나 단리되는 것을 가능하게 하는 조건 하에 적합한 배지 내에서 수행되는 실험실용 또는 산업용 발효기 내에서의 연속식, 회분식, 유가식, 또는 고체 상태 발효를 지칭한다. 일반적으로, 미생물은 셀룰로오스계 재료를 가수분해할 수 있는 효소의 생성에 적합한 세포 배양 배지 내에서 배양된다. 배양은 탄소 및 질소 공급원 및 무기 염류를 포함하는 영양 배지 내에서 공지의 절차 및 변동을 사용하여 이루어진다. 배양 배지, 온도 범위, 및 성장 및 셀룰라아제 생성을 위한 다른 조건은 공지되어 있다. 비제한적인 예로서, T. 레세이에 의한 셀룰라아제의 생성을 위한 전형적인 온도 범위는 24℃ 내지 28℃이다.

전체 셀룰라아제 제제는, 그것이 발효에 의해 생성된 그대로, 회수 및/또는 정제를 하지 않거나 최소로 하여 사용할 수 있다. 그러한 의미에서, 전체 셀룰라아제 제제는 전체 브로스 제형으로 사용할 수 있다. 예를 들어, 일단 셀룰라아제가 세포 배양 배지 내로 분비되면, 셀룰라아제를 함유하는 세포 배양 배지를 직접 사용할 수 있다. 전체 셀룰라아제 제제는, 소진된 세포 배양 배지, 세포외 효소, 및 세포를 포함하는, 발효 재료의 분획화되지 않은 내용물을 포함할 수 있다. 반면에, 전체 셀룰라아제 제제에는 또한, 다수의 일상적 단계 중에 추가의 가공, 예를 들어, 침전, 원심분리, 친화도 크로마토그래피, 여과 등을 적용할 수 있다. 예를 들어, 전체 셀룰라아제 제제를 농축한 후에, 추가의 정제 없이 사용할 수 있다. 전체 셀룰라아제 제제는, 예를 들어, 발효 후에 세포 생존 능력을 감소시키거나 세포를 살해하는 소정의 화학 약제를 포함하도록 제형화될 수 있다. 예를 들어, 공지 방법을 사용하여 세포를 용혈시키거나 투과화시킬 수 있다.

전체 셀룰라아제 제제의 엔도글루카나아제 활성은 카르복시메틸 셀룰로오스(CMC)를 기질로서 사용하여 결정할 수 있다. 적합한 어세이는 CMC에 작용하는 효소 혼합물에 의해 만들어진 환원성 단부의 생성을 측정하며, 여기서 1 단위는 1 ㎛oL의 산물/min을 유리시키는 효소의 양이다(Ghose, T. K., Pure & Appl. Chem. 1987, 59, pp. 257-268).

전체 셀룰라아제는 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드, 예를 들어, EG IV-보강된(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종으로 보강된 것과 같은 것) 셀룰라아제로 보강될 수 있다. 일반적으로, EG IV-보강된 전체 셀룰라아제는 EG IV 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 것) 및 전체 셀룰라아제 제제를 포함한다. EG IV-보강된 전체 셀룰라아제 조성물은 재조합 수단에 의해 생성될 수 있다. 예를 들어, 전체 셀룰라아제를 생성시킬 수 있는 미생물 내에서 EG IV를 발현시킴으로써 이러한 전체 셀룰라아제 제제를 달성할 수 있다. EG IV-보강된 전체 셀룰라아제 조성물은 또한, 예를 들어, 전체 셀룰라아제 제제 및 EG IV(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종과 같은 것)를 포함할 수 있다. 예를 들어, EG IV-보강된(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종으로 보강된) 전체 셀룰라아제 조성물은, 적합하게는, 그 블렌드/조성물 내의 단백질의 총 중량을 기준으로 0.1 중량%, 1 중량%, 2 중량%, 5 중량%, 7 중량%, 10 중량%, 15 중량%, 또는 20 중량% 이상, 그리고 25 중량%, 30 중량%, 35 중량%, 40 중량%, 또는 50 중량% 이하의 EG IV를 포함할 수 있다.

전체 셀룰라아제는 β-글루코시다아제-보강된 셀룰라아제일 수 있다. 일반적으로, β-글루코시다아제-보강된 전체 셀룰라아제는 β-글루코시다아제 및 전체 셀룰라아제 제제를 포함한다. β-글루코시다아제-보강된 전체 셀룰라아제 조성물은 재조합 수단에 의해 생성될 수 있다. 예를 들어, 전체 셀룰라아제를 생성시킬 수 있는 미생물 내에서 β-글루코시다아제를 발현시킴으로써 이러한 전체 셀룰라아제 제제를 달성할 수 있다. β-글루코시다아제-보강된 전체 셀룰라아제 조성물은 또한, 예를 들어, 전체 셀룰라아제 제제 및 β-글루코시다아제를 포함할 수 있다. 예를 들어, β-글루코시다아제-보강된 전체 셀룰라아제 조성물은, 적합하게는, 그 블렌드/조성물 내의 단백질의 총 중량을 기준으로 0.1 중량%, 1 중량%, 2 중량%, 5 중량%, 7 중량%, 10 중량%, 15 중량%, 또는 20 중량% 이상, 그리고 25 중량%, 30 중량%, 35 중량%, 40 중량%, 또는 50 중량% 이하의 β-글루코시다아제를 포함할 수 있다.

소정의 진균은 엑소-셀로바이오하이드롤라아제 또는 CBH-유형 셀룰라아제, 엔도글루카나아제 또는 EG-유형 셀룰라아제, 및 β-글루코시다아제 또는 BG-유형 셀룰라아제를 포함하는 완전한 셀룰라아제 시스템을 생성시킨다(Schulein, 1988). 그러나, 간혹 이들 시스템에는 CBH-유형 셀룰라아제가 결여되어 있으며, 예를 들어, 박테리아 셀룰라아제 또한 전형적으로 CBH-유형 셀룰라아제를 포함하지 않거나 거의 포함하지 않는다. 부가적으로, EG 구성요소 및 CBH 구성요소는 상승적으로 상호작용하여 더 효율적으로 셀룰로오스를 분해하는 것으로 나타났다. 예를 들어, 문헌[Wood, 1985]을 참조한다. 다중-구성요소 또는 완전한 셀룰라아제 시스템 내의 상이한 구성요소, 즉, 다양한 엔도글루카나아제 및 엑소셀로바이오하이드롤라아제는, 일반적으로 상이한 특성, 예를 들어, 등전점, 분자량, 글리코실화도, 기질 특이성, 및 효소적 기능 패턴을 갖는다.

일부 태양에서, 셀룰라아제는 발효에 의해 생성된 그대로, 회수 및/또는 정제를 하지 않거나 최소로 하여 사용한다. 예를 들어, 일단 세포에 의해 셀룰라아제가 세포 배양 배지 내로 분비되면, 셀룰라아제를 함유하는 세포 배양 배지를 사용할 수 있다. 일부 태양에서, 전체 셀룰라아제 제제는, 세포 배양 배지, 세포외 효소, 및 세포를 포함하는, 발효 재료의 분획화되지 않은 내용물을 포함한다. 대안적으로, 전체 셀룰라아제 제제는 임의의 편리한 방법, 예를 들어, 침전, 원심분리, 친화도, 여과, 또는 당업계에 공지된 임의의 다른 방법에 의해 가공될 수 있다. 일부 태양에서는, 예를 들어, 전체 셀룰라아제 제제를 농축한 후 추가의 정제 없이 사용할 수 있다. 일부 태양에서, 전체 셀룰라아제 제제는 세포 생존 능력을 감소시키거나 세포를 살해하는 화학 약제를 포함한다. 일부 태양에서는, 당업계에 공지된 방법을 사용하여 세포를 용혈시키거나 투과화시킨다.

GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하는 조성물이 제공되며, 여기서 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드를 발현시키는 숙주 세포에 대해 이종성이다. 일부 태양에는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하는 조성물이 제공되며, 여기서 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포로부터 발현되고, 여기서 셀룰라아제 폴리펩티드 및/또는 헤미셀룰라아제 폴리펩티드는 숙주 세포에 대해 내인성이다. 셀룰라아제 폴리펩티드는 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 EG1 또는 그의 변종, T. 레세이 EG2 또는 그의 변종), 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 CBH1, A. 푸미가투스 7A, 7B, C. 글로보섬 7A, 7B, T. 테레스트리스 7A, 7B, T. 레세이 CBH2, T. 테레스트리스 6A, S. 테르모필레 6A, 6B, 또는 그의 변종), 또는 β-글루코시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있다. 헤미셀룰라아제 폴리펩티드는 자일라나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종), β-자일로시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종), 또는 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함할 수 있다.

일부 태양에서, 조성물은 발효 브로스로부터 얻어진다. 조성물은 균주의 발효 브로스로부터 얻어질 수 있으며, 여기서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 암호화하는 핵산은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 발현시키는 숙주 세포에 대해 이종성이다(예를 들어, 균주 내로 통합되거나 숙주 균주 내에서 벡터로부터 발현됨). 조성물은 통합 균주(예를 들어, 실시예에서와 같은 H3A/Eg4, #27)의 발효 브로스로부터 얻어질 수 있다.

GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물은 전체 셀룰라아제를 포함할 수 있다. 따라서, T. 레세이 Eg4(또는 그의 변종), T. 레세이 Bgl1(또는 그의 변종), T. 레세이 xyn3(또는 그의 변종), Fv3A(또는 그의 변종), Fv43D(또는 그의 변종), 및 Fv51A(또는 그의 변종)를 포함하는 조성물이 제공된다(예를 들어, 비-천연 조성물).

일부 태양에서, 조성물은 단리된 T. 레세이 Eg4를 포함한다. 일부 태양에서, 조성물은 단리된 T. 레세이 Bgl1, 단리된 T. 레세이 xyn3, 단리된 Fv3A, 단리된 Fv43D, 및 단리된 Fv51A 중 하나 이상(2, 3, 4, 또는 5개 이상)을 포함한다.

일부 태양에서, 조성물은 발효 브로스로부터 얻어진다. 일부 태양에서, 조성물은 통합 균주(예를 들어, 본 명세서에서 실시예에 기재된 바와 같은 H3A/Eg4, #27)의 발효 브로스로부터 얻어진다. T. 레세이 Eg4 또는 T. 레세이 Eg4를 암호화하는 핵산은 T. 레세이 Eg4를 발현시키는 숙주 세포에 대해 이종성일 수 있다. T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, Fv51A, 또는 그의 변종을 암호화하는 하나 이상의 핵산은 T. 레세이 Eg4를 발현시키는 숙주 세포와 같은 숙주 세포에 대해 이종성일 수 있다. 일부 태양에서, T. 레세이 Bgl1, T. 레세이 xyn3, Fv3A, Fv43D, Fv51A, 또는 그의 변종을 암호화하는 하나 이상의 핵산은 T. 레세이 Eg4를 발현시키는 숙주 세포와 같은 숙주 세포에 대해 내인성이다.

상기 조성물 중 임의 것에 관하여, 조성물 내에 포함된 폴리펩티드(들)의 변동하는 양은 하기 "조성물 내의 구성요소(들)의 양" 섹션에 기재된다.

조성물 내의 구성요소(들)의 양

본 명세서에 제공된 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 비-천연 조성물(또는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 전체 셀룰라아제를 포함하는 비-천연 조성물)은 본 명세서에 기재된 바와 같이 다양한 구성요소를 포함할 수 있으며, 여기서 각각의 구성요소는 다양한 양으로 조성물 내에 존재한다.

본 명세서에 제공된 조성물 또는 방법 중 어느 하나의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 부재 하의 수율에 비교하여, 바이오매스 재료의 가수분해로부터의 발효가능한 당(들)의 수율을 증가시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상 만큼) 충분한 양으로 조성물 내에 존재한다. 본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 부재 하의 가수분해 중의 바이오매스 혼합물의 점도에 비교하여, 바이오매스 재료의 가수분해 중에 바이오매스 혼합물의 점도를 감소시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상 만큼) 충분한 양으로 조성물 내에 존재할 수 있다. 조성물은 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드, β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드, 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드, β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드, L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드, 및/또는 전체 셀룰라아제, 또는 그의 혼합물을 추가로 포함할 수 있다. 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 양, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들)의 양, β-글루코시다아제 활성을 갖는 폴리펩티드(들)의 양, 자일라나아제 활성을 갖는 폴리펩티드(들)의 양, β-자일로시다아제 활성을 갖는 폴리펩티드(들)의 양, L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들)의 양, 또는 전체 셀룰라아제의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종), 엔도글루카나아제 활성을 갖는 폴리펩티드(들), 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들), β-글루코시다아제 활성을 갖는 폴리펩티드(들), 자일라나아제 활성을 갖는 폴리펩티드(들), β-자일로시다아제 활성을 갖는 폴리펩티드(들), L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들), 또는 전체 셀룰라아제의 부재 하의 수율에 비교하여, 바이오매스 재료의 가수분해로부터의 발효가능한 당(들)의 수율을 증가시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상 만큼) 충분하다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 양, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들)의 양, β-글루코시다아제 활성을 갖는 폴리펩티드(들)의 양, 자일라나아제 활성을 갖는 폴리펩티드(들)의 양, β-자일로시다아제 활성을 갖는 폴리펩티드(들)의 양, L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들)의 양, 또는 전체 셀룰라아제의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종), 엔도글루카나아제 활성을 갖는 폴리펩티드(들), 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들), β-글루코시다아제 활성을 갖는 폴리펩티드(들), 자일라나아제 활성을 갖는 폴리펩티드(들), β-자일로시다아제 활성을 갖는 폴리펩티드(들), L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들), 또는 전체 셀룰라아제의 부재 하의 바이오매스 혼합물의 점도에 비교하여, 바이오매스 재료의 가수분해 중에 바이오매스 혼합물의 점도를 감소시키기에(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상 만큼) 충분하다.

GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것 이상인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드( 예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것 이하인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/ 조성물 중 임의의 것 내에) 상한 및 하한을 갖는 범위를 갖는 양으로 존재할 수 있다. 예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드에 대한 하한은 조성물 내의 단백질의 총 중량의 약 0.01 중량%, 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것이다. GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드에 대한 상한은 조성물 내의 단백질의 총 중량의 약 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 또는 70 중량% 중 임의의 것일 수 있다. 일부 태양에서, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/ 조성물 중 임의의 것 내에) 존재할 수 있다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)는 조성물 내의 단백질의 총 중량의 약 10 중량% 또는 12 중량%로 존재할 수 있다. 조성물은 엔도글루카나아제 활성을 갖는 2개 이상의 폴리펩티드(예를 들어, T. 레세이 Eg4, T. 레세이 Eg1, 및/또는 T. 레세이 Eg2, 또는 그의 변종)를 가질 수 있으며, 여기서 엔도글루카나아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 30 중량%, 약 2 내지 약 20 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)이다. GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 발현시키는 숙주 세포에 대해 이종성 또는 내인성일 수 있다. 조성물 내에 포함된 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드는 단리될 수 있다.

일부 태양에서, 본 명세서에 기재된 효소 조성물(예를 들어, 효소 조성물)은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 전체 셀룰라아제 조성물이다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 전체 셀룰라아제의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것 이상인 양으로 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는, 전체 셀룰라아제의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것 이하인 양으로 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는 전체 셀룰라아제의 총 중량의 약 0.01 중량%, 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것의 하한, 및 전체 셀룰라아제의 총 중량의 약 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 또는 70 중량% 중 임의의 것의 상한을 갖는 양으로 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는 전체 셀룰라아제의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 13 중량%, 14 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것인 양으로 존재할 수 있다. 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 폴리펩티드 또는 그의 변종을 포함하는 EG IV와 같은 것)는 전체 셀룰라아제의 총 중량의 약 10 중량% 또는 12 중량%인 양으로 존재한다.

일부 태양에서, 본 명세서에 제공된 조성물 중 임의의 것은 T. 레세이 Eg1 또는 그의 변종 및/또는 T. 레세이 Eg2 또는 그의 변종을 포함하는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드를 포함할 수 있다(예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드에 부가하여). 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량은, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 이상인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량은, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것 이하인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량은, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 상한 및 하한을 갖는 범위를 갖는 양으로 존재할 수 있다. 예를 들어, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량에 대한 하한은 조성물 내의 단백질의 총 중량의 약 0.01 중량%, 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것이다. 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량에 대한 상한은 조성물 내의 단백질의 총 중량의 약 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 또는 70 중량% 중 임의의 것일 수 있다. 일부 태양에서, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량은, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것인 양으로 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다.

일부 태양에서, 본 명세서에 제공된 조성물 중 임의의 것은 다양한 효소 활성을 가진 하나 이상의 폴리펩티드, 예를 들어, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들), 글루코시다아제 활성을 갖는 폴리펩티드(들)(예를 들어, β-글루코시다아제), 자일라나아제 활성을 갖는 폴리펩티드(들), 자일로시다아제 활성을 갖는 폴리펩티드(들), 및/또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들)를 포함할 수 있다. 일부 태양에는, 동일한 효소 활성을 갖는 다중 폴리펩티드가 존재할 수 있다. 상기 언급된 각각의 폴리펩티드(또는 특이적 효소 활성을 갖는 폴리펩티드의 총량, 예를 들어, 셀로바이오하이드롤라아제 활성, 글루코시다아제 활성(예를 들어, β-글루코시다아제), 자일라나아제 활성, 자일로시다아제 활성, 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것 이상인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 일부 태양에서, 상기 언급된 각각의 폴리펩티드(또는 특이적 효소 활성을 갖는 폴리펩티드의 총량, 예를 들어, 셀로바이오하이드롤라아제 활성, 글루코시다아제 활성(예를 들어, β-글루코시다아제), 자일라나아제 활성, 자일로시다아제 활성, 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량)는 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것 이하일 수 있다. 상기 언급된 각각의 폴리펩티드(또는 특이적 효소 활성을 갖는 폴리펩티드의 총량, 예를 들어, 셀로바이오하이드롤라아제 활성, 글루코시다아제 활성(예를 들어, β-글루코시다아제), 자일라나아제 활성, 자일로시다아제 활성, 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량)는, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 상한 및 하한을 갖는 범위를 갖는 양으로 존재할 수 있다. 예를 들어, 엔도글루카나아제 활성을 갖는 폴리펩티드(들)의 총량에 대한 하한은 조성물 내의 단백질의 총 중량의 약 0.01 중량%, 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 또는 50 중량% 중 임의의 것이다. 상한은 조성물 내의 단백질의 총 중량의 약 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 또는 70 중량% 중 임의의 것일 수 있다. 일부 태양에서, 상기 언급된 각각의 폴리펩티드(또는 특이적 효소 활성을 갖는 폴리펩티드의 총량, 예를 들어, 셀로바이오하이드롤라아제 활성, 글루코시다아제 활성(예를 들어, β-글루코시다아제), 자일라나아제 활성, 자일로시다아제 활성, 또는 아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량)는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 또는 80 중량% 중 임의의 것인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다.

일부 태양에서, 본 명세서에 제공된 조성물 중 임의의 것은 전체 셀룰라아제를 추가로 포함할 수 있다. 전체 셀룰라아제는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 80 중량%, 85 중량%, 90 중량%, 또는 95 중량% 중 임의의 것 이상인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다. 전체 셀룰라아제는, 조성물 내의 단백질의 총 중량의 약 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 80 중량%, 85 중량%, 90 중량%, 또는 95 중량% 중 임의의 것 이하인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/ 조성물 중 임의의 것 내에) 존재할 수 있다. 전체 셀룰라아제는, 조성물 내의 단백질의 총 중량의 약 1 중량%, 2 중량%, 3 중량%, 4 중량%, 5 중량%, 6 중량%, 7 중량%, 8 중량%, 9 중량%, 10 중량%, 11 중량%, 12 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 60 중량%, 65 중량%, 70 중량%, 75 중량%, 80 중량%, 85 중량%, 90 중량%, 또는 95 중량% 중 임의의 것인 양으로, 본 명세서에 기재된 조성물 중 임의의 것 내에(예를 들어, 본 명세서에 제공된 효소 블렌드/조성물 중 임의의 것 내에) 존재할 수 있다.

본 명세서에 제공된 조성물 또는 방법 중 어느 하나의 일부 태양에서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 CBH1, T. 레세이 CBH2, 또는 그의 변종)는 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 70 중량%(예를 들어, 약 0.5 내지 약 60 중량%, 약 5 내지 약 70 중량%, 약 10 내지 약 60 중량%, 약 20 내지 약 50 중량%, 또는 약 30 내지 약 50 중량%)인 양으로 존재한다. 일부 태양에서, 조성물은 셀로바이오하이드롤라아제 활성을 갖는 2개 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1(또는 그의 변종) 및 T. 레세이 CBH2(또는 그의 변종))를 가지며, 여기서 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 70 중량%(예를 들어, 약 0.5 내지 약 60 중량%, 약 5 내지 약 70 중량%, 약 10 내지 약 60 중량%, 약 20 내지 약 50 중량%, 또는 약 30 내지 약 50 중량%)이다. 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 일부 태양에서, 조성물 내에 포함된 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드는 단리된다.

본 명세서에 제공된 조성물 또는 방법 중 어느 하나의 일부 태양에서, β-글루코시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)는 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 40 중량%, 약 1 내지 약 30 중량%, 약 2 내지 약 20 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)인 양으로 존재한다. 일부 태양에서, 조성물은 β-글루코시다아제 활성을 갖는 2개 이상의 폴리펩티드를 가지며, 여기서 β-글루코시다아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 40 중량%, 약 1 내지 약 30 중량%, 약 2 내지 약 20 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)이다. β-글루코시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 일부 태양에서, 조성물 내에 포함된 β-글루코시다아제 활성을 갖는 폴리펩티드는 단리된다.

본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, 자일라나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)는 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 40 중량%, 약 1 내지 약 40 중량%, 약 4 내지 약 30 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)인 양으로 존재할 수 있다. 조성물은 자일라나아제 활성을 갖는 2개 이상의 폴리펩티드를 가질 수 있으며, 여기서 자일라나아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 40 중량%, 약 1 내지 약 40 중량%, 약 4 내지 약 30 중량%, 약 5 내지 약 20 중량%, 또는 약 8 내지 약 15 중량%)이다. 자일라나아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 조성물 내에 포함된 자일라나아제 활성을 갖는 폴리펩티드는 단리될 수 있다.

본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)는 조성물 내의 효소의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 40 중량%, 약 2 내지 약 30 중량%, 약 4 내지 약 20 중량%, 또는 약 5 내지 약 15 중량%)인 양으로 존재할 수 있다. 조성물은 L-α-아라비노푸라노시다아제 활성을 갖는 2개 이상의 폴리펩티드를 가질 수 있으며, 여기서 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 40 중량%, 약 2 내지 약 30 중량%, 약 4 내지 약 20 중량%, 또는 약 5 내지 약 15 중량%)이다. L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 이종성인 핵산으로부터 발현될 수 있다. 조성물 내에 포함된 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드는 단리될 수 있다.

본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, β-자일로시다아제 활성을 갖는 폴리펩티드(예를 들어, Fv3A, Fv43A, Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)는 조성물 내의 효소의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 40 중량%, 약 4 내지 약 35 중량%, 약 5 내지 약 25 중량%, 또는 약 5 내지 약 20 중량%)인 양으로 존재할 수 있다. 조성물은 β-자일로시다아제 활성을 갖는 2개 이상의 폴리펩티드를 가질 수 있으며, 여기서 β-자일로시다아제 활성을 갖는 폴리펩티드의 총량은 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 50 중량%(예를 들어, 약 0.5 내지 약 45 중량%, 약 1 내지 약 40 중량%, 약 4 내지 약 35 중량%, 약 5 내지 약 25 중량%, 또는 약 5 내지 약 20 중량%)이다. β-자일로시다아제 활성을 갖는 폴리펩티드는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현될 수 있다. 조성물 내에 포함된 β-자일로시다아제 활성을 갖는 폴리펩티드는 단리될 수 있다.

본 명세서에 제공된 조성물 또는 방법 중 어느 하나에서, 조성물 내의 전체 셀룰라아제는 조성물 내의 단백질의 총 중량의 약 0.1 내지 약 100 중량%(예를 들어, 약 1 내지 약 95 중량%, 약 5 내지 약 90 중량%, 약 10 내지 약 85 중량%, 약 20 내지 약 80 중량%, 또는 약 30 내지 약 75 중량%)일 수 있다. 전체 셀룰라아제는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종, T. 레세이 Eg1 또는 그의 변종, T. 레세이 Eg2 또는 그의 변종)를 포함할 수 있다. 전체 셀룰라아제는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1 또는 그의 변종, T. 레세이 CBH2 또는 그의 변종)를 포함할 수 있다. 전체 셀룰라아제는 숙주 세포에 대해 이종성이거나 내인성인 핵산으로부터 발현되는 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함할 수 있다.

일부 태양에서, 본 발명의 조성물은 바이오매스 재료를 발효가능한 당(들)(예를 들어, 글루코스, 자일로스, 아라비노스, 및/또는 셀로바이오스)으로 전환시킬 수 있다. 일부 태양에서, 조성물은 칼코플루오르 어세이에 의해 결정할 때 0.1 이상(예를 들어, 0.1 내지 0.4)의 산물 분율을 달성할 수 있다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는 바이오매스 재료에 접촉되기 전에 함께 혼합된다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는 상이한 시간에 바이오매스 재료에 첨가된다(예를 들어, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드는 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드가 바이오매스 재료에 첨가되기 전 또는 후에 바이오매스 재료에 첨가됨).

일부 태양에서, GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물은 바이오매스 재료를 포함하는 혼합물이며, 예를 들어, 조성물은 가수분해 혼합물, 발효 혼합물, 또는 당화 혼합물이다. 이러한 혼합물은 발효가능한 당(들)을 추가로 포함할 수 있다.

다른 성분들

적합하게는, 본 개시의 효소 조성물은 하나 이상의 보조 단백질을 추가로 포함할 수 있다. 보조 단백질의 예는, 만난아제(예를 들어, 엔도만난아제, 엑소만난아제, 및 β-만노시다아제), 갈락타나아제(예를 들어, 엔도- 및 엑소-갈락타나아제), 아라비나아제(예를 들어, 엔도-아라비나아제 및 엑소-아라비나아제), 리그니나아제, 아밀라아제, 글루쿠로니다아제, 프로테아제, 에스테라아제(예를 들어, 페룰산 에스테라아제, 아세틸 자일란 에스테라아제, 쿠마르산 에스테라아제, 또는 펙틴 메틸 에스테라아제), 리파아제, 다른 글리코시드 하이드롤라아제, 자일로글루카나아제, CIP1, CIP2, 스왈레닌, 익스팬신, 및 셀룰로오스 분해 단백질(cellulose disrupting protein)을 제한 없이 포함한다. 예를 들어, 셀룰로오스 분해 단백질은 셀룰로오스 결합 모듈이다.

방법 및 공정

본 개시는, 본 개시의 효소, 효소 블렌드/조성물을 사용하는, 바이오매스 당화를 위한 방법 및 공정을 제공한다. 특히 본 개시는, 바이오매스 재료를 가수분해하기 위해 본 명세서에 제공된 폴리펩티드 또는 조성물 중 어느 하나를 사용하는 방법 및 공정을 제공한다. 추가로 본 개시는, 바이오매스 혼합물(예를 들어, 당화 공정 중에 바이오매스 기질 및 효소를 함유하는 바이오매스 혼합물)의 점도를 감소시키기 위해 본 명세서에 제공된 폴리펩티드 또는 조성물 중 어느 하나를 사용하는 방법을 제공한다. 일부 태양에는, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 비-천연 조성물과 접촉시키는 단계를 포함하는, 바이오매스 재료를 가수분해하는 방법이 제공된다. 일부 태양에서, 폴리펩티드는 바이오매스 재료를 가수분해하기에 충분한 양으로 존재한다.

본 명세서에 사용되는 바와 같이, 용어 "바이오매스"는 셀룰로오스 및/또는 헤미셀룰로오스를 포함하는 임의의 조성물(리그노셀룰로오스계 바이오매스 재료 중의 리그닌을 포함함)을 지칭한다. 본 명세서에 사용되는 바와 같이, 바이오매스는, 종자, 낟알, 괴경, 식물 폐기물, 또는 식품 가공 또는 산업적 가공의 부산물(예를 들어, 줄기), 옥수수(corn)(예를 들어, 속대, 대 등을 포함함), 초본류(grass)(예를 들어, 소르가스트룸 누탄스(Sorghastrum nutans)와 같은 인디언 그래스(Indian grass); 또는 스위치그래스(switchgrass), 예를 들어, 파니쿰 비르가툼(Panicum virgatum)과 같은 파니쿰 종을 포함함), 다년생 케인(perennial cane)(예를 들어, 물대), 목재(예를 들어, 우드칩(wood chip), 가공 폐기물을 포함함), 종이(종이 폐기물을 포함함), 펄프, 및 재활용 종이(예를 들어, 신문, 프린터 용지 등을 포함함)를 제한 없이 포함한다. 다른 바이오매스 재료는 감자, 대두(예를 들어, 평지씨), 보리, 호밀, 귀리, 밀, 비트(beet), 및 사탕수수 바가스(sugar cane bagasse)를 제한 없이 포함한다. 적합한 리그노셀룰로오스계 바이오매스 재료는, 종자, 낟알, 괴경, 식물 폐기물, 또는 식품 가공 또는 산업적 가공의 부산물(예를 들어, 줄기), 옥수수(예를 들어, 속대, 대 등을 포함함), 초본류(예를 들어, 소르가스트룸 누탄스와 같은 인디언 그래스; 또는 스위치그래스, 예를 들어, 파니쿰 비르가툼과 같은 파니쿰 종), 다년생 케인, 예를 들어, 물대, 목재(예를 들어, 우드칩, 가공 폐기물을 포함함), 종이, 펄프, 재활용 종이(예를 들어, 신문), 목재 펄프, 또는 톱밥을 제한 없이 포함한다. 초본류의 예는 인디언 그래스 또는 스위치그래스를 제한 없이 포함한다. 갈대의 예는 물대와 같은 소정의 다년생 케인을 제한 없이 포함한다. 종이 폐기물의 예는 폐기되거나 사용된 복사 용지, 컴퓨터 프린터 용지, 공책 용지, 메모 용지, 타자기 용지, 신문, 잡지, 판지, 및 종이계 포장 재료를 제한 없이 포함한다.

당화된 바이오매스는, 예를 들어, 미생물 발효 및/또는 화학 합성과 같은 공정을 통해, 다수의 바이오계 산물로 만들어질 수 있다. 본 명세서에 사용되는 바와 같이, "미생물 발효"는 적합한 조건 하에 발효 미생물을 성장시키고 수확하는 공정을 지칭한다. 발효 미생물은, 바이오계 산물의 생성을 위한 목적하는 발효 공정에 사용하기에 적합한 임의의 미생물일 수 있다. 적합한 발효 미생물은 사상 진균, 효모, 및 박테리아를 제한 없이 포함한다. 당화된 바이오매스는 발효 및/또는 화학 합성을 통해, 예를 들어, 연료(예를 들어, 바이오에탄올, 바이오부탄올, 바이오메탄올, 바이오프로판올, 바이오디젤, 제트 연료 등과 같은 바이오연료)로 만들어질 수 있다. 당화된 바이오매스는 또한, 발효 및/또는 화학 합성을 통해, 예를 들어, 범용 화학물질(예를 들어, 아스코르브산, 아이소프렌, 1,3-프로판다이올), 지질, 아미노산, 단백질, 및 효소로 만들어질 수 있다.

바이오매스 재료는 셀룰로오스, 헤미셀룰로오스, 또는 그의 혼합물을 포함할 수 있다. 예를 들어, 바이오매스 재료는 글루칸 및/또는 자일란을 포함할 수 있다.

일부 태양에는, 바이오매스 혼합물을 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 비-천연 조성물과 접촉시키는 단계를 포함하는, 바이오매스 혼합물의 점도를 감소시키는 방법이 제공된다. 폴리펩티드는 점도를 감소시키기에 충분한 양으로 존재한다. 바이오매스 혼합물은 바이오매스 재료(예를 들어, 전처리된 바이오매스 재료)를 포함할 수 있다. 바이오매스 혼합물은 본 명세서에 제공된 효소 조성물 중 임의의 것 또는 그의 혼합물과 같은 효소 조성물을 포함할 수 있다.

일부 태양에서, 본 명세서에 제공된 폴리펩티드, 조성물 중 임의의 것을 사용하여 바이오매스 재료와 같은 기질을 가수분해하거나 당화 공정 중에 기질-효소 혼합물의 점도를 감소시킬 수 있다. 기질은 바이오매스 재료일 수 있다. 기질은 단리된 셀룰로오스 또는 단리된 헤미셀룰로오스일 수 있다. 기질은 글루칸 및/또는 자일란일 수 있다. 일부 태양에서, 바이오매스 재료는 전처리된 바이오매스 재료이다.

바이오매스 재료의 전처리

자일란, 헤미셀룰로오스, 셀룰로오스 및/또는 리그닌 재료를 효소에 대해 더 접근가능하거나 민감하게 함으로써 본 개시의 효소(들) 및/또는 효소 블렌드/조성물에 의한 가수분해에 더 순응적이 되게 하기 위하여, 당화 전에 바이오매스 재료에 바람직하게는 하나 이상의 전처리 단계(들)를 적용한다.

전처리는 화학적, 물리적, 및 생물학적 전처리를 포함할 수 있다. 예를 들어, 물리적 전처리 기술은 다양한 유형의 밀링, 분쇄, 증기 처리(steaming)/증기 폭쇄(steam explosion), 조사(irradiation), 및 수소화 열분해(hydrothermolysis)를 제한 없이 포함할 수 있다. 화학적 전처리 기술은 묽은 산, 알칼린(alkaline), 유기 용매, 암모니아, 이산화황, 이산화탄소, 및 pH-제어 수소화 열분해를 제한 없이 포함할 수 있다. 생물학적 전처리 기술은 리그닌-가용화 미생물의 응용을 제한 없이 포함할 수 있다. 전처리는 수 분 내지 수 시간, 예를 들어 약 1 시간 내지 약 120 시간 동안 일어날 수 있다.

일부 태양에서, 본 명세서에 제공된 방법 또는 공정 중 임의의 것은 바이오매스 재료를 전처리하는 단계, 예를 들어, 바이오매스를 산 또는 염기로 전처리하는 단계를 추가로 포함할 수 있다. 산 또는 염기는 암모니아, 소듐 하이드록사이드, 또는 인산일 수 있다. 본 방법은 바이오매스 재료를 암모니아로 전처리하는 단계를 추가로 포함할 수 있다. 전처리는 증기 폭쇄, 펄핑(pulping), 연삭(grinding), 산 가수분해, 또는 그의 조합일 수 있다.

일 실시 형태에서, 전처리는 승온 및 묽은 산, 진한 산, 또는 묽은 알칼리 용액의 첨가에 의할 수 있다. 헤미셀룰로오스 구성요소를 적어도 부분적으로 가수분해하기에 충분한 시간 동안 전처리 용액을 첨가한 후에 중화시킬 수 있다.

예시적인 실시 형태에서, 전처리는 반응기 내에서 강산 및 금속 염의 묽은 용액을 포함하는 촉매를 바이오매스 재료에 적용하는 단계를 수반한다. 바이오매스 재료는, 예를 들어, 원재료 또는 건조 재료일 수 있다. 이러한 전처리는 셀룰로오스 가수분해의 활성화 에너지 또는 온도를 낮추어, 궁극적으로 발효가능한 당의 더 높은 수율을 가능하게 할 수 있다. 예를 들어, 미국 특허 제6,660,506호; 제6,423,145호를 참조한다.

다른 예시적인 전처리 방법은, 셀룰로오스의 글루코스로의 유의적인 탈중합화가 이루어지지 않으면서 주로 헤미셀룰로오스의 탈중합화를 유발하도록 선택된 온도 및 압력에서 수성 배지 내에서 제1 가수분해 단계를 바이오매스 재료에 적용함으로써 바이오매스를 가수분해하는 단계를 수반한다. 이 단계는 슬러리를 생성시키며, 그 안에서 액체 수성 상은 헤미셀룰로오스의 탈중합화로부터 생성되는 용해된 단당류를 함유하고, 고체 상은 셀룰로오스 및 리그닌을 함유한다. 이어서, 셀룰로오스의 주요 부분이 탈중합화되는 것을 가능하게 하는 조건 하에 제2 가수분해 단계를 슬러리에 적용하여, 셀룰로오스의 용해된/가용성 탈중합화 산물을 함유하는 액체 수성 상을 생성시킨다. 예를 들어, 미국 특허 제5,536,325호를 참조한다.

방법의 추가의 예는, 약 0.4% 내지 약 2%의 강산을 사용하는 묽은 산 가수분해의 하나 이상의 단계에 의해 바이오매스 재료를 가공한 후에; 산 가수분해된 재료의 미반응 고체 리그노셀룰로오스계 구성요소를 알칼린 탈리그닌화로 처리하는 단계를 포함한다. 예를 들어, 미국 특허 제6,409,841호를 참조한다.

전처리 방법의 다른 예는, 사전 가수분해 반응기 내에서 바이오매스(예를 들어, 리그노셀룰로오스계 재료)를 사전 가수분해하는 단계; 산성 액체를 고체 리그노셀룰로오스계 재료에 첨가하여 혼합물을 제조하는 단계; 혼합물을 반응 온도로 가열하는 단계; 리그노셀룰로오스계 재료로부터의 리그닌의 약 20% 이상을 함유하는 가용화된 부분, 및 셀룰로오스를 함유하는 고체 분획으로 리그노-셀룰로오스계 재료를 분획화하기에 충분한 기간 동안 반응 온도를 유지하는 단계; 반응 온도 또는 그 부근에서, 고체 분획으로부터 가용화된 부분을 분리하여 가용화된 부분을 제거하는 단계; 및 가용화된 부분을 회수하는 단계를 포함한다. 고체 분획 내의 셀룰로오스는 효소적 분해에 대해 더 순응적이 된다. 예를 들어, 미국 특허 제5,705,369호를 참조한다.

추가의 전처리 방법은 과산화수소 H₂O₂의 사용을 포함할 수 있다. 문헌[Gould, 1984, Biotech, and Bioengr. 26:46-52]을 참조한다.

전처리는 또한, 바이오매스 재료를 매우 낮은 농도에서 화학양론적 양의 소듐 하이드록사이드 및 암모늄 하이드록사이드와 접촉시키는 단계를 포함할 수 있다. 문헌[Teixeira et al., 1999, Appl. Biochem.and Biotech. 77-79:19-34]을 참조한다. 전처리는 또한, 약 9 내지 약 14의 pH에서 보통의 온도, 압력, 및 pH에서 리그노셀룰로오스를 화학물질(예를 들어, 소듐 카르보네이트 또는 포타슘 하이드록사이드와 같은 염기)과 접촉시키는 단계를 포함할 수 있다. PCT 공개 제WO2004/081185호를 참조한다.

암모니아를 전처리 방법에 사용할 수 있다. 이러한 전처리 방법은, 높은 고체 함량의 조건 하에 낮은 암모니아 농도를 바이오매스 재료에 적용하는 단계를 포함한다. 예를 들어, 미국 특허 공개 제20070031918호, PCT 공개 제WO 06110901호를 참조한다.

당화 공정 및 점도 감소

본 개시는, 바이오매스 혼합물의 점도를 감소시키기에 충분한 양으로 글리코실 하이드롤라아제 패밀리 61("GH61") 엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 조성물(예를 들어, 비-천연 조성물)과 바이오매스 혼합물을 접촉시키는 단계를 포함하는, 바이오매스 혼합물의 점도를 감소시키는 방법을 제공한다. 일부 태양에서, 바이오매스 혼합물은 바이오매스 재료, 발효가능한 당(들), 전체 셀룰라아제, 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물을 포함한다. 일부 태양에서 점도는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 부재 하의 바이오매스 혼합물의 점도에 비교하여 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상) 만큼 감소한다. 본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 바이오매스 재료는 헤미셀룰로오스, 셀룰로오스, 또는 그의 혼합물을 포함한다. 일부 태양에서, 바이오매스 재료는 글루칸, 자일란 및/또는 리그닌을 포함한다.

본 명세서에 제공된 방법 및 공정은 다양한 조건 하에 수행될 수 있다. 예를 들어, 본 명세서에 제공된 방법 중 임의의 것은 약 3.5 내지 약 7.0 의 pH, 예를 들어, 약 4.0 내지 약 6.5 의 pH, 약 4.4 내지 약 6.0 의 pH, 약 4.8 내지 약 5.6 의 pH, 또는 약 4.5 내지 약 5.5 의 pH의 범위의 pH에서 수행될 수 있다. 당업자에게 공지된 방법 중 임의의 것에 따라 염기 또는 산(예를 들어, 황산)을 사용하여, 바이오매스 재료를 함유하는 당화 혼합물을 목적하는 pH로 조정할 수 있다. 예를 들어, 전처리된 바이오매스 재료에 염기 또는 산(예를 들어, 황산)을 첨가하여 당화를 위한 목적하는 pH를 달성할 수 있다. 바이오매스 재료를 가수분해하거나 바이오매스 혼합물의 점도를 감소시키는 방법 중 임의의 것은 약 4.8 내지 약 5.6의 pH(예를 들어, 약 4.8, 4.9, 5.0, 5.1, 5.2, 5.3, 5.4, 5.5, 또는 5.6 중 임의의 것의 pH)에서 수행할 수 있다. 일부 태양에서, 본 방법은 바이오매스 혼합물의 pH를 약 4.0 내지 약 6.5의 pH(예를 들어, 약 4.5 내지 약 5.5의 pH)로 조정하는 단계를 추가로 포함한다.

본 명세서에 제공된 방법 및 공정은 임의의 길이의 시간, 예를 들어, 1 시간, 2 시간, 4 시간, 8 시간, 12 시간, 18 시간, 24 시간, 2 일, 3 일, 4 일, 5 일, 6 일, 7 일, 8 일, 10 일, 14 일, 3 주, 또는 4 주 동안 수행될 수 있다. 본 명세서에 기재된 당화 시간 중 임의의 것 후에, 발효가능한 당(들)의 양이 증가하고/하거나 당화 혼합물의 점도가 감소한다. 일부 태양에서, 본 방법은 약 2 시간 내지 약 7 일(예를 들어, 약 4 시간 내지 약 6 일, 약 8 시간 내지 약 5 일, 또는 약 8 시간 내지 약 3 일) 동안 수행된다.

바이오매스 재료를 전처리한 후에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 첨가할 수 있다. 다른 효소 조성물(예를 들어, 헤미셀룰로오스, 셀룰라아제, 또는 전체 셀룰라아제를 포함하는 효소 조성물)을 바이오매스 재료에 첨가하기 전 또는 후에, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 바이오매스 재료에 첨가할 수 있다. (a) 바이오매스 재료 및/또는 발효가능한 당 및 (b) 효소(예를 들어, 전체 셀룰라아제를 포함하는 셀룰라아제 또는 헤미셀룰라아제)를 함유하는 바이오매스 혼합물에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 첨가할 수 있다. 일부 태양에서는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 바이오매스 혼합물에 첨가하며, 여기서 바이오매스 재료는 소정의 기간(예를 들어, 약 5 분, 10 분, 30 분, 1 시간, 2 시간, 4 시간, 8 시간, 12 시간, 18 시간, 24 시간, 2 일, 3 일, 4 일, 또는 5 일 중 임의의 것) 동안 가수분해되었다.

GH61/엔도글루카나아제 활성을 갖는 단리된 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 당화 중에 바이오매스 재료에 첨가할 수 있다. 전체 셀룰라아제를 포함하는 조성물(예를 들어, 비-천연 조성물)을 당화 중에 바이오매스 재료에 첨가할 수 있으며, 여기서 전체 셀룰라아제는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함한다.

본 방법 중 어느 하나에 사용되는 바이오매스 재료는 액체 형태, 고체 형태, 또는 그의 혼합물일 수 있다. 본 방법 중 어느 하나에 사용되는 바이오매스 재료는 습윤 형태, 건조 형태, 다양한 수분도(degree of moisture)를 갖는 재료, 또는 그의 혼합물일 수 있다. 본 방법 중 어느 하나에 사용되는 바이오매스 재료는 건조 고체 형태(예를 들어, 시재료로서의 건조 고체 형태)일 수 있다. 바이오매스 재료는 하기 형태 중 임의의 것으로 가공될 수 있다: 당업자에게 공지된 임의의 방법에 따라 습윤 형태, 건조 형태, 고체 형태, 액체 형태, 또는 그의 혼합물.

본 방법 중 임의의 것에 사용되는 바이오매스 재료는, 가수분해 혼합물 또는 당화 혼합물의 총 중량의 약 0.5 중량%, 1 중량%, 5 중량%, 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 또는 60 중량% 중 임의의 것 이상의 양으로 당화 혼합물 내에 존재할 수 있으며, 여기서 바이오매스 재료의 양은 그의 고체 상태의 바이오매스 재료(또는 그의 건조 상태, 그의 건조 고체 상태, 그의 자연 상태, 또는 그의 가공되지 않은 상태의 바이오매스 재료)의 중량을 지칭한다. 바이오매스 재료는 또한, 바이오매스 재료를 함유하는 가수분해 혼합물의 약 0.5 중량% 내지 약 55 중량%, 1 중량% 내지 약 40 중량%, 5 중량% 내지 약 60 중량%, 약 10 중량% 내지 약 55 중량%, 약 10 중량% 내지 약 50 중량%, 약 15 중량% 내지 약 50 중량%, 약 15 중량% 내지 약 40 중량%, 약 15 중량% 내지 약 35 중량%, 약 15 중량% 내지 약 30 중량%, 약 20 중량% 내지 약 35 중량%, 또는 약 20 중량% 내지 약 30 중량%의 양으로 존재할 수 있으며, 여기서 바이오매스 재료의 양은 그의 고체 상태의 바이오매스 재료(또는 그의 건조 상태, 그의 건조 고체 상태, 그의 자연 상태, 또는 그의 가공되지 않은 상태의 바이오매스 재료)의 중량을 지칭한다. 본 방법 중 임의의 것에 사용되는 바이오매스 재료는 가수분해 혼합물 또는 당화 혼합물의 총 중량의 약 0.5 중량%, 1 중량%, 5 중량%, 10 중량%, 15 중량%, 20 중량%, 25 중량%, 30 중량%, 35 중량%, 40 중량%, 45 중량%, 50 중량%, 55 중량%, 또는 60 중량% 중 임의의 것의 양으로 당화 혼합물 내에 존재할 수 있으며, 여기서 바이오매스 재료의 양은 그의 고체 상태의 바이오매스 재료(또는 그의 건조 상태, 그의 건조 고체 상태, 그의 자연 상태, 또는 그의 가공되지 않은 상태의 바이오매스 재료)의 중량을 지칭한다.

가수분해 혼합물 또는 당화 혼합물은 바이오매스 재료, 효소(들)(예를 들어, 본 명세서에 제공된 폴리펩티드 중 어느 하나), 효소 조성물(예를 들어, 본 명세서에 제공된 조성물 중 어느 하나), 및/또는 당화에 필요한 구성요소와 같은 다른 구성요소를 포함한다.

"예시적인 조성물" 섹션에 상기 제공된 조성물 중 어느 하나와 같은, 본 명세서에 제공된 조성물 중 임의의 것을 본 명세서에 기재된 방법에 사용할 수 있다. 본 명세서에 제공된 방법 중 어느 하나에 사용되는 본 명세서에 기재된 조성물 중 임의의 것의 양은, 바이오매스 재료에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.05 mg 내지 약 50 mg, 약 0.1 mg 내지 약 40 mg, 약 0.2 mg 내지 약 30 mg, 약 0.5 mg 내지 약 25 mg, 약 1 mg 내지 약 25 mg, 약 2 mg 내지 약 25 mg, 약 5 mg 내지 약 25 mg, 또는 약 10 mg 내지 약 25 mg 단백질의 범위일 수 있다. 바이오매스 재료를 가수분해하는 방법 및/또는 바이오매스 혼합물의 점도를 감소시키는 방법에 사용되는 방법 중 어느 하나에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물은, 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.05 mg 내지 약 50 mg, 약 0.1 mg 내지 약 40 mg, 약 0.2 mg 내지 약 30 mg, 약 0.5 mg 내지 약 25 mg, 약 1 mg 내지 약 25 mg, 약 2 mg 내지 약 25 mg, 약 5 mg 내지 약 25 mg, 또는 약 10 mg 내지 약 25 mg 단백질의 양으로 존재할 수 있다.

일부 태양에서, 바이오매스 재료를 가수분해하는 방법 및/또는 바이오매스 혼합물의 점도를 감소시키는 방법 중 임의의 것에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물은, 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.05 mg, 0.1 mg, 0.2 mg, 0.5 mg, 1 mg, 2 mg, 5 mg, 7.5 mg, 10 mg, 12 mg, 14 mg, 15 mg, 16 mg, 17.5 mg, 18 mg, 20 mg, 22.5 mg, 25 mg, 27.g mg, 30 mg, 35 mg, 40 mg, 45 mg, 또는 50 mg 단백질 중 임의의 것 이상의 양으로 존재한다. 일부 태양에서, 바이오매스 재료를 가수분해하는 방법 및/또는 바이오매스 혼합물의 점도를 감소시키는 방법 중 임의의 것에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물은, 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.1 mg, 0.2 mg, 0.5 mg, 1 mg, 2 mg, 5 mg, 7.5 mg, 10 mg, 12 mg, 14 mg, 15 mg, 16 mg, 17.5 mg, 18 mg, 20 mg, 22.5 mg, 25 mg, 27.5 g mg, 30 mg, 35 mg, 40 mg, 45 mg, 50 mg, 55 mg, 60 mg, 65 mg, 75 mg, 또는 100 mg 단백질 중 임의의 것 이하의 양으로 존재한다. 일부 태양에서, 바이오매스 재료를 가수분해하는 방법 및/또는 바이오매스 혼합물의 점도를 감소시키는 방법 중 임의의 것에 사용되는 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물은, 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.05 mg, 0.1 mg, 0.2 mg, 0.5 mg, 1 mg, 2 mg, 5 mg, 7.5 mg, 10 mg, 12 mg, 14 mg, 15 mg, 16 mg, 17.5 mg, 18 mg, 20 mg, 22.5 mg, 25 mg, 27.5 g mg, 30 mg, 35 mg, 40 mg, 45 mg, 또는 50 mg 단백질 중 임의의 것의 양으로 존재한다. 바이오매스 재료와 같은 기질 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 양은, 당업자에게 공지된 임의의 방법을 사용하여 계산할 수 있다. 바이오매스 재료는 글루칸, 자일란, 및/또는 리그닌을 포함할 수 있다.

본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.1 mg 내지 약 50 mg 단백질(예를 들어, 약 0.2 mg 내지 약 40 mg 단백질, 약 0.5 mg 내지 약 30 mg 단백질, 약 1 mg 내지 약 20 mg 단백질, 또는 약 5 mg 내지 약 15 mg 단백질)이다. 본 명세서에 기재된 단백질 양은 조성물 내의 총 단백질의 중량을 지칭한다. 단백질은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하며, 조성물 내의 셀룰라아제 폴리펩티드(들) 및/또는 헤미셀룰라아제 폴리펩티드(들)와 같은 다른 효소 또한 포함할 수 있다.

본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 1 mg 내지 약 5 mg 단백질)이다.

본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 엔도글루카나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Eg1, T. 레세이 Eg2, 및/또는 그의 변종)를 포함하며, 여기서 엔도글루카나아제 활성을 갖는 폴리펩티드의 총량은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 1 mg 내지 약 5 mg 단백질)이다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 CBH1, T. 레세이 CBH2, 및/또는 그의 변종)를 포함하며, 여기서 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 1 mg 내지 약 5 mg 단백질)이다.

본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 조성물은 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3C, Pa3D, Fv3G, Fv3D, Tr3A, Tr3B, Te3A, An3A, Fo3A, Gz3A, Nh3A, Vd3A, Pa3G, Tn3B, 또는 그의 변종)를 포함하며, 여기서 β-글루코시다아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 0.5 mg 내지 약 5 mg 단백질)이다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 자일라나아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, T. 레세이 Xyn3, T. 레세이 Xyn2, AfuXyn2, AfuXyn5, 또는 그의 변종)를 포함하며, 여기서 자일라나아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 0.5 mg 내지 약 5 mg 단백질)이다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 β-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Fv3A, Fv43A, a Pf43A, Fv43D, Fv39A, Fv43E, Fo43A, Fv43B, Pa51A, Gz43A, T. 레세이 Bxl1, 또는 그의 변종)를 포함하며, 여기서 β-자일로시다아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 0.5 mg 내지 약 5 mg 단백질)이다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 L-α-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드(예를 들어, Af43A, Fv43B, Pf51A, Pa51A, Fv51A, 또는 그의 변종)를 포함하며, 여기서 L-α-아라비노푸라노시다아제 활성을 갖는 폴리펩티드(들)의 양은, 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스 및 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 mg 내지 약 30 mg(예를 들어, 약 0.2 mg 내지 약 20 mg 단백질, 약 0.5 mg 내지 약 10 mg 단백질, 또는 약 0.5 mg 내지 약 5 mg 단백질)이다.

본 명세서에 제공된 방법 중 어느 하나에서, 바이오매스 혼합물의 점도는 본 명세서에 제공된 효소 조성물의 부재 하의 바이오매스 혼합물의 점도에 비교하여 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 이상 만큼 감소될 수 있다. 예를 들어, 바이오매스 혼합물을 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물과 접촉시키는 단계를 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)의 부재 하의 바이오매스 혼합물의 점도에 비교하여 점도가 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 이상 만큼 감소하는, 바이오매스 혼합물의 점도를 감소시키는 방법이 제공된다. 일부 태양에서는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)의 부재 하의 바이오매스 혼합물의 점도에 비교하여 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 만큼 점도가 감소한다. 본 명세서에 기재된 점도의 감소는 소정의 당화 기간 후에 나타난다. 예를 들어, 점도의 감소는 30 분, 1 시간, 2 시간, 4 시간, 8 시간, 12 시간, 18 시간, 24 시간, 2 일, 3 일, 4 일, 또는 5 일 당화 후에 나타난다. 점도를 측정하는 방법은 당업계에 공지되어 있다. 예를 들어, 점도는 육안으로 측정하거나, 브룩필드(Brookfield) 점도계(브룩필드 엔지니어링 인코포레이티드(Brookfield Engineering, Inc))와 같은 점도계에 의해 측정할 수 있다. 예를 들어, 암모니아로 전처리된 옥수수 속대를 기질로서 이용하는 점도계를 사용하여 당화 반응 혼합물의 점도를 측정할 수 있다. 점도계는 슬러리 내에서 스핀들을 일정한 속도로 회전시키기 위해 그것이 받는 저항(토크)을 측정할 수 있다.

본 명세서에 제공된 방법은 당화에 적합한 온도에서 수행될 수 있다. 예를 들어, 본 명세서에 기재된 방법 중 어느 하나는 약 20℃ 내지 약 75℃, 약 25℃ 내지 약 70℃, 약 30℃ 내지 약 65℃, 약 35℃ 내지 약 60℃, 약 37℃ 내지 약 60℃, 약 40℃ 내지 약 60℃, 약 40℃ 내지 약 55℃, 약 40℃ 내지 약 50℃, 또는 약 45℃ 내지 약 50℃에서 수행될 수 있다. 일부 태양에서, 본 명세서에 기재된 방법 중 어느 하나는 약 20℃, 약 25℃, 약 30℃, 약 35℃, 약 37℃, 약 40℃, 약 45℃, 약 48℃, 약 50℃, 약 55℃, 약 60℃, 약 65℃, 약 70℃, 또는 약 75℃에서 수행될 수 있다.

본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 본 방법은 발효가능한 당(들)을 생성시키는 단계를 포함하며, 여기서 발효가능한 당(들)의 양은, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)의 부재 하에 생성되는 발효가능한 당(들)의 양에 비교하여 약 5% 이상(예를 들어, 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 또는 90% 중 임의의 것 이상) 만큼 증가한다.

본 명세서에는 또한, 바이오매스 재료의 가수분해 중에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 조성물(예를 들어, 비-천연 조성물)을 사용함으로써, 발효가능한 당(들)의 양을 증가시키는 방법(및/또는 바이오매스 재료로부터 발효가능한 당(들)으로의 전환, 예를 들어, 글루칸 전환을 증가시키는 방법)이 제공된다. 글루코스, 자일로스, 및/또는 셀로바이오스를 포함하나, 이로 제한되지 않는, 바이오매스 재료의 가수분해로부터 생성되는 다양한 발효가능한 당이 존재한다. 일부 태양에서, 바이오매스 재료의 가수분해로부터 생성되는 발효가능한 당(들)의 양은, 본 명세서에 제공된 효소 조성물의 부재 하의 발효가능한 당(들)의 양에 비교하여 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 이상 만큼 증가할 수 있다. 예를 들어, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)를 포함하는 비-천연 조성물과 접촉시키는 단계(당화 공정을 개시하거나 촉진하기 위함)를 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)의 부재 하의 당화로부터의 발효가능한 당(들)의 양에 비교하여, 당화로부터의 발효가능한 당(들)의 양이 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 이상 만큼 증가하는, 발효가능한 당(들)의 양을 증가시키는 방법이 제공된다. 일부 태양에서는, GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종과 같은 EG IV)의 부재 하의 당화로부터의 발효가능한 당(들)의 양에 비교하여, 당화로부터의 발효가능한 당(들)의 양이 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 중 임의의 것 만큼 증가한다. 본 명세서에 기재된 바이오매스 재료의 가수분해로부터 생성되는 발효가능한 당(들)의 양의 증가는 소정 기간의 당화 후에 나타난다. 예를 들어, 발효가능한 당(들)의 양의 증가는 30 분, 1 시간, 2 시간, 4 시간, 8 시간, 12 시간, 18 시간, 24 시간, 2 일, 3 일, 4 일, 또는 5 일 당화 후에 나타난다. 발효가능한 당(들)의 양 및/또는 글루칸 전환을 측정하는 방법은 당업자에게 공지되어 있다.

당화 혼합물의 점도의 감소는 바람직한 발효가능한 당의 개선된 수율과 관련될 수 있다.

일부 태양에서, 본 방법은 바이오매스 재료를 전체 셀룰라아제를 포함하는 조성물과 접촉시키는 단계를 추가로 포함한다. 일부 태양에서, 바이오매스 재료를 전체 셀룰라아제를 포함하는 조성물과 추가로 접촉시키는 단계는, 바이오매스 재료를 글리코실 하이드롤라아제 패밀리 61("GH61") 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물과 접촉시키는 단계 전에, 후에, 또는 그와 동시에 수행된다.

본 명세서에 기재된 방법 중 임의의 것의 일부 태양에서, 본 방법은 바이오매스 재료를 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물과 추가로 접촉시키는 단계를 포함한다. 일부 태양에서, 바이오매스 재료를 셀룰라아제 활성을 갖는 폴리펩티드 및/또는 헤미셀룰라아제 활성을 갖는 폴리펩티드를 포함하는 조성물과 추가로 접촉시키는 단계는, 바이오매스 재료를 글리코실 하이드롤라아제 패밀리 61("GH61") 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물과 접촉시키는 단계 전에, 후에, 또는 그와 동시에 수행된다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는, 바이오매스 재료를 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하는 조성물과 접촉시키기 전에 함께 혼합된다.

일부 태양에서, 조성물은 GH61/ 엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)를 포함하고 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드를 추가로 포함하며, 여기서 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종) 및 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드는 상이한 시간에 바이오매스 재료에 첨가된다(예를 들어, 하나 이상의 셀룰라아제 폴리펩티드 및/또는 하나 이상의 헤미셀룰라아제 폴리펩티드가 바이오매스 재료에 첨가되기 전 또는 후에 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드(예를 들어, T. 레세이 Eg4 또는 그의 변종)가 첨가됨).

예를 들어, 하기의 미국 특허 공개 제US20050054039호, 제US20050037459호, 제US20060205042호, 제US20050048619A1호, 및 제US20060218671호 중 어느 하나에 기재된 CBH 폴리펩티드를 사용하여, 더 높은 온도에서 증진된 셀룰로오스 전환을 달성할 수 있다. β-글루코시다아제를 과발현시키는 방법은 당업계에 공지되어 있다. 예를 들어, 미국 특허 제6,022,725호를 참조한다. 또한 예를 들어, 미국 특허 공개 제20050214920호를 참조한다.

화학물질, 미생물을 위한 발효 공급원료, 및 단백질의 생성을 위한 유도물질, 유기 산물, 화학물질 및 연료, 플라스틱, 및 다른 산물 또는 중간체로서의 단당류, 이당류, 및 다당류의 생성에 본 개시의 방법을 사용할 수 있다. 특히, 셀룰로오스 또는 헤미셀룰로오스의 부분적 또는 완전 가용화에 의해 가공 잔류물(주정박(dried distillers grain), 양조로부터의 잔류 곡물(spent grains from brewing), 사탕수수 바가스 등)의 가치를 증가시킬 수 있다. 에탄올에 부가하여, 셀룰로오스 및 헤미셀룰로오스로부터 생성될 수 있는 화학물질은, 아세톤, 아세테이트, 글리신, 라이신, 유기산(예를 들어, 락트산), 1,3-프로판다이올, 부탄다이올, 글리세롤, 에틸렌 글리콜, 푸르푸랄, 폴리하이드록시알카노에이트, 시스, 시스-뮤콘산, 동물 사료, 및 자일로스를 포함한다.

영업 방법

본 개시의 셀룰라아제 및/또는 헤미셀룰라아제 조성물은 산업적 설정 및/또는 상업적 설정에서 추가로 사용될 수 있다. 따라서, 본 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물을 제조하거나, 시판하거나, 달리 상업화하는 방법 또는 방법 또한 고려된다.

특정 실시 형태에서, 예를 들어, 본 명세서에 기재된 바와 같은 GH61 엔도글루카나아제 또는 그의 변종 중 하나 이상을 포함하는 본 발명의 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물은, 소정의 에탄올(바이오에탄올) 정제공장 또는 다른 생화학물질 또는 생물재료 제조업체에 공급되거나 판매될 수 있다. 첫번째 예에서, 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물은, 산업적 규모의 효소 제조에 전문화된 효소 제조 설비 내에서 제조될 수 있다. 이어서, 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물을 포장하거나 효소 제조업체의 고객에게 판매할 수 있다. 이러한 운영 전략을 본 명세서에서는 "상업 효소 공급 모델(merchant enzyme supply model)"이라고 명명한다.

다른 운영 전략에서, 본 발명의 비-천연 셀룰라아제 및 헤미셀룰라아제 조성물은 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조업체("현장")에, 또는 그 부근에 위치하는 현장에 효소 제조업체에 의해 구축된 최신 효소 생산 시스템 내에서 생산될 수 있다. 일부 실시 형태에서는, 효소 제조업체 및 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조업체에 의해 효소 공급 계약이 이행된다. 효소 제조업체는 본 명세서에 기재된 바와 같은 숙주 세포, 발현, 및 생산 방법을 이용하여 현장에서 효소 생산 시스템을 설계, 제어, 및 운영하여, 비-천연 셀룰라아제 및/또는 헤미셀룰라아제 조성물을 생산한다. 소정의 실시 형태에서, 바람직하게는 본 명세서에 기재된 바와 같이 적절한 전처리를 적용하는 적합한 바이오매스를, 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조 설비에서, 또는 그 부근에서 본 명세서의 당화 방법 및 효소 및/또는 효소 조성물을 사용하여 가수분해할 수 있다. 이어서, 생성되는 발효가능한 당에 동일한 설비 또는 부근의 설비에서 발효를 적용할 수 있다. 이러한 운영 전략을 본 명세서에서는 "현장 생물정제 모델(on-site biorefinery model)"이라고 명명한다.

현장 생물정제 모델은, 예를 들어, 상업 효소 공급자로부터의 효소 공급에 대한 최소의 의존을 가능하게 하는 자급 운영의 제공을 포함하는, 상업 효소 공급 모델에 비한 소정의 이점을 제공한다. 이는 결국 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조업체가 실시간 또는 근사 실시간 수요에 기초하여 효소 공급을 더 잘 제어하는 것을 가능하게 한다. 소정의 실시 형태에서는, 서로 가까이 위치하는 바이오에탄올 정제공장 및/또는 생화학물질/생물재료 제조업체 2개 사이에, 또는 2개 이상 사이에 현장 효소 생산 설비를 공유하여, 효소의 수송 및 보관 비용을 절감할 수 있다는 것을 고려한다. 또한, 이는 효소 생산 설비 현장에서 더 즉각적인 "드롭-인(drop-in)" 기술 개선을 가능하게 하여, 발효가능한 당 및 궁극적으로, 바이오에탄올 또는 생화학물질의 더 높은 수율에 대한 효소 조성물의 개선 사이의 시차를 감소시킨다.

현장 생물정제 모델은, 그것을 사용하여 본 개시의 셀룰라아제 및 비-천연 헤미셀룰라아제 조성물 뿐 아니라, 전분(예를 들어, 옥수수)을 가공하여 더 효율적이고 효과적으로 전분을 바이오에탄올 또는 생화학물질로 직접 전환할 수 있게 하는 효소 및 효소 조성물 또한 제조하고, 공급하고, 생산할 수 있다는 점에서, 바이오에탄올 및 생화학물질의 산업적 생산 및 상업화에 더 일반적인 응용가능성을 갖는다. 소정의 실시 형태에서, 전분-가공 효소는 현장 생물정제공장에서 생산된 후에, 바이오에탄올을 생산하기 위하여 바이오에탄올 정제공장 또는 생화학물질/생물재료 제조 설비 내로 신속하고 용이하게 통합될 수 있다.

따라서 소정의 태양에서 본 발명은 또한, 효소(예를 들어, 소정의 GH61 엔도글루카나아제 및 그의 변종), 세포, 조성물(예를 들어, 적합한 GH61 엔도글루카나아제 또는 그의 변종을 포함함), 및 본 명세서의 공정을 소정의 바이오에탄올, 바이오연료, 생화학물질, 또는 다른 생물재료의 제조 및 시판에 응용하는 소정의 영업 방법에 관한 것이다. 일부 실시 형태에서, 본 발명은 이러한 효소, 세포, 조성물, 및 공정의 현장 생물정제 모델에서의 응용에 관한 것이다. 다른 실시 형태에서, 본 발명은 이러한 효소, 세포, 조성물, 및 공정의 상업 효소 공급 모델에서의 응용에 관한 것이다.

이와 관련하여, 본 개시는 본 발명의 효소 및/또는 효소 조성물의 상업적 설정에서의 용도를 제공한다. 예를 들어, 본 개시의 효소 및/또는 효소 조성물은, 효소 및/또는 조성물을 사용하는 전형적이거나 바람직한 방법에 대한 지침을 동반하여 적합한 시장에서 판매될 수 있다. 따라서 본 개시의 효소 및/또는 효소 조성물은 상업 효소 공급자 모델 내에서 사용되거나 상업화될 수 있으며, 여기서 본 개시의 효소 및/또는 효소 조성물은 바이오에탄올의 제조업체, 연료 정제공장, 또는 연료 또는 바이오-산물 생산에 종사하는 생화학물질 또는 생물재료 제조업체에 판매된다. 일부 태양에서, 본 개시의 효소 및/또는 효소 조성물은 현장 생물정제 모델을 사용하여 시판되거나 상업화될 수 있으며, 여기서 효소 및/또는 효소 조성물은 연료 정제공장 또는 생화학물질/생물재료 제조업체의 설비에, 또는 그 부근에 있는 설비에서 생산되거나 제조되고, 본 발명의 효소 및/또는 효소 조성물은 실시간 기반으로 연료 정제공장 또는 생화학물질/생물재료 제조업체의 특정 필요성에 맞추어진다. 또한 본 개시는, 목적하는 바이오-산물(예를 들어, 바이오연료, 생화학물질, 생물재료 등)을 제조하고 시판할 수 있도록 이들 제조업체에 효소 및/또는 효소 조성물을 사용하기 위한 기술적 지원 및/또는 지침을 제공하는 단계에 관한 것이다.

본 발명의 방법 및 조성물의 실시예가 하기에 이어진다. 상기 제공된 일반적 설명이 주어지면, 다른 다양한 실시 형태가 실시될 수 있음이 이해된다.

실시예

실시예 1: 어세이/방법

하기 실시예에는 하기의 어세이/방법을 일반적으로 사용하였다. 하기 제공된 프로토콜로부터의 임의의 변경은 특정 실시예에 나타낸다.

A. 바이오매스 기질의 전처리

국제 특허 공개 제WO06110901A호에 기재된 방법 및 가공 범위에 따라(달리 표시하지 않는 한) 옥수수 속대, 옥수수 대, 및 스위치 그래스를 효소적 가수분해 전에 전처리하였다. 전처리에 대한 이들 참고문헌은 또한 미국 특허 출원 공개 제20070031918-A1호, 제20070031919-A1호, 제20070031953-A1호, 및/또는 제20070037259-A1호의 개시에 포함된다.

암모니아 폭쇄(AFEX: Ammonia fiber explosion) 처리한 옥수수 대는 미시간 바이오테크놀로지 인스티튜트 인터내셔날(MBI: Michigan Biotechnology Institute International)로부터 입수하였다. 국립 재생 에너지 연구소(NREL: National Renewable Energy Laboratory) 절차, NREL LAP-002를 사용하여 MBI(Teymouri, F et al. Applied Biochemistry and Biotechnology, 2004, 113:951-963)에 의해 옥수수 대의 조성을 결정하였다. NREL 절차는, http://www.nrel.gov/ biomass/analytical_procedures.html에서 입수가능하다.

FPP 펄프 및 종이 기질은 프랑스 소재의 스머핏 카파 셀룰로오스 두 핀(SMURFIT KAPPA CELLULOSE DU PIN)으로부터 입수하였다.

증기 팽창된 사탕수수 바가스(SEB: steam expanded sugar-cane bagasse)는 선옵타(SunOpta)로부터 입수하였다(Glasser, WG et al. Biomass and Bioenergy 1998, 14(3): 219-235; Jollez, P et al. Advances in thermochemical biomass conversion, 1994, 2:1659-1669).

B. 바이오매스의 조성 분석

바이오매스 내의 구조 탄수화물 및 리그닌의 결정에 기재된 2-단계 산 가수분해 방법(National Renewable Energy Laboratory, Golden, CO 2008 http://www.nrel.gov/biomass/pdfs/42618.pdf)을 사용하여 바이오매스 기질의 조성을 측정하였다. 이 방법을 사용하여, 효소적 가수분해 결과를 기질의 시작 글루칸 및 자일란 함량으로부터의 이론적 수율에 대한 퍼센트 전환의 관점에서 본 명세서에 보고하였다.

C. 총 단백질 어세이

BCA 단백질 어세이는 분광 광도계로 단백질 농도를 측정하는 비색 어세이이다. BCA 단백질 어세이 키트(피어스 케미칼(Pierce Chemical), 제품 #23227)를 제조업체의 제안에 따라 사용하였다. 50 mM 소듐 아세테이트 완충제(pH 5)를 사용하여 시험관에 효소 희석액을 제조하였다. 1 mL의 15% 트라이클로로아세트산(TCA)을 함유하는 2 mL 에펜도르프 원심분리관에 희석된 효소 용액(0.1 mL)을 첨가하였다. 튜브를 보텍싱하고 얼음조에 10 min 동안 넣어 두었다. 이어서, 샘플을 14,000 rpm에서 6 min 동안 원심분리하였다. 상청액을 따라내고, 펠렛을 1 mL의 0.1 N NaOH에 재현탁하고, 펠렛이 용해될 때까지 튜브를 보텍싱하였다. 2 mg/mL의 스톡 용액으로부터 BSA 표준 용액을 제조하였다. 0.5 mL의 시약 B를 25 mL의 시약 A와 혼합함으로써 BCA 작업 용액을 제조하였다. 0.1 mL의 효소 재현탁 샘플을 3개의 에펜도르프 원심분리관에 첨가하였다. 2 mL의 피어스(Pierce) BCA 작업 용액을 각각의 샘플 및 BSA 표준 에펜도르프 튜브에 첨가하였다. 모든 튜브를 37℃ 수조에서 30 min 동안 인큐베이션하였다. 이어서, 샘플을 실온으로 냉각시키고(15 min) 분광 광도계에서 562 nm에서 흡광도를 측정하였다.

각각의 표준에 대한 단백질 흡광도의 평균값을 계산하였다. x-축을 흡광도로 하고 y-축을 농도(mg/mL)로 하여, 평균 단백질 표준을 플로팅하였다. 하기의 선형 수학식에 지점들을 적합시켰다:

y=mx +b

x- 값에 흡광도를 대입하여 효소 샘플의 원 농도를 계산하였다. 희석 배수를 곱하여 총 단백질 농도를 계산하였다.

정제된 샘플의 총 단백질을 A280에 의해 결정하였다(Pace, CN, et al. Protein Science, 1995, 4:2411-2423).

발효 산물의 총 단백질 함량은 간혹, 켈달(Kjeldahl)(rtech laboratories, www.rtechlabs.com )에 의해, 또는 두마스(DUMAS) 방법(트루스펙 CN(TruSpec CN), www.leco.com )(Sader, A.P.O. et al., Archives of Veterinary Science, 2004, 9(2):73-79)에 의해 자체적으로, 방출된 질소의 연소, 포집, 및 측정에 의한 총 질소로서 측정되었다. 복잡한 단백질-함유 샘플, 예를 들어, 발효 브로스의 경우, 평균 16%의 N 함량, 및 질소 대 단백질에 대해 6.25의 변환 인자를 사용하였다. 일부 경우에는, 간섭성 비-단백질 질소를 제거하기 위하여 총 침전가능한 단백질을 측정하였다. 12.5%의 최종 TCA 농도를 사용하였으며, 단백질-함유 TCA 펠렛은 0.1 M NaOH에 재현탁하였다.

일부 경우에는, 쿠마시 플러스- 더 베터 브래드포드 어세이(Coomassie Plus- the Better Bradford Assay)(일리노이주 록포드 소재의 써모 사이언티픽(Thermo Scientific), 제품 #23238)를 제조업체 권고사항에 따라 사용하였다. 다른 경우에는, 소 혈청 알부민을 보정물질로서 사용하여 바이크젤바움(Weichselbaum) 및 고날(Gornall)에 의해 개질된 뷰렛(Biuret) 방법(Weichselbaum, T. Amer. J. Clin. Path. 1960,16:40; Gornall, A. et al. J. Biol. Chem. 1949, 177:752)을 사용하여 총 단백질을 측정하였다.

D. ABTS를 사용하는 글루코스 결정

글루코스 결정을 위한 ABTS(2, 2'-아지노-비스(3-에틸렌티아졸린-6)-설폰산) 어세이는, 글루코스 옥시다아제가 O₂의 존재 하에 화학양론적 양의 과산화수소(H₂O₂)를 생성시키면서 글루코스의 산화를 촉매한다는 원리에 기초한다. 이 반응 후에는 호스 라디시 퍼옥시다아제(HRP)가 촉매하는 ABTS의 산화가 이어지며, 이는 H₂O₂의 농도에 선형으로 관련된다. 산화된 ABTS의 발생은 녹색의 발색에 의해 나타나며, 이는 405 nm의 OD에서 정량화된다. ABTS 분말(시그마, #A1888-5g 2.74 mg/mL), 0.1 U/mL HRP(100 U/mL, 시그마, #P8375), 및 1 U/mL 글루코스 옥시다아제(옥시고(OxyGO)(등록상표) HP L5000, 5000 U/mL, 제넨코 디비전(Genencor Division), 다니스코 USA)의 혼합물을 50 mM Na 아세테이트 완충제(pH 5.0) 중에 제조하고 어두운 곳에 보관하였다(기질). 글루코스 표준(0, 2, 4, 6, 8, 10 nmol)을 50 mM Na 아세테이트 완충제(H 5.0) 중에 제조하고 각각의 표준 10 ㎕를 96-웰 평저(flat bottom) MTP에 삼중 실험으로 첨가하였다. 연속 희석된 샘플 10 ㎕ 또한 MTP에 첨가하였다. 100 ㎕의 ABTS 기질 용액을 각각의 웰에 첨가하고 플레이트를 분광 광도계 플레이트 판독기 상에 놓아 5 min 동안 405 nm에서 ABTS의 산화를 동력학적으로 판독하였다.

대안적으로 15 내지 30 min의 인큐베이션에 이어서 2% SDS를 함유하는 50 mM Na 아세테이트 완충제(pH 5.0)로 반응을 켄칭한 후에 405 nm에서 흡광도를 측정하였다.

E. HPLC에 의한 당 분석

원심분리하여 불용성 재료를 제거하는 단계, 0.22 ㎛ 나일론 필터(스핀-X(Spin-X) 원심분리관 필터, 뉴욕주 코닝 소재의 코닝 인코포레이티드(Corning Incorporated))를 통해 여과하는 단계, 및 가용성 당의 적절한 농도까지 증류수로 희석하는 단계에 의해 바이오매스 당화로부터의 샘플을 제조하였다. 6 x 50 mm SH-1011P 가드 컬럼을 가진 쇼덱스 슈가(Shodex Sugar) SH-G SH1011, 8 x 300 mm(www.shodex.net) 상에서 단량체 당을 결정하였다. 용매는 0.6 mL/min으로 흐르는 0.01 N H₂SO₄였다. 컬럼 온도는 50℃ 였고 검출은 굴절률에 의하였다. 대안적으로, 워터스(Waters) 2410 굴절률 검출기와 함께 바이오라드(Biorad) 아미넥스(Aminex) HPX-87H 컬럼을 사용하여 당을 분석하였다. 분석 시간은 20 min이었고, 주입 부피는 20 ㎕의 희석된 샘플이었으며, 이동상은 0.2 ㎛ 여과하고 탈기시킨 0.01 N 황산이었고, 유속은 0.6 mL/min이었으며 컬럼 온도는 60℃였다. 글루코스, 자일로스, 및 아라비노스의 외부 표준을 각각의 샘플 세트와 함께 진행시켰다.

올리고머성 당은 토소 바이오셉(Tosoh Biosep) G2000PW 컬럼 7.5 mm x 60 cm(www.tosohbioscience.de)를 사용하는 HPLC에서 크기 배제 크로마토그래피에 의해 분리되었다. 용매는 0.6 mL/min에서의 증류수였고 컬럼은 실온에서 진행시켰다. 크기 보정에 사용된 육탄당 표준은 스타키오스, 라피노스, 셀로바이오스, 및 글루코스였고; 오탄당은 자일로헥소오스, 자일로펜토오스, 자일로테트로오스, 자일로트라이오스, 자일로바이오스, 및 자일로스였다. 자일로-올리고머는 메가자임(www.megazyme.com)으로부터 입수하였다. 검출은 굴절률에 의하였으며, 정량적으로 보고된 경우에 결과는 피크 면적 단위 또는 퍼센트에 의한 상대 피크 면적으로서 보고된다.

상기의 원심분리하고 필터 청징화한 샘플의 가수분해에 의해 총 가용성 당을 결정하였다. 청징화한 샘플을 0.8 N H₂SO₄로 1 대 1 희석하고, 생성된 용액을 마개가 있는 바이알 내에서 1 h의 총 주기 시간 동안 121℃로 가압멸균하였다. 결과는 가수분해 중의 단량체 당의 손실에 대한 교정 없이 보고하였다.

F. 속대로부터의 올리고머 제조 및 효소 어세이

50 mM Na 아세테이트 완충제(pH 5.0)(pH는 1 N 황산으로 조정함) 내에서 글루칸 + 자일란 g 당 8 mg의 T. 레세이 Xyn3를 건조 중량 250 g의 묽은 암모니아로 전처리된 옥수수 속대와 함께 인큐베이션함으로써, 옥수수 속대의 T. 레세이 Xyn3 가수분해로부터의 올리고머를 제조하였다. 72 h 동안 48℃에서, 180 rpm으로 회전식 진탕하면서 반응을 진행시켰다. 상청액을 9,000 x G로 원심분리한 후, 0.22 ㎛ 날진(Nalgene) 필터를 통해 여과하여 가용성 당을 회수하였다. 후속의 효소 어세이를 위하여, T. 레세이 Xyn3 올리고머-함유 상청액의 100 ㎕ 분취량을 1 μg/㎕의 T. 레세이 통합 균주 H3A, 1 μg/㎕의 T. 레세이 통합 균주 H3A/EG4#27, 또는 물 대조군과 함께 에펜도르프 튜브 내에서 48℃에서 2.5 h 동안 인큐베이션하였다. 이어서, 상청액을 얼음 냉각 밀리Q(MilliQ) 물로 4X 희석하고, 여과하고, 올리고머로부터의 당 방출에 대해 HPLC로 분석하였다.

G. 옥수수 속대 당화 어세이

본 명세서의 전형적인 실시예에 있어서, 특정 실시예에 대해 달리 구체적으로 기재되지 않는 한, 옥수수 속대 당화는 하기의 절차에 따라 마이크로타이터 플레이트 체제에서 수행하였다. 바이오매스 기질, 예를 들어, 묽은 암모니아로 전처리된 옥수수 속대를 물 중에 희석하고 황산으로 pH를 조정하여 pH 5의 7% 셀룰로오스 슬러리를 생성시킨 후, 이를 추가의 가공 없이 어세이에 직접 사용하였다. 기질(예를 들어, 옥수수 속대) 내의 셀룰로오스의 그램(예를 들어, 상기 실시예 1A에 기재된 방법을 사용하는 것과 같은 관용적인 조성 분석 방법을 사용하여 결정되는 바와 같음) 당 mg 총 단백질에 기초하여 효소 샘플을 로딩하였다. 이어서, 효소를 50 mM 소듐 아세테이트(pH 5.0) 중에 희석하여, 목적하는 로딩 농도를 얻었다. 70 mg의 묽은 암모니아로 전처리된 옥수수 속대(웰 당 7% 셀룰로오스)에 40 ㎕의 효소 용액을 첨가하였다(웰 당 최종 4.5% 셀룰로오스와 등가임). 어세이 플레이트를 알루미늄 플레이트 실러로 덮고, 실온에서 혼합하여 50℃, 200 rpm에서 3 일("3d") 동안 인큐베이션하였다. 인큐베이션 기간의 종료시에, 각각의 웰에 100 ㎕의 100 mM 글리신 완충제(pH 10.0)를 첨가함으로써 당화 반응을 켄칭하였다. 플레이트를 5 min 동안 3,000 rpm으로 원심분리하였다. 이어서, 96-웰 HPLC 플레이트 내에서 10 ㎕의 상청액을 200 ㎕의 밀리Q 물에 첨가하고 HPLC를 사용하여 가용성 당을 측정하였다.

실시예 2: 트리코더마 레세이의 통합 발현 균주의 작제

하기 5개 유전자를 동시발현시킨 트리코더마 레세이의 통합 발현 균주를 작제하였다: T. 레세이 β-글루코시다아제 유전자 bgl1, T. 레세이 엔도자일라나아제 유전자 xyn3, F. 베르티실리오이데스 β-자일로시다아제 유전자 fv3A, F. 베르티실리오이데스 β-자일로시다아제 유전자 fv43D, 및 F. 베르티실리오이데스 α-아라비노푸라노시다아제 유전자 fv51A.

이들 상이한 유전자 및 T. 레세이의 형질전환을 위한 발현 카세트의 작제는 하기에 기재되어 있다.

A. β-글루코시다아제 발현 벡터의 작제

천연 T. 레세이 β-글루코시다아제 유전자 bgl1의 N-말단 부분은 DNA 2.0(미국 소재의 멘로 파크(Menlo Park))에 의해 코돈 최적화되었다. 이 합성 부분은 코딩 영역의 최초 447 염기로 이루어졌다. 프라이머 SK943 및 SK941을 사용하여 이 단편을 PCR 증폭하였다. 프라이머 SK940 및 SK942를 사용하여, T. 레세이 균주 RL-P37로부터 추출된 게놈 DNA 샘플(Sheir-Neiss, G et al. Appl. Microbiol. Biotechnol. 1984, 20:46-53)로부터 천연 bgl1 유전자의 나머지 영역을 PCR 증폭하였다. 프라이머 SK943 및 SK942를 사용하여 bgl1 유전자의 이들 2개 PCR 단편을 융합 PCR 반응 중에 함께 융합시켰다:

순방향 프라이머 SK943: (5'-CACCATGAGATATAGAACAGCTGCCGCT-3')(서열 번호 121)

역방향 프라이머 SK941: (5'-CGACCGCCCTGCGGAGTCTTGCCCAGTGGTCCCGCGACAG-3')(서열 번호 122)

순방향 프라이머(SK940): (5'-CTGTCGCGGGACCACTGGGCAAGACTCCGCAGGG CGGTCG-3')(서열 번호 123)

역방향 프라이머(SK942): (5'-CCTACGCTACCGACAGAGTG-3')(서열 번호 124)

생성된 융합 PCR 단편을 게이트웨이(Gateway)(등록상표) 엔트리 벡터 pENTR(상표)/D-TOPO(등록상표) 내로 클로닝하고, E. 콜라이 원 셧(E. coli One Shot)(등록상표) TOP10 화학적 적격 세포(Chemically Competent cell)(인비트로젠(Invitrogen)) 내로 형질전환시켜 중간체 벡터, pENTR-TOPO-Bgl1-(943/942)(도 8a)를 생성시켰다. 삽입된 DNA의 뉴클레오티드 서열을 결정하였다. 인비트로젠에 의해 약술된 LR 클로나아제(LR clonase)(등록상표) 반응 프로토콜을 사용하여, 정확한 bgl1 서열을 가진 pENTR-943/942 벡터를 pTrex3g와 재조합하였다. LR 클로나아제 반응 혼합물을 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠) 내로 형질전환시켜, 최종 발현 벡터, pTrex3g 943/942(도 8b)를 생성시켰다. 벡터는 또한, T. 레세이의 형질전환에 대한 선택가능한 표지자로서 아세트아미다아제를 암호화하는 아스페르길루스 니둘란스 amdS 유전자를 함유한다. 프라이머 SK745 및 SK771을 이용하는 PCR로 발현 카세트를 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.

순방향 프라이머 SK771: (5'-GTCTAGACTGGAAACGCAAC-3')(서열 번호 125)

역방향 프라이머 SK745: (5'-GAGTTGTGAAGTCGGTAATCC -3') (서열 번호 126)

B. 엔도자일라나아제 발현 카세트의 작제

프라이머 xyn3F-2 및 xyn3R-2를 사용하여, T. 레세이로부터 추출된 게놈 DNA 샘플로부터 천연 T. 레세이 엔도자일라나아제 유전자 xyn3을 PCR 증폭하였다.

순방향 프라이머 xyn3F-2: (5'-CACCATGAAAGCAAACGTCATCTTGTGCCTCCTGG-3')(서열 번호 127)

역방향 프라이머 (xyn3R-2): (5'-CTATTGTAAGATGCCAACAATGCTGTTATATGC CGGCTTGGGG-3')(서열 번호 128)

생성된 PCR 단편을 게이트웨이(등록상표) 엔트리 벡터 pENTR(상표)/D-TOPO(등록상표) 내로 클로닝하고, E. 콜라이 원 셧(등록상표) TOP10 내로 화학적으로 형질전환시켰다(도 8c). 삽입된 DNA의 뉴클레오티드 서열을 결정하였다. 인비트로젠에 의해 약술된 LR 클로나아제(등록상표) 반응 프로토콜을 사용하여, 정확한 xyn3 서열을 가진 pENTR/Xyn3 벡터를 pTrex3g와 재조합하였다. LR 클로나아제 반응 혼합물을 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠) 내로 형질전환시켜, 최종 발현 벡터, pTrex3g/Xyn3(도 8d)를 생성시켰다. 벡터는 또한, T. 레세이의 형질전환에 대한 선택가능한 표지자로서 아세트아미다아제를 암호화하는 아스페르길루스 니둘란스 amdS 유전자를 함유한다. 프라이머 SK745 및 SK822를 이용하는 PCR로 발현 카세트를 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.

순방향 프라이머 SK745: (5'-GAGTTGTGAAGTCGGTAATCC-3')(서열 번호 129)

역방향 프라이머 SK822: (5'-CACGAAGAGCGGCGATTC-3')(서열 번호 130)

C. β-자일로시다아제 Fv3A 발현 벡터의 작제

프라이머 MH124 및 MH125를 사용하여, F. 베르티실리오이데스 게놈 DNA 샘플로부터 F. 베르티실리오이데스 β-자일로시다아제 fv3A 유전자를 증폭하였다.

순방향 프라이머 MH124: (5'-CAC CCA TGC TGC TCA ATC TTC AG -3')(서열 번호 131)

역방향 프라이머 MH125: (5'-TTA CGC AGA CTT GGG GTC TTG AG -3')(서열 번호 132)

PCR 단편을 게이트웨이 (등록상표) 엔트리 벡터 pENTR(상표)/D-TOPO(등록상표) 내로 클로닝하고, E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠) 내로 형질전환시켜 중간체 벡터, pENTR-Fv3A(도 8e)를 생성시켰다. 삽입된 DNA의 뉴클레오티드 서열을 결정하였다. 인비트로젠에 의해 약술된 LR 클로나아제(등록상표) 반응 프로토콜을 사용하여, 정확한 fv3A 서열을 가진 pENTR-Fv3A 벡터를 pTrex6g(도 8f)와 재조합하였다. LR 클로나아제 반응 혼합물을 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠) 내로 형질전환시켜, 최종 발현 벡터, pTrex6g/Fv3A(도 8g)를 생성시켰다. 벡터는 또한, alsR로 표기되는 천연 T. 레세이 아세토락테이트 신타아제(als) 유전자의 클로리무론 에틸 내성 돌연변이체를 함유하며, 이는 그의 천연 프로모터 및 터미네이터와 함께 T. 레세이 의 형질전환에 대한 선택가능한 표지자로서 사용된다(제WO2008/039370 A1호). 프라이머 SK1334, SK1335, 및 SK1299로 발현 카세트를 PCR 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.

순방향 프라이머 SK1334: (5'-GCTTGAGTGTATCGTGTAAG -3')(서열 번호 133)

순방향 프라이머 SK1335: (5'-GCAACGGCAAAGCCCCACTTC -3')(서열 번호 134)

역방향 프라이머 SK1299: (5'-GTAGCGGCCGCCTCATCTCATCTCATCCATCC -3')(서열 번호 135)

D. β-자일로시다아제 Fv43D 발현 카세트의 작제

F. 베르티실리오이데스 β-자일로시다아제 Fv43D 발현 카세트의 작제를 위하여, 프라이머 SK1322 및 SK1297을 사용하여 F. 베르티실리오이데스 게놈 DNA 샘플로부터 fv43D 유전자 산물을 증폭하였다. 프라이머 SK1236 및 SK1321을 사용하여, 균주 RL-P37로부터 추출된 T. 레세이 게놈 DNA 샘플로부터 엔도글루카나아제 유전자 egl1의 프로모터의 영역을 PCR로 증폭하였다. 이어서, 프라이머 SK1236 및 SK1297을 사용하여, 융합 PCR 반응 중에 이들 2개의 PCR 증폭된 DNA 단편을 함께 융합시켰다. 생성된 융합 PCR 단편을 pCR-Blunt II-TOPO 벡터(인비트로젠) 내로 클로닝하여 플라스미드 TOPO Blunt/Pegl1-Fv43D(도 8h)를 제공하고, 이 플라스미드를 사용하여 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠)를 형질전환시켰다. 몇몇 E. 콜라이 클론으로부터 플라스미드 DNA를 추출하고 제한효소 분해(restriction digest)로 확인하였다.

순방향 프라이머 SK1322: (5'-CACCATGCAGCTCAAGTTTCTGTC-3')(서열 번호 136)

역방향 프라이머 SK1297: (5'-GGTTACTAGTCAACTGCCCGTTCTGTAGCGAG-3')(서열 번호 137)

순방향 프라이머 SK1236: (5'-CATGCGATCGCGACGTTTTGGTCAGGTCG-3')(서열 번호 138)

역방향 프라이머 SK1321: (5'-GACAGAAACTTGAGCTGCATGGTGTGGGACA ACAAGAAGG-3')(서열 번호 139)

TOPO Blunt/Pegl1-Fv43D로부터 프라이머 SK1236 및 SK1297로 발현 카세트를 PCR 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.

E. α- 아라비노푸라노시다아제 발현 카세트의 작제

F. 베르티실리오이데스 α-아라비노푸라노시다아제 유전자 fv51A 발현 카세트의 작제를 위하여, 프라이머 SK1159 및 SK1289를 사용하여 F. 베르티실리오이데스 게놈 DNA로부터 fv51A 유전자 산물을 증폭하였다. 프라이머 SK1236 및 SK1262를 사용하여, 균주 RL-P37로부터 추출된 T. 레세이 게놈 DNA 샘플로부터 엔도글루카나아제 유전자 egl1의 프로모터의 영역을 PCR로 증폭하였다. 이어서, 프라이머 SK1236 및 SK1289를 사용하여, 융합 PCR 반응 중에 이들 2개의 PCR 증폭된 DNA 단편을 함께 융합시켰다. 생성된 융합 PCR 단편을 pCR-Blunt II-TOPO 벡터(인비트로젠) 내로 클로닝하여 플라스미드 TOPO Blunt/Pegl1-Fv51A(도 8i)를 제공하고, 이 플라스미드를 사용하여 E. 콜라이 원 셧(등록상표) TOP10 화학적 적격 세포(인비트로젠)를 형질전환시켰다.

순방향 프라이머 SK1159: (5'-CACCATGGTTCGCTTCAGTTCAATCCTAG-3')(서열 번호 140)

역방향 프라이머 SK1289: (5'-GTGGCTAGAAGATATCCAACAC-3')(서열 번호 141)

순방향 프라이머 SK1236: (5'-CATGCGATCGCGACGTTTTGGTCAGGTCG-3')(서열 번호 142)

역방향 프라이머 SK1262: (5'-GAACTGAAGCGAACCATGGTGTGGGACAACAAGAA GGAC-3')(서열 번호 143)

프라이머 SK1298 및 SK1289로 발현 카세트를 PCR 증폭하여 T. 레세이의 형질전환을 위한 산물을 생성시켰다.

순방향 프라이머 SK1298: (5'-GTAGTTATGCGCATGCTAGAC-')(서열 번호 144)

역방향 프라이머 SK1289: (5'-GTGGCTAGAAGATATCCAACAC-3')(서열 번호 145)

F. β-글루코시다아제 및 엔도자일라나아제를 위한 T. 레세이 발현 카세트의 동시형질전환

RL-P37로부터 유도되고(Sheir-Neiss, G et al. Appl. Microbiol. Biotechnol. 1984, 20:46-53) 높은 셀룰라아제 생성에 대해 선택된 트리코더마 레세이 돌연변이체 균주를, PEG-매개 형질전환(Penttila, M et al. Gene 1987, 61(2):155-64)을 사용하여 β-글루코시다아제 발현 카세트(cbh1 프로모터, T. 레세이 b-글루코시다아제1 유전자, cbh1 터미네이터, 및 amdS 표지자) 및 엔도자일라나아제 발현 카세트(cbh1 프로모터, T. 레세이 xyn3, 및 cbh1 터미네이터)로 동시형질전환시켰다. 다수의 형질전환체를 단리하여 b-글루코시다아제 및 엔도자일라나아제 생성에 대해 시험하였다. 다른 발현 카세트를 이용하는 형질전환에는 T. 레세이 균주 #229로 명명된 하나의 형질전환체를 사용하였다.

G. 2개의 β-자일로시다아제 및 하나의 α-아라비노푸라노시다아제를 위한 발현 카세트를 이용한 T. 레세이 균주 #229의 동시형질전환

T. 레세이 균주 #229를, 전기천공법(예를 들어, 제WO 08153712호 참조)을 사용하여 β-자일로시다아제 fv3A 발현 카세트(cbh1 프로모터, fv3A 유전자, cbh1 터미네이터, 및 alsR 표지자), β-자일로시다아제 fv43D 발현 카세트(egl1 프로모터, fv43D 유전자, 천연 fv43D 터미네이터), 및 fv51A α-아라비노푸라노시다아제 발현 카세트(egl1 프로모터, fv51A 유전자, fv51A 천연 터미네이터)로 동시형질전환시켰다. 클로리무론 에틸(80 ppm)을 함유하는 보겔스(Vogels) 아가 플레이트 상에서 형질전환체를 선택하였다. 보겔스 아가는 하기와 같이 제조하였다(리터 당):

50 x 보겔스 스톡 용액(하기 조제법) 20 mL

BBL 아가 20 g

탈이온 H₂O로 980 mL까지 채움

멸균 후 첨가:

50% 글루코스 20 mL

50 x 보겔스 스톡 용액(리터 당):

750 mL 탈이온 H2O 중에, 하기와 같이 이어서 용해시킴:

Na₃시트레이트*2H₂O 125 g

KH₂PO₄(무수) 250 g

NH₄NO₃(무수) 100 g

MgSO₄*7H₂O 10 g

CaCl₂*2H₂O 5 g

보겔스 미량 요소 용액(하기 조제법) 5 mL

d-바이오틴 0.1 g

탈이온 H₂O로 1 L까지 채움

보겔스 미량 요소 용액:

시트르산 50 g

ZnSO₄.*7H₂O 50 g

Fe(NH₄)2SO₄.*6H₂O 10 g

CuSO₄.5H₂O 2.5 g

MnSO₄.4H₂O 0.5 g

H₃BO₃ 0.5 g

Na₂MoO₄.2H₂O 0.5 g

다수의 형질전환체를 단리하여 β- 자일로시다아제 및 L-α-아라비노푸라노시다아제 생성에 대해 시험하였다. 형질전환체를 또한, 실시예 1(상기)에 기재된 속대 당화 어세이에 따라 바이오매스 전환 성능에 대해 스크리닝하였다. 본 명세서에 기재된 T. 레세이 통합 발현 균주의 예는 H3A, 39A, A10A, 11A, 및 G9A이며, 이들은 T. 레세이 베타-글루코시다아제 1, T. 레세이 Xyn3, Fv3A, Fv51A, 및 Fv43D를 위한 모든 유전자를 상이한 비율로 발현시킨다. 다른 통합 T. 레세이 균주는 T. 레세이 베타-글루코시다아제 1, T. 레세이 Xyn3, Fv3A, Fv51A, 및 Fv43D를 위한 유전자의 대부분이 상이한 비율로 발현된 것들을 포함한다. 예를 들어, 웨스턴 블롯(Western Blot)에 의해 결정할 때, 하나는 과발현 T. 레세이 Xyn3이 결여되었고; 다른 하나는 Fv51A가 결여되었으며; 다른 2개는 Fv3A가 결여되었고, 하나는 과발현 Bgl1이 결여되었다(예를 들어 균주 H3A-5).

H. T. 레세이 통합 균주 H3A의 조성

T. 레세이 통합 균주 H3A의 발효는 하기의 단백질 T. 레세이 Xyn3, T. 레세이 Bgl 1, Fv3A, Fv51A, 및 Fv43D를 본 명세서에 기재되고 도 9에 나타낸 바와 같이 결정된 비율로 생성시킨다.

I. HPLC에 의한 단백질 분석

액체 크로마토그래피(LC) 및 질량 분석법(MS)을 수행하여, 발효 브로스 내에 함유된 효소를 분리하고, 동정하고, 정량화하였다. 효소 샘플을 S. 플리카투스(S. plicatus)(예를 들어, NEB P0702L)로부터 재조합에 의해 발현된 endoH 글리코시다아제로 먼저 처리하였다. EndoH는 μg 샘플 총 단백질 당 0.01 내지 0.03 μg endoH 단백질의 비율로 사용하였고, 3 h 동안 37℃에서(pH 4.5 내지 6.0) 인큐베이션하여 HPLC 분석 전에 N-연결된 글리코실화를 효소적으로 제거하였다. 이어서, HIC-페닐 컬럼 및 35 min에 걸친 고농도 염-대-저농도 염 구배를 가진 애질런트(Agilent) 1100 HPLC 시스템을 사용하는 소수성 상호작용 크로마토그래피를 위해 대략 50 μg의 단백질을 주입하였다. 고농도 염 완충제 A(20 mM 포타슘 포스페이트(pH 6.75)를 함유하는 4 M 암모늄 설페이트) 및 저농도 염 완충제 B(20 mM 포타슘 포스페이트(pH 6.75))를 사용하여 구배를 달성하였다. UV 광으로 222 nm에서 피크를 검출하였고, 분획을 수집하여 질량 분석법으로 동정하였다. 단백질 농도는 샘플의 총 적분 면적에 대한 각각의 피크 면적의 퍼센트로서 보고되어 있다.

J. 묽은 암모니아로 전처리된 옥수수 속대의 당화에 대한, T. 레세이 통합 균주 H3A의 발효 브로스에 정제 단백질을 첨가하는 단계의 효과

정제 단백질(및 하나의 비정제 단백질)을 스톡 용액으로부터 연속 희석하고 T. 레세이 통합 균주 H3A의 발효 브로스에 첨가하여, 전처리된 바이오매스의 당화에 대한 그의 이익을 결정하였다. 묽은 암모니아로 전처리된 옥수수 속대를 20% 고체(w/w)(웰 당 ~5 mg의 셀룰로오스)(pH 5)로 마이크로타이터 플레이트(MTP) 웰 내에 로딩하였다. 각각의 웰에 H3A 단백질(발효 브로스의 형태)을 20 mg 단백질/g 셀룰로오스로 첨가하였다. 10, 5, 2, 및 1 ㎕의 부피의 각각의 희석된 단백질(도 10)을 개별적인 웰 내에 첨가하고, 각각의 웰에 대한 액체 첨가가 총 10 ㎕이도록 물을 첨가하였다. 대조 웰은 10 ㎕의 물 또는 부가적인 H3A 발효 브로스 희석액의 첨가를 포함하였다. MTP를 포일로 실링하고 이노바 인큐베이터 진탕기 내에서 200 RPM 진탕을 동반하여 50℃에서 3 일 동안 인큐베이션하였다. 100 ㎕의 100 mM 글리신(pH 10)으로 샘플을 켄칭하였다. 켄칭한 샘플을 플라스틱 시일로 덮고 4℃에서 5 min 동안 3000 RPM으로 원심분리하였다. 켄칭된 반응 혼합물의 분취량(5 ㎕)을 100 ㎕의 물로 희석하고, 반응 혼합물 내에 생성된 글루코스의 농도를 HPLC를 사용하여 결정하였다. 20 mg/g의 H3A에 첨가된 단백질 농도의 함수로서 글루코스 데이터를 플로팅하였다(단백질 첨가의 농도는 상이한 시작 농도 및 부피에 의한 첨가로 인하여 가변적이었음). 결과는 도 11a 내지 11d에 나타낸다.

실시예 3: T. 레세이 균주의 작제

A. T. 레세이 균주 H3A/EG4#27의 작제 및 그에 대한 스크리닝

T. 레세이 egl1(또한 "Cel 7B"라고 명명됨) 프로모터, T. 레세이 eg4(또한 "TrEG4", 또는 "Cel 61A"라고 명명됨) 개방 해독틀, 및 트리코더마 레세이로부터의 cbh1(Cel 7A) 터미네이터 서열(도 12a), 및 아스페르길루스 니게르로부터의 sucA 선택가능한 표지자(Boddy et al., Curr. Genet. 1993, 24:60-66)를 함유하는 발현 카세트를 pCR Blunt II TOPO(인비트로젠) 내로 클로닝하였다(도 12b).

하기의 프라이머를 이용하는 PCR로 발현 카세트 Pegl1 - eg4-sucA를 증폭하였다:

SK1298: 5'-gtagttatgcgcatgctagac-3'(서열 번호 146)

214: 5'-CCGGCTCAGTATCAACCACTAAGCACAT-3'(서열 번호 147)

PCR 반응을 위한 폴리머라아제로서 Pfu Ultra II(스트라타진(Stratagene))를 사용하였다. 퀴아퀵(QIAquick) PCR 정제 키트(퀴아젠(Qiagen))로 제조업체의 프로토콜에 따라 PCR 반응의 산물을 정제하였다. 이어서, 스피드 백(speed vac)을 사용하여 PCR 반응의 산물을 1 내지 3 μg/㎕까지 농축하였다. 형질전환시킬 T. 레세이 숙주 균주(H3A)를 감자 덱스트로스 아가 플레이트 상에서 5 d 동안 28℃에서 완전 포자형성까지 성장시켰다. 2개 플레이트로부터의 포자를 밀리Q 물로 수확하고 40 ㎛ 세포 스트레이너(BD 팔콘(BD Falcon))를 통해 여과하였다. 포자를 50 mL 원추형 튜브에 이전하고 반복 원심분리에 의해 50 mL 물로 3회 세척하였다. 1.1 M 소르비톨 용액으로 최종 세척을 실행하였다. 1.1 M 소르비톨 용액을 사용하여 작은 부피(펠렛 부피의 2배 미만)에 포자를 재현탁하였다. 이어서, 포자 현탁액을 얼음 상에 보관하였다. 포자 현탁액(60 ㎕)을 10 내지 20 μg의 DNA와 혼합하고, 전기천공법 큐벳(인비트로젠으로부터의 E-셧(E-shot), 0.1 cm 표준 전기천공법 큐벳) 내에 이전하였다. 16 kV/cm, 25 μF, 400 Ω의 설정으로 바이오라드 진 펄서 X셀(Gene Pulser Xcell)을 사용하여 포자를 전기천공하였다. 전기천공법 후에, 포자 현탁액에 1 mL의 1.1.M 소르비톨 용액을 첨가하였다. 탄소 공급원으로서 2% 수크로스를 함유하는 보겔스 아가 상에 포자 현탁액을 플레이팅하였다(실시예 2G 참조).

형질전환 플레이트를 30℃에서 5 내지 7 d 동안 인큐베이션하였다. 초기 형질전환체를 수크로스가 있는 2차 보겔스 아가 플레이트 상에 재도말하고 30℃에서 부가적인 5 내지 7 d 동안 성장시켰다. 2차 선택 플레이트 상에서 성장하는 단일 콜로니를, 이어서 마이크로타이터 플레이트의 웰 내에서 제WO/2009/114380호에 기재된 방법을 사용하여 성장시켰다. 상청액을 SDS-PAGE 상에서 분석하여 당화 성능 스크리닝 전에 발현 수준을 확인하였다.

총 94개의 형질전환체가 균주 H3A 내에서 EG4를 과발현시켰다. 2개의 H3A 대조군 균주를 H3A/EG4 균주와 함께 마이크로타이터 플레이트 내에서 성장시켰다. 암모니아로 전처리된 옥수수 속대를 사용하여, EG4 단백질을 발현시키는 T. 레세이 균주의 성능 스크리닝을 수행하였다. 묽은 암모니아로 전처리된 옥수수 속대를 물 중에 현탁하고 황산을 이용하여 pH 5.0으로 조정하여 7% 셀룰로오스를 달성하였다. 슬러리를 평저 96 웰 마이크로타이터 플레이트(넌크(Nunc), 269787) 내에 분주하고 3,000 rpm에서 5 min 동안 원심분리하였다.

기질의 웰 당 20 ㎕의 H3A 또는 H3A/EG4 균주 배양 브로스를 첨가함으로써 옥수수 속대 당화 반응을 개시하였다. 옥수수 속대 당화 반응 혼합물을 알루미늄(E&K 사이언티픽(E&K scientific))으로 실링하고 5 min 동안 650 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 72 h 동안 이노바 인큐베이터에 넣어 두었다. 72-h 당화의 종료시에, 100 ㎕의 100 mM 글리신(pH 10.0)을 첨가함으로써 반응을 켄칭하였다. 이어서, 플레이트를 완전히 혼합하고 3,000 rpm에서 5 min 동안 원심분리하였다. HPLC 96-웰 마이크로타이터 플레이트(애질런트, 5042-1385) 내에서 200 ㎕의 물에 상청액(10 μL)을 첨가하였다. 가드 컬럼이 사전-설치된 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098)을 사용하여 HPLC로 글루코스, 자일로스, 셀로바이오스, 및 자일로바이오스 농도를 측정하였다.

옥수수 속대에 대한 스크리닝에 의해 하기의 H3A/EG4 균주가 H3A 대조군 균주에 비교하여 개선된 글루칸 및 자일란 전환을 갖는 것으로 동정되었다: 1, 2, 3, 4, 5, 6, 14, 22, 27, 43, 및 49(도 13).

선택된 H3A/EG4 균주를 진탕 플라스크 내에서 재성장시켰다. 진탕 플라스크 당 균주 당 총 30 mL의 단백질 배양 여과액을 수집하였다. 10 kDa 막 원심 농축기(사토리우스(Sartorious), VS2001)를 사용하여 배양 여과액을 10배 농축하고 실시예 1C에 기재된 바와 같이 BCA에 의해 총 단백질 농도를 결정하였다. 옥수수 속대 기질의 웰 당 셀룰로오스의 g 당 H3A/EG4 균주 샘플로부터의 단백질 2.5, 5, 10, 또는 20 mg을 사용하여 옥수수 속대 당화 반응을 수행하였다. 14 L 발효 규모에서 생성된 H3A 균주, 및 진탕 플라스크 규모에서 생성된 사전에 동정된 저성능 샘플(H3A/EG4 균주 #20)이 대조군으로서 포함되었다. 실시예 4(하기)에 기재된 바와 같이 당화 반응을 실행하였다. 모든 EG4 발현 균주로부터의 배양 상청액에 대하여, 단백질 용량의 증가에 따른 글루칸 전환의 증가가 관찰되었다(도 14). T. 레세이 통합 균주 H3A/EG4#27을 부가적인 당화 반응에 사용하였으며, 균주는 단일 콜로니를 감자 덱스트로스 플레이트(그로부터 단일 콜로니가 단리됨) 상에 도말함으로써 정제하였다.

실시예 4: 묽은 암모니아로 전처리된 옥수수 속대의 개선된 당화를 위한 T. 레세이 EG4 농도의 범위

바람직한 용량을 결정하기 위하여, T. 레세이 통합 균주 H3A/EG4 #27 또는 반응 혼합물에 첨가된 정제 EG4를 가진 H3A로부터의 발효 브로스를 사용하여 pH 5.3에서 묽은 암모니아로 전처리된 옥수수 속대(25% 고체, 8.7% 셀룰로오스, 7.3% 자일란)의 가수분해를 수행하였다. T. 레세이 통합 균주 H3A/EG4 #27 또는 H3A의 총 로딩은 글루칸(G) 및 자일란(X)의 그램 당 14 mg 단백질이었다.

도 15, 17a, 및 17b의 투여 차트에 따라 5 mL의 총 반응 부피로 20 mL 섬광 바이알 내에 반응 혼합물(총 질량 5 g)을 로딩하였다.

실험 1을 위한 구성을 도 15에 나타낸다. 원추형 튜브 내에서 밀리Q 물 및 6 N 황산을 혼합하여 각각의 바이알에 첨가하고 바이알을 선회시켜 내용물을 혼합하였다. 효소 샘플을 바이알에 첨가하고 바이알을 6 d 동안 50℃에서 인큐베이션하였다. 다양한 시점에서, 100㎕의 샘플을 바이알로부터 채취하여 900 ㎕의 5mM 황산으로 희석하고, 보텍싱하고, 원심분리하고, HPLC를 사용하여 가용성 당의 농도를 측정하기 위하여 상청액을 사용하였다. 글루칸 및 자일란 전환의 결과를 도 16a 및 16b에 각각 나타낸다.

실험 2를 위한 구성을 도 17a에 나타낸다. 바람직한 EG4 농도를 추가로 결정하기 위하여, T. 레세이 통합 균주 H3A/EG4 #27 또는 반응 혼합물에 첨가된(0.05 내지 1.0 mg 단백질/g G+X의 범위) 정제 EG4를 가진 H3A로부터의 발효 브로스를 사용하여 pH 5.3에서 묽은 암모니아 옥수수 속대(25% 고체, 8.7% 셀룰로오스, 7.3% 자일란)의 당화를 수행하였다 T. 레세이 통합 균주 H3A/EG4 #27 또는 H3A의 총 로딩은 14 mg 단백질/g 글루칸 + 자일란이었다. 실험 결과는 도 18a에 나타낸다.

실험 3을 위한 구성을 도 17b에 나타낸다. T. 레세이 Eg4의 바람직한 농도 범위를 더욱 추가로 적시하기 위하여, T. 레세이 통합 균주 H3A/EG4 #27 또는 0.1 내지 0.5 mg 단백질/g G+X 범위의 농도로 첨가된 정제 EG4를 가진 H3A를 사용하여 pH 5.3에서 묽은 암모니아 옥수수 속대(25% 고체, 8.7% 셀룰로오스, 및 7.3% 자일란)를 가수분해하였다. T. 레세이 통합 균주 H3A/EG4 #27 또는 H3A의 총 로딩은 글루칸 및 자일란의 g 당 14 mg 단백질이었다.

결과는 도 18b에 나타낸다.

실시예 5: 상이한 고체 로딩에서 묽은 암모니아로 전처리된 옥수수 대의 당화에 대한 T. 레세이 Eg4의 효과

묽은 암모니아로 전처리된 옥수수 대를, 7, 10, 15, 20, 및 25% 고체(%S)에서 3 일 동안 50℃, pH 5.3에서 T. 레세이 통합 균주 H3A 또는 H3A/EG4#27로부터의 발효 브로스(14 mg 단백질/g 글루칸 및 자일란)와 함께 인큐베이션하였다(20 mL 바이알 내의 5 g 총 습윤 바이오매스). 상기 실시예 4에 기재된 바와 같이 반응을 실행하였다. 글루코스 및 자일로스를 HPLC로 분석하였다. 결과는 도 19에 나타낸다. 최대 20% 고체의 모든 샘플이 제1일에 가시적으로 액화되었다.

실시예 6: 묽은 암모니아로 전처리된 옥수수 속대의 가수분해에 대한 T. 레세이 EG4의 과발현의 효과

균주 H3A/EG4 # 27 및 H3A로부터의 발효 브로스를 사용하여, 묽은 암모니아로 전처리된 옥수수 속대의 당화에 대한 균주 H3A 내의 T. 레세이 Eg4의 과발현의 효과를 시험하였다. 하기와 같이 20 mL 유리 바이알 내에서 3 g 규모로 옥수수 속대 당화를 수행하였다. 효소 제제, 1 N 황산, 및 50 mM 소듐 아세테이트 완충제(pH 5.0)(0.01% 소듐 아자이드 및 5 mM MnCl₂를 가짐)를 첨가하여, 글루칸 + 자일란 그램 당 1.7 내지 21.0 mg 총 단백질로 변동하는 효소 로딩을 가진, 22% 건조 고체, pH 5.0, 3 g 총 반응 혼합물의 최종 슬러리를 제공하였다. 모든 당화 바이알을 180 rpm 회전을 동반하여 48℃에서 인큐베이션하였다. 72 h 후에, 12 mL의 여과된 밀리Q 물을 각각의 바이알에 첨가하여 전체 당화 반응 혼합물을 5배 희석하였다. 샘플을 14,000 x g에서 5 min 동안 원심분리한 후, 0.22 ㎛ 나일론 필터(스핀-X 원심분리관 필터, 뉴욕주 코닝 소재의 코닝 인코포레이티드)를 통해 여과하고, 여과된 밀리Q 물로 4배 추가 희석하여 최종 20X 희석액을 생성시켰다. 20 ㎕ 주입량을 HPLC로 분석하여 방출된 당을 측정하였다.

T. 레세이 Eg4의 첨가 또는 과발현은 H3A 단독에 비교하여 증진된 자일로스 및 글루코스 단량체 방출을 유발하였다(도 20 및 21). H3A/EG4#27을 상이한 용량으로 첨가하는 단계는, 균주 H3A에 비교하여, 또는 Eg4 + 일정한 1.12 mg Xyn3 / g 글루칸 + 자일란에 비교하여, 증가된 자일로스의 수율을 유발하였다(도 20).

H3A/EG4#27을 상이한 용량으로 첨가하는 단계는, 균주 H3A에 비교하여, 또는 Eg4 + 일정한 1.12 mg Xyn3 / g 글루칸 + 자일란에 비교하여, 증가된 글루코스의 수율을 유발하였다(도 21).

통합 균주 H3A/EG4# 27 또는 H3A에 의한 발효가능한 총 단량체(자일로스, 글루코스, 및 아라비노스) 방출에 대한 T. 레세이 Eg4의 효과를 도 22에 예시한다. H3A/EG4#27 통합 균주는, 통합 균주 H3A에 비교하여, 또는 Eg4 + 1.12 mg Xyn3/g 글루칸 + 자일란에 비교하여, 증진된 발효가능한 총 단량체 방출을 유발하였다.

실시예 7: 정제 T. 레세이 EG4는 묽은 암모니아로 전처리된 옥수수 속대에서 글루코스 방출을 유발한다

0.53 mg Xyn3 / g 글루칸 + 자일란의 존재 또는 부재 하에 1.05 g의 묽은 암모니아로 전처리된 옥수수 속대를 사용하여, 방출된 당의 농도에 대한 정제 T. 레세이 Eg4의 효과를 시험하였다. 실시예 6에 기재된 바와 같이 실험을 수행하였다. 결과는 도 23에 나타낸다. 결과는, 정제 T. 레세이 Eg4가 엔도글루카나아제, 셀로바이오하이드롤라아제, 및 β-글루코시다아제와 같은 다른 셀룰라아제의 작용 없이 글루코스 단량체의 방출을 유발한다는 것을 나타낸다.

또한, 정제 Eg4가 단독으로 첨가된(Xyn3은 첨가하지 않음) 묽은 암모니아로 전처리된 옥수수 속대를 사용하여 당화 실험을 수행하였다. 5 mL 바이알 내에서, 872 ㎕의 50 mM 소듐 아세테이트 완충제(pH 5.0)(0.01% 소듐 아자이드 및 5 mM MnCl₂를 포함함), 165 mg의 묽은 암모니아로 전처리된 옥수수 속대(67.3% 건조 고체, 111 mg의 건조 고체가 첨가됨), 및 16.5 ㎕의 1 N 황산에 3.3 ㎕의 정제 Eg4(15.3 mg/mL)를 첨가하였다. 바이알을 48℃에서 인큐베이션하였으며 180 rpm으로 회전시켰다. 주기적으로 20 ㎕의 분취량을 채취하고, 필터 멸균된 2차 증류수로 10배 희석하고, 나일론 필터를 통해 여과한 후, 다이오넥스(Dionex) 이온 크로마토그래피 시스템 상에서 글루코스 방출에 대해 분석하였다. 기준(authentic) 글루코스 용액을 외부 표준으로서 사용하였다. 결과를 도 24에 나타내며, 이는 정제 Eg4의 첨가가 다른 셀룰라아제 또는 엔도자일라나아제의 부재 하에 48℃에서 72 h 인큐베이션에 걸쳐 묽은 암모니아로 전처리된 옥수수 속대로부터 글루코스 단량체의 방출을 유발함을 나타낸다.

실시예 8: 다양한 기질에 대한 T. 레세이 통합 균주 H3A 및 H3A/EG4 #27의 당화 성능

본 실험에서는, 글루칸 + 자일란의 g 당 14 mg 단백질로 투여된 T. 레세이 통합 균주 H3A 또는 H3A/EG4#27로부터의 발효 브로스를, 하기의 것들을 포함하는 상이한 기질에 대한 당화 성능에 대해 시험하였다: 묽은 암모니아로 전처리된 옥수수 속대, 세척된 묽은 암모니아로 전처리된 옥수수 속대, 암모니아 섬유 팽창된 옥수수 대(AFEX CS: ammonia fiber expanded corn stover), 증기 팽창된 사탕수수 바가스(SEB: steam expanded sugarcane bagasse), 및 크라프트(kraft)-전처리된 종이 펄프 FPP27(침엽수 산업용 미표백 펄프(softwood industrial unbleached pulp) 탈리그닌화-카파 13.5, 글루칸 81.9%, 자일란 8.0%, 클라손 리그닌(klason Lignin) 1.9%), FPP-31(활엽수 미표백 펄프(hardwood unbleached pulp) 탈리그닌화-카파 10.1, 글루칸 75.1%, 자일란 19.1%, 클라손 리그닌 2.2%), 및 FPP-37(침엽수 미표백 펄프 공기 건조-카파 82, 글루칸 71.4%, 자일란 8.7%, 클라손 리그닌 11.3%).

25 mL 유리 바이알 내에 0.1 M 소듐 시트레이트 완충제(pH 5.0) 중의 10 g의 최종 질량으로 당화 반응을 구성하고 50℃, 200 rpm에서 6 d 동안 인큐베이션하였다. 6 d의 종료시에, 100 ㎕의 분취량을 5 mM 황산 중에 1:10 희석하고 샘플을 HPLC로 분석하여 글루코스 및 자일로스 형성을 결정하였다. 결과는 도 25에 나타낸다.

실시예 9: 산으로 전처리된 옥수수 대의 당화에 대한 T. 레세이 EG4의 효과

산으로 전처리된 옥수수 대의 당화에 대한 Eg4의 효과를 시험하였다. 묽은 황산으로 전처리한 옥수수 대(Schell, DJ, et al., Appl. Biochem. Biotechnol. 2003, 105(1-3):69-85)를 NREL로부터 입수하여, 20% 고체로 조정하고 소다회 용액를 첨가하여 pH 5.0으로 조건화하였다. 마이크로타이터 플레이트 내에서 20% 총 고체를 사용하여 전처리된 기질의 당화를 수행하였다. 뷰렛 어세이에 의해 발효 브로스 중의 총 단백질을 측정하였다(상기 실시예 1 참조). 증가하는 양의 T. 레세이 통합 균주 H3A/EG4 #27 및 H3A로부터의 발효 브로스를 기질에 첨가하고, 50℃, 5 d, 200 RPM 진탕에서의 인큐베이션 후에 당화 성능을 측정하였다. HPLC를 사용하여 글루코스 형성(mg/g)을 측정하였다. 결과는 도 26에 나타낸다.

실시예 10: 묽은 암모니아로 전처리된 옥수수 잎, 줄기, 속대에 대한 T. 레세이 통합 균주 H3A 및 H3A/EG4#27의 당화 성능

묽은 암모니아로 전처리된 옥수수 대 잎, 줄기, 또는 속대에 대해 T. 레세이 통합 균주 H3A 및 H3A/EG4#27의 당화 성능을 비교하였다. 제WO06110901A호에 기재된 바와 같이 전처리를 수행하였다. 20 mL 바이알 내에서 글루칸+자일란의 g 당 14 mg 단백질을 사용하여 pH 5.3에서(6 N H₂SO₄로 pH를 조정함) 5 g의 총 질량(7% 고체)을 가수분해하였다. 50℃에서 당화 반응을 실행하고 제4일에 방출된 글루코스 및 자일로스에 대해 HPLC로 샘플을 분석하였다. 결과는 도 27에 나타낸다.

실시예 11: T. 레세이로부터 과발현된 EG4에 의한, 묽은 암모니아로 전처리된 옥수수 속대에 대한 당화 성능

묽은 암모니아로 전처리된 옥수수 속대를 사용하여 3 g 규모로 당화 반응을 수행하였다. 충분한 전처리된 속대 제제를 측정하여 20 mL 유리 바이알에 넣어 0.75 g 건조 고체를 제공하였다. 효소 제제, 1 N 황산, 및 50 mM 소듐 아세테이트 완충제(pH 5.0)(0.01% 소듐 아자이드를 가짐)를 첨가하여 3 g 총 반응 혼합물, 25% 건조 고체, pH 5.0의 최종 슬러리를 제공하였다. Eg4를 과발현시키는 T. 레세이 균주(Δcbh1 Δcbh2 Δeg1 Δeg2)( 국제 특허 공개 제WO 05/001036호 참조)로부터의 비정제 배양물 상청액으로서 부가적인 5%의 14 mg 단백질 로딩의 존재 또는 부재 하에, T. 레세이 통합 균주 H3A로부터의 세포외 단백질(발효 브로스)를 14 mg 단백질/ g(글루칸+자일란)으로 첨가하였다. 당화 반응 혼합물을 72 h 동안 50℃에서 인큐베이션하였다. 인큐베이션 후에, 반응 내용물을 3배 희석하고 여과하여 글루코스 및 자일로스 농도에 대해 HPLC로 분석하였다. 결과는 도 28에 나타낸다. Eg4를 과발현시키는 T. 레세이 균주로부터의 세포외 단백질의 형태로 Eg4 단백질을 H3A에 첨가하는 단계는, 단량체 글루코스의 방출을 실질적으로 증가시켰고 단량체 자일로스의 방출을 미약하게 증가시켰다.

실시예 12: 암모니아로 전처리된 스위치그래스에 대한 균주 H3A/EG4#27의 당화 성능

암모니아로 전처리된 스위치그래스(국제 특허 공개 제WO06110901A호)에 대한 균주 H3A/EG4#27의 당화 성능을, 증가하는 단백질 용량에서 균주 H3A(18.5% 고체)의 것과 비교하였다. 전처리된 스위치그래스 제제를 측정하여 20 mL 유리 바이알에 넣어 0.925 g의 건조 고체를 제공하였다. 1 N 황산 및 50 mM 소듐 아세테이트 완충제(pH 5.3)(0.01% 소듐 아자이드를 가짐)를 첨가하여 5 그램 총 반응 혼합물의 최종 슬러리를 제공하였다. 시험한 H3A의 효소 용량은 14, 20, 및 30 mg/g(글루칸 + 자일란)이었고; H3A-EG4 #27의 용량은 5, 8, 11, 14, 20, 및 30 mg/g(글루칸 + 자일란)이었다. 반응 혼합물은 50℃에서 3 d 동안 인큐베이션하였다. 인큐베이션 후에, 반응 내용물을 3배 희석하고 여과하여 글루코스 및 자일로스 농도에 대해 HPLC로 분석하였다. 스위치그래스 기질의 조성을 기준으로 글루칸 및 자일란의 전환을 계산하였다. 결과(도 29)는, 글루칸 전환에 있어서 H3A-EG4 #27의 성능이 동일한 효소 용량에서의 H3A보다 더 효과적임을 나타낸다.

실시예 13: 옥수수 속대 당화, 및 CMC 및 셀로바이오스 가수분해에 대한 T. 레세이 EG4 첨가의 효과

A. 옥수수 속대 당화:

묽은 암모니아로 전처리된 옥수수 속대를 20% 고체, 7% 셀룰로오스로 조정하고 마이크로타이터 플레이트에 웰 당 65 mg을 분주하였다. T. 레세이 CBH1을 5 mg 단백질/g 글루칸(최종)으로 함유하고, 관련 효소(CBH1 또는 Eg4)를 0, 1, 2, 3, 4, 및 5 mg/g 글루칸의 최종 농도로 함유하는 35 ㎕의 50 mM 소듐 아세테이트(pH 5.0) 완충제를 첨가함으로써 당화 반응을 개시하였다. Eg4 대조군은 EG4 만을 동일한 용량으로 수용하였으며, 따라서 이들 웰 내에 첨가된 총 단백질은 더 적었다. 마이크로타이터 플레이트를 알루미늄 플레이트 시일(E&K 사이언티픽)로 실링하고, 2 min 동안 600 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 72 h 동안 이노바 인큐베이터에 넣어 두었다.

72-h 당화의 종료시에, 100 ㎕의 100 mM 글리신(pH 10.0)을 첨가함으로써 플레이트를 켄칭하였다. 이어서, 플레이트를 3000 rpm에서 5 min 동안 원심분리하였다. HPLC 96 웰 마이크로타이터 플레이트(애질런트 5042-1385) 내에서 상청액(20 ㎕)을 100 ㎕의 물에 첨가하였다. 가드 컬럼이 사전-설치된 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098)을 사용하여 HPLC로 글루코스 및 셀로바이오스 농도를 측정하였다. 100 x (mg 셀로바이오스 + mg 글루코스)/기질 내의 총 글루칸에 의해 %글루칸 전환을 계산하였다(도 30).

B. CMC 가수분해:

카르복시메틸셀룰로오스(CMC, 시그마 C4888)를 50 mM 소듐 아세테이트(pH 5.0)로 1%까지 희석하였다. 96-웰 마이크로타이터 플레이트(넌크 #269787) 내에서, 100 ㎕의 1% CMC에 20, 10, 5, 2.5, 1.25, 및 0 mg/g의 최종 농도로 3개 T. 레세이 정제 효소(EG4, EG1, 및 CBH1) 각각을 별도로 첨가함으로써 가수분해 반응을 개시하였다. 50 mM 소듐 아세테이트(pH 5.0)를 각각의 웰에 첨가하여 150 ㎕의 최종 부피가 되게 하였다. CMC 가수분해 반응 혼합물을 알루미늄 플레이트 시일(E&K 사이언티픽)로 실링하고 2 min 동안 600 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 30 min 동안 이노바 인큐베이터에 넣어 두었다.

30 min 인큐베이션의 종료시에, 플레이트를 10 min 동안 얼음 물에 넣어 반응을 중지시키고, 샘플을 에펜도르프 튜브에 이전하였다. 각각의 튜브에 375 ㎕의 다이니트로살리실산(DNS) 용액을 첨가하였다(하기 참조). 이어서, 샘플을 10 min 동안 끓이고 스펙트라맥스 250(몰리큘라 디바이시즈)으로 540 nm에서 O.D를 측정하였다. 결과는 도 31에 나타낸다.

DNS 용액:

40 g 3.5-다이니트로살리실산(시그마, D0550)

8 g 페놀

2 g 소듐 설파이트(Na2SO3)

800 g Na-K 타르타레이트(로셀 염)

상기의 것들 전부를 2 L의 2% NaOH에 첨가한다

알루미늄 포일로 덮어서 밤새 교반한다

증류 탈이온수를 첨가하여 4 L의 최종 부피가 되게 한다

잘 혼합한다

암색병에 냉장 보관한다

C. 셀로바이오스 가수분해

셀로바이오스를 50 mM 소듐 아세테이트(pH 5.0)로 5 g/L까지 희석하였다. 100 ㎕의 셀로바이오스 용액(5 g/L)에 20, 10, 5, 2.5, 및 0 mg/g의 최종 농도로 2개 효소(EG4 및 BGL1) 각각을 별도로 첨가함으로써 가수분해 반응을 개시하였다. 소듐 아세테이트(pH 5.0)를 각각의 웰에 첨가하여 120 ㎕의 최종 부피가 되게 하였다. 반응 플레이트를 알루미늄 플레이트 시일(E&K 사이언티픽)로 실링하고 2 min 동안 600 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 2 h 동안 이노바 인큐베이터에 넣어 두었다.

2 h 가수분해 단계의 종료시에, 100 ㎕의 100 mM 글리신(pH 10.0)을 첨가함으로써 플레이트를 켄칭하였다. 이어서, 플레이트를 3000 rpm에서 5 min 동안 원심분리하였다. ABTS(2,2'-아지노-비스 3-에틸벤조티아졸린-6-설폰산) 어세이(실시예 1)에 의해 글루코스 농도를 측정하였다. 96-웰 마이크로타이터 플레이트(코닝 코스타(Corning costar) 9017 EIA/RIA 플레이트, 96 웰 평저, 중등도 결합) 내에서 10 ㎕의 상청액을 90 ㎕의 ABTS 용액에 첨가하였다. 스펙트라맥스 250(몰리큘라 디바이시즈)로 OD 420 nm를 측정하였다. 결과는 도 32에 나타낸다.

실시예 14: 다양한 셀룰라아제 혼합물과 혼합될 경우, 정제 EG4는 묽은 암모니아로 전처리된 옥수수 속대로부터의 글루코스 생성을 개선한다

글루칸 + 자일란의 g 당 0.53 mg T. 레세이 Xyn3의 존재 하에 1.05 g의 묽은 암모니아로 전처리된 옥수수 속대를 사용하여, 방출된 당의 농도에 대한 정제 셀룰라아제(T. 레세이 EG1, EG2, CBH1, CBH2, 및 Bgl1)와 조합된 정제 Eg4의 효과를 시험하였다. 0.111 g의 건조 속대 고체(10.5% 고체)를 함유하는 5 mL 바이알 내에 1.06-g 반응을 구성하였다. 효소 제제(도 33), 1 N 황산, 및 50 mM 소듐 아세테이트 완충제(pH 5.0)(0.01% 소듐 아자이드 및 5 mM MnCl₂를 가짐)를 첨가하여 최종 반응 중량을 제공하였다. 반응 바이알을 180 rpm 회전을 동반하여 48℃에서 인큐베이션하였다. 72 h 후에, 여과된 밀리Q 물을 첨가하여 각각의 당화 반응 혼합물을 5배 희석하였다. 샘플을 14,000 x g에서 5 min 동안 원심분리한 후, 0.22 ㎛ 나일론 필터(스핀-X 원심분리관 필터, 뉴욕주 코닝 소재의 코닝 인코포레이티드)를 통해 여과하고, 여과된 밀리-Q 물로 4배 추가 희석하여 최종 20X 희석액을 생성시켰다. 20 ㎕ 주입량을 HPLC로 분석하여 방출된 당(글루코스, 셀로바이오스, 및 자일로스)을 측정하였다.

도 34는 각각의 조합으로 생성시킨 글루코스(a), 글루코스 + 셀로바이오스(b), 또는 자일로스(c)를 나타낸다. 정제 Eg4는 개별적인 셀룰라아제 및 혼합물의 성능을 개선하였다. 모든 정제 셀룰라아제가 존재한 경우, 글루칸 + 자일란 g 당 0.53 mg Eg4의 첨가는 거의 40% 만큼 전환을 개선하였다. CBH1, Egl1, 및 Bgl1의 조합에 Eg4를 첨가한 경우에도 또한 개선이 나타났다. 개별적인 셀룰라아제가 속대와 함께 존재한 경우, 총 글루코스 방출의 절대량은 셀룰라아제의 조합이 속대와 함께 존재한 실험으로부터 유발된 것보다 실질적으로 더 낮았으나, 각각의 경우에 Eg4의 존재 하의 퍼센트 개선은 유의적이었다. 정제 셀룰라아제에 T. 레세이 Eg4를 첨가하는 단계는 총 글루코스 방출에 하기의 퍼센트 개선을 유발하였다: Bgl1(121%), Egl2(112%), CBH2(239%), 및 CBH1(71%). 이는 Eg4가 바이오매스에 대한 셀룰라아제 성능을 개선하는 유의적이고 광범위한 효과를 가졌다는 것을 나타낸다.

실시예 15: EG4를 CBH1, CBH2, 및 EG2와 혼합한 경우에 관찰된 효과(기질: 묽은 암모니아로 전처리된 옥수수 속대)

96-웰 MTP(VWR) 내에서 옥수수 속대(웰 당 65 mg의 20% 고체, 7% 셀룰로오스)에 하기와 같이 효소 혼합물을 첨가함으로써, 묽은 암모니아로 전처리된 옥수수 속대 당화 반응 혼합물을 제조하였다. 80 ㎕의 50 mM 소듐 아세테이트(pH 5.0), 1 mg Bgl1/g 글루칸, 및 0.5 mg Xyn3/g 글루칸 백그라운드(background) 또한 모든 웰에 첨가하였다.

Eg4를 CBH1, CBH2, 및 EG2와 개별적으로 혼합하는 단계의 효과를 시험하기 위하여, CBH1, CBH2, 및 EG2 각각을 0, 1.25, 2.5, 5, 10, 및 20 mg/g 글루칸으로 첨가하고, 각각의 웰에 EG4를 20, 18.75, 17.5, 15, 10, 및 0 mg/g 글루칸의 농도로 첨가하여, 개별적인 웰 내의 총 단백질이 20 mg/g 글루칸이 되게 하였다. 대조군 웰은 CBH1 또는 CBH2 또는 EG2 또는 EG4 만을 동일한 용량으로 수용하였으며, 따라서 이들 웰에 첨가된 총 단백질은 20 mg/g 미만이었다.

셀룰라아제의 조합에 대한 Eg4의 효과를 시험하기 위하여, 상이한 비율(도 35 참조)의 CBH1, CBH2, 및 EG2의 혼합물을 0, 1.25, 2.5, 5, 10, 및 20 mg 단백질/g 글루칸으로 첨가하였고, EG4를 20, 18.75, 17.5, 15, 10, 및 0 mg 단백질/g 글루칸의 농도로 혼합물에 첨가함으로써, 개별적인 웰 내의 총 단백질이 20 mg 단백질/g 글루칸이 되도록 하였다. 상기와 같이, 대조군 웰은 하나의 첨가된 단백질 만을 수용하였으므로 총 단백질 첨가는 20 mg 단백질/g 미만이었다.

옥수수 속대 당화 반응 혼합물을 알루미늄 플레이트 시일(E&K 사이언티픽)로 실링하고 2 min 동안 600 rpm, 24℃에서 혼합하였다. 이어서, 플레이트를 50℃ 및 200 rpm에서 72 h 동안 이노바 44 인큐베이터 진탕기(뉴 브런즈윅 사이언티픽(New Brunswick Scientific))에 넣어 두었다. 72-h 당화 단계의 종료시에, 100 ㎕의 100 mM 글리신(pH 10.0)을 첨가함으로써 플레이트를 켄칭하였다. 이어서, 플레이트를 3000 rpm에서 5 min 동안 원심분리하였다(로탄타(Rotanta) 460R 원심분리기, 헤티히 젠트리퓨겐(Hettich Zentrifugen)). HPLC 96-웰 마이크로타이터 플레이트(애질런트, 5042-1385) 내에서 20 ㎕의 상청액을 100 ㎕의 물에 첨가하였다. 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098) 및 가드 컬럼(바이오라드)을 사용하여, HPLC로 글루코스 및 셀로바이오스 농도를 측정하였다.

결과는 도 36의 표에 나타냈으며, 여기서 글루칸 전환(%)은 100 x (글루코스 + 셀룰로바이오스) / 총 글루칸으로서 정의된다.

본 실험은, Eg4가 CBH1, CBH2, 및/또는 EG2에 첨가될 경우에 묽은 암모니아로 전처리된 옥수수 속대의 당화의 개선에 유익했음을 나타낸다. 또한, Eg4 및 다른 효소(CBH1, CBH2, 또는 EG2)를 동일한 양으로 당화 혼합물에 첨가했을 경우에 최고의 개선이 관찰되었다. 또한, Eg4의 효과가 CBH1 및 CBH2 혼합물에 대해 실질적임이 관찰되었다. Eg4 대 CBH1 및 CBH2의 양이 1:1이었을 때 Eg4에 의한 최적의 개선이 관찰되었다.

실시예 16: EG4는 다양한 셀룰라아제 조성물의 당화 성능을 개선한다.

상업적인 셀룰라아제 효소 제제 스페자임(등록상표) CP, 악셀러라아제(등록상표)1500, 및 악셀러라아제(등록상표)듀엣(DUET)(제넨코 디비전, 다니스코 US)의 총 단백질 농도를 개질된 뷰렛 어세이(본 명세서에 기재됨)에 의해 결정하였다.

정제 T. 레세이 EG4를 각각의 효소 제제에 첨가한 후, 암모니아로 전처리된 옥수수 속대의 25% 고체 로딩을 사용하여, 기질 글루칸 및 자일란의 g 당 14 mg의 총 단백질(글루칸 및 자일란의 g 당 5 mg EG4 + 글루칸 및 자일란의 g 당 9 mg 전체 셀룰라아제)의 용량으로, 당화 성능에 대해 샘플을 어세이하였다. 20 mL 바이알 내에서 5 g의 총 반응 혼합물을 사용하여 pH 5에서, 200 rpm으로 설정된 회전식 진탕기 내에서 7 d 동안 50℃로 인큐베이션하여 당화 반응을 실행하였다. 당화 샘플을 5 mM 황산으로 10x 희석하고, 0.2 ㎛ 필터를 통해 여과한 후, HPLC에 주입하였다. 바이오라드 아미넥스 HPX-87H 이온 배제 컬럼(300 mm x 7.8 mm)을 사용하여 HPLC 분석을 수행하였다.

도 40에 예시된 바와 같이, 전체 셀룰라아제 내로의 정제 EG4의 치환은 시험한 모든 셀룰라아제 제품에서 글루칸 전환을 개선하였다. 도 41에 예시된 바와 같이, 자일란 전환은 Eg4 치환에 의해 영향을 받지 않는 것으로 나타났다.

실시예 17: 바이오매스 당화 중의 점도의 감소

본 실험에 사용된 바이오매스는 하기의 조성(표 2)을 가진 인비콘(Inbicon) 산성화 증기-팽창으로 전처리된 밀짚이었다:

전처리된 밀짚을 물에 희석하고, 황산을 이용하여 pH 5.0로 pH-조정하고, 그것의 10.5%의 고체 수준을, 제1 샘플에서 20.5 mg 단백질/바이오매스 기질 내의 g 셀룰로오스의 총 단백질 농도로 50℃에서 T. 레세이 H3A 균주(도 9)의 발효 브로스와 혼합하거나, 제2 샘플에서 18.5 mg 단백질/바이오매스 기질 내의 g 셀룰로오스의 총 단백질 농도로 T. 레세이 H3A(도 9)의 발효 브로스 및 2 mg/g 셀룰로오스의 정제 T. 레세이 Eg4와 혼합하였다. 브룩필드 점도계(브룩필드 엔지니어링 인코포레이티드)를 사용하여 최대 약 6 h 동안 점도 변화를 관찰하면서 점도 감소를 측정하였다. 결과는 도 42에 나타낸다.

실시예 18: 바이오매스 당화 중의 점도의 감소

본 실험에 사용된 바이오매스는 NREL로부터의 묽은 산으로 전처리된 옥수수 대(세척하지 않은 PCS)였다.

세척하지 않은 전처리된 옥수수 대를 50℃의 온도, 5.0의 pH, 및 20% 건조 고체의 고체 수준에서, 제1 샘플에서는 20 mg/바이오매스 기질 내의 g 셀룰로오스의 총 단백질 농도로 T. 레세이 H3A 균주(도 9)의 발효 브로스와 혼합하고, 제2 샘플에서는 또한 20 mg/g 셀룰로오스로 T. 레세이 H3A/Eg4 #27 통합 균주의 발효 브로스와 혼합하였다. 브룩필드 점도계(브룩필드 엔지니어링 인코포레이티드)를 사용하여 최대 160 h에 걸쳐 점도 변화를 관찰하면서 점도 감소를 측정하였다. 결과는 도 43에 나타낸다.

실시예 19: 바이오매스 당화 중의 점도의 감소

본 실험에 사용된 바이오매스는 묽은 암모니아로 전처리된 옥수수 속대였다.

하기 2개의 고체 로딩 조건에서 묽은 암모니아로 전처리된 옥수수 속대를 효소 조성물과 혼합하였다: 25% 건조 고체 및 30% 건조 고체. 구체적으로, 전처리된 바이오매스를 50℃ 및 pH 5.0에서 T. 레세이 H3A(도 9) 또는 H3A/Eg4 #27 균주의 발효 브로스로부터의 14 mg 단백질/g 셀룰로오스와 혼합하였다. 브룩필드 점도계(브룩필드 엔지니어링 인코포레이티드)를 사용하여 점도 감소를 측정하였다. 결과는 도 44에 나타낸다.

실시예 20: 당화 공정 중의 점도 감소 및 글루코스 생성에 대한 다양한 셀룰라아제의 효과 결정

본 연구는 당화 공정에 옵티매쉬(OPTIMASH)(상표) BG, 옵티매쉬(상표) TBG, 옵티매쉬(상표) VR과 같은 다양한 점도 감소 효소; 또는 악셀러라아제(등록상표) BG와 같은 베타-글루코시다아제를 바이오매스 기질 내의 g 셀룰로오스사용하였으며, 글루코스 생성 및 점도 감소에 대한 이들 점도 감소 효소의 효과를 결정하였다. H3A/EG4 통합 균주 #27로부터 생성된 효소 조성물 또한 포함되었다. 악셀러라아제(등록상표) 1500, 악셀러라아제(등록상표) 듀엣, 악셀러라아제(등록상표) BG, 옵티매쉬(상표) BG, 옵티매쉬(상표) TBG, 및 옵티매쉬(상표) VR은 다니스코 US 인코포레이티드, 제넨코로부터 입수가능한 제품이었다.

상기와 같이 전처리된 밀짚을 사용하였다. 조성물 분석을 수행하고 표 2에 열거하였다(실시예 17 참조).

전처리된 밀짚(25% 건조물)을 다양한 효소와 함께 반응 챔버 내에서 인큐베이션함으로써 당화 공정을 수행하였다. 문헌[Larsen et al., The IBUS Process- Lignocellulosic Bioethanol Close to A commercial Reality, (2008) Chem. Eng. Tech. 31(5):765-772]을 참조한다. 실험 조건은 표 3 및 4에 나타낸다. 각각의 챔버에서, 총 질량은 10 kg이었다. 밀짚의 초기 pH는 약 3.50였으며, Na₂CO₃를 첨가함으로써 pH 5.0으로 조정하였다. 시간에 따라 글루코스 농도를 측정하고 셀룰로오스 전환을 계산하였다.

[표 3]

[표 4]

첫번째 날("제1일")에는 실험 조건 1 내지 6을 수행하였고, 두번째 날("제2일")에는 실험 조건 7 내지 12를 수행하였다.

각각의 실험 조건에 있어서 글루코스 농도는 6 시간 당화 후에 측정하였다. 악셀러라아제(등록상표) 듀엣은 0.25 mL/g 셀룰로오스에서 6-h 당화 후에 40.8 g 글루코스/kg을 유발하였다. 도 45를 참조한다. 악셀러라아제(등록상표) 듀엣 + 옵티매쉬 BG(또는 TBG)(0.15 + 6)(즉, 0.15 mL 악셀러라아제(등록상표) 듀엣/g 셀룰로오스 + 6 g 옵티매쉬 BG(또는 TBG) / kg 건조물)에 대한 글루코스 농도는 0.22 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 1500에 대한 글루코스 농도와 유사하였다. 도 45를 참조한다. 0.15 + 6에서의 악셀러라아제(등록상표) 듀엣 + 악셀러라아제 BG(즉, 0.15 mL 악셀러라아제(등록상표) 듀엣/g 셀룰로오스 + 6 g 악셀러라아제 BG / kg 건조물)에 대한 글루코스 농도는 0.22 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 1500에 대한 글루코스 농도와 유사하였으며 0.15 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 듀엣에 대한 글루코스 농도보다 더 높았다. 도 45를 참조한다. 높은 농도의 악셀러라아제(등록상표) BG는 당화 반응 혼합물의 점도를 감소시킬 수 있었다. H3A/EG4 #27의 발효로부터 생성된 효소 조성물을 0.15 mL/g 셀룰로오스의 양으로 사용하여, 6-h 당화 후에 37.5 g/kg의 글루코스를 생성시켰으며, 이는 0.22 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 1500 및 0.15 mL/g 셀룰로오스에서의 악셀러라아제(등록상표) 듀엣에 대한 글루코스 생성보다 실질적으로 더 높았다. 도 45를 참조한다.

제1일의 실험의 다양한 실험 조건에 대한 글루코스 농도를 24-h 당화 후에 다시 측정하였다. 도 46을 참조한다. 제2일의 실험에서 실험 조건 7 내지 12에 대해 글루코스 농도 및 셀룰로오스 전환을 시간에 따라 측정하였으며, 결과는 도 47 및 48에 나타낸다.

제1일의 실험에서 점도는 6-h 당화 후에 육안으로 관찰하였으며, 표 6에 요약되어 있다. 더 많은 "+"는 덜 점성인 당화 반응 혼합물을 나타낸다. 일반적으로, 덜 점성인 당화 반응 혼합물(예를 들어, 더 묽은 슬러리)은 더 많은 글루코스 생성과 관련되었다.

[표 6]

제2일의 실험에서 다양한 챔버 내의 당화 반응 혼합물의 점도를, 각각의 챔버 내의 금속 부분의 가시성을 기준으로 육안으로 관찰하였다. 50℃에서 6-일의 당화 후에, 챔버 3 내의 당화 혼합물(실험 조건 9, 0.15 mL/g 셀룰로오스의 악셀러라아제(등록상표) 듀엣)은 챔버 1(실험 조건 7) 또는 2(실험 조건 8, 0.22 mL/g 셀룰로오스의 악셀러라아제(등록상표) 1500) 내의 당화 혼합물보다 더 점성이었다. 챔버 3 내의 금속 부분은 볼 수 없었다. 챔버 4 내의 당화 혼합물(실험 조건 10, 0.15 mL/g 셀룰로오스의 악셀러라아제 듀엣(등록상표) + 0.1 g/kg 건조물의 악셀러라아제(등록상표) BG)의 점도는 챔버 3 내의 당화 혼합물(0.15 mL/g 셀룰로오스의 악셀러라아제(등록상표) 듀엣)의 점도에 비교하여 감소되었다. 챔버 5 내의 당화 혼합물(실험 조건 11, 0.15 mL/g 셀룰로오스의 악셀러라아제 듀엣(등록상표) + 6 g/kg 건조물의 악셀러라아제 BG)의 점도는 챔버 4 내의 당화 혼합물(0.15 mL/g 셀룰로오스의 악셀러라아제(등록상표) 듀엣 + 0.1 g/kg 건조물의 악셀러라아제 BG)의 점도에 비교하여 더 감소되었다. 악셀러라아제 BG의 많은 양에도 불구하고, 당화 혼합물(챔버 5, 0.15 mL/g 셀룰로오스의 악셀러라아제 듀엣(등록상표) + 6 g/kg 건조물의 악셀러라아제 BG)은 0.22 mL/g 셀룰로오스의 악셀러라아제(등록상표) 1500(챔버 1 및 2)보다 여전히 더 점성이었다. . 그러나, H3A/EG4 #27의 발효로부터 생성된 효소 조성물의 첨가로, 당화 혼합물(챔버 6)의 점도가 챔버 4 또는 5 내의 당화 혼합물의 점도에 비교하여 실질적으로 감소했음이 의외로 밝혀졌다. 챔버 6 내의 금속 부분을 볼 수 있었다.

실시예 21: 당화 공정 중의 점도 감소 및 글루코스 생성에 대한 다양한 셀룰라아제의 효과 결정

인비콘 전처리된 밀짚(25% 건조물)을 다양한 효소와 함께 반응 챔버 내에서 인큐베이션함으로써 당화 공정을 수행하였다. 실험 조건은 표 7에 나타낸다. 각각의 챔버에서, 총 질량은 10 kg이다. 밀짚의 초기 pH는 약 3.50였으며, Na₂CO₃를 첨가함으로써 pH 5.0으로 조정하였다. 악셀러라아제(등록상표) 1500, 악셀러라아제(등록상표) 듀엣, 악셀러라아제(등록상표) BG, 옵티매쉬(상표) BG, 및 프리마패스트(등록상표) 루나(Luna)는 제넨코로부터 입수가능한 제품이다.

[표 7]

6 h, 24 h, 50 h, 및 6 d의 당화 후에 글루코스 농도를 측정하였다. 6 h, 24 h, 50 h, 및 6 d의 당화 후에 당화 반응 혼합물의 점도를 육안으로 관찰하고 당업자에게 공지된 방법을 사용하여 점도계로 측정하였다.

실험 조건 3 내지 16 각각의 글루코스 생성은 실험 조건 1의 글루코스 생성에 비교하여 증가된 것으로 밝혀졌다. 실험 조건 3 내지 16 각각의 점도는 실험 조건 1의 점도에 비교하여 감소된 것으로 추가로 밝혀졌다.

본 연구는 또한, 상기와 동일한 실험 조건을 이용하지만 장기적인 예비-가수분해 시간(예를 들어, 6 h, 9 h, 12 h, 24 h) 후에 당화 공정 중의 글루코스 생성 및 점도 감소를 시험하였다.

실시예 22: CBH1 및 EG4에 의한 아비셀 가수분해에 대한 아스코르브산 효과

도 39a에 열거하여 기재된 바와 같이, 정제 T. 레세이 CBH1(5 mg/g 최종 농도), 정제 T. 레세이 Eg4(10 mg/g 최종 농도), 아스코르브산(50 mM 스톡, 8.8 g/L 최종 농도), 및 망간 용액(10 mM 최종 농도)의 조합을 함께 혼합함으로써, 결정질 셀룰로오스(50mM 소듐 아세테이트(pH 5.0) 중의 10% 아비셀 50 ㎕) 반응을 개시하였다. 50 mM 소듐 아세테이트 완충제(pH 5.0)를 각각의 샘플에 첨가하여 300 μL의 최종 부피가 되게 하였다.

반응 에펜도르프 튜브를 보텍싱한 후, 50℃, 200 rpm에서 이노바 44 인큐베이터(뉴 브런즈윅 사이언티픽)에 넣어 두었다. 3개의 시점(2.5, 4.5, 24 h)에 각각의 튜브로부터 50 μL 샘플을 취하여 50 ㎕의 100 mM 글리신 완충제(pH 10.0)로 켄칭하였다. 샘플을 3000 rpm에서 5 분 동안 원심분리하고(로탄타 460R 원심분리기, 헤티히 젠트리퓨겐), HPLC 96-웰 마이크로타이터 플레이트(애질런트, 5042-1385) 내에서 상청액(20 μL)을 100 ㎕의 물에 첨가하였다. 가드 컬럼이 사전-설치된 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098)을 사용하여 HPLC로 글루코스 및 셀로바이오스 농도를 측정하였다. 결과는 도 37에 나타낸다.

그 다음에 CBH2 및 EG4에 의한 아비셀 가수분해에 대한 아스코르브산 효과를 측정하였다. 도 39b에 열거된 바와 같이, 정제 T. 레세이 CBH2(5 mg/g 최종 농도), 정제 T. 레세이 Eg4(10 mg/g 최종 농도), 아스코르브산(50 mM 스톡, 8.8 g/l 최종 농도), 및 망간 용액(10 mM 최종 농도)의 조합을 함께 혼합함으로써, 결정질 셀룰로오스(50mM 소듐 아세테이트(pH 5.0) 중의 10% 아비셀 80 ㎕) 반응을 개시하였다. 50 mM 소듐 아세테이트 완충제(pH 5.0)를 각각의 샘플에 첨가하여 500 μL의 최종 부피가 되게 하였다.

반응 에펜도르프 튜브를 보텍싱한 후, 50℃, 200 rpm에서 이노바 44 인큐베이터(뉴 브런즈윅 사이언티픽)에 넣어 두었다. 3개의 시점(5, 24, 48 h)에 각각의 튜브로부터 50 μL 샘플을 취하여 50 ㎕의 100 mM 글리신 완충제(pH 10.0)로 켄칭하였다. 샘플을 3000 rpm에서 5 분 동안 원심분리하고(로탄타 460R 원심분리기, 헤티히 젠트리퓨겐), HPLC 96-웰 마이크로타이터 플레이트(애질런트, 5042-1385) 내에서 상청액(20 μL)을 100 ㎕의 물에 첨가하였다. 가드 컬럼이 사전-설치된 아미넥스 HPX-87P 컬럼(300 mm x 7.8 mm, 125-0098)을 사용하여 HPLC로 글루코스 및 셀로바이오스 농도를 측정하였다. 결과는 도 38에 나타낸다.

SEQUENCE LISTING <110> Danisco US Inc. Mitchinson, Colin Li, Mian Kelemen, Bradley R. Lantz, Suzanne E. Wing, Keith D. Hitz, William D. <120> Method for Reducing Viscosity in Saccharification Process <130> 31556-WO <140> PCT/US12/29445 <141> 2012-03-16 <150> US 61/453,923 <151> 2011-03-17 <160> 162 <170> PatentIn version 3.5 <210> 1 <211> 246 <212> PRT <213> Neurospora crassa <400> 1 Met Arg Phe Asp Leu Leu Ala Leu Ser Ala Phe Ala Pro Leu Val Ala 1 5 10 15 Ala His Gly Ala Val Thr Ser Tyr Ile Ile Asp Gly Thr Thr Tyr Pro 20 25 30 Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Lys Thr Ile Gln Phe 35 40 45 Gln Trp Pro Asn Tyr Asp Pro Thr Met Thr Val Ser Asp Ala Lys Met 50 55 60 Arg Cys Asn Gly Gly Thr Ser Ala Gln Leu Ser Ala Thr Val Gln Ala 65 70 75 80 Gly Ser Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Glu Gln Gly 85 90 95 Pro Val Gln Val Trp Leu Phe Lys Cys Pro Gly Ala Phe Gly Ser Ser 100 105 110 Cys Lys Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Glu Met Gly Met 115 120 125 Trp Gly Gly Lys Leu Asn Ser Ala Asn Trp Gly Thr Ala Leu Ile Val 130 135 140 Lys Asn His Gln Trp Ser Ser Glu Ile Pro Lys Asn Met Ala Pro Gly 145 150 155 160 Asn Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr 165 170 175 Pro Gln Phe Tyr Ala Glu Cys Ala Gln Ile Val Val Gln Gly Ser Gly 180 185 190 Asn Ala Val Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Thr Tyr Ala 195 200 205 Pro Gln Asn Asp Pro Gly Val Thr Leu Thr Arg Asp Phe Lys Ile Asp 210 215 220 Ile Tyr Ser Ser Lys Ala Thr Thr Tyr Thr Pro Pro Gly Gly Arg Val 225 230 235 240 Trp Ser Gly Phe Gln Phe 245 <210> 2 <211> 238 <212> PRT <213> Neurospora crassa <400> 2 Met Lys Val Leu Ala Pro Leu Val Leu Ala Ser Ala Ala Ser Ala His 1 5 10 15 Thr Ile Phe Ser Ser Leu Glu Val Asn Gly Val Asn Gln Gly Leu Gly 20 25 30 Glu Gly Val Arg Val Pro Thr Tyr Asn Gly Pro Ile Glu Asp Val Thr 35 40 45 Ser Ala Ser Ile Ala Cys Asn Gly Ser Pro Asn Thr Val Ala Ser Thr 50 55 60 Ser Lys Val Ile Thr Val Gln Ala Gly Thr Asn Val Thr Ala Ile Trp 65 70 75 80 Arg Tyr Met Leu Ser Thr Thr Gly Asp Ser Pro Ala Asp Val Met Asp 85 90 95 Ser Ser His Lys Gly Pro Thr Ile Ala Tyr Leu Lys Lys Val Asp Asn 100 105 110 Ala Ala Thr Ala Ser Gly Val Gly Asn Gly Trp Phe Lys Ile Gln Gln 115 120 125 Asp Gly Met Asp Ser Ser Gly Val Trp Gly Thr Glu Arg Val Ile Asn 130 135 140 Gly Lys Gly Arg His Ser Ile Lys Ile Pro Glu Cys Ile Ala Pro Gly 145 150 155 160 Gln Tyr Leu Leu Arg Ala Glu Met Ile Ala Leu His Ala Ala Ser Asn 165 170 175 Tyr Pro Gly Ala Gln Phe Tyr Met Glu Cys Ala Gln Leu Asn Val Val 180 185 190 Gly Gly Thr Gly Ala Lys Thr Pro Ser Thr Val Ser Phe Pro Gly Ala 195 200 205 Tyr Ser Gly Ser Asp Pro Gly Val Lys Ile Ser Ile Tyr Trp Pro Pro 210 215 220 Val Thr Ser Tyr Thr Val Pro Gly Pro Ser Val Phe Thr Cys 225 230 235 <210> 3 <211> 231 <212> PRT <213> Neurospora crassa <400> 3 Met Leu Pro Ser Ile Ser Leu Leu Leu Ala Ala Ala Leu Gly Thr Ser 1 5 10 15 Ala His Tyr Thr Phe Pro Lys Val Trp Ala Asn Ser Gly Thr Thr Ala 20 25 30 Asp Trp Gln Tyr Val Arg Arg Ala Asp Asn Trp Gln Asn Asn Gly Phe 35 40 45 Val Asp Asn Val Asn Ser Gln Gln Ile Arg Cys Phe Gln Ser Thr His 50 55 60 Ser Pro Ala Gln Ser Thr Leu Ser Val Ala Ala Gly Thr Thr Ile Thr 65 70 75 80 Tyr Gly Ala Ala Pro Ser Val Tyr His Pro Gly Pro Met Gln Phe Tyr 85 90 95 Leu Ala Arg Val Pro Asp Gly Gln Asp Ile Asn Ser Trp Thr Gly Glu 100 105 110 Gly Ala Val Trp Phe Lys Ile Tyr His Glu Gln Pro Thr Phe Gly Ser 115 120 125 Gln Leu Thr Trp Ser Ser Asn Gly Lys Ser Ser Phe Pro Val Lys Ile 130 135 140 Pro Ser Cys Ile Lys Ser Gly Ser Tyr Leu Leu Arg Ala Glu His Ile 145 150 155 160 Gly Leu His Val Ala Gln Ser Ser Gly Ala Ala Gln Phe Tyr Ile Ser 165 170 175 Cys Ala Gln Leu Ser Ile Thr Gly Gly Gly Ser Thr Glu Pro Gly Ala 180 185 190 Asn Tyr Lys Val Ser Phe Pro Gly Ala Tyr Lys Ala Ser Asp Pro Gly 195 200 205 Ile Leu Ile Asn Ile Asn Tyr Pro Val Pro Thr Ser Tyr Lys Asn Pro 210 215 220 Gly Pro Ser Val Phe Thr Cys 225 230 <210> 4 <211> 344 <212> PRT <213> Neurospora crassa <400> 4 Met Lys Ser Ser Leu Leu Val Val Leu Thr Ala Gly Leu Ala Val Arg 1 5 10 15 Asp Ala Ile Ala His Ala Ile Phe Gln Gln Leu Trp Val Asp Gly Val 20 25 30 Asp Tyr Gly Ser Thr Cys Asn Arg Leu Pro Thr Ser Asn Ser Pro Val 35 40 45 Thr Asn Val Gly Ser Arg Asp Val Val Cys Asn Ala Gly Thr Arg Gly 50 55 60 Val Ser Gly Lys Cys Pro Val Lys Ala Gly Gly Thr Val Thr Val Glu 65 70 75 80 Met His Gln Gln Pro Gly Asp Arg Ser Cys Lys Ser Glu Ala Ile Gly 85 90 95 Gly Ala His Trp Gly Pro Val Gln Ile Tyr Leu Ser Lys Val Ser Asp 100 105 110 Ala Ser Thr Ala Asp Gly Ser Ser Gly Gly Trp Phe Lys Ile Phe Ser 115 120 125 Asp Ala Trp Ser Lys Lys Ser Gly Gly Arg Val Gly Asp Asp Asp Asn 130 135 140 Trp Gly Thr Arg Asp Leu Asn Ala Cys Cys Gly Arg Met Asp Val Leu 145 150 155 160 Ile Pro Lys Asp Leu Pro Ser Gly Asp Tyr Leu Leu Arg Ala Glu Ala 165 170 175 Leu Ala Leu His Thr Ala Gly Gln Ser Gly Gly Ala Gln Phe Tyr Ile 180 185 190 Ser Cys Tyr Gln Ile Thr Val Ser Gly Gly Gly Ser Ala Asn Tyr Ala 195 200 205 Thr Val Lys Phe Pro Gly Ala Tyr Arg Ala Ser Asp Pro Gly Ile Gln 210 215 220 Ile Asn Ile His Ala Val Val Ser Asn Tyr Val Ala Pro Gly Pro Ala 225 230 235 240 Val Val Ala Gly Gly Val Thr Lys Gln Ala Gly Ser Gly Cys Ile Gly 245 250 255 Cys Glu Ser Thr Cys Lys Val Gly Ser Ser Pro Ser Ala Val Ala Pro 260 265 270 Gly Gly Lys Pro Ala Ser Gly Gly Ser Asp Gly Asn Ala Pro Glu Val 275 280 285 Ala Glu Pro Ser Gly Gly Glu Gly Ser Pro Ser Ala Pro Gly Ala Cys 290 295 300 Glu Val Ala Ala Tyr Gly Gln Cys Gly Gly Asp Gln Tyr Ser Gly Cys 305 310 315 320 Thr Gln Cys Ala Ser Gly Tyr Thr Cys Lys Ala Val Ser Pro Pro Tyr 325 330 335 Tyr Ser Gln Cys Ala Pro Thr Ser 340 <210> 5 <211> 293 <212> PRT <213> Neurospora crassa <400> 5 Met Lys Phe Ser Ser Ala Leu Ala Phe Leu Ala Ala Ala Gly Ala Gln 1 5 10 15 Ala His Tyr Thr Phe Pro Lys Gly Tyr Ser Thr Gly Ala Val Ser Gly 20 25 30 Glu Tyr Glu His Ile Arg Met Thr Glu Asn His Tyr Asn Arg Gly Pro 35 40 45 Val Ala Asp Val Thr Ser Glu Ser Met Thr Cys Tyr Glu Leu Asn Pro 50 55 60 Gly Lys Gly Ala Pro Lys Thr Leu Ser Val Ala Ala Gly Ser Asn Tyr 65 70 75 80 Thr Phe Val Val Gly Asp Asn Ile Gly His Pro Gly Pro Leu His Phe 85 90 95 Tyr Met Ala Lys Val Pro Glu Gly Lys Thr Ala Ala Thr Phe Asp Gly 100 105 110 Lys Gly Ala Val Trp Phe Lys Ile Tyr Gln Asp Gly Pro Met Gly Leu 115 120 125 Gly Thr Gly Gln Leu Thr Trp Pro Ser Ala Gly Ala Thr Glu Val Ser 130 135 140 Val Lys Leu Pro Ser Cys Leu Glu Ser Gly Glu Tyr Leu Leu Arg Val 145 150 155 160 Glu His Ile Gly Leu His Ser Ala Gly Ser Val Gly Gly Ala Gln Leu 165 170 175 Tyr Ile Ala Cys Ala Gln Leu Asn Val Thr Gly Gly Thr Gly Thr Ile 180 185 190 Asn Thr Ser Gly Lys Leu Val Ser Phe Pro Gly Ala Tyr Lys Ala Thr 195 200 205 Asp Pro Gly Leu Leu Phe Asn Leu Tyr Tyr Pro Ala Pro Thr Ser Tyr 210 215 220 Thr Asn Pro Gly Pro Ala Val Ala Thr Cys Asp Gly Ala Ser Ala Pro 225 230 235 240 Ala Ala Pro Ala Pro Ala Pro Ser Ser Ala Ala Pro Ser Ala Pro Ala 245 250 255 Ala Ser Ala Pro Ser Ala Thr Val Pro Ala Val Ser Ala Thr Ser Ala 260 265 270 Ala Ala Val Gly Lys Ala Ser Ser Thr Pro Lys Lys Gly Cys Lys Arg 275 280 285 Ala Ala Arg Lys His 290 <210> 6 <211> 342 <212> PRT <213> Neurospora crassa <400> 6 Met Arg Ser Thr Leu Val Thr Gly Leu Ile Ala Gly Leu Leu Ser Gln 1 5 10 15 Gln Ala Ala Ala His Ala Thr Phe Gln Ala Leu Trp Val Asp Gly Ala 20 25 30 Asp Tyr Gly Ser Gln Cys Ala Arg Val Pro Pro Ser Asn Ser Pro Val 35 40 45 Thr Asp Val Thr Ser Asn Ala Met Arg Cys Asn Thr Gly Thr Ser Pro 50 55 60 Val Ala Lys Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Val Glu 65 70 75 80 Met His Gln Ser His Pro Pro Val Pro Thr Leu Thr Tyr Lys Gln Gln 85 90 95 Ala Asn Asp Arg Ser Cys Ser Ser Glu Ala Ile Gly Gly Ala His Tyr 100 105 110 Gly Pro Val Leu Val Tyr Met Ser Lys Val Ser Asp Ala Ala Ser Ala 115 120 125 Asp Gly Ser Ser Gly Trp Phe Lys Ile Phe Glu Asp Thr Trp Ala Lys 130 135 140 Lys Pro Ser Ser Ser Ser Gly Asp Asp Asp Phe Trp Gly Val Lys Asp 145 150 155 160 Leu Asn Ser Cys Cys Gly Lys Met Gln Val Lys Ile Pro Ser Asp Ile 165 170 175 Pro Ala Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala Leu His Thr 180 185 190 Ala Ala Ser Ala Gly Gly Ala Gln Leu Tyr Met Thr Cys Tyr Gln Ile 195 200 205 Ser Val Thr Gly Gly Gly Ser Ala Thr Pro Ala Thr Val Ser Phe Pro 210 215 220 Gly Ala Tyr Lys Ser Ser Asp Pro Gly Ile Leu Val Asp Ile His Ser 225 230 235 240 Ala Met Ser Thr Tyr Val Ala Pro Gly Pro Ala Val Tyr Ser Gly Gly 245 250 255 Ser Ser Lys Lys Ala Gly Ser Gly Cys Val Gly Cys Glu Ser Thr Cys 260 265 270 Lys Val Gly Ser Gly Pro Thr Gly Thr Ala Ser Ala Val Pro Val Ala 275 280 285 Ser Thr Ser Ala Ala Ala Gly Gly Gly Gly Gly Gly Gly Ser Gly Gly 290 295 300 Cys Ser Val Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly 305 310 315 320 Cys Thr Ser Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro 325 330 335 Tyr Tyr Ser Gln Cys Val 340 <210> 7 <211> 308 <212> PRT <213> Neurospora crassa <400> 7 Met Val Arg Ala Leu Arg Leu Leu Ala Ser Cys Ala Met Phe Ser Gln 1 5 10 15 Ala Leu Ala His Ser His Ile Leu Tyr Leu Ile Ile Asn Gly Gln Gln 20 25 30 Tyr Arg Gly Phe Asn Pro His Ala Pro Asp Ala Ile Thr Asn Ser Ile 35 40 45 Gly Trp Ser Thr Ser Ala Val Asp Asp Gly Phe Val Thr Pro Ser Asn 50 55 60 Tyr Ser Asn Pro Asp Ile Ile Cys His Arg Asp Gly Lys Pro Ala Lys 65 70 75 80 Ala His Ala Pro Val Lys Ala Gly Asp Lys Ile Gln Ile Gln Trp Asn 85 90 95 Gly Trp Pro Gln Ser His Lys Gly Pro Val Leu Ser Tyr Leu Ala Pro 100 105 110 Cys Ala Asn Thr Thr Asp Gly Cys Ala Ser Val Asp Lys Arg Lys Leu 115 120 125 Ser Trp Thr Lys Ile Asp Asp Ser Ser Pro Val Leu Leu Asp Glu Lys 130 135 140 Gly Gly Pro Pro Gly Arg Trp Ala Thr Asp Val Leu Ile Ala Gln Asn 145 150 155 160 Asn Thr Trp Leu Leu Gly Leu Pro Asn Asp Leu Glu Pro Gly Pro Tyr 165 170 175 Val Leu Arg His Glu Leu Ile Ala Leu His Tyr Ala Asn Leu Lys Asn 180 185 190 Gly Ala Gln Asn Tyr Pro Gln Cys Val Asn Leu Trp Val Glu Gly Pro 195 200 205 Gly Pro Lys Ala Ile Thr Val Gly Lys Glu Glu Val Val Val Ala Gly 210 215 220 Gln Lys Glu Gly Val Pro Ala Thr Ala Leu Tyr Lys Ala Thr Asp Pro 225 230 235 240 Gly Val Ala Ile Asp Ile Tyr Thr Ala Val Leu Ser Thr Tyr Val Ile 245 250 255 Pro Gly Pro Thr Leu Ala Pro Glu Ala Lys Pro Val Pro Val Thr Glu 260 265 270 Gln Gly Leu Lys Ser Thr Ile Thr Ala Val Gly Thr Pro Val Ile Val 275 280 285 Thr Arg Ala Thr Ser Thr Val Pro Met Pro Asn Gly Glu Thr Ala Ala 290 295 300 Ala Phe Lys Gly 305 <210> 8 <211> 322 <212> PRT <213> Neurospora crassa <400> 8 Met Lys Val Leu Ser Leu Leu Ala Ala Ala Ser Ala Ala Ser Ala His 1 5 10 15 Thr Ile Phe Val Gln Leu Glu Ala Asp Gly Thr Thr Tyr Pro Val Ser 20 25 30 Tyr Gly Ile Arg Thr Pro Ser Tyr Asp Gly Pro Ile Thr Asp Val Thr 35 40 45 Ser Asn Asp Leu Ala Cys Asn Gly Gly Pro Asn Pro Thr Thr Pro Ser 50 55 60 Asp Lys Ile Ile Thr Val Asn Ala Gly Ser Thr Val Lys Ala Ile Trp 65 70 75 80 Arg His Thr Leu Thr Ser Gly Ala Asp Asp Val Met Asp Ala Ser His 85 90 95 Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Asp Asp Ala Leu Thr 100 105 110 Asp Thr Gly Ile Gly Gly Gly Trp Phe Lys Ile Gln Glu Asp Gly Tyr 115 120 125 Asn Asn Gly Gln Trp Gly Thr Ser Thr Val Ile Thr Asn Gly Gly Phe 130 135 140 Gln Tyr Ile Asp Ile Pro Ala Cys Ile Pro Ser Gly Gln Tyr Leu Leu 145 150 155 160 Arg Ala Glu Met Ile Ala Leu His Ala Ala Ser Ser Thr Ala Gly Ala 165 170 175 Gln Leu Tyr Met Glu Cys Ala Gln Ile Asn Ile Val Gly Gly Thr Gly 180 185 190 Gly Thr Ala Leu Pro Ser Thr Thr Tyr Ser Ile Pro Gly Ile Tyr Lys 195 200 205 Ala Thr Asp Pro Gly Leu Leu Val Asn Ile Tyr Ser Met Ser Pro Ser 210 215 220 Ser Thr Tyr Thr Ile Pro Gly Pro Ala Lys Phe Thr Cys Pro Ala Gly 225 230 235 240 Asn Gly Gly Gly Ala Gly Gly Gly Gly Ser Thr Thr Thr Ala Lys Pro 245 250 255 Ala Ser Ser Thr Thr Ser Lys Ala Ala Ile Thr Ser Ala Val Thr Thr 260 265 270 Leu Lys Thr Ser Val Val Ala Pro Gln Pro Thr Gly Gly Cys Thr Ala 275 280 285 Ala Gln Trp Ala Gln Cys Gly Gly Met Gly Phe Ser Gly Cys Thr Thr 290 295 300 Cys Ala Ser Pro Tyr Thr Cys Lys Lys Met Asn Asp Tyr Tyr Ser Gln 305 310 315 320 Cys Ser <210> 9 <211> 241 <212> PRT <213> Neurospora crassa <400> 9 Met Lys Thr Phe Ala Thr Leu Leu Ala Ser Ile Gly Leu Val Ala Ala 1 5 10 15 His Gly Phe Val Asp Asn Ala Thr Ile Gly Gly Gln Phe Tyr Gln Phe 20 25 30 Tyr Gln Pro Tyr Gln Asp Pro Tyr Met Gly Ser Pro Pro Asp Arg Ile 35 40 45 Ser Arg Lys Ile Pro Gly Asn Gly Pro Val Glu Asp Val Thr Ser Leu 50 55 60 Ala Ile Gln Cys Asn Ala Asp Ser Ala Pro Ala Lys Leu His Ala Ser 65 70 75 80 Ala Ala Ala Gly Ser Thr Val Thr Leu Arg Trp Thr Ile Trp Pro Asp 85 90 95 Ser His Val Gly Pro Val Ile Thr Tyr Met Ala Arg Cys Pro Asp Thr 100 105 110 Gly Cys Gln Asp Trp Thr Pro Ser Ala Ser Asp Lys Val Trp Phe Lys 115 120 125 Ile Lys Glu Gly Gly Arg Glu Gly Thr Ser Asn Val Trp Ala Ala Thr 130 135 140 Pro Leu Met Thr Ala Pro Ala Asn Tyr Glu Tyr Ala Ile Pro Ser Cys 145 150 155 160 Leu Lys Pro Gly Tyr Tyr Leu Val Arg His Glu Ile Ile Ala Leu His 165 170 175 Ser Ala Tyr Ser Tyr Pro Gly Ala Gln Phe Tyr Pro Gly Cys His Gln 180 185 190 Leu Gln Val Thr Gly Ser Gly Thr Lys Thr Pro Ser Ser Gly Leu Val 195 200 205 Ser Phe Pro Gly Ala Tyr Lys Ser Thr Asp Pro Gly Val Thr Tyr Asp 210 215 220 Ala Tyr Gln Ala Ala Thr Tyr Thr Ile Pro Gly Pro Ala Val Phe Thr 225 230 235 240 Cys <210> 10 <211> 472 <212> PRT <213> Neurospora crassa <400> 10 Met Arg Ser Thr Thr Val Leu Ala Gly Leu Ala Thr Val Leu Ala Pro 1 5 10 15 Leu Ala Ser Ala His Thr Val Leu Thr Thr Val Phe Val Asn Asp Lys 20 25 30 Asn Gln Gly Asp Gly Thr Gly Val Arg Met Pro Met Asp Gly Asn Ile 35 40 45 Ala Asn Ala Pro Val Ile Asn Met Asn Ser Asp Asp Met Ile Cys Gly 50 55 60 Arg Asp Gly Leu Lys Lys Val Asn Tyr Ala Ile Pro Ala Thr Ala Gly 65 70 75 80 Ser Lys Met Thr Phe Glu Phe Arg Thr Tyr Val Asp Gly Ser Arg Pro 85 90 95 Gln Phe Ile Asp Lys Ser His Gln Gly Pro Ile Ser Val Tyr Ala Lys 100 105 110 Ala Val Ser Asp Phe Asp Gln Ser Pro Gly Gly Ser Gly Trp Phe Lys 115 120 125 Ile Trp His Asp Gly Tyr Asp Glu Ser Thr Gly Lys Trp Ala Val Gln 130 135 140 Lys Val Ile Asp Thr Asn Gly Leu Leu Ser Ile Ser Leu Pro Thr Gly 145 150 155 160 Met Pro Thr Gly Ala Tyr Leu Leu Arg Thr Glu Val Ile Ala Met Gln 165 170 175 Asn Val Thr Thr Lys Ala Asp Gly Asn Trp Tyr Cys Glu Pro Gln Phe 180 185 190 Tyr Val Asn Cys Ala Gln Val Tyr Val Gln Gly Ser Ser Ser Gly Pro 195 200 205 Leu Ser Ile Pro Lys Asp Lys Glu Thr Ser Ile Pro Gly His Val His 210 215 220 Pro Ser Asp Lys Gly Leu Asn Phe Asn Met Tyr Asp Met Lys Gly Leu 225 230 235 240 Leu Pro Tyr Gln Ile Pro Gly Pro Val Pro Phe Arg Pro Ala Ser Ser 245 250 255 Ser Ser Gly Ser Asn Ala Lys Ala Ala Leu Thr Thr Pro Thr Asn Phe 260 265 270 Pro Gly Ala Val Pro Asp Asn Cys Leu Leu Lys Asn Ala Asn Trp Cys 275 280 285 Gly Phe Glu Val Pro Asp Tyr Thr Asn Glu Asp Gly Cys Trp Ala Ser 290 295 300 Ala Asp Asn Cys Trp Ala Gln Ser Lys Lys Cys Phe Asp Ser Ala Pro 305 310 315 320 Pro Ser Gly Ile Lys Gly Cys Lys Ile Trp Glu Gln Glu Lys Cys Gln 325 330 335 Ala Leu Ala Asn Ser Cys Asp Ala Lys Gln Phe Thr Gly Pro Pro Asn 340 345 350 Lys Gly Lys Arg Trp Gly Asp Val Thr Glu Gln Ser Ser Val Gln Val 355 360 365 Pro Gly Val Met Lys Gly Ala Asp Leu Val Asp Thr Pro Val Val Asp 370 375 380 Thr Thr Ser Asn Gln Lys Ala Ala Ala Asn Asn Asn Val Val Ser Ile 385 390 395 400 Pro Ala Ala Thr Ala Thr Thr Phe Ile Thr Thr Ser Ser Ala Ala Pro 405 410 415 Ser Lys Pro Val Thr Thr Val Pro Ser Val Ala Ile Thr Thr Thr Thr 420 425 430 Ser Ala Ala Val Ala Ile Pro Thr Glu Thr Ala Ala Gln Asn Thr Leu 435 440 445 Ile Arg Cys Gly Arg Gly Asp Lys Asn Gln Arg Arg Ala Met His Ile 450 455 460 Asn Arg His Lys Arg Ala Asp Phe 465 470 <210> 11 <211> 326 <212> PRT <213> Neurospora crassa <400> 11 Met Lys Leu Ser Val Ala Ala Ala Leu Ser Leu Ala Ala Ser Glu Ala 1 5 10 15 Ser Ala His Tyr Ile Phe Gln Gln Val Gly Ala Gly Thr Ser Val Asn 20 25 30 Pro Val Trp Lys Tyr Ile Arg Lys His Thr Asn Tyr Asn Ser Pro Val 35 40 45 Thr Asp Leu Thr Ser Lys Asp Leu Val Cys Asn Val Gly Ala Ser Ala 50 55 60 Glu Gly Val Glu Thr Leu Ser Val Ala Ala Gly Ser Gln Val Thr Phe 65 70 75 80 Lys Thr Asp Thr Ala Val Tyr His Gln Gly Pro Thr Ser Val Tyr Leu 85 90 95 Ser Lys Ala Asp Gly Ser Leu Ser Asp Tyr Asp Gly Ser Gly Gly Trp 100 105 110 Phe Lys Ile Lys Asp Trp Gly Ala Thr Phe Pro Gly Gly Glu Trp Thr 115 120 125 Leu Ser Asp Thr Tyr Thr Phe Thr Ile Pro Ser Cys Ile Pro Ser Gly 130 135 140 Asp Tyr Leu Leu Arg Ile Gln Gln Ile Gly Ile His Asn Pro Trp Pro 145 150 155 160 Ala Gly Val Pro Gln Phe Tyr Leu Ser Cys Ala His Ile Ser Val Thr 165 170 175 Gly Gly Gly Ser Ala Ser Pro Ala Thr Val Ser Ile Pro Gly Ala Phe 180 185 190 Lys Glu Thr Asp Pro Gly Tyr Thr Val Asn Ile Tyr Ser Asn Phe Asn 195 200 205 Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Thr Cys Ser Gly Ser Gly 210 215 220 Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Thr Pro Pro Ser Gln 225 230 235 240 Pro Thr Thr Ser Thr Thr Leu Pro Thr Ser Ser Thr Val Val Ala Thr 245 250 255 Thr Leu Lys Thr Ser Thr Val Val Ala Thr Thr Lys Ser Ser Ser Ser 260 265 270 Thr Thr Ser Ser Ala Ser Ser Ser Gly Ser Gln Pro Thr Ser Pro Ser 275 280 285 Gly Cys Thr Val Ala Lys Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser 290 295 300 Gly Cys Thr Ser Cys Ala Ser Gly Ser Thr Cys Lys Val Gly Asn Asp 305 310 315 320 Tyr Tyr Ser Gln Cys Leu 325 <210> 12 <211> 359 <212> PRT <213> Neurospora crassa <400> 12 Met Lys Thr Gly Ser Ile Leu Ala Ala Leu Val Ala Ser Ala Ser Ala 1 5 10 15 His Thr Ile Phe Gln Lys Val Ser Val Asn Gly Ala Asp Gln Gly Gln 20 25 30 Leu Lys Gly Ile Arg Ala Pro Ala Asn Asn Asn Pro Val Thr Asp Val 35 40 45 Met Ser Ser Asp Ile Ile Cys Asn Ala Val Thr Met Lys Asp Ser Asn 50 55 60 Val Leu Thr Val Pro Ala Gly Ala Lys Val Gly His Phe Trp Gly His 65 70 75 80 Glu Ile Gly Gly Ala Ala Gly Pro Asn Asp Ala Asp Asn Pro Ile Ala 85 90 95 Ala Ser His Lys Gly Pro Ile Met Val Tyr Leu Ala Lys Val Asp Asn 100 105 110 Ala Ala Thr Thr Gly Thr Ser Gly Leu Lys Trp Phe Lys Val Ala Glu 115 120 125 Ala Gly Leu Ser Asn Gly Lys Trp Ala Val Asp Asp Leu Ile Ala Asn 130 135 140 Asn Gly Trp Ser Tyr Phe Asp Met Pro Thr Cys Ile Ala Pro Gly Gln 145 150 155 160 Tyr Leu Met Arg Ala Glu Leu Ile Ala Leu His Asn Ala Gly Ser Gln 165 170 175 Ala Gly Ala Gln Phe Tyr Ile Gly Cys Ala Gln Ile Asn Val Thr Gly 180 185 190 Gly Gly Ser Ala Ser Pro Ser Asn Thr Val Ser Phe Pro Gly Ala Tyr 195 200 205 Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gly Gly Ser Gly 210 215 220 Lys Thr Asp Asn Gly Gly Lys Pro Tyr Gln Ile Pro Gly Pro Ala Leu 225 230 235 240 Phe Thr Cys Pro Ala Gly Gly Ser Gly Gly Ser Ser Pro Ala Pro Ala 245 250 255 Thr Thr Ala Ser Thr Pro Lys Pro Thr Ser Ala Ser Ala Pro Lys Pro 260 265 270 Val Ser Thr Thr Ala Ser Thr Pro Lys Pro Thr Asn Gly Ser Gly Ser 275 280 285 Gly Thr Gly Ala Ala His Ser Thr Lys Cys Gly Gly Ser Lys Pro Ala 290 295 300 Ala Thr Thr Lys Ala Ser Asn Pro Gln Pro Thr Asn Gly Gly Asn Ser 305 310 315 320 Ala Val Arg Ala Ala Ala Leu Tyr Gly Gln Cys Gly Gly Lys Gly Trp 325 330 335 Thr Gly Pro Thr Ser Cys Ala Ser Gly Thr Cys Lys Phe Ser Asn Asp 340 345 350 Trp Tyr Ser Gln Cys Leu Pro 355 <210> 13 <211> 369 <212> PRT <213> Neurospora crassa <400> 13 Met Ala Arg Met Ser Ile Leu Thr Ala Leu Ala Gly Ala Ser Leu Val 1 5 10 15 Ala Ala His Gly His Val Ser Lys Val Ile Val Asn Gly Val Glu Tyr 20 25 30 Gln Asn Tyr Asp Pro Thr Ser Phe Pro Tyr Asn Ser Asn Pro Pro Thr 35 40 45 Val Ile Gly Trp Thr Ile Asp Gln Lys Asp Asn Gly Phe Val Ser Pro 50 55 60 Asp Ala Phe Asp Ser Gly Asp Ile Ile Cys His Lys Ser Ala Lys Pro 65 70 75 80 Ala Gly Gly His Ala Thr Val Lys Ala Gly Asp Lys Ile Ser Leu Gln 85 90 95 Trp Asp Gln Trp Pro Glu Ser His Lys Gly Pro Val Ile Asp Tyr Leu 100 105 110 Ala Ala Cys Asp Gly Asp Cys Glu Ser Val Asp Lys Thr Ala Leu Lys 115 120 125 Phe Phe Lys Ile Asp Gly Ala Gly Tyr Asp Ala Thr Asn Gly Trp Ala 130 135 140 Ser Asp Thr Leu Ile Lys Asp Gly Asn Ser Trp Val Val Glu Ile Pro 145 150 155 160 Glu Ser Ile Lys Pro Gly Asn Tyr Val Leu Arg His Glu Ile Ile Ala 165 170 175 Leu His Ser Ala Gly Gln Ala Asn Gly Ala Gln Asn Tyr Pro Gln Cys 180 185 190 Phe Asn Leu Lys Val Glu Gly Ser Gly Ser Thr Val Pro Ala Gly Val 195 200 205 Ala Gly Thr Glu Leu Tyr Lys Ala Thr Asp Ala Gly Ile Leu Phe Asp 210 215 220 Ile Tyr Lys Asn Asp Ile Ser Tyr Pro Val Pro Gly Pro Ser Leu Ile 225 230 235 240 Ala Gly Ala Ser Ser Ser Ile Ala Gln Ser Lys Met Ala Ala Thr Ala 245 250 255 Thr Ala Ser Ala Thr Leu Pro Gly Ala Thr Gly Gly Ser Asn Ser Pro 260 265 270 Ala Thr Ser Ala Ala Ala Ala Ala Pro Ala Thr Ser Ala Ala Ala Ala 275 280 285 Thr Ser Gln Val Gln Ala Ala Pro Ala Thr Thr Leu Val Thr Ser Thr 290 295 300 Lys Ala Ala Ala Pro Ala Thr Ser Ala Ala Ala Pro Ala Ala Pro Ala 305 310 315 320 Thr Ser Ala Ala Ala Gly Gly Ala Gly Gln Val Gln Ala Lys Gln Thr 325 330 335 Lys Trp Gly Gln Cys Gly Gly Asn Gly Phe Thr Gly Pro Thr Glu Cys 340 345 350 Glu Ser Gly Ser Thr Cys Thr Lys Tyr Asn Asp Trp Tyr Ser Gln Cys 355 360 365 Val <210> 14 <211> 271 <212> PRT <213> Sporotrichum thermophilum <400> 14 Ala Leu Gly His Ser His Leu Gly Tyr Ile Ile Ile Asn Gly Glu Val 1 5 10 15 Tyr Gln Gly Phe Asp Pro Arg Pro Glu Gln Ala Asn Ser Pro Leu Arg 20 25 30 Val Gly Trp Ser Thr Gly Ala Ile Asp Asp Gly Phe Val Ala Pro Ala 35 40 45 Asn Tyr Ser Ser Pro Asp Ile Ile Cys His Ile Glu Gly Ala Ser Pro 50 55 60 Pro Ala His Ala Pro Val Arg Ala Gly Asp Arg Val His Val Gln Trp 65 70 75 80 Asn Gly Trp Pro Leu Gly His Val Gly Pro Val Leu Ser Tyr Leu Ala 85 90 95 Pro Cys Gly Gly Leu Glu Gly Ser Glu Ser Gly Cys Ala Gly Val Asp 100 105 110 Lys Arg Gln Leu Arg Trp Thr Lys Val Asp Asp Ser Leu Pro Ala Met 115 120 125 Glu Leu Arg Trp Ala Thr Asp Val Leu Ile Ala Ala Asn Asn Ser Trp 130 135 140 Gln Val Glu Ile Pro Arg Gly Leu Arg Asp Gly Pro Tyr Val Leu Arg 145 150 155 160 His Glu Ile Val Ala Leu His Tyr Ala Ala Glu Pro Gly Gly Ala Gln 165 170 175 Asn Tyr Pro Leu Cys Val Asn Leu Trp Val Glu Gly Gly Asp Gly Ser 180 185 190 Met Glu Leu Asp His Phe Asp Ala Thr Gln Phe Tyr Arg Pro Asp Asp 195 200 205 Pro Gly Ile Leu Leu Asn Val Thr Ala Gly Leu Arg Ser Tyr Ala Val 210 215 220 Pro Gly Pro Thr Leu Ala Ala Gly Ala Thr Pro Val Pro Tyr Ala Gln 225 230 235 240 Gln Asn Ile Ser Ser Ala Arg Ala Asp Gly Thr Pro Val Ile Val Thr 245 250 255 Arg Ser Thr Glu Thr Val Pro Phe Thr Ala Ala Pro Thr Pro Ala 260 265 270 <210> 15 <211> 330 <212> PRT <213> Sporotrichum thermophilum <400> 15 Met Ser Ser Phe Thr Ser Lys Gly Leu Leu Ser Ala Leu Met Gly Ala 1 5 10 15 Ala Thr Val Ala Ala His Gly His Val Thr Asn Ile Val Ile Asn Gly 20 25 30 Val Ser Tyr Gln Asn Phe Asp Pro Phe Thr His Pro Tyr Met Gln Asn 35 40 45 Pro Pro Thr Val Val Gly Trp Thr Ala Ser Asn Thr Asp Asn Gly Phe 50 55 60 Val Gly Pro Glu Ser Phe Ser Ser Pro Asp Ile Ile Cys His Lys Ser 65 70 75 80 Ala Thr Asn Ala Gly Gly His Ala Val Val Ala Ala Gly Asp Lys Val 85 90 95 Phe Ile Gln Trp Asp Thr Trp Pro Glu Ser His His Gly Pro Val Ile 100 105 110 Asp Tyr Leu Ala Asp Cys Gly Asp Ala Gly Cys Glu Lys Val Asp Lys 115 120 125 Thr Thr Leu Lys Phe Phe Lys Ile Ser Glu Ser Gly Leu Leu Asp Gly 130 135 140 Thr Asn Ala Pro Gly Lys Trp Ala Ser Asp Thr Leu Ile Ala Asn Asn 145 150 155 160 Asn Ser Trp Leu Val Gln Ile Pro Pro Asn Ile Ala Pro Gly Asn Tyr 165 170 175 Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Gln Gln Asn 180 185 190 Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Val Thr Gly Ser 195 200 205 Gly Thr Gln Lys Pro Ser Gly Val Leu Gly Thr Glu Leu Tyr Lys Ala 210 215 220 Thr Asp Ala Gly Ile Leu Ala Asn Ile Tyr Thr Ser Pro Val Thr Tyr 225 230 235 240 Gln Ile Pro Gly Pro Ala Ile Ile Ser Gly Ala Ser Ala Val Gln Gln 245 250 255 Thr Thr Ser Ala Ile Thr Ala Ser Ala Ser Ala Ile Thr Gly Ser Ala 260 265 270 Thr Ala Ala Pro Thr Ala Ala Thr Thr Thr Ala Ala Ala Ala Ala Thr 275 280 285 Thr Thr Thr Thr Ala Gly Ser Gly Ala Thr Ala Thr Pro Ser Thr Gly 290 295 300 Gly Ser Pro Ser Ser Ala Gln Pro Ala Pro Thr Thr Ala Ala Ala Thr 305 310 315 320 Ser Ser Pro Ala Arg Pro Thr Arg Cys Ala 325 330 <210> 16 <211> 342 <212> PRT <213> Sporotrichum thermophilum <400> 16 Met Ser Lys Ala Ser Ala Leu Leu Ala Gly Leu Thr Gly Ala Ala Leu 1 5 10 15 Val Ala Ala His Gly His Val Ser His Ile Val Val Asn Gly Val Tyr 20 25 30 Tyr Arg Asn Tyr Asp Pro Thr Thr Asp Trp Tyr Gln Pro Asn Pro Pro 35 40 45 Thr Val Ile Gly Trp Thr Ala Ala Asp Gln Asp Asn Gly Phe Val Glu 50 55 60 Pro Asn Ser Phe Gly Thr Pro Asp Ile Ile Cys His Lys Ser Ala Thr 65 70 75 80 Pro Gly Gly Gly His Ala Thr Val Ala Ala Gly Asp Lys Ile Asn Ile 85 90 95 Val Trp Thr Pro Glu Trp Pro Glu Ser His Ile Gly Pro Val Ile Asp 100 105 110 Tyr Leu Ala Ala Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Ser Ser 115 120 125 Leu Arg Trp Phe Lys Ile Asp Gly Ala Gly Tyr Asp Lys Ala Ala Gly 130 135 140 Arg Trp Ala Ala Asp Ala Leu Arg Ala Asn Gly Asn Ser Trp Leu Val 145 150 155 160 Gln Ile Pro Ser Asp Leu Lys Ala Gly Asn Tyr Val Leu Arg His Glu 165 170 175 Ile Ile Ala Leu His Gly Ala Gln Ser Pro Asn Gly Ala Gln Ala Tyr 180 185 190 Pro Gln Cys Ile Asn Leu Arg Val Thr Gly Gly Gly Ser Asn Leu Pro 195 200 205 Ser Gly Val Ala Gly Thr Ser Leu Tyr Lys Ala Thr Asp Pro Gly Ile 210 215 220 Leu Phe Asn Pro Tyr Val Ser Ser Pro Asp Tyr Thr Val Pro Gly Pro 225 230 235 240 Ala Leu Ile Ala Gly Ala Ala Ser Ser Ile Ala Gln Ser Thr Ser Val 245 250 255 Ala Thr Ala Thr Gly Thr Ala Thr Val Pro Gly Gly Gly Gly Ala Asn 260 265 270 Pro Thr Ala Thr Thr Thr Ala Ala Thr Ser Ala Ala Pro Ser Thr Thr 275 280 285 Leu Arg Thr Thr Thr Thr Ser Ala Ala Gln Thr Thr Ala Pro Pro Ser 290 295 300 Gly Asp Val Gln Thr Lys Tyr Gly Gln Cys Gly Gly Asn Gly Trp Thr 305 310 315 320 Gly Pro Thr Val Cys Ala Pro Gly Ser Ser Cys Ser Val Leu Asn Glu 325 330 335 Trp Tyr Ser Gln Cys Leu 340 <210> 17 <211> 323 <212> PRT <213> Sporotrichum thermophilum <400> 17 Met Lys Ser Phe Thr Leu Thr Thr Leu Ala Ala Leu Ala Gly Asn Ala 1 5 10 15 Ala Ala His Ala Thr Phe Gln Ala Leu Trp Val Asp Gly Val Asp Tyr 20 25 30 Gly Ala Gln Cys Ala Arg Leu Pro Ala Ser Asn Ser Pro Val Thr Asp 35 40 45 Val Thr Ser Asn Ala Ile Arg Cys Asn Ala Asn Pro Ser Pro Ala Arg 50 55 60 Gly Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Val Glu Met His 65 70 75 80 Gln Gln Pro Gly Asp Arg Ser Cys Ser Ser Glu Ala Ile Gly Gly Ala 85 90 95 His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Ser Asp Ala Ala 100 105 110 Ser Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Glu Asp Gly Trp 115 120 125 Ala Lys Asn Pro Ser Gly Gly Ser Gly Asp Asp Asp Tyr Trp Gly Thr 130 135 140 Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro Ala 145 150 155 160 Asp Leu Pro Ser Gly Asp Tyr Leu Leu Arg Ala Glu Ala Leu Ala Leu 165 170 175 His Thr Ala Gly Ser Ala Gly Gly Ala Gln Phe Tyr Met Thr Cys Tyr 180 185 190 Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Ser Pro Pro Thr Val Ser 195 200 205 Phe Pro Gly Ala Tyr Lys Ala Thr Asp Pro Gly Ile Leu Val Asn Ile 210 215 220 His Ala Pro Leu Ser Gly Tyr Thr Val Pro Gly Pro Ala Val Tyr Ser 225 230 235 240 Gly Gly Ser Thr Lys Lys Ala Gly Ser Ala Cys Thr Gly Cys Glu Ser 245 250 255 Thr Cys Ala Val Gly Ser Gly Pro Thr Ala Thr Val Ser Gln Ser Pro 260 265 270 Gly Ser Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Gly Cys Thr Val 275 280 285 Gln Lys Tyr Gln Gln Cys Gly Gly Gln Gly Tyr Thr Gly Cys Thr Asn 290 295 300 Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro Tyr Tyr Ser 305 310 315 320 Gln Cys Val <210> 18 <211> 341 <212> PRT <213> Neurospora crassa <400> 18 Met Pro Ser Phe Thr Ser Lys Ser Leu Leu Ala Val Leu Ala Gly Ala 1 5 10 15 Ala Ser Val Ala Ala His Gly His Val Ser Asn Ile Val Ile Asn Gly 20 25 30 Glu Tyr Tyr Arg Gly Phe Asp Ser Ser Leu Asn Tyr Met Ala Asn Pro 35 40 45 Pro Ala Val Val Gly Trp Lys Ala Asn Asn Gln Asp Asn Gly Phe Val 50 55 60 Gly Pro Asp Ala Phe Ser Ser Pro Asp Ile Ile Cys His Lys Asp Ala 65 70 75 80 Thr Asn Ala Lys Gly His Ala Val Val Lys Ala Gly Asp Lys Ile Ser 85 90 95 Ile Gln Trp Glu Thr Trp Pro Glu Ser His Lys Gly Pro Val Ile Asp 100 105 110 Tyr Leu Ala Asn Cys Gly Ala Ser Gly Cys Glu Thr Val Asp Lys Thr 115 120 125 Ser Leu Glu Phe Phe Lys Ile Asp Glu Val Gly Leu Val Asp Gly Gln 130 135 140 Lys Trp Gly Ser Asp Gln Leu Ile Ala Asn Asn Asn Ser Trp Leu Val 145 150 155 160 Glu Ile Pro Pro Thr Ile Ala Pro Gly Phe Tyr Val Leu Arg His Glu 165 170 175 Ile Ile Ala Leu His Ser Ala Gly Gln Pro Asn Gly Ala Gln Asn Tyr 180 185 190 Pro Gln Cys Phe Asn Ile Gln Val Thr Gly Ser Gly Thr Glu Lys Pro 195 200 205 Ala Gly Val Lys Gly Thr Ala Leu Tyr Lys Pro Asp Asp Ala Gly Ile 210 215 220 Ser Val Asn Ile Tyr Gln Ser Leu Ser Ser Tyr Ser Ile Pro Gly Pro 225 230 235 240 Ala Leu Ile Lys Gly Ala Val Ser Val Ala Gln Ser His Ser Ala Val 245 250 255 Thr Ala Thr Ala Thr Ala Ile Thr Gly Leu Gly Asp Ala Pro Ala Ala 260 265 270 Thr Ala Ala Pro Ala Ala Thr Thr Ala Pro Ala Ala Ala Pro Ala Val 275 280 285 Thr Thr Ala Pro Ala Ala Ala Ala Pro Thr Lys Pro Ala Thr Thr Ala 290 295 300 Ala Ala Pro Gln Pro Thr Lys Pro Ala Lys Ser Gly Cys Gln Lys Arg 305 310 315 320 Arg Ala Ala Arg Arg Ala Ala Ala Leu Ala Arg Arg His Ala Arg Asp 325 330 335 Val Ala Phe Leu Asp 340 <210> 19 <211> 342 <212> PRT <213> Aspergillus fumigatus <400> 19 Met Arg His Val Gln Ser Thr Gln Leu Leu Ala Ala Leu Leu Leu Thr 1 5 10 15 Thr Arg Val Thr Ala His Gly His Val Thr Asn Ile Val Ile Asn Gly 20 25 30 Val Ser Tyr Arg Gly Trp Asn Ile Asp Ser Asp Pro Tyr Asn Pro Asp 35 40 45 Pro Pro Val Val Val Ala Trp Gln Thr Pro Asn Thr Ala Asn Gly Phe 50 55 60 Ile Ser Pro Asp Ala Tyr Gly Thr Asn Asp Ile Ile Cys His Leu Asn 65 70 75 80 Ala Thr Asn Ala Arg Gly His Ala Val Val Ala Ala Gly Asp Lys Ile 85 90 95 Ser Ile Gln Trp Thr Ala Trp Pro Asp Ser His His Gly Pro Val Ile 100 105 110 Asp Tyr Leu Ala Arg Cys Gly Ser Ser Cys Glu Thr Val Asp Lys Thr 115 120 125 Thr Leu Glu Phe Phe Lys Ile Asp Gly Val Gly Leu Val Asp Gly Ser 130 135 140 Asn Pro Pro Gly Val Trp Gly Asp Asp Gln Leu Ile Ala Asp Asn Asn 145 150 155 160 Ser Trp Leu Val Glu Ile Pro Pro Thr Ile Ala Pro Gly Tyr Tyr Val 165 170 175 Leu Arg His Glu Leu Ile Ala Leu His Gly Ala Gly Ser Gln Asn Gly 180 185 190 Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Ile Thr Gly Ser Gly 195 200 205 Thr Ala Gln Pro Ser Gly Val Lys Gly Thr Glu Leu Tyr Ser Pro Thr 210 215 220 Asp Pro Gly Ile Leu Val Asn Ile Tyr Asn Ala Leu Ser Thr Tyr Ile 225 230 235 240 Val Pro Gly Pro Thr Leu Ile Pro Gly Ala Val Ser Val Val Gln Ser 245 250 255 Ser Ser Thr Ile Thr Ala Ser Gly Thr Pro Val Thr Gly Ser Gly Ser 260 265 270 Ala Pro Thr Thr Ser Ala Thr Thr Thr Leu Ser Thr Thr Thr Arg Ala 275 280 285 Thr Thr Thr Thr Thr Thr Thr Thr Ala Gly Ser Ser Thr Ser Val Gln 290 295 300 Ser Val Tyr Gly Gln Cys Gly Gly Ser Gly Trp Ser Gly Pro Thr Ala 305 310 315 320 Cys Val Thr Gly Ala Thr Cys Thr Ser Tyr Asn Ser Tyr Tyr Ser Gln 325 330 335 Cys Ile Pro Thr Ala Ser 340 <210> 20 <211> 330 <212> PRT <213> Aspergillus fumigatus <400> 20 Met Lys Leu Thr Ala Ser Ile Leu Phe Ser Leu Ala Ser Val Thr Pro 1 5 10 15 Leu Val Ser Gly His Tyr Val Phe Ser Lys Leu Ile Val Asp Gly Lys 20 25 30 Pro Thr Gln Asp Phe Glu Tyr Ile Arg Arg Asn Thr Asn Asn Tyr Met 35 40 45 Pro Thr Leu Pro Ser Glu Ile Leu Ser Asn Asp Phe Arg Cys Asn Lys 50 55 60 Gly Ser Met Gln Ser Ala Ala Asn Thr Lys Val Tyr Lys Val Ala Pro 65 70 75 80 Gly Thr Glu Leu Gly Phe Gln Leu Ala Tyr Gly Ala Glu Met Lys His 85 90 95 Pro Gly Pro Leu Gln Ile Tyr Met Ser Lys Ala Pro Gly Asp Val Arg 100 105 110 Ser Tyr Asp Gly Ser Gly Asp Trp Phe Lys Val His Gln Glu Gly Leu 115 120 125 Cys Ala Asp Thr Ser Lys Gly Ile Lys Asp Glu Asp Trp Cys Thr Trp 130 135 140 Gly Lys Asp Thr Ala Ser Phe Lys Ile Pro Gln Asp Thr Pro Ala Gly 145 150 155 160 Gln Tyr Leu Val Arg Val Glu His Ile Gly Leu His Arg Gly Phe Leu 165 170 175 Gly Glu Ala Glu Phe Tyr Phe Thr Cys Ala Gln Ile Glu Val Thr Gly 180 185 190 Ser Gly Ser Gly Ser Pro Ser Pro Thr Val Lys Ile Pro Gly Val Tyr 195 200 205 Lys Pro Asp Asp Pro Asn Val His Phe Asn Ile Trp Tyr Pro Thr Pro 210 215 220 Thr Ala Tyr Ser Leu Pro Gly Pro Ser Val Trp Thr Gly Gly Ser Ala 225 230 235 240 Gly Gly Ala Ser Pro Thr Ala Pro Ala Val Asn Asn Asn Ala Val Gln 245 250 255 Ala Ala Pro Thr Thr Met Thr Thr Val Ser Ser Pro Ala Asn Pro Thr 260 265 270 Ala Gly Ala Glu Ala Glu Ala Asp Cys Gly Ser Ser Glu Ser Ser Ser 275 280 285 Ala Val Ala Pro Glu Gly Thr Leu Lys Lys Trp Glu Gln Cys Gly Gly 290 295 300 Leu Asn Trp Thr Gly Ser Gly Ser Cys Glu Ala Arg Thr Thr Cys His 305 310 315 320 Gln Tyr Asn Pro Tyr Tyr Tyr Gln Cys Ile 325 330 <210> 21 <211> 364 <212> PRT <213> Aspergillus fumigatus <400> 21 Met Ser Gln Thr Lys Thr Leu Ser Leu Leu Ala Ala Leu Leu Ser Ala 1 5 10 15 Thr Arg Val Ala Ala His Gly His Val Thr Asn Val Val Val Asn Gly 20 25 30 Val Ser Tyr Ala Gly Phe Asp Ile Asn Ser Tyr Pro Tyr Met Ser Asp 35 40 45 Pro Pro Lys Val Ala Ala Trp Thr Thr Pro Asn Thr Gly Asn Gly Phe 50 55 60 Ile Ala Pro Ser Ala Tyr Asn Ser Pro Asp Ile Ile Cys His Gln Asn 65 70 75 80 Ala Thr Asn Ala Gln Ala Tyr Ile Glu Ile Ala Ala Gly Asp Arg Ile 85 90 95 Gln Leu Gln Trp Thr Ala Trp Pro Glu Ser His His Gly Pro Val Ile 100 105 110 Asp Met Leu Ala Ser Cys Gly Glu Ser Cys Thr Thr Val Asp Lys Thr 115 120 125 Ser Leu Lys Phe Phe Lys Ile Asp Gly Val Gly Leu Val Asp Asn Ser 130 135 140 Ala Val Pro Gly Thr Trp Gly Asp Asp Gln Leu Ile Ala Asn Ser Asn 145 150 155 160 Ser Trp Met Val Glu Ile Pro Lys Ser Ile Ala Pro Gly Asn Tyr Val 165 170 175 Leu Arg His Glu Leu Ile Ala Leu His Ser Ala Phe Glu Thr Gly Gly 180 185 190 Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Lys Val Thr Gly Ser Gly 195 200 205 Thr Asp Ser Pro Ala Gly Thr Leu Gly Thr Glu Leu Tyr Thr Glu Ser 210 215 220 Asp Pro Gly Leu Leu Val Asp Ile Tyr Lys Ser Ile Ala Ser Tyr Ala 225 230 235 240 Val Pro Gly Pro Ala Met Tyr Thr Gly Ala Val Ser Ile Thr Gln Ser 245 250 255 Thr Ser Ala Ile Thr Ala Thr Gly Thr Ala Thr Val Gly Ser Gly Ala 260 265 270 Asp Ser Thr Pro Val Pro Ser Ser Ala Ala Ser Ser Glu Tyr Ser Thr 275 280 285 Val Ala Val Gln Val Pro Thr Thr Lys Ala Gln Tyr Thr Pro Val Pro 290 295 300 Ser Ser Ser Pro Ser Thr Phe Val Thr Ser Pro Ala Pro Thr Thr Ser 305 310 315 320 Val Pro Ser Gly Ser Ser Val Pro Val Thr Ser Asn Thr Ala Ala Pro 325 330 335 Leu Pro Thr Ala Ala Pro Gly Gly Thr Gln Thr Val Tyr Gly Gln Cys 340 345 350 Gly Gly Gln Asn Trp Thr Gly Pro Thr Tyr Ile Val 355 360 <210> 22 <211> 270 <212> PRT <213> Thielavia terrestris <400> 22 Leu Leu Ser Thr Leu Ala Gly Ala Ala Ser Val Ala Ala His Gly His 1 5 10 15 Val Ser Asn Ile Val Ile Asn Gly Val Ser Tyr Gln Gly Tyr Asp Pro 20 25 30 Thr Ser Phe Pro Tyr Met Gln Asn Pro Pro Ile Val Val Gly Trp Thr 35 40 45 Ala Ala Asp Thr Asp Asn Gly Phe Val Ala Pro Asp Ala Phe Ala Ser 50 55 60 Gly Asp Ile Ile Cys His Lys Asn Ala Thr Asn Ala Lys Gly His Ala 65 70 75 80 Val Val Ala Ala Gly Asp Lys Ile Phe Ile Gln Trp Asn Thr Trp Pro 85 90 95 Glu Ser His His Gly Pro Val Ile Asp Tyr Leu Ala Ser Cys Gly Ser 100 105 110 Ala Ser Cys Glu Thr Val Asp Lys Thr Lys Leu Glu Phe Phe Lys Ile 115 120 125 Asp Glu Val Gly Leu Val Asp Gly Ser Ser Ala Pro Gly Val Trp Gly 130 135 140 Ser Asp Gln Leu Ile Ala Asn Asn Asn Ser Trp Leu Val Glu Ile Pro 145 150 155 160 Pro Thr Ile Ala Pro Gly Asn Tyr Val Leu Arg His Glu Ile Ile Ala 165 170 175 Leu His Ser Ala Glu Asn Ala Asp Gly Ala Gln Asn Tyr Pro Gln Cys 180 185 190 Phe Asn Leu Gln Ile Thr Gly Thr Gly Thr Ala Thr Pro Ser Gly Val 195 200 205 Pro Gly Thr Ser Leu Tyr Thr Pro Thr Asp Pro Gly Ile Leu Val Asn 210 215 220 Ile Tyr Ser Ala Pro Ile Thr Tyr Thr Val Pro Gly Pro Ala Leu Ile 225 230 235 240 Ser Gly Ala Val Ser Ile Ala Gln Ser Ser Ser Ala Ile Thr Ala Ser 245 250 255 Gly Thr Ala Leu Thr Gly Ser Ala Thr Ala Pro Ala Ala Ala 260 265 270 <210> 23 <211> 330 <212> PRT <213> Thielavia terrestris <400> 23 Met Pro Pro Ala Leu Pro Gln Leu Leu Thr Thr Val Leu Thr Ala Leu 1 5 10 15 Thr Leu Gly Ser Thr Ala Leu Ala His Ser His Leu Ala Tyr Ile Ile 20 25 30 Val Asn Gly Lys Leu Tyr Gln Gly Phe Asp Pro Arg Pro His Gln Ala 35 40 45 Asn Tyr Pro Ser Arg Val Gly Trp Ser Thr Gly Ala Val Asp Asp Gly 50 55 60 Phe Val Thr Pro Ala Asn Tyr Ser Thr Pro Asp Ile Ile Cys His Ile 65 70 75 80 Ala Gly Thr Ser Pro Ala Gly His Ala Pro Val Arg Pro Gly Asp Arg 85 90 95 Ile His Val Gln Trp Asn Gly Trp Pro Val Gly His Ile Gly Pro Val 100 105 110 Leu Ser Tyr Leu Ala Arg Cys Glu Ser Asp Thr Gly Cys Thr Gly Gln 115 120 125 Asn Lys Thr Ala Leu Arg Trp Thr Lys Ile Asp Asp Ser Ser Pro Thr 130 135 140 Met Gln Asn Val Ala Gly Ala Gly Thr Gln Gly Glu Gly Thr Pro Gly 145 150 155 160 Lys Arg Trp Ala Thr Asp Val Leu Ile Ala Ala Asn Asn Ser Trp Gln 165 170 175 Val Ala Val Pro Ala Gly Leu Pro Thr Gly Ala Tyr Val Leu Arg Asn 180 185 190 Glu Ile Ile Ala Leu His Tyr Ala Ala Arg Lys Asn Gly Ala Gln Asn 195 200 205 Tyr Pro Leu Cys Met Asn Leu Trp Val Asp Ala Ser Gly Asp Asn Ser 210 215 220 Ser Val Ala Ala Thr Thr Ala Ala Val Thr Ala Gly Gly Leu Gln Met 225 230 235 240 Asp Ala Tyr Asp Ala Arg Gly Phe Tyr Lys Glu Asn Asp Pro Gly Val 245 250 255 Leu Val Asn Val Thr Ala Ala Leu Ser Ser Tyr Val Val Pro Gly Pro 260 265 270 Thr Val Ala Ala Gly Ala Thr Pro Val Pro Tyr Ala Gln Gln Ser Pro 275 280 285 Ser Val Ser Thr Ala Ala Gly Thr Pro Val Val Val Thr Arg Thr Ser 290 295 300 Glu Thr Ala Pro Tyr Thr Gly Ala Met Thr Pro Thr Val Ala Ala Arg 305 310 315 320 Met Lys Gly Arg Gly Tyr Asp Arg Arg Gly 325 330 <210> 24 <211> 315 <212> PRT <213> Thielavia terrestris <400> 24 Met Arg Thr Thr Phe Ala Ala Ala Leu Ala Ala Phe Ala Ala Gln Glu 1 5 10 15 Val Ala Gly His Ala Ile Phe Gln Gln Leu Trp Val Asp Gly Thr Asp 20 25 30 Tyr Ile Arg Ala Pro Leu Phe Leu Phe Gly Lys Cys Pro Val Lys Ala 35 40 45 Gly Gly Thr Val Thr Val Glu Met His Gln Gln Pro Gly Asp Arg Ser 50 55 60 Cys Asn Asn Glu Ala Ile Gly Gly Ala His Trp Gly Pro Val Gln Val 65 70 75 80 Tyr Leu Ser Lys Val Glu Asp Ala Ser Thr Ala Asp Gly Ser Thr Gly 85 90 95 Trp Phe Lys Ile Phe Ala Asp Thr Trp Ser Lys Lys Ala Gly Ser Ser 100 105 110 Val Gly Asp Asp Asp Asn Trp Gly Thr Arg Asp Leu Asn Ala Cys Cys 115 120 125 Gly Lys Met Gln Val Lys Ile Pro Ala Asp Ile Pro Ser Gly Asp Tyr 130 135 140 Leu Leu Arg Ala Glu Ala Leu Ala Leu His Thr Ala Gly Gln Val Gly 145 150 155 160 Gly Ala Gln Phe Tyr Met Ser Cys Tyr Gln Ile Thr Val Ser Gly Gly 165 170 175 Gly Ser Ala Ser Pro Ala Thr Val Lys Phe Pro Gly Ala Tyr Ser Ala 180 185 190 Asn Asp Pro Gly Ile His Ile Asn Ile His Ala Ala Val Ser Asn Tyr 195 200 205 Val Ala Pro Gly Pro Ala Val Tyr Ser Gly Gly Thr Thr Lys Val Ala 210 215 220 Gly Ser Gly Cys Gln Gly Cys Glu Asn Thr Cys Lys Val Gly Ser Ser 225 230 235 240 Pro Thr Ala Thr Ala Pro Ser Gly Lys Ser Gly Ala Gly Ser Asp Gly 245 250 255 Gly Ala Gly Thr Asp Gly Gly Ser Ser Ser Ser Ser Pro Asp Thr Gly 260 265 270 Ser Ala Cys Ser Val Gln Ala Tyr Gly Gln Cys Gly Gly Asn Gly Tyr 275 280 285 Ser Gly Cys Thr Gln Cys Ala Pro Gly Tyr Thr Cys Lys Ala Val Ser 290 295 300 Pro Pro Tyr Tyr Ser Gln Cys Ala Pro Ser Ser 305 310 315 <210> 25 <211> 349 <212> PRT <213> Chaetomium globosum <400> 25 Met Ser Lys Ala Ser Ala Leu Leu Ala Thr Leu Thr Gly Ala Ala Leu 1 5 10 15 Val Ala Ala His Gly His Val Ser His Ile Ile Val Asn Gly Val Tyr 20 25 30 Tyr Glu Asn Tyr Asp Pro Thr Thr His Trp Tyr Gln Pro Asn Pro Pro 35 40 45 Thr Val Ile Gly Trp Lys Ala Ala Gln Gln Asp Asn Gly Phe Val Glu 50 55 60 Pro Asn Asn Phe Gly Thr Ser Asp Ile Ile Cys His Lys Ser Gly Ser 65 70 75 80 Pro Gly Gly Gly His Ala Thr Val Ala Ala Gly Asp Lys Ile Ser Ile 85 90 95 Val Trp Asp Pro Glu Trp Pro Glu Ser His Ile Gly Pro Val Ile Asp 100 105 110 Tyr Leu Ala Ala Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Ala Ser 115 120 125 Leu Arg Phe Phe Lys Ile Asp Gly Ala Gly Tyr Asp Lys Thr Ala Gly 130 135 140 Arg Trp Ala Ala Asp Thr Leu Arg Ala Asn Gly Asn Ser Trp Leu Val 145 150 155 160 Gln Ile Pro Ala Asp Leu Lys Ala Gly Asn Tyr Val Leu Arg His Glu 165 170 175 Ile Ile Ala Leu His Gly Ala Ser Ser Pro Asn Gly Ala Gln Ala Tyr 180 185 190 Pro Gln Cys Ile Asn Leu Arg Val Thr Gly Ser Gly Thr Asn Ala Pro 195 200 205 Ser Gly Val Ala Gly Thr Ser Leu Tyr Arg Ala Ser Asp Ala Gly Ile 210 215 220 Leu Phe Asn Pro Tyr Val Ala Ser Pro Asn Tyr Pro Val Pro Gly Pro 225 230 235 240 Ala Leu Ile Ala Gly Ala Ala Ser Ser Val Ala Gln Ser Lys Ser Val 245 250 255 Ala Thr Ala Thr Ala Ser Ala Thr Leu Pro Gly Asn Asn Asn Gly Gly 260 265 270 Gly Pro Asn Pro Gln Pro Thr Thr Ala Thr Thr Thr Ala Asn Pro Gly 275 280 285 Val Ser Thr Thr Leu Arg Thr Ser Thr Ser Thr Ser Thr Ser Ala Gln 290 295 300 Val Thr Pro Pro Pro Thr Gly Gly Asn Ala Gln Thr Lys Tyr Gly Gln 305 310 315 320 Cys Gly Gly Ser Gly Trp Thr Gly Pro Thr Ala Cys Ala Ala Gly Ser 325 330 335 Ser Cys Ser Val Leu Asn Asp Trp Tyr Ala Gln Cys Val 340 345 <210> 26 <211> 249 <212> PRT <213> Trichoderma reesei <400> 26 Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser 1 5 10 15 Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr 20 25 30 Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly 35 40 45 His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly 50 55 60 Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys 65 70 75 80 Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn 85 90 95 Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro 100 105 110 Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn 115 120 125 Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr 130 135 140 Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys 145 150 155 160 Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe 165 170 175 Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met 180 185 190 Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr 195 200 205 Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr 210 215 220 Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr 225 230 235 240 Ile Pro Gly Pro Ala Leu Trp Gln Gly 245 <210> 27 <211> 344 <212> PRT <213> Trichoderma reesei <400> 27 Met Ile Gln Lys Leu Ser Asn Leu Leu Val Thr Ala Leu Ala Val Ala 1 5 10 15 Thr Gly Val Val Gly His Gly His Ile Asn Asp Ile Val Ile Asn Gly 20 25 30 Val Trp Tyr Gln Ala Tyr Asp Pro Thr Thr Phe Pro Tyr Glu Ser Asn 35 40 45 Pro Pro Ile Val Val Gly Trp Thr Ala Ala Asp Leu Asp Asn Gly Phe 50 55 60 Val Ser Pro Asp Ala Tyr Gln Asn Pro Asp Ile Ile Cys His Lys Asn 65 70 75 80 Ala Thr Asn Ala Lys Gly His Ala Ser Val Lys Ala Gly Asp Thr Ile 85 90 95 Leu Phe Gln Trp Val Pro Val Pro Trp Pro His Pro Gly Pro Ile Val 100 105 110 Asp Tyr Leu Ala Asn Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Thr 115 120 125 Thr Leu Glu Phe Phe Lys Ile Asp Gly Val Gly Leu Leu Ser Gly Gly 130 135 140 Asp Pro Gly Thr Trp Ala Ser Asp Val Leu Ile Ser Asn Asn Asn Thr 145 150 155 160 Trp Val Val Lys Ile Pro Asp Asn Leu Ala Pro Gly Asn Tyr Val Leu 165 170 175 Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Gln Ala Asn Gly Ala 180 185 190 Gln Asn Tyr Pro Gln Cys Phe Asn Ile Ala Val Ser Gly Ser Gly Ser 195 200 205 Leu Gln Pro Ser Gly Val Leu Gly Thr Asp Leu Tyr His Ala Thr Asp 210 215 220 Pro Gly Val Leu Ile Asn Ile Tyr Thr Ser Pro Leu Asn Tyr Ile Ile 225 230 235 240 Pro Gly Pro Thr Val Val Ser Gly Leu Pro Thr Ser Val Ala Gln Gly 245 250 255 Ser Ser Ala Ala Thr Ala Thr Ala Ser Ala Thr Val Pro Gly Gly Gly 260 265 270 Ser Gly Pro Thr Ser Arg Thr Thr Thr Thr Ala Arg Thr Thr Gln Ala 275 280 285 Ser Ser Arg Pro Ser Ser Thr Pro Pro Ala Thr Thr Ser Ala Pro Ala 290 295 300 Gly Gly Pro Thr Gln Thr Leu Tyr Gly Gln Cys Gly Gly Ser Gly Tyr 305 310 315 320 Ser Gly Pro Thr Arg Cys Ala Pro Pro Ala Thr Cys Ser Thr Leu Asn 325 330 335 Pro Tyr Tyr Ala Gln Cys Leu Asn 340 <210> 28 <211> 250 <212> PRT <213> Aspergillus fumigatus <400> 28 Met Thr Leu Ser Lys Ile Thr Ser Ile Ala Gly Leu Leu Ala Ser Ala 1 5 10 15 Ser Leu Val Ala Gly His Gly Phe Val Ser Gly Ile Val Ala Asp Gly 20 25 30 Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser Asn 35 40 45 Pro Pro Asp Thr Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly Phe 50 55 60 Val Asp Gly Thr Gly Tyr Gln Ser Pro Asp Ile Ile Cys His Arg Asp 65 70 75 80 Ala Lys Asn Gly Lys Leu Thr Ala Thr Val Ala Ala Gly Ser Gln Ile 85 90 95 Glu Phe Gln Trp Thr Thr Trp Pro Glu Ser His His Gly Pro Leu Ile 100 105 110 Thr Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ala Thr Val Asp Lys Thr 115 120 125 Thr Leu Lys Phe Val Lys Ile Ala Ala Gln Gly Leu Ile Asp Gly Ser 130 135 140 Asn Pro Pro Gly Val Trp Ala Asp Asp Glu Met Ile Ala Asn Asn Asn 145 150 155 160 Thr Ala Thr Val Thr Ile Pro Ala Ser Tyr Ala Pro Gly Asn Tyr Val 165 170 175 Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Leu Asn Gly 180 185 190 Ala Gln Asn Tyr Pro Gln Cys Phe Asn Ile Gln Ile Thr Gly Gly Gly 195 200 205 Ser Ala Gln Gly Ser Gly Thr Ala Gly Thr Ser Leu Tyr Lys Asn Thr 210 215 220 Asp Pro Gly Ile Lys Phe Asp Ile Tyr Ser Asp Leu Ser Gly Gly Tyr 225 230 235 240 Pro Ile Pro Gly Pro Ala Leu Phe Asn Ala 245 250 <210> 29 <211> 226 <212> PRT <213> Thielavia terrestris <400> 29 Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val 1 5 10 15 Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln 20 25 30 Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp 35 40 45 Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala 50 55 60 Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala 65 70 75 80 Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg 85 90 95 Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val 100 105 110 Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr 115 120 125 Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys 130 135 140 Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His 145 150 155 160 Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln 165 170 175 Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala 180 185 190 Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile 195 200 205 Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe 210 215 220 Ser Cys 225 <210> 30 <211> 1044 <212> DNA <213> Trichoderma reesei <400> 30 atgatccaga agctttccaa ccttcttctc accgcactag cggtggcaac cggtgttgtt 60 ggacacggac acatcaacaa cattgtcgtc aacggagtgt actaccaggg atatgatcct 120 acatcgttcc catatgaatc tgacccgccc atagtggtgg gctggacggc tgccgatctt 180 gacaacggct tcgtctcacc cgacgcatat cagagcccgg acatcatctg ccacaagaat 240 gccaccaacg ccaaaggaca cgcgtccgtc aaggccggag acactattcc cctccagtgg 300 gtgccagttc cttggccgca cccaggcccc atcgtcgact acctggccaa ctgcaacggc 360 gactgcgaga ccgtggacaa gacgtccctt gagttcttca agattgacgg cgtcggtctc 420 atcagcggcg gagatccggg caactgggcc tcggacgtgt tgattgccaa caacaacacc 480 tgggttgtca agatccccga ggatctcgcc ccgggcaact acgtgcttcg ccacgagatc 540 atcgccttgc acagcgccgg gcaggcggac ggcgctcaga actaccctca gtgcttcaac 600 ctcgccgtcc caggctccgg atctctgcag ccgagcggcg tcaagggaac cgcgctctac 660 cactccgatg accccggtgt cctcatcaac atctacacca gccctcttgc gtacaccatt 720 cctggacctt ccgtggtatc aggcctcccc acgagtgtcg cccagggcag ctccgccgcg 780 acggccactg ccagcgccac tgttcctggc ggtagcggac cgggaaaccc gaccagtaag 840 actacgacga cggcgaggac gacacaggcc tcctctagca gggccagctc tactcctcct 900 gctactacgt cggcacctgg tggaggccca acccagactt tgtacggcca gtgtggtggc 960 agcggctaca gtggtcctac tcgatgcgcg ccgccggcca cttgctctac cttgaaccca 1020 tactacgccc agtgccttaa ctag 1044 <210> 31 <211> 471 <212> PRT <213> Trichoderma reesei <400> 31 Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala 1 5 10 15 Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly 20 25 30 Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly 35 40 45 Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly 50 55 60 Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg 65 70 75 80 Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly 85 90 95 Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr 100 105 110 Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr 115 120 125 Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met 130 135 140 Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu 145 150 155 160 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 165 170 175 Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 180 185 190 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 195 200 205 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 210 215 220 Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu 225 230 235 240 Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr 245 250 255 Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr 260 265 270 Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala 275 280 285 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala 290 295 300 Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu 305 310 315 320 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr 325 330 335 Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu 340 345 350 Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn 355 360 365 Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly 370 375 380 Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly 385 390 395 400 Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val 405 410 415 Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala 420 425 430 Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala 435 440 445 Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr 450 455 460 Asn Ala Asn Pro Ser Phe Leu 465 470 <210> 32 <211> 513 <212> PRT <213> Trichoderma reesei <400> 32 Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg 1 5 10 15 Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr 20 25 30 Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser 35 40 45 Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser 50 55 60 Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp 65 70 75 80 Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala 85 90 95 Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe 100 105 110 Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met 115 120 125 Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe 130 135 140 Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala 145 150 155 160 Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro 165 170 175 Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln 180 185 190 Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly 195 200 205 Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly 210 215 220 Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu 225 230 235 240 Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu 245 250 255 Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr 260 265 270 Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr 275 280 285 Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys 290 295 300 Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr 305 310 315 320 Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly 325 330 335 Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu 340 345 350 Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln 355 360 365 Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp 370 375 380 Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr 385 390 395 400 Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr 405 410 415 Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys 420 425 430 Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn 435 440 445 Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Arg Gly Thr Thr Thr Thr 450 455 460 Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln Ser 465 470 475 480 His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys 485 490 495 Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys 500 505 510 Leu <210> 33 <211> 837 <212> PRT <213> Trichoderma reesei <400> 33 Met Lys Val Ser Arg Val Leu Ala Leu Val Leu Gly Ala Val Ile Pro 1 5 10 15 Ala His Ala Ala Phe Ser Trp Lys Asn Val Lys Leu Gly Gly Gly Gly 20 25 30 Gly Phe Val Pro Gly Ile Ile Phe His Pro Lys Thr Lys Gly Val Ala 35 40 45 Tyr Ala Arg Thr Asp Ile Gly Gly Leu Tyr Arg Leu Asn Ala Asp Asp 50 55 60 Ser Trp Thr Ala Val Thr Asp Gly Ile Ala Asp Asn Ala Gly Trp His 65 70 75 80 Asn Trp Gly Ile Asp Ala Val Ala Leu Asp Pro Gln Asp Asp Gln Lys 85 90 95 Val Tyr Ala Ala Val Gly Met Tyr Thr Asn Ser Trp Asp Pro Ser Asn 100 105 110 Gly Ala Ile Ile Arg Ser Ser Asp Arg Gly Ala Thr Trp Ser Phe Thr 115 120 125 Asn Leu Pro Phe Lys Val Gly Gly Asn Met Pro Gly Arg Gly Ala Gly 130 135 140 Glu Arg Leu Ala Val Asp Pro Ala Asn Ser Asn Ile Ile Tyr Phe Gly 145 150 155 160 Ala Arg Ser Gly Asn Gly Leu Trp Lys Ser Thr Asp Gly Gly Val Thr 165 170 175 Phe Ser Lys Val Ser Ser Phe Thr Ala Thr Gly Thr Tyr Ile Pro Asp 180 185 190 Pro Ser Asp Ser Asn Gly Tyr Asn Ser Asp Lys Gln Gly Leu Met Trp 195 200 205 Val Thr Phe Asp Ser Thr Ser Ser Thr Thr Gly Gly Ala Thr Ser Arg 210 215 220 Ile Phe Val Gly Thr Ala Asp Asn Ile Thr Ala Ser Val Tyr Val Ser 225 230 235 240 Thr Asn Ala Gly Ser Thr Trp Ser Ala Val Pro Gly Gln Pro Gly Lys 245 250 255 Tyr Phe Pro His Lys Ala Lys Leu Gln Pro Ala Glu Lys Ala Leu Tyr 260 265 270 Leu Thr Tyr Ser Asp Gly Thr Gly Pro Tyr Asp Gly Thr Leu Gly Ser 275 280 285 Val Trp Arg Tyr Asp Ile Ala Gly Gly Thr Trp Lys Asp Ile Thr Pro 290 295 300 Val Ser Gly Ser Asp Leu Tyr Phe Gly Phe Gly Gly Leu Gly Leu Asp 305 310 315 320 Leu Gln Lys Pro Gly Thr Leu Val Val Ala Ser Leu Asn Ser Trp Trp 325 330 335 Pro Asp Ala Gln Leu Phe Arg Ser Thr Asp Ser Gly Thr Thr Trp Ser 340 345 350 Pro Ile Trp Ala Trp Ala Ser Tyr Pro Thr Glu Thr Tyr Tyr Tyr Ser 355 360 365 Ile Ser Thr Pro Lys Ala Pro Trp Ile Lys Asn Asn Phe Ile Asp Val 370 375 380 Thr Ser Glu Ser Pro Ser Asp Gly Leu Ile Lys Arg Leu Gly Trp Met 385 390 395 400 Ile Glu Ser Leu Glu Ile Asp Pro Thr Asp Ser Asn His Trp Leu Tyr 405 410 415 Gly Thr Gly Met Thr Ile Phe Gly Gly His Asp Leu Thr Asn Trp Asp 420 425 430 Thr Arg His Asn Val Ser Ile Gln Ser Leu Ala Asp Gly Ile Glu Glu 435 440 445 Phe Ser Val Gln Asp Leu Ala Ser Ala Pro Gly Gly Ser Glu Leu Leu 450 455 460 Ala Ala Val Gly Asp Asp Asn Gly Phe Thr Phe Ala Ser Arg Asn Asp 465 470 475 480 Leu Gly Thr Ser Pro Gln Thr Val Trp Ala Thr Pro Thr Trp Ala Thr 485 490 495 Ser Thr Ser Val Asp Tyr Ala Gly Asn Ser Val Lys Ser Val Val Arg 500 505 510 Val Gly Asn Thr Ala Gly Thr Gln Val Ala Ile Ser Ser Asp Gly Gly 515 520 525 Ala Thr Trp Ser Ile Asp Tyr Ala Ala Asp Thr Ser Met Asn Gly Gly 530 535 540 Thr Val Ala Tyr Ser Ala Asp Gly Asp Thr Ile Leu Trp Ser Thr Ala 545 550 555 560 Ser Ser Gly Val Gln Arg Ser Gln Phe Gln Gly Ser Phe Ala Ser Val 565 570 575 Ser Ser Leu Pro Ala Gly Ala Val Ile Ala Ser Asp Lys Lys Thr Asn 580 585 590 Ser Val Phe Tyr Ala Gly Ser Gly Ser Thr Phe Tyr Val Ser Lys Asp 595 600 605 Thr Gly Ser Ser Phe Thr Arg Gly Pro Lys Leu Gly Ser Ala Gly Thr 610 615 620 Ile Arg Asp Ile Ala Ala His Pro Thr Thr Ala Gly Thr Leu Tyr Val 625 630 635 640 Ser Thr Asp Val Gly Ile Phe Arg Ser Thr Asp Ser Gly Thr Thr Phe 645 650 655 Gly Gln Val Ser Thr Ala Leu Thr Asn Thr Tyr Gln Ile Ala Leu Gly 660 665 670 Val Gly Ser Gly Ser Asn Trp Asn Leu Tyr Ala Phe Gly Thr Gly Pro 675 680 685 Ser Gly Ala Arg Leu Tyr Ala Ser Gly Asp Ser Gly Ala Ser Trp Thr 690 695 700 Asp Ile Gln Gly Ser Gln Gly Phe Gly Ser Ile Asp Ser Thr Lys Val 705 710 715 720 Ala Gly Ser Gly Ser Thr Ala Gly Gln Val Tyr Val Gly Thr Asn Gly 725 730 735 Arg Gly Val Phe Tyr Ala Gln Gly Thr Val Gly Gly Gly Thr Gly Gly 740 745 750 Thr Ser Ser Ser Thr Lys Gln Ser Ser Ser Ser Thr Ser Ser Ala Ser 755 760 765 Ser Ser Thr Thr Leu Arg Ser Ser Val Val Ser Thr Thr Arg Ala Ser 770 775 780 Thr Val Thr Ser Ser Arg Thr Ser Ser Ala Ala Gly Pro Thr Gly Ser 785 790 795 800 Gly Val Ala Gly His Tyr Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly 805 810 815 Pro Thr Gln Cys Val Ala Pro Tyr Val Cys Gln Lys Gln Asn Asp Tyr 820 825 830 Tyr Tyr Gln Cys Val 835 <210> 34 <211> 297 <212> PRT <213> Staphylotrichum coccosporum <400> 34 Met Arg Ser Ser Pro Phe Leu Arg Ala Ala Leu Ala Ala Ala Leu Pro 1 5 10 15 Leu Ser Ala His Ala Leu Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys 20 25 30 Cys Lys Pro Ser Cys Gly Trp Pro Gly Lys Ala Ser Val Asn Gln Pro 35 40 45 Val Phe Ser Cys Ser Ala Asp Trp Gln Arg Ile Ser Asp Phe Asn Ala 50 55 60 Lys Ser Gly Cys Asp Gly Gly Ser Ala Tyr Ser Cys Ala Asp Gln Thr 65 70 75 80 Pro Trp Ala Val Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ala 85 90 95 Ile Ala Gly Gly Ser Glu Ser Ser Trp Cys Cys Ala Cys Tyr Ala Leu 100 105 110 Thr Phe Asn Ser Gly Pro Val Ala Gly Lys Thr Met Val Val Gln Ser 115 120 125 Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn Gln Phe Asp Leu Ala Ile 130 135 140 Pro Gly Gly Gly Val Gly Ile Phe Asn Gly Cys Ala Ser Gln Phe Gly 145 150 155 160 Gly Leu Pro Gly Ala Gln Tyr Gly Gly Ile Ser Asp Arg Ser Gln Cys 165 170 175 Ser Ser Phe Pro Ala Pro Leu Gln Pro Gly Cys Gln Trp Arg Phe Asp 180 185 190 Trp Phe Gln Asn Ala Asp Asn Pro Thr Phe Thr Phe Gln Arg Val Gln 195 200 205 Cys Pro Ser Glu Leu Thr Ser Arg Thr Gly Cys Lys Arg Asp Asp Asp 210 215 220 Ala Ser Tyr Pro Val Phe Asn Pro Pro Ser Gly Gly Ser Pro Ser Thr 225 230 235 240 Thr Ser Thr Thr Thr Ser Ser Pro Ser Gly Pro Thr Gly Asn Pro Pro 245 250 255 Gly Gly Gly Gly Cys Thr Ala Gln Lys Trp Ala Gln Cys Gly Gly Thr 260 265 270 Gly Phe Thr Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys Gln Val 275 280 285 Gln Asn Gln Trp Tyr Ser Gln Cys Leu 290 295 <210> 35 <211> 2358 <212> DNA <213> Fusarium verticillioides <400> 35 atgctgctca atcttcaggt cgctgccagc gctttgtcgc tttctctttt aggtggattg 60 gctgaggctg ctacgccata tacccttccg gactgtacca aaggaccttt gagcaagaat 120 ggaatctgcg atacttcgtt atctccagct aaaagagcgg ctgctctagt tgctgctctg 180 acgcccgaag agaaggtggg caatctggtc aggtaaaata tacccccccc cataatcact 240 attcggagat tggagctgac ttaacgcagc aatgcaactg gtgcaccaag aatcggactt 300 ccaaggtaca actggtggaa cgaagccctt catggcctcg ctggatctcc aggtggtcgc 360 tttgccgaca ctcctcccta cgacgcggcc acatcatttc ccatgcctct tctcatggcc 420 gctgctttcg acgatgatct gatccacgat atcggcaacg tcgtcggcac cgaagcgcgt 480 gcgttcacta acggcggttg gcgcggagtc gacttctgga cacccaacgt caaccctttt 540 aaagatcctc gctggggtcg tggctccgaa actccaggtg aagatgccct tcatgtcagc 600 cggtatgctc gctatatcgt caggggtctc gaaggcgata aggagcaacg acgtattgtt 660 gctacctgca agcactatgc tggaaacgac tttgaggact ggggaggctt cacgcgtcac 720 gactttgatg ccaagattac tcctcaggac ttggctgagt actacgtcag gcctttccag 780 gagtgcaccc gtgatgcaaa ggttggttcc atcatgtgcg cctacaatgc cgtgaacggc 840 attcccgcat gcgcaaactc gtatctgcag gagacgatcc tcagagggca ctggaactgg 900 acgcgcgata acaactggat cactagtgat tgtggcgcca tgcaggatat ctggcagaat 960 cacaagtatg tcaagaccaa cgctgaaggt gcccaggtag cttttgagaa cggcatggat 1020 tctagctgcg agtatactac taccagcgat gtctccgatt cgtacaagca aggcctcttg 1080 actgagaagc tcatggatcg ttcgttgaag cgccttttcg aagggcttgt tcatactggt 1140 ttctttgacg gtgccaaagc gcaatggaac tcgctcagtt ttgcggatgt caacaccaag 1200 gaagctcagg atcttgcact cagatctgct gtggagggtg ctgttcttct taagaatgac 1260 ggcactttgc ctctgaagct caagaagaag gatagtgttg caatgatcgg attctgggcc 1320 aacgatactt ccaagctgca gggtggttac agtggacgtg ctccgttcct ccacagcccg 1380 ctttatgcag ctgagaagct tggtcttgac accaacgtgg cttggggtcc gacactgcag 1440 aacagctcat ctcatgataa ctggaccacc aatgctgttg ctgcggcgaa gaagtctgat 1500 tacattctct actttggtgg tcttgacgcc tctgctgctg gcgaggacag agatcgtgag 1560 aaccttgact ggcctgagag ccagctgacc cttcttcaga agctctctag tctcggcaag 1620 ccactggttg ttatccagct tggtgatcaa gtcgatgaca ccgctctttt gaagaacaag 1680 aagattaaca gtattctttg ggtcaattac cctggtcagg atggcggcac tgcagtcatg 1740 gacctgctca ctggacgaaa gagtcctgct ggccgactac ccgtcacgca atatcccagt 1800 aaatacactg agcagattgg catgactgac atggacctca gacctaccaa gtcgttgcca 1860 gggagaactt atcgctggta ctcaactcca gttcttccct acggctttgg cctccactac 1920 accaagttcc aagccaagtt caagtccaac aagttgacgt ttgacatcca gaagcttctc 1980 aagggctgca gtgctcaata ctccgatact tgcgcgctgc cccccatcca agttagtgtc 2040 aagaacaccg gccgcattac ctccgacttt gtctctctgg tctttatcaa gagtgaagtt 2100 ggacctaagc cttaccctct caagaccctt gcggcttatg gtcgcttgca tgatgtcgcg 2160 ccttcatcga cgaaggatat ctcactggag tggacgttgg ataacattgc gcgacgggga 2220 gagaatggtg atttggttgt ttatcctggg acttacactc tgttgctgga tgagcctacg 2280 caagccaaga tccaggttac gctgactgga aagaaggcta ttttggataa gtggcctcaa 2340 gaccccaagt ctgcgtaa 2358 <210> 36 <211> 766 <212> PRT <213> Fusarium verticillioides <400> 36 Met Leu Leu Asn Leu Gln Val Ala Ala Ser Ala Leu Ser Leu Ser Leu 1 5 10 15 Leu Gly Gly Leu Ala Glu Ala Ala Thr Pro Tyr Thr Leu Pro Asp Cys 20 25 30 Thr Lys Gly Pro Leu Ser Lys Asn Gly Ile Cys Asp Thr Ser Leu Ser 35 40 45 Pro Ala Lys Arg Ala Ala Ala Leu Val Ala Ala Leu Thr Pro Glu Glu 50 55 60 Lys Val Gly Asn Leu Val Ser Asn Ala Thr Gly Ala Pro Arg Ile Gly 65 70 75 80 Leu Pro Arg Tyr Asn Trp Trp Asn Glu Ala Leu His Gly Leu Ala Gly 85 90 95 Ser Pro Gly Gly Arg Phe Ala Asp Thr Pro Pro Tyr Asp Ala Ala Thr 100 105 110 Ser Phe Pro Met Pro Leu Leu Met Ala Ala Ala Phe Asp Asp Asp Leu 115 120 125 Ile His Asp Ile Gly Asn Val Val Gly Thr Glu Ala Arg Ala Phe Thr 130 135 140 Asn Gly Gly Trp Arg Gly Val Asp Phe Trp Thr Pro Asn Val Asn Pro 145 150 155 160 Phe Lys Asp Pro Arg Trp Gly Arg Gly Ser Glu Thr Pro Gly Glu Asp 165 170 175 Ala Leu His Val Ser Arg Tyr Ala Arg Tyr Ile Val Arg Gly Leu Glu 180 185 190 Gly Asp Lys Glu Gln Arg Arg Ile Val Ala Thr Cys Lys His Tyr Ala 195 200 205 Gly Asn Asp Phe Glu Asp Trp Gly Gly Phe Thr Arg His Asp Phe Asp 210 215 220 Ala Lys Ile Thr Pro Gln Asp Leu Ala Glu Tyr Tyr Val Arg Pro Phe 225 230 235 240 Gln Glu Cys Thr Arg Asp Ala Lys Val Gly Ser Ile Met Cys Ala Tyr 245 250 255 Asn Ala Val Asn Gly Ile Pro Ala Cys Ala Asn Ser Tyr Leu Gln Glu 260 265 270 Thr Ile Leu Arg Gly His Trp Asn Trp Thr Arg Asp Asn Asn Trp Ile 275 280 285 Thr Ser Asp Cys Gly Ala Met Gln Asp Ile Trp Gln Asn His Lys Tyr 290 295 300 Val Lys Thr Asn Ala Glu Gly Ala Gln Val Ala Phe Glu Asn Gly Met 305 310 315 320 Asp Ser Ser Cys Glu Tyr Thr Thr Thr Ser Asp Val Ser Asp Ser Tyr 325 330 335 Lys Gln Gly Leu Leu Thr Glu Lys Leu Met Asp Arg Ser Leu Lys Arg 340 345 350 Leu Phe Glu Gly Leu Val His Thr Gly Phe Phe Asp Gly Ala Lys Ala 355 360 365 Gln Trp Asn Ser Leu Ser Phe Ala Asp Val Asn Thr Lys Glu Ala Gln 370 375 380 Asp Leu Ala Leu Arg Ser Ala Val Glu Gly Ala Val Leu Leu Lys Asn 385 390 395 400 Asp Gly Thr Leu Pro Leu Lys Leu Lys Lys Lys Asp Ser Val Ala Met 405 410 415 Ile Gly Phe Trp Ala Asn Asp Thr Ser Lys Leu Gln Gly Gly Tyr Ser 420 425 430 Gly Arg Ala Pro Phe Leu His Ser Pro Leu Tyr Ala Ala Glu Lys Leu 435 440 445 Gly Leu Asp Thr Asn Val Ala Trp Gly Pro Thr Leu Gln Asn Ser Ser 450 455 460 Ser His Asp Asn Trp Thr Thr Asn Ala Val Ala Ala Ala Lys Lys Ser 465 470 475 480 Asp Tyr Ile Leu Tyr Phe Gly Gly Leu Asp Ala Ser Ala Ala Gly Glu 485 490 495 Asp Arg Asp Arg Glu Asn Leu Asp Trp Pro Glu Ser Gln Leu Thr Leu 500 505 510 Leu Gln Lys Leu Ser Ser Leu Gly Lys Pro Leu Val Val Ile Gln Leu 515 520 525 Gly Asp Gln Val Asp Asp Thr Ala Leu Leu Lys Asn Lys Lys Ile Asn 530 535 540 Ser Ile Leu Trp Val Asn Tyr Pro Gly Gln Asp Gly Gly Thr Ala Val 545 550 555 560 Met Asp Leu Leu Thr Gly Arg Lys Ser Pro Ala Gly Arg Leu Pro Val 565 570 575 Thr Gln Tyr Pro Ser Lys Tyr Thr Glu Gln Ile Gly Met Thr Asp Met 580 585 590 Asp Leu Arg Pro Thr Lys Ser Leu Pro Gly Arg Thr Tyr Arg Trp Tyr 595 600 605 Ser Thr Pro Val Leu Pro Tyr Gly Phe Gly Leu His Tyr Thr Lys Phe 610 615 620 Gln Ala Lys Phe Lys Ser Asn Lys Leu Thr Phe Asp Ile Gln Lys Leu 625 630 635 640 Leu Lys Gly Cys Ser Ala Gln Tyr Ser Asp Thr Cys Ala Leu Pro Pro 645 650 655 Ile Gln Val Ser Val Lys Asn Thr Gly Arg Ile Thr Ser Asp Phe Val 660 665 670 Ser Leu Val Phe Ile Lys Ser Glu Val Gly Pro Lys Pro Tyr Pro Leu 675 680 685 Lys Thr Leu Ala Ala Tyr Gly Arg Leu His Asp Val Ala Pro Ser Ser 690 695 700 Thr Lys Asp Ile Ser Leu Glu Trp Thr Leu Asp Asn Ile Ala Arg Arg 705 710 715 720 Gly Glu Asn Gly Asp Leu Val Val Tyr Pro Gly Thr Tyr Thr Leu Leu 725 730 735 Leu Asp Glu Pro Thr Gln Ala Lys Ile Gln Val Thr Leu Thr Gly Lys 740 745 750 Lys Ala Ile Leu Asp Lys Trp Pro Gln Asp Pro Lys Ser Ala 755 760 765 <210> 37 <211> 1338 <212> DNA <213> Penicillium funiculosum <400> 37 atgcttcagc gatttgctta tattttacca ctggctctat tgagtgttgg agtgaaagcc 60 gacaacccct ttgtgcagag catctacacc gctgatccgg caccgatggt atacaatgac 120 cgcgtttatg tcttcatgga ccatgacaac accggagcta cctactacaa catgacagac 180 tggcatctgt tctcgtcagc agatatggcg aattggcaag atcatggcat tccaatgagc 240 ctggccaatt tcacctgggc caacgcgaat gcgtgggccc cgcaagtcat ccctcgcaac 300 ggccaattct acttttatgc tcctgtccga cacaacgatg gttctatggc tatcggtgtg 360 ggagtgagca gcaccatcac aggtccatac catgatgcta tcggcaaacc gctagtagag 420 aacaacgaga ttgatcccac cgtgttcatc gacgatgacg gtcaggcata cctgtactgg 480 ggaaatccag acctgtggta cgtcaaattg aaccaagata tgatatcgta cagcgggagc 540 cctactcaga ttccactcac cacggctgga tttggtactc gaacgggcaa tgctcaacgg 600 ccgaccactt ttgaagaagc tccatgggta tacaaacgca acggcatcta ctatatcgcc 660 tatgcagccg attgttgttc tgaggatatt cgctactcca cgggaaccag tgccactggt 720 ccgtggactt atcgaggcgt catcatgccg acccaaggta gcagcttcac caatcacgag 780 ggtattatcg acttccagaa caactcctac tttttctatc acaacggcgc tcttcccggc 840 ggaggcggct accaacgatc tgtatgtgtg gagcaattca aatacaatgc agatggaacc 900 attccgacga tcgaaatgac caccgccggt ccagctcaaa ttgggactct caacccttac 960 gtgcgacagg aagccgaaac ggcggcatgg tcttcaggca tcactacgga ggtttgtagc 1020 gaaggcggaa ttgacgtcgg gtttatcaac aatggcgatt acatcaaagt taaaggcgta 1080 gctttcggtt caggagccca ttctttctca gcgcgggttg cttctgcaaa tagcggcggc 1140 actattgcaa tacacctcgg aagcacaact ggtacgctcg tgggcacttg tactgtcccc 1200 agcactggcg gttggcagac ttggactacc gttacctgtt ctgtcagtgg cgcatctggg 1260 acccaggatg tgtattttgt tttcggtggt agcggaacag gatacctgtt caactttgat 1320 tattggcagt tcgcataa 1338 <210> 38 <211> 445 <212> PRT <213> Penicillium funiculosum <400> 38 Met Leu Gln Arg Phe Ala Tyr Ile Leu Pro Leu Ala Leu Leu Ser Val 1 5 10 15 Gly Val Lys Ala Asp Asn Pro Phe Val Gln Ser Ile Tyr Thr Ala Asp 20 25 30 Pro Ala Pro Met Val Tyr Asn Asp Arg Val Tyr Val Phe Met Asp His 35 40 45 Asp Asn Thr Gly Ala Thr Tyr Tyr Asn Met Thr Asp Trp His Leu Phe 50 55 60 Ser Ser Ala Asp Met Ala Asn Trp Gln Asp His Gly Ile Pro Met Ser 65 70 75 80 Leu Ala Asn Phe Thr Trp Ala Asn Ala Asn Ala Trp Ala Pro Gln Val 85 90 95 Ile Pro Arg Asn Gly Gln Phe Tyr Phe Tyr Ala Pro Val Arg His Asn 100 105 110 Asp Gly Ser Met Ala Ile Gly Val Gly Val Ser Ser Thr Ile Thr Gly 115 120 125 Pro Tyr His Asp Ala Ile Gly Lys Pro Leu Val Glu Asn Asn Glu Ile 130 135 140 Asp Pro Thr Val Phe Ile Asp Asp Asp Gly Gln Ala Tyr Leu Tyr Trp 145 150 155 160 Gly Asn Pro Asp Leu Trp Tyr Val Lys Leu Asn Gln Asp Met Ile Ser 165 170 175 Tyr Ser Gly Ser Pro Thr Gln Ile Pro Leu Thr Thr Ala Gly Phe Gly 180 185 190 Thr Arg Thr Gly Asn Ala Gln Arg Pro Thr Thr Phe Glu Glu Ala Pro 195 200 205 Trp Val Tyr Lys Arg Asn Gly Ile Tyr Tyr Ile Ala Tyr Ala Ala Asp 210 215 220 Cys Cys Ser Glu Asp Ile Arg Tyr Ser Thr Gly Thr Ser Ala Thr Gly 225 230 235 240 Pro Trp Thr Tyr Arg Gly Val Ile Met Pro Thr Gln Gly Ser Ser Phe 245 250 255 Thr Asn His Glu Gly Ile Ile Asp Phe Gln Asn Asn Ser Tyr Phe Phe 260 265 270 Tyr His Asn Gly Ala Leu Pro Gly Gly Gly Gly Tyr Gln Arg Ser Val 275 280 285 Cys Val Glu Gln Phe Lys Tyr Asn Ala Asp Gly Thr Ile Pro Thr Ile 290 295 300 Glu Met Thr Thr Ala Gly Pro Ala Gln Ile Gly Thr Leu Asn Pro Tyr 305 310 315 320 Val Arg Gln Glu Ala Glu Thr Ala Ala Trp Ser Ser Gly Ile Thr Thr 325 330 335 Glu Val Cys Ser Glu Gly Gly Ile Asp Val Gly Phe Ile Asn Asn Gly 340 345 350 Asp Tyr Ile Lys Val Lys Gly Val Ala Phe Gly Ser Gly Ala His Ser 355 360 365 Phe Ser Ala Arg Val Ala Ser Ala Asn Ser Gly Gly Thr Ile Ala Ile 370 375 380 His Leu Gly Ser Thr Thr Gly Thr Leu Val Gly Thr Cys Thr Val Pro 385 390 395 400 Ser Thr Gly Gly Trp Gln Thr Trp Thr Thr Val Thr Cys Ser Val Ser 405 410 415 Gly Ala Ser Gly Thr Gln Asp Val Tyr Phe Val Phe Gly Gly Ser Gly 420 425 430 Thr Gly Tyr Leu Phe Asn Phe Asp Tyr Trp Gln Phe Ala 435 440 445 <210> 39 <211> 1593 <212> DNA <213> Fusarium verticillioides <400> 39 atgaaggtat actggctcgt ggcgtgggcc acttctttga cgccggcact ggctggcttg 60 attggacacc gtcgcgccac caccttcaac aatcctatca tctactcaga ctttccagat 120 aacgatgtat tcctcggtcc agataactac tactacttct ctgcttccaa cttccacttc 180 agcccaggag cacccgtttt gaagtctaaa gatctgctaa actgggatct catcggccat 240 tcaattcccc gcctgaactt tggcgacggc tatgatcttc ctcctggctc acgttattac 300 cgtggaggta cttgggcatc atccctcaga tacagaaaga gcaatggaca gtggtactgg 360 atcggctgca tcaacttctg gcagacctgg gtatacactg cctcatcgcc ggaaggtcca 420 tggtacaaca agggaaactt cggtgataac aattgctact acgacaatgg catactgatc 480 gatgacgatg ataccatgta tgtcgtatac ggttccggtg aggtcaaagt atctcaacta 540 tctcaggacg gattcagcca ggtcaaatct caggtagttt tcaagaacac tgatattggg 600 gtccaagact tggagggtaa ccgcatgtac aagatcaacg ggctctacta tatcctaaac 660 gatagcccaa gtggcagtca gacctggatt tggaagtcga aatcaccctg gggcccttat 720 gagtctaagg tcctcgccga caaagtcacc ccgcctatct ctggtggtaa ctcgccgcat 780 cagggtagtc tcataaagac tcccaatggt ggctggtact tcatgtcatt cacttgggcc 840 tatcctgccg gccgtcttcc ggttcttgca ccgattacgt ggggtagcga tggtttcccc 900 attcttgtca agggtgctaa tggcggatgg ggatcatctt acccaacact tcctggcacg 960 gatggtgtga caaagaattg gacaaggact gataccttcc gcggaacctc acttgctccg 1020 tcctgggagt ggaaccataa tccggacgtc aactccttca ctgtcaacaa cggcctgact 1080 ctccgcactg ctagcattac gaaggatatt taccaggcga ggaacacgct atctcaccga 1140 actcatggtg atcatccaac aggaatagtg aagattgatt tctctccgat gaaggacggc 1200 gaccgggccg ggctttcagc gtttcgagac caaagtgcat acatcggtat tcatcgagat 1260 aacggaaagt tcacaatcgc tacgaagcat gggatgaata tggatgagtg gaacggaaca 1320 acaacagacc tgggacaaat aaaagccaca gctaatgtgc cttctggaag gaccaagatc 1380 tggctgagac ttcaacttga taccaaccca gcaggaactg gcaacactat cttttcttac 1440 agttgggatg gagtcaagta tgaaacactg ggtcccaact tcaaactgta caatggttgg 1500 gcattcttta ttgcttaccg attcggcatc ttcaacttcg ccgagacggc tttaggaggc 1560 tcgatcaagg ttgagtcttt cacagctgca tag 1593 <210> 40 <211> 530 <212> PRT <213> Fusarium verticillioides <400> 40 Met Lys Val Tyr Trp Leu Val Ala Trp Ala Thr Ser Leu Thr Pro Ala 1 5 10 15 Leu Ala Gly Leu Ile Gly His Arg Arg Ala Thr Thr Phe Asn Asn Pro 20 25 30 Ile Ile Tyr Ser Asp Phe Pro Asp Asn Asp Val Phe Leu Gly Pro Asp 35 40 45 Asn Tyr Tyr Tyr Phe Ser Ala Ser Asn Phe His Phe Ser Pro Gly Ala 50 55 60 Pro Val Leu Lys Ser Lys Asp Leu Leu Asn Trp Asp Leu Ile Gly His 65 70 75 80 Ser Ile Pro Arg Leu Asn Phe Gly Asp Gly Tyr Asp Leu Pro Pro Gly 85 90 95 Ser Arg Tyr Tyr Arg Gly Gly Thr Trp Ala Ser Ser Leu Arg Tyr Arg 100 105 110 Lys Ser Asn Gly Gln Trp Tyr Trp Ile Gly Cys Ile Asn Phe Trp Gln 115 120 125 Thr Trp Val Tyr Thr Ala Ser Ser Pro Glu Gly Pro Trp Tyr Asn Lys 130 135 140 Gly Asn Phe Gly Asp Asn Asn Cys Tyr Tyr Asp Asn Gly Ile Leu Ile 145 150 155 160 Asp Asp Asp Asp Thr Met Tyr Val Val Tyr Gly Ser Gly Glu Val Lys 165 170 175 Val Ser Gln Leu Ser Gln Asp Gly Phe Ser Gln Val Lys Ser Gln Val 180 185 190 Val Phe Lys Asn Thr Asp Ile Gly Val Gln Asp Leu Glu Gly Asn Arg 195 200 205 Met Tyr Lys Ile Asn Gly Leu Tyr Tyr Ile Leu Asn Asp Ser Pro Ser 210 215 220 Gly Ser Gln Thr Trp Ile Trp Lys Ser Lys Ser Pro Trp Gly Pro Tyr 225 230 235 240 Glu Ser Lys Val Leu Ala Asp Lys Val Thr Pro Pro Ile Ser Gly Gly 245 250 255 Asn Ser Pro His Gln Gly Ser Leu Ile Lys Thr Pro Asn Gly Gly Trp 260 265 270 Tyr Phe Met Ser Phe Thr Trp Ala Tyr Pro Ala Gly Arg Leu Pro Val 275 280 285 Leu Ala Pro Ile Thr Trp Gly Ser Asp Gly Phe Pro Ile Leu Val Lys 290 295 300 Gly Ala Asn Gly Gly Trp Gly Ser Ser Tyr Pro Thr Leu Pro Gly Thr 305 310 315 320 Asp Gly Val Thr Lys Asn Trp Thr Arg Thr Asp Thr Phe Arg Gly Thr 325 330 335 Ser Leu Ala Pro Ser Trp Glu Trp Asn His Asn Pro Asp Val Asn Ser 340 345 350 Phe Thr Val Asn Asn Gly Leu Thr Leu Arg Thr Ala Ser Ile Thr Lys 355 360 365 Asp Ile Tyr Gln Ala Arg Asn Thr Leu Ser His Arg Thr His Gly Asp 370 375 380 His Pro Thr Gly Ile Val Lys Ile Asp Phe Ser Pro Met Lys Asp Gly 385 390 395 400 Asp Arg Ala Gly Leu Ser Ala Phe Arg Asp Gln Ser Ala Tyr Ile Gly 405 410 415 Ile His Arg Asp Asn Gly Lys Phe Thr Ile Ala Thr Lys His Gly Met 420 425 430 Asn Met Asp Glu Trp Asn Gly Thr Thr Thr Asp Leu Gly Gln Ile Lys 435 440 445 Ala Thr Ala Asn Val Pro Ser Gly Arg Thr Lys Ile Trp Leu Arg Leu 450 455 460 Gln Leu Asp Thr Asn Pro Ala Gly Thr Gly Asn Thr Ile Phe Ser Tyr 465 470 475 480 Ser Trp Asp Gly Val Lys Tyr Glu Thr Leu Gly Pro Asn Phe Lys Leu 485 490 495 Tyr Asn Gly Trp Ala Phe Phe Ile Ala Tyr Arg Phe Gly Ile Phe Asn 500 505 510 Phe Ala Glu Thr Ala Leu Gly Gly Ser Ile Lys Val Glu Ser Phe Thr 515 520 525 Ala Ala 530 <210> 41 <211> 1374 <212> DNA <213> Fusarium verticillioides <400> 41 atgcactacg ctaccctcac cactttggtg ctggctctga ccaccaacgt cgctgcacag 60 caaggcacag caactgtcga cctctccaaa aatcatggac cggcgaaggc ccttggttca 120 ggcttcatat acggctggcc tgacaacgga acaagcgtcg acacctccat accagatttc 180 ttggtaactg acatcaaatt caactcaaac cgcggcggtg gcgcccaaat cccatcactg 240 ggttgggcca gaggtggcta tgaaggatac ctcggccgct tcaactcaac cttatccaac 300 tatcgcacca cgcgcaagta taacgctgac tttatcttgt tgcctcatga cctctggggt 360 gcggatggcg ggcagggttc aaactccccg tttcctggcg acaatggcaa ttggactgag 420 atggagttat tctggaatca gcttgtgtct gacttgaagg ctcataatat gctggaaggt 480 cttgtgattg atgtttggaa tgagcctgat attgatatct tttgggatcg cccgtggtcg 540 cagtttcttg agtattacaa tcgcgcgacc aaactacttc ggtgagtcta ctactgatcc 600 atacgtattt acagtgagct gactggtcga attagaaaaa cacttcccaa aactcttctc 660 agtggcccag ccatggcaca ttctcccatt ctgtccgatg ataaatggca tacctggctt 720 caatcagtag cgggtaacaa gacagtccct gatatttact cctggcatca gattggcgct 780 tgggaacgtg agccggacag cactatcccc gactttacca ccttgcgggc gcaatatggc 840 gttcccgaga agccaattga cgtcaatgag tacgctgcac gcgatgagca aaatccagcc 900 aactccgtct actacctctc tcaactagag cgtcataacc ttagaggtct tcgcgcaaac 960 tggggtagcg gatctgacct ccacaactgg atgggcaact tgatttacag cactaccggt 1020 acctcggagg ggacttacta ccctaatggt gaatggcagg cttacaagta ctatgcggcc 1080 atggcagggc agagacttgt gaccaaagca tcgtcggact tgaagtttga tgtctttgcc 1140 actaagcaag gccgtaagat taagattata gccggcacga ggaccgttca agcaaagtat 1200 aacatcaaaa tcagcggttt ggaagtagca ggacttccta agatgggtac ggtaaaggtc 1260 cggacttatc ggttcgactg ggctgggccg aatggaaagg ttgacgggcc tgttgatttg 1320 ggggagaaga agtatactta ttcggccaat acggtgagca gcccctctac ttga 1374 <210> 42 <211> 439 <212> PRT <213> Fusarium verticillioides <400> 42 Met His Tyr Ala Thr Leu Thr Thr Leu Val Leu Ala Leu Thr Thr Asn 1 5 10 15 Val Ala Ala Gln Gln Gly Thr Ala Thr Val Asp Leu Ser Lys Asn His 20 25 30 Gly Pro Ala Lys Ala Leu Gly Ser Gly Phe Ile Tyr Gly Trp Pro Asp 35 40 45 Asn Gly Thr Ser Val Asp Thr Ser Ile Pro Asp Phe Leu Val Thr Asp 50 55 60 Ile Lys Phe Asn Ser Asn Arg Gly Gly Gly Ala Gln Ile Pro Ser Leu 65 70 75 80 Gly Trp Ala Arg Gly Gly Tyr Glu Gly Tyr Leu Gly Arg Phe Asn Ser 85 90 95 Thr Leu Ser Asn Tyr Arg Thr Thr Arg Lys Tyr Asn Ala Asp Phe Ile 100 105 110 Leu Leu Pro His Asp Leu Trp Gly Ala Asp Gly Gly Gln Gly Ser Asn 115 120 125 Ser Pro Phe Pro Gly Asp Asn Gly Asn Trp Thr Glu Met Glu Leu Phe 130 135 140 Trp Asn Gln Leu Val Ser Asp Leu Lys Ala His Asn Met Leu Glu Gly 145 150 155 160 Leu Val Ile Asp Val Trp Asn Glu Pro Asp Ile Asp Ile Phe Trp Asp 165 170 175 Arg Pro Trp Ser Gln Phe Leu Glu Tyr Tyr Asn Arg Ala Thr Lys Leu 180 185 190 Leu Arg Lys Thr Leu Pro Lys Thr Leu Leu Ser Gly Pro Ala Met Ala 195 200 205 His Ser Pro Ile Leu Ser Asp Asp Lys Trp His Thr Trp Leu Gln Ser 210 215 220 Val Ala Gly Asn Lys Thr Val Pro Asp Ile Tyr Ser Trp His Gln Ile 225 230 235 240 Gly Ala Trp Glu Arg Glu Pro Asp Ser Thr Ile Pro Asp Phe Thr Thr 245 250 255 Leu Arg Ala Gln Tyr Gly Val Pro Glu Lys Pro Ile Asp Val Asn Glu 260 265 270 Tyr Ala Ala Arg Asp Glu Gln Asn Pro Ala Asn Ser Val Tyr Tyr Leu 275 280 285 Ser Gln Leu Glu Arg His Asn Leu Arg Gly Leu Arg Ala Asn Trp Gly 290 295 300 Ser Gly Ser Asp Leu His Asn Trp Met Gly Asn Leu Ile Tyr Ser Thr 305 310 315 320 Thr Gly Thr Ser Glu Gly Thr Tyr Tyr Pro Asn Gly Glu Trp Gln Ala 325 330 335 Tyr Lys Tyr Tyr Ala Ala Met Ala Gly Gln Arg Leu Val Thr Lys Ala 340 345 350 Ser Ser Asp Leu Lys Phe Asp Val Phe Ala Thr Lys Gln Gly Arg Lys 355 360 365 Ile Lys Ile Ile Ala Gly Thr Arg Thr Val Gln Ala Lys Tyr Asn Ile 370 375 380 Lys Ile Ser Gly Leu Glu Val Ala Gly Leu Pro Lys Met Gly Thr Val 385 390 395 400 Lys Val Arg Thr Tyr Arg Phe Asp Trp Ala Gly Pro Asn Gly Lys Val 405 410 415 Asp Gly Pro Val Asp Leu Gly Glu Lys Lys Tyr Thr Tyr Ser Ala Asn 420 425 430 Thr Val Ser Ser Pro Ser Thr 435 <210> 43 <211> 1350 <212> DNA <213> Fusarium verticillioides <400> 43 atgtggctga cctccccatt gctgttcgcc agcaccctcc tgggcctcac tggcgttgct 60 ctagcagaca accccatcgt ccaagacatc tacaccgcag acccagcacc aatggtctac 120 aatggccgcg tctacctctt cacaggccat gacaacgacg gctctaccga cttcaacatg 180 acagactggc gtctcttctc gtcagcagac atggtcaact ggcagcacca tggtgtcccc 240 atgagcttaa agaccttcag ctgggccaac agcagagcct gggctggtca agtcgttgcc 300 cgaaacggaa agttttactt ctatgttcct gtccgtaatg ccaagacggg tggaatggct 360 attggtgtcg gtgttagtac caacatcctt gggccctaca ctgatgccct tggaaagcca 420 ttggtcgaga acaatgagat cgacccaact gtctacatcg acactgatgg ccaggcctat 480 ctctactggg gcaaccctgg attgtactac gtcaagctca accaagacat gctctcctac 540 agtggtagca tcaacaaagt atcgctcaca acagctggat tcggcagccg cccgaacaac 600 gcgcagcgtc ctactacttt cgaggaagga ccgtggctgt acaagcgtgg aaatctctac 660 tacatgatct acgcagccaa ctgctgttcc gaggacattc gctactcaac tggacccagc 720 gccactggac cttggactta ccgcggtgtc gtgatgaaca aggcgggtcg aagcttcacc 780 aaccatcctg gcatcatcga ctttgagaac aactcgtact tcttttacca caatggcgct 840 cttgatggag gtagcggtta tactcggtct gtggctgtcg agagcttcaa gtatggttcg 900 gacggtctga tccccgagat caagatgact acgcaaggcc cagcgcagct caagtctctg 960 aacccatatg tcaagcagga ggccgagact atcgcctggt ctgagggtat cgagactgag 1020 gtctgcagcg aaggtggtct caacgttgct ttcatcgaca atggtgacta catcaaggtc 1080 aagggagtcg actttggcag caccggtgca aagacgttca gcgcccgtgt tgcttccaac 1140 agcagcggag gcaagattga gcttcgactt ggtagcaaga ccggtaagtt ggttggtacc 1200 tgcacggtaa cgactacggg aaactggcag acttataaga ctgtggattg ccccgtcagt 1260 ggtgctactg gtacgagcga tctattcttt gtcttcacgg gctctgggtc tggctctctg 1320 ttcaacttca actggtggca gtttagctaa 1350 <210> 44 <211> 449 <212> PRT <213> Fusarium verticillioides <400> 44 Met Trp Leu Thr Ser Pro Leu Leu Phe Ala Ser Thr Leu Leu Gly Leu 1 5 10 15 Thr Gly Val Ala Leu Ala Asp Asn Pro Ile Val Gln Asp Ile Tyr Thr 20 25 30 Ala Asp Pro Ala Pro Met Val Tyr Asn Gly Arg Val Tyr Leu Phe Thr 35 40 45 Gly His Asp Asn Asp Gly Ser Thr Asp Phe Asn Met Thr Asp Trp Arg 50 55 60 Leu Phe Ser Ser Ala Asp Met Val Asn Trp Gln His His Gly Val Pro 65 70 75 80 Met Ser Leu Lys Thr Phe Ser Trp Ala Asn Ser Arg Ala Trp Ala Gly 85 90 95 Gln Val Val Ala Arg Asn Gly Lys Phe Tyr Phe Tyr Val Pro Val Arg 100 105 110 Asn Ala Lys Thr Gly Gly Met Ala Ile Gly Val Gly Val Ser Thr Asn 115 120 125 Ile Leu Gly Pro Tyr Thr Asp Ala Leu Gly Lys Pro Leu Val Glu Asn 130 135 140 Asn Glu Ile Asp Pro Thr Val Tyr Ile Asp Thr Asp Gly Gln Ala Tyr 145 150 155 160 Leu Tyr Trp Gly Asn Pro Gly Leu Tyr Tyr Val Lys Leu Asn Gln Asp 165 170 175 Met Leu Ser Tyr Ser Gly Ser Ile Asn Lys Val Ser Leu Thr Thr Ala 180 185 190 Gly Phe Gly Ser Arg Pro Asn Asn Ala Gln Arg Pro Thr Thr Phe Glu 195 200 205 Glu Gly Pro Trp Leu Tyr Lys Arg Gly Asn Leu Tyr Tyr Met Ile Tyr 210 215 220 Ala Ala Asn Cys Cys Ser Glu Asp Ile Arg Tyr Ser Thr Gly Pro Ser 225 230 235 240 Ala Thr Gly Pro Trp Thr Tyr Arg Gly Val Val Met Asn Lys Ala Gly 245 250 255 Arg Ser Phe Thr Asn His Pro Gly Ile Ile Asp Phe Glu Asn Asn Ser 260 265 270 Tyr Phe Phe Tyr His Asn Gly Ala Leu Asp Gly Gly Ser Gly Tyr Thr 275 280 285 Arg Ser Val Ala Val Glu Ser Phe Lys Tyr Gly Ser Asp Gly Leu Ile 290 295 300 Pro Glu Ile Lys Met Thr Thr Gln Gly Pro Ala Gln Leu Lys Ser Leu 305 310 315 320 Asn Pro Tyr Val Lys Gln Glu Ala Glu Thr Ile Ala Trp Ser Glu Gly 325 330 335 Ile Glu Thr Glu Val Cys Ser Glu Gly Gly Leu Asn Val Ala Phe Ile 340 345 350 Asp Asn Gly Asp Tyr Ile Lys Val Lys Gly Val Asp Phe Gly Ser Thr 355 360 365 Gly Ala Lys Thr Phe Ser Ala Arg Val Ala Ser Asn Ser Ser Gly Gly 370 375 380 Lys Ile Glu Leu Arg Leu Gly Ser Lys Thr Gly Lys Leu Val Gly Thr 385 390 395 400 Cys Thr Val Thr Thr Thr Gly Asn Trp Gln Thr Tyr Lys Thr Val Asp 405 410 415 Cys Pro Val Ser Gly Ala Thr Gly Thr Ser Asp Leu Phe Phe Val Phe 420 425 430 Thr Gly Ser Gly Ser Gly Ser Leu Phe Asn Phe Asn Trp Trp Gln Phe 435 440 445 Ser <210> 45 <211> 1725 <212> DNA <213> Fusarium verticillioides <400> 45 atgcgcttct cttggctatt gtgccccctt ctagcgatgg gaagtgctct tcctgaaacg 60 aagacggatg tttcgacata caccaaccct gtccttccag gatggcactc ggatccatcg 120 tgtatccaga aagatggcct ctttctctgc gtcacttcaa cattcatctc cttcccaggt 180 cttcccgtct atgcctcaag ggatctagtc aactggcgtc tcatcagcca tgtctggaac 240 cgcgagaaac agttgcctgg cattagctgg aagacggcag gacagcaaca gggaatgtat 300 gcaccaacca ttcgatacca caagggaaca tactacgtca tctgcgaata cctgggcgtt 360 ggagatatta ttggtgtcat cttcaagacc accaatccgt gggacgagag tagctggagt 420 gaccctgtta ccttcaagcc aaatcacatc gaccccgatc tgttctggga tgatgacgga 480 aaggtttatt gtgctaccca tggcatcact ctgcaggaga ttgatttgga aactggagag 540 cttagcccgg agcttaatat ctggaacggc acaggaggtg tatggcctga gggtccccat 600 atctacaagc gcgacggtta ctactatctc atgattgccg agggtggaac tgccgaagac 660 cacgctatca caatcgctcg ggcccgcaag atcaccggcc cctatgaagc ctacaataac 720 aacccaatct tgaccaaccg cgggacatct gagtacttcc agactgtcgg tcacggtgat 780 ctgttccaag ataccaaggg caactggtgg ggtctttgtc ttgctactcg catcacagca 840 cagggagttt cacccatggg ccgtgaagct gttttgttca atggcacatg gaacaagggc 900 gaatggccca agttgcaacc agtacgaggt cgcatgcctg gaaacctcct cccaaagccg 960 acgcgaaacg ttcccggaga tgggcccttc aacgctgacc cagacaacta caacttgaag 1020 aagactaaga agatccctcc tcactttgtg caccatagag tcccaagaga cggtgccttc 1080 tctttgtctt ccaagggtct gcacatcgtg cctagtcgaa acaacgttac cggtagtgtg 1140 ttgccaggag atgagattga gctatcagga cagcgaggtc tagctttcat cggacgccgc 1200 caaactcaca ctctgttcaa atatagtgtt gatatcgact tcaagcccaa gtccgatgat 1260 caggaagctg gaatcaccgt tttccgcacg cagttcgacc atatcgatct tggcattgtt 1320 cgtcttccta caaaccaagg cagcaacaag aaatctaagc ttgccttccg attccgggcc 1380 acaggagctc agaatgttcc tgcaccgaag gtagtaccgg tccccgatgg ctgggagaag 1440 ggcgtaatca gtctacatat cgaggcagcc aacgcgacgc actacaacct tggagcttcg 1500 agccacagag gcaagactct cgacatcgcg acagcatcag caagtcttgt gagtggaggc 1560 acgggttcat ttgttggtag tttgcttgga ccttatgcta cctgcaacgg caaaggatct 1620 ggagtggaat gtcccaaggg aggtgatgtc tatgtgaccc aatggactta taagcccgtg 1680 gcacaagaga ttgatcatgg tgtttttgtg aaatcagaat tgtag 1725 <210> 46 <211> 574 <212> PRT <213> Fusarium verticillioides <400> 46 Met Arg Phe Ser Trp Leu Leu Cys Pro Leu Leu Ala Met Gly Ser Ala 1 5 10 15 Leu Pro Glu Thr Lys Thr Asp Val Ser Thr Tyr Thr Asn Pro Val Leu 20 25 30 Pro Gly Trp His Ser Asp Pro Ser Cys Ile Gln Lys Asp Gly Leu Phe 35 40 45 Leu Cys Val Thr Ser Thr Phe Ile Ser Phe Pro Gly Leu Pro Val Tyr 50 55 60 Ala Ser Arg Asp Leu Val Asn Trp Arg Leu Ile Ser His Val Trp Asn 65 70 75 80 Arg Glu Lys Gln Leu Pro Gly Ile Ser Trp Lys Thr Ala Gly Gln Gln 85 90 95 Gln Gly Met Tyr Ala Pro Thr Ile Arg Tyr His Lys Gly Thr Tyr Tyr 100 105 110 Val Ile Cys Glu Tyr Leu Gly Val Gly Asp Ile Ile Gly Val Ile Phe 115 120 125 Lys Thr Thr Asn Pro Trp Asp Glu Ser Ser Trp Ser Asp Pro Val Thr 130 135 140 Phe Lys Pro Asn His Ile Asp Pro Asp Leu Phe Trp Asp Asp Asp Gly 145 150 155 160 Lys Val Tyr Cys Ala Thr His Gly Ile Thr Leu Gln Glu Ile Asp Leu 165 170 175 Glu Thr Gly Glu Leu Ser Pro Glu Leu Asn Ile Trp Asn Gly Thr Gly 180 185 190 Gly Val Trp Pro Glu Gly Pro His Ile Tyr Lys Arg Asp Gly Tyr Tyr 195 200 205 Tyr Leu Met Ile Ala Glu Gly Gly Thr Ala Glu Asp His Ala Ile Thr 210 215 220 Ile Ala Arg Ala Arg Lys Ile Thr Gly Pro Tyr Glu Ala Tyr Asn Asn 225 230 235 240 Asn Pro Ile Leu Thr Asn Arg Gly Thr Ser Glu Tyr Phe Gln Thr Val 245 250 255 Gly His Gly Asp Leu Phe Gln Asp Thr Lys Gly Asn Trp Trp Gly Leu 260 265 270 Cys Leu Ala Thr Arg Ile Thr Ala Gln Gly Val Ser Pro Met Gly Arg 275 280 285 Glu Ala Val Leu Phe Asn Gly Thr Trp Asn Lys Gly Glu Trp Pro Lys 290 295 300 Leu Gln Pro Val Arg Gly Arg Met Pro Gly Asn Leu Leu Pro Lys Pro 305 310 315 320 Thr Arg Asn Val Pro Gly Asp Gly Pro Phe Asn Ala Asp Pro Asp Asn 325 330 335 Tyr Asn Leu Lys Lys Thr Lys Lys Ile Pro Pro His Phe Val His His 340 345 350 Arg Val Pro Arg Asp Gly Ala Phe Ser Leu Ser Ser Lys Gly Leu His 355 360 365 Ile Val Pro Ser Arg Asn Asn Val Thr Gly Ser Val Leu Pro Gly Asp 370 375 380 Glu Ile Glu Leu Ser Gly Gln Arg Gly Leu Ala Phe Ile Gly Arg Arg 385 390 395 400 Gln Thr His Thr Leu Phe Lys Tyr Ser Val Asp Ile Asp Phe Lys Pro 405 410 415 Lys Ser Asp Asp Gln Glu Ala Gly Ile Thr Val Phe Arg Thr Gln Phe 420 425 430 Asp His Ile Asp Leu Gly Ile Val Arg Leu Pro Thr Asn Gln Gly Ser 435 440 445 Asn Lys Lys Ser Lys Leu Ala Phe Arg Phe Arg Ala Thr Gly Ala Gln 450 455 460 Asn Val Pro Ala Pro Lys Val Val Pro Val Pro Asp Gly Trp Glu Lys 465 470 475 480 Gly Val Ile Ser Leu His Ile Glu Ala Ala Asn Ala Thr His Tyr Asn 485 490 495 Leu Gly Ala Ser Ser His Arg Gly Lys Thr Leu Asp Ile Ala Thr Ala 500 505 510 Ser Ala Ser Leu Val Ser Gly Gly Thr Gly Ser Phe Val Gly Ser Leu 515 520 525 Leu Gly Pro Tyr Ala Thr Cys Asn Gly Lys Gly Ser Gly Val Glu Cys 530 535 540 Pro Lys Gly Gly Asp Val Tyr Val Thr Gln Trp Thr Tyr Lys Pro Val 545 550 555 560 Ala Gln Glu Ile Asp His Gly Val Phe Val Lys Ser Glu Leu 565 570 <210> 47 <211> 2251 <212> DNA <213> Podospora anserina <400> 47 atgatccacc tcaagccagc cctcgcggcg ttgttggcgc tgtcgacgca atgtgtggct 60 attgatttgt ttgtcaagtc ttcggggggg aataagacga ctgatatcat gtatggtctt 120 atgcacgagg tatgtgtttt gcgagatctc ccttttgttt ttgcgcactg ctgacatgga 180 gactgcaaac aggatatcaa caactccggc gacggcggca tctacgccga gctaatctcc 240 aaccgcgcgt tccaagggag tgagaagttc ccctccaacc tcgacaactg gagccccgtc 300 ggtggcgcta cccttaccct tcagaagctt gccaagcccc tttcctctgc gttgccttac 360 tccgtcaatg ttgccaaccc caaggagggc aagggcaagg gcaaggacac caaggggaag 420 aaggttggct tggccaatgc tgggttttgg ggtatggatg tcaagaggca gaagtacact 480 ggtagcttcc acgttactgg tgagtacaag ggtgactttg aggttagctt gcgcagcgcg 540 attaccgggg agacctttgg caagaaggtg gtgaagggtg ggagtaagaa ggggaagtgg 600 accgagaagg agtttgagtt ggtgcctttc aaggatgcgc ccaacagcaa caacaccttt 660 gttgtgcagt gggatgccga ggtatgtgct tctttgatat tggctgagat agaagttggg 720 ttgacatgat gtggtgcagg gcgcaaagga cggatctttg gatctcaact tgatcagctt 780 gttccctccg acattcaagg gaaggaagaa tgggctgaga attgatcttg cgcagacgat 840 ggttgagctc aagccggtaa gtcctctcta gtcagaaaag tagagccttt gttaacgctt 900 gacagacctt cttgcgcttc cccggtggca acatgctcga gggtaacacc ttggacactt 960 ggtggaagtg gtacgagacc attggccctc tgaaggatcg cccgggcatg gctggtgtct 1020 gggagtacca gcaaaccctt ggcttgggtc tggtcgagta catggagtgg gccgatgaca 1080 tgaacttgga gcccagtatg tgatcccatt ttctggagtg acttctcttg ctaacgtatc 1140 cacagttgtc ggtgtcttcg ctggtcttgc cctcgatggc tcgttcgttc ccgaatccga 1200 gatgggatgg gtcatccaac aggctctcga cgaaatcgag ttcctcactg gcgatgctaa 1260 gaccaccaaa tggggtgccg tccgcgcgaa gcttggtcac cccaagcctt ggaaggtcaa 1320 gtgggttgag atcggtaacg aggattggct tgccggacgc cctgctggct tcgagtcgta 1380 catcaactac cgcttcccca tgatgatgaa ggccttcaac gaaaagtacc ccgacatcaa 1440 gatcatcgcc tcgccctcca tcttcgacaa catgacaatc cccgcgggtg ctgccggtga 1500 tcaccacccg tacctgactc ccgatgagtt cgttgagcga ttcgccaagt tcgataactt 1560 gagcaaggat aacgtgacgc tcatcggcga ggctgcgtcg acgcatccta acggtggtat 1620 cgcttgggag ggagatctca tgcccttgcc ttggtggggc ggcagtgttg ctgaggctat 1680 cttcttgatc agcactgaga gaaacggtga caagatcatc ggtgctactt acgcgcctgg 1740 tcttcgcagc ttggaccgct ggcaatggag catgacctgg gtgcagcatg ccgccgaccc 1800 ggccctcacc actcgctcga ccagttggta tgtctggaga atcctcgccc accacatcat 1860 ccgtgagacg ctcccggtcg atgccccggc cggcaagccc aactttgacc ctctgttcta 1920 cgttgccgga aagagcgaga gtggcaccgg tatcttcaag gctgccgtct acaactcgac 1980 tgaatcgatc ccggtgtcgt tgaagtttga tggtctcaac gagggagcgg ttgccaactt 2040 gacggtgctt actgggccgg aggatccgta tggatacaac gaccccttca ctggtatcaa 2100 tgttgtcaag gagaagacca ccttcatcaa ggccggaaag ggcggcaagt tcaccttcac 2160 cctgccgggc ttgagtgttg ctgtgttgga gacggccgac gcggtcaagg gtggcaaggg 2220 aaagggcaag ggcaagggaa agggtaactg a 2251 <210> 48 <211> 676 <212> PRT <213> Podospora anserina <400> 48 Met Ile His Leu Lys Pro Ala Leu Ala Ala Leu Leu Ala Leu Ser Thr 1 5 10 15 Gln Cys Val Ala Ile Asp Leu Phe Val Lys Ser Ser Gly Gly Asn Lys 20 25 30 Thr Thr Asp Ile Met Tyr Gly Leu Met His Glu Asp Ile Asn Asn Ser 35 40 45 Gly Asp Gly Gly Ile Tyr Ala Glu Leu Ile Ser Asn Arg Ala Phe Gln 50 55 60 Gly Ser Glu Lys Phe Pro Ser Asn Leu Asp Asn Trp Ser Pro Val Gly 65 70 75 80 Gly Ala Thr Leu Thr Leu Gln Lys Leu Ala Lys Pro Leu Ser Ser Ala 85 90 95 Leu Pro Tyr Ser Val Asn Val Ala Asn Pro Lys Glu Gly Lys Gly Lys 100 105 110 Gly Lys Asp Thr Lys Gly Lys Lys Val Gly Leu Ala Asn Ala Gly Phe 115 120 125 Trp Gly Met Asp Val Lys Arg Gln Lys Tyr Thr Gly Ser Phe His Val 130 135 140 Thr Gly Glu Tyr Lys Gly Asp Phe Glu Val Ser Leu Arg Ser Ala Ile 145 150 155 160 Thr Gly Glu Thr Phe Gly Lys Lys Val Val Lys Gly Gly Ser Lys Lys 165 170 175 Gly Lys Trp Thr Glu Lys Glu Phe Glu Leu Val Pro Phe Lys Asp Ala 180 185 190 Pro Asn Ser Asn Asn Thr Phe Val Val Gln Trp Asp Ala Glu Gly Ala 195 200 205 Lys Asp Gly Ser Leu Asp Leu Asn Leu Ile Ser Leu Phe Pro Pro Thr 210 215 220 Phe Lys Gly Arg Lys Asn Gly Leu Arg Ile Asp Leu Ala Gln Thr Met 225 230 235 240 Val Glu Leu Lys Pro Thr Phe Leu Arg Phe Pro Gly Gly Asn Met Leu 245 250 255 Glu Gly Asn Thr Leu Asp Thr Trp Trp Lys Trp Tyr Glu Thr Ile Gly 260 265 270 Pro Leu Lys Asp Arg Pro Gly Met Ala Gly Val Trp Glu Tyr Gln Gln 275 280 285 Thr Leu Gly Leu Gly Leu Val Glu Tyr Met Glu Trp Ala Asp Asp Met 290 295 300 Asn Leu Glu Pro Ile Val Gly Val Phe Ala Gly Leu Ala Leu Asp Gly 305 310 315 320 Ser Phe Val Pro Glu Ser Glu Met Gly Trp Val Ile Gln Gln Ala Leu 325 330 335 Asp Glu Ile Glu Phe Leu Thr Gly Asp Ala Lys Thr Thr Lys Trp Gly 340 345 350 Ala Val Arg Ala Lys Leu Gly His Pro Lys Pro Trp Lys Val Lys Trp 355 360 365 Val Glu Ile Gly Asn Glu Asp Trp Leu Ala Gly Arg Pro Ala Gly Phe 370 375 380 Glu Ser Tyr Ile Asn Tyr Arg Phe Pro Met Met Met Lys Ala Phe Asn 385 390 395 400 Glu Lys Tyr Pro Asp Ile Lys Ile Ile Ala Ser Pro Ser Ile Phe Asp 405 410 415 Asn Met Thr Ile Pro Ala Gly Ala Ala Gly Asp His His Pro Tyr Leu 420 425 430 Thr Pro Asp Glu Phe Val Glu Arg Phe Ala Lys Phe Asp Asn Leu Ser 435 440 445 Lys Asp Asn Val Thr Leu Ile Gly Glu Ala Ala Ser Thr His Pro Asn 450 455 460 Gly Gly Ile Ala Trp Glu Gly Asp Leu Met Pro Leu Pro Trp Trp Gly 465 470 475 480 Gly Ser Val Ala Glu Ala Ile Phe Leu Ile Ser Thr Glu Arg Asn Gly 485 490 495 Asp Lys Ile Ile Gly Ala Thr Tyr Ala Pro Gly Leu Arg Ser Leu Asp 500 505 510 Arg Trp Gln Trp Ser Met Thr Trp Val Gln His Ala Ala Asp Pro Ala 515 520 525 Leu Thr Thr Arg Ser Thr Ser Trp Tyr Val Trp Arg Ile Leu Ala His 530 535 540 His Ile Ile Arg Glu Thr Leu Pro Val Asp Ala Pro Ala Gly Lys Pro 545 550 555 560 Asn Phe Asp Pro Leu Phe Tyr Val Ala Gly Lys Ser Glu Ser Gly Thr 565 570 575 Gly Ile Phe Lys Ala Ala Val Tyr Asn Ser Thr Glu Ser Ile Pro Val 580 585 590 Ser Leu Lys Phe Asp Gly Leu Asn Glu Gly Ala Val Ala Asn Leu Thr 595 600 605 Val Leu Thr Gly Pro Glu Asp Pro Tyr Gly Tyr Asn Asp Pro Phe Thr 610 615 620 Gly Ile Asn Val Val Lys Glu Lys Thr Thr Phe Ile Lys Ala Gly Lys 625 630 635 640 Gly Gly Lys Phe Thr Phe Thr Leu Pro Gly Leu Ser Val Ala Val Leu 645 650 655 Glu Thr Ala Asp Ala Val Lys Gly Gly Lys Gly Lys Gly Lys Gly Lys 660 665 670 Gly Lys Gly Asn 675 <210> 49 <211> 1023 <212> DNA <213> Gibberella zeae <400> 49 atgaagtcca agttgttatt cccactcctc tctttcgttg gtcaaagtct tgccaccaac 60 gacgactgtc ctctcatcac tagtagatgg actgcggatc cttcggctca tgtctttaac 120 gacaccttgt ggctctaccc gtctcatgac atcgatgctg gatttgagaa tgatcctgat 180 ggaggccagt acgccatgag agattaccat gtctactcta tcgacaagat ctacggttcc 240 ctgccggtcg atcacggtac ggccctgtca gtggaggatg tcccctgggc ctctcgacag 300 atgtgggctc ctgacgctgc ccacaagaac ggcaaatact acctatactt ccctgccaaa 360 gacaaggatg atatcttcag aatcggcgtt gctgtctcac caacccccgg cggaccattc 420 gtccccgaca agagttggat ccctcacact ttcagcatcg accccgccag tttcgtcgat 480 gatgatgaca gagcctactt ggcatggggt ggtatcatgg gtggccagct tcaacgatgg 540 caggataaga acaagtacaa cgaatctggc actgagccag gaaacggcac cgctgccttg 600 agccctcaga ttgccaagct gagcaaggac atgcacactc tggcagagaa gcctcgcgac 660 atgctcattc ttgaccccaa gactggcaag ccgctccttt ctgaggatga agaccgacgc 720 ttcttcgaag gaccctggat tcacaagcgc aacaagattt actacctcac ctactctact 780 ggcacaaccc actatcttgt ctatgcgact tcaaagaccc cctatggtcc ttacacctac 840 cagggcagaa ttctggagcc agttgatggc tggactactc actctagtat cgtcaagtac 900 cagggtcagt ggtggctatt ttatcacgat gccaagacat ctggcaagga ctatcttcgc 960 caggtaaagg ctaagaagat ttggtacgat agcaaaggaa agatcttgac aaagaagcct 1020 tga 1023 <210> 50 <211> 340 <212> PRT <213> Gibberella zeae <400> 50 Met Lys Ser Lys Leu Leu Phe Pro Leu Leu Ser Phe Val Gly Gln Ser 1 5 10 15 Leu Ala Thr Asn Asp Asp Cys Pro Leu Ile Thr Ser Arg Trp Thr Ala 20 25 30 Asp Pro Ser Ala His Val Phe Asn Asp Thr Leu Trp Leu Tyr Pro Ser 35 40 45 His Asp Ile Asp Ala Gly Phe Glu Asn Asp Pro Asp Gly Gly Gln Tyr 50 55 60 Ala Met Arg Asp Tyr His Val Tyr Ser Ile Asp Lys Ile Tyr Gly Ser 65 70 75 80 Leu Pro Val Asp His Gly Thr Ala Leu Ser Val Glu Asp Val Pro Trp 85 90 95 Ala Ser Arg Gln Met Trp Ala Pro Asp Ala Ala His Lys Asn Gly Lys 100 105 110 Tyr Tyr Leu Tyr Phe Pro Ala Lys Asp Lys Asp Asp Ile Phe Arg Ile 115 120 125 Gly Val Ala Val Ser Pro Thr Pro Gly Gly Pro Phe Val Pro Asp Lys 130 135 140 Ser Trp Ile Pro His Thr Phe Ser Ile Asp Pro Ala Ser Phe Val Asp 145 150 155 160 Asp Asp Asp Arg Ala Tyr Leu Ala Trp Gly Gly Ile Met Gly Gly Gln 165 170 175 Leu Gln Arg Trp Gln Asp Lys Asn Lys Tyr Asn Glu Ser Gly Thr Glu 180 185 190 Pro Gly Asn Gly Thr Ala Ala Leu Ser Pro Gln Ile Ala Lys Leu Ser 195 200 205 Lys Asp Met His Thr Leu Ala Glu Lys Pro Arg Asp Met Leu Ile Leu 210 215 220 Asp Pro Lys Thr Gly Lys Pro Leu Leu Ser Glu Asp Glu Asp Arg Arg 225 230 235 240 Phe Phe Glu Gly Pro Trp Ile His Lys Arg Asn Lys Ile Tyr Tyr Leu 245 250 255 Thr Tyr Ser Thr Gly Thr Thr His Tyr Leu Val Tyr Ala Thr Ser Lys 260 265 270 Thr Pro Tyr Gly Pro Tyr Thr Tyr Gln Gly Arg Ile Leu Glu Pro Val 275 280 285 Asp Gly Trp Thr Thr His Ser Ser Ile Val Lys Tyr Gln Gly Gln Trp 290 295 300 Trp Leu Phe Tyr His Asp Ala Lys Thr Ser Gly Lys Asp Tyr Leu Arg 305 310 315 320 Gln Val Lys Ala Lys Lys Ile Trp Tyr Asp Ser Lys Gly Lys Ile Leu 325 330 335 Thr Lys Lys Pro 340 <210> 51 <211> 1047 <212> DNA <213> Fusarium oxysporum <400> 51 atgcagctca agtttctgtc ttcagcattg ctgttctctc tgaccagcaa atgcgctgcg 60 caagacacta atgacattcc tcccctgatc accgacctct ggtccgcaga tccctcggct 120 catgttttcg aaggcaagct ctgggtttac ccatctcacg acatcgaagc caatgttgtc 180 aacggcacag gaggcgctca atacgccatg agggattacc atacctactc catgaagagc 240 atctatggta aagatcccgt tgtcgaccac ggcgtcgctc tctcagtcga tgacgttccc 300 tgggcgaagc agcaaatgtg ggctcctgac gcagctcata agaacggcaa atattatctg 360 tacttccccg ccaaggacaa ggatgagatc ttcagaattg gagttgctgt ctccaacaag 420 cccagcggtc ctttcaaggc cgacaagagc tggatccctg gcacgtacag tatcgatcct 480 gctagctacg tcgacactga taacgaggcc tacctcatct ggggcggtat ctggggcggc 540 cagctccaag cctggcagga taaaaagaac tttaacgagt cgtggattgg agacaaggct 600 gctcctaacg gcaccaatgc cctatctcct cagatcgcca agctaagcaa ggacatgcac 660 aagatcaccg aaacaccccg cgatctcgtc attctcgccc ccgagacagg caagcctctt 720 caggctgagg acaacaagcg acgattcttc gagggccctt ggatccacaa gcgcggcaag 780 ctttactacc tcatgtactc caccggtgat acccacttcc ttgtctacgc tacttccaag 840 aacatctacg gtccttatac ctaccggggc aagattcttg atcctgttga tgggtggact 900 actcatggaa gtattgttga gtataaggga cagtggtggc ttttctttgc tgatgcgcat 960 acgtctggta aggattacct tcgacaggtg aaggcgagga agatctggta tgacaagaac 1020 ggcaagatct tgcttcaccg tccttag 1047 <210> 52 <211> 348 <212> PRT <213> Fusarium oxysporum <400> 52 Met Gln Leu Lys Phe Leu Ser Ser Ala Leu Leu Phe Ser Leu Thr Ser 1 5 10 15 Lys Cys Ala Ala Gln Asp Thr Asn Asp Ile Pro Pro Leu Ile Thr Asp 20 25 30 Leu Trp Ser Ala Asp Pro Ser Ala His Val Phe Glu Gly Lys Leu Trp 35 40 45 Val Tyr Pro Ser His Asp Ile Glu Ala Asn Val Val Asn Gly Thr Gly 50 55 60 Gly Ala Gln Tyr Ala Met Arg Asp Tyr His Thr Tyr Ser Met Lys Ser 65 70 75 80 Ile Tyr Gly Lys Asp Pro Val Val Asp His Gly Val Ala Leu Ser Val 85 90 95 Asp Asp Val Pro Trp Ala Lys Gln Gln Met Trp Ala Pro Asp Ala Ala 100 105 110 His Lys Asn Gly Lys Tyr Tyr Leu Tyr Phe Pro Ala Lys Asp Lys Asp 115 120 125 Glu Ile Phe Arg Ile Gly Val Ala Val Ser Asn Lys Pro Ser Gly Pro 130 135 140 Phe Lys Ala Asp Lys Ser Trp Ile Pro Gly Thr Tyr Ser Ile Asp Pro 145 150 155 160 Ala Ser Tyr Val Asp Thr Asp Asn Glu Ala Tyr Leu Ile Trp Gly Gly 165 170 175 Ile Trp Gly Gly Gln Leu Gln Ala Trp Gln Asp Lys Lys Asn Phe Asn 180 185 190 Glu Ser Trp Ile Gly Asp Lys Ala Ala Pro Asn Gly Thr Asn Ala Leu 195 200 205 Ser Pro Gln Ile Ala Lys Leu Ser Lys Asp Met His Lys Ile Thr Glu 210 215 220 Thr Pro Arg Asp Leu Val Ile Leu Ala Pro Glu Thr Gly Lys Pro Leu 225 230 235 240 Gln Ala Glu Asp Asn Lys Arg Arg Phe Phe Glu Gly Pro Trp Ile His 245 250 255 Lys Arg Gly Lys Leu Tyr Tyr Leu Met Tyr Ser Thr Gly Asp Thr His 260 265 270 Phe Leu Val Tyr Ala Thr Ser Lys Asn Ile Tyr Gly Pro Tyr Thr Tyr 275 280 285 Arg Gly Lys Ile Leu Asp Pro Val Asp Gly Trp Thr Thr His Gly Ser 290 295 300 Ile Val Glu Tyr Lys Gly Gln Trp Trp Leu Phe Phe Ala Asp Ala His 305 310 315 320 Thr Ser Gly Lys Asp Tyr Leu Arg Gln Val Lys Ala Arg Lys Ile Trp 325 330 335 Tyr Asp Lys Asn Gly Lys Ile Leu Leu His Arg Pro 340 345 <210> 53 <211> 1677 <212> DNA <213> Aspergillus fumigatus <400> 53 atggcagctc caagtttatc ctaccccaca ggtatccaat cgtataccaa tcctctcttc 60 cctggttggc actccgatcc cagctgtgcc tacgtagcgg agcaagacac ctttttctgc 120 gtgacgtcca ctttcattgc cttccccggt cttcctcttt atgcaagccg agatctgcag 180 aactggaaac tggcaagcaa tattttcaat cggcccagcc agatccctga tcttcgcgtc 240 acggatggac agcagtcggg tatctatgcg cccactctgc gctatcatga gggccagttc 300 tacttgatcg tttcgtacct gggcccgcag actaagggct tgctgttcac ctcgtctgat 360 ccgtacgacg atgccgcgtg gagcgatccg ctcgaattcg cggtacatgg catcgacccg 420 gatatcttct gggatcacga cgggacggtc tatgtcacgt ccgccgagga ccagatgatt 480 aagcagtaca cactcgatct gaagacgggg gcgattggcc cggttgacta cctctggaac 540 ggcaccggag gagtctggcc cgagggcccg cacatttaca agagagacgg atactactac 600 ctcatgatcg cagagggagg taccgagctc ggccactcgg agaccatggc gcgatctaga 660 acccggacag gtccctggga gccatacccg cacaatccgc tcttgtcgaa caagggcacc 720 tcggagtact tccagactgt gggccatgcg gacttgttcc aggatgggaa cggcaactgg 780 tgggccgtgg cgttgagcac ccgatcaggg cctgcatgga agaactatcc catgggtcgg 840 gagacggtgc tcgcccccgc cgcttgggag aagggtgagt ggcctgtcat tcagcctgtg 900 agaggccaaa tgcaggggcc gtttccacca ccaaataagc gagttcctcg cggcgagggc 960 ggatggatca agcaacccga caaagtggat ttcaggcccg gatcgaagat accggcgcac 1020 ttccagtact ggcgatatcc caagacagag gattttaccg tctcccctcg gggccacccg 1080 aatactcttc ggctcacacc ctccttttac aacctcaccg gaactgcgga cttcaagccg 1140 gatgatggcc tgtcgcttgt tatgcgcaaa cagaccgaca ccttgttcac gtacactgtg 1200 gacgtgtctt ttgaccccaa ggttgccgat gaagaggcgg gtgtgactgt tttccttacc 1260 cagcagcagc acatcgatct tggtattgtc cttctccaga caaccgaggg gctgtcgttg 1320 tccttccggt tccgcgtgga aggccgcggt aactacgaag gtcctcttcc agaagccacc 1380 gtgcctgttc ccaaggaatg gtgtggacag accatccggc ttgagattca ggccgtgagt 1440 gacaccgagt atgtctttgc ggctgccccg gctcggcacc ctgcacagag gcaaatcatc 1500 agccgcgcca actcgttgat tgtcagtggt gatacgggac ggtttactgg ctcgcttgtt 1560 ggcgtgtatg ccacgtcgaa cgggggtgcc ggatccacgc ccgcatatat cagcagatgg 1620 agatacgaag gacggggcca gatgattgat tttggtcgag tggtcccgag ctactga 1677 <210> 54 <211> 558 <212> PRT <213> Aspergillus fumigatus <400> 54 Met Ala Ala Pro Ser Leu Ser Tyr Pro Thr Gly Ile Gln Ser Tyr Thr 1 5 10 15 Asn Pro Leu Phe Pro Gly Trp His Ser Asp Pro Ser Cys Ala Tyr Val 20 25 30 Ala Glu Gln Asp Thr Phe Phe Cys Val Thr Ser Thr Phe Ile Ala Phe 35 40 45 Pro Gly Leu Pro Leu Tyr Ala Ser Arg Asp Leu Gln Asn Trp Lys Leu 50 55 60 Ala Ser Asn Ile Phe Asn Arg Pro Ser Gln Ile Pro Asp Leu Arg Val 65 70 75 80 Thr Asp Gly Gln Gln Ser Gly Ile Tyr Ala Pro Thr Leu Arg Tyr His 85 90 95 Glu Gly Gln Phe Tyr Leu Ile Val Ser Tyr Leu Gly Pro Gln Thr Lys 100 105 110 Gly Leu Leu Phe Thr Ser Ser Asp Pro Tyr Asp Asp Ala Ala Trp Ser 115 120 125 Asp Pro Leu Glu Phe Ala Val His Gly Ile Asp Pro Asp Ile Phe Trp 130 135 140 Asp His Asp Gly Thr Val Tyr Val Thr Ser Ala Glu Asp Gln Met Ile 145 150 155 160 Lys Gln Tyr Thr Leu Asp Leu Lys Thr Gly Ala Ile Gly Pro Val Asp 165 170 175 Tyr Leu Trp Asn Gly Thr Gly Gly Val Trp Pro Glu Gly Pro His Ile 180 185 190 Tyr Lys Arg Asp Gly Tyr Tyr Tyr Leu Met Ile Ala Glu Gly Gly Thr 195 200 205 Glu Leu Gly His Ser Glu Thr Met Ala Arg Ser Arg Thr Arg Thr Gly 210 215 220 Pro Trp Glu Pro Tyr Pro His Asn Pro Leu Leu Ser Asn Lys Gly Thr 225 230 235 240 Ser Glu Tyr Phe Gln Thr Val Gly His Ala Asp Leu Phe Gln Asp Gly 245 250 255 Asn Gly Asn Trp Trp Ala Val Ala Leu Ser Thr Arg Ser Gly Pro Ala 260 265 270 Trp Lys Asn Tyr Pro Met Gly Arg Glu Thr Val Leu Ala Pro Ala Ala 275 280 285 Trp Glu Lys Gly Glu Trp Pro Val Ile Gln Pro Val Arg Gly Gln Met 290 295 300 Gln Gly Pro Phe Pro Pro Pro Asn Lys Arg Val Pro Arg Gly Glu Gly 305 310 315 320 Gly Trp Ile Lys Gln Pro Asp Lys Val Asp Phe Arg Pro Gly Ser Lys 325 330 335 Ile Pro Ala His Phe Gln Tyr Trp Arg Tyr Pro Lys Thr Glu Asp Phe 340 345 350 Thr Val Ser Pro Arg Gly His Pro Asn Thr Leu Arg Leu Thr Pro Ser 355 360 365 Phe Tyr Asn Leu Thr Gly Thr Ala Asp Phe Lys Pro Asp Asp Gly Leu 370 375 380 Ser Leu Val Met Arg Lys Gln Thr Asp Thr Leu Phe Thr Tyr Thr Val 385 390 395 400 Asp Val Ser Phe Asp Pro Lys Val Ala Asp Glu Glu Ala Gly Val Thr 405 410 415 Val Phe Leu Thr Gln Gln Gln His Ile Asp Leu Gly Ile Val Leu Leu 420 425 430 Gln Thr Thr Glu Gly Leu Ser Leu Ser Phe Arg Phe Arg Val Glu Gly 435 440 445 Arg Gly Asn Tyr Glu Gly Pro Leu Pro Glu Ala Thr Val Pro Val Pro 450 455 460 Lys Glu Trp Cys Gly Gln Thr Ile Arg Leu Glu Ile Gln Ala Val Ser 465 470 475 480 Asp Thr Glu Tyr Val Phe Ala Ala Ala Pro Ala Arg His Pro Ala Gln 485 490 495 Arg Gln Ile Ile Ser Arg Ala Asn Ser Leu Ile Val Ser Gly Asp Thr 500 505 510 Gly Arg Phe Thr Gly Ser Leu Val Gly Val Tyr Ala Thr Ser Asn Gly 515 520 525 Gly Ala Gly Ser Thr Pro Ala Tyr Ile Ser Arg Trp Arg Tyr Glu Gly 530 535 540 Arg Gly Gln Met Ile Asp Phe Gly Arg Val Val Pro Ser Tyr 545 550 555 <210> 55 <211> 2320 <212> DNA <213> Penicillium funiculosum <400> 55 atgggaaaga tgtggcattc gatcttggtt gtgttgggct tattgtctgt cgggcatgcc 60 atcactatca acgtgtccca aagtggcggc aataagacca gtcctttgca atatggtctg 120 atgttcgagg taatccttct cttataccac atataaaagt tgcgtcattt ctaagacaag 180 tcaaggacat aaatcacggc ggtgatggcg gtctgtatgc agagcttgtt cgaaaccgag 240 cattccaagg tagcaccgtc tatccagcaa acctcgatgg atacgactcg gtcaatggag 300 caatcctagc gcttcagaat ttgacaaacc ctctatcacc ctccatgcct agctctctca 360 acgtcgccaa ggggtccaac aatggaagca tcggtttcgc aaatgaaggc tggtggggga 420 tagaagtcaa gccgcaaaga tacgcgggct cattctacgt ccagggggac tatcaaggag 480 atttcgacat ctctcttcag tcgaaattga cacaagaagt cttcgcaacg gcaaaagtca 540 ggtcctcggg caaacacgag gactgggttc aatacaagta cgagttggtg cccaaaaagg 600 cagcatcaaa caccaataac actctgacca ttacttttga ctcaaaggta tgttaaattt 660 tgggtttagt tcgatgtctg gcaattgtct tacgagaaac gtagggattg aaagacggat 720 ccttgaactt caacttgatc agcctatttc ccccaactta caacaatcgg cccaatggcc 780 taagaatcga cctggttgaa gctatggctg aactagaggg ggtaagctct tacaaatcaa 840 ctttatcttt acgaagacta atgtgaaaac ttagaaattt ctgcggtttc caggcggtag 900 cgatgtggaa ggtgtacaag ctccttactg gtataagtgg aatgaaacgg taggagatct 960 caaggaccgt tatagtaggc ccagtgcatg gacgtacgaa gaaagcaatg gaattggctt 1020 gattgagtac atgaattggt gtgatgacat ggggcttgag ccgagtgagt gtattccatt 1080 cagcgtcaaa tccagtgttc taatcataca catcagttct tgccgtatgg gatggacatt 1140 acctttcgaa cgaagtgata tcggaaaacg atttgcagcc atatatcgac gacaccctca 1200 accaactgga attcctgatg ggtgccccag atacgccata tggtagttgg cgtgcgtctc 1260 tgggctatcc gaagccgtgg acgattaact acgtcgagat tggaaacgaa gacaatctat 1320 acgggggact agaaacatac atcgcctacc ggtttcaggc atattacgac gctataacag 1380 ctaaatatcc ccatatgacg gtcatggaat ctttgacgga gatgcctggt ccggcggccg 1440 ctgcaagcga ttaccatcaa tattctactc ctgatgggtt tgtttcccag ttcaactact 1500 ttgatcagat gccagtcact aatagaacac tgaacggtat gaaaaccccc ccttttttaa 1560 atatgctttt aatggtatta accatctttc ataggagaga ttgcaaccgt ttatccaaat 1620 aatcctagta attcggtggc ctggggaagc ccattcccct tgtatccttg gtggattggg 1680 tccgttgcag aagctgtttt cctaattggt gaagagagga attcgccaaa gataatcggt 1740 gctagctacg tacggaattc tacttttcga gattttaaca ttggataaga aggactaacc 1800 tcaatacagg ctccaatgtt cagaaatatc aacaattggc agtggtctcc aacactcatc 1860 gcttttgacg ctgactcgtc gcgtacaagt cgttcaacaa gctggcatgt gatcaaggta 1920 tgctaatttt cctcctcatt caaacccgca gatgtgagct aactttccga agcttctctc 1980 gacaaacaaa atcacgcaaa atttacccac gacttggagt ggcggtgaca taggtccatt 2040 atactgggta gctggacgaa acgacaatac aggatcgaac atattcaagg ccgctgttta 2100 caacagcacc tcagacgtcc ctgtcaccgt tcaatttgca ggatgcaacg caaagagcgc 2160 aaatttgacc atcttgtcat ccgacgatcc gaacgcatcg aactaccctg gggggcccga 2220 agttgtgaag actgagatcc agtctgtcac tgcaaatgct catggagcat ttgagttcag 2280 tctcccgaac ctaagtgtgg ctgttctcaa aacggagtaa 2320 <210> 56 <211> 642 <212> PRT <213> Penicillium funiculosum <400> 56 Met Gly Lys Met Trp His Ser Ile Leu Val Val Leu Gly Leu Leu Ser 1 5 10 15 Val Gly His Ala Ile Thr Ile Asn Val Ser Gln Ser Gly Gly Asn Lys 20 25 30 Thr Ser Pro Leu Gln Tyr Gly Leu Met Phe Glu Asp Ile Asn His Gly 35 40 45 Gly Asp Gly Gly Leu Tyr Ala Glu Leu Val Arg Asn Arg Ala Phe Gln 50 55 60 Gly Ser Thr Val Tyr Pro Ala Asn Leu Asp Gly Tyr Asp Ser Val Asn 65 70 75 80 Gly Ala Ile Leu Ala Leu Gln Asn Leu Thr Asn Pro Leu Ser Pro Ser 85 90 95 Met Pro Ser Ser Leu Asn Val Ala Lys Gly Ser Asn Asn Gly Ser Ile 100 105 110 Gly Phe Ala Asn Glu Gly Trp Trp Gly Ile Glu Val Lys Pro Gln Arg 115 120 125 Tyr Ala Gly Ser Phe Tyr Val Gln Gly Asp Tyr Gln Gly Asp Phe Asp 130 135 140 Ile Ser Leu Gln Ser Lys Leu Thr Gln Glu Val Phe Ala Thr Ala Lys 145 150 155 160 Val Arg Ser Ser Gly Lys His Glu Asp Trp Val Gln Tyr Lys Tyr Glu 165 170 175 Leu Val Pro Lys Lys Ala Ala Ser Asn Thr Asn Asn Thr Leu Thr Ile 180 185 190 Thr Phe Asp Ser Lys Gly Leu Lys Asp Gly Ser Leu Asn Phe Asn Leu 195 200 205 Ile Ser Leu Phe Pro Pro Thr Tyr Asn Asn Arg Pro Asn Gly Leu Arg 210 215 220 Ile Asp Leu Val Glu Ala Met Ala Glu Leu Glu Gly Lys Phe Leu Arg 225 230 235 240 Phe Pro Gly Gly Ser Asp Val Glu Gly Val Gln Ala Pro Tyr Trp Tyr 245 250 255 Lys Trp Asn Glu Thr Val Gly Asp Leu Lys Asp Arg Tyr Ser Arg Pro 260 265 270 Ser Ala Trp Thr Tyr Glu Glu Ser Asn Gly Ile Gly Leu Ile Glu Tyr 275 280 285 Met Asn Trp Cys Asp Asp Met Gly Leu Glu Pro Ile Leu Ala Val Trp 290 295 300 Asp Gly His Tyr Leu Ser Asn Glu Val Ile Ser Glu Asn Asp Leu Gln 305 310 315 320 Pro Tyr Ile Asp Asp Thr Leu Asn Gln Leu Glu Phe Leu Met Gly Ala 325 330 335 Pro Asp Thr Pro Tyr Gly Ser Trp Arg Ala Ser Leu Gly Tyr Pro Lys 340 345 350 Pro Trp Thr Ile Asn Tyr Val Glu Ile Gly Asn Glu Asp Asn Leu Tyr 355 360 365 Gly Gly Leu Glu Thr Tyr Ile Ala Tyr Arg Phe Gln Ala Tyr Tyr Asp 370 375 380 Ala Ile Thr Ala Lys Tyr Pro His Met Thr Val Met Glu Ser Leu Thr 385 390 395 400 Glu Met Pro Gly Pro Ala Ala Ala Ala Ser Asp Tyr His Gln Tyr Ser 405 410 415 Thr Pro Asp Gly Phe Val Ser Gln Phe Asn Tyr Phe Asp Gln Met Pro 420 425 430 Val Thr Asn Arg Thr Leu Asn Gly Glu Ile Ala Thr Val Tyr Pro Asn 435 440 445 Asn Pro Ser Asn Ser Val Ala Trp Gly Ser Pro Phe Pro Leu Tyr Pro 450 455 460 Trp Trp Ile Gly Ser Val Ala Glu Ala Val Phe Leu Ile Gly Glu Glu 465 470 475 480 Arg Asn Ser Pro Lys Ile Ile Gly Ala Ser Tyr Ala Pro Met Phe Arg 485 490 495 Asn Ile Asn Asn Trp Gln Trp Ser Pro Thr Leu Ile Ala Phe Asp Ala 500 505 510 Asp Ser Ser Arg Thr Ser Arg Ser Thr Ser Trp His Val Ile Lys Leu 515 520 525 Leu Ser Thr Asn Lys Ile Thr Gln Asn Leu Pro Thr Thr Trp Ser Gly 530 535 540 Gly Asp Ile Gly Pro Leu Tyr Trp Val Ala Gly Arg Asn Asp Asn Thr 545 550 555 560 Gly Ser Asn Ile Phe Lys Ala Ala Val Tyr Asn Ser Thr Ser Asp Val 565 570 575 Pro Val Thr Val Gln Phe Ala Gly Cys Asn Ala Lys Ser Ala Asn Leu 580 585 590 Thr Ile Leu Ser Ser Asp Asp Pro Asn Ala Ser Asn Tyr Pro Gly Gly 595 600 605 Pro Glu Val Val Lys Thr Glu Ile Gln Ser Val Thr Ala Asn Ala His 610 615 620 Gly Ala Phe Glu Phe Ser Leu Pro Asn Leu Ser Val Ala Val Leu Lys 625 630 635 640 Thr Glu <210> 57 <211> 739 <212> DNA <213> Aspergillus fumigatus <400> 57 atggtttctt tctcctacct gctgctggcg tgctccgcca ttggagctct ggctgccccc 60 gtcgaacccg agaccacctc gttcaatgag actgctcttc atgagttcgc tgagcgcgcc 120 ggcaccccaa gctccaccgg ctggaacaac ggctactact actccttctg gactgatggc 180 ggcggcgacg tgacctacac caatggcgcc ggtggctcgt actccgtcaa ctggaggaac 240 gtgggcaact ttgtcggtgg aaagggctgg aaccctggaa gcgctaggta ccgagctttg 300 tcaacgtcgg atgtgcagac ctgtggctga cagaagtaga accatcaact acggaggcag 360 cttcaacccc agcggcaatg gctacctggc tgtctacggc tggaccacca accccttgat 420 tgagtactac gttgttgagt cgtatggtac atacaacccc ggcagcggcg gtaccttcag 480 gggcactgtc aacaccgacg gtggcactta caacatctac acggccgttc gctacaatgc 540 tccctccatc gaaggcacca agaccttcac ccagtactgg tctgtgcgca cctccaagcg 600 taccggcggc actgtcacca tggccaacca cttcaacgcc tggagcagac tgggcatgaa 660 cctgggaact cacaactacc agattgtcgc cactgagggt taccagagca gcggatctgc 720 ttccatcact gtctactag 739 <210> 58 <211> 228 <212> PRT <213> Aspergillus fumigatus <400> 58 Met Val Ser Phe Ser Tyr Leu Leu Leu Ala Cys Ser Ala Ile Gly Ala 1 5 10 15 Leu Ala Ala Pro Val Glu Pro Glu Thr Thr Ser Phe Asn Glu Thr Ala 20 25 30 Leu His Glu Phe Ala Glu Arg Ala Gly Thr Pro Ser Ser Thr Gly Trp 35 40 45 Asn Asn Gly Tyr Tyr Tyr Ser Phe Trp Thr Asp Gly Gly Gly Asp Val 50 55 60 Thr Tyr Thr Asn Gly Ala Gly Gly Ser Tyr Ser Val Asn Trp Arg Asn 65 70 75 80 Val Gly Asn Phe Val Gly Gly Lys Gly Trp Asn Pro Gly Ser Ala Arg 85 90 95 Thr Ile Asn Tyr Gly Gly Ser Phe Asn Pro Ser Gly Asn Gly Tyr Leu 100 105 110 Ala Val Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr Tyr Val Val 115 120 125 Glu Ser Tyr Gly Thr Tyr Asn Pro Gly Ser Gly Gly Thr Phe Arg Gly 130 135 140 Thr Val Asn Thr Asp Gly Gly Thr Tyr Asn Ile Tyr Thr Ala Val Arg 145 150 155 160 Tyr Asn Ala Pro Ser Ile Glu Gly Thr Lys Thr Phe Thr Gln Tyr Trp 165 170 175 Ser Val Arg Thr Ser Lys Arg Thr Gly Gly Thr Val Thr Met Ala Asn 180 185 190 His Phe Asn Ala Trp Ser Arg Leu Gly Met Asn Leu Gly Thr His Asn 195 200 205 Tyr Gln Ile Val Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ala Ser 210 215 220 Ile Thr Val Tyr 225 <210> 59 <211> 1002 <212> DNA <213> Aspergillus fumigatus <400> 59 atgatctcca tttcctcgct cagctttgga ctcgccgcta tcgccggcgc atatgctctt 60 ccgagtgaca aatccgtcag cttagcggaa cgtcagacga tcacgaccag ccagacaggc 120 acaaacaatg gctactacta ttccttctgg accaacggtg ccggatcagt gcaatataca 180 aatggtgctg gtggcgaata tagtgtgacg tgggcgaacc agaacggtgg tgactttacc 240 tgtgggaagg gctggaatcc agggagtgac cagtaggcaa cgcccgagaa ctatagaaga 300 ggacgcaaag aaagcactaa actctctact agtgacatta ccttctctgg cagcttcaat 360 ccttccggaa atgcttacct gtccgtgtat ggatggacta ccaaccccct agtcgaatac 420 tacatcctcg agaactatgg cagttacaat cctggctcgg gcatgacgca caagggcacc 480 gtcaccagcg atggatccac ctacgacatc tatgagcacc aacaggtcaa ccagccttcg 540 atcgtcggca cggccacctt caaccaatac tggtccatcc gccaaaacaa gcgatccagc 600 ggcacagtca ccaccgcgaa tcacttcaag gcctgggcta gtctggggat gaacctgggt 660 acccataact atcagattgt ttccactgag ggatatgaga gcagcggtac ctcgaccatc 720 actgtctcgt ctggtggttc ttcttctggt ggaagtggtg gcagctcgtc tactacttcc 780 tcaggcagct cccctactgg tggctccggc agtgtaagtc ttcttccata tggttgtggc 840 tttatgtgta ttctgactgt gatagtgctc tgctttgtgg ggccagtgcg gtggaattgg 900 ctggtctggt cctacttgct gctcttcggg cacttgccag gtttcgaact cgtactactc 960 ccagtgcttg tagtaccttc ttgcagggtt atatccaagt ga 1002 <210> 60 <211> 286 <212> PRT <213> Aspergillus fumigatus <400> 60 Met Ile Ser Ile Ser Ser Leu Ser Phe Gly Leu Ala Ala Ile Ala Gly 1 5 10 15 Ala Tyr Ala Leu Pro Ser Asp Lys Ser Val Ser Leu Ala Glu Arg Gln 20 25 30 Thr Ile Thr Thr Ser Gln Thr Gly Thr Asn Asn Gly Tyr Tyr Tyr Ser 35 40 45 Phe Trp Thr Asn Gly Ala Gly Ser Val Gln Tyr Thr Asn Gly Ala Gly 50 55 60 Gly Glu Tyr Ser Val Thr Trp Ala Asn Gln Asn Gly Gly Asp Phe Thr 65 70 75 80 Cys Gly Lys Gly Trp Asn Pro Gly Ser Asp His Asp Ile Thr Phe Ser 85 90 95 Gly Ser Phe Asn Pro Ser Gly Asn Ala Tyr Leu Ser Val Tyr Gly Trp 100 105 110 Thr Thr Asn Pro Leu Val Glu Tyr Tyr Ile Leu Glu Asn Tyr Gly Ser 115 120 125 Tyr Asn Pro Gly Ser Gly Met Thr His Lys Gly Thr Val Thr Ser Asp 130 135 140 Gly Ser Thr Tyr Asp Ile Tyr Glu His Gln Gln Val Asn Gln Pro Ser 145 150 155 160 Ile Val Gly Thr Ala Thr Phe Asn Gln Tyr Trp Ser Ile Arg Gln Asn 165 170 175 Lys Arg Ser Ser Gly Thr Val Thr Thr Ala Asn His Phe Lys Ala Trp 180 185 190 Ala Ser Leu Gly Met Asn Leu Gly Thr His Asn Tyr Gln Ile Val Ser 195 200 205 Thr Glu Gly Tyr Glu Ser Ser Gly Thr Ser Thr Ile Thr Val Ser Ser 210 215 220 Gly Gly Ser Ser Ser Gly Gly Ser Gly Gly Ser Ser Ser Thr Thr Ser 225 230 235 240 Ser Gly Ser Ser Pro Thr Gly Gly Ser Gly Ser Cys Ser Ala Leu Trp 245 250 255 Gly Gln Cys Gly Gly Ile Gly Trp Ser Gly Pro Thr Cys Cys Ser Ser 260 265 270 Gly Thr Cys Gln Val Ser Asn Ser Tyr Tyr Ser Gln Cys Leu 275 280 285 <210> 61 <211> 1053 <212> DNA <213> Fusarium verticillioides <400> 61 atgcagctca agtttctgtc ttcagcattg ttgctgtctt tgaccggcaa ttgcgctgcg 60 caagacacta atgatatccc tcctctgatc accgacctct ggtctgcgga tccctcggct 120 catgttttcg agggcaaact ctgggtttac ccatctcacg acatcgaagc caatgtcgtc 180 aacggcaccg gaggcgctca gtacgccatg agagattatc acacctattc catgaagacc 240 atctatggaa aagatcccgt tatcgaccat ggcgtcgctc tgtcagtcga tgatgtccca 300 tgggccaagc agcaaatgtg ggctcctgac gcagcttaca agaacggcaa atattatctc 360 tacttccccg ccaaggataa agatgagatc ttcagaattg gagttgctgt ctccaacaag 420 cccagcggtc ctttcaaggc cgacaagagc tggatccccg gtacttacag tatcgatcct 480 gctagctatg tcgacactaa tggcgaggca tacctcatct ggggcggtat ctggggcggc 540 cagcttcagg cctggcagga tcacaagacc tttaatgagt cgtggctcgg cgacaaagct 600 gctcccaacg gcaccaacgc cctatctcct cagatcgcca agctaagcaa ggacatgcac 660 aagatcaccg agacaccccg cgatctcgtc atcctggccc ccgagacagg caagcccctt 720 caagcagagg acaataagcg acgatttttc gaggggccct gggttcacaa gcgcggcaag 780 ctgtactacc tcatgtactc taccggcgac acgcacttcc tcgtctacgc gacttccaag 840 aacatctacg gtccttatac ctatcagggc aagattctcg accctgttga tgggtggact 900 acgcatggaa gtattgttga gtacaaggga cagtggtggt tgttctttgc ggatgcgcat 960 acttctggaa aggattatct gagacaggtt aaggcgagga agatctggta tgacaaggat 1020 ggcaagattt tgcttactcg tcctaagatt tag 1053 <210> 62 <211> 350 <212> PRT <213> Fusarium verticillioides <400> 62 Met Gln Leu Lys Phe Leu Ser Ser Ala Leu Leu Leu Ser Leu Thr Gly 1 5 10 15 Asn Cys Ala Ala Gln Asp Thr Asn Asp Ile Pro Pro Leu Ile Thr Asp 20 25 30 Leu Trp Ser Ala Asp Pro Ser Ala His Val Phe Glu Gly Lys Leu Trp 35 40 45 Val Tyr Pro Ser His Asp Ile Glu Ala Asn Val Val Asn Gly Thr Gly 50 55 60 Gly Ala Gln Tyr Ala Met Arg Asp Tyr His Thr Tyr Ser Met Lys Thr 65 70 75 80 Ile Tyr Gly Lys Asp Pro Val Ile Asp His Gly Val Ala Leu Ser Val 85 90 95 Asp Asp Val Pro Trp Ala Lys Gln Gln Met Trp Ala Pro Asp Ala Ala 100 105 110 Tyr Lys Asn Gly Lys Tyr Tyr Leu Tyr Phe Pro Ala Lys Asp Lys Asp 115 120 125 Glu Ile Phe Arg Ile Gly Val Ala Val Ser Asn Lys Pro Ser Gly Pro 130 135 140 Phe Lys Ala Asp Lys Ser Trp Ile Pro Gly Thr Tyr Ser Ile Asp Pro 145 150 155 160 Ala Ser Tyr Val Asp Thr Asn Gly Glu Ala Tyr Leu Ile Trp Gly Gly 165 170 175 Ile Trp Gly Gly Gln Leu Gln Ala Trp Gln Asp His Lys Thr Phe Asn 180 185 190 Glu Ser Trp Leu Gly Asp Lys Ala Ala Pro Asn Gly Thr Asn Ala Leu 195 200 205 Ser Pro Gln Ile Ala Lys Leu Ser Lys Asp Met His Lys Ile Thr Glu 210 215 220 Thr Pro Arg Asp Leu Val Ile Leu Ala Pro Glu Thr Gly Lys Pro Leu 225 230 235 240 Gln Ala Glu Asp Asn Lys Arg Arg Phe Phe Glu Gly Pro Trp Val His 245 250 255 Lys Arg Gly Lys Leu Tyr Tyr Leu Met Tyr Ser Thr Gly Asp Thr His 260 265 270 Phe Leu Val Tyr Ala Thr Ser Lys Asn Ile Tyr Gly Pro Tyr Thr Tyr 275 280 285 Gln Gly Lys Ile Leu Asp Pro Val Asp Gly Trp Thr Thr His Gly Ser 290 295 300 Ile Val Glu Tyr Lys Gly Gln Trp Trp Leu Phe Phe Ala Asp Ala His 305 310 315 320 Thr Ser Gly Lys Asp Tyr Leu Arg Gln Val Lys Ala Arg Lys Ile Trp 325 330 335 Tyr Asp Lys Asp Gly Lys Ile Leu Leu Thr Arg Pro Lys Ile 340 345 350 <210> 63 <211> 1031 <212> DNA <213> Penicillium funiculosum <400> 63 atgagtcgca gcatccttcc gtacgcctct gttttcgccc tcctgggcgg ggctatcgcc 60 gaaccgtttt tggttctcaa tagcgatttt cccgatccca gtctcataga gacatccagc 120 ggatactatg cattcggtac caccggaaac ggagtcaatg cgcaggttgc ttcttcacca 180 gactttaata cctggacttt gctttccggc acagatgccc tcccgggacc atttccgtca 240 tgggtagctt cgtctccaca aatctgggcg ccagatgttt tggttaaggt atgttcttat 300 ggaataacag ttttaggagt aggtcagcca ggatattgac aaaattataa taggccgatg 360 gtacctatgt catgtacttt tcggcatctg ctgcgagtga ctcgggcaaa cactgcgttg 420 gtgccgcaac tgcgacctca ccggaaggac cttacacccc ggtcgatagc gctgttgcct 480 gtccattaga ccagggagga gctattgatg ccaatggatt tattgacacc gacggcacta 540 tatacgttgt atacaaaatt gatggaaaca gtctagacgg tgatggaacc acacatccta 600 cccccatcat gcttcaacaa atggaggcag acggaacaac cccaaccggc agcccaatcc 660 aactcattga ccgatccgac ctcgacggac ctttgatcga ggctcctagt ttgctcctct 720 ccaatggaat ctactacctc agtttctctt ccaactacta caacactaat tactacgaca 780 cttcatacgc ctatgcctcg tcgattactg gtccttggac caaacaatct gcgccttatg 840 cacccttgtt ggttactgga accgagacta gcaatgacgg cgcattgagc gcccctggtg 900 gtgccgattt ctccgtcgat ggcaccaaga tgttgttcca cgcaaacctc aatggacaag 960 atatctcggg cggacgcgcc ttatttgctg cgtcaattac tgaggccagc gatgtggtta 1020 cattgcagta g 1031 <210> 64 <211> 321 <212> PRT <213> Penicillium funiculosum <400> 64 Met Ser Arg Ser Ile Leu Pro Tyr Ala Ser Val Phe Ala Leu Leu Gly 1 5 10 15 Gly Ala Ile Ala Glu Pro Phe Leu Val Leu Asn Ser Asp Phe Pro Asp 20 25 30 Pro Ser Leu Ile Glu Thr Ser Ser Gly Tyr Tyr Ala Phe Gly Thr Thr 35 40 45 Gly Asn Gly Val Asn Ala Gln Val Ala Ser Ser Pro Asp Phe Asn Thr 50 55 60 Trp Thr Leu Leu Ser Gly Thr Asp Ala Leu Pro Gly Pro Phe Pro Ser 65 70 75 80 Trp Val Ala Ser Ser Pro Gln Ile Trp Ala Pro Asp Val Leu Val Lys 85 90 95 Ala Asp Gly Thr Tyr Val Met Tyr Phe Ser Ala Ser Ala Ala Ser Asp 100 105 110 Ser Gly Lys His Cys Val Gly Ala Ala Thr Ala Thr Ser Pro Glu Gly 115 120 125 Pro Tyr Thr Pro Val Asp Ser Ala Val Ala Cys Pro Leu Asp Gln Gly 130 135 140 Gly Ala Ile Asp Ala Asn Gly Phe Ile Asp Thr Asp Gly Thr Ile Tyr 145 150 155 160 Val Val Tyr Lys Ile Asp Gly Asn Ser Leu Asp Gly Asp Gly Thr Thr 165 170 175 His Pro Thr Pro Ile Met Leu Gln Gln Met Glu Ala Asp Gly Thr Thr 180 185 190 Pro Thr Gly Ser Pro Ile Gln Leu Ile Asp Arg Ser Asp Leu Asp Gly 195 200 205 Pro Leu Ile Glu Ala Pro Ser Leu Leu Leu Ser Asn Gly Ile Tyr Tyr 210 215 220 Leu Ser Phe Ser Ser Asn Tyr Tyr Asn Thr Asn Tyr Tyr Asp Thr Ser 225 230 235 240 Tyr Ala Tyr Ala Ser Ser Ile Thr Gly Pro Trp Thr Lys Gln Ser Ala 245 250 255 Pro Tyr Ala Pro Leu Leu Val Thr Gly Thr Glu Thr Ser Asn Asp Gly 260 265 270 Ala Leu Ser Ala Pro Gly Gly Ala Asp Phe Ser Val Asp Gly Thr Lys 275 280 285 Met Leu Phe His Ala Asn Leu Asn Gly Gln Asp Ile Ser Gly Gly Arg 290 295 300 Ala Leu Phe Ala Ala Ser Ile Thr Glu Ala Ser Asp Val Val Thr Leu 305 310 315 320 Gln <210> 65 <211> 2186 <212> DNA <213> Fusarium verticillioides <400> 65 atggttcgct tcagttcaat cctagcggct gcggcttgct tcgtggctgt tgagtcagtc 60 aacatcaagg tcgacagcaa gggcggaaac gctactagcg gtcaccaata tggcttcctt 120 cacgaggttg gtattgacac accactggcg atgattggga tgctaacttg gagctaggat 180 atcaacaatt ccggtgatgg tggcatctac gctgagctca tccgcaatcg tgctttccag 240 tacagcaaga aataccctgt ttctctatct ggctggagac ccatcaacga tgctaagctc 300 tccctcaacc gtctcgacac tcctctctcc gacgctctcc ccgtttccat gaacgtgaag 360 cctggaaagg gcaaggccaa ggagattggt ttcctcaacg agggttactg gggaatggat 420 gtcaagaagc aaaagtacac tggctctttc tgggttaagg gcgcttacaa gggccacttt 480 acagcttctt tgcgatctaa ccttaccgac gatgtctttg gcagcgtcaa ggtcaagtcc 540 aaggccaaca agaagcagtg ggttgagcat gagtttgtgc ttactcctaa caagaatgcc 600 cctaacagca acaacacttt tgctatcacc tacgatccca aggtgagtaa caatcaaaac 660 tgggacgtga tgtatactga caatttgtag ggcgctgatg gagctcttga cttcaacctc 720 attagcttgt tccctcccac ctacaagggc cgcaagaacg gtcttcgagt tgatcttgcc 780 gaggctctcg aaggtctcca ccccgtaagg tttaccgtct cacgtgtatc gtgaacagtc 840 gctgacttgt agaaaagagc ctgctgcgct tccccggtgg taacatgctc gagggcaaca 900 ccaacaagac ctggtgggac tggaaggata ccctcggacc tctccgcaac cgtcctggtt 960 tcgagggtgt ctggaactac cagcagaccc atggtcttgg aatcttggag tacctccagt 1020 gggctgagga catgaacctt gaaatcagta ggttctataa aattcagtga cggttatgtg 1080 catgctaaca gatttcagtt gtcggtgtct acgctggcct ctccctcgac ggctccgtca 1140 cccccaagga ccaactccag cccctcatcg acgacgcgct cgacgagatc gaattcatcc 1200 gaggtcccgt cacttcaaag tggggaaaga agcgcgctga gctcggccac cccaagcctt 1260 tcagactctc ctacgttgaa gtcggaaacg aggactggct cgctggttat cccactggct 1320 ggaactctta caaggagtac cgcttcccca tgttcctcga ggctatcaag aaagctcacc 1380 ccgatctcac cgtcatctcc tctggtgctt ctattgaccc cgttggtaag aaggatgctg 1440 gtttcgatat tcctgctcct ggaatcggtg actaccaccc ttaccgcgag cctgatgttc 1500 ttgttgagga gttcaacctg tttgataaca ataagtatgg tcacatcatt ggtgaggttg 1560 cttctaccca ccccaacggt ggaactggct ggagtggtaa ccttatgcct tacccctggt 1620 ggatctctgg tgttggcgag gccgtcgctc tctgcggtta tgagcgcaac gccgatcgta 1680 ttcccggaac attctacgct cctatcctca agaacgagaa ccgttggcag tgggctatca 1740 ccatgatcca attcgccgcc gactccgcca tgaccacccg ctccaccagc tggtatgtct 1800 ggtcactctt cgcaggccac cccatgaccc atactctccc caccaccgcc gacttcgacc 1860 ccctctacta cgtcgctggt aagaacgagg acaagggaac tcttatctgg aagggtgctg 1920 cgtataacac caccaagggt gctgacgttc ccgtgtctct gtccttcaag ggtgtcaagc 1980 ccggtgctca agctgagctt actcttctga ccaacaagga gaaggatcct tttgcgttca 2040 atgatcctca caagggcaac aatgttgttg atactaagaa gactgttctc aaggccgatg 2100 gaaagggtgc tttcaacttc aagcttccta acctgagcgt cgctgttctt gagaccctca 2160 agaagggaaa gccttactct agctag 2186 <210> 66 <211> 660 <212> PRT <213> Fusarium verticillioides <400> 66 Met Val Arg Phe Ser Ser Ile Leu Ala Ala Ala Ala Cys Phe Val Ala 1 5 10 15 Val Glu Ser Val Asn Ile Lys Val Asp Ser Lys Gly Gly Asn Ala Thr 20 25 30 Ser Gly His Gln Tyr Gly Phe Leu His Glu Asp Ile Asn Asn Ser Gly 35 40 45 Asp Gly Gly Ile Tyr Ala Glu Leu Ile Arg Asn Arg Ala Phe Gln Tyr 50 55 60 Ser Lys Lys Tyr Pro Val Ser Leu Ser Gly Trp Arg Pro Ile Asn Asp 65 70 75 80 Ala Lys Leu Ser Leu Asn Arg Leu Asp Thr Pro Leu Ser Asp Ala Leu 85 90 95 Pro Val Ser Met Asn Val Lys Pro Gly Lys Gly Lys Ala Lys Glu Ile 100 105 110 Gly Phe Leu Asn Glu Gly Tyr Trp Gly Met Asp Val Lys Lys Gln Lys 115 120 125 Tyr Thr Gly Ser Phe Trp Val Lys Gly Ala Tyr Lys Gly His Phe Thr 130 135 140 Ala Ser Leu Arg Ser Asn Leu Thr Asp Asp Val Phe Gly Ser Val Lys 145 150 155 160 Val Lys Ser Lys Ala Asn Lys Lys Gln Trp Val Glu His Glu Phe Val 165 170 175 Leu Thr Pro Asn Lys Asn Ala Pro Asn Ser Asn Asn Thr Phe Ala Ile 180 185 190 Thr Tyr Asp Pro Lys Gly Ala Asp Gly Ala Leu Asp Phe Asn Leu Ile 195 200 205 Ser Leu Phe Pro Pro Thr Tyr Lys Gly Arg Lys Asn Gly Leu Arg Val 210 215 220 Asp Leu Ala Glu Ala Leu Glu Gly Leu His Pro Ser Leu Leu Arg Phe 225 230 235 240 Pro Gly Gly Asn Met Leu Glu Gly Asn Thr Asn Lys Thr Trp Trp Asp 245 250 255 Trp Lys Asp Thr Leu Gly Pro Leu Arg Asn Arg Pro Gly Phe Glu Gly 260 265 270 Val Trp Asn Tyr Gln Gln Thr His Gly Leu Gly Ile Leu Glu Tyr Leu 275 280 285 Gln Trp Ala Glu Asp Met Asn Leu Glu Ile Ile Val Gly Val Tyr Ala 290 295 300 Gly Leu Ser Leu Asp Gly Ser Val Thr Pro Lys Asp Gln Leu Gln Pro 305 310 315 320 Leu Ile Asp Asp Ala Leu Asp Glu Ile Glu Phe Ile Arg Gly Pro Val 325 330 335 Thr Ser Lys Trp Gly Lys Lys Arg Ala Glu Leu Gly His Pro Lys Pro 340 345 350 Phe Arg Leu Ser Tyr Val Glu Val Gly Asn Glu Asp Trp Leu Ala Gly 355 360 365 Tyr Pro Thr Gly Trp Asn Ser Tyr Lys Glu Tyr Arg Phe Pro Met Phe 370 375 380 Leu Glu Ala Ile Lys Lys Ala His Pro Asp Leu Thr Val Ile Ser Ser 385 390 395 400 Gly Ala Ser Ile Asp Pro Val Gly Lys Lys Asp Ala Gly Phe Asp Ile 405 410 415 Pro Ala Pro Gly Ile Gly Asp Tyr His Pro Tyr Arg Glu Pro Asp Val 420 425 430 Leu Val Glu Glu Phe Asn Leu Phe Asp Asn Asn Lys Tyr Gly His Ile 435 440 445 Ile Gly Glu Val Ala Ser Thr His Pro Asn Gly Gly Thr Gly Trp Ser 450 455 460 Gly Asn Leu Met Pro Tyr Pro Trp Trp Ile Ser Gly Val Gly Glu Ala 465 470 475 480 Val Ala Leu Cys Gly Tyr Glu Arg Asn Ala Asp Arg Ile Pro Gly Thr 485 490 495 Phe Tyr Ala Pro Ile Leu Lys Asn Glu Asn Arg Trp Gln Trp Ala Ile 500 505 510 Thr Met Ile Gln Phe Ala Ala Asp Ser Ala Met Thr Thr Arg Ser Thr 515 520 525 Ser Trp Tyr Val Trp Ser Leu Phe Ala Gly His Pro Met Thr His Thr 530 535 540 Leu Pro Thr Thr Ala Asp Phe Asp Pro Leu Tyr Tyr Val Ala Gly Lys 545 550 555 560 Asn Glu Asp Lys Gly Thr Leu Ile Trp Lys Gly Ala Ala Tyr Asn Thr 565 570 575 Thr Lys Gly Ala Asp Val Pro Val Ser Leu Ser Phe Lys Gly Val Lys 580 585 590 Pro Gly Ala Gln Ala Glu Leu Thr Leu Leu Thr Asn Lys Glu Lys Asp 595 600 605 Pro Phe Ala Phe Asn Asp Pro His Lys Gly Asn Asn Val Val Asp Thr 610 615 620 Lys Lys Thr Val Leu Lys Ala Asp Gly Lys Gly Ala Phe Asn Phe Lys 625 630 635 640 Leu Pro Asn Leu Ser Val Ala Val Leu Glu Thr Leu Lys Lys Gly Lys 645 650 655 Pro Tyr Ser Ser 660 <210> 67 <211> 2312 <212> DNA <213> Chaetomium globosum <400> 67 atggcgcccc tttcgcttcg ggccctctcg ctgctcgcgc tcacaggagc cgcagccgcg 60 gtgaccctat cggtcgcgaa ctctggcggt aatgatacgt ctccgtacat gtatggcatc 120 atgttcgagg acatcaatca gagcggtgac ggcgggctgt aagttctgtc gcggcttccc 180 ctgacaagct tgcatgatgc ttaactaaag tccttaggta cgccgagctg attcgcaacc 240 gagccttcca taatagctcc ctccaggcct ggaccgccgt gggggacagc actctcgagg 300 tcgtaacctc tgcaccgtta tcggatgccc tgcctcgctc ggtcaaggtc acgagtggaa 360 agggcaaggc gggcttgaag aatgccggct actggggaat ggacgtccag aagaccgaca 420 agtatagcgg cagcttctac tcgtacggcg cctacgacgg aaagtttacc ctctctctgg 480 tgtcggacat cacaaatgag accctggcca ccaccaagat caagtccagg tcggtggagc 540 atgcctggac cgagcacaag ttcgagcttc tcccgaccaa gagcgcggcg aacagcaaca 600 acagcttcgt gctggagttc cgcccctgcc accagacgga gctccagttc aacctcatca 660 gcttgttccc gccgacgtat aagaacaggc ccaacggcat gcgccgagag ctcatggaga 720 agctcgcaga cctcaagccc agtttccttc ggattccagg aggcaacaac ctgtaagtgc 780 ttccggcgaa actagcagta gttgcctgag agacactaat ctcagcgaac aacagcgagg 840 gcaactatgc tggcaactac tggaactggt caagcacact tggcccgctg accgaccggc 900 ccggtcgtga cggcgtgtgg acgtacgcca acacggacgg catcgggctg gtcgagtaca 960 tgcactgggc cgaggacctc gacgtggagg ttgtgctggc ggtcgccgca ggcctgtacc 1020 tgaacggcga tgtggtcccg gaggaggagc tgcacgtctt cgtggaggat gcgctgaacg 1080 agctcgagtt cctcatgggc gacgtctcga ccccttgggg cgcgcgccgc gctaagctcg 1140 gctaccccaa gccgtggaac atcaagttcg tcgaggtcgg caacgaggac aacctgtggg 1200 gcggcctcga ctcgtacaag agctaccggc tgaagacttt ctacgacgcc atcaaggcga 1260 agtaccccga catctccatc ttttcgtcga ccgacgagtt tgtgtacaag gagtcgggcc 1320 aggactacca caagtacacc cggccggact actccgtgtc ccagttcgac ctgtttgaca 1380 actgggccga cggccacccc atcatcatcg gagagtgagt gaacggcgac ccccacctcc 1440 ccctaacgcg ggatcgcgag ctgatagatc accccaggta tgcgaccatc cagaacaaca 1500 cgggcaagct cgaggacacg gactgggacg cgcccaagaa caagtggtcc aactggatcg 1560 gctccgtcgc cgaggccgtc ttcatcctcg gagccgagcg caacggcgac cgggtctggg 1620 gcaccacctt tgcgccgatc ctccagaacc tcaacagcta ccaatgggct gtaagtacat 1680 acatacatac cgcaccccca accccaaccc ccccaaagcg cacctccacc cacccaccca 1740 aacacaccac aactacctag ctaacccgcc acacaaacaa acagcccgac ctaatctcct 1800 tcaccgccaa cccggccgac accacgccca gcgtctcgta cccgatcatc cagctgctcg 1860 cctcgcaccg catcacgcac accctccccg tcagcagcgc cgacgccttc ggcccggcct 1920 actgggtggc cggtcgcggc gccgacgacg gctcgtacat cctcaaggcg gccgtgtaca 1980 acagcacggg gggtgcggat gtaccggtga gggtgcagtt tgaggcgggg ggtggtggtg 2040 gtggtggtgg tggtggtggt ggtggtggtg gtgatgggaa ggggaagggt aaagggaagg 2100 gaggggaggg tggtgagggt gtgaagaagg gtgaccgcgc gcagttgacc gtgttgacgg 2160 cgccggaggg gccctgggcg cataatacgc cggagaataa gggggcggtc aagacgacag 2220 tgacgacgtt gaaggccggg aggggtgggg tgtttgagtt tagtctgccg gatttgtcgg 2280 tggcggtgtt ggtggtggag ggggagaagt ga 2312 <210> 68 <211> 670 <212> PRT <213> Chaetomium globosum <400> 68 Met Ala Pro Leu Ser Leu Arg Ala Leu Ser Leu Leu Ala Leu Thr Gly 1 5 10 15 Ala Ala Ala Ala Val Thr Leu Ser Val Ala Asn Ser Gly Gly Asn Asp 20 25 30 Thr Ser Pro Tyr Met Tyr Gly Ile Met Phe Glu Asp Ile Asn Gln Ser 35 40 45 Gly Asp Gly Gly Leu Tyr Ala Glu Leu Ile Arg Asn Arg Ala Phe His 50 55 60 Asn Ser Ser Leu Gln Ala Trp Thr Ala Val Gly Asp Ser Thr Leu Glu 65 70 75 80 Val Val Thr Ser Ala Pro Leu Ser Asp Ala Leu Pro Arg Ser Val Lys 85 90 95 Val Thr Ser Gly Lys Gly Lys Ala Gly Leu Lys Asn Ala Gly Tyr Trp 100 105 110 Gly Met Asp Val Gln Lys Thr Asp Lys Tyr Ser Gly Ser Phe Tyr Ser 115 120 125 Tyr Gly Ala Tyr Asp Gly Lys Phe Thr Leu Ser Leu Val Ser Asp Ile 130 135 140 Thr Asn Glu Thr Leu Ala Thr Thr Lys Ile Lys Ser Arg Ser Val Glu 145 150 155 160 His Ala Trp Thr Glu His Lys Phe Glu Leu Leu Pro Thr Lys Ser Ala 165 170 175 Ala Asn Ser Asn Asn Ser Phe Val Leu Glu Phe Arg Pro Cys His Gln 180 185 190 Thr Glu Leu Gln Phe Asn Leu Ile Ser Leu Phe Pro Pro Thr Tyr Lys 195 200 205 Asn Arg Pro Asn Gly Met Arg Arg Glu Leu Met Glu Lys Leu Ala Asp 210 215 220 Leu Lys Pro Ser Phe Leu Arg Ile Pro Gly Gly Asn Asn Leu Glu Gly 225 230 235 240 Asn Tyr Ala Gly Asn Tyr Trp Asn Trp Ser Ser Thr Leu Gly Pro Leu 245 250 255 Thr Asp Arg Pro Gly Arg Asp Gly Val Trp Thr Tyr Ala Asn Thr Asp 260 265 270 Gly Ile Gly Leu Val Glu Tyr Met His Trp Ala Glu Asp Leu Asp Val 275 280 285 Glu Val Val Leu Ala Val Ala Ala Gly Leu Tyr Leu Asn Gly Asp Val 290 295 300 Val Pro Glu Glu Glu Leu His Val Phe Val Glu Asp Ala Leu Asn Glu 305 310 315 320 Leu Glu Phe Leu Met Gly Asp Val Ser Thr Pro Trp Gly Ala Arg Arg 325 330 335 Ala Lys Leu Gly Tyr Pro Lys Pro Trp Asn Ile Lys Phe Val Glu Val 340 345 350 Gly Asn Glu Asp Asn Leu Trp Gly Gly Leu Asp Ser Tyr Lys Ser Tyr 355 360 365 Arg Leu Lys Thr Phe Tyr Asp Ala Ile Lys Ala Lys Tyr Pro Asp Ile 370 375 380 Ser Ile Phe Ser Ser Thr Asp Glu Phe Val Tyr Lys Glu Ser Gly Gln 385 390 395 400 Asp Tyr His Lys Tyr Thr Arg Pro Asp Tyr Ser Val Ser Gln Phe Asp 405 410 415 Leu Phe Asp Asn Trp Ala Asp Gly His Pro Ile Ile Ile Gly Glu Tyr 420 425 430 Ala Thr Ile Gln Asn Asn Thr Gly Lys Leu Glu Asp Thr Asp Trp Asp 435 440 445 Ala Pro Lys Asn Lys Trp Ser Asn Trp Ile Gly Ser Val Ala Glu Ala 450 455 460 Val Phe Ile Leu Gly Ala Glu Arg Asn Gly Asp Arg Val Trp Gly Thr 465 470 475 480 Thr Phe Ala Pro Ile Leu Gln Asn Leu Asn Ser Tyr Gln Trp Ala Pro 485 490 495 Asp Leu Ile Ser Phe Thr Ala Asn Pro Ala Asp Thr Thr Pro Ser Val 500 505 510 Ser Tyr Pro Ile Ile Gln Leu Leu Ala Ser His Arg Ile Thr His Thr 515 520 525 Leu Pro Val Ser Ser Ala Asp Ala Phe Gly Pro Ala Tyr Trp Val Ala 530 535 540 Gly Arg Gly Ala Asp Asp Gly Ser Tyr Ile Leu Lys Ala Ala Val Tyr 545 550 555 560 Asn Ser Thr Gly Gly Ala Asp Val Pro Val Arg Val Gln Phe Glu Ala 565 570 575 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Asp 580 585 590 Gly Lys Gly Lys Gly Lys Gly Lys Gly Gly Glu Gly Gly Glu Gly Val 595 600 605 Lys Lys Gly Asp Arg Ala Gln Leu Thr Val Leu Thr Ala Pro Glu Gly 610 615 620 Pro Trp Ala His Asn Thr Pro Glu Asn Lys Gly Ala Val Lys Thr Thr 625 630 635 640 Val Thr Thr Leu Lys Ala Gly Arg Gly Gly Val Phe Glu Phe Ser Leu 645 650 655 Pro Asp Leu Ser Val Ala Val Leu Val Val Glu Gly Glu Lys 660 665 670 <210> 69 <211> 1002 <212> DNA <213> Fusarium verticillioides <400> 69 atgcgtcttc tatcgtttcc cagccatctc ctcgtggcct tcctaaccct caaagaggct 60 tcatccctcg ccctcagcaa acgggatagc cctgtcctcc ccggcctctg ggcggacccc 120 aacatcgcca tcgtcgacaa gacatactac atcttcccta ccaccgacgg tttcgaaggc 180 tggggcggca acgtcttcta ctggtggaaa tcaaaagatc tcgtatcatg gacaaagagc 240 gacaagccat tccttactct caatggtacg aatggcaacg ttccctgggc tacaggtaat 300 gcctgggctc ctgctttcgc tgctcgcgga ggcaagtatt acttctacca tagtgggaat 360 aatccctctg tgagtgatgg gcataagagt attggtgcgg cggtggctga tcatcctgag 420 gggccgtgga aggcacagga taagccgatg atcaagggaa cttctgatga ggagattgtc 480 agcaaccagg ctatcgatcc cgctgccttt gaagaccctg agactggaaa gtggtatatc 540 tactggggaa acggtgtccc cattgtcgca gagctcaacg acgacatggt ctctctcaaa 600 gcaggctggc acaaaatcac aggtcttcag aatttccgcg agggtctttt cgtcaactat 660 cgcgatggaa catatcatct gacatactct atcgacgata cgggctcaga gaactatcgc 720 gttgggtacg ctacggcgga taaccccatt ggaccttgga catatcgtgg tgttcttctg 780 gagaaggacg aatcgaaggg cattcttgct acgggacata actccatcat caacattcct 840 ggaacggatg agtggtatat cgcgtatcat cgcttccata ttcccgatgg aaatgggtat 900 aatagggaga ctacgattga tagggtaccc atcgacaagg atacgggttt gtttggaaag 960 gttacgccga ctttgcagag tgttgatcct aggcctttgt ag 1002 <210> 70 <211> 333 <212> PRT <213> Fusarium verticillioides <400> 70 Met Arg Leu Leu Ser Phe Pro Ser His Leu Leu Val Ala Phe Leu Thr 1 5 10 15 Leu Lys Glu Ala Ser Ser Leu Ala Leu Ser Lys Arg Asp Ser Pro Val 20 25 30 Leu Pro Gly Leu Trp Ala Asp Pro Asn Ile Ala Ile Val Asp Lys Thr 35 40 45 Tyr Tyr Ile Phe Pro Thr Thr Asp Gly Phe Glu Gly Trp Gly Gly Asn 50 55 60 Val Phe Tyr Trp Trp Lys Ser Lys Asp Leu Val Ser Trp Thr Lys Ser 65 70 75 80 Asp Lys Pro Phe Leu Thr Leu Asn Gly Thr Asn Gly Asn Val Pro Trp 85 90 95 Ala Thr Gly Asn Ala Trp Ala Pro Ala Phe Ala Ala Arg Gly Gly Lys 100 105 110 Tyr Tyr Phe Tyr His Ser Gly Asn Asn Pro Ser Val Ser Asp Gly His 115 120 125 Lys Ser Ile Gly Ala Ala Val Ala Asp His Pro Glu Gly Pro Trp Lys 130 135 140 Ala Gln Asp Lys Pro Met Ile Lys Gly Thr Ser Asp Glu Glu Ile Val 145 150 155 160 Ser Asn Gln Ala Ile Asp Pro Ala Ala Phe Glu Asp Pro Glu Thr Gly 165 170 175 Lys Trp Tyr Ile Tyr Trp Gly Asn Gly Val Pro Ile Val Ala Glu Leu 180 185 190 Asn Asp Asp Met Val Ser Leu Lys Ala Gly Trp His Lys Ile Thr Gly 195 200 205 Leu Gln Asn Phe Arg Glu Gly Leu Phe Val Asn Tyr Arg Asp Gly Thr 210 215 220 Tyr His Leu Thr Tyr Ser Ile Asp Asp Thr Gly Ser Glu Asn Tyr Arg 225 230 235 240 Val Gly Tyr Ala Thr Ala Asp Asn Pro Ile Gly Pro Trp Thr Tyr Arg 245 250 255 Gly Val Leu Leu Glu Lys Asp Glu Ser Lys Gly Ile Leu Ala Thr Gly 260 265 270 His Asn Ser Ile Ile Asn Ile Pro Gly Thr Asp Glu Trp Tyr Ile Ala 275 280 285 Tyr His Arg Phe His Ile Pro Asp Gly Asn Gly Tyr Asn Arg Glu Thr 290 295 300 Thr Ile Asp Arg Val Pro Ile Asp Lys Asp Thr Gly Leu Phe Gly Lys 305 310 315 320 Val Thr Pro Thr Leu Gln Ser Val Asp Pro Arg Pro Leu 325 330 <210> 71 <211> 1695 <212> DNA <213> Fusarium verticillioides <400> 71 atgctcttct cgctcgttct tcctaccctt gcctttcaag ccagcctggc gctcggcgat 60 acatccgtta ctgtcgacac cagccagaaa ctccaggtca tcgatggctt tggtgtctca 120 gaagcctacg gccacgccaa acaattccaa aacctcggtc ctggaccaca gaaagagggc 180 ctcgatcttc tcttcaacac tacaaccggc gcaggcttat ccatcatccg aaacaagatc 240 ggctgcgacg cctccaactc catcaccagc accaacaccg acaacccaga taagcaggct 300 gtttaccatt ttgacggcga tgatgatggt caggtatggt ttagcaaaca ggccatgagc 360 tatggtgtag atactatcta cgctaatgct tggtctgcgc ctgtatacat gaagtcagcc 420 cagagtatgg gccgtctctg cggtacacct ggtgtgtcgt gctcctctgg agattggaga 480 catcgttacg ttgagatgat agctgagtac ctctcctact acaagcaggc tggcatccca 540 gtgtcgcacg ttggattcct caatgagggt gacggctcgg actttatgct ctcaactgcc 600 gaacaggctg cagatgtcat tcctcttcta cacagcgctt tgcagtccaa gggccttggc 660 gatatcaaga tgacgtgctg tgataacatc ggttggaagt cacagatgga ctataccgcc 720 aagctggctg agcttgaggt ggagaagtat ctatctgtca tcacatccca cgagtactcc 780 agcagcccca accagcctat gaacactaca ttgccaacct ggatgtccga gggagctgcc 840 aatgaccagg catttgccac agcgtggtac gtcaacggcg gttccaacga aggtttcaca 900 tgggcagtca agatcgcaca aggcatcgtc aatgccgacc tctcagcgta tatctactgg 960 gagggcgttg agaccaacaa caaggggtct ctatctcacg tcatcgacac ggacggtacc 1020 aagtttacca tatcctcgat tctctgggcc attgctcact ggtcgcgcca tattcgccct 1080 ggtgcgcata gactttcgac ttcaggtgtt gtgcaagata cgattgttgg tgcgtttgag 1140 aacgttgatg gcagtgtcgt catggtgctc accaactctg gcactgctgc tcagactgtg 1200 gacctgggtg tttcgggaag tagcttctca acagctcagg ctttcacttc ggatgctgag 1260 gcgcagatgg tcgataccaa ggtgactctg tccgacggtc gtgtcaaggt tacggtcccg 1320 gtgcacggtg tcgtcactgt gaagctcaca acagcaaaaa gctccaaacc ggtctcaact 1380 gctgtttctg cgcaatctgc ccccactcca actagtgtta agcacacctt gactcaccag 1440 aagacttctt caacaacact ctcgaccgcc aaggccccaa cctccactca gactacctct 1500 gtagttgagt cagccaaggc ggtgaaatac cctgtccccc ctgtagcatc caagggatcc 1560 tcgaagagtg ctcccaagaa gggtaccaag aagaccacta cgaagaaggg ctcccaccaa 1620 tcgcacaagg cgcatagtgc tactcatcgt cgatgccgcc atggaagtta ccgtcgtggc 1680 cactgcacca actaa 1695 <210> 72 <211> 537 <212> PRT <213> Fusarium verticillioides <400> 72 Met Leu Phe Ser Leu Val Leu Pro Thr Leu Ala Phe Gln Ala Ser Leu 1 5 10 15 Ala Leu Gly Asp Thr Ser Val Thr Val Asp Thr Ser Gln Lys Leu Gln 20 25 30 Val Ile Asp Gly Phe Gly Val Ser Glu Ala Tyr Gly His Ala Lys Gln 35 40 45 Phe Gln Asn Leu Gly Pro Gly Pro Gln Lys Glu Gly Leu Asp Leu Leu 50 55 60 Phe Asn Thr Thr Thr Gly Ala Gly Leu Ser Ile Ile Arg Asn Lys Ile 65 70 75 80 Gly Cys Asp Ala Ser Asn Ser Ile Thr Ser Thr Asn Thr Asp Asn Pro 85 90 95 Asp Lys Gln Ala Val Tyr His Phe Asp Gly Asp Asp Asp Gly Gln Ser 100 105 110 Ala Gln Ser Met Gly Arg Leu Cys Gly Thr Pro Gly Val Ser Cys Ser 115 120 125 Ser Gly Asp Trp Arg His Arg Tyr Val Glu Met Ile Ala Glu Tyr Leu 130 135 140 Ser Tyr Tyr Lys Gln Ala Gly Ile Pro Val Ser His Val Gly Phe Leu 145 150 155 160 Asn Glu Gly Asp Gly Ser Asp Phe Met Leu Ser Thr Ala Glu Gln Ala 165 170 175 Ala Asp Val Ile Pro Leu Leu His Ser Ala Leu Gln Ser Lys Gly Leu 180 185 190 Gly Asp Ile Lys Met Thr Cys Cys Asp Asn Ile Gly Trp Lys Ser Gln 195 200 205 Met Asp Tyr Thr Ala Lys Leu Ala Glu Leu Glu Val Glu Lys Tyr Leu 210 215 220 Ser Val Ile Thr Ser His Glu Tyr Ser Ser Ser Pro Asn Gln Pro Met 225 230 235 240 Asn Thr Thr Leu Pro Thr Trp Met Ser Glu Gly Ala Ala Asn Asp Gln 245 250 255 Ala Phe Ala Thr Ala Trp Tyr Val Asn Gly Gly Ser Asn Glu Gly Phe 260 265 270 Thr Trp Ala Val Lys Ile Ala Gln Gly Ile Val Asn Ala Asp Leu Ser 275 280 285 Ala Tyr Ile Tyr Trp Glu Gly Val Glu Thr Asn Asn Lys Gly Ser Leu 290 295 300 Ser His Val Ile Asp Thr Asp Gly Thr Lys Phe Thr Ile Ser Ser Ile 305 310 315 320 Leu Trp Ala Ile Ala His Trp Ser Arg His Ile Arg Pro Gly Ala His 325 330 335 Arg Leu Ser Thr Ser Gly Val Val Gln Asp Thr Ile Val Gly Ala Phe 340 345 350 Glu Asn Val Asp Gly Ser Val Val Met Val Leu Thr Asn Ser Gly Thr 355 360 365 Ala Ala Gln Thr Val Asp Leu Gly Val Ser Gly Ser Ser Phe Ser Thr 370 375 380 Ala Gln Ala Phe Thr Ser Asp Ala Glu Ala Gln Met Val Asp Thr Lys 385 390 395 400 Val Thr Leu Ser Asp Gly Arg Val Lys Val Thr Val Pro Val His Gly 405 410 415 Val Val Thr Val Lys Leu Thr Thr Ala Lys Ser Ser Lys Pro Val Ser 420 425 430 Thr Ala Val Ser Ala Gln Ser Ala Pro Thr Pro Thr Ser Val Lys His 435 440 445 Thr Leu Thr His Gln Lys Thr Ser Ser Thr Thr Leu Ser Thr Ala Lys 450 455 460 Ala Pro Thr Ser Thr Gln Thr Thr Ser Val Val Glu Ser Ala Lys Ala 465 470 475 480 Val Lys Tyr Pro Val Pro Pro Val Ala Ser Lys Gly Ser Ser Lys Ser 485 490 495 Ala Pro Lys Lys Gly Thr Lys Lys Thr Thr Thr Lys Lys Gly Ser His 500 505 510 Gln Ser His Lys Ala His Ser Ala Thr His Arg Arg Cys Arg His Gly 515 520 525 Ser Tyr Arg Arg Gly His Cys Thr Asn 530 535 <210> 73 <211> 948 <212> DNA <213> Fusarium verticillioides <400> 73 atgtggaaac tcctcgtcag cggtcttgtc gccgtcgcgt ccctcagcgg cgtgaacgct 60 gcttatccta accctggtcc cgtcaccggc gatactcgtg ttcacgaccc tacggttgtc 120 aagactccca gcggtggata cttgctggct catactggcg ataacgtttc gctcaagact 180 tcttctgatc gaactgcttg gaaggatgca ggtgctgttt tccccaacgg tgcgccttgg 240 actacgcagt acaccaaggg cgacaagaac ctctgggccc ctgatatctc ctaccacaac 300 ggccagtact atctgtacta ctccgcctct tccttcggtc agcgtacctc tgccattttt 360 ctcgctacca gcaagaccgg tgcatccggc tcgtggacca accaaggcgt cgtcgtcgag 420 tccaacaaca acaacgacta caatgccatt gacggaaatc tctttgtcga ctctgatgga 480 aaatggtggc tctccttcgg ctctttctgg tccggcatca agctcatcca actcgacccc 540 aagaccggca agcgcaccgg ctcaagcatg tactccctcg ccaaacgcga cgcctccgtc 600 gaaggcgccg tcgaggctcc gttcatcacc aaacgcggaa gcacctacta cctctgggtg 660 tcgttcgaca agtgttgcca gggcgctgct agcacgtacc gtgtcatggt tggacggtcg 720 agcagcatta ctggtcctta tgttgacaag gctggtaagc agatgatgtc tggtggagga 780 acggagatta tggctagtca cggatctatt catggaccgg gacataatgc tgttttcact 840 gataacgatg cggacgttct tgtctatcat tactacgata acgctggcac agcgctgttg 900 ggcatcaact tgctcagata tgacaatggc tggcctgttg cttattag 948 <210> 74 <211> 315 <212> PRT <213> Fusarium verticillioides <400> 74 Met Trp Lys Leu Leu Val Ser Gly Leu Val Ala Val Ala Ser Leu Ser 1 5 10 15 Gly Val Asn Ala Ala Tyr Pro Asn Pro Gly Pro Val Thr Gly Asp Thr 20 25 30 Arg Val His Asp Pro Thr Val Val Lys Thr Pro Ser Gly Gly Tyr Leu 35 40 45 Leu Ala His Thr Gly Asp Asn Val Ser Leu Lys Thr Ser Ser Asp Arg 50 55 60 Thr Ala Trp Lys Asp Ala Gly Ala Val Phe Pro Asn Gly Ala Pro Trp 65 70 75 80 Thr Thr Gln Tyr Thr Lys Gly Asp Lys Asn Leu Trp Ala Pro Asp Ile 85 90 95 Ser Tyr His Asn Gly Gln Tyr Tyr Leu Tyr Tyr Ser Ala Ser Ser Phe 100 105 110 Gly Gln Arg Thr Ser Ala Ile Phe Leu Ala Thr Ser Lys Thr Gly Ala 115 120 125 Ser Gly Ser Trp Thr Asn Gln Gly Val Val Val Glu Ser Asn Asn Asn 130 135 140 Asn Asp Tyr Asn Ala Ile Asp Gly Asn Leu Phe Val Asp Ser Asp Gly 145 150 155 160 Lys Trp Trp Leu Ser Phe Gly Ser Phe Trp Ser Gly Ile Lys Leu Ile 165 170 175 Gln Leu Asp Pro Lys Thr Gly Lys Arg Thr Gly Ser Ser Met Tyr Ser 180 185 190 Leu Ala Lys Arg Asp Ala Ser Val Glu Gly Ala Val Glu Ala Pro Phe 195 200 205 Ile Thr Lys Arg Gly Ser Thr Tyr Tyr Leu Trp Val Ser Phe Asp Lys 210 215 220 Cys Cys Gln Gly Ala Ala Ser Thr Tyr Arg Val Met Val Gly Arg Ser 225 230 235 240 Ser Ser Ile Thr Gly Pro Tyr Val Asp Lys Ala Gly Lys Gln Met Met 245 250 255 Ser Gly Gly Gly Thr Glu Ile Met Ala Ser His Gly Ser Ile His Gly 260 265 270 Pro Gly His Asn Ala Val Phe Thr Asp Asn Asp Ala Asp Val Leu Val 275 280 285 Tyr His Tyr Tyr Asp Asn Ala Gly Thr Ala Leu Leu Gly Ile Asn Leu 290 295 300 Leu Arg Tyr Asp Asn Gly Trp Pro Val Ala Tyr 305 310 315 <210> 75 <211> 1352 <212> DNA <213> Trichoderma reesei <400> 75 atgaaagcaa acgtcatctt gtgcctcctg gcccccctgg tcgccgctct ccccaccgaa 60 accatccacc tcgaccccga gctcgccgct ctccgcgcca acctcaccga gcgaacagcc 120 gacctctggg accgccaagc ctctcaaagc atcgaccagc tcatcaagag aaaaggcaag 180 ctctactttg gcaccgccac cgaccgcggc ctcctccaac gggaaaagaa cgcggccatc 240 atccaggcag acctcggcca ggtgacgccg gagaacagca tgaagtggca gtcgctcgag 300 aacaaccaag gccagctgaa ctggggagac gccgactatc tcgtcaactt tgcccagcaa 360 aacggcaagt cgatacgcgg ccacactctg atctggcact cgcagctgcc tgcgtgggtg 420 aacaatatca acaacgcgga tactctgcgg caagtcatcc gcacccatgt ctctactgtg 480 gttgggcggt acaagggcaa gattcgtgct tgggtgagtt ttgaacacca catgcccctt 540 ttcttagtcc gctcctcctc ctcttggaac ttctcacagt tatagccgta tacaacattc 600 gacaggaaat ttaggatgac aactactgac tgacttgtgt gtgtgatggc gataggacgt 660 ggtcaatgaa atcttcaacg aggatggaac gctgcgctct tcagtctttt ccaggctcct 720 cggcgaggag tttgtctcga ttgcctttcg tgctgctcga gatgctgacc cttctgcccg 780 tctttacatc aacgactaca atctcgaccg cgccaactat ggcaaggtca acgggttgaa 840 gacttacgtc tccaagtgga tctctcaagg agttcccatt gacggtattg gtgagccacg 900 acccctaaat gtcccccatt agagtctctt tctagagcca aggcttgaag ccattcaggg 960 actgacacga gagccttctc tacaggaagc cagtcccatc tcagcggcgg cggaggctct 1020 ggtacgctgg gtgcgctcca gcagctggca acggtacccg tcaccgagct ggccattacc 1080 gagctggaca ttcagggggc accgacgacg gattacaccc aagttgttca agcatgcctg 1140 agcgtctcca agtgcgtcgg catcaccgtg tggggcatca gtgacaaggt aagttgcttc 1200 ccctgtctgt gcttatcaac tgtaagcagc aacaactgat gctgtctgtc tttacctagg 1260 actcgtggcg tgccagcacc aaccctcttc tgtttgacgc aaacttcaac cccaagccgg 1320 catataacag cattgttggc atcttacaat ag 1352 <210> 76 <211> 347 <212> PRT <213> Trichoderma reesei <400> 76 Met Lys Ala Asn Val Ile Leu Cys Leu Leu Ala Pro Leu Val Ala Ala 1 5 10 15 Leu Pro Thr Glu Thr Ile His Leu Asp Pro Glu Leu Ala Ala Leu Arg 20 25 30 Ala Asn Leu Thr Glu Arg Thr Ala Asp Leu Trp Asp Arg Gln Ala Ser 35 40 45 Gln Ser Ile Asp Gln Leu Ile Lys Arg Lys Gly Lys Leu Tyr Phe Gly 50 55 60 Thr Ala Thr Asp Arg Gly Leu Leu Gln Arg Glu Lys Asn Ala Ala Ile 65 70 75 80 Ile Gln Ala Asp Leu Gly Gln Val Thr Pro Glu Asn Ser Met Lys Trp 85 90 95 Gln Ser Leu Glu Asn Asn Gln Gly Gln Leu Asn Trp Gly Asp Ala Asp 100 105 110 Tyr Leu Val Asn Phe Ala Gln Gln Asn Gly Lys Ser Ile Arg Gly His 115 120 125 Thr Leu Ile Trp His Ser Gln Leu Pro Ala Trp Val Asn Asn Ile Asn 130 135 140 Asn Ala Asp Thr Leu Arg Gln Val Ile Arg Thr His Val Ser Thr Val 145 150 155 160 Val Gly Arg Tyr Lys Gly Lys Ile Arg Ala Trp Asp Val Val Asn Glu 165 170 175 Ile Phe Asn Glu Asp Gly Thr Leu Arg Ser Ser Val Phe Ser Arg Leu 180 185 190 Leu Gly Glu Glu Phe Val Ser Ile Ala Phe Arg Ala Ala Arg Asp Ala 195 200 205 Asp Pro Ser Ala Arg Leu Tyr Ile Asn Asp Tyr Asn Leu Asp Arg Ala 210 215 220 Asn Tyr Gly Lys Val Asn Gly Leu Lys Thr Tyr Val Ser Lys Trp Ile 225 230 235 240 Ser Gln Gly Val Pro Ile Asp Gly Ile Gly Ser Gln Ser His Leu Ser 245 250 255 Gly Gly Gly Gly Ser Gly Thr Leu Gly Ala Leu Gln Gln Leu Ala Thr 260 265 270 Val Pro Val Thr Glu Leu Ala Ile Thr Glu Leu Asp Ile Gln Gly Ala 275 280 285 Pro Thr Thr Asp Tyr Thr Gln Val Val Gln Ala Cys Leu Ser Val Ser 290 295 300 Lys Cys Val Gly Ile Thr Val Trp Gly Ile Ser Asp Lys Asp Ser Trp 305 310 315 320 Arg Ala Ser Thr Asn Pro Leu Leu Phe Asp Ala Asn Phe Asn Pro Lys 325 330 335 Pro Ala Tyr Asn Ser Ile Val Gly Ile Leu Gln 340 345 <210> 77 <211> 222 <212> PRT <213> Trichoderma reesei <400> 77 Met Val Ser Phe Thr Ser Leu Leu Ala Ala Ser Pro Pro Ser Arg Ala 1 5 10 15 Ser Cys Arg Pro Ala Ala Glu Val Glu Ser Val Ala Val Glu Lys Arg 20 25 30 Gln Thr Ile Gln Pro Gly Thr Gly Tyr Asn Asn Gly Tyr Phe Tyr Ser 35 40 45 Tyr Trp Asn Asp Gly His Gly Gly Val Thr Tyr Thr Asn Gly Pro Gly 50 55 60 Gly Gln Phe Ser Val Asn Trp Ser Asn Ser Gly Asn Phe Val Gly Gly 65 70 75 80 Lys Gly Trp Gln Pro Gly Thr Lys Asn Lys Val Ile Asn Phe Ser Gly 85 90 95 Ser Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Ser Val Tyr Gly Trp Ser 100 105 110 Arg Asn Pro Leu Ile Glu Tyr Tyr Ile Val Glu Asn Phe Gly Thr Tyr 115 120 125 Asn Pro Ser Thr Gly Ala Thr Lys Leu Gly Glu Val Thr Ser Asp Gly 130 135 140 Ser Val Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile 145 150 155 160 Ile Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Arg Asn His 165 170 175 Arg Ser Ser Gly Ser Val Asn Thr Ala Asn His Phe Asn Ala Trp Ala 180 185 190 Gln Gln Gly Leu Thr Leu Gly Thr Met Asp Tyr Gln Ile Val Ala Val 195 200 205 Glu Gly Tyr Phe Ser Ser Gly Ser Ala Ser Ile Thr Val Ser 210 215 220 <210> 78 <211> 797 <212> PRT <213> Trichoderma reesei <400> 78 Met Val Asn Asn Ala Ala Leu Leu Ala Ala Leu Ser Ala Leu Leu Pro 1 5 10 15 Thr Ala Leu Ala Gln Asn Asn Gln Thr Tyr Ala Asn Tyr Ser Ala Gln 20 25 30 Gly Gln Pro Asp Leu Tyr Pro Glu Thr Leu Ala Thr Leu Thr Leu Ser 35 40 45 Phe Pro Asp Cys Glu His Gly Pro Leu Lys Asn Asn Leu Val Cys Asp 50 55 60 Ser Ser Ala Gly Tyr Val Glu Arg Ala Gln Ala Leu Ile Ser Leu Phe 65 70 75 80 Thr Leu Glu Glu Leu Ile Leu Asn Thr Gln Asn Ser Gly Pro Gly Val 85 90 95 Pro Arg Leu Gly Leu Pro Asn Tyr Gln Val Trp Asn Glu Ala Leu His 100 105 110 Gly Leu Asp Arg Ala Asn Phe Ala Thr Lys Gly Gly Gln Phe Glu Trp 115 120 125 Ala Thr Ser Phe Pro Met Pro Ile Leu Thr Thr Ala Ala Leu Asn Arg 130 135 140 Thr Leu Ile His Gln Ile Ala Asp Ile Ile Ser Thr Gln Ala Arg Ala 145 150 155 160 Phe Ser Asn Ser Gly Arg Tyr Gly Leu Asp Val Tyr Ala Pro Asn Val 165 170 175 Asn Gly Phe Arg Ser Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly 180 185 190 Glu Asp Ala Phe Phe Leu Ser Ser Ala Tyr Thr Tyr Glu Tyr Ile Thr 195 200 205 Gly Ile Gln Gly Gly Val Asp Pro Glu His Leu Lys Val Ala Ala Thr 210 215 220 Val Lys His Phe Ala Gly Tyr Asp Leu Glu Asn Trp Asn Asn Gln Ser 225 230 235 240 Arg Leu Gly Phe Asp Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr 245 250 255 Tyr Thr Pro Gln Phe Leu Ala Ala Ala Arg Tyr Ala Lys Ser Arg Ser 260 265 270 Leu Met Cys Ala Tyr Asn Ser Val Asn Gly Val Pro Ser Cys Ala Asn 275 280 285 Ser Phe Phe Leu Gln Thr Leu Leu Arg Glu Ser Trp Gly Phe Pro Glu 290 295 300 Trp Gly Tyr Val Ser Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn 305 310 315 320 Pro His Asp Tyr Ala Ser Asn Gln Ser Ser Ala Ala Ala Ser Ser Leu 325 330 335 Arg Ala Gly Thr Asp Ile Asp Cys Gly Gln Thr Tyr Pro Trp His Leu 340 345 350 Asn Glu Ser Phe Val Ala Gly Glu Val Ser Arg Gly Glu Ile Glu Arg 355 360 365 Ser Val Thr Arg Leu Tyr Ala Asn Leu Val Arg Leu Gly Tyr Phe Asp 370 375 380 Lys Lys Asn Gln Tyr Arg Ser Leu Gly Trp Lys Asp Val Val Lys Thr 385 390 395 400 Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Val Leu 405 410 415 Leu Lys Asn Asp Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile 420 425 430 Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Met Gln Gly Asn 435 440 445 Tyr Tyr Gly Pro Ala Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys 450 455 460 Lys Ala Gly Tyr His Val Asn Phe Glu Leu Gly Thr Glu Ile Ala Gly 465 470 475 480 Asn Ser Thr Thr Gly Phe Ala Lys Ala Ile Ala Ala Ala Lys Lys Ser 485 490 495 Asp Ala Ile Ile Tyr Leu Gly Gly Ile Asp Asn Thr Ile Glu Gln Glu 500 505 510 Gly Ala Asp Arg Thr Asp Ile Ala Trp Pro Gly Asn Gln Leu Asp Leu 515 520 525 Ile Lys Gln Leu Ser Glu Val Gly Lys Pro Leu Val Val Leu Gln Met 530 535 540 Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ser Asn Lys Lys Val 545 550 555 560 Asn Ser Leu Val Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Val Ala 565 570 575 Leu Phe Asp Ile Leu Ser Gly Lys Arg Ala Pro Ala Gly Arg Leu Val 580 585 590 Thr Thr Gln Tyr Pro Ala Glu Tyr Val His Gln Phe Pro Gln Asn Asp 595 600 605 Met Asn Leu Arg Pro Asp Gly Lys Ser Asn Pro Gly Gln Thr Tyr Ile 610 615 620 Trp Tyr Thr Gly Lys Pro Val Tyr Glu Phe Gly Ser Gly Leu Phe Tyr 625 630 635 640 Thr Thr Phe Lys Glu Thr Leu Ala Ser His Pro Lys Ser Leu Lys Phe 645 650 655 Asn Thr Ser Ser Ile Leu Ser Ala Pro His Pro Gly Tyr Thr Tyr Ser 660 665 670 Glu Gln Ile Pro Val Phe Thr Phe Glu Ala Asn Ile Lys Asn Ser Gly 675 680 685 Lys Thr Glu Ser Pro Tyr Thr Ala Met Leu Phe Val Arg Thr Ser Asn 690 695 700 Ala Gly Pro Ala Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg 705 710 715 720 Leu Ala Asp Ile Lys Pro Gly His Ser Ser Lys Leu Ser Ile Pro Ile 725 730 735 Pro Val Ser Ala Leu Ala Arg Val Asp Ser His Gly Asn Arg Ile Val 740 745 750 Tyr Pro Gly Lys Tyr Glu Leu Ala Leu Asn Thr Asp Glu Ser Val Lys 755 760 765 Leu Glu Phe Glu Leu Val Gly Glu Glu Val Thr Ile Glu Asn Trp Pro 770 775 780 Leu Glu Glu Gln Gln Ile Lys Asp Ala Thr Pro Asp Ala 785 790 795 <210> 79 <211> 744 <212> PRT <213> Trichoderma reesei <400> 79 Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe 1 5 10 15 Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val 20 25 30 Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys 35 40 45 Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser 50 55 60 Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala 65 70 75 80 Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly 85 90 95 Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala 100 105 110 Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile 115 120 125 Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val 130 135 140 Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile 165 170 175 Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile 180 185 190 Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp 195 200 205 Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val 210 215 220 Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr 225 230 235 240 Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp 245 250 255 Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His 260 265 270 Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly 275 280 285 Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn 290 295 300 Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val 305 310 315 320 Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly 325 330 335 Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr 340 345 350 Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp 355 360 365 Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly 370 375 380 Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn 385 390 395 400 Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly 405 410 415 Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr 420 425 430 Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn 435 440 445 Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val 450 455 460 Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn 465 470 475 480 Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu 485 490 495 Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His 500 505 510 Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val 515 520 525 Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala 530 535 540 Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val 545 550 555 560 Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser 565 570 575 Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His 580 585 590 Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu 595 600 605 Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala 610 615 620 Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp 625 630 635 640 Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly 645 650 655 Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser 660 665 670 Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu 675 680 685 Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg 690 695 700 Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro 705 710 715 720 Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg 725 730 735 Leu Thr Ser Thr Leu Ser Val Ala 740 <210> 80 <211> 2031 <212> DNA <213> Podospora anserina <400> 80 atgatccacc tcaagccagc cctcgcggcg ttgttggcgc tgtcgacgca atgtgtggct 60 attgatttgt ttgtcaagtc ttcggggggg aataagacga ctgatatcat gtatggtctt 120 atgcacgagg atatcaacaa ctccggcgac ggcggcatct acgccgagct aatctccaac 180 cgcgcgttcc aagggagtga gaagttcccc tccaacctcg acaactggag ccccgtcggt 240 ggcgctaccc ttacccttca gaagcttgcc aagccccttt cctctgcgtt gccttactcc 300 gtcaatgttg ccaaccccaa ggagggcaag ggcaagggca aggacaccaa ggggaagaag 360 gttggcttgg ccaatgctgg gttttggggt atggatgtca agaggcagaa gtacactggt 420 agcttccacg ttactggtga gtacaagggt gactttgagg ttagcttgcg cagcgcgatt 480 accggggaga cctttggcaa gaaggtggtg aagggtggga gtaagaaggg gaagtggacc 540 gagaaggagt ttgagttggt gcctttcaag gatgcgccca acagcaacaa cacctttgtt 600 gtgcagtggg atgccgaggg cgcaaaggac ggatctttgg atctcaactt gatcagcttg 660 ttccctccga cattcaaggg aaggaagaat gggctgagaa ttgatcttgc gcagacgatg 720 gttgagctca agccgacctt cttgcgcttc cccggtggca acatgctcga gggtaacacc 780 ttggacactt ggtggaagtg gtacgagacc attggccctc tgaaggatcg cccgggcatg 840 gctggtgtct gggagtacca gcaaaccctt ggcttgggtc tggtcgagta catggagtgg 900 gccgatgaca tgaacttgga gcccattgtc ggtgtcttcg ctggtcttgc cctcgatggc 960 tcgttcgttc ccgaatccga gatgggatgg gtcatccaac aggctctcga cgaaatcgag 1020 ttcctcactg gcgatgctaa gaccaccaaa tggggtgccg tccgcgcgaa gcttggtcac 1080 cccaagcctt ggaaggtcaa gtgggttgag atcggtaacg aggattggct tgccggacgc 1140 cctgctggct tcgagtcgta catcaactac cgcttcccca tgatgatgaa ggccttcaac 1200 gaaaagtacc ccgacatcaa gatcatcgcc tcgccctcca tcttcgacaa catgacaatc 1260 cccgcgggtg ctgccggtga tcaccacccg tacctgactc ccgatgagtt cgttgagcga 1320 ttcgccaagt tcgataactt gagcaaggat aacgtgacgc tcatcggcga ggctgcgtcg 1380 acgcatccta acggtggtat cgcttgggag ggagatctca tgcccttgcc ttggtggggc 1440 ggcagtgttg ctgaggctat cttcttgatc agcactgaga gaaacggtga caagatcatc 1500 ggtgctactt acgcgcctgg tcttcgcagc ttggaccgct ggcaatggag catgacctgg 1560 gtgcagcatg ccgccgaccc ggccctcacc actcgctcga ccagttggta tgtctggaga 1620 atcctcgccc accacatcat ccgtgagacg ctcccggtcg atgccccggc cggcaagccc 1680 aactttgacc ctctgttcta cgttgccgga aagagcgaga gtggcaccgg tatcttcaag 1740 gctgccgtct acaactcgac tgaatcgatc ccggtgtcgt tgaagtttga tggtctcaac 1800 gagggagcgg ttgccaactt gacggtgctt actgggccgg aggatccgta tggatacaac 1860 gaccccttca ctggtatcaa tgttgtcaag gagaagacca ccttcatcaa ggccggaaag 1920 ggcggcaagt tcaccttcac cctgccgggc ttgagtgttg ctgtgttgga gacggccgac 1980 gcggtcaagg gtggcaaggg aaagggcaag ggcaagggaa agggtaactg a 2031 <210> 81 <211> 2031 <212> DNA <213> Artificial Sequence <220> <223> synthetic codon optimized cDNA <400> 81 atgatccacc tcaagcccgc cctcgccgcc ctcctcgccc tcagcaccca atgcgtcgcc 60 atcgacctct tcgtcaagag cagcggcggc aacaagacca ccgacatcat gtacggcctc 120 atgcacgagg acatcaacaa cagcggcgac ggcggcatct acgccgagct gatcagcaac 180 cgcgccttcc agggcagcga gaagttcccc agcaacctcg acaactggtc ccccgtcggc 240 ggcgccaccc tcaccctcca gaagctcgcc aagcccctgt cctctgccct cccctactcc 300 gtcaacgtcg ccaaccccaa ggagggtaag ggtaagggca aggacaccaa gggcaagaag 360 gtcggcctcg ccaacgccgg cttttggggc atggacgtca agcgccagaa atacaccggc 420 agcttccacg tcaccggcga gtacaagggc gacttcgagg tcagcctccg cagcgccatt 480 accggcgaga ccttcggcaa gaaggtcgtc aagggcggca gcaagaaggg caagtggacc 540 gagaaggagt tcgagctggt ccccttcaag gacgccccca acagcaacaa caccttcgtc 600 gtccagtggg acgccgaggg cgccaaggac ggcagcctcg acctcaacct catcagcctc 660 ttcccgccca ccttcaaggg ccgcaagaac ggcctccgca tcgacctcgc ccagaccatg 720 gtcgagctga agcccacctt cctccgcttt cccggcggca acatgctcga gggcaacacc 780 ctcgacacct ggtggaagtg gtacgagacc atcggccccc tgaaggaccg ccctggcatg 840 gccggcgtct gggagtacca gcagacgctg ggcctcggcc tggtcgagta catggagtgg 900 gccgacgaca tgaacctcga gcccatcgtc ggcgtctttg ctggcctggc cctggatggc 960 agctttgtcc ccgagagcga gatgggctgg gtcatccagc aggctctcga tgagatcgag 1020 ttcctcaccg gcgacgccaa gaccaccaag tggggcgccg tccgcgccaa gctcggccac 1080 cctaagccct ggaaggtcaa atgggtcgag atcggcaacg aggactggct cgccggccga 1140 cctgccggct tcgagagcta catcaactac cgcttcccca tgatgatgaa ggccttcaac 1200 gagaaatacc ccgacatcaa gatcattgcc agcccctcca tcttcgacaa catgaccatt 1260 ccagccggtg ctgccggtga ccaccacccc tacctcaccc ccgacgaatt tgtcgagcgc 1320 ttcgccaagt tcgacaacct cagcaaggac aacgtcaccc tcattggcga ggccgccagc 1380 acccacccca acggcggcat tgcctgggag ggcgacctca tgcccctgcc ctggtggggc 1440 ggcagcgtcg ccgaggccat cttcctcatc agcaccgagc gcaacggcga caagatcatc 1500 ggcgccacct acgcccctgg cctccgatct ctcgaccgct ggcagtggag catgacctgg 1560 gtccagcacg ccgccgaccc tgccctcacc acccgcagca ccagctggta cgtctggcgc 1620 atcctcgccc accacatcat tcgcgagacc ctccccgtcg acgcccccgc cggcaagccc 1680 aacttcgacc ccctcttcta cgtcgctggc aagtcggaga gcggcaccgg catcttcaag 1740 gccgccgtct acaacagcac cgagagcatc cccgtcagcc tcaagttcga cggcctcaac 1800 gagggcgccg tcgccaacct caccgtcctc accggccccg aggaccccta cggctacaac 1860 gaccccttca ccggcatcaa cgtcgtcaag gaaaagacca ccttcatcaa ggccggcaag 1920 ggcggcaagt tcacctttac cctccccggc ctctctgtcg ccgtcctcga gaccgccgac 1980 gccgtgaagg gtggcaaggg aaagggaaag ggcaagggta agggtaacta a 2031 <210> 82 <211> 1020 <212> DNA <213> Gibberella zeae <400> 82 atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc taccaacgac 60 gactgtcctc tcatcactag tagatggact gcggatcctt cggctcatgt ctttaacgac 120 accttgtggc tctacccgtc tcatgacatc gatgctggat ttgagaatga tcctgatgga 180 ggccagtacg ccatgagaga ttaccatgtc tactctatcg acaagatcta cggttccctg 240 ccggtcgatc acggtacggc cctgtcagtg gaggatgtcc cctgggcctc tcgacagatg 300 tgggctcctg acgctgccca caagaacggc aaatactacc tatacttccc tgccaaagac 360 aaggatgata tcttcagaat cggcgttgct gtctcaccaa cccccggcgg accattcgtc 420 cccgacaaga gttggatccc tcacactttc agcatcgacc ccgccagttt cgtcgatgat 480 gatgacagag cctacttggc atggggtggt atcatgggtg gccagcttca acgatggcag 540 gataagaaca agtacaacga atctggcact gagccaggaa acggcaccgc tgccttgagc 600 cctcagattg ccaagctgag caaggacatg cacactctgg cagagaagcc tcgcgacatg 660 ctcattcttg accccaagac tggcaagccg ctcctttctg aggatgaaga ccgacgcttc 720 ttcgaaggac cctggattca caagcgcaac aagatttact acctcaccta ctctactggc 780 acaacccact atcttgtcta tgcgacttca aagaccccct atggtcctta cacctaccag 840 ggcagaattc tggagccagt tgatggctgg actactcact ctagtatcgt caagtaccag 900 ggtcagtggt ggctatttta tcacgatgcc aagacatctg gcaaggacta tcttcgccag 960 gtaaaggcta agaagatttg gtacgatagc aaaggaaaga tcttgacaaa gaagccttga 1020 <210> 83 <211> 1038 <212> DNA <213> Fusarium oxysporum <400> 83 atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcaagacact 60 aatgacattc ctcccctgat caccgacctc tggtccgcag atccctcggc tcatgttttc 120 gaaggcaagc tctgggttta cccatctcac gacatcgaag ccaatgttgt caacggcaca 180 ggaggcgctc aatacgccat gagggattac catacctact ccatgaagag catctatggt 240 aaagatcccg ttgtcgacca cggcgtcgct ctctcagtcg atgacgttcc ctgggcgaag 300 cagcaaatgt gggctcctga cgcagctcat aagaacggca aatattatct gtacttcccc 360 gccaaggaca aggatgagat cttcagaatt ggagttgctg tctccaacaa gcccagcggt 420 cctttcaagg ccgacaagag ctggatccct ggcacgtaca gtatcgatcc tgctagctac 480 gtcgacactg ataacgaggc ctacctcatc tggggcggta tctggggcgg ccagctccaa 540 gcctggcagg ataaaaagaa ctttaacgag tcgtggattg gagacaaggc tgctcctaac 600 ggcaccaatg ccctatctcc tcagatcgcc aagctaagca aggacatgca caagatcacc 660 gaaacacccc gcgatctcgt cattctcgcc cccgagacag gcaagcctct tcaggctgag 720 gacaacaagc gacgattctt cgagggccct tggatccaca agcgcggcaa gctttactac 780 ctcatgtact ccaccggtga tacccacttc cttgtctacg ctacttccaa gaacatctac 840 ggtccttata cctaccgggg caagattctt gatcctgttg atgggtggac tactcatgga 900 agtattgttg agtataaggg acagtggtgg cttttctttg ctgatgcgca tacgtctggt 960 aaggattacc ttcgacaggt gaaggcgagg aagatctggt atgacaagaa cggcaagatc 1020 ttgcttcacc gtccttag 1038 <210> 84 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> synthetic motif for GH61 endoglucanase family <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa can be Ile, Leu, Met, or Val <220> <221> misc_feature <222> (3)..(6) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (8)..(8) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (10)..(10) <223> Xaa can be Ile, Leu, Met, or Val <220> <221> misc_feature <222> (11)..(11) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (13)..(13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (14)..(14) <223> Xaa can be Glu or Gln <220> <221> misc_feature <222> (15)..(18) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (19)..(19) <223> Xaa can be His, Asn, or Gln <400> 84 Xaa Pro Xaa Xaa Xaa Xaa Gly Xaa Tyr Xaa Xaa Arg Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa <210> 85 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic motif for GH61 endoglucanase family <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa can be Ile, Leu, Met, or Val <220> <221> misc_feature <222> (3)..(7) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (9)..(9) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (11)..(11) <223> Xaa can be Ile, Leu, Met, or Val <220> <221> misc_feature <222> (12)..(12) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (14)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (15)..(15) <223> Xaa can be Glu or Gln <220> <221> misc_feature <222> (16)..(19) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (20)..(20) <223> Xaa can be His, Asn or Gln <400> 85 Xaa Pro Xaa Xaa Xaa Xaa Xaa Gly Xaa Tyr Xaa Xaa Arg Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa 20 <210> 86 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> synthetic motif for GH61 endoglucanase family <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa can be Ile, Leu, Met or Val <220> <221> misc_feature <222> (3)..(6) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (8)..(8) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (10)..(10) <223> Xaa can be Ile, Leu, Met or Val <220> <221> misc_feature <222> (11)..(11) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (13)..(13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (14)..(14) <223> Xaa can be Glu or Gln <220> <221> misc_feature <222> (15)..(17) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (19)..(19) <223> Xaa can be His, Asn or Gln <400> 86 Xaa Pro Xaa Xaa Xaa Xaa Gly Xaa Tyr Xaa Xaa Arg Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Ala Xaa <210> 87 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic motif for GH61 endoglucanase family <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa can be Ile, Leu, Met or Val <220> <221> misc_feature <222> (3)..(7) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (9)..(9) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (11)..(11) <223> Xaa can be Ile, Leu, Met or Val <220> <221> misc_feature <222> (12)..(12) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (14)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (15)..(15) <223> Xaa can be Glu or Gln <220> <221> misc_feature <222> (16)..(18) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (20)..(20) <223> Xaa can be His, Asn or Gln <400> 87 Xaa Pro Xaa Xaa Xaa Xaa Xaa Gly Xaa Tyr Xaa Xaa Arg Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Ala Xaa 20 <210> 88 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> synthetic motif for GH61 endoglucanase family <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa can be Phe or Trp <220> <221> MISC_FEATURE <222> (2)..(2) <223> Xaa can be Thr or Phe <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa can be Ala, Ile or Val <400> 88 Xaa Xaa Lys Xaa 1 <210> 89 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> synthetic motif for GH61 endoglucanase family <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(8) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (9)..(9) <223> Xaa can be Tyr or Trp <220> <221> MISC_FEATURE <222> (10)..(10) <223> Xaa can be Ala, Ile, Leu, Met or Val <400> 89 His Xaa Xaa Gly Pro Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 90 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic motif for GH61 endoglucanase family <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(7) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa can be Tyr or Trp <220> <221> MISC_FEATURE <222> (9)..(9) <223> Xaa can be Ala, Ile, Leu, Met or Val <400> 90 His Xaa Gly Pro Xaa Xaa Xaa Xaa Xaa 1 5 <210> 91 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> synthetic motif for GH61 endoglucanase family <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa can be Glu or Gln <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (4)..(5) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (7)..(7) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa can be Glu, His, Gln or Asn <220> <221> MISC_FEATURE <222> (9)..(9) <223> Xaa can be Phe, Ile, Leu or Val <220> <221> misc_feature <222> (10)..(10) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (11)..(11) <223> Xaa can be Ile, Leu or Val <400> 91 Xaa Xaa Tyr Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 92 <211> 1920 <212> DNA <213> Penicillium funiculosum <400> 92 atgtaccgga agctcgccgt gatcagcgcc ttcctggcga ctgctcgcgc catcaccatc 60 aacgtcagcc agagcggcgg caacaagacc agcccgctcc agtacggcct catgttcgag 120 gacatcaacc acggcggcga cggcggcctc tacgccgagc tggtccggaa ccgggccttc 180 cagggcagca ccgtctaccc ggccaacctc gacggctacg actcggtgaa cggcgcgatt 240 ctcgcgctcc agaacctcac caacccgctc agcccgagca tgccctcgtc gctgaacgtc 300 gccaagggct cgaacaacgg cagcatcggc ttcgccaacg aggggtggtg gggcatcgag 360 gtcaagccgc agcggtacgc cggcagcttc tacgtccagg gcgactacca gggcgacttc 420 gacatcagcc tccagagcaa gctcacccag gaggtcttcg cgacggcgaa ggtccggtcg 480 agcggcaagc acgaggactg ggtccagtac aagtacgagc tggtcccgaa gaaggccgcc 540 agcaacacca acaacaccct caccatcacc ttcgacagca agggcctcaa ggacggcagc 600 ctcaacttca acctcatcag cctcttcccg ccgacctaca acaaccggcc gaacggcctc 660 cggatcgacc tcgtcgaggc catggcggag ctggagggca agttcctccg cttccccggc 720 ggctcggacg tggagggcgt ccaggccccg tactggtaca agtggaacga gaccgtcggc 780 gacctcaagg accgctactc gcgcccgagc gcctggacct acgaggagag caacggcatc 840 ggcctcatcg agtacatgaa ctggtgcgac gacatgggcc tcgagccgat cctcgccgtc 900 tgggacggcc actacctcag caacgaggtc atcagcgaga acgacctcca gccgtacatc 960 gacgacaccc tcaaccagct cgagttcctc atgggcgccc cggacactcc ctacgggtct 1020 tggagggcta gcctcggcta cccgaagccg tggaccatca actacgtcga gatcggcaac 1080 gaggacaacc tctacggcgg cctcgagacc tacatcgcct accggttcca ggcctactac 1140 gacgccatca ccgccaagta cccgcacatg accgtcatgg agagcctcac cgagatgccc 1200 ggccccgctg ccgcggcgtc ggactaccac cagtactcga cgcccgacgg cttcgtcagc 1260 cagttcaact acttcgacca gatgccggtc accaaccgca cgctgaacgg cgagatcgcc 1320 accgtctacc ccaacaaccc gagcaactcg gtggcgtggg gcagcccgtt cccgctctac 1380 ccgtggtgga tcgggtccgt ggctgaggcc gtcttcctca tcggcgagga gcggaacagc 1440 ccgaagatca tcggcgccag ctacgccccc atgttccgca acattaacaa ctggcagtgg 1500 agcccgaccc tgatcgcctt cgacgccgac agcagccgga cgtcgcgctc tacttcctgg 1560 cacgtcatca agctcctcag caccaacaag atcacccaga acctgcccac gacgtggtct 1620 gggggggaca tcggcccgct ctactgggtc gccggccgga acgacaacac cggcagcaac 1680 atcttcaagg ccgccgtcta caacagcacc agcgacgtcc cggtcaccgt ccagttcgcc 1740 ggctgcaacg ccaagagcgc caacctcacc atcctctcgt cggacgaccc caacgccagc 1800 aactacccgg gcggccccga ggtcgtcaag accgagatcc agagcgtcac cgccaacgcc 1860 cacggcgcct tcgagttcag cctcccgaac ctgtcggtgg ctgtgctgaa gacggagtag 1920 <210> 93 <211> 2260 <212> DNA <213> Podospora anserina <400> 93 atggctcttc aaaccttctt cctgctggcg gcagccatgc tggccaacgc agagacaaca 60 ggcgaaaagg tctctcggca agcaccgtct ggcgctcaag catgggccgc cgcccactcc 120 caggctgccg ccactctggc cagaatgtca cagcaagaca agatcaacat ggtcacgggc 180 attggctggg acagagggcc ttgcgtggga aacacagctg ccatcagctc catcaactat 240 cctcaaatct gtcttcagga tggaccattg ggcattcgct tcggcactgg taccaccgcc 300 ttcacacctg gcgtccaagc tgcttcgaca tgggacgttg atctgatccg gcagcgcggt 360 gcttacctgg gcgccgaagc caagggctgc ggcattcaca tccttttggg gcccgttgcc 420 ggtgccctgg gcaagattcc ccacggcggt cgcaactggg agggatttgg cgccgacccc 480 taccttgccg gtattgccat gaaggagacc atcgagggta ttcagtcagc aggcgtccag 540 gccaacgcca agcactacat tgcaaacgaa caagagctca accgcgagac catgagcagc 600 aatgtggatg accgcactca gcacgagctc tacctctggc cctttgccga cgccgtgcac 660 gccaacgtcg ccagcgtcat gtgcagttac aacaagctca atggcacgtg ggcttgcgag 720 aatgacaagg ctctgaatca gatcttgaag aaggagctcg gattccaggg ctacgttctc 780 agcgactgga atgctcagca cagcactgct ctgtctgcta acagtggtct ggacatgact 840 atgcccggta ccgatttcaa cggccgcaat gtctactggg gccctcaact gaacaacgct 900 gtcaacgccg gccaggttca gagatccaga ctagacgaca tgtgcaagag aatcttggct 960 ggctggtact tgctcggtca gaaccagggc tatcccgcca tcaacatcag ggccaacgtt 1020 cagggcaacc ataaggagaa cgtacgtgct gttgccagag acggcatcgt cttgctgaag 1080 aacgatggaa ttctgccgct ttccaagccg agaaagattg ctgtcgtggg ctcccactcc 1140 gtcaacaatc cccagggaat caacgcctgt gttgacaagg gctgcaatgt tggcaccctt 1200 ggcatgggct ggggttcagg cagcgtcaac tacccctatc tcgtgtcccc gtacgatgct 1260 ctccggactc gtgctcaggc cgatggcaca caaatcagcc tccacaacac tgacagcacc 1320 aacggtgtgt caaacgttgt gtctgacgct gatgctgttg ttgttgtcat cactgccgat 1380 tctggtgaag ggtacatcac tgtcgagggc cacgctggcg accgcagcca ccttgacccg 1440 tggcacaatg gcaaccaact tgttcaggct gccgcggctg ccaacaagaa cgtcatcgtt 1500 gttgtgcaca gtgttggcca gatcaccctg gagactatcc tcaacaccaa tggagtccgc 1560 gcgattgtgt gggctggtct tccgggccaa gagaatggca acgctcttgt tgatgttctc 1620 tacggcttgg tttcgccatc tggaaagctt ccctacacca ttggcaagag ggagtcggac 1680 tatggcacag ccgttgttcg tggggatgat aacttcaggg agggcctttt tgttgactac 1740 cgtcactttg acaatgccag gatcgagccg cgctatgagt ttggctttgg tctttgtaag 1800 ttccagcggc ggagttgggt ttgatttcaa gctttcctaa cctgataaaa cagcttacac 1860 caatttcacc ttctccgaca tcaagattac ttccaatgtc aagccggggc ccgctactgg 1920 ccagaccatt cccggcggac ctgccgacct gtgggaggac gttgcgacag tcactgcaac 1980 catcaccaac tcgggtgctg tcgagggcgc tgaggttgcc cagctttaca tcggcctgcc 2040 gtcctcggct cctgcctctc ccccgaagca gctgcgtgga ttttccaagc tgaagctggc 2100 cccgggtgcc agcggcactg ccacattcaa cctcagacgc agagatctca gctattggga 2160 tacccgcctc cagaactggg tcgtgcccag cggcaacttt gtcgtcagcg tcggcgccag 2220 ctcgagagat atccgcttga cgggcaccat cacggcgtag 2260 <210> 94 <211> 733 <212> PRT <213> Podospora anserina <400> 94 Met Ala Leu Gln Thr Phe Phe Leu Leu Ala Ala Ala Met Leu Ala Asn 1 5 10 15 Ala Glu Thr Thr Gly Glu Lys Val Ser Arg Gln Ala Pro Ser Gly Ala 20 25 30 Gln Ala Trp Ala Ala Ala His Ser Gln Ala Ala Ala Thr Leu Ala Arg 35 40 45 Met Ser Gln Gln Asp Lys Ile Asn Met Val Thr Gly Ile Gly Trp Asp 50 55 60 Arg Gly Pro Cys Val Gly Asn Thr Ala Ala Ile Ser Ser Ile Asn Tyr 65 70 75 80 Pro Gln Ile Cys Leu Gln Asp Gly Pro Leu Gly Ile Arg Phe Gly Thr 85 90 95 Gly Thr Thr Ala Phe Thr Pro Gly Val Gln Ala Ala Ser Thr Trp Asp 100 105 110 Val Asp Leu Ile Arg Gln Arg Gly Ala Tyr Leu Gly Ala Glu Ala Lys 115 120 125 Gly Cys Gly Ile His Ile Leu Leu Gly Pro Val Ala Gly Ala Leu Gly 130 135 140 Lys Ile Pro His Gly Gly Arg Asn Trp Glu Gly Phe Gly Ala Asp Pro 145 150 155 160 Tyr Leu Ala Gly Ile Ala Met Lys Glu Thr Ile Glu Gly Ile Gln Ser 165 170 175 Ala Gly Val Gln Ala Asn Ala Lys His Tyr Ile Ala Asn Glu Gln Glu 180 185 190 Leu Asn Arg Glu Thr Met Ser Ser Asn Val Asp Asp Arg Thr Gln His 195 200 205 Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val His Ala Asn Val Ala 210 215 220 Ser Val Met Cys Ser Tyr Asn Lys Leu Asn Gly Thr Trp Ala Cys Glu 225 230 235 240 Asn Asp Lys Ala Leu Asn Gln Ile Leu Lys Lys Glu Leu Gly Phe Gln 245 250 255 Gly Tyr Val Leu Ser Asp Trp Asn Ala Gln His Ser Thr Ala Leu Ser 260 265 270 Ala Asn Ser Gly Leu Asp Met Thr Met Pro Gly Thr Asp Phe Asn Gly 275 280 285 Arg Asn Val Tyr Trp Gly Pro Gln Leu Asn Asn Ala Val Asn Ala Gly 290 295 300 Gln Val Gln Arg Ser Arg Leu Asp Asp Met Cys Lys Arg Ile Leu Ala 305 310 315 320 Gly Trp Tyr Leu Leu Gly Gln Asn Gln Gly Tyr Pro Ala Ile Asn Ile 325 330 335 Arg Ala Asn Val Gln Gly Asn His Lys Glu Asn Val Arg Ala Val Ala 340 345 350 Arg Asp Gly Ile Val Leu Leu Lys Asn Asp Gly Ile Leu Pro Leu Ser 355 360 365 Lys Pro Arg Lys Ile Ala Val Val Gly Ser His Ser Val Asn Asn Pro 370 375 380 Gln Gly Ile Asn Ala Cys Val Asp Lys Gly Cys Asn Val Gly Thr Leu 385 390 395 400 Gly Met Gly Trp Gly Ser Gly Ser Val Asn Tyr Pro Tyr Leu Val Ser 405 410 415 Pro Tyr Asp Ala Leu Arg Thr Arg Ala Gln Ala Asp Gly Thr Gln Ile 420 425 430 Ser Leu His Asn Thr Asp Ser Thr Asn Gly Val Ser Asn Val Val Ser 435 440 445 Asp Ala Asp Ala Val Val Val Val Ile Thr Ala Asp Ser Gly Glu Gly 450 455 460 Tyr Ile Thr Val Glu Gly His Ala Gly Asp Arg Ser His Leu Asp Pro 465 470 475 480 Trp His Asn Gly Asn Gln Leu Val Gln Ala Ala Ala Ala Ala Asn Lys 485 490 495 Asn Val Ile Val Val Val His Ser Val Gly Gln Ile Thr Leu Glu Thr 500 505 510 Ile Leu Asn Thr Asn Gly Val Arg Ala Ile Val Trp Ala Gly Leu Pro 515 520 525 Gly Gln Glu Asn Gly Asn Ala Leu Val Asp Val Leu Tyr Gly Leu Val 530 535 540 Ser Pro Ser Gly Lys Leu Pro Tyr Thr Ile Gly Lys Arg Glu Ser Asp 545 550 555 560 Tyr Gly Thr Ala Val Val Arg Gly Asp Asp Asn Phe Arg Glu Gly Leu 565 570 575 Phe Val Asp Tyr Arg His Phe Asp Asn Ala Arg Ile Glu Pro Arg Tyr 580 585 590 Glu Phe Gly Phe Gly Leu Ser Tyr Thr Asn Phe Thr Phe Ser Asp Ile 595 600 605 Lys Ile Thr Ser Asn Val Lys Pro Gly Pro Ala Thr Gly Gln Thr Ile 610 615 620 Pro Gly Gly Pro Ala Asp Leu Trp Glu Asp Val Ala Thr Val Thr Ala 625 630 635 640 Thr Ile Thr Asn Ser Gly Ala Val Glu Gly Ala Glu Val Ala Gln Leu 645 650 655 Tyr Ile Gly Leu Pro Ser Ser Ala Pro Ala Ser Pro Pro Lys Gln Leu 660 665 670 Arg Gly Phe Ser Lys Leu Lys Leu Ala Pro Gly Ala Ser Gly Thr Ala 675 680 685 Thr Phe Asn Leu Arg Arg Arg Asp Leu Ser Tyr Trp Asp Thr Arg Leu 690 695 700 Gln Asn Trp Val Val Pro Ser Gly Asn Phe Val Val Ser Val Gly Ala 705 710 715 720 Ser Ser Arg Asp Ile Arg Leu Thr Gly Thr Ile Thr Ala 725 730 <210> 95 <211> 2551 <212> DNA <213> Fusarium verticillioides <400> 95 atgtttcctt cttccatatc ttgtttggcg gccctgagtc tgatgagcca gggtctacta 60 gctcagagcc aaccggaaaa tgtcatcacc gatgatacct acttctacgg tcaatcgcca 120 ccagtgtatc ctacacgtaa gcactctctc tgatttccca acgaaagcaa tactgatctc 180 ttgaccagcg gaacaggtag acaccggctc atgggctgcc gctgtagcca aagccaagaa 240 cttggtgtcc cagttgactc ttgaagagaa agtcaacttg actacaggag gccagacgac 300 caccggctgc tctggcttca tccctggcat tccccgtgta ggctttccag gactgtgttt 360 agcagacgct ggcaacggtg tccgcaacac agattatgtg agctcgtttc cctccgggat 420 tcatgtcggt gcaagctgga atccggagtt gacctacagc cggagctact acatgggtgc 480 tgaggccaaa gccaagggcg ttaacatcct tctcggtcca gtatttggac ctttgggccg 540 agtagttgaa ggtggacgca actgggaggg gttttccaat gatccctacc tggcgggtaa 600 attagggcat gaagctgtcg ccggtatcca agacgccgga gttgttgcat gcggaaaaca 660 tttccttgct caagagcagg agacccatag acttgcggcg tctgtcactg gggctgatgc 720 aatctcatca aatctcgatg acaagacact ccatgaatta tatctctggt aagcacatca 780 tatcttggct gagtagatga accttactaa cacccgaact gggcttttcg ctgatgcagt 840 ccacgccgga cttgccagtg tgatgtgcag ctacaacaga gcaaacaatt cacacgcctg 900 ccaaaactcg aagcttctca atggccttct caagggcgag ttaggattcc agggttttgt 960 cgtctcggac tggggcgcac agcaatctgg tatggcttca gcattggctg gcctggatgt 1020 tgtcatgccc agctcgatct tgtggggtgc caaccttacc cttggtgtga acaacggaac 1080 tattcccgag tcacaggttg acaatatggt tacacggtac gcgaagtctc agccttactt 1140 ctcaattctt ttgaactgac aatcgtgtag gctccttgca acttggtatc agttgaacca 1200 ggaccaagac accgaagccc caggtcacgg actcgctgcc aagctttggg agcctcaccc 1260 agtagtcgac gctcgcaacg caagctccaa gcctactatc tgggacggtg cagtcgaggg 1320 ccatgttctt gttaagaaca ccaacaacgc actgccattc aagcccaaca tgaaactcgt 1380 ttctttgttc ggatactctc acaaagctcc tgataagaac atcccagacc ccgcccaagg 1440 catgttctcc gcttggtcta tcggtgccca atccgccaac atcactgagc tgaacctcgg 1500 ctttctcgga aatttgagtc tcacatactc cgccatcgcg cccaacggaa ccatcatctc 1560 gggtggaggc tcgggtgcca gcgcttggac tctgttcagc tcacccttcg atgcattcgt 1620 ttctcgggcg aagaaagagg gtactgcgct tttctgggat tttgagagct gggatcctta 1680 tgtgaaccct acatctgaag cttgcatcgt tgctggtaat gcatgggcta gcgaaggctg 1740 ggatagacct gcaacctatg atgcctatac tgatgagctc atcaataacg tcgctgacaa 1800 gtgcgctaac actattgttg ttcttcacaa tgctggaaca cgacttgtgg atggcttctt 1860 tggtcacccc aacgtcaccg ctattatcta cgctcatctc ccaggtcagg atagtggaga 1920 tgctctggta tctttgctct atggcgatga gaacccatct ggtcgcctcc cttacaccgt 1980 tgcccgcaac gagacggatt atggtcacct gctgaagcca gacttgactc tcgcccccaa 2040 ccagtaccaa cactttcccc agtccgactt ctccgagggt attttcattg actaccgaca 2100 tttcgatgct aagaacatca cgcctcgctt cgagtttggt ttcggcttga gctacacaac 2160 ctttgagtac gctagtctcc agatctcaaa gtcccaggcc cagacaccgg aatacccagc 2220 tggtgctctt accgagggag gccgttcaga tttgtgggac gtcgttgcta ctgtcacagc 2280 aagcgtcagg aacactgggt ctgtcgacgg caaggaggtt gcacagctat acgttggtgt 2340 tccaggtggt cctatgagac agctacgtgg ctttacgaaa ccagctatta aggctggaga 2400 gacggctaca gtgacctttg agcttactcg ccgcgacttg agtgtctggg atgttaatgc 2460 gcaggagtgg caacttcagc aaggcaacta tgctatctac gttggccgaa gtagtcgaga 2520 tttgcctctg caaagtacct tgagcatcta g 2551 <210> 96 <211> 780 <212> PRT <213> Fusarium verticillioides <400> 96 Met Phe Pro Ser Ser Ile Ser Cys Leu Ala Ala Leu Ser Leu Met Ser 1 5 10 15 Gln Gly Leu Leu Ala Gln Ser Gln Pro Glu Asn Val Ile Thr Asp Asp 20 25 30 Thr Tyr Phe Tyr Gly Gln Ser Pro Pro Val Tyr Pro Thr His Thr Gly 35 40 45 Ser Trp Ala Ala Ala Val Ala Lys Ala Lys Asn Leu Val Ser Gln Leu 50 55 60 Thr Leu Glu Glu Lys Val Asn Leu Thr Thr Gly Gly Gln Thr Thr Thr 65 70 75 80 Gly Cys Ser Gly Phe Ile Pro Gly Ile Pro Arg Val Gly Phe Pro Gly 85 90 95 Leu Cys Leu Ala Asp Ala Gly Asn Gly Val Arg Asn Thr Asp Tyr Val 100 105 110 Ser Ser Phe Pro Ser Gly Ile His Val Gly Ala Ser Trp Asn Pro Glu 115 120 125 Leu Thr Tyr Ser Arg Ser Tyr Tyr Met Gly Ala Glu Ala Lys Ala Lys 130 135 140 Gly Val Asn Ile Leu Leu Gly Pro Val Phe Gly Pro Leu Gly Arg Val 145 150 155 160 Val Glu Gly Gly Arg Asn Trp Glu Gly Phe Ser Asn Asp Pro Tyr Leu 165 170 175 Ala Gly Lys Leu Gly His Glu Ala Val Ala Gly Ile Gln Asp Ala Gly 180 185 190 Val Val Ala Cys Gly Lys His Phe Leu Ala Gln Glu Gln Glu Thr His 195 200 205 Arg Leu Ala Ala Ser Val Thr Gly Ala Asp Ala Ile Ser Ser Asn Leu 210 215 220 Asp Asp Lys Thr Leu His Glu Leu Tyr Leu Cys Val Met Cys Ser Tyr 225 230 235 240 Asn Arg Ala Asn Asn Ser His Ala Cys Gln Asn Ser Lys Leu Leu Asn 245 250 255 Gly Leu Leu Lys Gly Glu Leu Gly Phe Gln Gly Phe Val Val Ser Asp 260 265 270 Trp Gly Ala Gln Gln Ser Gly Met Ala Ser Ala Leu Ala Gly Leu Asp 275 280 285 Val Val Met Pro Ser Ser Ile Leu Trp Gly Ala Asn Leu Thr Leu Gly 290 295 300 Val Asn Asn Gly Thr Ile Pro Glu Ser Gln Val Asp Asn Met Val Thr 305 310 315 320 Arg Leu Leu Ala Thr Trp Tyr Gln Leu Asn Gln Asp Gln Asp Thr Glu 325 330 335 Ala Pro Gly His Gly Leu Ala Ala Lys Leu Trp Glu Pro His Pro Val 340 345 350 Val Asp Ala Arg Asn Ala Ser Ser Lys Pro Thr Ile Trp Asp Gly Ala 355 360 365 Val Glu Gly His Val Leu Val Lys Asn Thr Asn Asn Ala Leu Pro Phe 370 375 380 Lys Pro Asn Met Lys Leu Val Ser Leu Phe Gly Tyr Ser His Lys Ala 385 390 395 400 Pro Asp Lys Asn Ile Pro Asp Pro Ala Gln Gly Met Phe Ser Ala Trp 405 410 415 Ser Ile Gly Ala Gln Ser Ala Asn Ile Thr Glu Leu Asn Leu Gly Phe 420 425 430 Leu Gly Asn Leu Ser Leu Thr Tyr Ser Ala Ile Ala Pro Asn Gly Thr 435 440 445 Ile Ile Ser Gly Gly Gly Ser Gly Ala Ser Ala Trp Thr Leu Phe Ser 450 455 460 Ser Pro Phe Asp Ala Phe Val Ser Arg Ala Lys Lys Glu Gly Thr Ala 465 470 475 480 Leu Phe Trp Asp Phe Glu Ser Trp Asp Pro Tyr Val Asn Pro Thr Ser 485 490 495 Glu Ala Cys Ile Val Ala Gly Asn Ala Trp Ala Ser Glu Gly Trp Asp 500 505 510 Arg Pro Ala Thr Tyr Asp Ala Tyr Thr Asp Glu Leu Ile Asn Asn Val 515 520 525 Ala Asp Lys Cys Ala Asn Thr Ile Val Val Leu His Asn Ala Gly Thr 530 535 540 Arg Leu Val Asp Gly Phe Phe Gly His Pro Asn Val Thr Ala Ile Ile 545 550 555 560 Tyr Ala His Leu Pro Gly Gln Asp Ser Gly Asp Ala Leu Val Ser Leu 565 570 575 Leu Tyr Gly Asp Glu Asn Pro Ser Gly Arg Leu Pro Tyr Thr Val Ala 580 585 590 Arg Asn Glu Thr Asp Tyr Gly His Leu Leu Lys Pro Asp Leu Thr Leu 595 600 605 Ala Pro Asn Gln Tyr Gln His Phe Pro Gln Ser Asp Phe Ser Glu Gly 610 615 620 Ile Phe Ile Asp Tyr Arg His Phe Asp Ala Lys Asn Ile Thr Pro Arg 625 630 635 640 Phe Glu Phe Gly Phe Gly Leu Ser Tyr Thr Thr Phe Glu Tyr Ala Ser 645 650 655 Leu Gln Ile Ser Lys Ser Gln Ala Gln Thr Pro Glu Tyr Pro Ala Gly 660 665 670 Ala Leu Thr Glu Gly Gly Arg Ser Asp Leu Trp Asp Val Val Ala Thr 675 680 685 Val Thr Ala Ser Val Arg Asn Thr Gly Ser Val Asp Gly Lys Glu Val 690 695 700 Ala Gln Leu Tyr Val Gly Val Pro Gly Gly Pro Met Arg Gln Leu Arg 705 710 715 720 Gly Phe Thr Lys Pro Ala Ile Lys Ala Gly Glu Thr Ala Thr Val Thr 725 730 735 Phe Glu Leu Thr Arg Arg Asp Leu Ser Val Trp Asp Val Asn Ala Gln 740 745 750 Glu Trp Gln Leu Gln Gln Gly Asn Tyr Ala Ile Tyr Val Gly Arg Ser 755 760 765 Ser Arg Asp Leu Pro Leu Gln Ser Thr Leu Ser Ile 770 775 780 <210> 97 <211> 2487 <212> DNA <213> Fusarium verticillioides <400> 97 atggctagca ttcgatctgt gttggtctcg ggtcttttgg ccgcgggtgt caatgcccaa 60 gcctacgatg cgagtgatcg cgctgaagat gctttcagct gggtccagcc caagaacacc 120 actattcttg gacagtacgg ccattcgcct cattaccctg ccagtatgtt caccaactac 180 accaagtgac actgaggctg tactgacatt ctagacaatg ctactggcaa gggctgggaa 240 gatgccttcg ccaaggctca aaactttgtc tcccaactaa ccctcgagga aaaggccgac 300 atggtcacag gaactccagg tccttgcgtc ggcaacatcg tcgccattcc ccgtctcaac 360 ttcaacggtc tctgtcttca cgacggcccc ctcgccatcc gagtagcaga ctacgccagt 420 gttttccccg ctggtgtatc agccgcttca tcgtgggaca aggacctcct ctaccagcgc 480 ggtctcgcca tgggtcaaga gttcaaggcc aagggtgctc acatcctcct cggccccgtc 540 gccggtcctc ttggccgctc ggcatactct ggtcgtaact gggagggttt ctcgccggac 600 ccttacctca ctggtattgc gatggaggag actatcatgg gacatcaaga tgctggtgtt 660 caggctactg cgaagcactt tatcggtaat gagcaggagg tcatgcgaaa ccctactttt 720 gtcaaggatg ggtatattgg tgaggttgac aaggaggctc tttcgtctaa catggatgat 780 cgaaccatgc acgagcttta cctctggccc tttgccaatg ctgttcatgc caaggcttcc 840 agcatgatgt gctcgtacca gcgtctcaac ggctcctacg cctgccagaa ctcaaaggtc 900 ctcaacggaa ttctgcgtga tgagcttggt ttccagggct acgtcatgtc agattggggt 960 gccacccacg ccggtgttgc tgccatcaac agcggtctcg acatggacat gcccggtggt 1020 atcggtgcct acggaacata ctttaccaag tccttcttcg gcggcaacct cacccgcgcc 1080 gtcaccaacg gcaccctcga cgagacccgc gtcaacgaca tgatcacccg catcatgact 1140 ccctacttct ggctcggcca ggacaaggac tatccctccg tcgacccctc cagcggtgat 1200 ctcaacacct tcagccccaa gagctcctgg ttccgcgagt tcaacctcac cggcgagcgc 1260 agccgtgacg tccgcggtaa ccacggcgac ttgatccgca agcacggcgc cgagtctacc 1320 gtccttctca agaacgagaa gaacgccctt cccctcaaga agcccaagtc catcgctgtc 1380 tttggcaacg atgctggtga tatcactgag ggtttctaca accagaatga ctacgaattt 1440 ggcactcttg ttgctggtgg tggctctgga actggtcgtt tgacatacct tgtttcgcct 1500 ctagccgcca tcaatgctcg tgctaagcag gacggtactc ttgttcagca gtggatgaac 1560 aacactctta ttgctaccac caacgtcact gatctctgga tccctgctac tcccgatgtc 1620 tgcctcgttt tcttgaagac ttgggctgag gaggctgctg atcgtgagca cctctccgtt 1680 gactgggacg gtaatgatgt tgttgagtct gttgccaagt actgcaataa cactgtcgtc 1740 gtcactcact cttctggtat caacactctt ccttgggctg accaccccaa cgtcaccgct 1800 attctcgctg cccacttccc cggtcaggag tctggcaact ccctcgttga cctcctctac 1860 ggcgatgtca acccctctgg tcgtcttccc tacaccatcg ccttcaacgg caccgactac 1920 aacgctcccc ccaccactgc cgtcaacacc accggcaagg aggactggca gtcttggttc 1980 gacgagaagc tcgagattga ctaccgctac ttcgacgcgc acaacatctc cgtccgctac 2040 gaattcggct tcggtctctc ctactccacc ttcgaaatct ccgacatctc cgctgagcca 2100 ctcgcatccg acattacctc ccagcccgag gatctccccg tgcagcccgg cggcaacccc 2160 gccctctggg agaccgtcta caacgtgacc gtctccgtct ccaacacggg caaggtcgac 2220 ggcgccactg tcccccagct atacgtgaca ttccccgaca gcgcgcctgc cggtacacca 2280 cccaagcagc tccgtgggtt cgacaaggtc ttccttgagg ctggcgagag caagagtgtc 2340 agctttgagc tgatgcgccg tgatctgagc tactgggata tcatttctca gaagtggctc 2400 atccctgagg gagagtttac tattcgtgtt ggattcagca gtcgggactt gaaggaggag 2460 acaaaggtta ctgttgttga ggcgtaa 2487 <210> 98 <211> 811 <212> PRT <213> Fusarium verticillioides <400> 98 Met Ala Ser Ile Arg Ser Val Leu Val Ser Gly Leu Leu Ala Ala Gly 1 5 10 15 Val Asn Ala Gln Ala Tyr Asp Ala Ser Asp Arg Ala Glu Asp Ala Phe 20 25 30 Ser Trp Val Gln Pro Lys Asn Thr Thr Ile Leu Gly Gln Tyr Gly His 35 40 45 Ser Pro His Tyr Pro Ala Asn Asn Ala Thr Gly Lys Gly Trp Glu Asp 50 55 60 Ala Phe Ala Lys Ala Gln Asn Phe Val Ser Gln Leu Thr Leu Glu Glu 65 70 75 80 Lys Ala Asp Met Val Thr Gly Thr Pro Gly Pro Cys Val Gly Asn Ile 85 90 95 Val Ala Ile Pro Arg Leu Asn Phe Asn Gly Leu Cys Leu His Asp Gly 100 105 110 Pro Leu Ala Ile Arg Val Ala Asp Tyr Ala Ser Val Phe Pro Ala Gly 115 120 125 Val Ser Ala Ala Ser Ser Trp Asp Lys Asp Leu Leu Tyr Gln Arg Gly 130 135 140 Leu Ala Met Gly Gln Glu Phe Lys Ala Lys Gly Ala His Ile Leu Leu 145 150 155 160 Gly Pro Val Ala Gly Pro Leu Gly Arg Ser Ala Tyr Ser Gly Arg Asn 165 170 175 Trp Glu Gly Phe Ser Pro Asp Pro Tyr Leu Thr Gly Ile Ala Met Glu 180 185 190 Glu Thr Ile Met Gly His Gln Asp Ala Gly Val Gln Ala Thr Ala Lys 195 200 205 His Phe Ile Gly Asn Glu Gln Glu Val Met Arg Asn Pro Thr Phe Val 210 215 220 Lys Asp Gly Tyr Ile Gly Glu Val Asp Lys Glu Ala Leu Ser Ser Asn 225 230 235 240 Met Asp Asp Arg Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asn 245 250 255 Ala Val His Ala Lys Ala Ser Ser Met Met Cys Ser Tyr Gln Arg Leu 260 265 270 Asn Gly Ser Tyr Ala Cys Gln Asn Ser Lys Val Leu Asn Gly Ile Leu 275 280 285 Arg Asp Glu Leu Gly Phe Gln Gly Tyr Val Met Ser Asp Trp Gly Ala 290 295 300 Thr His Ala Gly Val Ala Ala Ile Asn Ser Gly Leu Asp Met Asp Met 305 310 315 320 Pro Gly Gly Ile Gly Ala Tyr Gly Thr Tyr Phe Thr Lys Ser Phe Phe 325 330 335 Gly Gly Asn Leu Thr Arg Ala Val Thr Asn Gly Thr Leu Asp Glu Thr 340 345 350 Arg Val Asn Asp Met Ile Thr Arg Ile Met Thr Pro Tyr Phe Trp Leu 355 360 365 Gly Gln Asp Lys Asp Tyr Pro Ser Val Asp Pro Ser Ser Gly Asp Leu 370 375 380 Asn Thr Phe Ser Pro Lys Ser Ser Trp Phe Arg Glu Phe Asn Leu Thr 385 390 395 400 Gly Glu Arg Ser Arg Asp Val Arg Gly Asn His Gly Asp Leu Ile Arg 405 410 415 Lys His Gly Ala Glu Ser Thr Val Leu Leu Lys Asn Glu Lys Asn Ala 420 425 430 Leu Pro Leu Lys Lys Pro Lys Ser Ile Ala Val Phe Gly Asn Asp Ala 435 440 445 Gly Asp Ile Thr Glu Gly Phe Tyr Asn Gln Asn Asp Tyr Glu Phe Gly 450 455 460 Thr Leu Val Ala Gly Gly Gly Ser Gly Thr Gly Arg Leu Thr Tyr Leu 465 470 475 480 Val Ser Pro Leu Ala Ala Ile Asn Ala Arg Ala Lys Gln Asp Gly Thr 485 490 495 Leu Val Gln Gln Trp Met Asn Asn Thr Leu Ile Ala Thr Thr Asn Val 500 505 510 Thr Asp Leu Trp Ile Pro Ala Thr Pro Asp Val Cys Leu Val Phe Leu 515 520 525 Lys Thr Trp Ala Glu Glu Ala Ala Asp Arg Glu His Leu Ser Val Asp 530 535 540 Trp Asp Gly Asn Asp Val Val Glu Ser Val Ala Lys Tyr Cys Asn Asn 545 550 555 560 Thr Val Val Val Thr His Ser Ser Gly Ile Asn Thr Leu Pro Trp Ala 565 570 575 Asp His Pro Asn Val Thr Ala Ile Leu Ala Ala His Phe Pro Gly Gln 580 585 590 Glu Ser Gly Asn Ser Leu Val Asp Leu Leu Tyr Gly Asp Val Asn Pro 595 600 605 Ser Gly Arg Leu Pro Tyr Thr Ile Ala Phe Asn Gly Thr Asp Tyr Asn 610 615 620 Ala Pro Pro Thr Thr Ala Val Asn Thr Thr Gly Lys Glu Asp Trp Gln 625 630 635 640 Ser Trp Phe Asp Glu Lys Leu Glu Ile Asp Tyr Arg Tyr Phe Asp Ala 645 650 655 His Asn Ile Ser Val Arg Tyr Glu Phe Gly Phe Gly Leu Ser Tyr Ser 660 665 670 Thr Phe Glu Ile Ser Asp Ile Ser Ala Glu Pro Leu Ala Ser Asp Ile 675 680 685 Thr Ser Gln Pro Glu Asp Leu Pro Val Gln Pro Gly Gly Asn Pro Ala 690 695 700 Leu Trp Glu Thr Val Tyr Asn Val Thr Val Ser Val Ser Asn Thr Gly 705 710 715 720 Lys Val Asp Gly Ala Thr Val Pro Gln Leu Tyr Val Thr Phe Pro Asp 725 730 735 Ser Ala Pro Ala Gly Thr Pro Pro Lys Gln Leu Arg Gly Phe Asp Lys 740 745 750 Val Phe Leu Glu Ala Gly Glu Ser Lys Ser Val Ser Phe Glu Leu Met 755 760 765 Arg Arg Asp Leu Ser Tyr Trp Asp Ile Ile Ser Gln Lys Trp Leu Ile 770 775 780 Pro Glu Gly Glu Phe Thr Ile Arg Val Gly Phe Ser Ser Arg Asp Leu 785 790 795 800 Lys Glu Glu Thr Lys Val Thr Val Val Glu Ala 805 810 <210> 99 <211> 3269 <212> DNA <213> Fusarium verticillioides <400> 99 atgaagctga attgggtcgc cgcagccctg tctataggtg ctgctggcac tgacagcgca 60 gttgctcttg cttctgcagt tccagacact ttggctggtg taaaggtcag ttttttttca 120 ccatttcctc gtctaatctc agccttgttg ccatatcgcc cttgttcgct cggacgccac 180 gcaccagatc gcgatcattt cctcccttgc agccttggtt cctcttacga tcttccctcc 240 gcaattatca gcgcccttag tctacacaaa aacccccgag acagtctttc attgagtttg 300 tcgacatcaa gttgcttctc aactgtgcat ttgcgtggct gtctacttct gcctctagac 360 aaccaaatct gggcgcaatt gaccgctcaa accttgttca aataaccttt tttattcgag 420 acgcacattt ataaatatgc gcctttcaat aataccgact ttatgcgcgg cggctgctgt 480 ggcggttgat cagaaagctg acgctcaaaa ggttgtcacg agagatacac tcgcatactc 540 gccgcctcat tatccttcac catggatgga ccctaatgct gttggctggg aggaagctta 600 cgccaaagcc aagagctttg tgtcccaact cactctcatg gaaaaggtca acttgaccac 660 tggtgttggg taagcagctc cttgcaaaca gggtatctca atcccctcag ctaacaactt 720 ctcagatggc aaggcgaacg ctgtgtagga aacgtgggat caattcctcg tctcggtatg 780 cgaggtctct gtctccagga tggtcctctt ggaattcgtc tgtccgacta caacagcgct 840 tttcccgctg gcaccacagc tggtgcttct tggagcaagt ctctctggta tgagagaggt 900 ctcctgatgg gcactgagtt caaggagaag ggtatcgata tcgctcttgg tcctgctact 960 ggacctcttg gtcgcactgc tgctggtgga cgaaactggg aaggcttcac cgttgatcct 1020 tatatggctg gccacgccat ggccgaggcc gtcaagggta ttcaagacgc aggtgtcatt 1080 gcttgtgcta agcattacat cgcaaacgag cagggtaagc cacttggacg atttgaggaa 1140 ttgacagaga actgaccctc ttgtagagca cttccgacag agtggcgagg tccagtcccg 1200 caagtacaac atctccgagt ctctctcctc caacctggat gacaagacta tgcacgagct 1260 ctacgcctgg cccttcgctg acgccgtccg cgccggcgtc ggttccgtca tgtgctcgta 1320 caaccagatc aacaactcgt acggttgcca gaactccaag ctcctcaacg gtatcctcaa 1380 ggacgagatg ggcttccagg gtttcgtcat gagcgattgg gcggcccagc ataccggtgc 1440 cgcttctgcc gtcgctggtc tcgatatgag catgcctggt gacactgcct tcgacagcgg 1500 atacagcttc tggggcggaa acttgactct ggctgtcatc aacggaactg ttcccgcctg 1560 gcgagttgat gacatggctc tgcgaatcat gtctgccttc ttcaaggttg gaaagacgat 1620 agaggatctt cccgacatca acttctcctc ctggacccgc gacaccttcg gcttcgtgca 1680 tacatttgct caagagaacc gcgagcaggt caactttgga gtcaacgtcc agcacgacca 1740 caagagccac atccgtgagg ccgctgccaa gggaagcgtc gtgctcaaga acaccgggtc 1800 ccttcccctc aagaacccaa agttcctcgc tgtcattggt gaggacgccg gtcccaaccc 1860 tgctggaccc aatggttgtg gtgaccgtgg ttgcgataat ggtaccctgg ctatggcttg 1920 gggctcggga acttcccaat tcccttactt gatcaccccc gatcaagggc tctctaatcg 1980 agctactcaa gacggaactc gatatgagag catcttgacc aacaacgaat gggcttcagt 2040 acaagctctt gtcagccagc ctaacgtgac cgctatcgtt ttcgccaatg ccgactctgg 2100 tgagggatac attgaagtcg acggaaactt tggtgatcgc aagaacctca ccctctggca 2160 gcagggagac gagctcatca agaacgtgtc gtccatatgc cccaacacca ttgtagttct 2220 gcacaccgtc ggccctgtcc tactcgccga ctacgagaag aaccccaaca tcactgccat 2280 cgtctgggct ggtcttcccg gccaagagtc aggcaatgcc atcgctgatc tcctctacgg 2340 caaggtcagc cctggccgat ctcccttcac ttggggccgc acccgcgaga gctacggtac 2400 tgaggttctt tatgaggcga acaacggccg tggcgctcct caggatgact tctctgaggg 2460 tgtcttcatc gactaccgtc acttcgaccg acgatctcca agcaccgatg gaaagagctc 2520 tcccaacaac accgctgctc ctctctacga gttcggtcac ggtctatctt ggtccacctt 2580 tgagtactct gacctcaaca tccagaagaa cgtcgagaac ccctactctc ctcccgctgg 2640 ccagaccatc cccgccccaa cctttggcaa cttcagcaag aacctcaacg actacgtgtt 2700 ccccaagggc gtccgataca tctacaagtt catctacccc ttcctcaaca cctcctcatc 2760 cgccagcgag gcatccaacg atggtggcca gtttggtaag actgccgaag agttcctccc 2820 tcccaacgcc ctcaacggct cagcccagcc tcgtcttccc gcctctggtg ccccaggtgg 2880 taaccctcaa ttgtgggaca tcttgtacac cgtcacagcc acaatcacca acacaggcaa 2940 cgccacctcc gacgagattc cccagctgta tgtcagcctc ggtggcgaga acgagcccat 3000 ccgtgttctc cgcggtttcg accgtatcga gaacattgct cccggccaga gcgccatctt 3060 caacgctcaa ttgacccgtc gcgatctgag taactgggat acaaatgccc agaactgggt 3120 catcactgac catcccaaga ctgtctgggt tggaagcagc tctcgcaagc tgcctctcag 3180 cgccaagttg gagtaagaaa gccaaacaag ggttgttttt tggactgcaa ttttttggga 3240 ggacatagta gccgcgcgcc agttacgtc 3269 <210> 100 <211> 899 <212> PRT <213> Fusarium verticillioides <400> 100 Met Lys Leu Asn Trp Val Ala Ala Ala Leu Ser Ile Gly Ala Ala Gly 1 5 10 15 Thr Asp Ser Ala Val Ala Leu Ala Ser Ala Val Pro Asp Thr Leu Ala 20 25 30 Gly Val Lys Lys Ala Asp Ala Gln Lys Val Val Thr Arg Asp Thr Leu 35 40 45 Ala Tyr Ser Pro Pro His Tyr Pro Ser Pro Trp Met Asp Pro Asn Ala 50 55 60 Val Gly Trp Glu Glu Ala Tyr Ala Lys Ala Lys Ser Phe Val Ser Gln 65 70 75 80 Leu Thr Leu Met Glu Lys Val Asn Leu Thr Thr Gly Val Gly Trp Gln 85 90 95 Gly Glu Arg Cys Val Gly Asn Val Gly Ser Ile Pro Arg Leu Gly Met 100 105 110 Arg Gly Leu Cys Leu Gln Asp Gly Pro Leu Gly Ile Arg Leu Ser Asp 115 120 125 Tyr Asn Ser Ala Phe Pro Ala Gly Thr Thr Ala Gly Ala Ser Trp Ser 130 135 140 Lys Ser Leu Trp Tyr Glu Arg Gly Leu Leu Met Gly Thr Glu Phe Lys 145 150 155 160 Glu Lys Gly Ile Asp Ile Ala Leu Gly Pro Ala Thr Gly Pro Leu Gly 165 170 175 Arg Thr Ala Ala Gly Gly Arg Asn Trp Glu Gly Phe Thr Val Asp Pro 180 185 190 Tyr Met Ala Gly His Ala Met Ala Glu Ala Val Lys Gly Ile Gln Asp 195 200 205 Ala Gly Val Ile Ala Cys Ala Lys His Tyr Ile Ala Asn Glu Gln Glu 210 215 220 His Phe Arg Gln Ser Gly Glu Val Gln Ser Arg Lys Tyr Asn Ile Ser 225 230 235 240 Glu Ser Leu Ser Ser Asn Leu Asp Asp Lys Thr Met His Glu Leu Tyr 245 250 255 Ala Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ser Val Met 260 265 270 Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Gln Asn Ser Lys 275 280 285 Leu Leu Asn Gly Ile Leu Lys Asp Glu Met Gly Phe Gln Gly Phe Val 290 295 300 Met Ser Asp Trp Ala Ala Gln His Thr Gly Ala Ala Ser Ala Val Ala 305 310 315 320 Gly Leu Asp Met Ser Met Pro Gly Asp Thr Ala Phe Asp Ser Gly Tyr 325 330 335 Ser Phe Trp Gly Gly Asn Leu Thr Leu Ala Val Ile Asn Gly Thr Val 340 345 350 Pro Ala Trp Arg Val Asp Asp Met Ala Leu Arg Ile Met Ser Ala Phe 355 360 365 Phe Lys Val Gly Lys Thr Ile Glu Asp Leu Pro Asp Ile Asn Phe Ser 370 375 380 Ser Trp Thr Arg Asp Thr Phe Gly Phe Val His Thr Phe Ala Gln Glu 385 390 395 400 Asn Arg Glu Gln Val Asn Phe Gly Val Asn Val Gln His Asp His Lys 405 410 415 Ser His Ile Arg Glu Ala Ala Ala Lys Gly Ser Val Val Leu Lys Asn 420 425 430 Thr Gly Ser Leu Pro Leu Lys Asn Pro Lys Phe Leu Ala Val Ile Gly 435 440 445 Glu Asp Ala Gly Pro Asn Pro Ala Gly Pro Asn Gly Cys Gly Asp Arg 450 455 460 Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser Gly Thr Ser 465 470 475 480 Gln Phe Pro Tyr Leu Ile Thr Pro Asp Gln Gly Leu Ser Asn Arg Ala 485 490 495 Thr Gln Asp Gly Thr Arg Tyr Glu Ser Ile Leu Thr Asn Asn Glu Trp 500 505 510 Ala Ser Val Gln Ala Leu Val Ser Gln Pro Asn Val Thr Ala Ile Val 515 520 525 Phe Ala Asn Ala Asp Ser Gly Glu Gly Tyr Ile Glu Val Asp Gly Asn 530 535 540 Phe Gly Asp Arg Lys Asn Leu Thr Leu Trp Gln Gln Gly Asp Glu Leu 545 550 555 560 Ile Lys Asn Val Ser Ser Ile Cys Pro Asn Thr Ile Val Val Leu His 565 570 575 Thr Val Gly Pro Val Leu Leu Ala Asp Tyr Glu Lys Asn Pro Asn Ile 580 585 590 Thr Ala Ile Val Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly Asn Ala 595 600 605 Ile Ala Asp Leu Leu Tyr Gly Lys Val Ser Pro Gly Arg Ser Pro Phe 610 615 620 Thr Trp Gly Arg Thr Arg Glu Ser Tyr Gly Thr Glu Val Leu Tyr Glu 625 630 635 640 Ala Asn Asn Gly Arg Gly Ala Pro Gln Asp Asp Phe Ser Glu Gly Val 645 650 655 Phe Ile Asp Tyr Arg His Phe Asp Arg Arg Ser Pro Ser Thr Asp Gly 660 665 670 Lys Ser Ser Pro Asn Asn Thr Ala Ala Pro Leu Tyr Glu Phe Gly His 675 680 685 Gly Leu Ser Trp Ser Thr Phe Glu Tyr Ser Asp Leu Asn Ile Gln Lys 690 695 700 Asn Val Glu Asn Pro Tyr Ser Pro Pro Ala Gly Gln Thr Ile Pro Ala 705 710 715 720 Pro Thr Phe Gly Asn Phe Ser Lys Asn Leu Asn Asp Tyr Val Phe Pro 725 730 735 Lys Gly Val Arg Tyr Ile Tyr Lys Phe Ile Tyr Pro Phe Leu Asn Thr 740 745 750 Ser Ser Ser Ala Ser Glu Ala Ser Asn Asp Gly Gly Gln Phe Gly Lys 755 760 765 Thr Ala Glu Glu Phe Leu Pro Pro Asn Ala Leu Asn Gly Ser Ala Gln 770 775 780 Pro Arg Leu Pro Ala Ser Gly Ala Pro Gly Gly Asn Pro Gln Leu Trp 785 790 795 800 Asp Ile Leu Tyr Thr Val Thr Ala Thr Ile Thr Asn Thr Gly Asn Ala 805 810 815 Thr Ser Asp Glu Ile Pro Gln Leu Tyr Val Ser Leu Gly Gly Glu Asn 820 825 830 Glu Pro Ile Arg Val Leu Arg Gly Phe Asp Arg Ile Glu Asn Ile Ala 835 840 845 Pro Gly Gln Ser Ala Ile Phe Asn Ala Gln Leu Thr Arg Arg Asp Leu 850 855 860 Ser Asn Trp Asp Thr Asn Ala Gln Asn Trp Val Ile Thr Asp His Pro 865 870 875 880 Lys Thr Val Trp Val Gly Ser Ser Ser Arg Lys Leu Pro Leu Ser Ala 885 890 895 Lys Leu Glu <210> 101 <211> 2370 <212> DNA <213> Trichoderma reesei <400> 101 atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60 agtcagtata gctggtccca tactgggatg tgatatgtat cctggagaca ccatgctgac 120 tcttgaatca aggtagctca acatcggggg cctcggctga ggcagttgta cctcctgcag 180 ggactccatg gggaaccgcg tacgacaagg cgaaggccgc attggcaaag ctcaatctcc 240 aagataaggt cggcatcgtg agcggtgtcg gctggaacgg cggtccttgc gttggaaaca 300 catctccggc ctccaagatc agctatccat cgctatgcct tcaagacgga cccctcggtg 360 ttcgatactc gacaggcagc acagccttta cgccgggcgt tcaagcggcc tcgacgtggg 420 atgtcaattt gatccgcgaa cgtggacagt tcatcggtga ggaggtgaag gcctcgggga 480 ttcatgtcat acttggtcct gtggctgggc cgctgggaaa gactccgcag ggcggtcgca 540 actgggaggg cttcggtgtc gatccatatc tcacgggcat tgccatgggt caaaccatca 600 acggcatcca gtcggtaggc gtgcaggcga cagcgaagca ctatatcctc aacgagcagg 660 agctcaatcg agaaaccatt tcgagcaacc cagatgaccg aactctccat gagctgtata 720 cttggccatt tgccgacgcg gttcaggcca atgtcgcttc tgtcatgtgc tcgtacaaca 780 aggtcaatac cacctgggcc tgcgaggatc agtacacgct gcagactgtg ctgaaagacc 840 agctggggtt cccaggctat gtcatgacgg actggaacgc acagcacacg actgtccaaa 900 gcgcgaattc tgggcttgac atgtcaatgc ctggcacaga cttcaacggt aacaatcggc 960 tctggggtcc agctctcacc aatgcggtaa atagcaatca ggtccccacg agcagagtcg 1020 acgatatggt gactcgtatc ctcgccgcat ggtacttgac aggccaggac caggcaggct 1080 atccgtcgtt caacatcagc agaaatgttc aaggaaacca caagaccaat gtcagggcaa 1140 ttgccaggga cggcatcgtt ctgctcaaga atgacgccaa catcctgccg ctcaagaagc 1200 ccgctagcat tgccgtcgtt ggatctgccg caatcattgg taaccacgcc agaaactcgc 1260 cctcgtgcaa cgacaaaggc tgcgacgacg gggccttggg catgggttgg ggttccggcg 1320 ccgtcaacta tccgtacttc gtcgcgccct acgatgccat caataccaga gcgtcttcgc 1380 agggcaccca ggttaccttg agcaacaccg acaacacgtc ctcaggcgca tctgcagcaa 1440 gaggaaagga cgtcgccatc gtcttcatca ccgccgactc gggtgaaggc tacatcaccg 1500 tggagggcaa cgcgggcgat cgcaacaacc tggatccgtg gcacaacggc aatgccctgg 1560 tccaggcggt ggccggtgcc aacagcaacg tcattgttgt tgtccactcc gttggcgcca 1620 tcattctgga gcagattctt gctcttccgc aggtcaaggc cgttgtctgg gcgggtcttc 1680 cttctcagga gagcggcaat gcgctcgtcg acgtgctgtg gggagatgtc agcccttctg 1740 gcaagctggt gtacaccatt gcgaagagcc ccaatgacta taacactcgc atcgtttccg 1800 gcggcagtga cagcttcagc gagggactgt tcatcgacta taagcacttc gacgacgcca 1860 atatcacgcc gcggtacgag ttcggctatg gactgtgtaa gtttgctaac ctgaacaatc 1920 tattagacag gttgactgac ggatgactgt ggaatgatag cttacaccaa gttcaactac 1980 tcacgcctct ccgtcttgtc gaccgccaag tctggtcctg cgactggggc cgttgtgccg 2040 ggaggcccga gtgatctgtt ccagaatgtc gcgacagtca ccgttgacat cgcaaactct 2100 ggccaagtga ctggtgccga ggtagcccag ctgtacatca cctacccatc ttcagcaccc 2160 aggacccctc cgaagcagct gcgaggcttt gccaagctga acctcacgcc tggtcagagc 2220 ggaacagcaa cgttcaacat ccgacgacga gatctcagct actgggacac ggcttcgcag 2280 aaatgggtgg tgccgtcggg gtcgtttggc atcagcgtgg gagcgagcag ccgggatatc 2340 aggctgacga gcactctgtc ggtagcgtag 2370 <210> 102 <211> 744 <212> PRT <213> Trichoderma reesei <400> 102 Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe 1 5 10 15 Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val 20 25 30 Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys 35 40 45 Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser 50 55 60 Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala 65 70 75 80 Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly 85 90 95 Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala 100 105 110 Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile 115 120 125 Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val 130 135 140 Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile 165 170 175 Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile 180 185 190 Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp 195 200 205 Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val 210 215 220 Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr 225 230 235 240 Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp 245 250 255 Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His 260 265 270 Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly 275 280 285 Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn 290 295 300 Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val 305 310 315 320 Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly 325 330 335 Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr 340 345 350 Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp 355 360 365 Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly 370 375 380 Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn 385 390 395 400 Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly 405 410 415 Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr 420 425 430 Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn 435 440 445 Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val 450 455 460 Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn 465 470 475 480 Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu 485 490 495 Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His 500 505 510 Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val 515 520 525 Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala 530 535 540 Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val 545 550 555 560 Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser 565 570 575 Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His 580 585 590 Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu 595 600 605 Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala 610 615 620 Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp 625 630 635 640 Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly 645 650 655 Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser 660 665 670 Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu 675 680 685 Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg 690 695 700 Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro 705 710 715 720 Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg 725 730 735 Leu Thr Ser Thr Leu Ser Val Ala 740 <210> 103 <211> 2625 <212> DNA <213> Trichoderma reesei <400> 103 atgaagacgt tgtcagtgtt tgctgccgcc cttttggcgg ccgtagctga ggccaatccc 60 tacccgcctc ctcactccaa ccaggcgtac tcgcctcctt tctacccttc gccatggatg 120 gaccccagtg ctccaggctg ggagcaagcc tatgcccaag ctaaggagtt cgtctcgggc 180 ttgactctct tggagaaggt caacctcacc accggtgttg gctggatggg tgagaagtgc 240 gttggaaacg ttggtaccgt gcctcgcttg ggcatgcgaa gtctttgcat gcaggacggc 300 cccctgggtc tccgattcaa cacgtacaac agcgctttca gcgttggctt gacggccgcc 360 gccagctgga gccgacacct ttgggttgac cgcggtaccg ctctgggctc cgaggcaaag 420 ggcaagggtg tcgatgttct tctcggaccc gtggctggcc ctctcggtcg caaccccaac 480 ggaggccgta acgtcgaggg tttcggctcg gatccctatc tggcgggttt ggctctggcc 540 gataccgtga ccggaatcca gaacgcgggc accatcgcct gtgccaagca cttcctcctc 600 aacgagcagg agcatttccg ccaggtcggc gaagctaacg gttacggata ccccatcacc 660 gaggctctgt cttccaacgt tgatgacaag acgattcacg aggtgtacgg ctggcccttc 720 caggatgctg tcaaggctgg tgtcgggtcc ttcatgtgct cgtacaacca ggtcaacaac 780 tcgtacgctt gccaaaactc caagctcatc aacggcttgc tcaaggagga gtacggtttc 840 caaggctttg tcatgagcga ctggcaggcc cagcacacgg gtgtcgcgtc tgctgttgcc 900 ggtctcgata tgaccatgcc tggtgacacc gccttcaaca ccggcgcatc ctactttgga 960 agcaacctga cgcttgctgt tctcaacggc accgtccccg agtggcgcat tgacgacatg 1020 gtgatgcgta tcatggctcc cttcttcaag gtgggcaaga cggttgacag cctcattgac 1080 accaactttg attcttggac caatggcgag tacggctacg ttcaggccgc cgtcaatgag 1140 aactgggaga aggtcaacta cggcgtcgat gtccgcgcca accatgcgaa ccacatccgc 1200 gaggttggcg ccaagggaac tgtcatcttc aagaacaacg gcatcctgcc ccttaagaag 1260 cccaagttcc tgaccgtcat tggtgaggat gctggcggca accctgccgg ccccaacggc 1320 tgcggtgacc gcggctgtga cgacggcact cttgccatgg agtggggatc tggtactacc 1380 aacttcccct acctcgtcac ccccgacgcg gccctgcaga gccaggctct ccaggacggc 1440 acccgctacg agagcatcct gtccaactac gccatctcgc agacccaggc gctcgtcagc 1500 cagcccgatg ccattgccat tgtctttgcc aactcggata gcggcgaggg ctacatcaac 1560 gtcgatggca acgagggcga ccgcaagaac ctgacgctgt ggaagaacgg cgacgatctg 1620 atcaagactg ttgctgctgt caaccccaag acgattgtcg tcatccactc gaccggcccc 1680 gtgattctca aggactacgc caaccacccc aacatctctg ccattctgtg ggccggtgct 1740 cctggccagg agtctggcaa ctcgctggtc gacattctgt acggcaagca gagcccgggc 1800 cgcactccct tcacctgggg cccgtcgctg gagagctacg gagttagtgt tatgaccacg 1860 cccaacaacg gcaacggcgc tccccaggat aacttcaacg agggcgcctt catcgactac 1920 cgctactttg acaaggtggc tcccggcaag cctcgcagct cggacaaggc tcccacgtac 1980 gagtttggct tcggactgtc gtggtcgacg ttcaagttct ccaacctcca catccagaag 2040 aacaatgtcg gccccatgag cccgcccaac ggcaagacga ttgcggctcc ctctctgggc 2100 agcttcagca agaaccttaa ggactatggc ttccccaaga acgttcgccg catcaaggag 2160 tttatctacc cctacctgag caccactacc tctggcaagg aggcgtcggg tgacgctcac 2220 tacggccaga ctgcgaagga gttcctcccc gccggtgccc tggacggcag ccctcagcct 2280 cgctctgcgg cctctggcga acccggcggc aaccgccagc tgtacgacat tctctacacc 2340 gtgacggcca ccattaccaa cacgggctcg gtcatggacg acgccgttcc ccagctgtac 2400 ctgagccacg gcggtcccaa cgagccgccc aaggtgctgc gtggcttcga ccgcatcgag 2460 cgcattgctc ccggccagag cgtcacgttc aaggcagacc tgacgcgccg tgacctgtcc 2520 aactgggaca cgaagaagca gcagtgggtc attaccgact accccaagac tgtgtacgtg 2580 ggcagctcct cgcgcgacct gccgctgagc gcccgcctgc catga 2625 <210> 104 <211> 874 <212> PRT <213> Trichoderma reesei <400> 104 Met Lys Thr Leu Ser Val Phe Ala Ala Ala Leu Leu Ala Ala Val Ala 1 5 10 15 Glu Ala Asn Pro Tyr Pro Pro Pro His Ser Asn Gln Ala Tyr Ser Pro 20 25 30 Pro Phe Tyr Pro Ser Pro Trp Met Asp Pro Ser Ala Pro Gly Trp Glu 35 40 45 Gln Ala Tyr Ala Gln Ala Lys Glu Phe Val Ser Gly Leu Thr Leu Leu 50 55 60 Glu Lys Val Asn Leu Thr Thr Gly Val Gly Trp Met Gly Glu Lys Cys 65 70 75 80 Val Gly Asn Val Gly Thr Val Pro Arg Leu Gly Met Arg Ser Leu Cys 85 90 95 Met Gln Asp Gly Pro Leu Gly Leu Arg Phe Asn Thr Tyr Asn Ser Ala 100 105 110 Phe Ser Val Gly Leu Thr Ala Ala Ala Ser Trp Ser Arg His Leu Trp 115 120 125 Val Asp Arg Gly Thr Ala Leu Gly Ser Glu Ala Lys Gly Lys Gly Val 130 135 140 Asp Val Leu Leu Gly Pro Val Ala Gly Pro Leu Gly Arg Asn Pro Asn 145 150 155 160 Gly Gly Arg Asn Val Glu Gly Phe Gly Ser Asp Pro Tyr Leu Ala Gly 165 170 175 Leu Ala Leu Ala Asp Thr Val Thr Gly Ile Gln Asn Ala Gly Thr Ile 180 185 190 Ala Cys Ala Lys His Phe Leu Leu Asn Glu Gln Glu His Phe Arg Gln 195 200 205 Val Gly Glu Ala Asn Gly Tyr Gly Tyr Pro Ile Thr Glu Ala Leu Ser 210 215 220 Ser Asn Val Asp Asp Lys Thr Ile His Glu Val Tyr Gly Trp Pro Phe 225 230 235 240 Gln Asp Ala Val Lys Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Asn 245 250 255 Gln Val Asn Asn Ser Tyr Ala Cys Gln Asn Ser Lys Leu Ile Asn Gly 260 265 270 Leu Leu Lys Glu Glu Tyr Gly Phe Gln Gly Phe Val Met Ser Asp Trp 275 280 285 Gln Ala Gln His Thr Gly Val Ala Ser Ala Val Ala Gly Leu Asp Met 290 295 300 Thr Met Pro Gly Asp Thr Ala Phe Asn Thr Gly Ala Ser Tyr Phe Gly 305 310 315 320 Ser Asn Leu Thr Leu Ala Val Leu Asn Gly Thr Val Pro Glu Trp Arg 325 330 335 Ile Asp Asp Met Val Met Arg Ile Met Ala Pro Phe Phe Lys Val Gly 340 345 350 Lys Thr Val Asp Ser Leu Ile Asp Thr Asn Phe Asp Ser Trp Thr Asn 355 360 365 Gly Glu Tyr Gly Tyr Val Gln Ala Ala Val Asn Glu Asn Trp Glu Lys 370 375 380 Val Asn Tyr Gly Val Asp Val Arg Ala Asn His Ala Asn His Ile Arg 385 390 395 400 Glu Val Gly Ala Lys Gly Thr Val Ile Phe Lys Asn Asn Gly Ile Leu 405 410 415 Pro Leu Lys Lys Pro Lys Phe Leu Thr Val Ile Gly Glu Asp Ala Gly 420 425 430 Gly Asn Pro Ala Gly Pro Asn Gly Cys Gly Asp Arg Gly Cys Asp Asp 435 440 445 Gly Thr Leu Ala Met Glu Trp Gly Ser Gly Thr Thr Asn Phe Pro Tyr 450 455 460 Leu Val Thr Pro Asp Ala Ala Leu Gln Ser Gln Ala Leu Gln Asp Gly 465 470 475 480 Thr Arg Tyr Glu Ser Ile Leu Ser Asn Tyr Ala Ile Ser Gln Thr Gln 485 490 495 Ala Leu Val Ser Gln Pro Asp Ala Ile Ala Ile Val Phe Ala Asn Ser 500 505 510 Asp Ser Gly Glu Gly Tyr Ile Asn Val Asp Gly Asn Glu Gly Asp Arg 515 520 525 Lys Asn Leu Thr Leu Trp Lys Asn Gly Asp Asp Leu Ile Lys Thr Val 530 535 540 Ala Ala Val Asn Pro Lys Thr Ile Val Val Ile His Ser Thr Gly Pro 545 550 555 560 Val Ile Leu Lys Asp Tyr Ala Asn His Pro Asn Ile Ser Ala Ile Leu 565 570 575 Trp Ala Gly Ala Pro Gly Gln Glu Ser Gly Asn Ser Leu Val Asp Ile 580 585 590 Leu Tyr Gly Lys Gln Ser Pro Gly Arg Thr Pro Phe Thr Trp Gly Pro 595 600 605 Ser Leu Glu Ser Tyr Gly Val Ser Val Met Thr Thr Pro Asn Asn Gly 610 615 620 Asn Gly Ala Pro Gln Asp Asn Phe Asn Glu Gly Ala Phe Ile Asp Tyr 625 630 635 640 Arg Tyr Phe Asp Lys Val Ala Pro Gly Lys Pro Arg Ser Ser Asp Lys 645 650 655 Ala Pro Thr Tyr Glu Phe Gly Phe Gly Leu Ser Trp Ser Thr Phe Lys 660 665 670 Phe Ser Asn Leu His Ile Gln Lys Asn Asn Val Gly Pro Met Ser Pro 675 680 685 Pro Asn Gly Lys Thr Ile Ala Ala Pro Ser Leu Gly Ser Phe Ser Lys 690 695 700 Asn Leu Lys Asp Tyr Gly Phe Pro Lys Asn Val Arg Arg Ile Lys Glu 705 710 715 720 Phe Ile Tyr Pro Tyr Leu Ser Thr Thr Thr Ser Gly Lys Glu Ala Ser 725 730 735 Gly Asp Ala His Tyr Gly Gln Thr Ala Lys Glu Phe Leu Pro Ala Gly 740 745 750 Ala Leu Asp Gly Ser Pro Gln Pro Arg Ser Ala Ala Ser Gly Glu Pro 755 760 765 Gly Gly Asn Arg Gln Leu Tyr Asp Ile Leu Tyr Thr Val Thr Ala Thr 770 775 780 Ile Thr Asn Thr Gly Ser Val Met Asp Asp Ala Val Pro Gln Leu Tyr 785 790 795 800 Leu Ser His Gly Gly Pro Asn Glu Pro Pro Lys Val Leu Arg Gly Phe 805 810 815 Asp Arg Ile Glu Arg Ile Ala Pro Gly Gln Ser Val Thr Phe Lys Ala 820 825 830 Asp Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Thr Lys Lys Gln Gln 835 840 845 Trp Val Ile Thr Asp Tyr Pro Lys Thr Val Tyr Val Gly Ser Ser Ser 850 855 860 Arg Asp Leu Pro Leu Ser Ala Arg Leu Pro 865 870 <210> 105 <211> 2577 <212> DNA <213> Artificial Sequence <220> <223> synthetic codon optimized nucleotide sequence <400> 105 atgcgcaacg gcctcctcaa ggtcgccgcc ttagccgctg ccagcgccgt caacggcgag 60 aacctcgcct acagcccccc cttctacccc agcccctggg ccaacggcca gggcgactgg 120 gccgaggcct accagaaggc cgtccagttc gtcagccagc tcaccctcgc cgagaaggtc 180 aacctcacca ccggcaccgg ctgggagcag gaccgctgcg tcggccaggt cggcagcatc 240 ccccgcttag gcttccccgg cctctgcatg caggacagcc ccctcggcgt ccgcgacacc 300 gactacaaca gcgccttccc tgccggcgtt aacgtcgccg ccacctggga ccgcaactta 360 gcctaccgca gaggcgtcgc catgggcgag gaacaccgcg gcaagggcgt cgacgtccag 420 ttaggccccg tcgccggccc cttaggccgc tctcctgatg ccggccgcaa ctgggagggc 480 ttcgcccccg accccgtcct caccggcaac atgatggcca gcaccatcca gggcatccag 540 gatgctggcg tcattgcctg cgccaagcac ttcatcctct acgagcagga acacttccgc 600 cagggcgccc aggacggcta cgacatcagc gacagcatca gcgccaacgc cgacgacaag 660 accatgcacg agttatacct ctggcccttc gccgatgccg tccgcgccgg tgtcggcagc 720 gtcatgtgca gctacaacca ggtcaacaac agctacgcct gcagcaacag ctacaccatg 780 aacaagctcc tcaagagcga gttaggcttc cagggcttcg tcatgaccga ctggggcggc 840 caccacagcg gcgtcggctc tgccctcgcc ggcctcgaca tgagcatgcc cggcgacatt 900 gccttcgaca gcggcacgtc tttctggggc accaacctca ccgttgccgt cctcaacggc 960 tccatccccg agtggcgcgt cgacgacatg gccgtccgca tcatgagcgc ctactacaag 1020 gtcggccgcg accgctacag cgtccccatc aacttcgaca gctggaccct cgacacctac 1080 ggccccgagc actacgccgt cggccagggc cagaccaaga tcaacgagca cgtcgacgtc 1140 cgcggcaacc acgccgagat catccacgag atcggcgccg cctccgccgt cctcctcaag 1200 aacaagggcg gcctccccct cactggcacc gagcgcttcg tcggtgtctt tggcaaggat 1260 gctggcagca acccctgggg cgtcaacggc tgcagcgacc gcggctgcga caacggcacc 1320 ctcgccatgg gctggggcag cggcaccgcc aactttccct acctcgtcac ccccgagcag 1380 gccatccagc gcgaggtcct cagccgcaac ggcaccttca ccggcatcac cgacaacggc 1440 gccttagccg agatggccgc tgccgcctct caggccgaca cctgcctcgt ctttgccaac 1500 gccgactccg gcgagggcta catcaccgtc gatggcaacg agggcgaccg caagaacctc 1560 accctctggc agggcgccga ccaggtcatc cacaacgtca gcgccaactg caacaacacc 1620 gtcgtcgtct tacacaccgt cggccccgtc ctcatcgacg actggtacga ccaccccaac 1680 gtcaccgcca tcctctgggc cggtttaccc ggtcaggaaa gcggcaacag cctcgtcgac 1740 gtcctctacg gccgcgtcaa ccccggcaag acccccttca cctggggcag agcccgcgac 1800 gactatggcg cccctctcat cgtcaagcct aacaacggca agggcgcccc ccagcaggac 1860 ttcaccgagg gcatcttcat cgactaccgc cgcttcgaca agtacaacat cacccccatc 1920 tacgagttcg gcttcggcct cagctacacc accttcgagt tcagccagtt aaacgtccag 1980 cccatcaacg cccctcccta cacccccgcc agcggcttta cgaaggccgc ccagagcttc 2040 ggccagccct ccaatgccag cgacaacctc taccctagcg acatcgagcg cgtccccctc 2100 tacatctacc cctggctcaa cagcaccgac ctcaaggcca gcgccaacga ccccgactac 2160 ggcctcccca ccgagaagta cgtccccccc aacgccacca acggcgaccc ccagcccatt 2220 gaccctgccg gcggtgcccc tggcggcaac cccagcctct acgagcccgt cgcccgcgtc 2280 accaccatca tcaccaacac cggcaaggtc accggcgacg aggtccccca gctctatgtc 2340 agcttaggcg gccctgacga cgcccccaag gtcctccgcg gcttcgaccg catcaccctc 2400 gcccctggcc agcagtacct ctggaccacc accctcactc gccgcgacat cagcaactgg 2460 gaccccgtca cccagaactg ggtcgtcacc aactacacca agaccatcta cgtcggcaac 2520 agcagccgca acctccccct ccaggccccc ctcaagccct accccggcat ctgatga 2577 <210> 106 <211> 857 <212> PRT <213> Talaromyces emersonii <400> 106 Met Arg Asn Gly Leu Leu Lys Val Ala Ala Leu Ala Ala Ala Ser Ala 1 5 10 15 Val Asn Gly Glu Asn Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro 20 25 30 Trp Ala Asn Gly Gln Gly Asp Trp Ala Glu Ala Tyr Gln Lys Ala Val 35 40 45 Gln Phe Val Ser Gln Leu Thr Leu Ala Glu Lys Val Asn Leu Thr Thr 50 55 60 Gly Thr Gly Trp Glu Gln Asp Arg Cys Val Gly Gln Val Gly Ser Ile 65 70 75 80 Pro Arg Leu Gly Phe Pro Gly Leu Cys Met Gln Asp Ser Pro Leu Gly 85 90 95 Val Arg Asp Thr Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val 100 105 110 Ala Ala Thr Trp Asp Arg Asn Leu Ala Tyr Arg Arg Gly Val Ala Met 115 120 125 Gly Glu Glu His Arg Gly Lys Gly Val Asp Val Gln Leu Gly Pro Val 130 135 140 Ala Gly Pro Leu Gly Arg Ser Pro Asp Ala Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Ala Pro Asp Pro Val Leu Thr Gly Asn Met Met Ala Ser Thr Ile 165 170 175 Gln Gly Ile Gln Asp Ala Gly Val Ile Ala Cys Ala Lys His Phe Ile 180 185 190 Leu Tyr Glu Gln Glu His Phe Arg Gln Gly Ala Gln Asp Gly Tyr Asp 195 200 205 Ile Ser Asp Ser Ile Ser Ala Asn Ala Asp Asp Lys Thr Met His Glu 210 215 220 Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ser 225 230 235 240 Val Met Cys Ser Tyr Asn Gln Val Asn Asn Ser Tyr Ala Cys Ser Asn 245 250 255 Ser Tyr Thr Met Asn Lys Leu Leu Lys Ser Glu Leu Gly Phe Gln Gly 260 265 270 Phe Val Met Thr Asp Trp Gly Gly His His Ser Gly Val Gly Ser Ala 275 280 285 Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Ala Phe Asp Ser 290 295 300 Gly Thr Ser Phe Trp Gly Thr Asn Leu Thr Val Ala Val Leu Asn Gly 305 310 315 320 Ser Ile Pro Glu Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ser 325 330 335 Ala Tyr Tyr Lys Val Gly Arg Asp Arg Tyr Ser Val Pro Ile Asn Phe 340 345 350 Asp Ser Trp Thr Leu Asp Thr Tyr Gly Pro Glu His Tyr Ala Val Gly 355 360 365 Gln Gly Gln Thr Lys Ile Asn Glu His Val Asp Val Arg Gly Asn His 370 375 380 Ala Glu Ile Ile His Glu Ile Gly Ala Ala Ser Ala Val Leu Leu Lys 385 390 395 400 Asn Lys Gly Gly Leu Pro Leu Thr Gly Thr Glu Arg Phe Val Gly Val 405 410 415 Phe Gly Lys Asp Ala Gly Ser Asn Pro Trp Gly Val Asn Gly Cys Ser 420 425 430 Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly Trp Gly Ser Gly 435 440 445 Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln Arg 450 455 460 Glu Val Leu Ser Arg Asn Gly Thr Phe Thr Gly Ile Thr Asp Asn Gly 465 470 475 480 Ala Leu Ala Glu Met Ala Ala Ala Ala Ser Gln Ala Asp Thr Cys Leu 485 490 495 Val Phe Ala Asn Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Asp Gly 500 505 510 Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp Gln Gly Ala Asp Gln 515 520 525 Val Ile His Asn Val Ser Ala Asn Cys Asn Asn Thr Val Val Val Leu 530 535 540 His Thr Val Gly Pro Val Leu Ile Asp Asp Trp Tyr Asp His Pro Asn 545 550 555 560 Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly Asn 565 570 575 Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Lys Thr Pro 580 585 590 Phe Thr Trp Gly Arg Ala Arg Asp Asp Tyr Gly Ala Pro Leu Ile Val 595 600 605 Lys Pro Asn Asn Gly Lys Gly Ala Pro Gln Gln Asp Phe Thr Glu Gly 610 615 620 Ile Phe Ile Asp Tyr Arg Arg Phe Asp Lys Tyr Asn Ile Thr Pro Ile 625 630 635 640 Tyr Glu Phe Gly Phe Gly Leu Ser Tyr Thr Thr Phe Glu Phe Ser Gln 645 650 655 Leu Asn Val Gln Pro Ile Asn Ala Pro Pro Tyr Thr Pro Ala Ser Gly 660 665 670 Phe Thr Lys Ala Ala Gln Ser Phe Gly Gln Pro Ser Asn Ala Ser Asp 675 680 685 Asn Leu Tyr Pro Ser Asp Ile Glu Arg Val Pro Leu Tyr Ile Tyr Pro 690 695 700 Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ala Asn Asp Pro Asp Tyr 705 710 715 720 Gly Leu Pro Thr Glu Lys Tyr Val Pro Pro Asn Ala Thr Asn Gly Asp 725 730 735 Pro Gln Pro Ile Asp Pro Ala Gly Gly Ala Pro Gly Gly Asn Pro Ser 740 745 750 Leu Tyr Glu Pro Val Ala Arg Val Thr Thr Ile Ile Thr Asn Thr Gly 755 760 765 Lys Val Thr Gly Asp Glu Val Pro Gln Leu Tyr Val Ser Leu Gly Gly 770 775 780 Pro Asp Asp Ala Pro Lys Val Leu Arg Gly Phe Asp Arg Ile Thr Leu 785 790 795 800 Ala Pro Gly Gln Gln Tyr Leu Trp Thr Thr Thr Leu Thr Arg Arg Asp 805 810 815 Ile Ser Asn Trp Asp Pro Val Thr Gln Asn Trp Val Val Thr Asn Tyr 820 825 830 Thr Lys Thr Ile Tyr Val Gly Asn Ser Ser Arg Asn Leu Pro Leu Gln 835 840 845 Ala Pro Leu Lys Pro Tyr Pro Gly Ile 850 855 <210> 107 <211> 2586 <212> DNA <213> Aspergillus niger <400> 107 atgcgcttca ccagcatcga ggccgtcgcc ctcaccgccg tcagcctcgc cagcgccgac 60 gagttagcct acagcccccc ctactacccc agcccctggg ccaacggcca gggcgactgg 120 gccgaggcct accagcgcgc cgtcgacatc gtcagccaga tgaccctcgc cgagaaggtc 180 aacctcacca ccggcaccgg ctgggagtta gagttatgcg tcggccagac tggtggcgtc 240 ccccgcctcg gcatccccgg catgtgcgcc caggacagcc ccctcggcgt ccgcgacagc 300 gactacaaca gcgccttccc tgccggcgtc aacgtcgccg ccacctggga caagaacctc 360 gcctacctcc gcggccaggc catgggccag gaattcagcg acaagggcgc cgacatccag 420 ttaggccccg ctgccggccc tttaggccgc tctcccgacg gcggcagaaa ctgggagggc 480 ttcagccccg accccgctct cagcggcgtc ctcttcgccg agactatcaa gggcatccag 540 gatgctggcg tcgtcgccac cgccaagcac tacattgcct acgagcagga acacttccgc 600 caggcccccg aggcccaggg ctacggcttc aacatcaccg agagcggcag cgccaacctc 660 gacgacaaga ccatgcacga gttatacctc tggcccttcg ccgacgccat tagagctggc 720 gctggtgctg tcatgtgcag ctacaaccag atcaacaaca gctacggctg ccagaacagc 780 tacaccctca acaagctcct caaggccgag ttaggcttcc agggcttcgt catgtccgac 840 tgggccgccc accacgccgg cgtcagcggc gccttagccg gcctcgacat gagcatgccc 900 ggcgacgtcg actacgacag cggcaccagc tactggggca ccaacctcac catcagcgtc 960 ctcaacggca ccgtccccca gtggcgcgtc gacgacatgg ccgtccgcat catggccgcc 1020 tactacaagg tcggccgcga ccgcctctgg acccccccca acttcagcag ctggacccgc 1080 gacgagtacg gcttcaagta ctactacgtc agcgagggcc cctatgagaa ggtcaaccag 1140 ttcgtcaacg tccagcgcaa ccacagcgag ttaatccgcc gcatcggcgc cgacagcacc 1200 gtcctcctca agaacgacgg cgccctcccc ctcaccggca aggaacgcct cgtcgccctc 1260 atcggcgagg acgccggcag caacccctac ggcgccaacg gctgcagcga ccgcggctgc 1320 gacaacggca ccctcgccat gggctggggc agcggcaccg ccaacttccc ttacctcgtc 1380 acccccgagc aggccatcag caacgaggtc ctcaagaaca agaacggcgt ctttaccgcc 1440 accgacaact gggccatcga ccagatcgag gccttagcca agaccgcctc tgtcagcctc 1500 gtctttgtca acgccgacag cggcgagggc tacatcaacg tcgacggcaa cctcggcgac 1560 cgccgcaacc tcaccctctg gcgcaacggc gacaacgtca tcaaggccgc cgccagcaac 1620 tgcaacaaca ccatcgtcat catccacagc gtcggccccg tcctcgtcaa cgagtggtac 1680 gacaacccca acgtcaccgc catcctctgg ggcggcttac ccggccagga aagcggcaac 1740 agcctcgccg acgtcctcta cggccgcgtc aaccctggcg ccaagagccc cttcacctgg 1800 ggcaagaccc gcgaggccta tcaggactac ctctacaccg agcccaacaa cggcaacggc 1860 gccccccagg aagatttcgt cgagggcgtc tttatcgact accgcggctt tgacaagcgc 1920 aacgagactc ccatctacga gttcggctac ggcctcagct acaccacctt caactacagc 1980 aacctccagg tcgaggtcct cagcgcccct gcctacgagc ccgccagcgg cgagactgag 2040 gccgccccca ccttcggcga ggtcggcaac gccagcgact acttataccc cgacggcctc 2100 cagcgcatca ccaagttcat ctacccctgg ctcaacagca ccgacctcga ggccagcagc 2160 ggcgacgcct cttacggcca ggacgcctcc gactacctcc ccgagggtgc caccgacggc 2220 agcgctcagc ccatcttacc tgccggtggc ggtgctggcg gcaaccccag actctacgac 2280 gagctgatcc gcgtcagcgt caccatcaag aacaccggca aggtcgctgg tgacgaggtc 2340 ccccagctct acgtcagctt aggcggccct aacgagccca agatcgtcct ccgccagttc 2400 gagcgcatca ccctccagcc cagcaaggaa actcagtgga gcaccaccct cactcgccgc 2460 gacctcgcca actggaacgt cgagactcag gactgggaga tcaccagcta ccccaagatg 2520 gtctttgccg gcagcagcag ccgcaagctc cccctccgcg ccagcctccc caccgtccac 2580 tgatga 2586 <210> 108 <211> 860 <212> PRT <213> Aspergillus niger <400> 108 Met Arg Phe Thr Ser Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu 1 5 10 15 Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro 20 25 30 Trp Ala Asn Gly Gln Gly Asp Trp Ala Glu Ala Tyr Gln Arg Ala Val 35 40 45 Asp Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr 50 55 60 Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val 65 70 75 80 Pro Arg Leu Gly Ile Pro Gly Met Cys Ala Gln Asp Ser Pro Leu Gly 85 90 95 Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val 100 105 110 Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met 115 120 125 Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala 130 135 140 Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile 165 170 175 Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile 180 185 190 Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Tyr 195 200 205 Gly Phe Asn Ile Thr Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr 210 215 220 Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly 225 230 235 240 Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly 245 250 255 Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly 260 265 270 Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val 275 280 285 Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp 290 295 300 Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val 305 310 315 320 Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg 325 330 335 Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro 340 345 350 Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Tyr 355 360 365 Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Phe Val Asn Val 370 375 380 Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr 385 390 395 400 Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg 405 410 415 Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala 420 425 430 Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly 435 440 445 Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln 450 455 460 Ala Ile Ser Asn Glu Val Leu Lys Asn Lys Asn Gly Val Phe Thr Ala 465 470 475 480 Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala 485 490 495 Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile 500 505 510 Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg 515 520 525 Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr 530 535 540 Ile Val Ile Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr 545 550 555 560 Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln 565 570 575 Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro 580 585 590 Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln 595 600 605 Asp Tyr Leu Tyr Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu 610 615 620 Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg 625 630 635 640 Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr 645 650 655 Phe Asn Tyr Ser Asn Leu Gln Val Glu Val Leu Ser Ala Pro Ala Tyr 660 665 670 Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val 675 680 685 Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Asp Gly Leu Gln Arg Ile Thr 690 695 700 Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu Ala Ser Ser 705 710 715 720 Gly Asp Ala Ser Tyr Gly Gln Asp Ala Ser Asp Tyr Leu Pro Glu Gly 725 730 735 Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Ala 740 745 750 Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr 755 760 765 Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr 770 775 780 Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe 785 790 795 800 Glu Arg Ile Thr Leu Gln Pro Ser Lys Glu Thr Gln Trp Ser Thr Thr 805 810 815 Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Thr Gln Asp Trp 820 825 830 Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Ala Gly Ser Ser Ser Arg 835 840 845 Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His 850 855 860 <210> 109 <211> 3203 <212> DNA <213> Fusarium oxysporum <400> 109 atgaagctga actgggtcgc cgcagccctc tctataggtg ctgctggcac tgatggtgca 60 gttgctcttg cttctgaagt tccaggcact ttggctggtg taaaggtcgg tttttttacc 120 atttcctcac ctaatctcag ccttgttgcc atatcgccct tattcgctcg gacgctacgc 180 accaaatcgc gatcatttcc tcccttgcag ccttgttttc ttttttcgat cttccctccg 240 caatcgccag cacccttagc ctacacaaaa acccccgaga cagtctcatt gagtttgtcg 300 acatcaagtt gcttctcaag tgtgcatttg cgtggctgtc tacttctgcc tctagaccac 360 caaatctggg cgcaattgat cgctcaaacc ttgttcgaat aagcctttta ttcgagacgt 420 ccaattttta cagagaatgt acctttcaat aataccgacg ttatgcgcgg cggtggctgc 480 tgtgatggtt gttgatcaga atactgacgc tcaaaaggtt gtcacgagag atacactcgc 540 acactcacct cctcactatc cttcaccatg gatggatcct aatgccattg gctgggagga 600 agcttacgcc aaagcaaaga actttgtgtc ccagctcact ctcctcgaaa aggtcaactt 660 gaccactggt gttgggtaag tagctccttg cgaacagtgc atctcggtct ccttgactaa 720 cgactctctc aggtggcaag gcgaacgctg tgtaggaaac gtgggatcaa ttcctcgtct 780 tggtatgcga ggtctttgtc ttcaggatgg tcctcttgga attcgtctgt ccgattacaa 840 cagtgctttt cccgctggca ccacagctgg tgcttcttgg agcaagtctc tctggtatga 900 gaggggtctt ctgatgggaa ctgagttcaa ggggaagggt atcgatatcg ctcttggccc 960 tgctactggt cctcttggcc gcactgctgc tggtggacga aactgggagg gctttaccgt 1020 tgatccttat atggctggcc atgccatggc cgaggccgtc aagggcatcc aagacgcagg 1080 tgtcattgct tgtgctaagc attacatcgc aaacgagcaa ggtaagccaa ttggacggtt 1140 tgggaaatcg acagagaact gacccccttg tagagcactt ccgacagagt ggcgaggtcc 1200 agtcccgcaa gtacaacatc tccgagtctc tctcctccaa cctggacgac aagactttgc 1260 acgagctcta cgcctggccc tttgctgatg ccgtccgcgc tggcgtcggt tcagtcatgt 1320 gctcttacaa tcagatcaac aactcgtacg gttgccagaa ctccaagctc ctcaacggta 1380 tcctcaagga cgagatgggt ttccagggct tcgtcatgag cgattgggcg gcccagcaca 1440 ccggtgctgc ttctgccgtc gctggtcttg atatgagcat gcctggtgac accgcgttcg 1500 acagtggata tagcttctgg ggtggaaacc tgactcttgc tgtcatcaac ggaactgttc 1560 ccgcctggcg agttgatgac atggctctgc gaatcatgtc ggccttcttc aaggttggaa 1620 agacggtaga ggacctcccc gacatcaact tctcctcctg gacccgcgac accttcggct 1680 tcgtccaaac atttgctcaa gagaaccgcg aacaagtcaa ctttggagtt aacgtccagc 1740 acgaccacaa gaaccacatc cgtgagtctg ccgccaaggg aagcgtcatc ctcaagaaca 1800 ccggctccct tcccctcaac aatcccaagt tcctcgctgt cattggtgag gacgccggtc 1860 ccaaccctgc tggacccaat ggttgcggcg accgtggttg cgacaatggt accctggcta 1920 tggcttgggg ctcgggaact tctcaattcc cttacttgat cacacccgac caaggtctcc 1980 agaaccgagc tgcccaagac ggaactcgat atgagagcat cttgaccaac aacgaatggg 2040 cccagacaca ggctcttgtc agccaaccca acgtgaccgc tatcgttttt gccaacgccg 2100 actctggtga gggttacatt gaagtcgacg gaaacttcgg tgatcgcaag aacctcaccc 2160 tctggcaaca gggagacgag ctcatcaaga acgtctcgtc catctgcccc aacaccattg 2220 tcgttctgca taccgtcggc cctgtcctgc tcgccgacta cgagaagaac cccaacatca 2280 ccgccatcgt ctgggctggt cttcccggcc aagagtctgg caatgccatc gctgatctcc 2340 tctacggcaa ggtaagccct ggccgatctc ccttcacttg gggccgcacc cgtgagagct 2400 acggtaccga ggttctttat gaggcgaaca acggccgtgg cgctcctcag gatgacttct 2460 cggagggtgt cttcattgac taccgtcact ttgatcgacg atctcccagc accgatggca 2520 agagcgctcc caacaacacc gctgctcctc tctacgagtt cggtcatggt ctgtcttgga 2580 ctacctttga gtattcagac ctcaacatcc agaagaacgt taactccacc tactctcctc 2640 ctgctggtca gaccattcct gccccaacct ttggcaactt cagcaagaac ctcaacgact 2700 acgtgttccc taagggtgtc cgatacatct acaagttcat ctaccccttc ctgaacactt 2760 cctcatccgc cagcgaggca tctaacgacg gcggccagtt tggtaagact gccgaagagt 2820 tcctacctcc aaacgccctc aacggctcag cccagcctcg tcttccctct tctggtgccc 2880 caggcggtaa ccctcaattg tgggatatcc tgtacaccgt cacagccaca atcaccaaca 2940 caggcaacgc cacctccgac gagattcccc agctgtatgt cagcctcggt ggcgagaacg 3000 aacccgttcg tgtcctccgc ggtttcgacc gtatcgagaa cattgctccc ggccagagcg 3060 ccatcttcaa cgctcaattg acccgtcgcg atctgagcaa ctgggatgtg gatgcccaga 3120 actgggttat caccgaccat ccaaagacgg tgtgggttgg aagtagttct cgcaagctgc 3180 ctctcagcgc caagttggaa taa 3203 <210> 110 <211> 899 <212> PRT <213> Fusarium oxysporum <400> 110 Met Lys Leu Asn Trp Val Ala Ala Ala Leu Ser Ile Gly Ala Ala Gly 1 5 10 15 Thr Asp Gly Ala Val Ala Leu Ala Ser Glu Val Pro Gly Thr Leu Ala 20 25 30 Gly Val Lys Asn Thr Asp Ala Gln Lys Val Val Thr Arg Asp Thr Leu 35 40 45 Ala His Ser Pro Pro His Tyr Pro Ser Pro Trp Met Asp Pro Asn Ala 50 55 60 Ile Gly Trp Glu Glu Ala Tyr Ala Lys Ala Lys Asn Phe Val Ser Gln 65 70 75 80 Leu Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly Val Gly Trp Gln 85 90 95 Gly Glu Arg Cys Val Gly Asn Val Gly Ser Ile Pro Arg Leu Gly Met 100 105 110 Arg Gly Leu Cys Leu Gln Asp Gly Pro Leu Gly Ile Arg Leu Ser Asp 115 120 125 Tyr Asn Ser Ala Phe Pro Ala Gly Thr Thr Ala Gly Ala Ser Trp Ser 130 135 140 Lys Ser Leu Trp Tyr Glu Arg Gly Leu Leu Met Gly Thr Glu Phe Lys 145 150 155 160 Gly Lys Gly Ile Asp Ile Ala Leu Gly Pro Ala Thr Gly Pro Leu Gly 165 170 175 Arg Thr Ala Ala Gly Gly Arg Asn Trp Glu Gly Phe Thr Val Asp Pro 180 185 190 Tyr Met Ala Gly His Ala Met Ala Glu Ala Val Lys Gly Ile Gln Asp 195 200 205 Ala Gly Val Ile Ala Cys Ala Lys His Tyr Ile Ala Asn Glu Gln Glu 210 215 220 His Phe Arg Gln Ser Gly Glu Val Gln Ser Arg Lys Tyr Asn Ile Ser 225 230 235 240 Glu Ser Leu Ser Ser Asn Leu Asp Asp Lys Thr Leu His Glu Leu Tyr 245 250 255 Ala Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ser Val Met 260 265 270 Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Gln Asn Ser Lys 275 280 285 Leu Leu Asn Gly Ile Leu Lys Asp Glu Met Gly Phe Gln Gly Phe Val 290 295 300 Met Ser Asp Trp Ala Ala Gln His Thr Gly Ala Ala Ser Ala Val Ala 305 310 315 320 Gly Leu Asp Met Ser Met Pro Gly Asp Thr Ala Phe Asp Ser Gly Tyr 325 330 335 Ser Phe Trp Gly Gly Asn Leu Thr Leu Ala Val Ile Asn Gly Thr Val 340 345 350 Pro Ala Trp Arg Val Asp Asp Met Ala Leu Arg Ile Met Ser Ala Phe 355 360 365 Phe Lys Val Gly Lys Thr Val Glu Asp Leu Pro Asp Ile Asn Phe Ser 370 375 380 Ser Trp Thr Arg Asp Thr Phe Gly Phe Val Gln Thr Phe Ala Gln Glu 385 390 395 400 Asn Arg Glu Gln Val Asn Phe Gly Val Asn Val Gln His Asp His Lys 405 410 415 Asn His Ile Arg Glu Ser Ala Ala Lys Gly Ser Val Ile Leu Lys Asn 420 425 430 Thr Gly Ser Leu Pro Leu Asn Asn Pro Lys Phe Leu Ala Val Ile Gly 435 440 445 Glu Asp Ala Gly Pro Asn Pro Ala Gly Pro Asn Gly Cys Gly Asp Arg 450 455 460 Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser Gly Thr Ser 465 470 475 480 Gln Phe Pro Tyr Leu Ile Thr Pro Asp Gln Gly Leu Gln Asn Arg Ala 485 490 495 Ala Gln Asp Gly Thr Arg Tyr Glu Ser Ile Leu Thr Asn Asn Glu Trp 500 505 510 Ala Gln Thr Gln Ala Leu Val Ser Gln Pro Asn Val Thr Ala Ile Val 515 520 525 Phe Ala Asn Ala Asp Ser Gly Glu Gly Tyr Ile Glu Val Asp Gly Asn 530 535 540 Phe Gly Asp Arg Lys Asn Leu Thr Leu Trp Gln Gln Gly Asp Glu Leu 545 550 555 560 Ile Lys Asn Val Ser Ser Ile Cys Pro Asn Thr Ile Val Val Leu His 565 570 575 Thr Val Gly Pro Val Leu Leu Ala Asp Tyr Glu Lys Asn Pro Asn Ile 580 585 590 Thr Ala Ile Val Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly Asn Ala 595 600 605 Ile Ala Asp Leu Leu Tyr Gly Lys Val Ser Pro Gly Arg Ser Pro Phe 610 615 620 Thr Trp Gly Arg Thr Arg Glu Ser Tyr Gly Thr Glu Val Leu Tyr Glu 625 630 635 640 Ala Asn Asn Gly Arg Gly Ala Pro Gln Asp Asp Phe Ser Glu Gly Val 645 650 655 Phe Ile Asp Tyr Arg His Phe Asp Arg Arg Ser Pro Ser Thr Asp Gly 660 665 670 Lys Ser Ala Pro Asn Asn Thr Ala Ala Pro Leu Tyr Glu Phe Gly His 675 680 685 Gly Leu Ser Trp Thr Thr Phe Glu Tyr Ser Asp Leu Asn Ile Gln Lys 690 695 700 Asn Val Asn Ser Thr Tyr Ser Pro Pro Ala Gly Gln Thr Ile Pro Ala 705 710 715 720 Pro Thr Phe Gly Asn Phe Ser Lys Asn Leu Asn Asp Tyr Val Phe Pro 725 730 735 Lys Gly Val Arg Tyr Ile Tyr Lys Phe Ile Tyr Pro Phe Leu Asn Thr 740 745 750 Ser Ser Ser Ala Ser Glu Ala Ser Asn Asp Gly Gly Gln Phe Gly Lys 755 760 765 Thr Ala Glu Glu Phe Leu Pro Pro Asn Ala Leu Asn Gly Ser Ala Gln 770 775 780 Pro Arg Leu Pro Ser Ser Gly Ala Pro Gly Gly Asn Pro Gln Leu Trp 785 790 795 800 Asp Ile Leu Tyr Thr Val Thr Ala Thr Ile Thr Asn Thr Gly Asn Ala 805 810 815 Thr Ser Asp Glu Ile Pro Gln Leu Tyr Val Ser Leu Gly Gly Glu Asn 820 825 830 Glu Pro Val Arg Val Leu Arg Gly Phe Asp Arg Ile Glu Asn Ile Ala 835 840 845 Pro Gly Gln Ser Ala Ile Phe Asn Ala Gln Leu Thr Arg Arg Asp Leu 850 855 860 Ser Asn Trp Asp Val Asp Ala Gln Asn Trp Val Ile Thr Asp His Pro 865 870 875 880 Lys Thr Val Trp Val Gly Ser Ser Ser Arg Lys Leu Pro Leu Ser Ala 885 890 895 Lys Leu Glu <210> 111 <211> 3134 <212> DNA <213> Gibberella zeae <400> 111 atgaaggcca attggcttgc cgcggccgtt tatttggctg ctggcaccga tgctgcagtc 60 cctgacactt tggcaggagt caatgtaagc tactcttcaa tttcatctca tctcaacttt 120 gccaggccac aacaactttt cttcactcac gatcttttca ccataaacgc aacagtttca 180 caaaaaataa agcccaaatc atgtctctga tcgttgaact cgccatcttc gtttacatcg 240 cggttgtctt tttcttcttg tacttctcat tcgttgttgt tctctacatt ttcgactggc 300 tgtttagcct tgagattctt ctcactcccc gtgatgccta gatcactctc tgaggcgttt 360 aatctacttg tagagatgcg cctctcattt gttgtgtcgc tagtcgcgat agttgctgga 420 attgcagtcc ttgatcttcc tactgacact caaaagctcg ttgcgcggga cacactcgct 480 cactctcctc ctcactatcc ctcgccatgg atggacccta acgctgtcgg ctgggaggac 540 gcctacgcca aggccaagga ctttgtctcc cagatgactc tcctagaaaa ggtcaacttg 600 accactggtg ttgggtaagt aacgagcgac aagacgtcta caatccacta acacgatctc 660 tagatggcag ggcgaacgtt gtgttggaaa cgtgggatct atccctcgtc tcggtatgcg 720 aggcctctgt ctccaggatg gtcctctcgg aattcgcttc tccgactaca acagcgcttt 780 ccctactggt gtcaccgctg gtgcttcttg gagtaaggcc ctttggtacg agcgaggacg 840 attgatgggt accgagttta aggagaaggg tatcgatatt gctctcggcc ctgcaactgg 900 tcctctcggt cgccacgctg ctggtggacg aaactgggaa ggcttcactg tcgaccccta 960 cgccgctggc catgctatgg ctgagactgt caagggtatc caagattctg gagtcattgc 1020 ttgtgctaag cattacatcg caaacgagca aggtatgtac aggcccattc aatggcttca 1080 ggaacgaaaa ctaactctta atagaacact tccgtcaacg aggcgatgtc atgtctcaaa 1140 agttcaacat ttccgagtct ctgtcttcca accttgacga taagactatg cacgagctct 1200 acaactggcc tttcgccgac gccgtccgcg ccggtgttgg ctccattatg tgctcttaca 1260 accaggtcaa caactcatat gcttgccaga actccaagct cctcaacggc atcctcaagg 1320 acgagatggg tttccagggt ttcgtcatga gcgattggca ggctcagcac accggtgccg 1380 cctccgctgt tgccggtctt gacatgacca tgcctggtga caccgagttc aacactggct 1440 tcagcttctg gggtggaaac ctgaccctcg ctgttatcaa cggtactgtt cccgcctgga 1500 gaatcgacga catggctacc cgaattatgg ctgctttctt caaggttggc cgatctgttg 1560 aggaggaacc cgacatcaac ttctcagctt ggactcgtga tgagtatggc ttcgtccaga 1620 cctacgccca agagaaccga gaaaaggtca actttgctgt taatgtccag cacgaccaca 1680 agcgccacat tcgcgaggct ggcgcaaagg gatccgtcgt cctcaagaac actggctcac 1740 ttcctcttaa gaagccccag ttcctcgctg tcattggaga ggacgctggt tccaaccctg 1800 ccggacccaa cggttgcgct gaccgtggat gcgacaacgg tactcttgcc atggcatggg 1860 gttccggaac ctctcaattc ccctaccttg tcacccccga ccaaggcatc tcgctccagg 1920 ctattcagga cggtactcgt tatgagagca tcctcaacaa caaccagtgg ccccagacac 1980 aagctcttgt cagccagccc aacgtcaccg ccattgtctt tgccaatgcc gattctggtg 2040 agggctacat cgaggttgac ggcaactacg gcgaccgcaa gaacctcact ctgtggaagc 2100 aaggcgatga gctcatcaag aacgtctctg ctatctgccc caacaccatt gtggtccttc 2160 acaccgttgg ccccgtcctt ctaaccgagt ggcacaacaa ccccaacatc accgccattg 2220 tttgggctgg tgtgcctgga caggagtccg gtaacgccat cgccgacatc ctctacggca 2280 agaccagccc tggacgttct cccttcacct ggggtcgcac ttatgacagc tatggcacca 2340 aggttctcta caaggccaac aatggagagg gtgcccctca agaggacttt gtcgagggca 2400 acttcatcga ctaccgccac tttgaccgac aatcccccag caccaacgga aagagtgcca 2460 ccaacgactc ttctgctcct ctctacgagt tcggtttcgg tctgtcctgg actacctttg 2520 agtactctga tctcaaagtc gagtctgtca gcaacgcctc ttacagcccc tctgtcggaa 2580 acaccattcc tgcccctacc tacggcaact tcagcaagaa cctggacgat tacacattcc 2640 cctcaggtgt ccgatacctc tacaagttca tctaccccta cctcaacacc tcttcctccg 2700 ctgagaaggc ttccggcgat gtcaagggca gatttggtga gaccggcgac gagttcctcc 2760 ctcccaacgc tctcaacggt tcatcgcagc ctcgtcttcc ttccagtggt gctcccggcg 2820 gtaaccctca gctctgggac attatgtaca ccgtcactgc caccatcacc aacactggtg 2880 acgctacctc ggatgaggtt ccccagctgt acgtcagcct cggtggtgag ggcgagcctg 2940 tccgtgtcct ccgtggcttc gagcgtcttg aaaacattgc tcctggtgag agtgccacat 3000 tcaccgctca gcttactcgc cgtgacctga gcaactggga cgtcaacgtc cagaactggg 3060 tcatcaccga tcacgccaag aagatctggg tcggcagcag ctctcgcaat ctgcccctca 3120 gcgccgacct gtag 3134 <210> 112 <211> 886 <212> PRT <213> Gibberella zeae <400> 112 Met Lys Ala Asn Trp Leu Ala Ala Ala Val Tyr Leu Ala Ala Gly Thr 1 5 10 15 Asp Ala Ala Val Pro Asp Thr Leu Ala Gly Val Asn Leu Val Ala Arg 20 25 30 Asp Thr Leu Ala His Ser Pro Pro His Tyr Pro Ser Pro Trp Met Asp 35 40 45 Pro Asn Ala Val Gly Trp Glu Asp Ala Tyr Ala Lys Ala Lys Asp Phe 50 55 60 Val Ser Gln Met Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly Val 65 70 75 80 Gly Trp Gln Gly Glu Arg Cys Val Gly Asn Val Gly Ser Ile Pro Arg 85 90 95 Leu Gly Met Arg Gly Leu Cys Leu Gln Asp Gly Pro Leu Gly Ile Arg 100 105 110 Phe Ser Asp Tyr Asn Ser Ala Phe Pro Thr Gly Val Thr Ala Gly Ala 115 120 125 Ser Trp Ser Lys Ala Leu Trp Tyr Glu Arg Gly Arg Leu Met Gly Thr 130 135 140 Glu Phe Lys Glu Lys Gly Ile Asp Ile Ala Leu Gly Pro Ala Thr Gly 145 150 155 160 Pro Leu Gly Arg His Ala Ala Gly Gly Arg Asn Trp Glu Gly Phe Thr 165 170 175 Val Asp Pro Tyr Ala Ala Gly His Ala Met Ala Glu Thr Val Lys Gly 180 185 190 Ile Gln Asp Ser Gly Val Ile Ala Cys Ala Lys His Tyr Ile Ala Asn 195 200 205 Glu Gln Glu His Phe Arg Gln Arg Gly Asp Val Met Ser Gln Lys Phe 210 215 220 Asn Ile Ser Glu Ser Leu Ser Ser Asn Leu Asp Asp Lys Thr Met His 225 230 235 240 Glu Leu Tyr Asn Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly 245 250 255 Ser Ile Met Cys Ser Tyr Asn Gln Val Asn Asn Ser Tyr Ala Cys Gln 260 265 270 Asn Ser Lys Leu Leu Asn Gly Ile Leu Lys Asp Glu Met Gly Phe Gln 275 280 285 Gly Phe Val Met Ser Asp Trp Gln Ala Gln His Thr Gly Ala Ala Ser 290 295 300 Ala Val Ala Gly Leu Asp Met Thr Met Pro Gly Asp Thr Glu Phe Asn 305 310 315 320 Thr Gly Phe Ser Phe Trp Gly Gly Asn Leu Thr Leu Ala Val Ile Asn 325 330 335 Gly Thr Val Pro Ala Trp Arg Ile Asp Asp Met Ala Thr Arg Ile Met 340 345 350 Ala Ala Phe Phe Lys Val Gly Arg Ser Val Glu Glu Glu Pro Asp Ile 355 360 365 Asn Phe Ser Ala Trp Thr Arg Asp Glu Tyr Gly Phe Val Gln Thr Tyr 370 375 380 Ala Gln Glu Asn Arg Glu Lys Val Asn Phe Ala Val Asn Val Gln His 385 390 395 400 Asp His Lys Arg His Ile Arg Glu Ala Gly Ala Lys Gly Ser Val Val 405 410 415 Leu Lys Asn Thr Gly Ser Leu Pro Leu Lys Lys Pro Gln Phe Leu Ala 420 425 430 Val Ile Gly Glu Asp Ala Gly Ser Asn Pro Ala Gly Pro Asn Gly Cys 435 440 445 Ala Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser 450 455 460 Gly Thr Ser Gln Phe Pro Tyr Leu Val Thr Pro Asp Gln Gly Ile Ser 465 470 475 480 Leu Gln Ala Ile Gln Asp Gly Thr Arg Tyr Glu Ser Ile Leu Asn Asn 485 490 495 Asn Gln Trp Pro Gln Thr Gln Ala Leu Val Ser Gln Pro Asn Val Thr 500 505 510 Ala Ile Val Phe Ala Asn Ala Asp Ser Gly Glu Gly Tyr Ile Glu Val 515 520 525 Asp Gly Asn Tyr Gly Asp Arg Lys Asn Leu Thr Leu Trp Lys Gln Gly 530 535 540 Asp Glu Leu Ile Lys Asn Val Ser Ala Ile Cys Pro Asn Thr Ile Val 545 550 555 560 Val Leu His Thr Val Gly Pro Val Leu Leu Thr Glu Trp His Asn Asn 565 570 575 Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Val Pro Gly Gln Glu Ser 580 585 590 Gly Asn Ala Ile Ala Asp Ile Leu Tyr Gly Lys Thr Ser Pro Gly Arg 595 600 605 Ser Pro Phe Thr Trp Gly Arg Thr Tyr Asp Ser Tyr Gly Thr Lys Val 610 615 620 Leu Tyr Lys Ala Asn Asn Gly Glu Gly Ala Pro Gln Glu Asp Phe Val 625 630 635 640 Glu Gly Asn Phe Ile Asp Tyr Arg His Phe Asp Arg Gln Ser Pro Ser 645 650 655 Thr Asn Gly Lys Ser Ala Thr Asn Asp Ser Ser Ala Pro Leu Tyr Glu 660 665 670 Phe Gly Phe Gly Leu Ser Trp Thr Thr Phe Glu Tyr Ser Asp Leu Lys 675 680 685 Val Glu Ser Val Ser Asn Ala Ser Tyr Ser Pro Ser Val Gly Asn Thr 690 695 700 Ile Pro Ala Pro Thr Tyr Gly Asn Phe Ser Lys Asn Leu Asp Asp Tyr 705 710 715 720 Thr Phe Pro Ser Gly Val Arg Tyr Leu Tyr Lys Phe Ile Tyr Pro Tyr 725 730 735 Leu Asn Thr Ser Ser Ser Ala Glu Lys Ala Ser Gly Asp Val Lys Gly 740 745 750 Arg Phe Gly Glu Thr Gly Asp Glu Phe Leu Pro Pro Asn Ala Leu Asn 755 760 765 Gly Ser Ser Gln Pro Arg Leu Pro Ser Ser Gly Ala Pro Gly Gly Asn 770 775 780 Pro Gln Leu Trp Asp Ile Met Tyr Thr Val Thr Ala Thr Ile Thr Asn 785 790 795 800 Thr Gly Asp Ala Thr Ser Asp Glu Val Pro Gln Leu Tyr Val Ser Leu 805 810 815 Gly Gly Glu Gly Glu Pro Val Arg Val Leu Arg Gly Phe Glu Arg Leu 820 825 830 Glu Asn Ile Ala Pro Gly Glu Ser Ala Thr Phe Thr Ala Gln Leu Thr 835 840 845 Arg Arg Asp Leu Ser Asn Trp Asp Val Asn Val Gln Asn Trp Val Ile 850 855 860 Thr Asp His Ala Lys Lys Ile Trp Val Gly Ser Ser Ser Arg Asn Leu 865 870 875 880 Pro Leu Ser Ala Asp Leu 885 <210> 113 <211> 2796 <212> DNA <213> Nectria haematococca <400> 113 atgcggttca ccgtccttct cgcggcattt tcggggcttg tccccatggt tggttcgcaa 60 gctgaccaga aaccactaca gctcggtgtg aacaataaca ctctggcgca ttcacctcct 120 cactatcctt cgccatggat ggatcctgct gctcctggct gggaggaagc ctatctcaag 180 gcgaaagatt ttgtttcaca gcttaccctt cttgaaaagg tcaacttgac cactggtgtt 240 gggtgagtca cttgttttcc tctctcctga cgtgacactt tgctttggcc tgcttcctat 300 atcgtctact agcattgcta acactcgagg cagatggatg ggcgaacgtt gcgtcggcaa 360 cgtgggttca ctccctcgtt ttggaatgcg tggtctctgc atgcaggatg gccccctcgg 420 catccgcttg tctgactata actctgcctt tcctactggt attacagctg gtgcctcttg 480 gagccgtgcc ctttggtacc aacgtggcct cctgatgggc accgagcatc gtgaaaaagg 540 catcgacgtt gcacttgggc ctgctactgg tcctcttggt cgtactccta ctggcggccg 600 caactgggag ggtttctcgg ttgatcccta cgttgctggc gttgccatgg ccgagactgt 660 tagcggcatt caagatggtg gtactatcgc ctgtgctaag cactacatcg gcaacgaaca 720 aggtatgcct cttcacttct cctcgctgat aaatctgctc acaacaacct agagcaccat 780 cgccaagccc ccgaatccat tggccgcggc tacaacatca ccgagtccct gtcgtcgaac 840 gttgatgaca agaccctcca cgagctctat ctctggccgt tcgcagatgc cgtcaaggct 900 ggtgttggtg ctatcatgtg ttcctaccag cagctgaaca actcttacgg ttgccaaaac 960 tctaagcttc tcaacggaat tctcaaggac gagctaggat tccagggctt cgtcatgagt 1020 gactggcaag cccaacatgc tggagctgct accgctgttg caggccttga catgaccatg 1080 cccggtgaca ctttgttcaa caccggatac agcttctggg gtggtaacct gaccctcgct 1140 gtagtcaatg gcactgttcc cgactggcgt attgacgaca tggctatgag aatcatggca 1200 gctttcttca aggttggcaa gactgttgag gaccttcctg acatcaactt ttcttcttgg 1260 tctcgagaca cttttggcta cgttcaagcc gctgcccaag agaactggga acagatcaac 1320 ttcggagttg atgttcgtca cgaccacagc gaacacattc gactctcggc cgccaagggc 1380 accgtcctcc ttaagaactc tggctcattg cctctgaaga agcccaagtt ccttgccgtc 1440 gttggcgagg acgccggccc gaaccctgct ggccccaacg gctgtaacga ccgcggatgt 1500 aacaacggca ctctggccat gtcctggggc tcaggaacag cccagttccc ttacctcgtt 1560 actcccgact cagcgctaca gaaccaggct gtcctcgacg gcactcgcta cgagagtgtc 1620 ttgcggaaca accagtggga acagacacgc agtctcatta gccaacctaa cgtgacggct 1680 attgtgtttg ccaatgccaa ttccggagag ggatatatcg atgttgacgg caacgaaggc 1740 gatcggaaga atttgacctt gtggaacgag ggtgatgacc taattaagaa cgtctcctca 1800 atctgcccca acaccattgt tgttctgcac actgttggcc ctgtcatcct gacggaatgg 1860 tatgacaacc cgaacattac cgccatagtg tgggctggtg tacctggaca ggagtccggc 1920 aatgctcttg tggacatcct ttatggcaaa acaagccctg gtcgctctcc cttcacatgg 1980 ggtcgcaccc gaaagagtta cggcactgat gtcctatacg agcccaacaa tggtcagggt 2040 gctcctcaag atgatttcac ggagggagtc tttatcgact atcgtcattt tgaccaggtt 2100 tctcctagca ccgacggcag caagtctaat gatgagtcca gtcccatcta cgagtttggc 2160 catggtctgt cctggaccac gtttgagtac tctgaactca acattcaagc tcacaacaag 2220 attcccttcg atcctcctat tggcgagacg attgccgctc cggtccttgg caactacagt 2280 accgaccttg ccgattacac gttccccgat ggaattcgct acatctacca gttcatctat 2340 ccctggttga atacttcttc ttccggaaga gaggcttctg gcgatcccga ctacggaaag 2400 acggccgaag agttcctgcc ccccggagct ctcgacgggt cagctcagcc gcgacctcca 2460 tcctctggtg ctccaggtgg aaaccctcat ctttgggatg tgttgtacac tgttagtgct 2520 atcatcacca acactggcaa cgccacctcg gacgagatcc cgcagctcta cgttagtctc 2580 ggtggcgaga acgagcccgt ccgcgtcctt cgcgggttcg accgaattga gaacattgcg 2640 cctggccaga gtgtcagatt cacaactgac atcactcgcc gcgacctgag caactgggac 2700 gtcgtctctc agaactgggt cattacagac tacgagaaga ccgtatatgt cgggagcagc 2760 tcccgcaacc tgcctctcaa ggcaaccctg aagtaa 2796 <210> 114 <211> 880 <212> PRT <213> Nectria haematococca <400> 114 Met Arg Phe Thr Val Leu Leu Ala Ala Phe Ser Gly Leu Val Pro Met 1 5 10 15 Val Gly Ser Gln Ala Asp Gln Lys Pro Leu Gln Leu Gly Val Asn Asn 20 25 30 Asn Thr Leu Ala His Ser Pro Pro His Tyr Pro Ser Pro Trp Met Asp 35 40 45 Pro Ala Ala Pro Gly Trp Glu Glu Ala Tyr Leu Lys Ala Lys Asp Phe 50 55 60 Val Ser Gln Leu Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly Val 65 70 75 80 Gly Trp Met Gly Glu Arg Cys Val Gly Asn Val Gly Ser Leu Pro Arg 85 90 95 Phe Gly Met Arg Gly Leu Cys Met Gln Asp Gly Pro Leu Gly Ile Arg 100 105 110 Leu Ser Asp Tyr Asn Ser Ala Phe Pro Thr Gly Ile Thr Ala Gly Ala 115 120 125 Ser Trp Ser Arg Ala Leu Trp Tyr Gln Arg Gly Leu Leu Met Gly Thr 130 135 140 Glu His Arg Glu Lys Gly Ile Asp Val Ala Leu Gly Pro Ala Thr Gly 145 150 155 160 Pro Leu Gly Arg Thr Pro Thr Gly Gly Arg Asn Trp Glu Gly Phe Ser 165 170 175 Val Asp Pro Tyr Val Ala Gly Val Ala Met Ala Glu Thr Val Ser Gly 180 185 190 Ile Gln Asp Gly Gly Thr Ile Ala Cys Ala Lys His Tyr Ile Gly Asn 195 200 205 Glu Gln Glu His His Arg Gln Ala Pro Glu Ser Ile Gly Arg Gly Tyr 210 215 220 Asn Ile Thr Glu Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Leu His 225 230 235 240 Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Lys Ala Gly Val Gly 245 250 255 Ala Ile Met Cys Ser Tyr Gln Gln Leu Asn Asn Ser Tyr Gly Cys Gln 260 265 270 Asn Ser Lys Leu Leu Asn Gly Ile Leu Lys Asp Glu Leu Gly Phe Gln 275 280 285 Gly Phe Val Met Ser Asp Trp Gln Ala Gln His Ala Gly Ala Ala Thr 290 295 300 Ala Val Ala Gly Leu Asp Met Thr Met Pro Gly Asp Thr Leu Phe Asn 305 310 315 320 Thr Gly Tyr Ser Phe Trp Gly Gly Asn Leu Thr Leu Ala Val Val Asn 325 330 335 Gly Thr Val Pro Asp Trp Arg Ile Asp Asp Met Ala Met Arg Ile Met 340 345 350 Ala Ala Phe Phe Lys Val Gly Lys Thr Val Glu Asp Leu Pro Asp Ile 355 360 365 Asn Phe Ser Ser Trp Ser Arg Asp Thr Phe Gly Tyr Val Gln Ala Ala 370 375 380 Ala Gln Glu Asn Trp Glu Gln Ile Asn Phe Gly Val Asp Val Arg His 385 390 395 400 Asp His Ser Glu His Ile Arg Leu Ser Ala Ala Lys Gly Thr Val Leu 405 410 415 Leu Lys Asn Ser Gly Ser Leu Pro Leu Lys Lys Pro Lys Phe Leu Ala 420 425 430 Val Val Gly Glu Asp Ala Gly Pro Asn Pro Ala Gly Pro Asn Gly Cys 435 440 445 Asn Asp Arg Gly Cys Asn Asn Gly Thr Leu Ala Met Ser Trp Gly Ser 450 455 460 Gly Thr Ala Gln Phe Pro Tyr Leu Val Thr Pro Asp Ser Ala Leu Gln 465 470 475 480 Asn Gln Ala Val Leu Asp Gly Thr Arg Tyr Glu Ser Val Leu Arg Asn 485 490 495 Asn Gln Trp Glu Gln Thr Arg Ser Leu Ile Ser Gln Pro Asn Val Thr 500 505 510 Ala Ile Val Phe Ala Asn Ala Asn Ser Gly Glu Gly Tyr Ile Asp Val 515 520 525 Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp Asn Glu Gly 530 535 540 Asp Asp Leu Ile Lys Asn Val Ser Ser Ile Cys Pro Asn Thr Ile Val 545 550 555 560 Val Leu His Thr Val Gly Pro Val Ile Leu Thr Glu Trp Tyr Asp Asn 565 570 575 Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Val Pro Gly Gln Glu Ser 580 585 590 Gly Asn Ala Leu Val Asp Ile Leu Tyr Gly Lys Thr Ser Pro Gly Arg 595 600 605 Ser Pro Phe Thr Trp Gly Arg Thr Arg Lys Ser Tyr Gly Thr Asp Val 610 615 620 Leu Tyr Glu Pro Asn Asn Gly Gln Gly Ala Pro Gln Asp Asp Phe Thr 625 630 635 640 Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Gln Val Ser Pro Ser 645 650 655 Thr Asp Gly Ser Lys Ser Asn Asp Glu Ser Ser Pro Ile Tyr Glu Phe 660 665 670 Gly His Gly Leu Ser Trp Thr Thr Phe Glu Tyr Ser Glu Leu Asn Ile 675 680 685 Gln Ala His Asn Lys Ile Pro Phe Asp Pro Pro Ile Gly Glu Thr Ile 690 695 700 Ala Ala Pro Val Leu Gly Asn Tyr Ser Thr Asp Leu Ala Asp Tyr Thr 705 710 715 720 Phe Pro Asp Gly Ile Arg Tyr Ile Tyr Gln Phe Ile Tyr Pro Trp Leu 725 730 735 Asn Thr Ser Ser Ser Gly Arg Glu Ala Ser Gly Asp Pro Asp Tyr Gly 740 745 750 Lys Thr Ala Glu Glu Phe Leu Pro Pro Gly Ala Leu Asp Gly Ser Ala 755 760 765 Gln Pro Arg Pro Pro Ser Ser Gly Ala Pro Gly Gly Asn Pro His Leu 770 775 780 Trp Asp Val Leu Tyr Thr Val Ser Ala Ile Ile Thr Asn Thr Gly Asn 785 790 795 800 Ala Thr Ser Asp Glu Ile Pro Gln Leu Tyr Val Ser Leu Gly Gly Glu 805 810 815 Asn Glu Pro Val Arg Val Leu Arg Gly Phe Asp Arg Ile Glu Asn Ile 820 825 830 Ala Pro Gly Gln Ser Val Arg Phe Thr Thr Asp Ile Thr Arg Arg Asp 835 840 845 Leu Ser Asn Trp Asp Val Val Ser Gln Asn Trp Val Ile Thr Asp Tyr 850 855 860 Glu Lys Thr Val Tyr Val Gly Ser Ser Ser Arg Asn Leu Pro Leu Lys 865 870 875 880 <210> 115 <211> 3169 <212> DNA <213> Verticillium dahliae <400> 115 atgaagctga ccctcgctac tgccttactg gcagccagcg ggtgtgtctc tgcgggacaa 60 cccaagctca aggtacgtac ttgcctcttt ttcacaagga aaccaaaccc gcaccataat 120 ggtgattgag cagtcgtgct ttcctcaacc cgaatcaaac ccatgccgtg ttcgcgcatg 180 ccctttcgat cgtctgttgt gtgtgaaccc acgctcttca agcatcgcac atagcaccac 240 tccatcttca ttttcgagca atttcgggcc gcagagagcg gtctttcact tcaccacaat 300 cgttcatgcc tcgtgcccca ctgccatgtt tcttcccagt attctacttc tgagagcctt 360 gaccaccgtt gtcgacatct cgtcgccaag gctcgttgac acggactctg tttcccttgg 420 aattaatatt cgaaacaatg ctgaccagca tcctcagcgc cagactaaca gctctagcga 480 gctcgccttt tcccctccgc actacccttc tccatggatg aacccccaag cgactgggtg 540 ggaggacgcc tacgcccgtg ccagagaggt ggtagagcag atgactctgc tcgaaaaggt 600 caacctgacg acaggtgtcg ggtaagcttc acagaccccg tcttgccatc caaagtcatc 660 tgacagaatc ctagctggag cggtgatctc tgcgtcggaa acgtcggctc gatcccccga 720 atcggctgga gggggctttg tttgcaggat ggcccacagg gtatccgttt cgcggactac 780 gtctcgtact tcacttcgag ccagacagcc ggcgctacct gggaccgagg gcttctgtac 840 cagcgcgctc acgccattgg cgccgaagga gtagccaagg gcgtcgacgt cgtcctcggg 900 cccgccattg gccctctagg tcgccttccc gccggaggtc gtaactggga gggtttcgcc 960 gtggaccctt acctcagtgg cgttgctgtc gccgaatccg tcaggggcat ccaggatgct 1020 ggtgctattg ccaacgtcaa gcactacatc gtcaatgagc aggaacattt ccgccaggct 1080 ggcgaggctc aaggttacgg ctacgatgtc gacgaggcat tatcgtcgaa cgttgacgac 1140 aagaccatgc atgagcttta cctttggcca tttgcagacg ctgtccgtgc tggagccggc 1200 agtgtcatgt gttcttatca acaggtgggg gcaataccat tctctcctct ttccttgcag 1260 acagtgcact gaccgacctt ttttgcccaa gatcaacaac agttacggct gtcaaaactc 1320 acatcttctg aatgggctcc tcaaggacga actcggcttt caggggttcg tcctcagcga 1380 ttggcaagcg cagcatgctg gtgctgccac tgccgttgct ggacttgaca tggccatgcc 1440 cggtgacact cgcttcaaca ccggagtcgc cttctggggc gctaacctta ccaatgccat 1500 tttgaacggc accgttcccg aatatcggct cgatgacatg gccatgcgta ttatggcggc 1560 ctttttcaaa gttggaaaga ccctggacga tgttcctgac atcaacttct cgtcttggac 1620 aaaagacacc atcggcccgc tgcactgggc ggcccaggac aatgtgcagg tcatcaacca 1680 acacgttgat gtccgtcaag accacggcgc cctcattcgc accatcgctg cccgcggtac 1740 tgtcttacta aaaaatgagg gatcactgcc tctgaacaag ccgaaatttg ttgctgtcat 1800 tggtgaagat gctggccctc gtcctgttgg tcccaatggc tgccctgatc agggttgcaa 1860 taacggcact ctggctgctg gatggggatc tggcaccgcc agtttccctt atctcatcac 1920 tcctgatagt gctcttcagt ttcaagccgt ttcggatggc tcgcgatacg aaagcatcct 1980 cagcaactgg gattatgagc gcacagaggc cttggtttcc caggcggatg ctactgctct 2040 ggttttcgtc aatgcaaact ctggcgaagg atatatcagc gttgatggaa acgaaggtga 2100 tcgcaagaac ctcactctct ggaatggagg agacgagctt attcaacgag tcgctgcggc 2160 caacaacaac accatcgtca tcatccattc ggttggtccc gttctagtca ctgactggta 2220 cgagaatccc aatatcacgg ctatcatctg ggccggctta cccggacagg agtctggcaa 2280 ctctatcgcc gatattcttt acggccgcgt gaaccctggt ggcaagacac ctttcacctg 2340 gggtccaact gttgagagct acggcgttga cgtcctgaga gagcccaaca atggcaatgg 2400 tgctccccag agcgatttcg acgagggagt cttcatcgat taccgttggt ttgaccggca 2460 gtcgggtgtt gataacaatg catcagcgcc gaggaacagc agcagcagcc acgccccaat 2520 cttcgagttt ggctatggcc tttcgtacac aacctttgaa ttctccaatc ttcagattga 2580 gaggcatgac gttcacgatt acgtccctac cactgggcag acgagccctg cgccgagatt 2640 tggtgctaac tacagtacga actacgacga ctacgtcttt cccgagggcg aaatccgtta 2700 catctatcaa cacatctacc catacctcaa ttcctcagac ccaaaggagg cattggctga 2760 tcctaaatac ggccaaactg cagaagagtt cctcccagag ggcgctcttg atgcctcacc 2820 gcagcctagg ctcccagctt ctggagggcc cggaggcaac ccaatgcttt gggacgtcat 2880 attcacggtc accgcgaccg tgaccaacac gggtaaggtt gctggggacg aagtggcaca 2940 gctttacgtt tctcttggtg gacctgacga tccgattcga gtcctccgtg ggttcgaccg 3000 cattcacatc gcgcctggag cctcgcaaac cttccgtgcg gaactcacgc gccgggacct 3060 cagcaactgg gatgttgtca cgcaaaattg gttcatcagc cagtacgaaa agacggtctt 3120 tgtcgggagc tcatcccgaa acctccctct cagcactcgc ctcgaatag 3169 <210> 116 <211> 890 <212> PRT <213> Verticillium dahliae <400> 116 Met Lys Leu Thr Leu Ala Thr Ala Leu Leu Ala Ala Ser Gly Cys Val 1 5 10 15 Ser Ala Gly Gln Pro Lys Leu Lys His Pro Gln Arg Gln Thr Asn Ser 20 25 30 Ser Ser Glu Leu Ala Phe Ser Pro Pro His Tyr Pro Ser Pro Trp Met 35 40 45 Asn Pro Gln Ala Thr Gly Trp Glu Asp Ala Tyr Ala Arg Ala Arg Glu 50 55 60 Val Val Glu Gln Met Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly 65 70 75 80 Val Gly Trp Ser Gly Asp Leu Cys Val Gly Asn Val Gly Ser Ile Pro 85 90 95 Arg Ile Gly Trp Arg Gly Leu Cys Leu Gln Asp Gly Pro Gln Gly Ile 100 105 110 Arg Phe Ala Asp Tyr Val Ser Tyr Phe Thr Ser Ser Gln Thr Ala Gly 115 120 125 Ala Thr Trp Asp Arg Gly Leu Leu Tyr Gln Arg Ala His Ala Ile Gly 130 135 140 Ala Glu Gly Val Ala Lys Gly Val Asp Val Val Leu Gly Pro Ala Ile 145 150 155 160 Gly Pro Leu Gly Arg Leu Pro Ala Gly Gly Arg Asn Trp Glu Gly Phe 165 170 175 Ala Val Asp Pro Tyr Leu Ser Gly Val Ala Val Ala Glu Ser Val Arg 180 185 190 Gly Ile Gln Asp Ala Gly Ala Ile Ala Asn Val Lys His Tyr Ile Val 195 200 205 Asn Glu Gln Glu His Phe Arg Gln Ala Gly Glu Ala Gln Gly Tyr Gly 210 215 220 Tyr Asp Val Asp Glu Ala Leu Ser Ser Asn Val Asp Asp Lys Thr Met 225 230 235 240 His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Ala 245 250 255 Gly Ser Val Met Cys Ser Tyr Gln Gln Ile Asn Asn Ser Tyr Gly Cys 260 265 270 Gln Asn Ser His Leu Leu Asn Gly Leu Leu Lys Asp Glu Leu Gly Phe 275 280 285 Gln Gly Phe Val Leu Ser Asp Trp Gln Ala Gln His Ala Gly Ala Ala 290 295 300 Thr Ala Val Ala Gly Leu Asp Met Ala Met Pro Gly Asp Thr Arg Phe 305 310 315 320 Asn Thr Gly Val Ala Phe Trp Gly Ala Asn Leu Thr Asn Ala Ile Leu 325 330 335 Asn Gly Thr Val Pro Glu Tyr Arg Leu Asp Asp Met Ala Met Arg Ile 340 345 350 Met Ala Ala Phe Phe Lys Val Gly Lys Thr Leu Asp Asp Val Pro Asp 355 360 365 Ile Asn Phe Ser Ser Trp Thr Lys Asp Thr Ile Gly Pro Leu His Trp 370 375 380 Ala Ala Gln Asp Asn Val Gln Val Ile Asn Gln His Val Asp Val Arg 385 390 395 400 Gln Asp His Gly Ala Leu Ile Arg Thr Ile Ala Ala Arg Gly Thr Val 405 410 415 Leu Leu Lys Asn Glu Gly Ser Leu Pro Leu Asn Lys Pro Lys Phe Val 420 425 430 Ala Val Ile Gly Glu Asp Ala Gly Pro Arg Pro Val Gly Pro Asn Gly 435 440 445 Cys Pro Asp Gln Gly Cys Asn Asn Gly Thr Leu Ala Ala Gly Trp Gly 450 455 460 Ser Gly Thr Ala Ser Phe Pro Tyr Leu Ile Thr Pro Asp Ser Ala Leu 465 470 475 480 Gln Phe Gln Ala Val Ser Asp Gly Ser Arg Tyr Glu Ser Ile Leu Ser 485 490 495 Asn Trp Asp Tyr Glu Arg Thr Glu Ala Leu Val Ser Gln Ala Asp Ala 500 505 510 Thr Ala Leu Val Phe Val Asn Ala Asn Ser Gly Glu Gly Tyr Ile Ser 515 520 525 Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp Asn Gly 530 535 540 Gly Asp Glu Leu Ile Gln Arg Val Ala Ala Ala Asn Asn Asn Thr Ile 545 550 555 560 Val Ile Ile His Ser Val Gly Pro Val Leu Val Thr Asp Trp Tyr Glu 565 570 575 Asn Pro Asn Ile Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly Gln Glu 580 585 590 Ser Gly Asn Ser Ile Ala Asp Ile Leu Tyr Gly Arg Val Asn Pro Gly 595 600 605 Gly Lys Thr Pro Phe Thr Trp Gly Pro Thr Val Glu Ser Tyr Gly Val 610 615 620 Asp Val Leu Arg Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp 625 630 635 640 Phe Asp Glu Gly Val Phe Ile Asp Tyr Arg Trp Phe Asp Arg Gln Ser 645 650 655 Gly Val Asp Asn Asn Ala Ser Ala Pro Arg Asn Ser Ser Ser Ser His 660 665 670 Ala Pro Ile Phe Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu 675 680 685 Phe Ser Asn Leu Gln Ile Glu Arg His Asp Val His Asp Tyr Val Pro 690 695 700 Thr Thr Gly Gln Thr Ser Pro Ala Pro Arg Phe Gly Ala Asn Tyr Ser 705 710 715 720 Thr Asn Tyr Asp Asp Tyr Val Phe Pro Glu Gly Glu Ile Arg Tyr Ile 725 730 735 Tyr Gln His Ile Tyr Pro Tyr Leu Asn Ser Ser Asp Pro Lys Glu Ala 740 745 750 Leu Ala Asp Pro Lys Tyr Gly Gln Thr Ala Glu Glu Phe Leu Pro Glu 755 760 765 Gly Ala Leu Asp Ala Ser Pro Gln Pro Arg Leu Pro Ala Ser Gly Gly 770 775 780 Pro Gly Gly Asn Pro Met Leu Trp Asp Val Ile Phe Thr Val Thr Ala 785 790 795 800 Thr Val Thr Asn Thr Gly Lys Val Ala Gly Asp Glu Val Ala Gln Leu 805 810 815 Tyr Val Ser Leu Gly Gly Pro Asp Asp Pro Ile Arg Val Leu Arg Gly 820 825 830 Phe Asp Arg Ile His Ile Ala Pro Gly Ala Ser Gln Thr Phe Arg Ala 835 840 845 Glu Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Val Thr Gln Asn 850 855 860 Trp Phe Ile Ser Gln Tyr Glu Lys Thr Val Phe Val Gly Ser Ser Ser 865 870 875 880 Arg Asn Leu Pro Leu Ser Thr Arg Leu Glu 885 890 <210> 117 <211> 2418 <212> DNA <213> Podospora anserina <400> 117 atgaaactca ataagccatt cctggccatt tatttggctt tcaacttggc cgaggcttcg 60 aaaactccgg attgcatcag tggtccgctg gcaaagacct tggcatgtga tacaacggcg 120 tcacctcctg cgcgagcagc tgctcttgtg caggctttaa atatcacgga aaagcttgtg 180 aatctagtgg agtatgtcaa gtcaagagaa gctcctttag ggatttcaat tcagctaatc 240 actcctcata gcatgagcct cggtgcagaa aggatcggcc ttccagctta tgcttggtgg 300 aacgaagctc ttcatggtgt tgccgcgtcg cctggggtct ccttcaatca ggccggacaa 360 gaattctcac acgctacttc atttgcgaat actattacgc tagcagccgc ctttgacaat 420 gacctggttt acgaggtggc ggataccatc agcactgaag cgcgagcgtt cagcaatgcc 480 gagctcgctg gactggatta ctggacgcct aacatcaacc cgtacaaaga tccgagatgg 540 gggaggggcc atgaggtttg ttaccttagc cttcttttcc gtgccgtgca gttgctgaga 600 actcaaaaga cacccggaga agatccggta cacatcaaag gctacgtcca agcacttctc 660 gagggtctag aagggagaga caagatcaga aaggtgattg ccacttgtaa acactttgca 720 gcctatgatt tggagagatg gcaaggggct cttagataca ggttcaatgc tgttgtgacc 780 tcgcaggatc tttcggagta ctacctccaa ccgtttcaac aatgcgctcg agacagcaag 840 gtcgggtctt tcatgtgctc atataatgcg ctcaacggaa caccggcatg tgcaagcacg 900 tatttgatgg acgacatcct tcgaaaacac tggaattgga ccgagcacaa caactatata 960 acgagcgact gtaatgctat tcaggacttc ctccccaact ttcacaactt cagccaaact 1020 ccagctcaag ccgccgctga tgcttataac gccggtacag acaccgtctg tgaggtgcct 1080 ggataccccc cactcacaga tgtaatcgga gcatacaatc agtctctgct gtcagaggaa 1140 attatcgacc gagcacttcg cagattatac gaaggcctca tccgagctgg ctatctcgac 1200 tcagcctccc cacatccata caccaaaatc tcatggtccc aagtaaacac ccccaaagcc 1260 caagccctgg ctctccagtc cgccaccgac gggatagtcc ttctcaaaaa caacggcctc 1320 cttcccctag acctcaccaa caaaaccata gccctcatag gccactgggc caatgcaacc 1380 cgccaaatgc taggcggcta cagcggtatc cccccttact acgccaaccc aatctatgca 1440 gccacccagc tcaacgtcac ttttcatcac gccccaggac cggtgaacca gtcatctccc 1500 tccacaaatg acacctggac ctcccccgcc ctctccgcgg cttccaaatc ggatatcatc 1560 ctctacctcg gcggcaccga cctctccatc gcagccgaag accgagacag agactccatc 1620 gcctggccat ccgctcaact ttccttgtta acctccctcg cccagatggg aaaacccaca 1680 atcgtagcaa gactaggcga ccaagtagac gacacccccc tgctctccaa cccaaacatc 1740 tcctccatcc tatgggtagg ctacccaggc caatcaggcg gaacagccct cttgaacatc 1800 atcaccggag tcagctcccc cgccgctcga ctgcccgtca cagtctaccc agaaacttac 1860 acctccctca tccccctgac agccatgtcc ctccgcccaa cctccgcccg cccaggccgg 1920 acttacaggt ggtacccctc ccccgtgctc cccttcggcc acggcctcca ctacacaacc 1980 tttaccgcca aattcggcgt ctttgagtcc ctcaccatca acattgccga actcgtttcc 2040 aactgtaacg aacgatacct cgacctctgc cggttcccgc aggtgtccgt ctgggtgtcg 2100 aatacgggag aactcaaatc tgactatgtc gcccttgttt ttgtcagggg tgagtacgga 2160 ccggagccgt acccgatcaa gacgctggtg gggtacaagc ggataaggga tatcgagccg 2220 gggactacgg gggcggcgcc ggtgggggtg gtggtggggg atttggctag ggtggatttg 2280 ggggggaata gggttttgtt tccggggaag tatgagtttc tgctggatgt ggaggggggg 2340 agggataggg ttgtgatcga gttggttggg gaggaggtgg tgttggagaa gttccctcag 2400 ccgcctgcgg cgggttga 2418 <210> 118 <211> 805 <212> PRT <213> Podospora anserina <400> 118 Met Lys Leu Asn Lys Pro Phe Leu Ala Ile Tyr Leu Ala Phe Asn Leu 1 5 10 15 Ala Glu Ala Ser Lys Thr Pro Asp Cys Ile Ser Gly Pro Leu Ala Lys 20 25 30 Thr Leu Ala Cys Asp Thr Thr Ala Ser Pro Pro Ala Arg Ala Ala Ala 35 40 45 Leu Val Gln Ala Leu Asn Ile Thr Glu Lys Leu Val Asn Leu Val Glu 50 55 60 Tyr Val Lys Ser Arg Glu Ala Pro Leu Gly Ile Ser Ile Gln Leu Ile 65 70 75 80 Thr Pro His Ser Met Ser Leu Gly Ala Glu Arg Ile Gly Leu Pro Ala 85 90 95 Tyr Ala Trp Trp Asn Glu Ala Leu His Gly Val Ala Ala Ser Pro Gly 100 105 110 Val Ser Phe Asn Gln Ala Gly Gln Glu Phe Ser His Ala Thr Ser Phe 115 120 125 Ala Asn Thr Ile Thr Leu Ala Ala Ala Phe Asp Asn Asp Leu Val Tyr 130 135 140 Glu Val Ala Asp Thr Ile Ser Thr Glu Ala Arg Ala Phe Ser Asn Ala 145 150 155 160 Glu Leu Ala Gly Leu Asp Tyr Trp Thr Pro Asn Ile Asn Pro Tyr Lys 165 170 175 Asp Pro Arg Trp Gly Arg Gly His Glu Val Cys Tyr Leu Ser Leu Leu 180 185 190 Phe Arg Ala Val Gln Leu Leu Arg Thr Gln Lys Thr Pro Gly Glu Asp 195 200 205 Pro Val His Ile Lys Gly Tyr Val Gln Ala Leu Leu Glu Gly Leu Glu 210 215 220 Gly Arg Asp Lys Ile Arg Lys Val Ile Ala Thr Cys Lys His Phe Ala 225 230 235 240 Ala Tyr Asp Leu Glu Arg Trp Gln Gly Ala Leu Arg Tyr Arg Phe Asn 245 250 255 Ala Val Val Thr Ser Gln Asp Leu Ser Glu Tyr Tyr Leu Gln Pro Phe 260 265 270 Gln Gln Cys Ala Arg Asp Ser Lys Val Gly Ser Phe Met Cys Ser Tyr 275 280 285 Asn Ala Leu Asn Gly Thr Pro Ala Cys Ala Ser Thr Tyr Leu Met Asp 290 295 300 Asp Ile Leu Arg Lys His Trp Asn Trp Thr Glu His Asn Asn Tyr Ile 305 310 315 320 Thr Ser Asp Cys Asn Ala Ile Gln Asp Phe Leu Pro Asn Phe His Asn 325 330 335 Phe Ser Gln Thr Pro Ala Gln Ala Ala Ala Asp Ala Tyr Asn Ala Gly 340 345 350 Thr Asp Thr Val Cys Glu Val Pro Gly Tyr Pro Pro Leu Thr Asp Val 355 360 365 Ile Gly Ala Tyr Asn Gln Ser Leu Leu Ser Glu Glu Ile Ile Asp Arg 370 375 380 Ala Leu Arg Arg Leu Tyr Glu Gly Leu Ile Arg Ala Gly Tyr Leu Asp 385 390 395 400 Ser Ala Ser Pro His Pro Tyr Thr Lys Ile Ser Trp Ser Gln Val Asn 405 410 415 Thr Pro Lys Ala Gln Ala Leu Ala Leu Gln Ser Ala Thr Asp Gly Ile 420 425 430 Val Leu Leu Lys Asn Asn Gly Leu Leu Pro Leu Asp Leu Thr Asn Lys 435 440 445 Thr Ile Ala Leu Ile Gly His Trp Ala Asn Ala Thr Arg Gln Met Leu 450 455 460 Gly Gly Tyr Ser Gly Ile Pro Pro Tyr Tyr Ala Asn Pro Ile Tyr Ala 465 470 475 480 Ala Thr Gln Leu Asn Val Thr Phe His His Ala Pro Gly Pro Val Asn 485 490 495 Gln Ser Ser Pro Ser Thr Asn Asp Thr Trp Thr Ser Pro Ala Leu Ser 500 505 510 Ala Ala Ser Lys Ser Asp Ile Ile Leu Tyr Leu Gly Gly Thr Asp Leu 515 520 525 Ser Ile Ala Ala Glu Asp Arg Asp Arg Asp Ser Ile Ala Trp Pro Ser 530 535 540 Ala Gln Leu Ser Leu Leu Thr Ser Leu Ala Gln Met Gly Lys Pro Thr 545 550 555 560 Ile Val Ala Arg Leu Gly Asp Gln Val Asp Asp Thr Pro Leu Leu Ser 565 570 575 Asn Pro Asn Ile Ser Ser Ile Leu Trp Val Gly Tyr Pro Gly Gln Ser 580 585 590 Gly Gly Thr Ala Leu Leu Asn Ile Ile Thr Gly Val Ser Ser Pro Ala 595 600 605 Ala Arg Leu Pro Val Thr Val Tyr Pro Glu Thr Tyr Thr Ser Leu Ile 610 615 620 Pro Leu Thr Ala Met Ser Leu Arg Pro Thr Ser Ala Arg Pro Gly Arg 625 630 635 640 Thr Tyr Arg Trp Tyr Pro Ser Pro Val Leu Pro Phe Gly His Gly Leu 645 650 655 His Tyr Thr Thr Phe Thr Ala Lys Phe Gly Val Phe Glu Ser Leu Thr 660 665 670 Ile Asn Ile Ala Glu Leu Val Ser Asn Cys Asn Glu Arg Tyr Leu Asp 675 680 685 Leu Cys Arg Phe Pro Gln Val Ser Val Trp Val Ser Asn Thr Gly Glu 690 695 700 Leu Lys Ser Asp Tyr Val Ala Leu Val Phe Val Arg Gly Glu Tyr Gly 705 710 715 720 Pro Glu Pro Tyr Pro Ile Lys Thr Leu Val Gly Tyr Lys Arg Ile Arg 725 730 735 Asp Ile Glu Pro Gly Thr Thr Gly Ala Ala Pro Val Gly Val Val Val 740 745 750 Gly Asp Leu Ala Arg Val Asp Leu Gly Gly Asn Arg Val Leu Phe Pro 755 760 765 Gly Lys Tyr Glu Phe Leu Leu Asp Val Glu Gly Gly Arg Asp Arg Val 770 775 780 Val Ile Glu Leu Val Gly Glu Glu Val Val Leu Glu Lys Phe Pro Gln 785 790 795 800 Pro Pro Ala Ala Gly 805 <210> 119 <211> 721 <212> PRT <213> Thermotoga neapolitana <400> 119 Met Glu Lys Val Asn Glu Ile Leu Ser Gln Leu Thr Leu Glu Glu Lys 1 5 10 15 Val Lys Leu Val Val Gly Val Gly Leu Pro Gly Leu Phe Gly Asn Pro 20 25 30 His Ser Arg Val Ala Gly Ala Ala Gly Glu Thr His Pro Val Pro Arg 35 40 45 Val Gly Leu Pro Ala Phe Val Leu Ala Asp Gly Pro Ala Gly Leu Arg 50 55 60 Ile Asn Pro Thr Arg Glu Asn Asp Glu Asn Thr Tyr Tyr Thr Thr Ala 65 70 75 80 Phe Pro Val Glu Ile Met Leu Ala Ser Thr Trp Asn Arg Glu Leu Leu 85 90 95 Glu Glu Val Gly Lys Ala Met Gly Glu Glu Val Arg Glu Tyr Gly Val 100 105 110 Asp Val Leu Leu Ala Pro Ala Met Asn Ile His Arg Asn Pro Leu Cys 115 120 125 Gly Arg Asn Phe Glu Tyr Tyr Ser Glu Asp Pro Val Leu Ser Gly Glu 130 135 140 Met Ala Ser Ser Phe Val Lys Gly Val Gln Ser Gln Gly Val Gly Ala 145 150 155 160 Cys Ile Lys His Phe Val Ala Asn Asn Gln Glu Thr Asn Arg Met Val 165 170 175 Val Asp Thr Ile Val Ser Glu Arg Ala Leu Arg Glu Ile Tyr Leu Arg 180 185 190 Gly Phe Glu Ile Ala Val Lys Lys Ser Lys Pro Trp Ser Val Met Ser 195 200 205 Ala Tyr Asn Lys Leu Asn Gly Lys Tyr Cys Ser Gln Asn Glu Trp Leu 210 215 220 Leu Lys Lys Val Leu Arg Glu Glu Trp Gly Phe Glu Gly Phe Val Met 225 230 235 240 Ser Asp Trp Tyr Ala Gly Asp Asn Pro Val Glu Gln Leu Lys Ala Gly 245 250 255 Asn Asp Leu Ile Met Pro Gly Lys Ala Tyr Gln Val Asn Thr Glu Arg 260 265 270 Arg Asp Glu Ile Glu Glu Ile Met Glu Ala Leu Lys Glu Gly Lys Leu 275 280 285 Ser Glu Glu Val Leu Asp Glu Cys Val Arg Asn Ile Leu Lys Val Leu 290 295 300 Val Asn Ala Pro Ser Phe Lys Asn Tyr Arg Tyr Ser Asn Lys Pro Asp 305 310 315 320 Leu Glu Lys His Ala Lys Val Ala Tyr Glu Ala Gly Ala Glu Gly Val 325 330 335 Val Leu Leu Arg Asn Glu Glu Ala Leu Pro Leu Ser Glu Asn Ser Lys 340 345 350 Ile Ala Leu Phe Gly Thr Gly Gln Ile Glu Thr Ile Lys Gly Gly Thr 355 360 365 Gly Ser Gly Asp Thr His Pro Arg Tyr Ala Ile Ser Ile Leu Glu Gly 370 375 380 Ile Lys Glu Arg Gly Leu Asn Phe Asp Glu Glu Leu Ala Lys Thr Tyr 385 390 395 400 Glu Asp Tyr Ile Lys Lys Met Arg Glu Thr Glu Glu Tyr Lys Pro Arg 405 410 415 Arg Asp Ser Trp Gly Thr Ile Ile Lys Pro Lys Leu Pro Glu Asn Phe 420 425 430 Leu Ser Glu Lys Glu Ile His Lys Leu Ala Lys Lys Asn Asp Val Ala 435 440 445 Val Ile Val Ile Ser Arg Ile Ser Gly Glu Gly Tyr Asp Arg Lys Pro 450 455 460 Val Lys Gly Asp Phe Tyr Leu Ser Asp Asp Glu Thr Asp Leu Ile Lys 465 470 475 480 Thr Val Ser Arg Glu Phe His Glu Gln Gly Lys Lys Val Ile Val Leu 485 490 495 Leu Asn Ile Gly Ser Pro Val Glu Val Val Ser Trp Arg Asp Leu Val 500 505 510 Asp Gly Ile Leu Leu Val Trp Gln Ala Gly Gln Glu Thr Gly Arg Ile 515 520 525 Val Ala Asp Val Leu Thr Gly Arg Ile Asn Pro Ser Gly Lys Leu Pro 530 535 540 Thr Thr Phe Pro Arg Asp Tyr Ser Asp Val Pro Ser Trp Thr Phe Pro 545 550 555 560 Gly Glu Pro Lys Asp Asn Pro Gln Lys Val Val Tyr Glu Glu Asp Ile 565 570 575 Tyr Val Gly Tyr Arg Tyr Tyr Asp Thr Phe Gly Val Glu Pro Ala Tyr 580 585 590 Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Tyr Ser Asp Leu 595 600 605 Asn Val Ser Phe Asp Gly Glu Thr Leu Arg Val Gln Tyr Arg Ile Glu 610 615 620 Asn Thr Gly Gly Arg Ala Gly Lys Glu Val Ser Gln Val Tyr Ile Lys 625 630 635 640 Ala Pro Lys Gly Lys Ile Asp Lys Pro Phe Gln Glu Leu Lys Ala Phe 645 650 655 His Lys Thr Arg Leu Leu Asn Pro Gly Glu Ser Glu Glu Val Val Leu 660 665 670 Glu Ile Pro Val Arg Asp Leu Ala Ser Phe Asn Gly Glu Glu Trp Val 675 680 685 Val Glu Ala Gly Glu Tyr Glu Val Arg Val Gly Ala Ser Ser Arg Asn 690 695 700 Ile Lys Leu Lys Gly Thr Phe Ser Val Gly Glu Glu Arg Arg Phe Lys 705 710 715 720 Pro <210> 120 <211> 17 <212> PRT <213> Trichoderma reesei <400> 120 Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg 1 5 10 15 Ala <210> 121 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 121 caccatgaga tatagaacag ctgccgct 28 <210> 122 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 122 cgaccgccct gcggagtctt gcccagtggt cccgcgacag 40 <210> 123 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 123 ctgtcgcggg accactgggc aagactccgc agggcggtcg 40 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 124 cctacgctac cgacagagtg 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 125 gtctagactg gaaacgcaac 20 <210> 126 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 126 gagttgtgaa gtcggtaatc c 21 <210> 127 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 127 caccatgaaa gcaaacgtca tcttgtgcct cctgg 35 <210> 128 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 128 ctattgtaag atgccaacaa tgctgttata tgccggcttg ggg 43 <210> 129 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 129 gagttgtgaa gtcggtaatc c 21 <210> 130 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 130 cacgaagagc ggcgattc 18 <210> 131 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 131 cacccatgct gctcaatctt cag 23 <210> 132 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 132 ttacgcagac ttggggtctt gag 23 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 133 gcttgagtgt atcgtgtaag 20 <210> 134 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 134 gcaacggcaa agccccactt c 21 <210> 135 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 135 gtagcggccg cctcatctca tctcatccat cc 32 <210> 136 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 136 caccatgcag ctcaagtttc tgtc 24 <210> 137 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 137 ggttactagt caactgcccg ttctgtagcg ag 32 <210> 138 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 138 catgcgatcg cgacgttttg gtcaggtcg 29 <210> 139 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 139 gacagaaact tgagctgcat ggtgtgggac aacaagaagg 40 <210> 140 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 140 caccatggtt cgcttcagtt caatcctag 29 <210> 141 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 141 gtggctagaa gatatccaac ac 22 <210> 142 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 142 catgcgatcg cgacgttttg gtcaggtcg 29 <210> 143 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 143 gaactgaagc gaaccatggt gtgggacaac aagaaggac 39 <210> 144 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 144 gtagttatgc gcatgctaga c 21 <210> 145 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 145 gtggctagaa gatatccaac ac 22 <210> 146 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 146 gtagttatgc gcatgctaga c 21 <210> 147 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 147 ccggctcagt atcaaccact aagcacat 28 <210> 148 <211> 250 <212> PRT <213> Thermoascus aurantiacus <400> 148 Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala 1 5 10 15 Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly 20 25 30 Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser 35 40 45 Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly 50 55 60 Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg 65 70 75 80 Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr 85 90 95 Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val 100 105 110 Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys 115 120 125 Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp 130 135 140 Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn 145 150 155 160 Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr 165 170 175 Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp 180 185 190 Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly 195 200 205 Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp 210 215 220 Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr 225 230 235 240 Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly 245 250 <210> 149 <211> 799 <212> DNA <213> Thermoascus aurantiacus <400> 149 atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60 ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120 acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180 atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240 tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300 agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360 tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420 tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480 caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540 caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600 tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660 cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720 cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780 tcctctgtat actggttaa 799 <210> 150 <211> 532 <212> PRT <213> Aspergillus fumigatus <400> 150 Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile 1 5 10 15 Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser 20 25 30 Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly 35 40 45 Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp 50 55 60 Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn 65 70 75 80 Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn 85 90 95 Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala 100 105 110 Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys 115 120 125 Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu 130 135 140 Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser 145 150 155 160 Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp 165 170 175 Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys 180 185 190 Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe 195 200 205 Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp 210 215 220 Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp 225 230 235 240 Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys 245 250 255 Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr 260 265 270 Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp 275 280 285 Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met 290 295 300 Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr 305 310 315 320 Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr 325 330 335 Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly 340 345 350 Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser 355 360 365 Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly 370 375 380 Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp 385 390 395 400 Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr 405 410 415 Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile 420 425 430 Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr 435 440 445 Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn 450 455 460 Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr 465 470 475 480 Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly 485 490 495 Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro 500 505 510 Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr 515 520 525 Ser Gln Cys Leu 530 <210> 151 <211> 452 <212> PRT <213> Aspergillus fumigatus <400> 151 Met His Gln Arg Ala Leu Leu Phe Ser Ala Leu Ala Val Ala Ala Asn 1 5 10 15 Ala Gln Gln Val Gly Thr Gln Thr Pro Glu Thr His Pro Pro Leu Thr 20 25 30 Trp Gln Lys Cys Thr Ala Ala Gly Ser Cys Ser Gln Gln Ser Gly Ser 35 40 45 Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Ser Thr Lys Asp Thr 50 55 60 Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asn Thr Glu Leu Cys Pro Asp 65 70 75 80 Asn Glu Ser Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ala 85 90 95 Gly Thr Tyr Gly Val Thr Thr Ser Gly Ser Glu Leu Lys Leu Ser Phe 100 105 110 Val Thr Gly Ala Asn Val Gly Ser Arg Leu Tyr Leu Met Gln Asp Asp 115 120 125 Glu Thr Tyr Gln His Phe Asn Leu Leu Asn His Glu Phe Thr Phe Asp 130 135 140 Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe 145 150 155 160 Val Ala Met Asp Ala Asp Gly Gly Met Ser Lys Tyr Pro Ser Asn Lys 165 170 175 Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg 180 185 190 Asp Leu Lys Phe Ile Asn Gly Met Ala Asn Val Glu Gly Trp Glu Pro 195 200 205 Ser Ser Ser Asp Lys Asn Ala Gly Val Gly Gly His Gly Ser Cys Cys 210 215 220 Pro Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Val Thr 225 230 235 240 Pro His Pro Cys Asp Asp Val Ser Gln Thr Met Cys Ser Gly Asp Ala 245 250 255 Cys Gly Gly Thr Tyr Ser Glu Ser Arg Tyr Ala Gly Thr Cys Asp Pro 260 265 270 Asp Gly Cys Asp Phe Asn Pro Phe Arg Met Gly Asn Glu Ser Phe Tyr 275 280 285 Gly Pro Gly Lys Ile Val Asp Thr Lys Ser Lys Met Thr Val Val Thr 290 295 300 Gln Phe Ile Thr Ala Asp Gly Thr Asp Ser Gly Ala Leu Ser Glu Ile 305 310 315 320 Lys Arg Leu Tyr Val Gln Asn Gly Lys Val Ile Ala Asn Ser Val Ser 325 330 335 Asn Val Ala Gly Val Ser Gly Asn Ser Ile Thr Ser Asp Phe Cys Thr 340 345 350 Ala Gln Lys Lys Ala Phe Gly Asp Glu Asp Ile Phe Ala Lys His Gly 355 360 365 Gly Leu Ser Gly Met Gly Lys Ala Leu Ser Glu Met Val Leu Ile Met 370 375 380 Ser Ile Trp Asp Asp His His Ser Ser Met Met Trp Leu Asp Ser Thr 385 390 395 400 Tyr Pro Thr Asp Ala Asp Pro Ser Lys Pro Gly Val Ala Arg Gly Thr 405 410 415 Cys Glu His Gly Ala Gly Asp Pro Glu Asn Val Glu Ser Gln His Pro 420 425 430 Asp Ala Ser Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser 435 440 445 Thr Tyr Glu Gly 450 <210> 152 <211> 450 <212> PRT <213> Chaetosphaeridium globosum <400> 152 Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu Met Ser 1 5 10 15 Leu Val Ser Ala Gln Gly Val Gly Thr Ser Thr Ser Glu Thr His Pro 20 25 30 Lys Ile Thr Trp Lys Lys Cys Ser Ser Gly Gly Ser Cys Ser Thr Val 35 40 45 Asn Ala Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Asn Ala 50 55 60 Asp Ser Lys Asn Cys Tyr Asp Gly Asn Glu Trp Thr Asp Ala Cys Thr 65 70 75 80 Ser Ser Asp Asp Cys Thr Ser Lys Cys Val Leu Glu Gly Ala Glu Tyr 85 90 95 Gly Lys Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Ser Leu Lys 100 105 110 Phe Leu Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe Tyr 115 120 125 Leu Met Asn Gly Ala Ser Lys Tyr Gln Met Phe Thr Leu Met Asn Asn 130 135 140 Glu Phe Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys Gly Leu Asn 145 150 155 160 Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala Ser 165 170 175 Tyr Ser Thr Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp 180 185 190 Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Ala Asn Tyr 195 200 205 Asp Gly Trp Thr Pro Ser Ser Asn Asp Ala Asn Ala Gly Val Gly Ala 210 215 220 Leu Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala His 225 230 235 240 Ala Phe Ala Phe Thr Pro His Ala Cys Glu Asn Asn Asn Tyr His Val 245 250 255 Cys Glu Asp Thr Thr Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala 260 265 270 Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Val Gly 275 280 285 Asn Thr Asp Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys 290 295 300 Phe Thr Val Val Ser Gln Phe Gln Glu Asn Lys Leu Thr Gln Phe Phe 305 310 315 320 Val Gln Asn Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys His Glu Gly 325 330 335 Leu Pro Thr Glu Ser Ser Asp Ile Thr Pro Glu Leu Cys Ser Ala Met 340 345 350 Pro Glu Val Phe Gly Asp Arg Asp Arg Phe Ala Glu Val Gly Gly Phe 355 360 365 Asp Ala Leu Asn Lys Ala Leu Ala Val Pro Met Val Leu Val Met Ser 370 375 380 Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr 385 390 395 400 Pro Pro Glu Lys Ala Gly Thr Pro Gly Gly Asp Arg Gly Pro Cys Ala 405 410 415 Gln Asp Ser Gly Val Pro Ser Glu Val Glu Ser Gln Tyr Pro Asp Ala 420 425 430 Thr Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val 435 440 445 Gln Val 450 <210> 153 <211> 452 <212> PRT <213> Chaetosphaeridium globosum <400> 153 Met Tyr Arg Gln Val Ala Thr Ala Leu Ser Phe Ala Ser Leu Val Leu 1 5 10 15 Gly Gln Gln Val Gly Thr Leu Thr Ala Glu Thr His Pro Ser Leu Pro 20 25 30 Ile Glu Val Cys Thr Ala Pro Gly Ser Cys Thr Lys Glu Asp Thr Thr 35 40 45 Val Val Leu Asp Ala Asn Trp Arg Trp Thr His Val Thr Asp Gly Tyr 50 55 60 Thr Asn Cys Tyr Thr Gly Asn Ala Trp Asn Glu Thr Ala Cys Pro Asp 65 70 75 80 Gly Lys Thr Cys Ala Ala Asn Cys Ala Ile Asp Gly Ala Glu Tyr Glu 85 90 95 Lys Thr Tyr Gly Ile Thr Thr Pro Glu Glu Gly Ala Leu Arg Leu Asn 100 105 110 Phe Val Thr Glu Ser Asn Val Gly Ser Arg Val Tyr Leu Met Ala Gly 115 120 125 Glu Asp Lys Tyr Arg Leu Phe Asn Leu Leu Asn Lys Glu Phe Thr Met 130 135 140 Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Val Tyr 145 150 155 160 Phe Ser Glu Met Asp Glu Asp Gly Gly Met Ser Arg Phe Glu Gly Asn 165 170 175 Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro 180 185 190 Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ser Glu Gly Trp Gly 195 200 205 Gly Glu Asp Gly Asn Ser Gly Thr Gly Lys Tyr Gly Thr Cys Cys Ala 210 215 220 Glu Met Asp Ile Trp Glu Ala Asn Leu Asp Ala Thr Ala Tyr Thr Pro 225 230 235 240 His Pro Cys Lys Val Thr Glu Gln Thr Arg Cys Glu Asp Asp Thr Glu 245 250 255 Cys Gly Ala Gly Asp Ala Arg Tyr Glu Gly Leu Cys Asp Arg Asp Gly 260 265 270 Cys Asp Phe Asn Ser Phe Arg Leu Gly Asn Lys Glu Phe Tyr Gly Pro 275 280 285 Glu Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Leu Val Thr Gln Phe 290 295 300 Val Thr Ala Asp Gly Thr Asp Thr Gly Ala Leu Gln Ser Ile Arg Arg 305 310 315 320 Phe Tyr Val Gln Asp Gly Thr Val Ile Pro Asn Ser Glu Thr Val Val 325 330 335 Glu Gly Val Asp Pro Thr Asn Glu Ile Thr Asp Asp Phe Cys Ala Gln 340 345 350 Gln Lys Thr Ala Phe Gly Asp Asn Asn His Phe Lys Thr Ile Gly Gly 355 360 365 Leu Pro Ala Met Gly Lys Ser Leu Glu Lys Met Val Leu Val Leu Ser 370 375 380 Ile Trp Asp Asp His Ala Val Tyr Met Asn Trp Leu Asp Ser Asn Tyr 385 390 395 400 Pro Thr Asp Ala Asp Pro Thr Lys Pro Gly Val Ala Arg Gly Arg Cys 405 410 415 Asp Pro Glu Ala Gly Val Pro Glu Thr Val Glu Ala Ala His Pro Asp 420 425 430 Ala Tyr Val Ile Tyr Ser Asn Ile Lys Ile Gly Ala Leu Asn Ser Thr 435 440 445 Phe Ala Ala Ala 450 <210> 154 <211> 526 <212> PRT <213> Thielavia terrestris <400> 154 Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala 1 5 10 15 Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser 20 25 30 Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser 35 40 45 Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser 50 55 60 Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp 65 70 75 80 Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser 85 90 95 Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe 100 105 110 Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu 115 120 125 Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu 130 135 140 Phe Thr Phe Asp Val Asp Val Ser Gly Leu Gly Cys Gly Leu Asn Gly 145 150 155 160 Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr 165 170 175 Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser 180 185 190 Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val 195 200 205 Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr 210 215 220 Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser 225 230 235 240 Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys 245 250 255 Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly 260 265 270 Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn 275 280 285 Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe 290 295 300 Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu 305 310 315 320 Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn 325 330 335 Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys 340 345 350 Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys 355 360 365 Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu 370 375 380 Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp 385 390 395 400 Ser Thr Tyr Pro Thr Asp Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly 405 410 415 Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala 420 425 430 Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly 435 440 445 Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly 450 455 460 Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser 465 470 475 480 Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly 485 490 495 Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro 500 505 510 Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu 515 520 525 <210> 155 <211> 455 <212> PRT <213> Thielavia terrestris <400> 155 Met Leu Ser Lys Ile Leu Ala Leu Gly Ala Leu Ala Gly Ala Ala Val 1 5 10 15 Ala Gln Gln Ala Gly Thr Gln Thr Ala Glu Asn His Pro Lys Met Ser 20 25 30 Trp Gln Lys Cys Ser Ser Gly Gly Ser Cys Thr Thr Val Gln Gly Glu 35 40 45 Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Lys Asn Gly Tyr 50 55 60 Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asn Thr Thr Ile Cys Ser Asp 65 70 75 80 Ala Lys Ser Cys Ala Ala Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser 85 90 95 Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Thr Leu Lys Phe 100 105 110 Val Thr Lys Gly Ser Tyr Ser Thr Asn Ile Gly Ser Arg Leu Tyr Met 115 120 125 Met Ala Ser Ser Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu 130 135 140 Phe Thr Phe Asp Val Asp Val Ser Lys Leu Gly Cys Gly Leu Asn Gly 145 150 155 160 Ala Leu Tyr Phe Val Ala Met Asp Glu Asp Gly Gly Met Ser Lys Tyr 165 170 175 Ser Ala Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala 180 185 190 Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Ser Ala 195 200 205 Gln Trp Thr Pro Ser Ser Asn Asp Gln Asn Ala Gly Val Gly Gln Tyr 210 215 220 Gly Ser Cys Cys Ala Glu Met Asp Ile Trp Tyr Ala Asn Ser Ile Ser 225 230 235 240 Ala Ala Val Thr Pro His Pro Cys Glu Thr Val Glu Gln His Gln Cys 245 250 255 Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Gly Asp Arg Tyr Gly Gly 260 265 270 Asp Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly Val 275 280 285 Lys Asp Phe Tyr Gly Pro Ser Met Thr Val Asp Thr Thr Lys Lys Phe 290 295 300 Thr Val Val Thr Gln Phe Ile Lys Gly Ser Asp Gly Glu Leu Ser Glu 305 310 315 320 Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Val Ile Glu Asn Ala Asn 325 330 335 Ser Thr Ile Pro Asn Asn Pro Gly Asn Ser Ile Thr Pro Asp Phe Cys 340 345 350 Lys Ala Gln Lys Val Ala Phe Gly Asp Arg Asp Val Phe Asn Glu Lys 355 360 365 Gly Gly Phe Pro Gln Phe Ser Lys Ala Val Gln Thr Pro Met Val Leu 370 375 380 Val Met Ser Leu Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp 385 390 395 400 Ser Thr Tyr Pro Val Asp Ala Asp Pro Ser Glu Pro Gly Lys Ala Arg 405 410 415 Gly Thr Cys Asp Thr Ser Ser Gly Val Pro Lys Asp Val Glu Ala Asn 420 425 430 Gln Ala Ser Asn Gln Val Ile Tyr Ser Asn Ile Lys Phe Gly Pro Ile 435 440 445 Gly Ser Thr Phe Lys Gln Ser 450 455 <210> 156 <211> 482 <212> PRT <213> Sporotrichum thermophile <400> 156 Met Ala Lys Lys Leu Phe Ile Thr Ala Ala Leu Ala Ala Ala Val Leu 1 5 10 15 Ala Ala Pro Val Ile Glu Glu Arg Gln Asn Cys Gly Ala Val Trp Thr 20 25 30 Gln Cys Gly Gly Asn Gly Trp Gln Gly Pro Thr Cys Cys Ala Ser Gly 35 40 45 Ser Thr Cys Val Ala Gln Asn Glu Trp Tyr Ser Gln Cys Leu Pro Asn 50 55 60 Ser Gln Val Thr Ser Ser Thr Thr Pro Ser Ser Thr Ser Thr Ser Gln 65 70 75 80 Arg Ser Thr Ser Thr Ser Ser Ser Thr Thr Arg Ser Gly Ser Ser Ser 85 90 95 Ser Ser Ser Thr Thr Pro Pro Pro Val Ser Ser Pro Val Thr Ser Ile 100 105 110 Pro Gly Gly Ala Thr Ser Thr Ala Ser Tyr Ser Gly Asn Pro Phe Ser 115 120 125 Gly Val Arg Leu Phe Ala Asn Asp Tyr Tyr Arg Ser Glu Val His Asn 130 135 140 Leu Ala Ile Pro Ser Met Thr Gly Thr Leu Ala Ala Lys Ala Ser Ala 145 150 155 160 Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile 165 170 175 Asp Thr Leu Met Val Gln Thr Leu Ser Gln Val Arg Ala Leu Asn Lys 180 185 190 Ala Gly Ala Asn Pro Pro Tyr Ala Ala Gln Leu Val Val Tyr Asp Leu 195 200 205 Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile 210 215 220 Ala Asn Gly Gly Ala Ala Asn Tyr Arg Ser Tyr Ile Asp Ala Ile Arg 225 230 235 240 Lys His Ile Ile Glu Tyr Ser Asp Ile Arg Ile Ile Leu Val Ile Glu 245 250 255 Pro Asp Ser Met Ala Asn Met Val Thr Asn Met Asn Val Ala Lys Cys 260 265 270 Ser Asn Ala Ala Ser Thr Tyr His Glu Leu Thr Val Tyr Ala Leu Lys 275 280 285 Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala 290 295 300 Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe 305 310 315 320 Ala Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ala Val Arg Gly Leu 325 330 335 Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Ser Ala Pro 340 345 350 Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu 355 360 365 Ala Phe Ser Pro Leu Leu Asn Ser Ala Gly Phe Pro Ala Arg Phe Ile 370 375 380 Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp 385 390 395 400 Gly Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr 405 410 415 Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp Val Lys Pro 420 425 430 Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp 435 440 445 Tyr His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly 450 455 460 Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro 465 470 475 480 Pro Phe <210> 157 <211> 395 <212> PRT <213> Sporotrichum thermophile <400> 157 Met Lys Phe Val Gln Ser Ala Thr Leu Ala Phe Ala Ala Thr Ala Leu 1 5 10 15 Ala Ala Pro Ser Arg Thr Thr Pro Gln Lys Pro Arg Gln Ala Ser Ala 20 25 30 Gly Cys Ala Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Phe Gln 35 40 45 Gln Tyr Thr Leu His Pro Asn Asn Phe Tyr Arg Ala Glu Val Glu Ala 50 55 60 Ala Ala Glu Ala Ile Ser Asp Ser Ala Leu Ala Glu Lys Ala Arg Lys 65 70 75 80 Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Thr Ile Glu Asn Ile 85 90 95 Gly Arg Leu Glu Pro Ala Leu Glu Asp Val Pro Cys Glu Asn Ile Val 100 105 110 Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys Ala 115 120 125 Ser Asn Gly Glu Leu Lys Val Gly Glu Leu Asp Arg Tyr Lys Thr Glu 130 135 140 Tyr Ile Asp Lys Ile Ala Glu Ile Leu Lys Ala His Ser Asn Thr Ala 145 150 155 160 Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr Asn 165 170 175 Ser Asp Leu Gln Thr Cys Gln Gln Ser Ala Ser Gly Tyr Arg Glu Gly 180 185 190 Val Ala Tyr Ala Leu Lys Gln Leu Asn Leu Pro Asn Val Val Met Tyr 195 200 205 Ile Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu Lys 210 215 220 Pro Gly Ala Gln Glu Leu Ala Ser Val Tyr Lys Ser Ala Gly Ser Pro 225 230 235 240 Ser Gln Val Arg Gly Ile Ser Thr Asn Val Ala Gly Trp Asn Ala Trp 245 250 255 Asp Gln Glu Pro Gly Glu Phe Ser Asp Ala Ser Asp Ala Gln Tyr Asn 260 265 270 Lys Cys Gln Asn Glu Lys Ile Tyr Ile Asn Thr Phe Gly Ala Glu Leu 275 280 285 Lys Ser Ala Gly Met Pro Asn His Ala Ile Ile Asp Thr Gly Arg Asn 290 295 300 Gly Val Thr Gly Leu Arg Asp Glu Trp Gly Asp Trp Cys Asn Val Asn 305 310 315 320 Gly Ala Gly Phe Gly Val Arg Pro Thr Ala Asn Thr Gly Asp Glu Leu 325 330 335 Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr 340 345 350 Ser Asp Ser Ser Ala Ala Arg Tyr Asp Ser Phe Cys Gly Lys Pro Asp 355 360 365 Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Gln Ala Tyr Phe 370 375 380 Glu Met Leu Leu Lys Asn Ala Asn Pro Ser Phe 385 390 395 <210> 158 <211> 481 <212> PRT <213> Thielavia terrestris <400> 158 Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu 1 5 10 15 Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser 20 25 30 Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly 35 40 45 Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn 50 55 60 Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg 65 70 75 80 Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr 85 90 95 Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro 100 105 110 Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly 115 120 125 Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu 130 135 140 Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val 145 150 155 160 Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp 165 170 175 Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys 180 185 190 Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro 195 200 205 Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala 210 215 220 Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser 225 230 235 240 Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro 245 250 255 Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala 260 265 270 Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln 275 280 285 Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly 290 295 300 Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala 305 310 315 320 Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala 325 330 335 Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser 340 345 350 Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala 355 360 365 Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr 370 375 380 Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly 385 390 395 400 Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr 405 410 415 Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly 420 425 430 Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr 435 440 445 His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr 450 455 460 Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro 465 470 475 480 Phe <210> 159 <211> 2394 <212> DNA <213> Trichoderma reesei <400> 159 atggtgaata acgcagctct tctcgccgcc ctgtcggctc tcctgcccac ggccctggcg 60 cagaacaatc aaacatacgc caactactct gctcagggcc agcctgatct ctaccccgag 120 acacttgcca cgctcacact ctcgttcccc gactgcgaac atggccccct caagaacaat 180 ctcgtctgtg actcatcggc cggctatgta gagcgagccc aggccctcat ctcgctcttc 240 accctcgagg agctcattct caacacgcaa aactcgggcc ccggcgtgcc tcgcctgggt 300 cttccgaact accaagtctg gaatgaggct ctgcacggct tggaccgcgc caacttcgcc 360 accaagggcg gccagttcga atgggcgacc tcgttcccca tgcccatcct cactacggcg 420 gccctcaacc gcacattgat ccaccagatt gccgacatca tctcgaccca agctcgagca 480 ttcagcaaca gcggccgtta cggtctcgac gtctatgcgc caaacgtcaa tggcttccga 540 agccccctct ggggccgtgg ccaggagacg cccggcgaag acgccttttt cctcagctcc 600 gcctatactt acgagtacat cacgggcatc cagggtggcg tcgaccctga gcacctcaag 660 gttgccgcca cggtgaagca ctttgccgga tacgacctcg agaactggaa caaccagtcc 720 cgtctcggtt tcgacgccat cataactcag caggacctct ccgaatacta cactccccag 780 ttcctcgctg cggcccgtta tgcaaagtca cgcagcttga tgtgcgcata caactccgtc 840 aacggcgtgc ccagctgtgc caacagcttc ttcctgcaga cgcttttgcg cgagagctgg 900 ggcttccccg aatggggata cgtctcgtcc gattgcgatg ccgtctacaa cgttttcaac 960 cctcatgact acgccagcaa ccagtcgtca gccgccgcca gctcactgcg agccggcacc 1020 gatatcgact gcggtcagac ttacccgtgg cacctcaacg agtcctttgt ggccggcgaa 1080 gtctcccgcg gcgagatcga gcggtccgtc acccgtctgt acgccaacct cgtccgtctc 1140 ggatacttcg acaagaagaa ccagtaccgc tcgctcggtt ggaaggatgt cgtcaagact 1200 gatgcctgga acatctcgta cgaggctgct gttgagggca tcgtcctgct caagaacgat 1260 ggcactctcc ctctgtccaa gaaggtgcgc agcattgctc tgatcggacc atgggccaat 1320 gccacaaccc aaatgcaagg caactactat ggccctgccc catacctcat cagccctctg 1380 gaagctgcta agaaggccgg ctatcacgtc aactttgaac tcggcacaga gatcgccggc 1440 aacagcacca ctggctttgc caaggccatt gctgccgcca agaagtcgga tgccatcatc 1500 tacctcggtg gaattgacaa caccattgaa caggagggcg ctgaccgcac ggacattgct 1560 tggcccggta atcagctgga tctcatcaag cagctcagcg aggtcggcaa accccttgtc 1620 gtcctgcaaa tgggcggtgg tcaggtagac tcatcctcgc tcaagagcaa caagaaggtc 1680 aactccctcg tctggggcgg atatcccggc cagtcgggag gcgttgccct cttcgacatt 1740 ctctctggca agcgtgctcc tgccggccga ctggtcacca ctcagtaccc ggctgagtat 1800 gttcaccaat tcccccagaa tgacatgaac ctccgacccg atggaaagtc aaaccctgga 1860 cagacttaca tctggtacac cggcaaaccc gtctacgagt ttggcagtgg tctcttctac 1920 accaccttca aggagactct cgccagccac cccaagagcc tcaagttcaa cacctcatcg 1980 atcctctctg ctcctcaccc cggatacact tacagcgagc agattcccgt cttcaccttc 2040 gaggccaaca tcaagaactc gggcaagacg gagtccccat atacggccat gctgtttgtt 2100 cgcacaagca acgctggccc agccccgtac ccgaacaagt ggctcgtcgg attcgaccga 2160 cttgccgaca tcaagcctgg tcactcttcc aagctcagca tccccatccc tgtcagtgct 2220 ctcgcccgtg ttgattctca cggaaaccgg attgtatacc ccggcaagta tgagctagcc 2280 ttgaacaccg acgagtctgt gaagcttgag tttgagttgg tgggagaaga ggtaacgatt 2340 gagaactggc cgttggagga gcaacagatc aaggatgcta cacctgacgc ataa 2394 <210> 160 <211> 780 <212> DNA <213> Trichoderma reesei <400> 160 atggtctcct tcacctccct cctcgccggc gtcgccgcca tctcgggcgt cttggccgct 60 cccgccgccg aggtcgaatc cgtggctgtg gagaagcgcc agacgattca gcccggcacg 120 ggctacaaca acggctactt ctactcgtac tggaacgatg gccacggcgg cgtgacgtac 180 accaatggtc ccggcgggca gttctccgtc aactggtcca actcgggcaa ctttgtcggc 240 ggcaagggat ggcagcccgg gaccaagaac aagtaagact acctactctt accccctttg 300 accaacacag cacaacacaa tacaacacat gtgactacca atcatggaat cggatctaac 360 agctgtgttt taaaaaaaag ggtcatcaac ttctcgggaa gctacaaccc caacggcaac 420 agctacctct ccgtgtacgg ctggtcccgc aaccccctga tcgagtacta catcgtcgag 480 aactttggca cctacaaccc gtccacgggc gccaccaagc tgggcgaggt cacctccgac 540 ggcagcgtct acgacattta ccgcacgcag cgcgtcaacc agccgtccat catcggcacc 600 gccacctttt accagtactg gtccgtccgc cgcaaccacc gctcgagcgg ctccgtcaac 660 acggcgaacc acttcaacgc gtgggctcag caaggcctga cgctcgggac gatggattac 720 cagattgttg ccgtggaggg ttactttagc tctggctctg cttccatcac cgtcagctaa 780 <210> 161 <211> 368 <212> PRT <213> Thielavia terrestris <400> 161 Met Pro Ser Phe Ala Ser Lys Thr Leu Leu Ser Thr Leu Ala Gly Ala 1 5 10 15 Ala Ser Val Ala Ala His Gly His Val Ser Asn Ile Val Ile Asn Gly 20 25 30 Val Ser Tyr Gln Gly Tyr Asp Pro Thr Ser Phe Pro Tyr Met Gln Asn 35 40 45 Pro Pro Ile Val Val Gly Trp Thr Ala Ala Asp Thr Asp Asn Gly Phe 50 55 60 Val Ala Pro Asp Ala Phe Ala Ser Gly Asp Ile Ile Cys His Lys Asn 65 70 75 80 Ala Thr Asn Ala Lys Gly His Ala Val Val Ala Ala Gly Asp Lys Ile 85 90 95 Phe Ile Gln Trp Asn Thr Trp Pro Glu Ser His His Gly Pro Val Ile 100 105 110 Asp Tyr Leu Ala Ser Cys Gly Ser Ala Ser Cys Glu Thr Val Asp Lys 115 120 125 Thr Lys Leu Glu Phe Phe Lys Ile Asp Glu Val Gly Leu Val Asp Gly 130 135 140 Ser Ser Ala Pro Gly Val Trp Gly Ser Asp Gln Leu Ile Ala Asn Asn 145 150 155 160 Asn Ser Trp Leu Val Glu Ile Pro Pro Thr Ile Ala Pro Gly Asn Tyr 165 170 175 Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Glu Asn Ala Asp 180 185 190 Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Ile Thr Gly Thr 195 200 205 Gly Thr Ala Thr Pro Ser Gly Val Pro Gly Thr Ser Leu Tyr Thr Pro 210 215 220 Thr Asp Pro Gly Ile Leu Val Asn Ile Tyr Ser Ala Pro Ile Thr Tyr 225 230 235 240 Thr Val Pro Gly Pro Ala Leu Ile Ser Gly Ala Val Ser Ile Ala Gln 245 250 255 Ser Ser Ser Ala Ile Thr Ala Ser Gly Thr Ala Leu Thr Gly Ser Ala 260 265 270 Thr Ala Pro Ala Ala Ala Ala Ala Thr Thr Thr Ser Thr Thr Asn Ala 275 280 285 Ala Ala Ala Ala Thr Ser Ala Ala Ala Ala Ala Gly Thr Ser Thr Thr 290 295 300 Thr Thr Ser Ala Ala Ala Val Val Gln Thr Ser Ser Ser Ser Ser Ser 305 310 315 320 Ala Pro Ser Ser Ala Ala Ala Ala Ala Thr Thr Thr Ala Ala Ala Ser 325 330 335 Ala Arg Pro Thr Gly Cys Ser Ser Gly Arg Ser Arg Lys Gln Pro Arg 340 345 350 Arg His Ala Arg Asp Met Val Val Ala Arg Gly Ala Glu Glu Ala Asn 355 360 365 <210> 162 <211> 520 <212> PRT <213> Artificial Sequence <220> <223> synthetic consensus sequence <220> <221> misc_feature <222> (19)..(21) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (37)..(37) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (46)..(46) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (49)..(49) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (53)..(56) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (73)..(73) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (109)..(111) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (128)..(134) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (139)..(140) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (154)..(163) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (167)..(172) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (220)..(225) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (244)..(245) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (247)..(247) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (253)..(255) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (257)..(272) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (275)..(275) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (290)..(296) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (298)..(299) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (301)..(301) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (313)..(313) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (321)..(321) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (324)..(334) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (338)..(339) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (342)..(342) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (351)..(351) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (353)..(353) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (355)..(355) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (359)..(364) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (366)..(368) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (370)..(383) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (385)..(386) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (388)..(388) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (392)..(396) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (398)..(399) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (401)..(446) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (453)..(453) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (455)..(457) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (460)..(460) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (462)..(463) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (466)..(466) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (468)..(468) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (470)..(497) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (499)..(510) <223> Xaa can be any naturally occurring amino acid or skipped <220> <221> misc_feature <222> (515)..(520) <223> Xaa can be any naturally occurring amino acid or skipped <400> 162 Met Lys Ser Ser Ala Ser Leu Leu Leu Leu Ala Ala Leu Ala Gly Ala 1 5 10 15 Ala Ala Xaa Xaa Xaa Val Ala Ala His Gly His Val Val Asn Gly Val 20 25 30 Ile Asn Gly Val Xaa Tyr Gln Gly Tyr Asp Pro Thr Thr Xaa Pro Tyr 35 40 45 Xaa Asn Asn Pro Xaa Xaa Xaa Xaa Pro Ser Val Val Gly Trp Cys Asn 50 55 60 Ala Gly Thr Asp Asn Gly Phe Val Xaa Pro Asp Ala Tyr Ala Ser Pro 65 70 75 80 Asp Ile Ile Cys His Lys Gly Ala Thr Asn Ala Lys Gly His Ala Thr 85 90 95 Val Ala Ala Gly Asp Lys Ile Ser Ile Gln Trp Thr Xaa Xaa Xaa Trp 100 105 110 Pro Glu Ser His Lys Gly Pro Val Ile Asp Tyr Leu Ala Lys Cys Xaa 115 120 125 Xaa Xaa Xaa Xaa Xaa Xaa Gly Gly Cys Thr Xaa Xaa Thr Val Asp Lys 130 135 140 Thr Ser Leu Gly Trp Phe Lys Ile Asp Xaa Xaa Xaa Xaa Xaa Xaa Xaa 145 150 155 160 Xaa Xaa Xaa Gly Val Gly Xaa Xaa Xaa Xaa Xaa Xaa Asp Pro Gly Val 165 170 175 Trp Ala Thr Asp Asp Leu Ile Ala Asn Asn Asn Ser Trp Leu Val Lys 180 185 190 Ile Pro Ser Asp Ile Ala Pro Gly Asn Tyr Val Leu Arg His Glu Ile 195 200 205 Ile Ala Leu His Ser Ala Gly Ser Ala Asn Gly Xaa Xaa Xaa Xaa Xaa 210 215 220 Xaa Ala Gln Asn Tyr Pro Gln Cys Ala Asn Leu Gln Val Thr Gly Ser 225 230 235 240 Gly Ser Ala Xaa Xaa Ser Xaa Pro Ser Gly Val Lys Xaa Xaa Xaa Pro 245 250 255 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 260 265 270 Gly Thr Xaa Leu Tyr Lys Ala Thr Asp Pro Gly Ile Leu Val Asn Ile 275 280 285 Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa Xaa Ser Xaa Tyr Thr Val 290 295 300 Pro Gly Pro Ala Val Ile Thr Gly Xaa Ala Ser Ser Val Ala Gln Ser 305 310 315 320 Xaa Ser Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Ala 325 330 335 Thr Xaa Xaa Ala Val Xaa Pro Gly Gly Thr Ala Pro Ala Pro Xaa Ala 340 345 350 Xaa Thr Xaa Ala Ser Thr Xaa Xaa Xaa Xaa Xaa Xaa Thr Xaa Xaa Xaa 355 360 365 Thr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala 370 375 380 Xaa Xaa Gly Xaa Ser Ala Pro Xaa Xaa Xaa Xaa Xaa Cys Xaa Xaa Ala 385 390 395 400 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 405 410 415 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 420 425 430 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Tyr Gly 435 440 445 Gln Cys Gly Gly Xaa Gly Xaa Xaa Xaa Thr Gly Xaa Thr Xaa Xaa Cys 450 455 460 Ala Xaa Gly Xaa Thr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 465 470 475 480 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 485 490 495 Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Tyr Tyr 500 505 510 Ser Gln Xaa Xaa Xaa Xaa Xaa Xaa 515 520

Claims

a. 바이오매스(biomass) 재료
b.
i. 서열 번호 1 내지 29 및 148 중 어느 하나에 대해 서열 동일성이 65% 이상이거나;
ii. 서열 번호 27의 잔기 22 내지 344에 대해 서열 동일성이 65% 이상이거나
iii. 서열 번호 84 내지 91로 구성된 군으로부터 선택된 하나 이상의 아미노산 서열 모티프를 포함하거나;
iv. (1) 서열 번호 84 및 88; (2) 서열 번호 85 및 88; (3) 서열 번호 86; (4) 서열 번호 87; (5) 서열 번호 84, 88, 및 89; (6) 서열 번호 84, 88, 및 91; (10) 서열 번호 85, 88, 및 91; (11) 서열 번호 84, 88, 89, 및 91; (12) 서열 번호 84, 88, 90, 및 91; (13) 서열 번호 85, 88, 89, 및 91; 및 (14) 서열 번호 85, 88, 90, 및 91로 구성된 군으로부터 선택된 하나 이상의 서열 모티프를 포함하거나;
v. 서열 번호 30에 대해 서열 동일성이 65% 이상인 폴리뉴클레오티드 서열 또는 그의 상보체(complement)에 의해 암호화되거나;
vi. 높은 엄격성 조건 하에 서열 번호 30 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드 서열에 의해 암호화되는; 엔도글루카나아제 활성을 갖는 글리코실 하이드롤라아제 패밀리(family) 61 효소를 포함하는 효소 조성물을 포함하며;
여기서, 글리코실 하이드롤리아제 패밀리 61 효소가 없는 바이오매스 당화 혼합물보다 더 낮은 점도를 갖고/갖거나, 글리코실 하이드롤라아제 패밀리 61 효소를 갖지 않거나 더 낮은 수준으로 갖는 혼합물 내의 당화 수준에 비교하여 혼합물 내의 당화 수준을 증가시킬 수 있는, 바이오매스 당화 혼합물.
제1항에 있어서, 바이오매스의 당화를 유발하기에 충분한 기간 동안 혼합물을 인큐베이션한 후의 발효가능한 당(fermentable sugar)의 수율에 의해 당화 수준이 측정되는 바이오매스 당화 혼합물.
제1항 또는 제2항에 있어서, 글리코실 하이드롤라아제 패밀리 61 효소가 사상 진균으로부터 유도되는 바이오매스 당화 혼합물.
제3항에 있어서, 사상 진균이 트리코더마, 휴미콜라, 푸사리움, 아스페르길루스, 뉴로스포라, 페니실리움, 세팔로스포리움, 아클리아, 포도스포라, 엔도티아, 무코르, 코클리오볼루스, 피리쿨라리아, 크리소스포리움, 아스페르길루스 아와모리, 아스페르길루스 푸미가투스, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리제, 크리소스포리움 루크노엔스, 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 푸사리움 베네나툼, 브제르칸데라 아두스타, 세리포리옵시스 아네이리나, 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아, 세리포리옵시스 길베센스, 세리포리옵시스 판노신타, 세리포리옵시스 리불로사, 세리포리옵시스 서브루파, 세리포리옵시스 서브베르미스포라, 코프리누스 시네레우스, 코리올루스 히르수투스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 뉴로스포라 인터미디아, 페니실리움 푸르푸로게눔, 페니실리움 카네센스, 페니실리움 솔리툼, 페니실리움 푸니쿨로섬 파네로카에테 크리소스포리움, 플레비아 라디아테, 플레우로투스 에린기, 탈라로마이세스 플라부스, 티엘라비아 테레스트리스, 트라메테스 빌로사, 트라메테스 베르시콜로르, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 트리코더마 레세이, 트리코더마 비리데, 지오스미티아 에메르소니, 또는 G. 스테아로테르모필루스의 군으로부터 선택된 것인 바이오매스 당화 혼합물.
제1항 내지 제4항 중 어느 한 항에 있어서, 효소 조성물이 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드 및 베타-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드를 추가로 포함하는 바이오매스 당화 혼합물.
제5항에 있어서, 셀로바이오하이드롤라아제 활성을 갖는 하나 이상의 폴리펩티드가 T. 레세이 CBH1, Af 7A(서열 번호 150), Af7B(서열 번호 151), Cg7A(서열 번호 152), Cg7B(서열 번호 153), Tt7A(서열 번호 154), Tt7B(서열 번호 155), T. 레세이 CBH2, Tt6A(서열 번호 156), St6A(서열 번호 157), St6B(서열 번호 158), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드인 바이오매스 당화 혼합물.
제5항 또는 제6항에 있어서, 베타-글루코시다아제 활성을 갖는 하나 이상의 폴리펩티드가
a. Fv3C(서열 번호 100), Pa3D(서열 번호 94), Fv3G(서열 번호 96), Fv3D(서열 번호 98), Tr3A(서열 번호 102), Tr3B(서열 번호 104), Te3A(서열 번호 106), An3A(서열 번호 108), Fo3A(서열 번호 110), Gz3A(서열 번호 112), Nh3A(서열 번호 114), Vd3A(서열 번호 116), Pa3G(서열 번호 118), Tn3B(서열 번호 119), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드; 또는
b. (1) 서열 번호 99, 93, 95, 97, 101, 103, 105, 107, 109, 111, 113, 115, 또는 117에 대해 90% 이상의 서열 동일성을 갖거나; (2) 높은 엄격성 조건 하에 서열 번호 99, 93, 95, 97, 101, 103, 105, 107, 109, 111, 113, 115, 또는 117, 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드인 바이오매스 당화 혼합물.
제7항 내지 제9항 중 어느 한 항에 있어서, 효소 조성물이 (1) 자일라나아제 활성을 갖는 폴리펩티드, (2) 베타-자일로시다아제 활성을 갖는 폴리펩티드; 및 (3) L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드 중 하나 이상 또는 전부를 추가로 포함하는 바이오매스 당화 혼합물.
제8항에 있어서, 자일라나아제 활성을 갖는 폴리펩티드가
a. T. 레세이 Xyn3(서열 번호 76), T. 레세이 Xyn2(서열 번호 77), AfuXyn2(서열 번호 58), AfuXyn5(서열 번호 60), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드; 또는
b. (1) 서열 번호 75, 57, 또는 59에 대해 90% 이상의 서열 동일성을 갖거나; (2) 높은 엄격성 조건 하에 서열 번호 75, 57, 또는 59, 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드인 바이오매스 당화 혼합물.
제8항에 있어서, 베타-자일로시다아제 활성을 갖는 하나 이상의 폴리펩티드가
a. Fv3A(서열 번호 36), Fv43A(서열 번호 44), Pf43A(서열 번호 38), Fv43D(서열 번호 62), Fv39A(서열 번호 42), Fv43E(서열 번호 40), Fo43A(서열 번호 52), Fv43B(서열 번호 46), Pa51A(서열 번호 48), Gz43A(서열 번호 50), T. 레세이 Bxl1(서열 번호 78), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드; 또는
b. (1) 서열 번호 35, 43, 37, 61, 41, 39, 51, 45, 47, 49, 또는 159에 대해 90% 이상의 서열 동일성을 갖거나; (2) 높은 엄격성 조건 하에 서열 번호 35, 43, 37, 61, 41, 39, 51, 45, 47, 49, 159, 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드인 바이오매스 당화 혼합물.
제8항에 있어서, L-알파-아라비노푸라노시다아제 활성을 갖는 하나 이상의 폴리펩티드가
a. Af43A(서열 번호 54), Fv43B(서열 번호 46), Pf51A(서열 번호 56), Pa51A(서열 번호 48), Fv51A(서열 번호 66), 또는 그에 대해 90% 이상의 서열 동일성을 갖는 그의 변종을 암호화하는 폴리펩티드; 또는
b. (1) 서열 번호 53, 45, 55, 47, 또는 65에 대해 90% 이상의 서열 동일성을 갖거나; (2) 높은 엄격성 조건 하에 서열 번호 53, 45, 55, 47, 또는 65, 또는 그의 상보체에 혼성화되는 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드인 바이오매스 당화 혼합물.
제1항 내지 제11항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량을 기준으로 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 15 중량%의 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드; 또는 (2) 바이오매스 재료 내에 함유된 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 1 ㎎ 내지 약 5 ㎎의 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 바이오매스 당화 혼합물.
제5항 내지 제12항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 80 중량%, 약 5 중량% 내지 약 70 중량%, 약 10 중량% 내지 약 60 중량%, 약 20 중량% 내지 약 50 중량%, 또는 약 25 중량% 내지 약 50 중량%; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎인 양으로 셀룰로바이오하이드롤라아제를 포함하고; (1) 효소 조성물 내의 단백질의 총 중량의 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 30 중량%, 약 2 중량% 내지 약 20 중량%, 약 5 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎인 양으로 베타-글루코시다아제를 포함하는 바이오매스 당화 혼합물.
제8항 내지 제13항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량을 기준으로 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 40 중량%, 약 4 중량% 내지 약 30 중량%, 약 5 중량% 내지 약 20 중량%, 또는 약 8 중량% 내지 약 15 중량%의 자일라나아제 활성을 갖는 폴리펩티드; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎의 자일라나아제 활성을 갖는 폴리펩티드를 포함하는 바이오매스 당화 혼합물.
제8항 내지 제14항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량을 기준으로 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 40 중량%, 약 2 중량% 내지 약 30 중량%, 약 4 중량% 내지 약 20 중량%, 또는 약 5 중량% 내지 약 15 중량%의 베타-자일로시다아제 활성을 갖는 폴리펩티드; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎의 베타-자일로시다아제 활성을 갖는 폴리펩티드를 포함하는 바이오매스 당화 혼합물.
제8항 내지 제15항 중 어느 한 항에 있어서, 효소 조성물이 (1) 효소 조성물 내의 단백질의 총 중량을 기준으로 약 0.1 중량% 내지 약 50 중량%, 약 0.1 중량% 내지 약 50 중량%, 약 1 중량% 내지 약 40 중량%, 약 2 중량% 내지 약 30 중량%, 약 4 중량% 내지 약 20 중량%, 또는 약 5 중량% 내지 약 15 중량%의 L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드; 또는 (2) 바이오매스 당화 혼합물 내의 셀룰로오스, 헤미셀룰로오스, 또는 셀룰로오스와 헤미셀룰로오스의 혼합물의 그램 당 약 0.2 ㎎ 내지 약 30 ㎎, 약 0.2 ㎎ 내지 약 20 ㎎, 약 0.5 ㎎ 내지 약 10 ㎎, 또는 약 0.5 ㎎ 내지 약 5 ㎎의 L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드를 포함하는 바이오매스 당화 혼합물.
제1항 내지 제16항 중 어느 한 항에 있어서, 효소 조성물이 전체 셀룰라아제(whole cellulase) 조성물인 바이오매스 당화 혼합물.
제17항에 있어서, 전체 셀룰라아제 조성물이 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 발현시키는 숙주 세포로부터 유도되는 바이오매스 당화 혼합물.
제18항에 있어서, GH61 패밀리 효소 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드가 숙주 세포에 대해 이종성인 바이오매스 당화 혼합물.
제17항 내지 제19항 중 어느 한 항에 있어서, 전체 셀룰라아제 조성물이 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드, 및 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 추가로 발현시키는 숙주 세포로부터 유도되는 바이오매스 당화 혼합물.
제20항에 있어서, 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드 및/또는 베타-글루코시다아제를 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드가 숙주 세포에 대해 이종성인 바이오매스 당화 혼합물.
제17항 내지 제21항 중 어느 한 항에 있어서, 전체 셀룰라아제 조성물이 (1) 베타-자일로시다아제 활성을 갖는 펩티드를 암호화하는 폴리뉴클레오티드; (2) 자일라나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드; 및 (3) L-알파-아라비노푸라노시다아제 활성을 갖는 폴리뉴클레오티드 펩티드 중 하나 이상 또는 전부를 발현시키는 숙주 세포로부터 유도되는 바이오매스 당화 혼합물.
제22항에 있어서, 베타-자일로시다아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드, 자일라나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드, 또는 L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드가 숙주 세포에 대해 이종성인 바이오매스 당화 혼합물.
제17항 내지 제23항 중 어느 한 항에 있어서, 효소 조성물이 전체 브로스 제형(whole broth formulation)인 바이오매스 당화 혼합물.
제1항 내지 제24항 중 어느 한 항에 있어서, (1) GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; (2) 셀로바이오하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; (3) 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; (4) 베타-자일로시다아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; (5) 자일라나아제 활성을 갖는 폴리펩티드를 암호화하는 유전자; 및 (6) L-알파-아라비노푸라노시다아제 활성을 갖는 폴리펩티드를 암호화하는 유전자 중 하나 이상 또는 전부가 숙주 세포의 유전 물질 내로 통합된 바이오매스 당화 혼합물.
제18항 내지 제25항 중 어느 한 항에 있어서, 숙주 세포가 박테리아 숙주 세포, 효모 숙주 세포, 또는 진균 숙주 세포인 바이오매스 당화 혼합물.
제26항에 있어서, 숙주 세포가 사상 진균 숙주 세포인 바이오매스 당화 혼합물.
제27항에 있어서, 사상 진균 숙주 세포가 아스페르길루스 니게르, 아스페르길루스 오리제, 크리소스포리움 루크노엔스, 트리코더마 레세이, 아스페르길루스 아와모리, 아스페르길루스 푸미가투스, 아스페르길루스 포에티두스, 아스페르길루스 자포니쿠스, 아스페르길루스 니둘란스, 푸사리움 박트리디오이데스, 푸사리움 세레알리스, 푸사리움 크루크웰렌스, 푸사리움 컬모룸, 푸사리움 그라미네아룸, 푸사리움 그라미눔, 푸사리움 헤테로스포룸, 푸사리움 네군디, 푸사리움 옥시스포룸, 푸사리움 레티쿨라툼, 푸사리움 로제움, 푸사리움 삼부치눔, 푸사리움 사르코크로움, 푸사리움 스포로트리키오이데스, 푸사리움 설푸리움, 푸사리움 토룰로섬, 푸사리움 트리코테치오이데스, 푸사리움 베네나툼, 브제르칸데라 아두스타, 세리포리옵시스 아네이리나, 세리포리옵시스 아네이리나, 세리포리옵시스 카레기아, 세리포리옵시스 길베센스, 세리포리옵시스 판노신타, 세리포리옵시스 리불로사, 세리포리옵시스 서브루파, 세리포리옵시스 서브베르미스포라, 코프리누스 시네레우스, 코리올루스 히르수투스, 휴미콜라 인솔렌스, 휴미콜라 라누기노사, 무코르 미에헤이, 마이셀리오프토라 테르모필라, 뉴로스포라 크라사, 뉴로스포라 인터미디아, 페니실리움 푸르푸로게눔, 페니실리움 카네센스, 페니실리움 솔리툼, 페니실리움 푸니쿨로섬 파네로카에테 크리소스포리움, 플레비아 라디아테, 플레우로투스 에린기, 탈라로마이세스 플라부스, 티엘라비아 테레스트리스, 트라메테스 빌로사, 트라메테스 베르시콜로르, 트리코더마 하르지아눔, 트리코더마 코닌기, 트리코더마 롱지브라치아툼, 또는 트리코더마 비리데의 세포로부터 선택된 것인 바이오매스 당화 혼합물.
제1항 내지 제28항 중 어느 한 항에 있어서, 먼저 GH61/엔도글루카나아제 활성을 갖는 폴리펩티드를 포함하는 효소 조성물을 블렌딩한 후에 효소 조성물을 바이오매스와 혼합하는 단계에 의해 제조되는 바이오매스 당화 혼합물.
제1항 내지 제29항 중 어느 한 항에 있어서, 바이오매스 재료가 헤미셀룰로오스, 셀룰로오스, 또는 헤미셀룰로오스와 셀룰로오스의 혼합물을 포함하는 바이오매스 당화 혼합물.
제1항 내지 제30항 중 어느 한 항에 있어서, 바이오매스 재료가 글루칸, 자일란 및/또는 리그닌을 포함하는 바이오매스 당화 혼합물.
제1항 내지 제30항 중 어느 한 항에 있어서, 바이오매스 재료가 종자, 낟알, 괴경, 식물 폐기물, 식품 가공 또는 산업적 가공의 부산물, 옥수수 속대(corn cob), 옥수수 대(corn stover), 초본류(grass), 소르가스트룸 누탄스, 스위치그래스, 다년생 케인, 목재, 우드칩(wood chip), 목재 가공 폐기물, 톱밥, 종이, 종이 폐기물, 펄프, 및 재활용 종이, 감자, 대두, 보리, 호밀, 귀리, 밀, 비트(beet), 사탕수수 바가스(sugar cane bagasse) 및 짚으로부터 선택되는 바이오매스 당화 혼합물.
제1항 내지 제32항 중 어느 한 항에 있어서, 바이오매스 재료에 산 또는 염기를 이용하는 전처리를 적용하는 바이오매스 당화 혼합물.
제33항에 있어서, 전처리된 바이오매스를 효소 조성물과 혼합하기 전에 약 4.0 내지 6.5의 pH로 조정하는 바이오매스 당화 혼합물.
제1항 내지 제34항 중 어느 한 항에 있어서, 바이오매스 재료가 혼합물의 총 중량에 대한 그의 고체 상태의 바이오매스 재료의 양을 기준으로 약 5 중량% 내지 약 60 중량%, 약 10 중량% 내지 약 50 중량%, 약 15 중량% 내지 약 40 중량%, 약 15 중량% 내지 약 30 중량%, 또는 약 20 중량% 내지 약 30 중량%의 양으로 혼합물 내에 존재하는 바이오매스 당화 혼합물.
바이오매스 당화 혼합물 내의 바이오매스 재료를 가수분해하기에 적합한 조건 하에 충분한 기간 동안 제1항 내지 제35항 중 어느 한 항의 바이오매스 당화 혼합물을 인큐베이션하는 단계를 포함하는, 바이오매스 재료를 가수분해하는 방법.
제36항에 있어서, 바이오매스 당화 혼합물 내의 바이오매스 재료를 가수분해하기에 적합한 조건이, (1) 약 3.5 내지 약 7.0의 pH; (2) 약 2 시간 이상의 지속기간; 및/또는 (3) 약 20℃ 내지 약 75℃의 온도를 포함하는 방법.
제36항 또는 제37항에 있어서, 충분한 기간이 약 8 시간 내지 약 72 시간의 기간을 포함하는 방법.
제36항 내지 제38항 중 어느 한 항에 있어서, 2 시간 초과의 임의의 주어진 시간에, 바이오매스 당화 혼합물에 의해 생성되는 발효가능한 당의 양이, 동일한 양 및 유형의 바이오매스 재료, 및 동일한 조성의 효소 구성요소를 포함하나 GH61/엔도글루카나아제가 없는 대조군 바이오매스 당화 혼합물에 의해 생성되는 발효가능한 당의 양에 비교하여 약 5% 이상 만큼 증가되는 방법.
제39항에 있어서, 바이오매스 당화에 의해 생성되는 발효가능한 당의 양이, 대조군 바이오매스 당화 혼합물에 의해 생성되는 발효가능한 당에 비교하여 약 10% 이상 만큼 증가되는 방법.
제36항 내지 제40항 중 어느 한 항에 있어서, 바이오매스 재료가 그의 고체 상태에서 약 10 중량% 내지 약 50 중량%의 양으로 존재하는 방법.
제41항에 있어서, 바이오매스 당화 혼합물의 점도가, 동일한 양 및 유형의 바이오매스 재료, 및 동일한 조성의 효소 구성요소를 포함하나 GH61/엔도글루카나아제가 없는 대조군 바이오매스 당화 혼합물의 점도에 비교하여 적어도 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 또는 그 이상 만큼 감소되는 방법.
상업 효소 공급 모델(merchant enzyme supply model) 또는 현장 생물정제 모델(on-site bio-refinery model)에서 바이오매스 재료를 발효가능한 당으로 전환시키기 위한, 제1항 내지 제35항 중 어느 한 항의 조성물의 사용 방법.