KR20100029088A - 셀룰로오스성 물질의 분해를 위한 조성물 - Google Patents

셀룰로오스성 물질의 분해를 위한 조성물 Download PDF

Info

Publication number
KR20100029088A
KR20100029088A KR1020097025755A KR20097025755A KR20100029088A KR 20100029088 A KR20100029088 A KR 20100029088A KR 1020097025755 A KR1020097025755 A KR 1020097025755A KR 20097025755 A KR20097025755 A KR 20097025755A KR 20100029088 A KR20100029088 A KR 20100029088A
Authority
KR
South Korea
Prior art keywords
seq
polypeptide
mature polypeptide
sequence
amino acid
Prior art date
Application number
KR1020097025755A
Other languages
English (en)
Inventor
산드라 메리노
키이스 맥파랜드
조엘 체리
사라 티터
Original Assignee
노보자임스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노보자임스 인코포레이티드 filed Critical 노보자임스 인코포레이티드
Publication of KR20100029088A publication Critical patent/KR20100029088A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/16Preparation of compounds containing saccharide radicals produced by the action of an alpha-1, 6-glucosidase, e.g. amylose, debranched amylopectin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

본 발명은 셀룰로오스-함유 물질을 분해 또는 전환하기 위한 셀룰로오스 가수분해 조성물 및 조성물의 제조 및 사용 방법에 관한 것이다. 조성물은 (a) 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드, (b) 베타 글루코시다아제 및 (c) T. reesei 셀로비오히드롤라아제 I, T. reesei 셀로비오히드롤라아제 II 및 T. reesei 엔도글루카나아제 및 그것의 변이체로 구성된 군에서 선택된 하나 이상의 셀룰로오스 가수분해 효소를 포함한다.
셀룰로오스-함유 물질, 분해, 전환, 셀룰로오스 가수분해 조성물

Description

셀룰로오스성 물질의 분해를 위한 조성물{COMPOSITIONS FOR DEGRADING CELLULOSIC MATERIAL}
(연방 지원 연구 및 개발하에 이루어진 발명에 대한 권리에 대한 진술)
본 발명은 에너지부에 의해 부여된 NREL 하청 번호 ZCO-30017-02, 원청 계약 DE-AC36-98GO10337하에 정부 지원으로 이루어졌다.
(서열 목록에 대한 참조)
본 출원은 컴퓨터 판독가능한 형태로 서열 목록을 포함한다. 컴퓨터 판독가능한 형태는 본원에 참조로 포함된다.
(생물학적 물질의 기탁에 대한 참조)
본 출원은 생물학적 물질의 기탁에 대한 참조를 포함하며, 이것은 본원에 참조로 포함된다.
본 발명은 셀룰로오스-함유 물질을 분해 또는 전환하기 위한 셀룰로오스 가수분해 단백질 조성물 및 조성물의 제조 및 사용 방법에 관한 것이다.
셀룰로오스는 베타-1,4-결합에 의하여 공유결합된 단당 글루코스의 고분자이다. 다수의 미생물은 베타-결합된 글루칸을 가수분해하는 효소를 생산한다. 이러한 효소는 엔도글루카나아제, 셀로비오히드롤라아제, 및 베타-글루코시다아제를 포함 한다. 엔도글루카나아제는 셀룰로오스 고분자를 임의의 위치에서 절단하고, 셀로비오히드롤라아제가 공격하도록 개방한다. 셀로비오하이드롤라아제는 셀룰로오스 고분자의 말단으로부터 셀로비오의 분자를 순차적으로 방출한다. 셀로비오스는 수용성 베타-1,4-결합된 글루코스 이량체이다. 베타-글루코시다아제는 셀로비오스를 글루코스로 가수분해한다.
셀룰로오스성 공급 원료의 에탄올 전환은 대량 공급 원료의 활용성, 재료의 소각 또는 매립의 방지에 대한 소망 및 에탄올 연료의 청정성에 이점이 있다. 목재, 농업 부산물, 초본 작물, 및 도시 고체 폐기물은 에탄올 생산의 공급 원료로서 고려되어 왔다. 이러한 재료들은 1차적으로 셀룰로오스, 헤미셀룰로오스, 및 리그닌으로 구성된다. 셀룰로오스가 글루코스로 전환되면, 글루코스는 효모에 의하여 쉽게 발효되어 에탄올이 된다.
WO 2005/074647은 Thielavia terrestris로부터의 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드 및 그것의 폴리뉴클레오티드를 개시한다. WO 2005/074656은 Thermoascus aurantiacus로부터의 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드 및 그것의 폴리뉴클레오티드를 개시한다. 미국 공개 출원 번호 제2007/0077630호는 Trichoderma reesei로부터의 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드 및 그것의 폴리뉴클레오티드를 개시한다.
당해 기술 분야에서는 셀룰로오스 가수분해 단백질 조성물의 셀룰로오스성 물질 분해 또는 전환 능력을 개선시키는 것이 유리하다.
본 발명은 셀룰로오스성 물질의 분해 또는 전환 능력이 개선된 셀룰로오스 가수분해 단백질 조성물에 관한 것이다.
발명의 개요
본 발명은 (a) 셀룰로오스 가수분해 증진 활성을 갖는 천연 또는 이종 폴리펩티드를 암호화하는 제1 폴리뉴클레오티드; (b) 천연 또는 이종 베타-글루코시다아제를 암호화하는 제2 폴리뉴클레오티드; 및 (c) Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A) 및 Trichoderma reesei 엔도글루카나아제 I (CEL7B), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 선택된 천연 또는 이종 셀룰로오스 가수분해 효소를 암호화하는 하나 이상의(다수의) 제3 폴리뉴클레오티드를 포함하는, 사상 진균 숙주 세포에 관한 것이다.
본 발명은 또한 (a) 이러한 사상 진균 숙주 세포를 셀룰로오스 가수분해 단백질 조성물의 제조 조건하에서 배양하는 단계; 및 (b) 셀룰로오스 가수분해 단백질 조성물을 회수하는 단계를 포함하는, 셀룰로오스 가수분해 단백질 조성물의 제조방법에 관한 것이다. 본 발명은 또한 이러한 방법에 의해 얻어진 셀룰로오스 가수분해 단백질 조성물에 관한 것이다.
본 발명은 또한 (a) 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; (b) 베타-글루코시다아제; 및 (c) Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A) 및 Trichoderma reesei 엔도글루카나아제 I (CEL7B), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 선택된 하나 이상의(다수의) 셀룰로오스 가수분해 효소를 포함하는, 셀룰로 오스 가수분해 단백질 조성물에 관한 것이다.
본 발명은 또한 셀룰로오스성 물질을 유효량의 이러한 셀룰로오스 가수분해 단백질 조성물로 처리하는 것을 포함하는, 셀룰로오스성 물질의 분해 또는 전환 방법에 관한 것이다.
본 발명은 또한 (a) 셀룰로오스성 물질을 유효량의 이러한 셀룰로오스 가수분해 단백질 조성물로 당화시키는 단계; (b) 단계 (a)의 당화된 셀룰로오스성 물질을 하나 이상의(다수의) 발효 미생물로 발효시켜서 발효 산물을 생성하는 단계; 및 (c) 발효로부터 발효 산물을 회수하는 단계를 포함하는, 발효 산물의 제조방법에 관한 것이다.
도 1은 pMJ04의 제한효소 지도를 나타낸다.
도 2는 pCaHj527의 제한효소 지도를 나타낸다.
도 3은 pMT2188의 제한효소 지도를 나타낸다.
도 4는 pCaHj568의 제한효소 지도를 나타낸다.
도 5는 pMJO5의 제한효소 지도를 나타낸다.
도 6은 pSMai130의 제한효소 지도를 나타낸다.
도 7은 Aspergillus oryzae 베타-글루코시다아제 천연 신호 서열(SEQ ID NO: 91 및 92)의 DNA 서열 및 아미노산 서열을 나타낸다.
도 8은 Humicola insolens 엔도글루카나아제 V 신호 서열(SEQ ID NO: 95 및 96)의 DNA 서열 및 아미노산 서열을 나타낸다.
도 9는 pSMai135의 제한효소 지도를 나타낸다.
도 10은 pSMai140의 제한효소 지도를 나타낸다.
도 11은 pSaMe-F1의 제한효소 지도를 나타낸다.
도 12는 pSaMe-FX의 제한효소 지도를 나타낸다.
도 13은 pAILo47의 제한효소 지도를 나타낸다.
도 14는 pSaMe-FH의 제한효소 지도를 나타낸다.
정의
셀룰로오스 가수분해 증진 활성: 용어 "셀룰로오스 가수분해 증진 활성"은 셀룰로오스 가수분해 활성을 갖는 단백질에 의하여 셀룰로오스-함유 물질의 가수분해를 증진시키는 생물학적 활성으로 본원에서 정의된다. 본 발명의 목적을 위하여, 셀룰로오스 가수분해 증진 활성은 하기 조건하에서 셀룰로오스 가수분해 단백질에 의한 셀룰로오스-함유 물질 물질의 가수분해로부터 환원당의 증가 또는 셀로비오스와 글루코스의 총량의 증가를 측정하고: 80-99.5% w/w 셀룰로오스 가수분해 단백질/PCS 중 셀룰로오스의 g 및 0.5-20% w/w 셀룰로오스 가수분해 증진 활성의 단백질을 함유하는 총 단백질 1-50mg, 1-7일 동안 50℃, 셀룰로오스 가수분해 증진 활성 없이 동일한 총 단백질 로딩(1-50mg 셀룰로오스 가수분해 단백질/PCS 중 셀룰로오스의 g)으로의 대조구 가수분해와 비교함으로써 결정된다. 바람직한 양태에서, 셀룰라아제 단백질 로딩 중 3% Aspergillus oryzae 베타-글루코시다아제(WO 02/095014에 따라 Aspergillus oryzae에서 재조합 제조) 또는 3% Aspergillus fumigatus 베타-글루코시다아제(WO 02/095014의 실시예 22에 따라 Aspergillus oryzae에서 재조합 제조)의 존재하의 CELLUCLAST® 1.5L (Novozymes A/S, Bagsvaerd, Denmark)의 혼합물이 셀룰로오스 가수분해 활성의 표준으로서 사용된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 SEQ ID NO: 2, 4, 6, 8, 10, 12 또는 14의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성의 적어도 20%, 바람직하게는 적어도 40%, 보다 바람직하게는 적어도 50%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 100%를 갖는다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 바람직하게는 적어도 0.1-배, 보다 바람직하게는 적어도 0.2-배, 보다 바람직하게는 적어도 0.3-배, 보다 바람직하게는 적어도 0.4-배, 보다 바람직하게는 적어도 0.5-배, 보다 바람직하게는 적어도 1-배, 보다 바람직하게는 적어도 3-배, 보다 바람직하게는 적어도 4-배, 보다 바람직하게는 적어도 5-배, 보다 바람직하게는 적어도 10-배, 보다 바람직하게는 적어도 20-배, 보다 더 바람직하게는 적어도 30-배, 가장 바람직하게는 적어도 50-배, 가장 더 바람직하게는 적어도 100-배 동일한 정도의 가수분해에 이르는데 필요한 셀룰로오스 가수분해 효소의 양을 감소시킴으로써 셀룰로오스 가수분해 활성을 갖는 단백질에 의해 촉매되는 셀룰로오스-함유 물질의 가수분해를 증진시킨다.
셀룰로오스 가수분해 활성: 용어 "셀룰로오스 가수분해 활성"은 셀룰로오스- 함유 물질을 가수분해하는 셀룰라아제 활성(예컨대, 엔도글루카나아제(들), 셀로비오히드롤라아제(들), 베타-글루코시다아제(들), 또는 이들의 조합)으로서 본원에 정의된다. 셀룰로오스 가수분해 단백질은 카르복시메틸 셀룰로오스(CMC)를 가수분해하여, 인큐베이션 혼합물의 점도를 감소시킬 수 있다. 결과적인 점도 감소는 진동 점도계(예컨대, Sofraser, France로부터의 MIVI 3000)로 결정될 수 있다. 셀룰라아제 점도 단위(CEVU)의 관점으로 측정된 셀룰라아제 활성의 결정은, 카르복시메틸 셀룰로오스(CMC)의 용액의 점도를 감소시키는 시료의 능력을 측정함으로써 샘플에 존재하는 촉매 활성의 양을 정한다. 이 분석은 셀룰로오스 가수분해 단백질 및 기질에 적합한 온도 및 pH에서 수행한다.
본 발명의 목적을 위해서, 셀룰로오스 가수분해 활성은 하기 조건하에서 셀룰로오스 가수분해 조성물에 의한 셀룰로오스-함유 물질의 가수분해 증가를 측정하고: 1-50mg 셀룰로오스 가수분해 단백질/PCS 중 셀룰로오스의 g, 1-7일 동안 5O℃에서, 추가의 셀룰로오스 가수분해 단백질을 추가하지 않은 대조구 가수분해와 비교하여 결정된다.
엔도글루카나아제: 용어 "엔도글루카나아제"는 엔도-1,4-(1,3;1,4)-베타-D-글루칸 4-글루카노히드롤라아제(E.C. No. 3.2.1.4)로서 본원에서 정의되며, 이것은 셀룰로오스, 셀룰로오스 유도체(카르복시메틸 셀룰로오스 및 히드록시에틸 셀룰로오스 등), 리케닌, 시리얼 베타-D-글루칸 또는 자일로글루칸과 같은 혼합 베타-1,3 글루칸 내의 베타-1,4 결합, 및 셀룰로오스성 성분을 함유하는 다른 식물 물질 중의 1,4-베타-D-글리코시드 결합의 엔도가수분해를 촉매한다. 본 발명의 목적을 위 해서, 엔도글루카나아제 활성은 Ghose, 1987, Pure and Appl. Chem. 59: 257-268의 과정에 따라 카르복시메틸 셀룰로오스(CMC) 가수분해를 사용하여 결정된다.
셀로비오히드롤라아제: 용어 "셀로비오히드롤라아제"는 1,4-베타-D-글루칸 셀로비오히드롤라아제(E.C. 3.2.1.91)로서 본원에서 정의되며, 이것은 셀룰로오스, 셀로올리고당, 또는 쇄의 환원 또는 비환원 말단으로부터 셀로비오스를 방출하는 고분자를 함유하는 어떤 베타-1,4-결합된 글루코스 중의 1,4-베타-D-글루코시드 결합의 가수분해를 촉매한다. 본 발명의 목적을 위해서, 셀로비오히드롤라아제 활성은 Lever et al., 1972, Anal. Biochem. 47: 273-279 및 van Tilbeurgh et al, 1982, FEBS Letters 149: 152-156; van Tilbeurgh and Claeyssens, 1985, FEBS Letters 187: 283-288에 의해 설명된 과정에 따라 결정된다. 본 발명에서, Lever et al. 방법을 사용하여 옥수수대 중의 셀룰로오스의 가수분해를 평가하는 한편, van Tilbeurgh et al. 방법을 사용하여 형광 이당류 유도체에 대한 셀로비오히드롤라아제 활성을 결정하였다.
베타-글루코시다아제: 용어 "베타-글루코시다아제"는 베타-D-글루코시드 글루코히드롤라아제 (E.C. 3.2.1.21)로서 본원에 정의되며, 이것은 베타-D-글루코스의 방출과 함께 말단 비환원 베타-D-글루코스 잔기의 가수분해를 촉매한다. 본 발명의 목적을 위해서, 베타-글루코시다아제 활성은 본원에서 설명하는 바와 같은 상이한 조건을 사용한 것을 제외하고 Venturi et al., 2002, J. Basic Microbiol. 42: 55-66에 의해 설명된 기본 과정에 따라 결정된다. 베타-글루코시다아제 활성의 하나의 유닛은 100mM 소듐 시트레이트, 0.01% TWEEN® 20에서 기질로서 4mM p-니트 로페닐-베타-D-글루코피라노시드로부터 50℃, pH 5에서 분당 생성되는 p-니트로페놀의 1.0μmol로서 정의된다.
패밀리 1, 패밀리 3, 패밀리 5, 패밀리 6, 패밀리 7, 패밀리 9, 패밀리 12, 패밀리 45, 패밀리 61, 또는 패밀리 74 글리코시드 히드롤라아제: Henrissat B., 1991, 아미노산 서열 유사성에 기초한 글리코실 히드롤라아제의 분류, Biochem. J. 280: 309-316, 및 Henrissat B., 및 Bairoch A., 1996, 글리코실 히드롤라아제의 서열-기초 분류 갱신, Biochem. J. 316: 695-696에 따라, 용어 "패밀리 1, 패밀리 3, 패밀리 5, 패밀리 6, 패밀리 7, 패밀리 9, 패밀리 12, 패밀리 45, 패밀리 61, 또는 패밀리 74 글리코시드 히드롤라아제" 또는 "패밀리 GH1, 패밀리 GH3, 패밀리 GH5, 패밀리 GH6, 패밀리 GH7, 패밀리 GH9, 패밀리 GH12, 패밀리 GH45, 패밀리 GH61, 또는 패밀리 GH74"는 각각 글리코시드 히드롤라아제 패밀리 1, 패밀리 3, 패밀리 5, 패밀리 6, 패밀리 7, 패밀리 9, 패밀리 12, 패밀리 45, 패밀리 61, 또는 패밀리 74에 속하는 폴리펩티드로서 본원에서 정의된다. 현재 Henrissat은, GH61 패밀리에 속하는 폴리펩티드에 대한 메카니즘, 촉매 친핵/염기, 촉매 양자 공여체 및 3-D 구조와 같은 특성이 알려지지 않았다는 것을 지적하며 이 패밀리를 미분류로서 열거한다.
셀룰로오스-함유 물질: 바이오매스의 1차 세포벽 중에 주된 다당류는 셀룰로오스이고, 두번째로 가장 풍부한 것은 헤미-셀룰로오스이고, 세번째는 펙틴이다. 세포가 성장을 멈춘 후 생성되는 2차 세포벽 또한 다당류를 함유하며, 헤미-셀룰로오스에 공유 가교결합된 고분자 리그닌에 의해 강화된다. 셀룰로오스는 안하이드로 셀로비오스의 호모폴리머이고 따라서 선형 베타-(1-4)-D-글루칸인 한편, 헤미셀룰로오스는 치환체의 스펙트럼을 갖는 복합 분기 구조로 자일란, 자일로글루칸, 아라비노자일란 및 만난과 같은 여러 화합물을 포함한다. 일반적으로 다형이더라도, 셀룰로오스는 평행 글루칸 쇄의 불용성 결정 매트릭스로서 주로 식물 조직에서 발견된다. 헤미셀룰로오스는 대개 다른 헤미 셀룰로오스뿐만 아니라 셀룰로오스와도 수소결합하며, 이것은 세포벽 매트릭스 안정화에 기여한다.
셀룰로오스-함유 물질은 셀룰로오스를 함유하는 어떤 물질일 수 있다. 셀룰로오스는 예를 들면, 줄기, 잎, 외피, 껍질, 및 식물 또는 잎의 속(cob), 가지, 및 나무의 목질에서 일반적으로 발견된다. 셀룰로오스-함유 물질은 초본 물질, 농업 부산물, 임업 부산물, 고시 고체 폐기물, 폐지, 및 펄프 및 제지 부산물이 될 수 있으나 이에 한정되지 않는다. 셀룰로오스-함유 물질은 목재 공급원, 고시 고체 폐기물, 폐지, 농작물 및 농작물 부산물을 포함하지만 이에 제한되지 않는 어떤 종류의 바이오매스일 수 있다(예컨대, Wiselogel et al., 1995, in Handbook on Bioethanol(Charles E. Wyman, editor), pp.105-118, Taylor & Francis, Washington D.C.; Wyman, 1994, Bioresource Technology 50: 3-16; Lynd, 1990, Applied Biochemistry and Biotechnology 24/25: 695-719; Mosier et al., 1999, Recent Progress in Bioconversion of Lignocellulosics, in Advances in Biochemical Engineering/Biotechnology, T. Scheper, managing editor, Volume 65, pp.23-40, Springer-Verlag, New York 참조). 본원에서 셀룰로오스-함유 물질은 바람직하게는 리그노셀룰로오스, 예컨대 혼합 매트릭스 내의 리그닌, 셀룰로오 스 및 헤미셀룰로오스를 함유하는 식물 세포벽 물질의 형태라는 것이 이해된다.
바람직한 양태에서, 셀룰로오스-함유 물질은 옥수수대이다. 다른 바람직한 양태에서, 셀룰로오스-함유 물질은 옥수수 섬유질이다. 다른 바람직한 양태에서, 셀룰로오스-함유 물질은 옥수수속이다. 다른 바람직한 양태에서, 셀룰로오스-함유 물질은 스위치 그래스이다. 다른 바람직한 양태에서, 셀룰로오스-함유 물질은 볏짚이다. 다른 바람직한 양태에서, 셀룰로오스-함유 물질은 종이 및 펄프 가공 폐기물이다. 다른 바람직한 양태에서, 셀룰로오스-함유 물질은 목재 또는 초본 식물이다. 다른 바람직한 양태에서, 셀룰로오스-함유 물질은 버개스(bagasse)이다.
셀룰로오스-함유 물질은 그 자체로 사용되거나 또는 당해 기술 분야에 알려진 종래 기술을 사용하여 전처리를 할 수 있다. 예를 들면, 물리적 전처리 기술은 다양한 형태의 제분, 조사(irradiation), 증기 처리/증기 폭발 및 열가수분해를 포함할 수 있으며; 화학적 전처리 기술은 희석산, 염기성, 유기 용매, 암모니아, 이산화황, 이산화탄소, 및 pH-조절 열가수분해를 포함할 수 있으며; 생물학적 전처리 기술은 리그닌-가용성 미생물 적용을 수반할 수 있다(예를 들면, Hsu, T.-A., 1996, Pretreatment of biomass, in Handbook on Bioethanol: Production and Utilization, Wyman, C. E., ed., Taylor & Francis, Washington, DC, 179-212; Ghosh, P., and Singh, A., 1993, Physicochemical and Biological treatments for enzymatic/microbial conversion of lignocellulosic biomass, Adv. Appl. Microbiol. 39: 295-333; McMillan, J. D., 1994, Pretreating Lignocellulosic biomass: a review, in Enzymatic conversion of Biomass for Fules Production, Himmel, M. E., Baker, J. O., and Overend, R. P., eds., ACS Symposium Series 566, American Chemical Society, Washington, DC, chapter 15; Gong, C. S., Cao, N. J., Du, J., and Tsao, G. T., 1999, Ethanol Production from renewable resources, in Advances in Biochemical Engineering/Biotechnology, Scheper, T., ed., Springer-Verlag Berlin Heidelberg, Germany, 65: 207-241; Olsson, L., and Hahn-Hagerdal, B., 1996, Fermentation of Lignocellulosic hydrolysates for Ethanol Production, Enz. Microb. Tech. 18: 312-331 ; and Vallander, L., and Eriksson, K.-E. L., 1990, Production of Ethanol from Lignocellulosic materials: State of the art, Adv. Biochem. Eng./Biotechnol. 42: 63-95 참조).
전처리된 옥수수대(corn stover): 용어 "PCS" 또는 "전처리된 옥수수대"는 본원에서 열 및 희석산 처리에 의해 옥수수대로부터 유래한 셀룰로오스-함유 물질로 정의된다. 본 발명의 목적을 위하여, PCS는 본원에 설명된 방법에 의해 제조된다.
전장 폴리펩티드: 용어 "전장 폴리펩티드"는 생물학적 활성을 갖는 폴리펩티드의 전구체 형태로서 본원에 정의되며, 여기서 전구체는 신호 펩티드 영역 및 대안적으로 또한 프로펩티드 영역을 포함하고, 여기서 세포로부터의 분비시 신호 펩티드가 분열되고, 대안적으로 또한 프로펩티드가 분열되어 생물학적 활성을 갖는 폴리펩티드를 얻는다.
신호 펩티드: 용어 "신호 펩티드"는 폴립펩티드의 아미노 말단에 프레임 내에서 결합된 펩티드로서 본원에서 정의되고, 암호화된 폴리펩티드를 세포 분비 경 로로 지시한다.
신호 펩티드 암호화 서열: 용어 "신호 펩티드 암호화 서열"은 폴리펩티드의 아미노 말단에 프레임 내에서 결합된 아미노산 서열을 암호화하는 펩티드 암호화 영역으로서 본원에서 정의되며, 암호화된 폴리펩티드를 세포 분비 경로로 지시한다.
프로펩티드: 용어 "프로펩티드"는 폴리펩티드의 아미노 말단에 프레임 내에서 결합된 펩티드로서 본원에서 정의된다. 결과 폴리펩티드는 프로효소 또는 프로폴리펩티드(또는 일부 경우 자이모겐)으로서 알려진다. 프로폴리펩티드는 일반적으로 불활성이며 프로폴리펩티들부터 폴리펩티드의 촉매 또는 자기촉매 분열에 의해 성숙한 활성 폴리펩티드로 전환될 수 있다. 폴리펩티드의 아미노 말단에 신호 펩티드 영역과 프로펩티드 영역이 모두 존재하는 경우, 프로펩티드 영역은 폴리펩티드의 아미노 말단에 프레임 내에서 결합되고 신호 펩티드 영역은 프로펩티드 영역의 아미노 말단에 프레임 내에서 결합된다.
프로펩티드 암호화 서열: 용어 "프로펩티드 암호화 서열"은 프로효소 또는 프로폴리펩티드(또는 일부 경우 자이모겐)의 아미노 말단에 프레임 내에서 결합된 아미노산 서열을 암호화하는 펩티드 암호화 영역으로서 본원에서 정의된다.
촉매 도메인: 용어 "촉매 도메인"은 베타-글루코시다아제 또는 엔도글루카나아제의 촉매 활성을 보유하는 베타-글루코시다아제 또는 엔도글루카나아제의 아미노산 서열의 구조적 부분 또는 영역으로서 본원에서 정의된다.
베타-글루코시다아제 융합 단백질: 용어 "베타-글루코시다아제 융합 단백질" 은 베타-글루코시다아제 활성을 나타내고 적어도 베타-글루코시다아제 촉매 도메인과 엔도글루카나아제 촉매 도메인을 포함하는 폴리펩티드로서 본원에서 정의된다.
베타-글루코시다아제 융합 단백질의 성분: 용어 "베타-글루코시다아제 융합 단백질의 성분"은 베타-글루코시다아제 융합 단백질의 개별 (분열된) 단편으로서 본원에 정의되며, 여기서 각 단편은 베타-글루코시다아제 활성을 갖고, 융합 단백질의 엔도글루카나아제 촉매 도메인과 베타-글루코시다아제 촉매 도메인 또는 베타-글루코시다아제 촉매를 포함한다. 예컨대, 융합 단백질의 엔도글루카나아제 성분과 베타-글루코시다아제 성분간의 분열 부위, 예컨대 Kex2 부위의 존재는 엔도글루카나아제 활성을 갖는 폴리펩티드 및 베타-글루코시다아제 활성을 갖는 또 다른 폴리펩티드를 생성할 수 있다.
셀룰로오스 결합 도메인: 용어 "셀룰로오스 결합 도메인 (CBD)"은 엔도글루카나아제의 셀룰로오스 결합 활성에 수반되는 엔도글루카나아제(셀룰라아제)의 아미노산 서열의 부분으로서 본원에서 정의된다. 셀룰로오스 결합 도메인은 일반적으로 셀룰로오스, 셀룰로오스 유도체 또는 이들의 다당류 동등물에 대한 엔도글루카나아제의 비공유적 결합에 의해 기능한다. CBD는 통상적으로 촉매 도메인에 독립하여 기능한다.
베타-글루코시다아제 융합 구조체: 용어 "베타-글루코시다아제 융합 구조체"는 작동가능한 결합으로 상이한 유전자 또는 그것의 일부로 이루어진 핵산 구조체를 의미한다. 성분은 5' 말단으로부터 적어도 엔도글루카나아제 촉매 도메인을 포함하는 DNA 분자 및 적어도 베타-글루코시다아제 촉매 도메인을 포함하는 DNA 분자 를 포함한다.
분리된 폴리펩티드: 본원에 사용된 용어 "분리된 폴리펩티드"는 공급원으로부터 분리된 폴리펩티드를 의미한다. 바람직한 양태에서, 폴리펩티드는 SDS-PAGE에 의하여 측정하는 경우, 적어도 1% 순수, 바람직하게는 적어도 5% 순수, 보다 바람직하게는 적어도 10% 순수, 보다 바람직하게는 적어도 20% 순수, 보다 바람직하게는 적어도 40% 순수, 보다 바람직하게는 적어도 60% 순수, 보다 더 바람직하게는 적어도 80% 순수, 가장 바람직하게는 적어도 90% 순수하다.
실질적으로 순수한 폴리펩티드: 용어 "실질적으로 순수한 폴리펩티드"는 본원에서 10중량% 이하, 바람직하게는 8중량% 이하, 보다 바람직하게는 6중량% 이하, 보다 바람직하게는 5중량% 이하, 보다 바람직하게는 4중량% 이하, 보다 바람직하게는 3중량% 이하, 더욱 보다 바람직하게는 2중량% 이하, 가장 바람직하게는 1중량% 이하, 가장 보다 바람직하게는 0.5중량% 이하의 천연적으로 또는 재조합적으로 연관된 다른 폴리펩티드 물질을 함유한 폴리펩티드 제조물을 말한다. 따라서, 실질적으로 순수한 폴리펩티드는 제조물에 존재하는 총 폴리펩티드 물질 중 적어도 92중량% 순수, 바람직하게는 적어도 94중량% 순수, 보다 바람직하게는 적어도 95중량% 순수, 보다 바람직하게는 적어도 96중량% 순수, 보다 바람직하게는 적어도 96중량% 순수, 보다 바람직하게는 적어도 97중량% 순수, 보다 바람직하게는 적어도 98중랴% 순수, 더욱 보다 바람직하게는 적어도 99중량%, 가장 바람직하게는 적어도 99.5중량% 순수, 가장 보다 바람직하게는 100중량% 순수한 것이 바람직하다. 본 발명의 폴리펩티드는 실질적으로 순수한 형태, 즉 폴리펩티드 제조물이 천연적으로 또는 재조합적으로 연관된 다른 폴리펩티드 물질이 본질적으로 부재한 것이 바람직하다.
성숙한 폴리펩티드: 용어 "성숙한 폴리펩티드"는 생물학적 활성, 예컨대 효소 활성을 갖는 폴리펩티드로서 본원에서 정의되며, 이것은 번역, 및 N-말단 처리, C-말단 절단, 글리코실화, 인산화 등과 같은 번역후 변형 후의 최종 형태로 존재한다.
성숙한 폴리펩티드 암호화 서열: 용어 "성숙한 폴리펩티드 암호화 서열"은 생물학적 활성을 갖는 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열로서 본원에서 정의된다.
동일성: 두 아미노산 서열 간의 또는 두 뉴클레오티드 서열 간의 관련성은 "동일성"이라는 파라미터로 설명된다.
본 발명의 목적으로 위해서, 두 아미노산 서열 간의 동일성의 정도는 EMBOSS 패키지(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends in Genetics 16: 276-277), 바람직하게는 3.0.0 이상 버전의 Needle 프로그램에서 수행되는 Needleman-Wunsch 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)을 사용하여 결정된다. 사용되는 선택적 파라미터는 갭 개방 패널티 10, 갭 확장 패널티 0.5, 및 EBLOSUM62(BLOSUM62의 EMBOSS 버전) 치환 매트릭스이다. Needle 표지된 "최장 동일성"의 출력(-nobrief option을 사용하여 얻어짐)은 퍼센트 동일성으로서 사용되며 하기와 같이 산출된다:
(동일한 잔기 x 10O)/(정렬 길이 - 정렬 내 갭의 총수)
본 발명의 목적을 위해서, 두 데옥시리보뉴클레오티드 서열 간의 동일성의 정도는 EMBOSS 패키지(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, 상기 참조), 바람직하게는 3.0.0 이상 버전의 Needle 프로그램에서 이행되는 Needleman-Wunsch 알고리즘(Needleman and Wunsch, 1970, 상기 참조)을 사용하여 결정된다. 사용되는 선택적 파라미터는 갭 개방 패널티 10, 갭 확장 패널티 0.5, 및 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스이다. Needle 표지된 "최장 동일성"의 출력(-nobrief option을 사용하여 얻어짐)은 퍼센트 동일성으로서 사용되며 하기와 같이 산출된다:
(동일한 데옥시리보뉴클레오티드 x 10O)/(정렬 길이 - 정렬 내 갭의 총수)
상동 서열: 용어 "상동 서열"은 BLOSUM62 매트릭스, 단어크기 3, 갭 존재 코스트 11 , 갭 확장 코스트 1, 낮은 복잡성 여과 없음, 및 조회용으로 성숙한 단백질 단백질 서열을 가지고 blastp(단백질 데이터베이스용) 또는 tblastn(핵산 서열 데이터베이스용) 알고리즘을 사용하여, 0.001 미만의 E값(또는 기대값)을 갖는 서열로서 본원에서 정의된다. Altschul et al., 1997, Nucleic Acids Res. 25: 3389-3402 참조.
폴리펩티드 단편: 용어 "폴리펩티드 단편"은 본원에서 성숙한 폴리펩티드의 아미노 및/또는 카르복실 말단으로부터 결실된 하나 이상의(다수의) 아미노산을 갖는 폴리펩티드, 또는 그것의 상동 서열로 정의되며, 여기서 단편은 그것의 성숙한 폴리펩티드로서 활성을 갖는다.
부분서열: 용어 "부분서열"은 본원에서 성숙한 폴리펩티드 암호화 서열의 5' 및/또는 3' 말단으로부터 결실된 하나 이상의(다수의) 뉴클레오티드를 갖는 뉴클레 오티드 서열, 또는 그것의 상동 서열로 정의되며, 여기서 부분서열은 그것의 성숙한 폴리펩티드로서 활성을 갖는 폴리펩티드 단편을 암호화한다.
대립 변이체: 용어 "대립 변이체"는 동일한 염색체좌를 점유하는 유전자의 둘 이상의 대안적 형태를 나타낸다. 대립 변이체는 돌연변이를 통하여 자연적으로 발생하며, 집단 내의 다형성(polymorphism)을 야기할 수 있다. 유전자 돌연변이는 침묵(암호화된 폴리펩티드 내의 무변화)일 수 있으며 또는 아미노산 서열이 변화된 폴리펩티드를 암호화할 수 있다. 폴리펩티드의 대립 변이체는 유전자의 대립 변이체에 의하여 암호화된 폴리펩티드이다.
분리된 폴리뉴클레오티드: 본원에서 사용된 용어 "분리된 폴리뉴클레오티드"는 공급원으로부터 분리된 폴리뉴클레오티드를 말한다. 바람직한 양태에서, 폴리뉴클레오티드는 아가로스 전기영동에 의하여 측정시 적어도 1% 순수, 바람직하게는 적어도 5% 순수, 보다 바람직하게는 적어도 10% 순수, 보다 바람직하게는 적어도 20% 순수, 보다 바람직하게는 적어도 40% 순수, 보다 바람직하게는 적어도 60% 순수, 보다 더 바람직하게는 적어도 80% 순수, 가장 바람직하게는 적어도 90% 순수하나다.
실질적으로 순수한 폴리뉴클레오티드: 본원에서 사용된 용어 "실질적으로 순수한 폴리뉴클레오티드"는 다른 외인성 또는 원치 않는 뉴클레오티드가 부재하며, 유전자 조작된 단백질 생산 시스템 내에서 사용하기 적합한 형태의 폴리뉴클레오티드 제조물을 의미한다. 따라서, 실질적으로 순수한 폴리뉴클레오티드는 10중량% 이하, 바람직하게는 8중량% 이하, 보다 바람직하게는 6중량% 이하, 보다 바람직하게 는 5중량% 이하, 보다 바람직하게는 4중량% 이하, 보다 바람직하게는 3중량% 이하, 보다 더 바람직하게는 2중량% 이하, 가장 바람직하게는 1중량% 이하, 가장 더 바람직하게는 0.5중량% 이하의 천연적으로 또는 재조합적으로 연관된 다른 폴리뉴클레오티드 물질을 함유한다. 그러나 실질적으로 순수한 폴리뉴클레오티드는 프로모터 및 터미네이터와 같은 자연 발생 5' 및 3' 비번역 영역을 포함한다. 실질적으로 순수한 폴리뉴클레오티드는 적어도 90중량% 순수, 바람직하게는 적어도 92중량% 순수, 보다 바람직하게는 적어도 94중량% 순수, 보다 바람직하게는 적어도 95중량% 순수, 보다 바람직하게는 적어도 96중량% 순수, 보다 바람직하게는 적어도 97중량% 순수, 보다 더 바람직하게는 적어도 98중량% 순수, 가장 바람직하게는 적어도 99중량%, 가장 더 바람직하게는 적어도 99.5중량% 순수한 것이 바람직하다. 본 발명의 폴리뉴클레오티드는 실질적으로 순수한 형태인 것, 즉 폴리뉴클레오티드 제조물은 천연적으로 또는 재조합적으로 연관된 다른 폴리뉴클레오티드 물질이 본질적으로 부재한 것이 바람직하다. 폴리뉴클레오티드는 게놈, cDNA, RNA, 반합성, 합성 기원(origin) 또는 이들의 어떤 조합일 수 있다.
cDNA: 용어 "cDNA"는 본원에서 원핵 세포로부터 얻어진 성숙한, 스플라이싱된 mRNA 분자로부터 역전사하여 제조될 수 있는 DNA 분자로 정의된다. cDNA는 상응하는 게놈 DNA에 일반적으로 존재하는 인트론 서열이 결핍되어 있다. 초기 1차 RNA 전사체는 성숙한 스플라이싱된 mRNA로서 나타나기 전에 일련의 단계를 거쳐 가공된 mRNA의 전구체이다. 이들 단계는 스플라이싱이라고 불리는 과정에 의한 인트론 서열의 제거를 포함한다. 따라서 mRNA로부터 유래한 cDNA는 어떤 인트론 서열이 결핍 된다.
핵산 구조체: 본원에서 사용된 용어 "핵산 구조체"는 자연 발생 유전자로부터 분리되거나 자연 상에 달리 존재하지 않는 방식으로 핵산 서열의 부분을 함유하도록 변형되거나 합성된 단일- 또는 이중-가닥의 핵산 분자를 말한다. 용어 핵산 구조체는 핵산 구조체가 본 발명의 암호화 서열의 발현에 필요한 조절 서열을 함유하는 경우, 용어 "발현 카세트"와 동의어이다.
조절 서열: 용어 "조절 서열"는 본원에서 본 발명의 폴리펩티드를 암호화하는 폴리뉴클레오티드의 발현에 필요한 모든 성분을 포함한다. 각 조절 서열은 폴리펩티드를 암호화하는 뉴클레오티드 서열에 동질적 또는 이질적이거나 또는 서로 동질적이거나 이질적일 수 있다. 이러한 조절 서열은 선도체, 폴리아데닐화 서열, 프로펩티드 서열, 프로모터, 신호 펩티드 서열, 및 전사 터미네이터를 포함하지만 이에 한정되지 않는다. 적어도 조절 서열은 프로모터, 및 전사 및 번역 종결 신호를 포함한다. 조절 서열은 폴리펩티드를 암호화하는 뉴클레오티드 서열의 암호화 영역을 지닌 조절 서열의 라이게이션을 용이하게 하는 특이적 제한 부위를 도입하기 위한 링커를 제공할 수 있다.
작동가능하게 결합된: 본원에서 용어 "작동가능하게 결합된"은 조절 서열이 폴리펩티드의 암호화 서열의 발현을 지시하도록 폴리뉴클레오티드 서열의 암호화 서열에 상대적으로 적절한 위치에 조절 서열이 배치된 구성을 나타낸다.
암호화 서열: 본원에서 용어 "암호화 서열"을 사용하는 경우 이들의 단백질 산물의 아미노산 서열을 직접 특정하는 뉴클레오티드 서열을 의미한다. 암호화 서 열의 경계는 개방 리딩 프레임에 의하여 일반적으로 결정되며, 대체로 ATG 개시 코돈 또는 대안적 개시 코돈, 예컨대 GTG 및 TTG로 시작하고 종결 코돈, 예컨대 TAA, TAG 및 TGA로 종결된다. 암호화 서열은 DNA, cDNA, 합성 또는 재조합 뉴클레오티드 서열일 수 있다.
발현: 용어 "발현"은 전사, 전사후 변형, 번역, 번역후 변형, 및 분비를 포함하나 이에 한정되지 않는 폴리펩티드의 생성에 수반되는 어떤 단계를 포함한다.
발현 벡터: 용어 "발현 벡터"는 본원에서 본 발명의 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함하는 선형 또는 원형 DNA 분자로 정의되며, 이들의 발현을 위하여 제공되는 추가의 뉴클레오티드에 작동가능하게 결합된다.
숙주 세포: 본원에서 사용되는 용어 "숙주 세포"는 폴리뉴클레오티드를 포함하는 핵산 구조체 또는 발현 벡터에 의한 형질전환, 트랜스펙션, 형질도입 등에 영향받기 쉬운 어떤 세포 유형을 포함한다.
변형: 용어 "변형"은 본원에서 성숙한 폴리펩티드 또는 이들의 상동 서열의 화학적 변형; 및 이러한 폴리펩티드를 암호화하는 DNA의 유전자 조작을 의미한다. 변형은 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입뿐만 아니라 하나 이상의(다수의) 아미노산 측쇄의 대체일 수 있다.
인공 변이체: 본원에서 사용하는 용어 "인공 변이체"는 성숙한 폴리펩티드 암호화 서열의 변형된 뉴클레오티드 서열 또는 이들의 상동 서열을 발현하는 유기체에 의하여 생성되는 폴리펩티드를 의미한다. 변형된 뉴클레오티드 서열은 폴리뉴클레오티드 서열 또는 이들의 상동 서열의 변형에 의한 인간의 개입을 통하여 얻어 진다.
본 발명은 (a) 셀룰로오스 가수분해 증진 활성을 갖는 천연 또는 이종 폴리펩티드를 암호화하는 제1 폴리뉴클레오티드; (b) 천연 또는 이종 베타-글루코시다아제를 암호화하는 제2 폴리뉴클레오티드; 및 (c) Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A) 및 Trichoderma reesei 엔도글루카나아제 I (CEL7B), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 선택된 천연 또는 이종 하나 이상의(다수의) 셀룰로오스 가수분해 효소를 암호화하는 하나 이상의(다수의) 제3 폴리뉴클레오티드를 포함하는 사상 진균 숙주 세포에 관한 것이다.
본 발명은 또한 (a) 이러한 사상 진균 숙주 세포를 셀룰로오스 가수분해 단백질 조성물의 제조 조건하에서 배양하는 단계; 및 (b) 셀룰로오스 가수분해 단백질 조성물을 회수하는 단계를 포함하는, 셀룰로오스 가수분해 단백질 조성물의 제조방법에 관한 것이다. 본 발명은 또한 이러한 방법에 의해 얻어진 셀룰로오스 가수분해 단백질 조성물에 관한 것이다.
본 발명은 또한 (a) 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; (b) 베타-글루코시다아제; 및 (c) Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A) 및 Trichoderma reesei 엔도글루카나아제 I (CEL7B), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 선택된 하나 이상의(다수의) 셀룰로오스 가수분해 효소를 포함하는, 셀룰로오스 가수분해 단백질 조성물에 관한 것이다.
바람직한 양태에서, 사상 진균 숙주 세포는 SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하는 셀룰로오스 가수분해 단백질 조성물을 생성한다. 바람직한 양태에서, 사상 진균 숙주 세포는 Trichoderma reesei, 특히 Trichoderma reesei RutC30이다.
다른 바람직한 양태에서, 사상 진균 숙주 세포는 SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하는 셀룰로오스 가수분해 단백질 조성물을 생성하고, 또한 SEQ ID NO: 58의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 II (CEL5A), SEQ ID NO: 62의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 V (CEL45A), 및 SEQ ID NO: 60의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 III (CEL12A)로 구성된 군에서 선택된 하나 이상의(다수의) 효소를 생성한다. 또 다른 바람직한 양태에서, 사상 진균 숙주 세포는 Trichoderma reesei, 특히 Trichoderma reesei RutC30이다.
다른 바람직한 양태에서, 사상 진균 숙주 세포는 SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하는 셀룰로오스 가수분해 단백질 조성물을 생성하고, 또한 SEQ ID NO: 64의 성숙한 펩티드의 Thielavia terrestris 셀로비오히드롤라아제를 생성한다. 다른 바람직한 양태에서, 사상 진균 숙주 세포는 Trichoderma reesei, 특히 Trichoderma reesei RutC30이다.
다른 바람직한 양태에서, 사상 진균 숙주 세포는 SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하는 셀룰로오스 가수분해 단백질 조성물을 생성하고, 또한 (1) SEQ ID NO: 58의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 II (CEL5A), SEQ ID NO: 62의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 V (CEL45A) 및 SEQ ID NO: 60의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 III (CEL12A)로 구성된 군에서 선택된 하나 이상의(다수의) 효소를 생성하고, 및/또는 (2) SEQ ID NO: 64의 성숙한 폴리펩티드의 Thielavia teirestris 셀로비오히드롤라아제를 생성한다. 다른 바람직한 양태에서, 사상 진균 숙주 세포는 Trichoderma reesei, 특히 Trichoderma reesei RutC30이다.
다른 바람직한 양태에서, 셀룰로오스 가수분해 단백질 조성물은 SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함한다.
다른 바람직한 양태에서, 셀룰로오스 가수분해 단백질 조성물은 SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하고, 또한 SEQ ID NO: 58의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 II (CEL5A), SEQ ID NO: 62의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 V (CEL45A), 및 SEQ ID NO: 60의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 III (CEL12A)로 구성된 군에서 선택된 하나 이상의(다수의) 효소를 포함한다.
다른 바람직한 양태에서, 셀룰로오스 가수분해 단백질 조성물은 SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하고, 또한 SEQ ID NO: 64의 성숙한 폴리펩티드의 Thielavia terrestris 셀로비오히드롤라아제를 포함한다.
다른 바람직한 양태에서, 셀룰로오스 가수분해 단백질 조성물은 SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하고, 또한 (1) SEQ ID NO: 58의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 II (CEL5A), SEQ ID NO: 62의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 V (CEL45A), 및 SEQ ID NO: 60의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 III (CEL12A)로 구성된 군에서 선택된 하나 이상의(다수의) 효소를 포함하고, 및/또는 (2) 또한 SEQ ID NO: 64의 성숙한 폴리펩티드의 Thielavia terrestris 셀로비오히드롤라아제를 포함한다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드 및 그것의 폴리뉴클레오티드
셀룰로오스-함유 물질 처리에 유용한 셀룰로오스 가수분해 증진 활성을 갖는 어떤 폴리펩티드를 본 발명의 조성물에 사용할 수 있다. 이러한 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 사용하여 조성물을 제조할 수 있다.
제1 양태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 하기 모티프:
[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ] 및 [FW]-[TF]-K-[AIV] 를 포함하며, 여기서 X는 어떤 아미노산이고, X(4,5)는 4 또는 5개 연속 위치된 어떤 아미노산이고, X(4)는 4개 연속 위치된 어떤 아미노산이다.
상기 나타낸 모티프를 포함하는 분리된 폴리펩티드는 또한
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV], 또는
H-X(1,2)-G-P-X(3)-[YW]-[AILMV] 및 [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X- [ILV]
를 포함할 수 있으며, 여기서 X는 어떤 아미노산이고, X(1,2)는 1개 위치된 또는 2개 연속 위치된 어떤 아미노산이고, X(3)는 3개 연속 위치된 어떤 아미노산이고, X(2)는 2개 연속 위치된 어떤 아미노산이다. 상기 모티프에서, 승인된 IUPAC 단일 문자 아미노산 축약어가 사용된다.
바람직한 실시형태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 또한 H-X(1,2)-G-P-X(3)-[YW]-[AILMV]를 포함한다. 다른 바람직한 실시형태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]를 포함한다. 다른 바람직한 실시형태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 H-X(1,2)-G-P-X(3)-[YW]-[AILMV] 및 [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]를 포함한다.
제2 양태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 하기 모티프:
[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]
를 포함하며, 여기서 x는 어떤 아미노산이고, x(4,5)는 4 또는 5개 연속 위치된 어떤 아미노산이고, x(3)는 3개 연속 위치된 어떤 어미노산이다. 상기 모티프에서, 승인된 IUPAC 단일 문자 아미노산 축약어가 사용된다.
제3 양태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드에 대하여 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98%, 또는 99%의 동일성의 정도를 갖는 아미노산 서열을 포함하거나 또는 이들로 이루어지며, 이것은 셀룰로오스 가수분해 증진 활성을 갖는다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 2. SEQ ID NO: 4. SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 상이한 아미노산 서열을 포함하거나 또는 이들로 이루어진다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 2의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 아미노산 20 내지 326, 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 아미노산 20 내지 326를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 그것의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 아미노산 20 내지 326 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 2의 아미노산 20 내지 326으로 구성된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 4의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 아미노산 18 내지 240, 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 아미노산 18 내지 240을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 아미노산 18 내지 240 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 4의 아미노산 18 내지 240으로 구성된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 6의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 아미노산 20 내지 258, 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 아미노산 20 내지 258을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 아미노산 20 내지 258 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 6의 아미노산 20 내지 258로 구성된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 8의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 아미노산 19 내지 226, 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 아미노산 19 내지 226을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 아미노산 19 내지 226 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 8의 아미노산 19 내지 226으로 구성된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 10의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 아미노산 20 내지 304, 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 아미노산 20 내지 304를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 아미노산 20 내지 304 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 10의 아미노산 20 내지 304로 구성된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 12의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 아미노산 23 내지 250, 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 아미노산 23 내지 250을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 아미노산 23 내지 250 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 12의 아미노산 23 내지 250으로 구성된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 14의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 아미노산 20 내지 249, 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 아미노산 20 내지 249를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 아미노산 20 내지 249 또는 그것의 대립 변이체; 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 14의 아미노산 20 내지 249로 구성된다.
바람직하게는, SEQ ID NO: 2의 성숙한 폴리펩티드의 단편은 적어도 277 아미노산 잔기, 보다 바람직하게는 적어도 287 아미노산 잔기, 가장 바람직하게는 적어도 297 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 4의 성숙한 폴리펩티드의 단편은 적어도 185 아미노산 잔기, 보다 바람직하게는 적어도 195 아미노산 잔기, 가장 바람직하게는 적어도 205 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 6의 성숙한 폴리펩티드의 단편은 적어도 200 아미노산 잔기, 보다 바람직하게는 적어도 212 아미노산 잔기, 가장 바람직하게는 적어도 224 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 8의 성숙한 폴리펩티드의 단편은 적어도 175 아미노산 잔기, 보다 바람직하게는 적어도 185 아미노산 잔기, 가장 바람직하게는 적어도 195 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 10의 성숙한 폴리펩티드의 단편은 적어도 240 아미노산 잔기, 보다 바람직하게는 적어도 255 아미노산 잔기, 가장 바람직하게는 적어도 270 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 12의 성숙한 폴리펩티드의 단편은 적어도 175 아미노산 잔기, 보다 바람직하게는 적어도 190 아미노산 잔기, 가장 바람직하게는 적어도 205 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 14의 성숙한 폴리펩티드의 단편은 적어도 200 아미노산 잔기, 보다 바람직하게는 적어도 210 아미노산 잔기, 가장 바람직하게는 적어도 220 아미노산 잔기를 함유한다.
바람직하게는, SEQ ID NO: 1의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 831 뉴클레오티드, 보다 바람직하게는 적어도 861 뉴클레오티드, 가장 바람직하게는 적어도 891 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 3의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 555 뉴클레오티드, 보다 바람직하게는 적어도 585 뉴클레오티드, 가장 바람직하게는 적어도 615 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 5의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 600 뉴클레오티드, 보다 바람직하게는 적어도 636 뉴클레오티드, 가장 바람직하게는 적어도 672 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 7의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 525 뉴클레오티드, 보다 바람직하게는 적어도 555 뉴클레오티드, 가장 바람직하게는 적어도 585 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 9의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 720 뉴클레오티드, 보다 바람직하게는 적어도 765 뉴클레오티드, 가장 바람직하게는 적어도 810 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 11의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 525 뉴클레오티드, 보다 바람직하게는 적어도 570 뉴클레오티드, 가장 바람직하게는 적어도 615 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 600 뉴클레오티드, 보다 바람직하게는 적어도 630 뉴클레오티드, 가장 바람직하게는 적어도 660 뉴클레오티드를 함유한다.
제4 양태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, 또는 SEQ ID NO: 11의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열, 또는 SEQ ID NO: 7, SEQ ID NO: 9 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열을 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된다(J J. Sambrook, E.F. Fritsch, and T. Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 2d edition, Cold Spring Harbor, New York). SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다. 바람직한 양태에서, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 1의 뉴클레오티드 388 내지 1332, SEQ ID NO: 3의 뉴클레오티드 98 내지 821, SEQ ID NO: 5의 뉴클레오티드 126 내지 978, SEQ ID NO: 7의 뉴클레오티드 55 내지 678, SEQ ID NO: 9의 뉴클레오티드 58 내지 912, SEQ ID NO: 11의 뉴클레오티드 67 내지 796, 또는 SEQ ID NO: 13의 뉴클레오티드 77 내지 766이다.
SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 뉴클레오티드 서열, 또는 이들의 부분서열; 및 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 아미노산 서열, 또는 그것의 단편을 핵산 프로브 설계에 사용하여 다른 종 또는 속의 균주로부터 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화하는 DNA를 식별 및 클로닝할 수 있다. 특히, 이러한 프로브는 표준 서던 블롯팅 기법에 따라 해당 속 또는 종의 게놈 또는 cDNA와 혼성화하는데 사용하여 그 안의 상응하는 유전자를 식별하고 분리할 수 있다. 이러한 프로브는 전체 서열보다 상당히 짧을 수 있으나, 길이가 적어도 14, 바람직하게는 적어도 25, 보다 바람직하게는 적어도 35, 및 가장 바람직하게는 적어도 70 뉴클레오티드이다. 그러나, 핵산 프로브는 길이가 적어도 100 뉴클레오티드인 것이 바람직하다. 예를 들면, 핵산 프로브는 길이가 적어도 200 뉴클레오티드, 바람직하게는 적어도 300 뉴클레오티드, 보다 바람직하게는 적어도 400 뉴클레오티드, 또는 가장 바람직하게는 적어도 500 뉴클레오티드일 수 있다. 더 긴 프로브를 사용할 수도 있으며, 예컨대 길이가 적어도 600 뉴클레오티드, 바람직하게는 적어도 700 뉴클레오티드, 보다 바람직하게는 적어도 800 뉴클레오티드, 또는 가장 바람직하게는 적어도 900 뉴클레오티드인 핵산 프로브를 사용할 수 있다. DNA 및 RNA 프로브 둘 다 사용될 수 있다. 프로브는 일반적으로 상응하는 유전자를 검출하기 위하여 (예를 들면, 32P, 3H, 35S, 바이오틴, 또는 아비딘으로) 표지된다. 이러한 프로브는 본 발명에 의하여 포괄된다.
그러므로 이러한 다른 균주로부터 생성된 게놈 DNA 또는 cDNA 라이브러리는 전술한 프로브와 혼성화한 DNA에 대하여 선별될 수 있고, 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화한다. 이러한 다른 균주로부터의 게놈 또는 다른 DNA는 아가로스 또는 폴리아크릴아미드 겔 전기영동, 또는 다른 분리 기술에 의하여 분리될 수 있다. 라이브러리로부터의 DNA 또는 분리된 DNA는 니트로셀룰로오스 또는 다른 적합한 담체 물질로 이송되고 고정된다. SEQ ID NO: 1; 또는 그것의 부분서열과 상동인 클론 또는 DNA를 식별하기 위하여, 담체 물질을 서던 블롯에 사용하는 것이 바람직하다.
본 발명의 목적을 위해서, 혼성화는 뉴클레오티드 서열이 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열, SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, 또는 SEQ ID NO: 11의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열, 또는 SEQ ID NO: 7, SEQ ID NO: 9, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열을 포함하는 게놈 DNA 서열, 그것의 전장 상보 가닥, 또는 이들의 부분서열에 상응하는 표지된 핵산 프로브에 매우 낮은 긴축 조건 내지 매우 높은 긴축 조건하에서 혼성화하는 것을 나타낸다. 이들 조건하에서 핵산 프로브가 혼성화하는 분자는 예를 들면 X선 필름을 사용하여 검출할 수 있다.
바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 1의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 1의 뉴클레오티드 388 내지 1332이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 2의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 1이다. 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30699에 함유된 플라스미드 pEJG120에 함유된 폴리뉴클레오티드 서열이며, 여기서 그것의 폴리뉴클레오티드 서열은 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드을 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30699에 함유된 플라스미드 pEJG120에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 3의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 3의 뉴클레오티드 98 내지 821이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 4의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 3이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30813에 함유된 플라스미드 pTter61C에 함유된 폴리뉴클레오티드 서열이며, 여기서 그것의 폴리뉴클레오티드 서열은 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드을 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30813에 함유된 플라스미드 pTter61C에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 5의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 5의 뉴클레오티드 126 내지 978이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 6의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 5이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30812에 함유된 플라스미드 pTter61D에 함유된 폴리뉴클레오티드 서열이며, 여기서 그것의 폴리뉴클레오티드 서열은 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드을 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30812에 함유된 플라스미드 pTter61D에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 7의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 7의 뉴클레오티드 55 내지 678이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 8의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 7이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30814에 함유된 플라스미드 pTter61E에 함유된 폴리뉴클레오티드 서열이며, 여기서 그것의 폴리뉴클레오티드 서열은 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드을 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30814에 함유된 플라스미드 pTter61E에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 9의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 9의 뉴클레오티드 58 내지 912이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 10의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 9이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30811에 함유된 플라스미드 pTter61G에 함유된 폴리뉴클레오티드 서열이며, 여기서 그것의 폴리뉴클레오티드 서열은 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드을 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30811에 함유된 플라스미드 pTter61G에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 11의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 11의 뉴클레오티드 67 내지 796이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 12의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 11이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30704에 함유된 플라스미드 pDZA2-7에 함유된 폴리뉴클레오티드 서열이며, 여기서 이들의 폴리뉴클레오티드 서열은 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드을 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30704에 함유된 플라스미드 pDZA2-7에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 13의 뉴클레오티드 77 내지 766이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 14의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 13이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30878에 함유된 플라스미드 pTr333에 함유된 폴리뉴클레오티드 서열이며, 여기서 그것의 폴리뉴클레오티드 서열은 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드을 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30878에 함유된 플라스미드 pTr333에 함유된 성숙한 폴리펩티드 암호화 영역이다.
길이가 적어도 100 뉴클레오티드인 긴 프로브를 위하여, 매우 낮은 긴축 조건 내지 매우 높은 긴축 조건은 12 내지 24 시간 동안 최적으로 표준 서던 블롯팅 절차에 따라, 42℃에서 5X SSPE, 0.3% SDS, 200 ㎍/ml 절단 및 변성된 연어 정자 DNA, 및 매우 낮은 긴축 및 낮은 긴축을 위하여 25% 포름아미드, 중간 긴축 및 중상 긴축을 위하여 35% 포름아미드, 또는 높은 긴축 및 매우 높은 긴축을 위하여 50% 포름아미드에서의 예비혼성화 및 혼성화로서 정의된다.
길이가 적어도 100 뉴클레오티드인 긴 프로브를 위하여, 담체 물질을 바람직하게는 적어도 45℃(매우 낮은 긴축), 보다 바람직하게는 적어도 50℃(낮은 긴축), 보다 바람직하게는 적어도 55℃(중간 긴축), 보다 바람직하게는 적어도 60℃(중상 긴축), 보다 더 바람직하게는 적어도 65℃(높은 긴축), 가장 바람직하게는 적어도 70℃(매우 높은 긴축)에서 15분간 2X SSC, 0.2% SDS를 사용하여 각각 최종적으로 3회 세정한다.
길이가 약 15 뉴클레오티드 내지 약 70 뉴클레오티드인 짧은 프로브를 위하여, 긴축 조건은 12 내지 24 시간 동안 최적으로 표준 서던 블롯팅 절차에 따라, ml당 0.9 M NaCl, 0.09 M Tris-HCl pH 7.6, 6mM EDTA, 0.5% NP-40, 1X 덴하르트 용액, 1mM 소듐 피로포스페이트, 1mM 소듐 단염기 포스페이트, 0.1mM ATP, 및 0.2mg의 효모 RNA에서 Bolton 및 McCarthy(1962, Proceedings of the National Academy of Sciences USA 48:1390)에 따른 계산법을 사용하여 계산된 Tm 이하의 약 5℃ 내지 약 10℃에서의 예비혼성화, 혼성화 및 혼성화후-세정으로서 정의된다.
길이가 약 15 뉴클레오티드 내지 약 70 뉴클레오티드인 짧은 프로브를 위하여, 담체 물질은 6X SCC 플러스 0.1% SDS에서 15분간 1회 세정하고, 6X SSC를 사용하여 15분간 계산된 Tm 이하의 5℃ 내지 10℃에서 각각 2회 세정한다.
제5 양태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98%, 또는 99%인 뉴클레오티드 서열을 포함하거나 또는 이들로 이루어진 폴리뉴클레오티드에 의해 암호화되며, 이것은 활성 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화한다.
바람직한 양태에서, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 1의 뉴클레오티드 388 내지 1332, SEQ ID NO: 3의 뉴클레오티드 98 내지 821, SEQ ID NO: 5의 뉴클레오티드 126 내지 978, SEQ ID NO: 7의 뉴클레오티드 55 내지 678, SEQ ID NO: 9의 뉴클레오티드 58 내지 912, SEQ ID NO: 11의 뉴클레오티드 67 내지 796, 또는 SEQ ID NO: 13의 뉴클레오티드 77 내지 766이다. 본원에서 폴리뉴클레오티드 부분 참조.
제6 양태에서, 셀룰로오스 가수분해 증진 활성을 갖는 분리된 폴리펩티드는 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14; 또는 그것의 상동 서열의 성숙한 폴리펩티드의 인공 변이체이다. 바람직하게는, 아미노산 변화는 경미한 현상이며, 이는 단백질의 접힘 및/또는 활성에 현저하게 영향을 미치지 않는 보존적 아미노산 치환 또는 삽입; 일반적으로 1 내지 약 30 아미노산의 적은 결실; 아미노-말단 메티오닌 잔기와 같은 적은 아미노- 또는 카르복실-말단 확장; 약 20-25 잔기까지의 적은 링커 펩티드; 또는 순 전하 변화에 의한 정제 또는 폴리-히스티딘 트랙, 항원성 에피토프 또는 결합 도메인과 같은 다른 기능을 촉진시키는 적은 확장이다.
보존적 치환의 예는 염기성 아미노산 (아르기닌, 라이신 및 히스티딘), 산성 아미노산 (글루탐산 및 아스파라긴산), 극성 아미노산 (글루타민 및 아스파라긴), 소수성 아미노산 (류신, 이소류신 및 발린), 방향성 아미노산 (페닐알라닌, 트립토판 및 티로신), 및 소형 아미노산 (글리신, 알라닌, 세린, 트레오닌 및 메티오닌)의 군에 있다. 일반적으로 특정 활성을 변화시키지 않는 아미노산 치환은 기술 분야에 공지되어 있으며, 예를 들면, H. Neurath and R.L. Hill, 1979, In, The Proteins, Academic Press, New York에 설명되어 있다. 가장 일반적으로 발생하는 교환은 Ala/Ser, Val/lle, Asp/Glu, Thr/Ser, Ala/Gly, Ala/Thr, Ser/Asn, Ala/Val, Ser/Gly, Tyr/Phe, Ala/Pro, Lys/Arg, Asp/Asn, Leu/lle, Leu/Val, Ala/Glu 및 Asp/Gly이다.
20개의 표준 아미노산 이외에, 비-표준 아미노산(예컨대 4-히드록시프롤린, 6-N-메틸 리신, 2-아미노이소부티르산, 이소발린 및 알파-메틸 세린)이 야생형 폴리펩티드의 아미노산 잔기에 치환될 수 있다. 제한된 수의 비-보존적 아미노산, 유전자 코드에 의하여 암호화되지 않은 아미노산, 및 비천연 아미노산은 아미노산 잔기에 치환될 수 있다. "비천연 아미노산"은 단백질 합성 후 변형되었거나, 및/또는 그들의 측쇄(들)에 표준 아미노산과는 다른 화학적 구조를 갖는다. 비천연 아미노산은 화학적으로 합성될 수 있으며, 바람직하게는 시중에서 입수가능하고, 피페콜산, 티아졸리딘 카르복실산, 데하이드로프롤린, 3- 및 4-메틸프롤린, 및 3,3-디메틸프롤린을 포함한다.
대안적으로, 아미노산 변화는 폴리펩티드의 물리-화학적 특성이 변경되는 현상이다. 예를 들면, 아미노산 변화는 폴리펩티드의 열적 안정성을 개선시키고, 기질 특이성을 변경시키고, 최적 pH를 변화시킬 수 있다.
모체 폴리펩티드 내의 필수 아미노산은 부위-지정 돌연변이유발 또는 알라닌-스캐닝 돌연변이유발(Cunningham and Wells, 1989, Science 244: 1081-1085)과 같은 당해 기술 분야에 공지된 과정에 따라 식별될 수 있다. 후자의 기술에 있어서, 단일 알라닌 돌연변이는 분자 내의 모든 잔기로 도입되며, 얻어진 돌연변이 분자를 생물학적 활성에 대하여 테스트하여 분자의 활성에 결정적인 아미노산 잔기를 식별한다. Hilton et al., 1996, J. Biol. Chem. 271: 4699-4708 참조. 추정되는 접촉 부위 아미노산의 돌연변이와 연관하여 핵 자기 공명, 결정 분석법, 전자 회절, 또는 광친화도 표지법과 같은 기술에 의하여 측정되는 것과 같이, 효소의 활성 부위 또는 다른 생물학적 상호작용은 구조의 물리적 분석에 의해 측정될 수도 있다. 예를 들면, de Vos et al., 1992, Science 255: 306-312; Smith et al., 1992, J. Mol. Biol. 224: 899-904; Wlodaver et al., 1992, FEBS Lett. 309: 59-64 참조. 필수 아미노산의 동일성은 본 발명에 따른 폴리펩티드에 관련된 폴리펩티드와 동일성 분석을 통하여 추론할 수도 있다.
단일 또는 다중 아미노산 치환, 결실 및/또는 삽입은 Reidhaar-Olson and Sauer, 1988, Science 241: 53-57; Bowie and Sauer, 1989, Proc. Natl. Acad. Sci USA 86: 2152-2156; WO 95/17413; 또는 WO 95/22625에 개시된 바와 같이, 돌연변이유발, 재조합 및/또는 셔플링의 공지된 방법에 이어서 관련 선별 절차를 사용하여 제조하고 테스트할 수 있다. 사용할 수 있는 다른 방법은 실수-유발(error-prone) PCR, 파지 디스플레이(예컨대, Lowman et al., 1991, Biochem. 30: 10832-10837; 미국 특허 제5,223,409호; WO 92/06204), 및 영역-지정 돌연변이유발 (Derbyshire et al., 1986, Gene 46: 145; Ner et al., 1988, DNA 7: 127)를 포함한다.
돌연변이유발/셔플링 방법은 높은-처리량의 자동화 선별 방법과 병용하여 숙주 세포에 의해 발현된 클로닝, 돌연변이유발된 폴리펩티드의 활성을 검출할 수 있다(Ness et al., 1999, Nature Biotechnology 17: 893-896). 활성 폴리펩티드를 암호화하는 돌연변이유발된 DNA 분자를 숙주 세포로부터 회수할 수 있으며, 당해 기술 분야의 표준 방법을 사용하여 신속하게 시퀀싱할 수 있다. 이들 방법은 대상 폴리펩티드 내의 개별 아미노산 잔기의 중요도를 신속하게 결정하도록 하며, 미지 구조의 폴리펩티드에 적용할 수 있다.
SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12 또는 SEQ ID NO: 14의 성숙한 폴리펩티드의 아미노산 치환, 결실 및/또는 삽입의 총수는 10, 바람직하게는 9, 보다 바람직하게는 8, 보다 바람직하게는 7, 보다 바람직하게는 6 이하, 보다 바람직하게는 5, 보다 바람직하게는 4, 보다 더 바람직하게는 3, 가장 바람직하게는 2, 가장 더 바람직하게는 1이다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 어떤 속의 미생물로부터 얻을 수 있다. 본 발명의 목적을 위하여, 주어진 공급원과 연관하여 본원에서 사용되는 용어 "로부터 얻어진"은 뉴클레오티드 서열에 의하여 암호화된 폴리펩티드가 공급원에 의하여 또는 공급원으로부터의 뉴클레오티드 서열이 삽입된 균주에 의하여 생성되었다는 것을 의미한다. 바람직한 양태에서, 주어진 공급원으로부터 얻어진 폴리펩티드는 세포외로 분비된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 박테리아 폴리펩티드일 수 있다. 예를 들면, 셀룰로오스가수분해 증진 활성을 갖는 Bacillus, Streptococcus, Streptomyces, Staphylococcus, Enterococcus, Lactobacillus, Lactococcus, Clostridium, Geobacillus, 또는 Oceanobacillus 폴리펩티드와 같은 그람 양성 박테리아 폴리펩티드, 또는 셀룰로오스가수분해 증진 활성을 갖는 E. coli, Pseudomonas, Salmonella, Campylobacter, Helicobacter, Flavobacterium, Fusobacterium, llyobacter, Neisseria, 또는 Ureaplasma와 같은 그람 음성 박테리아 폴리펩티드일 수 있다.
바람직한 양태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus brevis, Bacillus culans, Bacillus clausii, Bacillus coagulans, Bacillus firmus, Bacillus lautus, Bacillus lentus, Bacillus licheniformis, Bacillus megaterium, Bacillus pumilus, Bacillus stearothermophilus, Bacillus subtilis, 또는 Bacillus thuringiensis 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Streptococcus equisimilis, Streptococcus pyogenes, Streptococcus uberis, 또는 Streptococcus equi subsp. Zooepidemicus 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Streptomyces achromogenes, Streptomyces avermitilis, Streptomyces coelicolor, Streptomyces griseus, 또는 Streptomyces lividans 폴리펩티드이다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 또한 진균 폴리펩티드일 수 있으며, 보다 바람직하게는 셀룰로오스 가수분해 증진 활성을 갖는 Candida, Kluyveromyces, Pichia, Saccharomyces, Schizosaccharomyces, 또는 Yarrowia 폴리펩티드와 같은 효모 폴리펩티드; 또는 보다 바람직하게는 셀룰로오스가수분해 증진 활성을 갖는 Acremonium, Agaricus, Alternaria, Aspergillus, Aureobasidium, Botryospaeria, Ceriporiopsis, Chaetomidium, Chrysosporium, Claviceps, Cochliobolus, Coprinopsis, Coptotermes, Corynascus, Cryphonectria, Cryptococcus, Diplodia, Exidia, Filibasidium, Fusarium, Gibberella, Holomastigotoides, Humicola, Irpex, Lentinula, Leptospaeria, Magnaporthe, Melanocarpus, Mehpilus, Mucor, Myceliophthora, Neocalllmastix, Neurospora, Paecilomyces, Penlcillium, Phanerochaete, Piromyces, Poitrasia, Pseudoplectania, Pseudotrichonympha, Rhizomucor, Schizophyllum, Scytalidium, Talaromyces, Thermoascus, Thielavia, Tolypodadium, Trichoderma, Trichophaea, Verticillium, Volvariella, 또는 Xylaria 폴리펩티드와 같은 사상 진균 폴리펩티드이다.
바람직한 양태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Saccharomyces carlsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, 또는 Saccharomyces oviformis 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 셀룰로오스가수분해 증진 활성을 갖는 Acremonium cellulolyticus, Aspergillus aculeatus, Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Chrysosporium keratinophilum, Chrysosporium lucknowense, Chrysosporium tropicum, Chrysosporium merdarium, Chrysosporium inops, Chrysosporium pannicola, Chrysosporium queenslandicum, Chrysosporium zonatum, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola grisea, Humicola insolens, Humicola lanuginosa, Irpex lacteus, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium funiculosum, Penicillium purpurogenum, Phanerochaete chrysosporium, Thielavia achromatica, Thielavia albomyces, Thielavia albopilosa, Thielavia australeinsis, Thielavia fimeti, Thielavia microspore, Thielavia ovispora, Thielavia peruviana, Thielavia spededonium, Thielavia setosa, Thielavia subthermophila, Thielavia terrestris, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, Trichoderma viride, 또는 Trichophaea saccata 폴리펩티드이다.
보다 바람직한 양태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Trichoderma terrestris 폴리펩티드이다. 가장 바람직한 실시형태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Trielavia terrestris NRRL 8126 폴리펩티드, 예컨대 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 2, 4, 6, 8 또는 10의 성숙한 폴리펩티드, 또는 그것의 단편이다.
다른 보다 바람직한 양태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Thermoascus aurantiacus 폴리펩티드, 예컨대 SEQ ID NO: 12의 성숙한 폴리펩티드이다.
다른 보다 바람직한 양태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Trichoderma reesei 폴리펩티드이다. 다른 가장 바람직한 양태에서, 폴리펩티드는 셀룰로오스 가수분해 증진 활성을 갖는 Trichoderma reesei RutC30 (ATCC 56765) 폴리펩티드, 예컨대 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 14의 성숙한 폴리펩티드 또는 그것의 단편이다.
전술한 종에 대하여 본 발명은 완전한 상태 및 불완전한 상태 모두, 및 다른 분류학적 동등물, 예컨대, 알려진 종 이름과 관계없이 무성생식형을 포괄한다는 것이 이해된다. 당업자들은 적합한 동등물의 동일성을 쉽게 인지할 것이다.
이러한 종의 균주는 American Type Culture Collection(ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM), Centraalbureau Voor Schimmelcultures(CBS), 및 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center(NRRL)와 같은 공공의 다수 미생물 기탁기관에서 쉽게 입수할 수 있다.
더욱이, 이러한 폴리펩티드는 자연(예컨대, 토양, 퇴비, 물 등)으로부터 분리된 미생물을 포함하는 다른 공급원으로부터 상기 언급한 프로브를 사용하여 식별되고 얻어질 수 있다. 천연 자생지로부터 미생물을 분리하는 기술은 당해 기술 분야에 공지되어 있다. 폴리뉴클레오티드는 그 다음 이러한 미생물의 게놈 또는 cDNA 라이브러리를 유사하게 선별하여 얻을 수 있다. 폴리폴리펩티드를 암호화하는 폴리뉴클레오티드 서열이 프로브(들)에 의하여 검출되면, 폴리뉴클레오티드는 당업자에게 알려진 활용 기술에 의하여 분리되거나 또는 클로닝될 수 있다(예컨대, 상기 Sambrook et al., 1989 참조).
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는 또한 다른 폴리펩티드가 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드 또는 그것의 단편의 N-말단 또는 C-말단에서 융합된, 융합된 폴리펩티드 또는 분열가능한 융합 폴리펩티드를 포함한다. 융합된 폴리펩티드는 다른 폴리펩티드를 암호화하는 뉴클레오티드 서열(또는 이들의 부분)을 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열(또는 이들의 부분)에 융합함으로써 생성할 수 있다. 융합 폴리펩티드 생성 기술은 당해 기술 분야에 공지되어 있으며, 폴리펩티드를 암호화하는 암호화 서열을 프레임 내에 존재하고 융합된 폴리펩티드의 발현이 동일한 프로모터(들) 및 터미테이터의 제어하에 있도록 라이게이션하는 것을 포함한다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드 및 그것의 폴리뉴클레오티드에 대한 더욱 상세는 WO 2005/074647, WO 2005/074656 및 미국 공개 출원 제2007/0077630호를 참조하며 이들은 본원에 참조로 포함된다.
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드는 본원에 설명된 바와 같이 분리되고 본 발명의 방법에 사용될 수 있다.
폴리뉴클레오티드는 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화하는 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화서열에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98%, 또는 99%인 뉴클레오티드 서열을 포함거나 이들로 구성된다.
바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 1을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30699에 함유된 플라스미드 pEJG120에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 1의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30699에 함유된 플라스미드 pEJG120에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 2의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 1와 상이하다. 본 발명은 또한 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 2의 단편을 암호화하는 SEQ ID NO: 1의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 3을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30813에 함유된 플라스미드 pTter61C에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 3의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30813에 함유된 플라스미드 pTter61C에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 4의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 3과 상이하다. 본 발명은 또한 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 4의 단편을 암호화하는 SEQ ID NO: 3의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 5를 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30812에 함유된 플라스미드 pTter61D에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 5의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30812에 함유된 플라스미드 pTter61D에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 6의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 5와 상이하다. 본 발명은 또한 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 6의 단편을 암호화하는 SEQ ID NO: 5의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 7을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30814에 함유된 플라스미드 pTter61E에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 7의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30814에 함유된 플라스미드 pTter61E에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 8의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 7과 상이하다. 본 발명은 또한 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 8의 단편을 암호화하는 SEQ ID NO: 7의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 9를 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30811에 함유된 플라스미드 pTter61G에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 9의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30811에 함유된 플라스미드 pTter61G에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 10의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 9와 상이하다. 본 발명은 또한 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 10의 단편을 암호화하는 SEQ ID NO: 9의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 11을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30704에 함유된 플라스미드 pDZA2-7에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 11의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30704에 함유된 플라스미드 pDZA2-7에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 12의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 11과 상이하다. 본 발명은 또한 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 12의 단편을 암호화하는 SEQ ID NO: 11의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 13을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30878에 함유된 플라스미드 pTr3337에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 Escherichia coli NRRL B-30878에 함유된 플라스미드 pTr3337에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 14의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 13 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 셀룰로오스 가수분해 증진 활성을 갖는 SEQ ID NO: 14의 단편을 암호화하는 SEQ ID NO: 13의 부분서열에 관한 것이다.
본 발명은 또한 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열에 적어도 하나의 돌연변이를 포함하는 성숙한 폴리뉴클레오티드에 관한 것이며, 여기에서 성숙한 뉴클레오티드 서열은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드를 암호화한다. 바람직한 양태에서, 성숙한 폴리펩티드는 SEQ ID NO: 2의 아미노산 20 내지 326, SEQ ID NO: 4의 아미노산 18 내지 240, SEQ ID NO: 6의 아미노산 20 내지 258, SEQ ID NO: 8의 아미노산 19 내지 226, 또는 SEQ ID NO: 10의 아미노산 20 내지 304, SEQ ID NO: 12의 아미노산 23 내지 250, 또는 SEQ ID NO: 14의 아미노산 20 내지 249이다. 다른 바람직한 양태에서, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 1의 뉴클레오티드 388 내지 1332, SEQ ID NO: 3의 뉴클레오티드 98 내지 821, SEQ ID NO: 5의 뉴클레오티드 126 내지 978, SEQ ID NO: 7의 뉴클레오티드 55 내지 678, SEQ ID NO: 9의 뉴클레오티드 58 내지 912, SEQ ID NO: 11의 뉴클레오티드 67 내지 796, 또는 SEQ ID NO: 13의 뉴클레오티드 77 내지 766이다.
앞서 설명한 바와 같이, 폴리펩티드를 암호화하는 폴리뉴클레오티드를 분리 또는 클로닝하는데 사용되는 기술은 해당 기술분야에 알려져 있으며 게놈 DNA로부터의 분리, cDNA로부터의 제조, 또는 이들의 조합을 포함한다.
폴리뉴클레오티드는 또한 본원에 정의된 바와 같이, 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 1, SEQ ID NO: 1, SEQ ID NO: 5, 또는 SEQ ID NO: 11의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열, 또는 SEQ ID NO: 7, SEQ ID NO: 9 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥; 또는 그것의 대립 변이체 및 부분서열과 혼성화하는 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 포함하거나 또는 이들로 구성될 수 있다(상기 Sambrook et al., 1989). 바람직한 양태에서, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 1의 뉴클레오티드 388 내지 1332, SEQ ID NO: 3의 뉴클레오티드 98 내지 821, SEQ ID NO: 5의 뉴클레오티드 126 내지 978, SEQ ID NO: 7의 뉴클레오티드 55 내지 678, SEQ ID NO: 9의 뉴클레오티드 58 내지 912, SEQ ID NO: 11의 뉴클레오티드 67 내지 796, 또는 SEQ ID NO: 13의 뉴클레오티드 77 내지 766이다.
베타-글루코시다아제 및 그것의 폴리뉴클레오티드
셀룰로오스-함유 물질을 처리하는데 유용한 베타-글루코시다아제 활성을 갖는 어떤 폴리펩티드는 본 발명의 조성물의 성분일 수 있다. 베타-글루코시다아제 활성을 갖는 이러한 폴리펩티드를 암호화하는 폴리뉴클레오티드를 사용하여 조성물을 제조할 수 있다.
제1 양태에서, 베타-글루코시다아제 활성을 갖는 분리된 폴리펩티드는 베타-글루코시다아제 활성을 갖는 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, 또는 SEQ ID NO: 28의 성숙한 폴리펩티드에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98%, 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, 또는 SEQ ID NO: 28의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 다른 아미노산 서열을 포함하거나 또는 이들로 구성된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 16의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 아미노산 20 내지 861, 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 아미노산 20 내지 861을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 아미노산 20 또는 861 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 16의 아미노산 20 내지 861으로 구성된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 18의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 아미노산 20 내지 861, 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 아미노산 20 내지 861을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 아미노산 20 또는 861 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 18의 아미노산 20 내지 861으로 구성된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 20의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 아미노산 20 내지 863, 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 아미노산 20 내지 863을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 아미노산 20 또는 863 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 20의 아미노산 20 내지 863으로 구성된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 22의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 아미노산 37 내지 878, 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 아미노산 37 내지 878을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 아미노산 37 또는 878 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 22의 아미노산 37 내지 878로 구성된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 24의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 아미노산 32 내지 744, 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 아미노산 32 내지 744를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 아미노산 32 또는 744 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 24의 아미노산 32 내지 744로 구성된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 26의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 아미노산 20 내지 860, 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 아미노산 20 내지 860을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 아미노산 20 또는 860 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 26의 아미노산 20 내지 860으로 구성된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 바람직하게는 SEQ ID NO: 28의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 아미노산 20 내지 860, 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 아미노산 20 내지 860을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 아미노산 서열 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 아미노산 20 또는 860 또는 그것의 대립 변이체; 또는 베타-글루코시다아제 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 28의 아미노산 20 내지 860으로 구성된다.
바람직하게는, SEQ ID NO: 16의 성숙한 폴리펩티드의 단편은 적어도 720 아미노산 잔기, 보다 바람직하게는 적어도 760 아미노산 잔기, 가장 바람직하게는 적어도 800 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 18의 성숙한 폴리펩티드의 단편은 적어도 720 아미노산 잔기, 보다 바람직하게는 적어도 760 아미노산 잔기, 가장 바람직하게는 적어도 800 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 20의 성숙한 폴리펩티드의 단편은 적어도 770 아미노산 잔기, 보다 바람직하게는 적어도 800 아미노산 잔기, 가장 바람직하게는 적어도 830 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 22의 성숙한 폴리펩티드의 단편은 적어도 720 아미노산 잔기, 보다 바람직하게는 적어도 760 아미노산 잔기, 가장 바람직하게는 적어도 800 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 24의 성숙한 폴리펩티드의 단편은 적어도 620 아미노산 잔기, 보다 바람직하게는 적어도 650 아미노산 잔기, 가장 바람직하게는 적어도 680 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 26의 성숙한 폴리펩티드의 단편은 적어도 720 아미노산 잔기, 보다 바람직하게는 적어도 760 아미노산 잔기, 가장 바람직하게는 적어도 800 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 28의 성숙한 폴리펩티드의 단편은 적어도 720 아미노산 잔기, 보다 바람직하게는 적어도 760 아미노산 잔기, 가장 바람직하게는 적어도 800 아미노산 잔기를 함유한다.
바람직하게는, SEQ ID NO: 15의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 2160 뉴클레오티드, 보다 바람직하게는 적어도 2280 뉴클레오티드, 가장 바람직하게는 적어도 2400 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 17의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 2160 뉴클레오티드, 보다 바람직하게는 적어도 2280 뉴클레오티드, 가장 바람직하게는 적어도 2400 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 19의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 2310 뉴클레오티드, 보다 바람직하게는 적어도 2400 뉴클레오티드, 가장 바람직하게는 적어도 2490 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 21의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 2160 뉴클레오티드, 보다 바람직하게는 적어도 2280 뉴클레오티드, 가장 바람직하게는 적어도 2400 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 23의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 1860 뉴클레오티드, 보다 바람직하게는 적어도 1950 뉴클레오티드, 가장 바람직하게는 적어도 2040 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 25의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 2160 뉴클레오티드, 보다 바람직하게는 적어도 2280 뉴클레오티드, 가장 바람직하게는 적어도 2400 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 2160 뉴클레오티드, 보다 바람직하게는 적어도 2280 뉴클레오티드, 가장 바람직하게는 적어도 2400 뉴클레오티드를 함유한다.
바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 Aspergillus oryzae 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 16의 성숙한 폴리펩티드를 암호화하는 SEQ ID NO: 15의 성숙한 폴리펩티드 암호화 서열을 포함하는 Aspergillus oryzae 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 Aspergillus oryzae 베타-글루코시다아제 돌연변이 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 18의 성숙한 폴리펩티드를 암호화하는 SEQ ID NO: 17의 성숙한 폴리펩티드 암호화 서열을 포함하는 Aspergillus oryzae 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 Aspergillus fumigatus 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 20의 성숙한 폴리펩티드를 암호화하는 SEQ ID NO: 19의 성숙한 폴리펩티드 암호화 서열을 포함하는 Aspergillus fumigatus 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 Penicillium brasilianum 균주 IBT 20888 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 22의 성숙한 폴리펩티드를 암호화하는 SEQ ID NO: 21의 성숙한 폴리펩티드 암호화 서열을 포함하는 Penicillium brasilianum 균주 IBT 20888 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 Trichoderma reesei 균주 No. QM9414 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 24의 성숙한 폴리펩티드를 암호화하는 SEQ ID NO: 23의 성숙한 폴리펩티드 암호화 서열을 포함하는 Trichoderma reesei 균주 No. QM9414 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다(GenBank™ 승인 번호 U09580).
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 Aspergillus niger 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 26의 성숙한 폴리펩티드를 암호화하는 SEQ ID NO: 25의 성숙한 폴리펩티드 암호화 서열을 포함하는 Aspergillus niger 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다(GenBank™ 승인 번호 AJ132386).
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 Aspergillus aculeatus 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 28의 성숙한 폴리펩티드를 암호화하는 SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열을 포함하는 Aspergillus aculeatus 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다(EMBL 승인 번호 D64088).
베타-글루코시다아제 활성을 갖는 Aspergillus oryzae 폴리펩티드는 WO 2002/095014에 따라 얻을 수 있다. 베타-글루코시다아제 활성을 갖는 Aspergillus oryzae 폴리펩티드 변이체는 WO 2004/099228에 따라 얻을 수 있다. 베타-글루코시다아제 활성을 갖는 Aspergillus fumigatus 폴리펩티드는 WO 2005/047499에 따라 얻을 수 있다. 베타-글루코시다아제 활성을 갖는 Penicillium brasilianum 폴리펩티드는 WO 2007/019442에 따라 얻을 수 있다. 베타-글루코시다아제 활성을 갖는 Trichoderma reesei 균주 번호 QM9414 폴리펩티드는 미국 특허 제6,022,725호에 따라 얻을 수 있다. 베타-글루코시다아제 활성을 갖는 Aspergillus niger 폴리펩티드는 Dan et al., 2000, J. Biol. Chem. 275: 4973-4980에 따라 얻을 수 있다. 베타-글루코시다아제 활성을 갖는 Aspergillus aculeatus 폴리펩티드는 Kawaguchi et al., 1996, Gene 173: 287-288에 따라 얻을 수 있다.
바람직한 양태에서, SEQ ID NO: 16의 성숙한 폴리펩티드는 E. coli DSM 14240에 함유된 플라스미드에 함유된 폴리뉴클레오티드에 의해 암호화된다. 다른 바람직한 양태에서, SEQ ID NO: 20의 성숙한 폴리펩티드는 E. coli NRRL B-30695에 함유된 플라스미드 pEJG113에 함유된 폴리뉴클레오티드에 의해 암호화된다. 다른 바람직한 양태에서, SEQ ID NO: 22의 성숙한 폴리펩티드는 E. coli NRRL B-30860에 함유된 플라스미드 pKKAB에 함유된 폴리뉴클레오티드에 의해 암호화된다.
제2 양태에서, 베타-글루코시다아제 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 함께 혼성화하는 뉴클레오티드 서열을 포함하는 또는 이들로 구성된 폴리뉴클레오티드에 의해 암호화된다(상기 J. Sambrook, E. F. Fritsch, 및 T. Maniatus, 1989). SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 베타-글루코시다아제 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다.
상기 설명한 바와 같이, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 뉴클레오티드 서열, 또는 그것의 부분서열; 및 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, 또는 SEQ ID NO: 28의 아미노산 서열 또는 그것의 단편을 사용하여 핵산 프로브를 설계하여 상이한 속 또는 종의 균주로부터 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 DNA를 식별 및 클로닝할 수 있다.
본 발명의 목적을 위해서, 상기 설명한 바와 같이 혼성화는 SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 DNA 서열, 그것의 전장 상보 가닥, 또는 이들의 부분서열에 대응하는 표지된 핵산 프로브로, 매우 낮은 내지 매우 높은 긴축 조건하에서 혼성화하는 것을 나타낸다.
바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 15의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 15의 뉴클레오티드 58 내지 2584이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 16을 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 15이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli DSM 14240에 함유된 폴리뉴클레오티드이며, 여기서 그것의 폴리뉴클레오티드 서열은 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli DSM 14240에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 17의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 17의 뉴클레오티드 58 내지 2584이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 18의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 17이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 19의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 19의 뉴클레오티드 73 내지 1413이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 20의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 19이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30695에 함유된 플라스미드 pEJG113에 함유된 폴리뉴클레오티드이며, 여기서 그것의 폴리뉴클레오티드 서열은 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30695에 함유된 플라스미드 pEJG113에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 21의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 21의 뉴클레오티드 67 내지 1377이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 22의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 21이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30860에 함유된 플라스미드 pKKAB에 함유된 폴리뉴클레오티드이며, 여기서 그것의 폴리뉴클레오티드 서열은 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30860에 함유된 성숙한 폴리펩티드 암호화 영역이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 23의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 23의 뉴클레오티드 88 내지 2232이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 24의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 23이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 25의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 25의 뉴클레오티드 59 내지 2580이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 26의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 25이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 27의 뉴클레오티드 59 내지 2580이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 28의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 27이다.
길이가 적어도 100 뉴클레오티드인 긴 프로브에 대하여, 매우 낮은 내지 매우 높은 긴축 조건은 본원에 정의된 바와 같다.
길이가 적어도 100 뉴클레오티드인 긴 프로브에 대하여, 담체 물질은 본원에 정의된 바와 같이 최종적으로 세정된다.
길이가 약 15 뉴클레오티드 내지 약 70 뉴클레오티드인 짧은 프로브에 대하여, 긴축 조건은 본원에 정의된 바와 같다.
길이가 약 15 뉴클레오티드 내지 약 70 뉴클레오티드인 짧은 프로브에 대하여, 담체 물질은 본원에 정의된 바와 같이 세정된다.
제3 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98%, 또는 99%인 뉴클레오티드 서열을 포함하거나 또는 이들로 구성된 폴리뉴클레오티드에 의해 암호화되며, 이것은 활성 폴리펩티드를 암호화한다.
제6 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26 또는 SEQ ID NO: 28; 또는 그것의 상동 서열의 성숙한 폴리펩티드의 인공 변이체이다. 이러한 인공 변이체의 제조방법은 상기 설명되었다.
SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, 또는 SEQ ID NO: 28의 성숙한 폴리펩티드의 아미노산 치환, 결실 및/또는 삽입의 총수는 10, 바람직하게는 9, 보다 바람직하게는 8, 보다 바람직하게는 7, 보다 바람직하게는 6 이하, 보다 바람직하게는 5, 보다 바람직하게는 4, 보다 더 바람직하게는 3, 가장 바람직하게는 2, 가장 더 바람직하게는 1이다.
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 패밀리 1 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드 패밀리 3 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제 활성을 갖는 폴리펩티드는 패밀리 5 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
본 발명에서 폴리뉴클레오티드를 위한 공급원으로서 사용할 수 있는 다른 베타-글루코시다아제의 예는 Aspergillus oryzae 베타-글루코시다아제(WO 02/095014; WO 04/099228); Aspergillus aculeatus 베타-글루코시다아제(Kawaguchi et al., 1996, Gene 173: 287-288); Aspergillus avenaceus 베타-글루코시다아제(GenBank™ 승인 번호 AY943971); Aspergillus fumigatus 베타-글루코시다아제(GenBank™ 승인 번호 XM745234); Aspergillus kawachii 베타-글루코시다아제(GenBank™ 승인 번호 AB003470); Aspergillus niger 베타-글루코시다아제(GenBank™ AJ132386); Magnaporthe grisea 베타-글루코시다아제(GenBank™ 승인 번호 AY849670); Phanerochaete chrysosporium 베타-글루코시다아제(GenBank™ 승인 번호 AB253327); Talaromyces emersonii 베타-글루코시다아제(GenBank™ 승인 번호 AY072918), 및 Trichoderma reesei 베타-글루코시다아제(GenBank™ 승인 번호 U09580, AB003110, AY281374, AY281375, AY281377, AY281378, 및 AY281379)를 포함하지만 이에 제한되는 것은 아니다. 베타-글루코시다아제의 변이체는 또한 WO 04/099228에 설명된 것과 같은 폴리뉴클레오티드를 위한 공급원으로서 사용될 수 있다.
다른 베타-글루코시다아제는 Henrissat B., 1991, 아미노산 서열 유사성에 기초한 글리코실 히드롤라아제의 분류, Biochem. J. 280: 309-316, 및 Henrissat B., 및 Bairoch A., 1996, 글리코실 히드롤라아제의 서열-기초 분류의 갱신, Biochem. J. 316: 695-696에 따른 분류를 사용하여 13 이상의 글리코실 히드롤라아제 패밀리에 개시된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 또한 어떤 속의 미생물로부터 얻을 수 있다. 본 발명의 목적으로 위해서, 본원에 정의된 바와 같이 용어 "로부터 얻어진"이 사용된다. 바람직한 양태에서, 주어진 공급원으로부터 얻어진 폴리펩티드는 세포외로 분비된다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 박테리아 폴리펩티드일 수 있다. 예를 들면, 폴리펩티드는 베타-글루코시다아제 활성을 갖는 Bacillus, Streptococcus, Streptomyces, Staphylococcus, Enterococcus, Lactobacillus, Lactococcus, Clostridium, Geobacillus, 또는 Oceanobacillus 폴리펩티드와 같은 그람 양성 박테리아 폴리펩티드, 또는 베타-글루코시다아제 활성을 갖는 E. coli, Pseudomonas, Salmonella, Campylobacter, Helicobacter, Flavobacterium, Fusobacterium, llyobacter, Neisseria, 또는 Ureaplasma 폴리펩티드와 같은 그람 음성 박테리아 폴리펩티드일 수 있다.
바람직한 양태에서, 폴리펩티드는 베타-글루코시다아제 활성을 갖는 Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus brevis, Bacillus Circulans, Bacillus clausii, Bacillus coagulans, Bacillus firmus, Bacillus lautus, Bacillus lentus, Bacillus licheniformis, Bacillus megaterium, Bacillus pumilus, Bacillus stearothermophilus, Bacillus subtilis, 또는 Bacillus thuringiensis 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 베타-글루코시다아제 활성을 갖는 Streptococcus equisimilis, Streptococcus pyogenes, Streptococcus uberis, 또는 Streptococcus equi subsp. Zooepidemicus 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 베타-글루코시다아제 활성을 갖는 Streptomyces achromogenes, Streptomyces avermitilis, Streptomyces coelicolor, Streptomyces griseus, 또는 Streptomyces lividans 폴리펩티드이다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 또한 진균 폴리펩티드일 수 있으며, 보다 바람직하게는 베타-글루코시다아제 활성을 갖는 Candida, Kluyveromyces, Pichia, Saccharomyces, Schizosaccharomyces, 또는 Yarrowia 폴리펩티드와 같은 효모 폴리펩티드; 또는 보다 바람직하게는 베타-글루코시다아제 활성을 갖는 Acremonium, Agaricus, Alternaria, Aspergillus, Aureobasidium, Botryospaeria, Ceriporiopsis, Chaetomidium, Chrysosporium, Claviceps, Cochliobolus, Coprinopsis, Coptotermes, Corynascus, Cryphonectria, Cryptococcus, Diplodia, Exidia, Filibasidium, Fusarium, Gibberella, Holomastigotoides, Humicola, Irpex, Lentinula, Leptospaeria, Magnaporthe, Melanocarpus, Meripilus, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Piromyces, Poitrasia, Pseudoplectania, Pseudotrichonympha, Rhizomucor, Schizophyllum, Scytalidium, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trichoderma, Trichophaea, Verticillium, Volvariella, 또는 Xylaria 폴리펩티드와 같은 사상 진균 폴리펩티드이다.
바람직한 양태에서, 폴리펩티드는 베타-글루코시다아제 활성을 갖는 Saccharomyces carlsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, 또는 Saccharomyces oviformis 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 베타-글루코시다아제 활성을 갖는 Acremonium cellulolyticus, Aspergillus aculeatus, Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Chrysosporium keratinophilum, Chrysosporium lucknowense, Chrysosporium tropicum, Chrysosporium merdarium, Chrysosporium inops, Chrysosporium pannicola, Chrysosporium queenslandicum, Chrysosporium zonatum, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola grisea, Humicola insolens, Humicola lanuginosa, Irpex lacteus, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium funiculosum, Penicillium purpurogenum, Phanerochaete chrysosporium, Thielavia achromatica, Thielavia albomyces, Thielavia albopilosa, Thielavia australeinsis, Thielavia fimeti, Thielavia microspore, Thielavia ovispora, Thielavia peruviana, Thielavia spededonium, Thielavia setosa, Thielavia subthermophila, Thielavia terrestris, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, Trichoderma viride, 또는 Trichophaea saccata 폴리펩티드이다.
전술한 종에 대하여 본 발명은 완전한 상태 및 불완전한 상태 모두, 및 다른 분류학적 동등물, 예컨대, 알려진 종 이름과 관계없이 무성생식형을 포괄한다는 것이 이해된다. 당업자들은 적합한 동등물의 동일성을 쉽게 인지할 것이다.
이러한 종의 균주는 American Type Culture Collection(ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM), Centraalbureau Voor Schimmelcultures(CBS), 및 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center(NRRL)와 같은 공공의 다수 미생물 기탁기관에서 쉽게 입수할 수 있다.
더욱이, 본원에 설명한 바와 같이, 이러한 폴리펩티드는 자연(예컨대, 토양, 퇴비, 물 등)으로부터 분리된 미생물을 포함하는 다른 공급원으로부터 상기 언급한 프로브를 사용하여 식별되고 얻어질 수 있다.
베타-글루코시다아제 활성을 갖는 폴리펩티드는 또한 다른 폴리펩티드가 베타-글루코시다아제 활성을 갖는 폴리펩티드 또는 그것의 단편의 N-말단 또는 C-말단에서 융합된, 융합된 폴리펩티드 또는 분열가능한 융합 폴리펩티드를 포함한다.
본원에 설명한 바와 같이, 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성된 폴리뉴클레오티드는 본 발명의 방법을 실행하기 위해 분리되고 사용될 수 있다.
폴리뉴클레오티드는 SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98%, 또는 99%인, 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함거나 이들로 구성되며, 이것은 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화한다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 15를 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 E. coli DSM 14240에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 15의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 15의 뉴클레오티드 58 내지 2584를 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 E. coli DSM 14240에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 16의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 15 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 베타-글루코시다아제 활성을 갖는 SEQ ID NO: 16의 단편을 암호화하는 SEQ ID NO: 15의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 17을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 17의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 17의 뉴클레오티드 58 내지 2584를 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 18의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 17 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 베타-글루코시다아제 활성을 갖는 SEQ ID NO: 18의 단편을 암호화하는 SEQ ID NO: 17의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 19를 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 E. coli NRRL B-30695에 함유된 플라스미드 pEJG113에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 19의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 19의 뉴클레오티드 58 내지 2580를 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 E. coli NRRL B-30695에 함유된 플라스미드 pEJG113에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 20의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 19 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 베타-글루코시다아제 활성을 갖는 SEQ ID NO: 20의 단편을 암호화하는 SEQ ID NO: 19의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 21을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 E. coli NRRL B-30860에 함유된 플라스미드 pKKAB에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 21의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 21의 뉴클레오티드 109 내지 2751을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 E. coli NRRL B-30860에 함유된 플라스미드 pKKAB에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 22의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 21 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 베타-글루코시다아제 활성을 갖는 SEQ ID NO: 22의 단편을 암호화하는 SEQ ID NO: 21의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 23을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 23의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 23의 뉴클레오티드 88 내지 2232를 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 24의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 23 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 베타-글루코시다아제 활성을 갖는 SEQ ID NO: 24의 단편을 암호화하는 SEQ ID NO: 23의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 25를 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 25의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 23의 뉴클레오티드 88 내지 2232를 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 26의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 25 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 베타-글루코시다아제 활성을 갖는 SEQ ID NO: 26의 단편을 암호화하는 SEQ ID NO: 25의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 27을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 23의 뉴클레오티드 88 내지 2232를 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 28의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 27 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 베타-글루코시다아제 활성을 갖는 SEQ ID NO: 28의 단편을 암호화하는 SEQ ID NO: 27의 부분서열에 관한 것이다.
본 발명은 또한 SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열에 적어도 하나의 돌연변이를 포함하는 돌연변이 폴리뉴클레오티드에 관한 것이며, 여기서 돌연변이 뉴클레오티드 서열은 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, 또는 SEQ ID NO: 28의 성숙한 폴리펩티드를 암호화한다.
앞서 설명한 바와 같이, 폴리펩티드를 암호화하는 폴리뉴클레오티드를 분리 또는 클로닝하는데 사용되는 기술은 해당 기술분야에 알려져 있으며 게놈 DNA로부터의 분리, cDNA로부터의 제조, 또는 이들의 조합을 포함한다.
폴리뉴클레오티드는 또한 본원에 정의된 바와 같이, 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, 또는 SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, 또는 SEQ ID NO: 27의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 전장 상보 가닥; 또는 그것의 대립 변이체 및 부분서열과 혼성화하는 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열을 포함하거나 또는 이들로 구성될 수 있다(상기 Sambrook et al., 1989).
상기 바람직한 양태 각각에서, 성숙한 폴리펩티드는 SEQ ID NO: 16의 아미노산 20 내지 861, SEQ ID NO: 18의 아미노산 20 내지 861, SEQ ID NO: 22의 아미노산 20 내지 863, SEQ ID NO: 22의 아미노산 37 내지 878, SEQ ID NO: 24의 아미노산 32 내지 744, SEQ ID NO: 26의 아미노산 20 내지 860, 또는 SEQ ID NO: 28의 아미노산 20 내지 860이고, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 15의 뉴클레오티드 58 내지 2584, SEQ ID NO: 17의 뉴클레오티드 58 내지 2584, SEQ ID NO: 19의 뉴클레오티드 58 내지 2580, SEQ ID NO: 21의 뉴클레오티드 109 내지 2751, SEQ ID NO: 23의 뉴클레오티드 88 내지 2232, SEQ ID NO: 25의 뉴클레오티드 59 내지 2580, 또는 SEQ ID NO: 27의 뉴클레오티드 59 내지 2580이다.
베타-글루코시다아제 융합 폴리펩티드 및 그것의 폴리뉴클레오티드
베타-글루코시다아제는 또한 베타-글루코시다아제 융합 단백질의 형태일 수 있다. 베타-글루코시다아제 융합 폴리펩티드는 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열(또는 그것의 일부)을 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열(또는 그것의 일부) 및 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열(또는 그것의 일부)에 작동가능하게 결합된 신호 펩티드를 암호화하는 뉴클레오티드 서열에 융합함으로써 제조된다. 융합 폴리펩티드 제조 기술은 해당 기술분야에 알려져 있으며, 예컨대 폴리펩티드를 암호화하는 암호화 서열을 이들이 프레임 내에 있고 융합된 폴리펩티드의 발현은 동일한 프로모터(들) 및 터미네이터의 제어하에 있도록 라이게이션하는 것을 포함한다. 융합 단백질은 또한 융합이 번역후 생성되는 인테인(intein) 기술을 사용하여 구성될 수 있다(Cooper et al., 1993, EMBO J. 12: 2575-2583; Dawson et al., 1994, Science 266: 776-779).
신호 펩티드에 프레임 내에서 결합된 엔도글루카나아제의 촉매 도메인을 적어도 포함하는 베타-글루코시다아제 활성을 갖는 융합 단백질은 적어도 엔도글루카나아제의 촉매 도메인의 부재에 비하여 융합 단백질의 분비가 증가한다. 베타-글루코시다아제 활성을 갖는 융합 단백질의 분비 증가는 적어도 엔도글루카나아제의 촉매 도메인의 부재에 비하여 적어도 25%, 바람직하게는 적어도 50%, 보다 바람직하게는 적어도 100%, 보다 더 바람직하게는 적어도 150%, 보다 더 바람직하게는 적어도 200%, 가장 바람직하게는 적어도 500%, 가장 더 바람직하게는 적어도 1000%이다.
하기 각 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체의 성분은 구조체의 5' 말단으로부터 3' 말단까지 작동가능하게 결합된다.
바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 전장 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 전장 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 엔도글루카나아제(신호 펩티드 및 성숙한 폴리펩티드)의 전장 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 전장 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인 및 선택적으로 링커 및/또는 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드 및 선택적으로 링커 및/또는 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인 및 선택적으로 링커 및/또는 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드 및 선택적으로 링커 및/또는 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인 및 선택적으로 링커 및/또는 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 전장 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드 및 선택적으로 링커 및/또는 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 전장 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 또 다른 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 또 다른 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 또 다른 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 또 다른 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인, 및 선택적으로 링커 및 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 또 다른 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드, 및 선택적으로 링커 및 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 또 다른 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 촉매 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 촉매 도메인, 및 선택적으로 링커 및 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 또 다른 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체는 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 엔도글루카나아제의 성숙한 폴리펩티드, 및 선택적으로 링커 및 셀룰로오스 결합 도메인을 암호화하는 서열을 포함하는 폴리뉴클레오티드; 또 다른 신호 펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드; 및 베타-글루코시다아제의 성숙한 폴리펩티드를 암호화하는 서열을 포함하는 폴리뉴클레오티드를 포함한다.
상기 각 바람직한 양태에서, 베타-글루코시다아제 융합 단백질 구조체의 성분은 프로모터 영역을 더 포함한다.
베타-글루코시다아제 활성 또는 엔도글루카나아제 활성을 갖는 촉매 도메인, 성숙한 폴리펩티드, 또는 전장 폴리펩티드를 암호화하는 폴리뉴클레오티드는 어떤 유기체로부터 얻을 수 있다. 본 발명의 목적을 위해서, 용어 "폴리펩티드"는 베타-글루코시다아제 또는 엔도글루카나아제 활성을 갖는 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인; 또는 이들의 일부 또는 단편을 포함하는 것으로 이해된다. 용어 "로부터 얻어진"은 본원에 정의된 바와 같이 사용된다.
많은 엔도글루카나아제는 링커 펩티드에 의해 셀룰로오스 결합 도메인(CBD)으로부터 분리된 촉매 도메인으로 구성된 멀티도메인 구조를 갖는다(Suurnakki et al., 2000, Cellulose 7: 189-209). 촉매 도메인은 활성 부위를 함유하는 반면, CBD는 셀룰로오스에 효소를 결함시킴으로써 상호작용한다(van Tilbeurgh et al., 1986, FEBS Letters 204: 223-227; Tomme et al., 1988, European Journal of Biochemistry 170: 575-581).
베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드는 앞서 설명하였다.
엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드는 박테리아 폴리펩티드를 암호화하는 유전자로부터 얻을 수 있다. 예를 들면, 폴리펩티드는 Bacillus, Streptococcus, Streptomyces, Staphylococcus, Enterococcus, Lactobacillus, Lactococcus, Clostridium, GeoBacillus, 또는 Oceanobacillus 폴리펩티드를 포함하지만 이에 제한되지 않는 그람 양성 박테리아 폴리펩티드, 예컨대 Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus brevis, Bacillus Circulans, Bacillus coagulans, Bacillus lautus, Bacillus lentus, Bacillus licheniformis, Bacillus megaterium, Bacillus stearothermophilus, Bacillus subtilis, Bacillus thuringiensis, Streptococcus equisimilis, Streptococcus pyogenes, Streptococcus uberis, 및 Streptococcus equi subsp. Zooepidemicus, Streptomyces lividans, 또는 Streptomyces murinus 폴리펩티드; 또는 E. coli, Pseudomonas, Salmonella, Campylobacter, Helicobacter, Flavobacterium, Fusobacterium, llyobacter, Neisseria, 또는 Ureaplasma 폴리펩티드를 포함하지만 이에 제한되지 않는 그람 음성 박테리아 폴리펩티드일 수 있다.
본 발명의 방법에서 폴리뉴클레오티드를 위한 공급원으로서 사용될 수 있는 박테리아 엔도글루카나아제의 예는 Acidothermus cellulolyticus 엔도글루카나아제(WO 91/05039; WO 93/15186; 미국 특허 제5,275,944호; WO 96/02551; 미국 특허 제5,536,655호, WO 00/70031, WO 05/093050); Thermobifida fusca 엔도글루카나아제 III(WO 05/093050); 및 Thermobifida fusca 엔도글루카나아제 V(WO 05/093050)를 포함하지만 이에 제한되는 것은 아니다.
엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드는 또한 진균 폴리펩티드를 암호화하는 유전자로부터 얻을 수 있으며, 보다 바람직하게는 Candida, Kluyveromyces, Pichia, Saccharomyces, Schizosaccharomyces, 또는 Yarrowia 폴리펩티드와 같은 효모 폴리펩티드; 또는 보다 바람직하게는 Acremonium, Agaricus, Altemaria, Aspergillus, Aureobasidium, Botryospaeria, Ceriporiopsis, Chaetomidium, Chrysosporium, Claviceps, Cochliobolus, Coprinopsis, Coptotermes, Corynascus, Cryphonectria, Cryptococcus, Diplodia, Exidia, Filibasidium, Fusarium, Gibberella, Holomastigotoides, Humicola, Irpex, Lentinula, Leptospaeria, Magnaporthe, Melanocarpus, Meripilus, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penidllium, Phanerochaete, Piromyces, Poitrasia, Pseudoplectania, Pseudotrichonympha, Rhizomucor, Schizophyllum, Scytalidium, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trichoderma, Trichophaea, Verticillium, Votvariella, 또는 Xylaria 폴리펩티드와 같은 사상 진균 폴리펩티드이다.
바람직한 양태에서, 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드는 Saccharomyces carlsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, 또는 Saccharomyces oviformis 폴리펩티드를 암호화하는 유전자로부터 얻을 수 있다.
또 다른 바람직한 양태에서, 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드는 Acremonium cellulolyticus, Aspergillus aculeatus, Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Chrysosporium keratinophilum, Chrysosporium lucknowense, Chrysosporium tropicum, Chrysosporium merdarium, Chrysosporium inops, Chrysosporium pannicola, Chrysosporium queenslandicum, Chrysosporium zonatum, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola grisea, Humicola insolens, Humicola lanuginosa, Irpex lacteus, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium funiculosum, Penicillium purpurogenum, Phanerochaete chrysosporium, Thielavia achromatica, Thielavia albomyces, Thielavia albopilosa, Thielavia australeinsis, Thielavia fimeti, Thielavia microspore, Thielavia ovispora, Thielavia peruviana, Thielavia spededonium, Thielavia setosa, Thielavia subthermophila, Thielavia terrestris, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, Trichoderma viride, 또는 Trichophaea saccata 폴리펩티드를 암호화하는 유전자로부터 얻을 수 있다.
본 발명의 방법에서 폴리뉴클레오티드를 위한 공급원으로서 사용할 수 있는 진균 엔도글루카나아제의 예는 Trichoderma reesei 엔도글루카나아제 I(Penttila et al., 1986, Gene 45: 253-263; GenBank™ 승인 번호 M15665); Trichoderma reesei 엔도글루카나아제 II(Saloheimo, et al., 1988, Gene 63:11-22; GenBank™ 승인 번호 M19373); Trichoderma reesei 엔도글루카나아제 III(Okada et al., 1988, Appl. Environ. Microbiol. 64: 555-563; GenBank™ 승인 번호 AB003694); Trichoderma reesei 엔도글루카나아제 IV(Saloheimo et al., 1997, Eur. J. Biochem. 249: 584-591; GenBank™ 승인 번호 Y11113); 및 Trichoderma reesei 엔도글루카나아제 V(Saloheimo et al., 1994, Molecular Microbiology 13: 219-228; GenBank™ 승인 번호 Z33381); Aspergillus aculeatus 엔도글루카나아제(Ooi et al., 1990, Nucleic Acids Research 18: 5884); Aspergillis kawachii 엔도글루카나아제(Sakamoto et al., 1995, Current Genetics 27: 435-439); Chrysosporium sp. C1(미국 특허 제6,573,086호; GenPept 승인 번호 AAQ38150); Corynascus heterothallicus(미국 특허 제6,855,531호; GenPept 승인 번호 AAY00844); Erwinia carotovara 엔도글루카나아제(Saarilahti et al., 1990, Gene 90: 9-14); Fusarium oxysporum 엔도글루카나아제(GenBank™ 승인 번호 L29381); Humicola grisea var. thermoidea 엔도글루카나아제(GenBank™ 승인 번호 AB003107); Melanocarpus albomyces 엔도글루카나아제(GenBank™ 승인 번호 MAL515703); Neurospora crassa 엔도글루카나아제(GenBank™ 승인 번호 XM_324477); Piromyces equi(Eberhardt et al., 2000, Microbiology 146: 1999-2008; GenPept 승인 번호 CAB92325); Rhizopus oryzae(Moriya et al., 2003, J. Bacteriology 185: 1749-1756; GenBank™ 승인 번호 AB047927, AB056667, 및 AB056668); 및 Thielavia terrestris(WO 2004/053039; EMBL 승인 번호 CQ827970)를 포함하지만 이에 제한되는 것은 아니다.
다른 엔도글루카나아제는 Henrissat B., 1991, 아미노산 서열 유사성에 기초한 글리코실 히드롤라아제의 분류, Biochem. J. 280: 309-316, 및 Henrissat B., 및 Bairoch A., 1996, 글리코실 히드롤라아제의 서열-기초 분류의 갱신, Biochem. J. 316: 695-696에 따른 분류를 사용하여 13 이상의 글리코실 히드롤라아제 패밀리에 개시된다.
엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 분리 또는 클로닝하는데 사용되는 기술은 해당 기술분야에 알려져 있으며, 게놈 DNA로부터의 분리, cDNA로부터의 제조 또는 이들의 조합을 포함한다. 이러한 게놈 DNA로부터 폴리뉴클레오티드의 클로닝을, 예컨대 잘 알려진 폴리메라제 연쇄 반응(PCR) 또는 발현 라이브러리의 항체 스크리닝을 사용하여 행함으로써 공유된 구조적 특징을 갖는 클로닝된 DNA 단편을 검출한다. 예컨대 Innis et al., 1990, PCR: A Guide to Methods and Application, Academic Press, New York 참조. 리가아제 연쇄 반응(LCR), 라이게이션 활성화 전사(LAT) 및 뉴클레오티드 서열-기반 증폭(NASBA)과 같은 다른 핵산 증폭 과정을 사용할 수 있다.
전술한 종에 대하여 본 발명은 완전한 상태 및 불완전한 상태 모두, 및 다른 분류학적 동등물, 예컨대, 알려진 종 이름과 관계없이 무성생식형을 포괄한다는 것이 이해된다. 당업자들은 적합한 동등물의 동일성을 쉽게 인지할 것이다.
이러한 종의 균주는 American Type Culture Collection(ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM), Centraalbureau Voor Schimmelcultures(CBS), 및 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center(NRRL)와 같은 공공의 다수 미생물 기탁기관에서 쉽게 입수할 수 있다.
바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 엔도글루카나아제 I 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 엔도글루카나아제 II 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 엔도글루카나아제 III 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 엔도글루카나아제 IV 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 엔도글루카나아제 V 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Humicola insolens 엔도글루카나아제 V 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 30의 폴리펩티드를 암호화하는 SEQ ID NO: 29를 포함하는 Humicola insolens 엔도글루카나아제 V 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 엔도글루카나아제 VI 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 패밀리 5 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 Myceliophthora thermophila CBS 117.65 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 SEQ ID NO: 32의 폴리펩티드를 암호화하는 SEQ ID NO: 31을 포함하는 Myceliophthora thermophila CBS 117.65 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 basidiomycete CBS 495.95 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드, 또는 촉매 도메인은 SEQ ID NO: 34의 폴리펩티드를 암호화하는 SEQ ID NO: 33을 포함하는 basidiomycete CBS 495.95 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 basidiomycete CBS 494.95 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 36의 폴리펩티드를 암호화하는 SEQ ID NO: 35를 포함하는 basidiomycete CBS 494.95 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 6 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Thielavia terrestris NRRL 8126 CEL6B 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 38의 폴리펩티드를 암호화하는 SEQ ID NO: 37을 포함하는 Thielavia terrestris NRRL 8126 CEL6B 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Thielavia terrestris NRRL 8126 CEL6C 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 40의 폴리펩티드를 암호화하는 SEQ ID NO: 39를 포함하는 Thielavia terrestris NRRL 8126 CEL6C 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 7 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Thielavia terrestris NRRL 8126 CEL7C 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 42의 폴리펩티드를 암호화하는 SEQ ID NO: 41를 포함하는 Thielavia terrestris NRRL 8126 CEL7C 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Thielavia terrestris NRRL 8126 CEL7E 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 44의 폴리펩티드를 암호화하는 SEQ ID NO: 43을 포함하는 Thielavia terrestris NRRL 8126 CEL7E 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Thielavia terrestris NRRL 8126 CEL7F 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 46의 폴리펩티드를 암호화하는 SEQ ID NO: 45를 포함하는 Thielavia terrestris NRRL 8126 CEL7F 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 보다 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Cladorrhinum foecundissimum ATCC 62373 CEL7A 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 폴리펩티드는 SEQ ID NO: 48의 폴리펩티드를 암호화하는 SEQ ID NO: 47을 포함하는 Cladorrhinum foecundissimum ATCC 62373 CEL7A 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 가장 바람직한 실시형태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 50의 폴리펩티드를 암호화하는 SEQ ID NO: 49를 포함하는 Trichoderma reesei 균주 No. VTT-D-80133 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다(GenBank™ 승인 번호 M 15665).
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 9 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 12 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 45 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 보다 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 45 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 양태에서, 패밀리 45 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 30의 폴리펩티드를 암호화하는 SEQ ID NO: 29를 포함하는 Humicola insolens 엔도글루카나아제 V 유전자, 또는 그것의 오르소로그 및 변이체로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 바람직한 패밀리 45 엔도글루카나아제 및 그것의 폴리뉴클레오티드는 Chrysosporium sp. C1(미국 특허 제6,573,086호; GenPept 승인 번호 AAQ38150); Corynascus heterothailicus(미국 특허 제6,855,531호; GenPept 승인 번호 AAY00844); Piromyces equi(Eberhardt et al., 2000, Microbiology 146: 1999-2008; GenPept 승인 번호 CAB92325); 및 Rhizopus oryzae(Moriya et al., 2003, J. Bacteriology 185: 1749-1756; GenBank™ 승인 번호 AB047927, AB056667, 및 AB056668)로부터 얻어진다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 74 엔도글루카나아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
바람직한 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 1 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다..
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 3 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 패밀리 5 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Aspergillus oryzae 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 16의 폴리펩티드를 암호화하는 SEQ ID NO: 15를 포함하는 Aspergillus oryzae 베타-글루코시다아제 유전자 또는 SEQ ID NO: 18의 폴리펩티드를 암호화하는 SEQ ID NO: 17을 포함하는 Aspergillus oryzae 베타-글루코시다아제 돌연변이 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Aspergillus fumigatus 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 20의 폴리펩티드를 암호화하는 SEQ ID NO: 19를 포함하는 Aspergillus fumigatus 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Penicillium brasilianum 균주 IBT 20888 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 22의 폴리펩티드를 암호화하는 SEQ ID NO: 21를 포함하는 Penicillium brasilianum 균주 IBT 20888 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Trichoderma reesei 균주 No. QM9414 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 다른 가장 바람직한 실시형태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 24의 폴리펩티드를 암호화하는 SEQ ID NO: 23를 포함하는 Trichoderma reesei 균주 No. QM9414 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다(GenBank™ 승인 번호 U09580).
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Aspergillus niger 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 26의 폴리펩티드를 암호화하는 SEQ ID NO: 25를 포함하는 Aspergillus niger 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 Aspergillus aculeatus 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다. 가장 바람직한 실시형태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 28의 폴리펩티드를 암호화하는 SEQ ID NO: 27을 포함하는 Aspergillus aculeatus 베타-글루코시다아제 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화된다.
다른 바람직한 양태에서, 베타-글루코시다아제는 자연적으로 분비된다. 다른 바람직한 양태에서, 베타-글루코시다아제는 자연적으로 분비되지 않는다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, 또는 SEQ ID NO: 50의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인의 아미노산 서열에 대하여 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98%, 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된 상동 폴리펩티드를 암호화하는 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화되며, 이것은 엔도글루카나아제 활성을 갖는다. 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48 또는 SEQ ID NO: 50의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인과 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산 상이한 아미노산 서열을 갖는다.
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26 또는 SEQ ID NO: 28의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인의 아미노산 서열에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된 상동 폴리펩티드를 암호화하는 유전자로부터 얻어진 폴리뉴클레오티드에 의해 암호화되며, 이것은 엔도글루카나아제 활성을 갖는다. 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26 또는 SEQ ID NO: 28의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인과 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산 상이한 아미노산 서열을 포함하거나 또는 이들로 구성된다.
다른 바람직한 양태에서, 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 매우 낮은 긴축 조건, 바람직하게는 낮은 긴축 조건, 보다 바람직하게는 중간 긴축 조건, 보다 바람직하게는 중상 긴축 조건, 보다 더 바람직하게는 높은 긴축 조건, 가장 바람직하게는 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, 또는 SEQ ID NO: 49, (ii) SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47 또는 SEQ ID NO: 49에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성된 폴리뉴클레오티드에 의해 암호화된다(J. Sambrook, E.F. Fritsch, and T. Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 2d edition, Cold Spring Harbor, New York). SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41 , SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47 또는 SEQ ID NO: 49의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다.
다른 바람직한 양태에서, 베타-글루코시다아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인은 매우 낮은 긴축 조건, 바람직하게는 낮은 긴축 조건, 보다 바람직하게는 중간 긴축 조건, 보다 바람직하게는 중상 긴축 조건, 보다 더 바람직하게는 높은 긴축 조건, 가장 바람직하게는 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25 또는 SEQ ID NO: 27, (ii) SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21 , SEQ ID NO: 23, SEQ ID NO: 25 또는 SEQ ID NO: 27에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 함께 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 구성된 폴리뉴클레오티드에 의해 암호화된다(J. Sambrook, E.F. Fritsch, and T. Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 2d edition, Cold Spring Harbor, New York). SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25 또는 SEQ ID NO: 27의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다.
엔도글루카나아제를 위한 SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47 또는 SEQ ID NO: 49의 뉴클레오티드 서열 또는 그것의 부분서열, 및 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48 또는 SEQ ID NO: 50의 아미노산 서열 또는 그것의 단편, 및 베타-글루코시다아제를 위한 SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25 또는 SEQ ID NO: 27의 뉴클레오티드 서열 또는 그것의 부분서열, 및 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26 또는 SEQ ID NO: 28의 아미노산 서열 또는 그것의 단편은 상기 설명한 바와 같이 상이한 속 또는 종의 균주로부터 엔도글루카나아제 또는 베타-글루코시다아제 활성을 갖는 폴리펩티드를 암호화하는 DNA를 식별 및 클로닝하기 위한 핵산 프로브를 설계하는데 사용될 수 있다.
본 발명의 목적을 위해서, 상기 설명한 바와 같이, 혼성화는 뉴클레오티드 서열을 매우 낮은 내지 매우 높은 긴축 조건하에서 상기 설명한 뉴클레오티드 서열 중 하나에 대응하는 표지된 핵산 프로브에 혼성화하는 것을 나타낸다.
길이가 적어도 100 뉴클레오티드인 긴 프로브를 위해서, 매우 낮은 긴축 조건 내지 매우 높은 긴축 조건은 본원에 설명한 바와 같다.
길이가 적어도 100 뉴클레오티드인 긴 프로브를 위해서, 담체 물질은 본원에 설명된 바와 같이 최종적으로 세정된다.
길이가 약 15 뉴클레오티드 내지 약 70 뉴클레오티드인 짧은 프로브를 위해서, 긴축 조건은 본원에 설명한 바와 같다.
길이가 약 15 뉴클레오티드 내지 약 70 뉴클레오티드인 짧은 프로브를 위해서, 담체 물질은 본원에 설명된 바와 같이 세정된다.
다른 바람직한 양태에서, "셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드 및 그것의 폴리뉴클레오티드" 부분에서 설명한 엔도글루카나아제의 전장 폴리펩티드, 성숙한 폴리펩티드 또는 촉매 도메인을 사용하여 베타-글루코시다아제 융합 단백질을 구성할 수도 있다.
바람직한 양태에서, 베타-글루코시다아제 융합 단백질은 SEQ ID NO: 104을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질은 SEQ ID NO: 103을 포함하거나 또는 이들로 구성된 폴리뉴클레오티드로 암호화된다. 다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질은 SEQ ID NO: 106을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 베타-글루코시다아제 융합 단백질은 SEQ ID NO: 105을 포함하거나 또는 이들로 구성된 폴리뉴클레오티드에 의해 암호화된다.
상기 설명한 바와 같이, 많은 엔도글루카나아제는 셀룰로오스 결합 도메인으로부터 링커 펩티드에 의해 분리된 촉매 도메인으로 구성된 멀티도메인 구조를 갖는다. 본 발명의 방법에서, 베타-글루코시다아제 융합 구조체는 엔도글루카나아제 촉매 도메인을 포함하는 서열에 대하여 3' 위치하고 베타-글루코시다아제 촉매 도메인을 포함하는 서열에 대하여 5' 위치한 링커를 더 포함할 수 있다.
링커는 엔도글루카나아제의 촉매 도메인과 동일한 유전자 또는 상이한 엔도글루카나아제 유전자로부터 얻을 수 있다. 한편, 링커는 기원에서 합성할 수 있다.
본 발명의 방법에서 사용할 수 있는 링커의 예는 Trichoderma reesei 셀로비오히드롤라아제 I(Srisodsuk et al., 1993, Journal of Biological Chemistry 268: 20765-20761); Hypocrea jecorina(전 Trichoderma reesei) Cel7A 셀로비오히드롤라아제(Mulakala et al., 2005, Proteins 60: 598-605); Humicola insolens 엔도글루카나아제 V; 및 Thielavia terrestris NRRL 8126 CEL7C 엔도글루카나아제를 위한 유전자로부터 얻어진 링커를 포함하지만 이에 제한되는 것은 아니다.
바람직한 양태에서, 링커는 Humicola insolens 엔도글루카나아제 유전자로부터 얻어진다. 다른 바람직한 양태에서, 링커는 Trichoderma reesei 엔도글루카나아제 유전자로부터 얻어진다. 보다 바람직한 양태에서, 링커는 Humicola insolens 엔도글루카나아제 V (eg5) 유전자로부터 얻어진다.
다른 바람직한 양태에서, 링커는 Thielavia terrestris 엔도글루카나아제 유전자로부터 얻어진다. 다른 보다 바람직한 양태에서, 링커는 Thielavia terrestris NRRL 8126 CEL7C 엔도글루카나아제 유전자로부터 얻어진다.
바람직한 양태에서, 링커는 적어도 5 아미노산 잔기이다. 보다 바람직한 양태에서, 링커는 적어도 15 아미노산 잔기이다. 가장 바람직한 양태에서, 링커는 적어도 25 아미노산 잔기이다.
바람직한 양태에서, 링커는 약 5 내지 60 아미노산 잔기이다. 보다 바람직한 양태에서, 링커는 약 15 내지 50 아미노산 잔기이다. 가장 바람직한 양태에서, 링커는 약 25 내지 45 아미노산 잔기이다.
많은 종류의 탄수화물 결합 도메인이 설명되어 있지만, 그것의 대부분은 일반적으로 셀룰로오스-결합 도메인(CBD)이라고 언급된다. 통상적인 셀룰로오스-결합 도메인은 셀룰라아제에서 발생한다. 마찬가지로, 다른 CBD의 하위분류, 예컨대 키틴-결합 도메인(통상적으로 키티나아제에서 발생하는 CBD), 자일란-결합 도메인(통상적으로 자일라나아제에서 발생하는 CBD), 만난-결합 도메인(통상적으로 만난아제에서 발생하는 CBD) 및 전분-결합 도메인을 포괄할 수 있다.
CBD는 특히 기질 가수분해를 위한 활성 부위를 함유하는 촉매 도메인 및 해당 탄수화물 기질에 결합하기 위한 탄수화물-결합 도메인(CBD)을 통상적으로 포함하는 가수분해 효소(히드롤라아제)에서, 둘 이상의 폴리펩티드 아미노산 서열 영역으로 구성된 대형 폴리펩티드 또는 단백질의 완전한 부분으로서 발견된다. 이러한 효소는 하나 이상의 촉매 도메인 및 1, 2 또는 3개의 CBD을 포함할 수 있으며, 선택적으로 CBD(들)를 촉매 도메인(들)과 연결하는 하나 이상의(다수의) 폴리펩티드 아미노산 서열 영역을 더 포함하고, 후자 종류의 영역을 대개 "링커"라고 한다. CBD를 포함하는 가수분해 효소의 예는 셀룰라아제, 자일라나아제, 만난아제, 아라비노푸라노시다아제, 아세틸에스테라아제 및 키티나아제이다(P. Tomme et al., Cellulose-Binding Domains - Classification and Properties in Enzymatic Degradation of Insoluble Carbohydrates, John N. Saddler and Michael H. Penner (Eds.), ACS Symposium Series, No. 618, 1996). 알려진 CBD의 대부분은 셀룰라아제 및 자일라나아제로부터 유도된다.
CBD는 단백질 또는 폴리펩티드의 N 또는 C 말단 또는 내부 위치에 위치할 수 있다. CBD를 구성하는 폴리펩티드 또는 단백질의 영역은 통상적으로 약 30 초과 약 250 미만의 아미노산 잔기로 구성된다. 예컨대: 상기 Tomme et al., 1996에 따라 패밀리 I로 열거되고 분류된 CBD들은 33-37 아미노산 잔기로 구성되고, 패밀리 IIa로 열거되고 분류된 CBD들은 95-108 아미노산 잔기로 구성되고, 패밀리 VI로 열거되고 분류된 CBD들은 85-92 아미노산 잔기로 구성되는 한편, 패밀리 VII로 열거되고 분류된 하나의 CBD(Clostridium thermocellum로부터의 셀룰로오스로부터 유래)는 240 아미노산 잔기로 구성된다. 따라서, CBD를 구성하는 아미노산 서열의 분자량은 통상적으로 약 4 kDa 내지 약 40 kDa 범위 내에 있으며, 대개 약 35 kDa 미만이다.
본 발명의 방법에서, 어떤 CBD를 사용할 수 있다. CBD는 자연적으로 엔도글루카나아제와 관련되거나 또는 엔도글루카나아제에 대하여 이질적일 수 있다.
바람직한 양태에서, CBD는 Trichoderma reesei 엔도글루카나아제 (EG) 유전자로부터 얻어진다. 보다 바람직한 양태에서, CBD는 Trichoderma reesei 엔도글루카나아제 EGI 유전자로부터 얻어진다. 다른 보다 바람직한 양태에서, CBD는 Trichoderma reesei 엔도글루카나아제 EGII 유전자로부터 얻어진다. 다른 보다 바람직한 양태에서, CBD는 Trichoderma reesei 엔도글루카나아제 EGV로부터 얻어진다.
다른 바람직한 양태에서, CBD는 Trichoderma reesei 셀로비오히드롤라아제 (CBH) 유전자로부터 얻어진다. 다른 바람직한 양태에서, CBD는 Trichoderma reesei CBHI 유전자로부터 얻어진다(Terri et al., 1987, Gene 51: 42-52; Linder and Teeri, 1996, Biochemistry 93: 12251-12255). 다른 바람직한 양태에서, CBD는 Trichoderma reesei CBHII 유전자로부터 얻어진다.
다른 바람직한 양태에서, CBD는 Thielavia terrestris 엔도글루카나아제 유전자로부터 얻어진다. 다른 보다 바람직한 양태에서, CBD는 Thielavia terrestris NRRL 8126 CEL7C 엔도글루카나아제 유전자로부터 얻어진다.
베타-글루코시다아제 융합 구조체는 분열 부위를 더 포함할 수 있다. 분열 부위는 바람직하게는 엔도글루카나아제 촉매 도메인을 적어도 포함하는 서열 후 베타-글루코시다아제 촉매 도메인을 적어도 포함하는 서열 전에 위치한다. 베타-글루코시다아제 융합 단백질의 분비시, 이 부위가 분열되어 융합 단백질로부터 베타-글루코시다아제 활성을 갖는 폴리펩티드를 방출한다.
분열 부위의 예는 디펩티드 Lys-Arg를 암호화하는 Kex2 부위(Martin et al., 2003, J. Ind. Microbiol. Biotechnol. 3: 568-76; Svetina et al., 2000, J. Biotechnol. 76: 245-251; Rasmussen-Wilson et al., 1997, Appl. Environ. Microbiol. 63: 3488-3493; Ward et al., 1995, Biotechnology 13: 498-503; 및 Contreras et al., 1991, Biotechnology 9: 378-381), 아르기닌 잔기 후 인자 Xa 프로테아제에 의해 분열되는 IIe-(Glu 또는 Asp)-Gly-Arg 부위(Eaton et al., 1986, Biochem. 25: 505-512); 리신 후 엔테로키나아제에 의해 분열되는 Asp-Asp-Asp-Asp-Lys 부위(Collins-Racie et al., 1995, Biotechnology 13: 982-987); 제네나아제 I에 의해 분열되는 His-Tyr-Glu 부위 또는 His-Tyr-Asp 부위(Carter et al., 1989, Proteins: Structure, Function, and Genetics 6: 240-248); Arg 후 트롬빈에 의해 분열되는 Leu-Val-Pro-Arg-Gly-Ser 부위(Stevens, 2003, Drug Discovery World 4: 35-48); Gln 후 TEV 프로테아제에 의해 분열되는 Glu-Asn-Leu-Tyr-Phe-Gln-Gly 부위(상기 Stevens, 2003); 및 Gln 후 사람 리노바이러스 3C 프로테아제에의 유전자 조작 형태에 의해 분열되는 Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro 부위(상기 Stevens, 2003)를 포함하지만 이에 제한되는 것은 아니다.
셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드 및 그것의 폴리뉴클레오티드
본 발명에서, 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드 및 이들의 폴리뉴클레오티드는 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A) 및 Trichoderma reesei 엔도글루카나아제 I (CEL7B), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 바람직하게 선택되고, 또한 Trichoderma reesei 엔도글루카나아제 II (CEL5A), Trichoderma reesei 엔도글루카나아제 III (CEL12A) 및 Trichoderma reesei 엔도글루카나아제 V (CEL45A), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 선택된다.
제1 양태에서, 셀로비오히드롤라아제 I 활성을 갖는 분리된 폴리펩티드는 셀로비오히드롤라아제 I 활성을 갖는 SEQ ID NO: 52의 성숙한 폴리펩티드(Trichoderma reesei 셀로비오히드롤라아제 I; CEL7A)에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%; 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 52의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 상이한 아미노산 서열을 포함하거나 또는 이들로 구성된다.
셀로비오히드롤라아제 I 활성을 갖는 폴리펩티드는 SEQ ID NO: 52의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 I 활성을 갖는 이들의 단편을 바람직하게 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 아미노산 18 내지 514 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 I 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 아미노산 18 내지 514을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 I 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 아미노산 18 내지 514 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 I 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 52의 아미노산 18 내지 514으로 구성된다.
다른 제1 양태에서, 셀로비오히드롤라아제 II 활성을 갖는 분리된 폴리펩티드는 SEQ ID NO: 54의 성숙한 폴리펩티드(Trichoderma reesei 셀로비오히드롤라아제 II; CEL6A)의 아미노산 서열에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 이루어지며, 이것은 셀로비오히드롤라아제 II 활성을 갖다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 54의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 상이한 아미노산 서열을 포함하거나 또는 이들로 구성된다.
셀로비오히드롤라아제 II 활성을 갖는 폴리펩티드는 SEQ ID NO: 54의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 II 활성을 갖는 이들의 단편을 바람직하게 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 아미노산 25 내지 471, 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 II 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 아미노산 25 내지 471을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 II 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 아미노산 25 내지 471 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 II 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 54의 아미노산 25 내지 471으로 구성된다.
다른 제1 양태에서, 엔도글루카나아제 I 활성을 갖는 분리된 폴리펩티드는 엔도글루카나아제 I 활성을 갖는 SEQ ID NO: 56의 성숙한 폴리펩티드(Trichoderma reesei 엔도글루카나아제 I; CEL7B)에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 56의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 다른 아미노산 서열을 포함하거나 또는 이들로 구성된다.
엔도글루카나아제 I 활성을 갖는 폴리펩티드는 SEQ ID NO: 56의 아미노산 서열 또는 그것의 대립 변이체; 또는 엔도글루카나아제 I 활성을 갖는 이들의 단편을 바람직하게 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 아미노산 23 내지 459, 또는 그것의 대립 변이체; 또는 엔도글루카나아제 I 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 아미노산 23 내지 459를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 아미노산 서열 또는 그것의 대립 변이체; 또는 엔도글루카나아제 I 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 아미노산 23 내지 459 또는 그것의 대립 변이체; 또는 엔도글루카나아제 I 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 56의 아미노산 23 내지 459로 구성된다.
다른 제1 양태에서, 엔도글루카나아제 II 활성을 갖는 분리된 폴리펩티드는 엔도글루카나아제 II 활성을 갖는 SEQ ID NO: 58의 성숙한 폴리펩티드(Trichoderma reesei 엔도글루카나아제 II; CEL5A)에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 58의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 상이한 아미노산 서열을 포함하거나 또는 이들로 구성된다.
엔도글루카나아제 II 활성을 갖는 폴리펩티드는 SEQ ID NO: 58의 아미노산 서열 또는 그것의 대립 변이체; 또는 엔도글루카나아제 II 활성을 갖는 이들의 단편을 바람직하게 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 아미노산 22 내지 418, 또는 그것의 대립 변이체; 또는 엔도글루카나아제 II 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 아미노산 22 내지 418을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 아미노산 서열 또는 그것의 대립 변이체; 또는 엔도글루카나아제 II 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 아미노산 22 내지 418 또는 그것의 대립 변이체; 또는 엔도글루카나아제 II 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 58의 아미노산 22 내지 418로 구성된다.
다른 제1 양태에서, 엔도글루카나아제 III 활성을 갖는 분리된 폴리펩티드는 엔도글루카나아제 III 활성을 갖는 SEQ ID NO: 60의 성숙한 폴리펩티드(Trichoderma reesei 엔도글루카나아제 III; CEL12A)에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 60의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 상이한 아미노산 서열을 포함하거나 또는 이들로 구성된다.
엔도글루카나아제 III 활성을 갖는 폴리펩티드는 SEQ ID NO: 60의 아미노산 서열 또는 그것의 대립 변이체; 또는 엔도글루카나아제 III 활성을 갖는 이들의 단편을 바람직하게 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 아미노산 17 내지 234, 또는 그것의 대립 변이체; 또는 엔도글루카나아제 III 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 아미노산 17 내지 234를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 아미노산 서열 또는 그것의 대립 변이체; 또는 엔도글루카나아제 III 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 아미노산 17 내지 234 또는 그것의 대립 변이체; 또는 엔도글루카나아제 III 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 60의 아미노산 17 내지 234로 구성된다.
다른 제1 양태에서, 엔도글루카나아제 V 활성을 갖는 분리된 폴리펩티드는 엔도글루카나아제 V 활성을 갖는 SEQ ID NO: 62의 성숙한 폴리펩티드(Trichoderma reesei 엔도글루카나아제 V; CEL45A)에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 62의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 상이한 아미노산 서열을 포함하거나 또는 이들로 구성된다.
엔도글루카나아제 V 활성을 갖는 폴리펩티드는 SEQ ID NO: 62의 아미노산 서열 또는 그것의 대립 변이체; 또는 엔도글루카나아제 V 활성을 갖는 이들의 단편을 바람직하게 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 아미노산 1 내지 242, 또는 그것의 대립 변이체; 또는 엔도글루카나아제 V 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 아미노산 18 내지 242를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 아미노산 서열 또는 그것의 대립 변이체; 또는 엔도글루카나아제 V 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 아미노산 18 내지 242 또는 그것의 대립 변이체; 또는 엔도글루카나아제 V 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 62의 아미노산 18 내지 242로 구성된다.
다른 제1 양태에서, 셀로비오히드롤라아제 II 활성을 갖는 분리된 폴리펩티드는 셀로비오히드롤라아제 II 활성을 갖는 SEQ ID NO: 64의 성숙한 폴리펩티드 Thielavia terrestirs 셀로비오히드롤라아제 II; CEL6A)에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 아미노산 서열을 포함하거나 또는 이들로 구성된다(이하 "상동 폴리펩티드"). 바람직한 양태에서, 상동 폴리펩티드는 SEQ ID NO: 64의 성숙한 폴리펩티드와 10 아미노산, 바람직하게는 5 아미노산, 보다 바람직하게는 4 아미노산, 보다 더 바람직하게는 3 아미노산, 가장 바람직하게는 2 아미노산, 가장 더 바람직하게는 1 아미노산이 상이한 아미노산 서열을 포함하거나 또는 이들로 구성된다.
셀로비오히드롤라아제 II 활성을 갖는 폴리펩티드는 SEQ ID NO: 64의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 II 활성을 갖는 이들의 단편을 바람직하게 포함한다. 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 아미노산 서열을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 성숙한 폴리펩티드를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 아미노산 18 내지 481, 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 II 활성을 갖는 이들의 단편을 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 아미노산 18 내지 481를 포함한다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 아미노산 서열 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 II 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 아미노산 서열로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 성숙한 폴리펩티드로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 아미노산 18 내지 481 또는 그것의 대립 변이체; 또는 셀로비오히드롤라아제 II 활성을 갖는 이들의 단편으로 구성된다. 다른 바람직한 양태에서, 폴리펩티드는 SEQ ID NO: 64의 아미노산 18 내지 481로 구성된다.
바람직하게는, SEQ ID NO: 52의 성숙한 폴리펩티드의 단편은 적어도 425 아미노산 잔기, 보다 바람직하게는 적어도 450 아미노산 잔기, 가장 바람직하게는 적어도 475 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 54의 성숙한 폴리펩티드의 단편은 적어도 390 아미노산 잔기, 보다 바람직하게는 적어도 410 아미노산 잔기, 가장 바람직하게는 적어도 430 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 56의 성숙한 폴리펩티드의 단편은 적어도 370 아미노산 잔기, 보다 바람직하게는 적어도 390 아미노산 잔기, 가장 바람직하게는 적어도 410 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 58의 성숙한 폴리펩티드의 단편은 적어도 340 아미노산 잔기, 보다 바람직하게는 적어도 360 아미노산 잔기, 가장 바람직하게는 적어도 380 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 60의 성숙한 폴리펩티드의 단편은 적어도 190 아미노산 잔기, 보다 바람직하게는 적어도 200 아미노산 잔기, 가장 바람직하게는 적어도 210 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 62의 성숙한 폴리펩티드의 단편은 적어도 190 아미노산 잔기, 보다 바람직하게는 적어도 200 아미노산 잔기, 가장 바람직하게는 적어도 210 아미노산 잔기를 함유한다. 바람직하게는, SEQ ID NO: 64의 성숙한 폴리펩티드의 단편은 적어도 400 아미노산 잔기, 보다 바람직하게는 적어도 420 아미노산 잔기, 가장 바람직하게는 적어도 440 아미노산 잔기를 함유한다.
바람직하게는, SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 1275 뉴클레오티드, 보다 바람직하게는 적어도 1350 뉴클레오티드, 가장 바람직하게는 적어도 1425 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 1170 뉴클레오티드, 보다 바람직하게는 적어도 1230 뉴클레오티드, 가장 바람직하게는 적어도 1290 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 1110 뉴클레오티드, 보다 바람직하게는 적어도 1170 뉴클레오티드, 가장 바람직하게는 적어도 1230 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 1020 뉴클레오티드, 보다 바람직하게는 적어도 1080 뉴클레오티드, 가장 바람직하게는 적어도 1140 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 570 뉴클레오티드, 보다 바람직하게는 적어도 600 뉴클레오티드, 가장 바람직하게는 적어도 630 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 570 뉴클레오티드, 보다 바람직하게는 적어도 600 뉴클레오티드, 가장 바람직하게는 적어도 630 뉴클레오티드를 함유한다. 바람직하게는, SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 1200 뉴클레오티드, 보다 바람직하게는 적어도 1260 뉴클레오티드, 가장 바람직하게는 적어도 1320 뉴클레오티드를 함유한다.
제2 양태에서, 셀로비오히드롤라아제 I 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성되는 폴리뉴클레오티드에 의해 암호화된다(상기 J. Sambrook, E.F. Fritsch, and T. Maniatus, 1989). SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 셀로비오히드롤라아제 I 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다.
다른 제2 양태에서, 셀로비오히드롤라아제 II 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성되는 폴리뉴클레오티드에 의해 암호화된다(상기 J. Sambrook, E.F. Fritsch, and T. Maniatus, 1989). SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 셀로비오히드롤라아제 II 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다.
다른 제2 양태에서, 엔도글루카나아제 I 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성되는 폴리뉴클레오티드에 의해 암호화된다(상기 J. Sambrook, E.F. Fritsch, and T. Maniatus, 1989). SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 엔도글루카나아제 I 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다.
다른 제2 양태에서, 엔도글루카나아제 II 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성되는 폴리뉴클레오티드에 의해 암호화된다(상기 J. Sambrook, E.F. Fritsch, and T. Maniatus, 1989). SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 엔도글루카나아제 II 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다.
다른 제2 양태에서, 엔도글루카나아제 III 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성되는 폴리뉴클레오티드에 의해 암호화된다(상기 J. Sambrook, E.F. Fritsch, and T. Maniatus, 1989). SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 엔도글루카나아제 III 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다.
다른 제2 양태에서, 엔도글루카나아제 V 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성되는 폴리뉴클레오티드에 의해 암호화된다(상기 J. Sambrook, E.F. Fritsch, and T. Maniatus, 1989). SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 엔도글루카나아제 V 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다.
다른 제2 양태에서, 셀로비오히드롤라아제 II 활성을 갖는 분리된 폴리펩티드는 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 부분서열, 또는 (iv) (i), (ii) 또는 (iii)의 전장 상보 가닥과 혼성화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성되는 폴리뉴클레오티드에 의해 암호화된다(상기 J. Sambrook, E.F. Fritsch, and T. Maniatus, 1989). SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열의 부분서열은 적어도 100 인접 뉴클레오티드 또는 바람직하게는 적어도 200 인접 뉴클레오티드를 함유한다. 또한, 부분서열은 셀로비오히드롤라아제 II 활성을 갖는 폴리펩티드 단편을 암호화할 수 있다.
바람직한 양태에서, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 51의 뉴클레오티드 52 내지 1542, SEQ ID NO: 53의 뉴클레오티드 73 내지 1413, SEQ ID NO: 55의 뉴클레오티드 67 내지 1377, SEQ ID NO: 57의 뉴클레오티드 64 내지 1254, SEQ ID NO: 59의 뉴클레오티드 49 내지 702, SEQ ID NO: 61의 뉴클레오티드 52 내지 726, 또는 SEQ ID NO: 63의 뉴클레오티드 52 내지 1443이다.
상기 설명한 바와 같이, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59. SEQ ID NO: 61 또는 SEQ ID NO: 63의 뉴클레오티드 서열 또는 그것의 부분서열; 및 SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62 또는 SEQ ID NO: 64의 아미노산 서열 또는 그것의 단편은, 상이한 속 또는 종의 균주로부터 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 DNA를 식별 및 클로닝하기 위한 핵산 프로브를 설계하는데 사용할 수 있다.
본 발명의 목적을 위해서, 혼성화는 뉴클레오티드 서열이 SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57 또는 SEQ ID NO: 59, SEQ ID NO: 61, 또는 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, 또는 SEQ ID NO: 59, SEQ ID NO: 61, 또는 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, 그것의 전장 상보 가닥, 또는 이들이 부분서열에 상응하는 표지된 핵산 프로브에 매우 낮은 내지 매우 높은 긴축 조건하에서 혼성화하는 것을 나타낸다.
바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 51의 뉴클레오티드 52 내지 1542이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 52의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 51이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 53의 뉴클레오티드 73 내지 1413이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 54의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 53이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 55의 뉴클레오티드 67 내지 1377이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 56의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 55이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 57의 뉴클레오티드 64 내지 1254이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 58의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 57이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 59의 뉴클레오티드 49 내지 702이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 60의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 59이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 61의 뉴클레오티드 52 내지 726이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 62의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 61이다.
다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 63의 뉴클레오티드 52 내지 1443이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 64의 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열, 또는 그것의 부분서열이다. 다른 바람직한 양태에서, 핵산 프로브는 SEQ ID NO: 63이다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30802에 함유된 플라스미드 pTter6A에 함유된 폴리뉴클레오티드 서열이며, 여기서 이들의 폴리뉴클레오티드 서열은 셀로비오히드롤라아제 활성을 갖는 폴리펩티드를 암호화한다. 다른 바람직한 양태에서, 핵산 프로브는 E. coli NRRL B-30802에 함유된 플라스미드 pTter6A에 함유된 성숙한 폴리펩티드 암호화 영역이다.
길이가 적어도 100 뉴클레오티드인 긴 프로브를 위해서, 매우 낮은 내지 매우 높은 긴축 조건은 본원에 정의된 바와 같다.
길이가 적어도 100 뉴클레오티드인 긴 프로브를 위해서, 담체 물질은 본원에 정의된 바와 같이 최종적으로 세정된다.
길이가 약 15 뉴클레오티드 내지 약 70 뉴클레오티드인 짧은 프로브를 위해서, 긴축 조건은 본원에 정의된 바이다.
길이가 약 15 뉴클레오티드 내지 약 70 뉴클레오티드인 짧은 프로브를 위해서, 담체 물질은 본원에 정의된 바와 같이 세정된다.
제3 양태에서, 분리된 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, 또는 SEQ ID NO: 59, SEQ ID NO: 61, 또는 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98%, 또는 99%인 뉴클레오티드 서열을 포함하거나 또는 이들로 구성된 폴리뉴클레오티드에 의해 암호화되며, 이것은 활성 폴리펩티드를 암호화한다.
바람직한 양태에서, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 51의 뉴클레오티드 52 내지 1542, SEQ ID NO: 53의 뉴클레오티드 73 내지 1413, SEQ ID NO: 55의 뉴클레오티드 67 내지 1377, SEQ ID NO: 57의 뉴클레오티드 64 내지 1254, SEQ ID NO: 59의 뉴클레오티드 49 내지 702, SEQ ID NO: 61의 뉴클레오티드 52 내지 726, 또는 SEQ ID NO: 63의 뉴클레오티드 52 내지 1443이다. 본원의 폴리뉴클레오티드 부분 참조.
제6 양태에서, 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 분리된 폴리펩티드는 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, 또는 SEQ ID NO: 64; 또는 그것의 상동 서열의 성숙한 폴리펩티드의 인공 변이체이다. 이러한 인공 변이체를 제조하는 방법은 상기 설명되어 있다.
SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62 또는 SEQ ID NO: 64의 성숙한 폴리펩티드의 아미노산 치환, 결실 및/또는 삽입의 총수는 10, 바람직하게는 9, 보다 바람직하게는 8, 보다 바람직하게는 7, 보다 바람직하게는 6 이하, 보다 바람직하게는 5, 보다 바람직하게는 4, 보다 더 바람직하게는 3, 가장 바람직하게는 2, 가장 더 바람직하게는 1이다.
셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드는 어떤 속의 미생물로부터 얻을 수 있다. 본 발명의 목적을 위해서, 용어 "로부터 얻어진"은 본원에 정의된 바와 같이 사용된다. 바람직한 양태에서, 주어진 공급원으로부터 얻어진 폴리펩티드는 세포외로 분비된다.
셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드는 박테리아 폴리펩티드일 수 있다. 예를 들면, 폴리펩티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Bacillus, Streptococcus, Streptomyces, Staphylococcus, Enterococcus, LactoBacillus, Lactococcus, Clostridium, GeoBacillus, 또는 Oceanobacillus 폴리펩티드와 같은 그람 양성 박테리아 폴리펩티드, 또는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 E. coli, Pseudomonas, Salmonella, Campylobacter, Helicobacter, Flavobacterium, Fusobacterium, llyobacter, Neisseria, 또는 Ureaplasma 폴리펩티드와 같은 그람 음성 박테리아 폴리펩티드일 수 있다.
바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus brevis, Bacillus Circulans, Bacillus clausii, Bacillus coagulans, Bacillus firmus, Bacillus lautus, Bacillus lentus, Bacillus licheniformis, Bacillus megaterium, Bacillus pumilus, Bacillus stearothermophilus, Bacillus subtilis, 또는 Bacillus thuringiensis 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Streptococcus equisimilis, Streptococcus pyogenes, Streptococcus uberis, 또는 Streptococcus equi subsp . Zooepidemicus 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Streptomyces achromogenes, Streptomyces avermitilis, Streptomyces coelicolor, Streptomyces griseus, 또는 Streptomyces lividans 폴리펩티드이다.
셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드는 또한 진균 폴리펩티드일 수 있으며, 보다 바람직하게는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Candida, Kluyveromyces, Pichia, Saccharomyces, Schizosaccharomyces, 또는 Yarrowia 폴리펩티드와 같은 효모 폴리펩티드; 또는 보다 바람직하게는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Acremonium, Aspergillus, Aureobasidium, Cryptococcus, Filibasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Piromyces, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium 또는 Trichoderma 폴리펩티드와 같은 사상 진균 폴리펩티드이다.
바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Saccharomyces carlsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, 또는 Saccharomyces oviformis 폴리펩티드이다.
또 다른 바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Aspergillus aculeatus, Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Coprinus cinereus, Diplodia gossyppina, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambuClnum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichotheciloides, Fusarium venenatum, Humicola insolens, Humicola lanuginosa, Magnaporthe grisea, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporium, Pseudoplectania nigrella, Thermoascus aurantiacus, Thielavia terrestris, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, Trichoderma viride 또는 Trichophaea saccata 폴리펩티드이다.
보다 바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Trichoderma reesei 폴리펩티드이다. 다른 가장 바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 Trichoderma reesei RutC30 (ATCC 56765) 폴리펩티드, 예컨대 셀로비오히드롤라아제 활성을 갖는 SEQ ID NO: 52, 또는 54의 성숙한 폴리펩티드, 또는 그것의 단편 및, 엔도글루카나아제 활성을 갖는 SEQ ID NO: 56, 58, 60, 또는 62의 성숙한 폴리펩티드, 또는 그것의 단편이다.
다른 보다 바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 활성을 갖는 Thielavia terrestris 폴리펩티드이다. 다른 가장 바람직한 양태에서, 폴리펩티드는 셀로비오히드롤라아제 II 활성을 갖는 Thielavia terrestris (NRRL 8126) 폴리펩티드, 예컨대 셀로비오히드롤라아제 활성을 갖는 SEQ ID NO: 64의 성숙한 폴리펩티드, 또는 그것의 단편이다.
전술한 종에 대하여 본 발명은 완전한 상태 및 불완전한 상태 모두, 및 다른 분류학적 동등물, 예컨대, 알려진 종 이름과 관계없이 무성생식형을 포괄한다는 것이 이해된다. 당업자들은 적합한 동등물의 동일성을 쉽게 인지할 것이다.
이러한 종의 균주는 American Type Culture Collection(ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM), Centraalbureau Voor Schimmelcultures(CBS), 및 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center(NRRL)와 같은 공공의 다수 미생물 기탁기관에서 쉽게 입수할 수 있다.
더욱이, 이러한 폴리펩티드는 본원에 설명한 바와 같이 자연(예컨대, 토양, 퇴비, 물 등)으로부터 분리된 미생물을 포함하는 다른 공급원으로부터 상기 언급한 프로브를 사용하여 식별되고 얻어질 수 있다.
셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드는 또한 다른 폴리펩티드가 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드 또는 그것의 단편의 N-말단 또는 C-말단에서 융합된, 융합된 폴리펩티드 또는 분열가능한 융합 폴리펩티드를 포함한다. 융합된 폴리펩티드는 본원에 설명한 바와 같이 제조된다.
셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성된 폴리뉴클레오티드는 본원에 설명한 바와 같이 분리되고 본 발명의 방법에 사용될 수 있다.
폴리뉴클레오티드는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57 또는 SEQ ID NO: 59, SEQ ID NO: 61 또는 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열에 대한 동일성의 정도가 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 가장 더 바람직하게는 적어도 96%, 97%, 98% 또는 99%인 뉴클레오티드 서열을 포함하거나 또는 이들로 구성된다.
바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 51을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 52의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 51과 상이하다. 본 발명은 또한 셀로비오히드롤라아제 I 활성을 갖는 SEQ ID NO: 52의 단편을 암호화하는 SEQ ID NO: 51의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 53을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 54의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 53과 상이하다. 본 발명은 또한 셀로비오히드롤라아제 II 활성을 갖는 SEQ ID NO: 54의 단편을 암호화하는 SEQ ID NO: 53의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 55를 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 56의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 51과 상이하다. 본 발명은 또한 엔도글루카나아제 I 활성을 갖는 SEQ ID NO: 56의 단편을 암호화하는 SEQ ID NO: 55의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 57을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 58의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 57과 상이하다. 본 발명은 또한 엔도글루카나아제 II 활성을 갖는 SEQ ID NO: 58의 단편을 암호화하는 SEQ ID NO: 57의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 59를 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 60의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 59와 상이하다. 본 발명은 또한 엔도글루카나아제 II 활성을 갖는 SEQ ID NO: 60의 단편을 암호화하는 SEQ ID NO: 59의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 61을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 62의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 61과 상이하다. 본 발명은 또한 엔도글루카나아제 V 활성을 갖는 SEQ ID NO: 62의 단편을 암호화하는 SEQ ID NO: 61의 부분서열에 관한 것이다.
다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 63을 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 E. coli NRRL B-30802에 함유된 플라스미드 pTter6A에 함유된 서열을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 뉴클레오티드 서열은 SEQ ID NO: 63의 뉴클레오티드 52 내지 1443를 포함하거나 또는 이들로 구성된다. 다른 보다 바람직한 양태에서, 뉴클레오티드 서열은 E. coli NRRL B-30802에 함유된 플라스미드 pTter6A에 함유된 성숙한 폴리펩티드 암호화 영역을 포함하거나 또는 이들로 구성된다. 본 발명은 또한 SEQ ID NO: 64의 아미노산 서열을 포함하거나 또는 이들로 구성된 폴리펩티드 또는 그것의 성숙한 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포괄하며, 이것은 유전 암호의 퇴보에 의해 SEQ ID NO: 63 또는 그것의 성숙한 폴리펩티드 암호화 서열과 상이하다. 본 발명은 또한 셀로비오히드롤라아제 II 활성을 갖는 SEQ ID NO: 64의 단편을 암호화하는 SEQ ID NO: 63의 부분서열에 관한 것이다.
본 발명은 또한 SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, 또는 SEQ ID NO: 59, SEQ ID NO: 61, 또는 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열에 적어도 하나의 돌연변이를 포함하는 돌연변이 폴리뉴클레오티드에 관한 것이며, 여기서 돌연변이 뉴클레오티드 서열은 SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, 또는 SEQ ID NO: 64의 성숙한 폴리펩티드를 암호화한다.
바람직한 양태에서, 성숙한 폴리펩티드는 SEQ ID NO: 52의 아미노산 18 내지 541, SEQ ID NO: 54의 아미노산 25 내지 471, SEQ ID NO: 56의 아미노산 23 내지 459, SEQ ID NO: 58의 아미노산 22 내지 418, SEQ ID NO: 60의 아미노산 17 내지 234, SEQ ID NO: 62의 아미노산 18 내지 242, 또는 SEQ ID NO: 64의 아미노산 18 내지 481이다. 다른 바람직한 양태에서, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 51의 뉴클레오티드 52 내지 1542, SEQ ID NO: 53의 뉴클레오티드 73 내지 1413, SEQ ID NO: 55의 뉴클레오티드 67 내지 1377, SEQ ID NO: 57의 뉴클레오티드 64 내지 1254, SEQ ID NO: 59의 뉴클레오티드 49 내지 702, SEQ ID NO: 61의 뉴클레오티드 52 내지 726, 또는 SEQ ID NO: 63의 뉴클레오티드 52 내지 1443이다.
앞서 설명한 바와 같이, 폴리펩티드를 암호화하는 폴리뉴클레오티드를 분리 또는 클로닝하는데 사용되는 기술은 해당 기술분야에 알려져 있으며 게놈 DNA로부터의 분리, cDNA로부터의 제조, 또는 이들의 조합을 포함한다.
폴리뉴클레오티드는 또한 본원에 정의된 바와 같이 적어도 매우 낮은 긴축 조건, 바람직하게는 적어도 낮은 긴축 조건, 보다 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 보다 더 바람직하게는 적어도 높은 긴축 조건, 가장 바람직하게는 적어도 매우 높은 긴축 조건하에서 (i) SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, 또는 SEQ ID NO: 59, SEQ ID NO: 61, 또는 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, 또는 SEQ ID NO: 59, SEQ ID NO: 61, 또는 SEQ ID NO: 63의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 이를 포함하는 게놈 DNA 서열, (iii) (i) 또는 (ii)의 전장 상보 가닥; 또는 그것의 대립 변이체 및 부분서열과 혼성화하는 셀로비오히드롤라아제 또는 엔도글루카나아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하거나 또는 이들로 구성될 수 있다(상기 Sambrook et al., 1989). 바람직한 양태에서, 성숙한 폴리펩티드 암호화 서열은 SEQ ID NO: 51의 뉴클레오티드 52 내지 1542, SEQ ID NO: 53의 뉴클레오티드 73 내지 1413, SEQ ID NO: 55의 뉴클레오티드 67 내지 1377, SEQ ID NO: 57의 뉴클레오티드 64 내지 1254, SEQ ID NO: 59의 뉴클레오티드 49 내지 702, SEQ ID NO: 61의 뉴클레오티드 52 내지 726, 또는 SEQ ID NO: 63의 뉴클레오티드 52 내지 1443이다.
핵산 구조체
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드, 베타-글루코시다아제 활성을 갖는 폴리펩티드, 베타-글루코시다아제 융합 폴리펩티드, 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로비오히드롤라아제 활성을 갖는 폴리펩티드 또는 다른 셀룰로오스 가수분해 효소 활성을 갖는 폴리펩티드를 암호화하는 분리된 폴리뉴클레오티드는 조절 서열과 양립가능한 조건하에서 적합한 숙주 세포 내에서 암호화 서열의 발현을 지시하는 하나 이상의(다수의) 조절 서열에 작동가능하게 결합된 폴리펩티드를 암호화하는 분리된 폴리뉴클레오티드를 포함하는 핵산 구조체를 구성함으로써 폴리펩티드의 발현을 제공하기 위한 다양한 방법으로 조작될 수 있다. 벡터로의 삽입 전에 폴리뉴클레오티드 서열을 조작하는 것은 발현 벡터에 따라 바람직하거나 또는 필수적일 수 있다. 재조합 DNA 방법을 활용하여 폴리뉴클레오티드 서열을 변형시키는 기술은 당해 기술 분야에 잘 알려져 있다.
조절 서열은 적절한 프로모터 서열, 폴리펩티드를 암호화하는 폴리뉴클레오티드의 발현을 위한 숙주 세포에 의하여 인식되는 뉴클레오티드 서열일 수 있다. 프로모터 서열은 폴리펩티드의 발현을 매개하는 전사 조절 서열을 함유한다. 프로모터는 돌연변이, 절단, 및 혼성 프로모터를 포함하는 숙주 세포의 선택에 있어서 전사 활성을 나타내는 어떤 뉴클레오티드 서열일 수 있으며, 숙주 세포에 상동 또는 이종인 세포외 또는 세포내 폴리펩티드를 암호화하는 유전자로부터 얻을 수 있다.
사상 진균 숙주 세포 내에서 핵산 구조체의 전사를 지시하는 적합한 프로모터의 예는 Aspergillus oryzae TAKA 아밀라아제, Rhizomucor miehei 아스파틱 프로테이나아제, Aspergillus niger 뉴트럴 알파-아밀라아제, Aspergillus niger 산 안정 알파-아밀라아제, Aspergillus niger 또는 Aspergillus awamori 글루코아밀라아제 (glaA), Rhizomucor miehei 리파아제, Aspergillus oryzae 염기성 프로테아제, Aspergillus oryzae 트리오스 포스페이트 아이소머라아제, Aspergillus nidulans 아세타미나아제, Fusarium venenatum 아밀로글루코시다아제(WO 00/56900), Fusarium venenatum 다리아(Daria)(WO 00/56900), Fusarium venenatum 퀴인(Quinn)(WO 00/56900), Fusarium oxysporum 트립신-유사 프로테아제(WO 96/00787), Trichoderma reesei 베타-글루코시다아제, Trichoderma reesei 셀로바이오하이드롤라아제 I, Trichoderma reesei 셀로바이오하이드롤라아제 II, Trichoderma reesei 엔도글루카나아제 I, Trichoderma reesei 엔도글루카나아제 II, Trichoderma reesei 엔도글루카나아제 III, Trichoderma reesei 엔도글루카나아제 IV, Trichoderma reesei 엔도글루카나아제 V, Trichoderma reesei 자일라나아제 I, Trichoderma reesei 자일라나아제 II, Trichoderma reesei 베타-자일로시다아제, 및 NA2-tpi 프로모터(Aspergillus niger 뉴트럴 알파-아밀라아제 및 Aspergillus oryzae 트리오스 포스페이트 아이소머라아제를 위한 유전자로부터 프로모터의 혼성); 및 이들의 돌연변이, 절단, 및 혼성 프로모터이다.
조절 서열은 또한 적합한 전사 터미네이터 서열, 전사를 종료하도록 숙주 세포에 의해 인식된 서열일 수 있다. 터미네이터 서열은 폴리펩티드를 암호화하는 뉴클레오티드 서열의 3' 말단에 작동가능하게 결합된다. 선택한 숙주 세포에서 기능하는 어떤 터미네이터를 본 발명에 사용할 수 있다.
사상 진균 숙주 세포를 위한 바람직한 터미테이터는 Aspergillus oryzae TAKA 아밀라아제, Aspergillus niger 글루코아밀라아제, Aspergillus nidulans 안트라닐레이트 신타제, Aspergillus niger 알파-글루코시다아제, 및 Fusarium oxysporum 트립신-유사 프로테아제의 유전자로부터 얻어진다.
조절 서열은 적합한 선도 서열, 숙주 세포에 의한 번역에 중요한 mRNA의 비번역 영역일 수 있다. 선도 서열은 폴리펩티드을 암호화하는 뉴클레오티드 서열의 5' 말단에 작동가능하게 결합된다. 선택된 숙주 세포에서 기능하는 어떤 선도 서열이 본 발명에 사용될 수 있다.
사상 진균 숙주 세포를 위한 바람직한 선도체는 Aspergillus oryzae TAKA 아밀라아제 및 Aspergillus nidulans 트리오스 포스페이트 아이소머라아제의 유전자로부터 얻어진다.
조절 서열은 폴리아데닐화 서열, 뉴클레오티드 서열의 3' 말단에 작동가능하게 연결된 서열일 수 있으며, 전사시 숙주 세포에 의하여 폴리아데노신 잔기를 전사된 mRNA에 부가하라는 신호로 인식된다. 선택된 숙주 세포에서 기능하는 어떤 폴리아데닐화 서열이 본 발명에 사용될 수 있다.
사상 진균 숙주 세포를 위한 바람직한 폴리아데닐화 서열은 Aspergillus oryzae TAKA 아밀라아제, Aspergillus niger 글루코아밀라아제, Aspergillus nidulans 안트라닐레이트 신타제, Fusarium oxysporum 트립신-유사 프로테아제, 및 Aspergillus niger 알파-글루코시다아제의 유전자로부터 얻어진다.
조절 서열은 폴리펩티드의 아미노 말단에 결합된 아미노산 서열을 암호화하고, 암호화된 폴리펩티드를 세포의 분비 경로로 지시할 수 있는 신호 펩티드 암호화 영역일 수 있다. 뉴클레오티드 서열의 암호화 서열의 5' 말단은 분비되는 폴리펩티드를 암호화하는 암호화 영역의 세그먼트와 함께 번역 해독 프레임에 자연적으로 결합된 신호 펩티드 암호화 영역을 본래 함유할 수 있다. 대안적으로, 암호화 서열의 5' 말단은 암호화 서열에 외래인 신호 펩티드 암호화 영역을 함유할 수 있다. 외래 신호 펩티드 암호화 영역은 암호화 서열이 신호 펩티드 암호화 영역을 자연적으로 함유하지 않은 경우에 필요할 수 있다. 대안적으로, 외래 신호 펩티드 암호화 영역은 천연 신호 펩티드 암호화 영역을 단순히 대체함로써 폴리펩티드의 분비를 증진시킬 수 있다. 그러나, 선택된 숙주 세포의 분비 경로로 발현된 폴리펩티드를 지시하는, 즉 배양 배지로 분비하는 어떤 신호 펩티드 암호화 영역을 본 발명에 사용할 수 있다.
사상 진균 숙주 세포의 효과적인 신호 펩티드 암호화 영역은 Aspergillus oryzae TAKA 아밀라아제, Aspergillus niger 뉴트럴 아밀라아제, Aspergillus niger 글루코아밀라아제, Rhizomucor miehei 아스파라긴산 프로테인나아제, Humicola insolens 셀룰라아제, Humicola insolens 엔도글루카나아제 V 및 Humicola lanuginosa 라파아제의 유전자로부터 얻어진 신호 펩티드 암호화 영역이다.
바람직한 양태에서, 신호 펩티드는 SEQ ID NO: 2의 아미노산 1 내지 19를 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 신호 펩티드 암호화 영역은 SEQ ID NO: 1의 뉴클레오티드 330 내지 387을 포함하거나 또는 이들로 구성된다.
다른 바람직한 양태에서, 신호 펩티드는 SEQ ID NO: 4의 아미노산 1 내지 17을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 신호 펩티드 암호화 영역은 SEQ ID NO: 3의 뉴클레오티드 47 내지 97을 포함하거나 또는 이들로 구성된다.
다른 바람직한 양태에서, 신호 펩티드는 SEQ ID NO: 6의 아미노산 1 내지 19를 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 신호 펩티드 암호화 영역은 SEQ ID NO: 5의 뉴클레오티드 69 내지 125를 포함하거나 또는 이들로 구성된다.
다른 바람직한 양태에서, 신호 펩티드는 SEQ ID NO: 8의 아미노산 1 내지 18을 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 신호 펩티드 암호화 영역은 SEQ ID NO: 7의 뉴클레오티드 1 내지 54를 포함하거나 또는 이들로 구성된다.
다른 바람직한 양태에서, 신호 펩티드는 SEQ ID NO: 10의 아미노산 1 내지 19를 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 신호 펩티드 암호화 영역은 SEQ ID NO: 9의 뉴클레오티드 1 내지 57을 포함하거나 또는 이들로 구성된다.
다른 바람직한 양태에서, 신호 펩티드는 SEQ ID NO: 12의 아미노산 1 내지 22를 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 신호 펩티드 암호화 영역은 SEQ ID NO: 11의 뉴클레오티드 1 내지 66을 포함하거나 또는 이들로 구성된다.
다른 바람직한 양태에서, 신호 펩티드는 SEQ ID NO: 14의 아미노산 1 내지 19를 포함하거나 또는 이들로 구성된다. 다른 바람직한 양태에서, 신호 펩티드 암호화 영역은 SEQ ID NO: 13의 뉴클레오티드 20 내지 76을 포함하거나 또는 이들로 구성된다.
조절 서열은 폴리펩티드의 아미노 말단에 위치한 아미노산 서열을 암호화하는 펩티드 암호화 영역일 수 있다. 얻어진 폴리펩티드는 프로효소 또는 프로폴리펩티드(또는 일부 경우 자이모겐)로 알려져 있다. 프로폴리펩티드는 일반적으로 불활성이며, 프로폴리펩티드로부터 프로펩티드의 촉매 또는 자기촉매 분열에 의하여 성숙한 활성 폴리펩티드로 전환될 수 있다. 프로펩티드 암호화 영역은 Saccharomyces cerevisiae 알파-인자, Rhizomucor miehei 아스파라긴산 프로테이나아제, 및 Myceliophthora thermophila 락카아제를 위한 유전자로부터 얻을 수 있다(WO 95/33836).
신호 펩티드 및 프로펩티드 영역이 모두 폴리펩티드의 아미노 말단에 존재하는 경우, 프로펩티드 영역은 폴리펩티드의 아미노 말단의 옆에 위치하며, 신호 펩티드 영역은 프로펩티드 영역의 아미노 말단의 옆에 위치한다.
숙주 세포의 성장에 관한 폴리펩티드의 발현을 조정하게 하는 조정 서열을 부가하는 것이 바람직하다. 조정 시스템의 예는 화학적 또는 물리적 자극에 반응하여 유전자 발현을 작동하게 하거나 또는 중단시키는 것들로서, 조정 화합물의 존재를 포함한다. 사상 진균 내의 조정 시스템은 TAKA 알파-아밀라아제 프로모터, Aspergillus niger 글루코아밀라아제 프로모터, 및 Aspergillus oryzae 글루코아밀라아제 프로모터를 포함하며 조정 서열로서 사용할 수 있다. 조정 서열의 다른 예는 유전자 증폭을 가능하게 하는 것들이다. 원핵 시스템에서, 이들 조정 서열은 메토트렉사이트의 존재하에 증폭되는 디히드로폴레이트 리덕타아제 유전자, 및 중금속을 가지고 증폭되는 메탈로티오네인 유전자를 포함한다. 이들 경우, 폴리펩티드를 암호화한 뉴클레오티드 서열은 조정 서열과 작동가능하게 결합할 수 있다.
발현 벡터
본원에 설명한 다양한 핵산 및 조절 서열은 함께 결합하여 셀룰로오스가수분해 증진 활성을 갖는 폴리펩티드, 베타-글루코시다아제 활성을 갖는 폴리펩티드, 베타-글루코시다아제 융합 폴리펩티드, 엔도글루카나아제 활성을 갖는 폴리펩티드 셀로비오히드롤라아제 활성을 갖는 폴리펩티드, 또는 다른 셀룰로오스 가분해 효소 활성을 갖는 폴리펩티드, 프로모터, 및 전사 정지 신호 및 번역 정지 신호를 암호화하는 폴리뉴클레오티드를 포함하는 재조합 발현 벡터를 제조한다. 발현 벡터는 하나 이상의(다수의) 편리한 제한 부위를 포함하여 이 부위에 폴리펩티드를 암호화하는 뉴클레오티드 서열의 삽입 또는 치환을 가능하게 한다. 대안적으로, 이러한 폴리펩티드를 암호화하는 폴리뉴클레오티드는 뉴클레오티드 서열 또는 이 서열을 포함하는 핵산 구조체를 발현을 위한 적절한 벡터로 삽입함으로써 발현될 수 있다. 발현 백터의 생성에 있어서, 암호화 서열이 발현을 위한 적절한 조절 서열과 작동가능하게 결합되도록 암호화 서열을 벡터 내로 위치시킨다.
재조합 발현 벡터는 편리하게 재조합 DNA 과정을 수행할 수 있고 뉴클오타이드 서열의 발현을 발생시킬 수 있는 어떤 벡터(예컨대, 플라스미드 또는 바이러스)일 수 있다. 벡터의 선택은 일반적으로 벡터와 벡터가 도입될 숙주 세포의 양립성에 의존한다. 벡터는 선형 또는 폐쇄된 고리형 플라스미드일 수 있다.
벡터는 자발 복제 벡터, 예컨대 염색체외 실체로서 존재하는 벡터일 수 있으며, 이것의 복제는 염색체 복제, 예컨대 플라스미드, 염색체외 성분, 미니염색체 또는 인공 염색체와 독립적이다. 벡터는 자가-복제를 확보하는 어떤 수단을 함유할 수 있다. 대안적으로, 벡터는 숙주 세포로 도입되었을 때 게놈으로 통합되어 통합된 염색체(들)과 함께 복제되는 것일 수 있다. 또한, 숙주 세포의 게놈에 도입되는 총 DNA를 함께 함유하는 단일 벡터 또는 플라스미드 또는 둘 이상의 벡터 또는 플라스미드, 또는 트랜스포손이 사용될 수 있다.
벡터는 바람직하게는 형질전환, 트랜스펙션, 형질도입 등이 된 세포의 용이한 선택을 가능하게 하는 하나 이상의(다수의) 선택가능한 마커를 함유한다. 선택가능한 마커는 그 산물이 살균 또는 바이러스 내성, 중금속 내성, 영양요구균주에 대한 기본영양성 등을 제공하는 유전자이다.
사상 진균 숙주 세포에 사용하기 위해 선택가능한 마커는 amdS(아세트아미다아제), argB(오르니틴 카바모일트랜스퍼라아제), bar(포스피노트리신 아세틸트랜스퍼라아제), hph(하이그로마이신 포스포트랜스퍼라아제), niaD(니트레이트 리덕타제), pyrG(오르티딘-5'-포스페이트 디카르복실라아제), sC (황산염 아데닐트랜스퍼라아제), 및 trpC(안트라닐레이트 신타제), 및 이들의 동등물을 포함하지만 이에 한정되지 않는다. Aspergillus 세포에는 Aspergillus nidulans 또는 Aspergillus oryzaeamdSpyrG 유전자 및 Streptomyces hygroscopicusbar 유전자를 사용하는 것이 바람직하다.
벡터는 숙주 세포의 게놈으로 벡터의 통합 또는 게놈에 독립적인 세포에서 벡터의 자가 복제를 가능하게 하는 요소(들)를 함유하는 것이 바람직하다.
숙주 세포 게놈으로의 통합을 위하여, 벡터는 폴리펩티드를 암호화한 폴리뉴클레오티드의 서열 또는 상동 또는 비상동 재조합에 의한 게놈으로의 통합을 위한 벡터의 어떤 다른 요소에 의존한다. 대안적으로, 벡터는 염색체(들)에서 정확한 위치(들)에서 숙주 세포의 게놈으로 상동 재조합에 의한 통합을 지시하기 위해 추가적인 뉴클레오티드 서열을 함유할 수 있다. 정확한 위치에서의 통합 가능성을 증가시키기 위하여, 통합 요소는 바람직하게는 충분한 수의 핵산, 예컨대 100 내지 10,000 염기쌍, 바람직하게는 400 내지 10,000 염기쌍, 가장 바람직하게는 800 내지 10,000 염기쌍 함유하여 상응하는 표적 서열에 대한 동일성의 정도가 높아서 상동 재조합의 가능성을 증진시킨다. 통합 요소는 숙주 세포의 게놈 내의 표적 서열과 상동인 어떤 서열일 수 있다. 또한, 통합 요소는 뉴클레오티드 서열을 비암호화 또는 암호화할 수 있다. 한편, 벡터는 비-상동 재조합에 의하여 숙주 세포의 게놈 내로 통합될 수 있다.
자발 복제를 위하여, 벡터는 해당 숙주 세포에서 벡터가 자발 복제할 수 있도록 하는 복제 원점을 더 포함할 수 있다. 복제 원점은 세포 내에서 기능하는 자발 복제를 매개하는 어떤 플라스미드 리플리케이터일 수 있다. 본원에서 용어 "복제 원점" 또는 "플라스미드 리플리케이터"는 플라스미드 또는 벡터를 생체 내에서 복제가능하게 하는 뉴클레오티드 서열로 정의된다.
사상 진균 세포에 유용한 복제 원점의 예는 AMA1 및 ANS1이다(Gems et al., 1991, Gene 98:61-67; Cullen et al., 1987, Nucleic Acids Research 15: 9163- 9175; WO 00/24883). AMA1 유전자의 분리 및 유전자를 포함한 플라스미드 또는 벡터의 구성은 WO 00/24883에 개시된 방법에 의하여 달성할 수 있다.
이러한 폴리펩티드를 암호화하는 하나 이상의 폴리뉴클레오티드의 카피가 숙주 세포 내로 삽입되어 폴리펩티드의 생성을 증가시킬 수 있다. 폴리뉴클레오티드 카피 수의 증가는 적어도 하나의 추가적 서열의 카피를 숙주 세포 게놈으로 통합함으로써, 또는 폴리뉴클레오티드와 함께 증폭가능한 선택가능한 마커 유전자를 포함함으로써 얻을 수 있으며, 이때 선택가능한 마커 유전자의 증폭된 카피, 따라서 폴리뉴클레오티드의 추가적 카피를 포함하는 세포는 적절한 선택가능 제제의 존재하에 세포를 배양함으로써 선택할 수 있다.
전술한 요소를 라이게이션에 사용하여 재조합 발현 벡터를 구성하는 과정은 당업자에게 잘 알려져 있다(예컨대, 상기 Sambrook et al., 1989 참조).
숙주 세포
셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드, 베타-글루코시다아제 활성을 갖는 폴리펩티드, 베타-글루코시다아제 융합 폴리펩티드, 엔도글루카나아제 활성을 갖는 폴리펩티드, 셀로비오히드롤라아제 활성을 갖는 폴리펩티드, 또는 다른 셀룰로오스 가수분해 효소 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함하는 재조합 사상 진균 숙주 세포는, 폴리펩티드의 재조합체 제조에 유리하게 사용될 수 있다. 이러한 폴리뉴클레오티드를 포함하는 벡터는 앞서 설명한 바와 같이 벡터가 염색체 성분으로서 또는 자가-복제 추가-염색체 벡터로로서 유지되도록 숙주 세포 내로 도입된다. 용어 "숙주 세포"는 복제시 발생하는 돌연변이에 기인하여 모세포와 일치하지 않는 모세포의 어떤 자손을 포괄한다. 숙주 세포의 선택은 폴리펩티드를 암호화하는 유전자 및 이들의 공급원에 따라 광범위하게 의존할 것이다.
용어 "사상 진균"은 하위분류 EumycotaOomycota의 모든 사상 형태를 포함한다(상기 Hawksworth et al ., 1995에 정의). 사상 진균은 일반적으로 키틴, 셀룰로오스, 글루칸, 키토산, 만난 및 그 밖의 복합 다당류로 이루어진 균사 세포벽에 의해 특징화된다. 영양 생장은 균사 신장에 의한 것이며, 탄소 이화는 절대적으로 호기성이다. 이와 대조적으로, Saccharomyces cerevisiae와 같은 효모에 의한 영양 생장은 단세포 엽상체(thallus)의 발아에 의하며, 탄소 이화는 발효에 의할 수 있다.
바람직한 양태에서, 사상 진균 숙주 세포는 Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosproium, Coprinus, Coriolus, Cryptococcus, Filibasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trametes, 또는 Trichoderma 세포이다.
보다 바람직한 양태에서, 사상 진균 숙주 세포는 Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger 또는 Aspergillus oryzae, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis pannocinta, Ceriporiopsis rivulosa, Ceriporiopsis subrufa, Ceriporiopsis subvermispora, Chrysosporium lucknowense, Coprinus cinereus, Coriolus hirsutus, Fusarlum bactridioides, Fusarium cerealls, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambudnum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporium, Phlebia radiata, Pleurotus eryngii, Thielavia terrestris, Trametes viltosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, 또는 Trichoderma viride 세포이다.
가장 바람직한 양태에서, 사상 진균 숙주 세포는 Aspergillus oryzae이다. 다른 가장 바람직한 양태에서, 사상 진균 숙주 세포는 Trichoderma reesei 세포이다. 다른 가장 바람직한 양태에서, 사상 진균 숙주 세포는 Fusarium venenatum 세포이다. 다른 가장 바람직한 양태에서, 사상 진균 숙주 세포는 Chrysosporium lucknowense 세포이다.
진균 세포는 그 자체로 알려진 방법으로 원형질체 형성, 원형질체의 형질전환, 및 세포벽의 재생을 수반하는 과정에 의해 형질전환될 수 있다. AspergillusTrichoderma 숙주 세포의 형질전환에 적합한 방법은 EP 238 023 및 Yelton et al., 1984, Proceedings of the National Academy of Sciences USA 81 : 1470-1474에 개시되어 있다. 적합한 Fusarium 종의 형질전환 방법은 Malardier et al., 1989, Gene 78: 147-156, 및 WO 96/00787에 기재되어 있다. 효모는 Becker and Guarente, In Abelson, J.N. and Simon, M. I., editors, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194, pp 182- 187, Academic Press, Inc., New York; lto et al., 1983, Journal of Bacteriology 153: 163; 및 Hinnen et al., 1978, Proceedings of the National Academy of Sciences USA 75: 1920에 기술된 방법을 사용하여 형질전환할 수 있다.
제조 방법
본 발명의 셀룰로오스 가수분해 단백질 조성물의 제조방법은 (a) 폴리펩티드의 제조 조건하에서, 야생형 형태에서 폴리펩티드를 생성할 수 있는 사상 진균 세포를 배양하는 단계; 및 (b) 폴리펩티드를 회수하는 단계를 포함한다.
대안적으로, 본 발명의 셀룰로오스 가수분해 단백질 조성물의 제조방법은 (a) 폴리펩티드의 제조 조건하에서 재조합 사상 진균 숙주 세포를 배양하는 단계; 및 (b) 폴리펩티드를 회수하는 단계를 포함한다.
제조 방법에서, 사상 진균 세포는 당해 기술분야에 잘 알려진 방법을 사용하여 폴리펩티드를 제조하기에 적합한 영양 배지에서 배양된다. 예를 들어, 세포는 폴리펩티드를 발현 및/또는 분리할 수 있는 조건하에서 적합한 배지에서 행하는 실험실 또는 공업용 발효기에서 진탕 플라스크 배양 및 소규모 또는 대규모 발효(연속, 회분, 유가 또는 고체상 발효를 포함)에 의하여 배양될 수 있다. 배양은 당해 기술 분야에 알려진 절차를 사용하여 탄소원, 질소원 및 무기염을 포함하는 적합한 영양 배지 내에서 행한다. 적합한 배지는 시중의 공급자로부터 입수가능하거나 (예컨대, American Type Culture Collection의 카탈로그에) 공지된 조성물에 따라 제조할 수 있다. 단백질 성분이 영양 배지로 분비되는 경우, 이들을 배지로부터 직접 회수할 수 있다. 폴리펩티드가 분비되지 않는 경우, 이들을 세포 용해물로부터 회수할 수 있다.
조성물의 단백질 성분은 본원에 설명된 방법 또는 기술분야에 알려진 어떤 방법을 사용하여 검출할 수 있다.
얻어진 셀룰로오스 가수분해 단백질 조성물은 당해 기술 분야에 알려진 방법을 사용하여 회수할 수 있다. 예를 들어, 셀룰로오스 가수분해 단백질 조성물은 원심분리, 여과, 추출, 분무-건조, 증발, 또는 침전을 포함하나 이에 한정되지 않는 종래의 방법에 의하여 영양 배지로부터 회수할 수 있다.
조성물의 단백질 성분은 실질적으로 순수한 폴리펩티드를 획득하기 위하여 크로마토그래피(예컨대, 이온 교환, 친화성, 소수성, 크로마토포커싱, 및 크기 배제), 전기영동법(예컨대, 예비 등전 집속), 용해도차(예컨대, 황산 암모늄 침전), SDS-PAGE, 또는 추출(예컨대, Protein Purification, J.-C. Janson and Lars Ryden, editors, VCH Publishers, New York, 1989 참조)을 포함하나 이에 한정되지 않는 당해 기술 분야에 알려진 다양한 절차에 의하여 분리 정제할 수 있다.
셀룰로오스-함유 물질의 처리 방법
본 발명은 또한 셀룰로오스-함유 물질을 유효량의 본 발명의 셀룰로오스 가수분해 단백질 조성물로 처리하는 것을 포함하는, 셀룰로오스-함유 물질의 분해 또는 전환 방법에 관한 것이다.
본 발명은 또한 (a) 셀룰로오스-함유 물질을 유효량의 본 발명의 셀룰로오스 가수분해 단백질 조성물로 당화하는 단계; (b) 단계 (a)의 당화된 셀룰로오스-함유 물질을 하나 이상의(다수의) 발효 미생물로 발효하여 발효 산물을 제조하는 단계; 및 (c) 발효로부터 발효 산물을 회수하는 단계를 포함하는, 발효 산물의 제조방법에 관한 것이다.
본 발명의 방법을 사용하여 셀룰로오스-함유 물질, 예컨대 리그노셀룰로오스를 발효가능한 당으로 가수분해(당화)하고 발효가능한 당을 많은 유용한 물질, 예컨대 화학물질 및 연료로 전환할 수 있다. 통상적으로 셀룰로오스-함유 물질로부터 원하는 발효 산물의 제조는 전처리, 효소적 가수분해(당화) 및 발효를 수반한다.
본 발명에 따른 셀룰로오스-함유 물질의 처리는 해당 분야에 알려진 과정을 사용하여 달성할 수 있다. 또한, 본 발명의 방법은 본 발명에 따라 조작되도록 구성된 어떤 바이오매스 처리 장치를 사용하여 수행될 수 있다.
분리 또는 동시의 가수분해(당화) 및 발효는 분리 가수분해 및 배양(SHF), 동시 당화 및 발효(SSF), 동시 당화 및 공발효(SSCF), 혼성 가수분해 및 발효(HHF), SHCF(분리 가수분해 및 공발효), HHCF(혼성 가수분해 및 발효), 및 직접 세균 전환(DMC)을 포함하지만 이에 제한되는 것은 아니다. 전처리, 효소적 가수분해(당화), 발효 또는 이들의 조합을 포함하는 해당 기술분야에 알려진 어떤 방법을 본 발명의 방법을 실행하는데 사용할 수 있다는 것이 본원에서 이해된다.
종래의 장치는 유가식(fed-batch) 교반 반응기, 회분 교반 반응기, 한외여과가 구비된 연속 유동 교반 반응기 및/또는 연속 압출유 컬럼 반응기(Fernanda de Castilhos Corazza, Flavio Faria de Moraes, Gisella Maria Zanin and Ivo Neitzel, 2003, Optimal control in fed-batch reactor for the Cellobiose hydrolysis, Acta Scientiarum. Technology 25: 33-38; Gusakov, A. V., and Sinitsyn, A. P., 1985, Kinetics of the enzymatic hydrolysis of cellulose: 1. A mathematical model for a batch reactor process, Em. Microb. Technol. 7: 346-352), 마모 반응기(Ryu, S. K., and Lee, J. M., 1983, Byconversion of waste cellulose by using an attrition bioreactor, Biotechnol. Bioeng. 25: 53-65), 또는 전자기장에 의해 유도된 집중 교반이 구비된 반응기(Gusakov, A. V., Sinitsyn, A. P., Davydkin, I. Y., Davydkin, V. Y., Protas, O. V., 1996, Enhancement of enzymatic cellulose hydrolysis using a novel type of bioreactor with intensive stirring induced by electromagnetic field, Appl. Biochem. Biotechnol. 56: 141-153)을 포함할 수 있다. 추가의 반응기 종류는, 예컨대 가수분해 및/또는 발효를 위한 유동층, 상향류 블랭킷, 고정 및 압출형 반응기를 포함한다.
전처리. 본 발명의 방법을 실행함에 있어, 기술분야에 알려진 어떤 전처리 과정을 사용하여 셀룰로오스-함유 물질의 식물 세포벽 성분을 붕괴시킬 수 있다. 또한 기술분야에 알려진 방법을 사용하여 전처리하기 전에 셀룰로오스-함유 물질에 프리-소킹, 웨팅 또는 컨디셔닝을 실시할 수 있다. 종래의 전처리는 스팀 전처리(폭발과 함께 또는 없이), 희석산 전처리, 열수 전처리, 석회 전처리, 습식 산화, 습식 폭발, 암모니아 섬유 폭발, 오르가노솔브 전처리 및 생물학적 전처리를 포함하지만 이에 제한되는 것은 아니다. 추가적 전처리는 초음파, 전기천공, 마이크로파, 초임계 CO2, 초임계 H2O, 및 암모니아 침출을 포함한다.
가수분해 및/또는 발효 전에 셀룰로오스-함유 물질을 전처리할 수 있다. 전처리는 가수분해 전에 행하는 것이 바람직하다. 대안적으로, 전처리는 가수분해와 동시에, 예컨대 하나 이상의 셀룰로오스 가수분해 효소 또는 다른 효소 활성물질로 셀룰로오스-함유 물질을 처리하는 것과 동시에 행하여 글루코스 및/또는 말토스와 같은 발효가능 당을 방출할 수 있다. 대부분의 경우 전처리 단계 자체는 바이오매스의 발효가능 당으로의 전환을 야기한다(효소 부재시에도).
스팀 전처리. 스팀 전처리에서는, 셀룰로오스-함유 물질을 가열하여 리그닌, 헤미셀룰로오스 및 셀룰로오스와 같은 식물 세포벽 성분을 붕괴시켜서 셀룰로오스 및 다른 분획을, 예컨대 효소에 접근가능한 헤미 셀룰라아제로 만든다. 셀룰로오스 물질은 필요한 온도 및 압력으로 온도를 증가시키기 위해 스팀이 주입된 반응 용기를 통과하거나 거치고, 그 안에서 원하는 반응 시간 동안 체류한다. 스팀 전처리는 바람직하게는 140-230℃, 보다 바람직하게는 160-200℃, 가장 바람직하게는 170-190℃에서 행하며, 이때 최적 온도 범위는 화학 촉매의 부가에 따른다. 스팀 전처리를 위한 체류 시간은 바람직하게는 1-15분, 보다 바람직하게는 3-12분, 가장 바람직하게는 4-10분이며, 이때 최적 체류 시간은 온도 범위 및 화학 촉매의 부가에 따른다. 스팀 전처리는 비교적 높은 고체 로딩을 허용해서, 셀룰로오스-함유 물질은 일반적으로 전처리 동안 오직 축축한 상태이다. 스팀 전처리는 전처리 후 물질의 폭발 유출과 병용되기도 하며, 이것은 스팀 폭발로서 알려져 있고, 즉 물질을 대기압 및 난류로 신속하게 플래싱(flashing)하여 단편화에 의해 접근가능한 표면적을 증가시킨다(Duff and Murray, 1996, Bioresource Technology 855: 1-33; Galbe and Zacchi, 2002, Appl. Microbiol. Biotechnol. 59: 618-628; 미국 특허 출원 제20020164730호).
H2SO4 또는 SO2(통상적으로 0.3 내지 3% w/w)와 같은 촉매를 스팀 전처리 전에 가하며, 이것은 시간 및 온도를 낮추고 회수율을 증가시키고 효소적 가수분해를 개선시킨다(Ballesteros et al., 2006, Appl. Biochem. Biotechnol. 129-132: 496-508; Varga et al.. 2004, Appl. Biochem. Biotechnol. 113-116: 509-523; Sassner et al., 2006, Enzyme Microb. Technol. 39: 756-762).
화학적 전처리: 용어 "화학적 전처리"는 셀룰로오스, 헤미셀룰로오스 및/또는 리그닌의 분리 및/또는 방출을 촉진하는 어떤 화학적 전처리를 의미한다. 적절한 화학적 전처리 과정의 예는, 예컨대 희석산 전처리, 석회 전처리, 습식 산화, 암모니아 섬유/냉동 폭발(AFEX), 암모니아 침출(APR) 및 오르가노솔브 전처리를 포함한다.
희석산 전처리에서는, 셀룰로오스-함유 물질을 희석산, 통상적으로 H2SO4, 및 물과 혼합하여 슬러리를 형성하고, 스팀에 의해 원하는 온도로 가열하고, 체류 시간 후 대기압으로 플래시한다. 희석산 전처리는 많은 반응기 디자인, 예컨대 플러그-플로우 반응기, 역류 반응기 또는 연속 역류 수축층 반응기로 행할 수 있다(상기 Duff and Murray, 1996; Schell et al., 2004, Bioresource Technol. 91 : 179-188; Lee et al., 1999, Adv. Biochem. Eng. Biotechnol. 65: 93-115).
알칼리성 조건하의 다수의 전처리 방법을 사용할 수 있다. 이들 알칼리성 전처리는 석회 전처리, 습식 산화, 암모니아 침출(APR), 및 암모니아 섬유/냉동 폭발(AFEX)을 포함하지만 이에 한정되는 것은 아니다.
석회 전처리는 탄산칼슘, 수산화나트륨 또는 암모니아로 85-150℃의 저온 및 1시간 내지 수일의 체류 시간에 행한다(Wyman et al., 2005, Bioresource Technol. 96: 1959-1966; Mosier et al., 2005, Bioresource Technol. 96: 673-686). WO 2006/110891, WO 2006/11899, WO 2006/11900, 및 WO 2006/110901는 암모니아를 사용한 전처리 방법을 개시한다.
습식 산화는 통상적으로 180-200℃에서 5-15분 동안 과산화수소 또는 과압의 산소와 같은 산화제의 첨가와 함께 행하는 열적 전처리이다(Schmidt and Thomsen, 1998, Bioresource Technol. 64: 139-151; Palonen et al., 2004, Appl. Biochem. Biotechnol. 117: 1-17; Varga et al., 2004, Biotechnol. Bioeng. 88: 567-574; Martin et al., 2006, J. Chem. Technol. Biotechnol. 81: 1669-1677). 전처리는 바람직하게는 1-40건조 물질%, 보다 바람직하게는 2-30건조 물질%, 가장 바람직하게는 5-20건조 물질%에서 행하며, 때로는 탄산나트륨과 같은 알칼리의 첨가에 의해 초기 pH를 증가시킨다.
습식 폭발(습식 산화와 스팀 폭발의 병용)로서 알려진 습식 산화 전처리 방법의 변형은 최대 30% 건조 물질을 취급할 수 있다. 습식 폭발에서, 일정한 체류 시간 후 전처리 동안 산화제가 도입된다. 그 다음 대기압으로의 플래싱에 의해 전처리가 종료된다(WO 2006/032282).
암모니아 섬유 폭발(AFEX)은 90-100℃와 같은 중간 온도 및 17-20bar와 같은 고압에서 5-10분 동안 액체 또는 가스 암모니아로 셀룰로오스-함유 물질을 처리하는 것을 수반하며, 이때 건조 물질 함량은 60%로 높다(Gollapalli et al., 2002, Appl. Biochem. Biotechnol. 98: 23-35; Chundawat et al., 2007, Biotechnol. Bioeng. 96: 219-231; Alizadeh et al., 2005, Appl. Biochem. Biotechnol. 121 :1133-1141; Teymouri et al., 2005, Bioresource Technol. 96: 2014-2018).
오르가노솔브 전처리는 160-200℃에서 30-60분 동안 수성 에탄올(40-60% 에탄올)을 사용하여 추출에 의해 셀룰로오스-함유 물질을 처리한다(Pan et al., 2005, Biotechnol. Bioeng. 90: 473-481; Pan et al., 2006, Biotechnol. Bioeng. 94: 851-861; Kurabi et al., 2005, Appl. Biochem. Biotechnol. 121:219-230). 대개 황산이 촉매로서 첨가된다. 오르가노솔브 전처리에서, 대부분의 헤미셀룰로오스가 제거된다.
적합한 전처리 방법의 다른 예는 Schell et al., 2003, Appl. Biochem. and Biotechnol. Vol. 105-108, p. 69-85, 및 Mosier et al., 2005, Bioresource Technology 96: 673-686, 및 미국 공개 특허 제2002/0164730호에 설명되어 있다.
한 양태에서, 화학적 전처리는 바람직하게는 산처리로서, 보다 바람직하게는 연속 희석산 및/또는 약산 처리로서 행한다. 산은 통상적으로 황산이지만 아세트산, 시트르산, 질산, 인산, 타르타르산, 숙신산, 염화수소 또는 이들의 혼합물과 같은 다른 산도 사용할 수 있다. 약산 처리는 바람직하게는 1-5, 보다 바람직하게는 1-4, 가장 바람직하게는 1-3의 pH 범위에서 행한다. 한 양태에서, 산 농도는 바람직하게는 0.01 내지 20wt% 산, 보다 바람직하게는 0.05 내지 10wt% 산, 보다 더 바람직하게는 0.1 내지 5wt% 산, 가장 바람직하게는 0.2 내지 2.0wt% 산의 범위 내이다. 산은 셀룰로오스-함유 물질과 접촉하고 예컨대 160-220℃, 바람직하게는 165-195℃ 범위 내의 온도에서, 초 내지 분 범위의 시간 동안, 예컨대 1초 내지 60분 동안 유지한다.
다른 양태에서, 전처리는 암모니아 섬유 폭발 단계(AFEX 전처리 단계)로서 행한다.
다른 양태에서, 전처리는 수성 슬러리에서 행한다. 바람직한 양태에서, 셀룰로오스-함유 물질은 전처리 동안 바람직하게는 10-80wt%, 보다 바람직하게는 20-70wt%, 가장 바람직하게는 30-60wt%, 50wt% 근방과 같은 양으로 존재한다. 전처리된 셀룰로오스-함유 물질을 세정하지 않거나 또는 기술분야에 알려진 어떤 방법을 사용하여 세정할 수 있고, 예컨대 물로 세정한다.
기계적 전처리: 용어 "기계적 전처리"는 그라인딩 또는 밀링의 여러 종류를 의미한다(예컨대 건식 밀링, 습식 밀링 또는 진동 볼 밀링).
물리적 전처리: 용어 "물리적 전처리"는 셀룰로오스-함유 물질로부터 셀룰로오스, 헤미셀룰로오스 및/또는 리그닌의 분리 및/또는 방출을 촉진하는 어떤 전처리를 의미한다. 예컨대, 물리적 전처리는 조사(예컨대 마이크로파 조사), 스팀처리/스팀 폭발, 수소화열분해 및 이들의 조합을 수반할 수 있다.
물리적 전처리는 고압 및/또는 고온을 수반할 수 있다(스팀 폭발). 한 양태에서, 고압은 바람직하게는 약 300 내지 약 600psi, 보다 바람직하게는 약 350 내지 약 550psi, 가장 바람직하게는 약 400 내지 약 500psi, 450 psi 근방의 범위 내의 압력을 의미한다. 다른 양태에서, 고온은 약 100 내지 약 300℃, 바람직하게는 약 140 내지 약 235℃ 범위 내의 온도를 의미한다. 바람직한 양태에서, 기계적 전처리는 상기 정의한 고압 및 고온을 사용하는 배치-공정, 스팀 건 가수분해 시스템, 예컨대 Sunds Defibrator AB, Swedend으로부터 입수가능한 Sunds Hydrolyzer에서 행한다.
물리적 및 화학적 전처리 병용: 셀룰로오스-함유 물질을 물리적으로 그리고 화학적으로 모두 전처리할 수 있다. 예컨대, 전처리 단계는 희석산 또는 약산 처리 및 고온 및/또는 고압 처리를 수반할 수 있다. 물리적 화학적 전처리는 필요에 따라 순차로 또는 동시에 행할 수 있다. 기계적 전처리도 포함될 수 있다.
따라서, 바람직한 양태에서에서, 셀룰로오스-함유 물질은 기계적, 화학적 또는 물리적 전처리 또는 이들의 어떤 조합을 실시하여 셀룰로오스, 헤미셀룰로오스 및/또는 리그닌의 분리 및/또는 방출을 촉진한다.
생물학적 전처리: 용어 "생물학적 전처리"는 셀룰로오스-함유 물질로부터 셀룰로오스, 헤미셀룰로오스 및/또는 리그닌의 분리 및/또는 방출을 촉진하는 어떤 생물학적 전처리를 의미한다. 생물학적 전처리 기술은 리그닌-가용화 미생물의 적용을 수반한다(예컨대 Hsu, T.-A.. 1996, Pretreatment of biomass, in Handbook on Bioethanol: Production and Utilization, Wyman, C. E., ed., Taylor & Francis, Washington, DC, 179- 212; Ghosh and Singh, 1993, Physicochemical and biological treatments for enzymatic/microbial conversion of lignocellulosic biomass, Adv. Appl. Microbiol. 39: 295-333; McMillan, J. D., 1994, Pretreating lignocellulosic biomass: a review, in Enzymatic Conversion of Biomass for Fuels Production, Himmel, M. E., Baker, J. O., and Overend, R. P., eds., ACS Symposium Series 566, American Chemical Society, Washington, DC, chapter 15; Gong, C. S., Cao, N. J., Du, J., and Tsao, G. T., 1999, Ethanol production from renewable resources, in Advances in Biochemical Engineering/Biotechnology, Scheper, T., ed., Springer-Verlag Berlin Heidelberg, Germany, 65: 207-241; Olsson and Hahn-Hagerdal, 1996, Fermentation of lignocellulosic hydrolysates for ethanol production, Enz. Microb. Tech. 18: 312-331 ; and Vallander and Eriksson, 1990, Production of ethanol from lignocellulosic materials: State of the art, Adv. Biochem. Eng./Biotechnol. 42: 63-95 참조).
당화. 당화로서도 알려진 가수분해 단계에서, 전처리된 셀룰로오스-함유 물질을 가수분해하여 셀룰로오스 및 대안적으로 또한 헤미셀룰로오스를 글루코스, 자일로스, 자일룰로스, 아라비노스, 말토스, 만노스, 갈락토스 및/또는 가용성 올리고당과 같은 발효가능한 당으로 분해한다. 가수분해는 본 발명의 셀룰로오스 가수분해 단백질 조성물을 사용하여 효소적으로 행한다. 또한 조성물의 효소 성분을 순차 첨가할 수 있다.
효소적 가수분해는 당업자에 의해 쉽게 결정할 수 있는 조건하에서 적절한 수성 환경에서 바람직하게 행한다. 바람직한 양태에서, 가수분해는 효소(들)의 활성에 적합한, 즉 효소(들)에 최적인 조건하에서 행한다. 가수분해는 유가식 또는 연속식 공정으로서 행할 수 있으며, 이때 전처리된 셀룰로오스-함유 물질(기질)은 예를 들면 가수분해 용액을 함유하는 효소에 서서히 공급된다.
당화는 일반적으로 제어된 pH, 온도 및 혼합 조건하에서 교반-탱크 반응기 또는 발효기에서 행한다. 적합한 공정 시간, 온도 및 pH 조건은 당업자에 의해 쉽게 결정할 수 있다. 예를 들면, 당화는 최대 200시간 지속할 수 있지만, 바람직하게는 약 12 내지 약 96 시간, 보다 바람직하게는 약 16 내지 약 72 시간, 가장 바람직하게는 약 24 내지 약 48 시간 동안 통상적으로 행한다. 온도는 바람직하게는 약 25℃ 내지 약 70℃, 보다 바람직하게는 약 3O℃ 내지 약 65℃, 보다 바람직하게는 약 40℃ 내지 60℃, 특히 약 50℃의 범위 내이다. pH는 바람직하게는 약 3 내지 약 8, 보다 바람직하게는 약 3.5 내지 약 7, 가장 바람직하게는 약 4 내지 약 6, 특히 약 pH 5의 범위 내이다. 건조 고체 함량은 바람직하게는 약 5 내지 약 50wt%, 보다 바람직하게는 약 10 내지 약 40wt%, 가장 바람직하게는 약 20 내지 약 30wt% 범위 내이다.
셀룰로오스 가수분해 증진 활성을 갖는 효소 및 폴리펩티드의 최적량은 셀룰로오스 가수분해 단백질의 성분, 셀룰로오스성 기질, 셀룰로오스성 기질의 농도, 셀룰로오스성 기질의 전처리(들), 시간, pH 및 발효 미생물의 함유물(예컨대 동시 당화 및 발효를 위한 효모)을 포함하지만 이에 제한되는 것은 아닌 다수의 인자에 의존한다.
바람직한 양태에서, 셀룰로오스-함유 물질에 대한 셀룰로오스 가수분해 단백질(들)의 유효량은 셀룰로오스-함유 물질 g당 약 0.5 내지 약 50mg, 바람직하게는 약 0.5 내지 약 40mg, 보다 바람직하게는 약 0.5 내지 약 25mg, 보다 바람직하게는 약 0.75 내지 약 20mg, 보다 바람직하게는 약 0.75 내지 약 15mg, 보다 더 바람직하게는 약 0.5 내지 약 10mg, 가장 바람직하게는 약 2.5 내지 약 10mg이다.
다른 바람직한 양태에서, 셀룰로오스-함유 물질에 대한 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드의 유효량은 셀룰로오스-함유 물질 g당 약 0.5 내지 약 50mg, 바람직하게는 약 0.5 내지 약 40mg, 보다 바람직하게는 약 0.5 내지 약 25mg, 보다 바람직하게는 약 0.75 내지 약 20mg, 보다 바람직하게는 약 0.75 내지 약 15mg, 보다 더 바람직하게는 약 0.5 내지 약 10mg, 가장 바람직하게는 약 2.5 내지 약 10mg이다.
다른 바람직한 양태에서, 셀룰로오스-함유 물질에 대한 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드(들)의 유효량은 셀룰로오스-함유 물질 g당 약 0.01 내지 약 50.0mg, 바람직하게는 약 0.01 내지 약 40mg, 보다 바람직하게는 약 0.01 내지 약 30mg, 보다 바람직하게는 약 0.01 내지 약 20mg, 보다 바람직하게는 약 0.01 내지 약 10mg, 보다 바람직하게는 약 0.01 내지 약 5mg, 보다 바람직하게는 약 0.025 내지 약 1.5mg, 보다 바람직하게는 약 0.05 내지 약 1.25 mg, 보다 바람직하게는 약 0.075 내지 약 1.25 mg, 보다 바람직하게는 약 0.1 내지 약 1.25mg, 보다 더 바람직하게는 약 0.15 내지 약 1.25mg, 가장 바람직하게는 약 0.25 내지 약 1.0mg이다.
다른 바람직한 양태에서, 셀룰로오스 가수분해 단백질(들)에 대한 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드(들)의 유효량은 셀룰로오스 가수분해 단백질(들) g당 약 0.005 내지 약 1.0g, 바람직하게는 약 0.01 내지 약 1.0g, 보다 바람직하게는 약 0.15 내지 약 0.75g, 보다 바람직하게는 약 0.15 내지 약 0.5g, 보다 바람직하게는 약 0.1 내지 약 0.5g, 보다 더 바람직하게는 약 0.1 내지 약 0.5g, 가장 바람직하게는 약 0.05 내지 약 0.2g이다.
발효. 전처리 및 가수분해된 셀룰로오스-함유 물질로부터 얻어진 발효가능한 당은, 당을 직접적으로 또는 간접적으로 원하는 발효 산물로 발효시킬 수 있는 하나 이상의 발효 미생물에 의해 배양될 수 있다. "발효" 또는 "발효 공정"은 어떤 발효 공정 또는 발효 단계를 포함하는 어떤 공정을 말한다. 또한 발효 공정은 바이오연료 산업, 소비성 알콜 산업(예컨대 맥주 및 와인), 낙농 산업(예컨대 발효 낙동 제품), 가죽 산업 및 담배 산업에 사용되는 발효 공정을 포함한다. 발효 조건은 원하는 발효 산물 및 발효 유기체에 의존하고 당업자에 의해 쉽게 결정될 수 있다.
발효 단계에서, 전처리 및 효소적 가수분해 단계의 결과로서 셀룰로오스-함유 물질로부터 방출된 당은, 효모와 같은 발효 유기체에 의해 산물, 예컨대 에탄올로 발효된다. 가수분해(당화) 및 발효는 분리적 또는 동시적일 수 있다. 이러한 방법은 분리 가수분해 및 발효(SHF), 동시 당화 및 발효(SSF), 동시 당화 및 공발효(SSCF), 혼성 가수분해 및 발효(HHF), SHCF(분리 가수분해 및 공발효), HHCF(혼성 가수분해 및 발효), 및 직접 미생물 전환(DMC)을 포함하지만 이에 제한되는 것은 아니다.
본 발명을 실행함에 있어 어떤 적합한 가수분해된 셀룰로오스-함유 물질을 발효 단계에 사용할 수 있다. 물질은 일반적으로 원하는 발효 산물, 즉 발효로부터 얻어지는 물질에 기초하여 선택하고, 사용하는 공정 또한 기술분야에 잘 공지되어 있다.
본원에서 용어 "발효 배지"는 당화 공정으로부터 얻어진 배지, 및 예컨대 동시 당화 및 발효 공정(SSF)에서 사용되는 배지와 같은, 발효 미생물(들)을 첨가하기 전의 배지를 말하는 것으로 이해된다.
"발효 미생물"은 발효 산물을 제조하기 위해 원하는 발효 공정에 사용하기에 적합한 박테리아 및 진균 유기체를 포함하는 어떤 미생물을 말한다. 발효 유기체는 C6 및/또는 C5 발효 유기체 또는 이들의 조합일 수 있다. C6 및 C5 발효 유기체 모두 기술분야에 잘 알려져 있다. 적합한 발효 미생물은 글루코스, 자일로스, 자일룰로스, 아라비노스, 말토스, 만노스, 갈락토스 또는 올리고당과 같은 당을 원하는 발효 산물로 직접적으로 또는 간접적으로 발효, 즉 전환시킬 수 있다.
에탄올을 생성하는 박테리아 및 진균 발효 유기체의 예는 Lin et al., 2006, Appl. Microbiol. Botechnol. 69: 627-642에 설명되어 있다.
C6 당을 발효할 수 있는 발효 미생물의 예는 효모와 같은 박테리아 및 진균 유기체를 포함한다. 바람직한 효모는 Saccharomyces spp .의 균주, 바람직하게는 Saccharomyces cerevisiae를 포함한다.
C5 당을 발효할 수 있는 발효 유기체의 예는 효모와 같은 박테리아 및 진균 유기체를 포함한다. 바람직한 C5 배양 효모는 Pichia의 균주, 바람직하게는 Pichia stipitis CBS 5773와 같은 Pichia stipitis; Candida의 균주, 바람직하게는 Candida boidinii , Candida brassicae , Candida sheatae , Candida diddensii , Candida pseudotropicalis, 또는 Candida utilis를 포함한다.
다른 발효 유기체는 Zymomonas mobilis와 같은 Zymomonas의 균주; Hansenula anomala와 같은 Hansenula의 균주; K. fragilis와 같은 Klyveromyces의 균주; S. pombe와 같은 Schizosaccharomyces의 균주; 및 E. coli의 균주, 특히 에탄올의 수율을 증가시키도록 유전자 조작된 E. coli 균주를 포함한다.
바람직한 양태에서, 효모는 Saccharomyces spp.이다. 보다 바람직한 양태에서, 효모는 Saccharomyces cerevisiae이다. 다른 보다 바람직한 양태에서, 효모는 Saccharomyces distaticus이다. 다른 보다 바람직한 양태에서, 효모는 Saccharomyces uvarum이다. 다른 바람직한 양태에서, 효모는 Kluyveromyces이다. 다른 보다 바람직한 양태에서, 효모는 Kluyveromyces marxlanus이다. 다른 보다 바람직한 양태에서, 효모는 Kluyveromyces fragilis이다. 다른 바람직한 양태에서, 효모는 Candida이다. 다른 보다 바람직한 양태에서, 효모는 Candida boidinii이다. 다른 보다 바람직한 양태에서, 효모는 Candida brassicae이다. 다른 보다 바람직한 양태에서, 효모는 Candida diddensii이다. 다른 보다 바람직한 양태에서, 효모는 Candida pseudotroplcalis이다. 다른 보다 바람직한 양태에서, 효모는 Candida utilis이다. 다른 바람직한 양태에서, 효모는 Clavispora이다. 다른 보다 바람직한 양태에서, 효모는 Clavispora lusitaniae이다. 다른 보다 바람직한 양태에서, 효모는 Clavispora opuntiae이다. 다른 바람직한 양태에서, 효모는 Pachysolen이다. 다른 보다 바람직한 양태에서, 효모는 Pachysolen tannophilus이다. 다른 바람직한 양태에서, 효모는 Pichia이다. 다른 보다 바람직한 양태에서, 효모는 Pichia stipitis이다. 다른 바람직한 양태에서, 효모는 Bretannomyces이다. 다른 보다 바람직한 양태에서, 효모는 Bretannomyces clausenii이다(Philippidis, G. P., 1996, Cellulose byconversion technology, in Handbook on Bioethanol : Production and Utilization, Wyman, C. E., ed., Taylor & Francis, Washington, DC1 179-212).
헥소스 및 펜토스를 에탄올로 효과적으로 발효시키는 박테리아는, 예컨대 Zymomonas mobilisClostridium thermocellum을 포함한다(상기 Philippidis, 1996).
바람직한 양태에서, 박테리아는 Zymomonas이다. 보다 바람직한 양태에서, 박테리아는 Zymomonas mobilis이다. 다른 바람직한 양태에서, 박테리아는 Clostridium이다. 다른 보다 바람직한 양태에서, 박테리아는 Clostridium thermocellum이다.
에탄올 제조에 적합한 시중에서 입수가능한 효모는, 예컨대 ETHANOL RED™ 효모(Fermentis/Lesaffre, USA로부터 입수가능), FALI™(Fleischmann's Yeast, USA로부터 입수가능), SUPERSTART™ 및 THERMOSACC™ 신선한 효모(Ethanol Technology, WI, USA로부터 입수가능), BIOFERM™ AFT 및 XR(NABC - North American Byproducts Corporation, GA, USA로부터 입수가능), GERT STRAND™ (Gert Strand AB, Sweden로부터 입수가능), 및 FERMIOL™(DSM Specialties로부터 입수가능).
바람직한 양태에서, 발효 미생물은 유전자 조작되어 자일로스 활용, 아라비노스 활용 및 자일로스 및 아라비노스 동시-활용 미생물과 같은 펜토스 당을 배양하는 능력을 제공한다.
다양한 발효 미생물로의 이종 유전자의 클로닝은 헥소스 및 펜토스를 에탄올로 전환(공발효)시킬 수 있는 유기체의 구조를 유도한다(Chen and Ho, 1993, Saccharomyces cerevisiae에서 Pichia stipitis 자일로스 리덕타제 유전자의 발현의 클로닝 및 개선, Appl. Biochem. Biotechnol. 39-40: 135-147; Ho et al., 1998, 글루코스 및 자일로스를 효과적으로 공배양할 수 있는 유전자 조작된 Saccharomyces 효모, Appl. Environ. Microbiol. 64: 1852-1859; Kotter and Ciriacy, 1993, Saccharomyces cerevisiae에 의한 자일로스 발효, Appl. Microbiol. Biotechnol. 38: 776-783; Walfridsson et al., 1995, 펜토스 포스페이트 경로 효소 트랜스케톨라제 및 트랜스알도라제를 암호화하는 TKL1 및 TAL1 유전자를 과발현하는 자일로스-대사 Saccharomyces cerevisiae 균주, Appl. Environ. Microbiol. 61 : 4184-4190; Kuyper et al., 2004, 효과적인 혐기 자일로스 발효를 위한 Saccharomyces cerevisiae의 최소 대사 공학: 원리의 증거, FEMS Yeast Research 4: 655-664; Beall et al., 1991, 재조합 Escherichia coli에 의한 자일로스 및 다른 당으로부터 에탄올 생성의 모수 연구, Biotech. Bioeng. 38: 296-303; Ingram et al.. 1998, 에탄올 생성을 위한 박테리아의 대사 공학, Biotechnol. Bioeng. 58: 204-214; Zhang et al., 1995, 에탄올 생산 Zymomonas mobilis에서 펜토스 대사 경로의 대사 공학, Science 267: 240-243; Deanda et al., 1996, 대사 경로 공학에 의한 아라비노스-발효 Zymomonas mobilis 균주의 개발, Appl. Environ. Microbiol. 62: 4465-4470).
바람직한 양태에서, 유전자 조작 발효 미생물은 Saccharomyces cerevisiae이다. 다른 바람직한 양태에서, 유전자 조작 발효 미생물은 Zymomonas mobilis이다. 다른 바람직한 양태에서, 유전자 조작된 발효 미생물은 Escherichia coli이다. 다른 바람직한 양태에서, 유전자 조작된 발효 미생물은 Klebsiella oxytoca이다.
발효 미생물(들)은 통상적으로 분해된 셀룰로오스 또는 가수분해물에 첨가되고, 발효는 약 8 내지 약 96시간, 예컨대 약 24 내지 약 60시간 동안 행한다. 온도는 통상적으로 약 26℃ 내지 약 60℃, 특히 약 32℃ 또는 50℃이고, 약 pH 3 내지 약 pH 8, 예컨대 pH 4-5 근처, 6 또는 7에서 이다.
바람직한 양태에서, 발효 미생물(들)을 분해된 셀룰로오스 또는 가수분해물에 적용하고 발효는 약 12 내지 약 96시간, 예컨대 통상적으로 24-60시간 동안 행한다. 바람직한 양태에서, 온도는 바람직하게는 약 2O℃ 내지 약 6O℃, 보다 바람직하게는 약 25℃ 내지 약 5O℃, 가장 바람직하게는 약 32℃ 내지 약 5O℃, 특히 약 32℃ 또는 5O℃이고, pH는 일반적으로 약 pH 3 내지 약 pH 7, 바람직하게는 pH 4-7 근방이다. 그러나, 일부, 예컨대 박테리아 발효 유기체는 높은 발효 온도 최적을 갖는다. 발효 미생물(들)은 발효 브로스(broth)의 ml 당 바람직하게는 대략 105 내지 1012, 바람직하게는 대략 107 내지 1010, 특히 대략 2 x 108 생존 세포 수의 양으로 바람직하게 적용된다. 발효를 위한 효모 사용에 관한 추가의 지침은, 예컨대, "The Alcohol Textbook" (Editors K. Jacques, T.P. Lyons and D. R. Kelsall, Nottingham University Press, United Kingdom 1999)에서 찾을 수 있으며, 이는 본원에서 참고로서 포함된다.
에탄올 제조를 위해서, 발효 후에 발효된 슬러리를 증류하여 에탄올을 추출한다. 본 발명의 방법에 따라 얻어진 에탄올은 예컨대 연료 에탄올, 음용 에탄올, 즉 음용 중성 주정, 또는 산업용 에탄올에 사용될 수 있다.
발효 시뮬레이터는 발효 공정, 특히, 발효 미생물의 성능, 예컨대 증진율 및 에탄올 수율을 추가로 개선하기 위하여 본원에 설명된 어떤 효소적 공정과 병용하여 사용할 수도 있다. "발효 시뮬레이터"는 발효 미생물, 특히, 효모의 성장을 위한 시뮬레이터를 말한다. 성장을 위한 바람직한 발효 시뮬레이터는 비타민 및 미네랄을 포함한다. 비타민의 예는 멀티비타민, 바이오틴, 판토테인산염, 니코틴산, 메소-이노시톨, 티아민, 피리독신, 파라-아미노벤조산, 폴산, 리보플라빈, 및 비타민 A, B, C, D, 및 E를 포함한다. 예컨대, Alfenore et al., Improving ethanol production and viability of Saccharomyces cerevisiae by a vitamin feeding strategy during fed-batch process, Springer-Verlag (2002)를 참조하며, 이는 본원에 참고로서 포함되어 있다. 미네랄의 예는 P, K, Mg, S, Ca, Fe, Zn, Mn, 및 Cu를 포함하는 양분을 공급할 수 있는 미네랄 및 미네랄 염을 포함한다.
발효 산물: 발효 산물은 발효로부터 유래한 어떤 물질일 수 있다. 발효 산물은 제한 없이 알콜(예컨대 아라비니톨, 부탄올, 에탄올, 글리세롤, 메탄올, 1,3-프로판디올, 소르비톨 및 자일리톨); 유기산(예컨대 아세트산, 아세톤산, 아디프산, 아스코르브산, 시트르산, 2,5-디케토-D-글루콘산, 포름산, 글루칼산, 글루콘산, 글루쿠론산, 글루타르산, 3-히드록시프로피온산, 이타콘산, 락트산, 말산, 말론산, 옥살산, 프로피온산, 숙신산 및 자일론산); 케톤(예컨대 아세톤); 알데히드(예컨대 포름알데히드); 아미노산(예컨대 아스파르트산, 글루탐산, 글리신, 리신, 세린 및 트레오닌); 및 가스(예컨대 메탄, 수소(H2), 이산화탄소(CO2), 및 일산화탄소(CO))일 수 있다. 발효 산물은 또한 고가 산물로서 단백질일 수 있다.
바람직한 양태에서, 발효 산물을 알콜이다. 용어 "알콜"은 하나 이상의 히드록실 모이어티를 함유하는 물질을 포괄하는 것으로 이해된다. 보다 바람직한 양태에서, 알콜은 아라비니톨이다. 다른 보다 바람직한 양태에서, 알콜은 부탄올이다. 다른 보다 바람직한 양태에서, 알콜은 에탄올이다. 다른 보다 바람직한 양태에서, 알콜은 글리세롤이다. 다른 보다 바람직한 양태에서, 알콜은 메탄올이다. 다른 보다 바람직한 양태에서, 알콜은 1,3-프로판디올이다. 다른 보다 바람직한 양태에서, 알콜은 소르비톨이다. 다른 보다 바람직한 양태에서, 알콜은 자일리톨이다. 예컨대 Gong, C. S., Cao, N. J., Du, J., and Tsao, G. T., 1999, Ethanol production from renewable resources, in Advances in Biochemical Engineering/Biotechnology, Scheper, T., ed., Springer-Verlag Berlin Heidelberg, Germany, 65: 207-241 ; Silveira, M. M., and Jonas, R., 2002, The biotechnological production of sorbitol, Appl. Microbiol. Biotechnol. 59: 400-408; Nigam, P., and Singh, D., 1995, Processes for fermentative production of xylitol - a sugar substitute, Process Biochemistry 30 (2): 117-124; Ezeji, T. C, Qureshi, N. and Blaschek, H. P., 2003, Production of acetone, butanol and ethanol by Clostridium beijerinckli BA101 and in situ recovery by gas stripping, World Journal of Microbiology and Biotechnology 19 (6): 595-603 참조.
다른 바람직한 양태에서, 발효 산물은 유기산이다. 다른 보다 바람직한 양태에서, 유기산은 아세트산이다. 다른 보다 바람직한 양태에서, 유기산은 아세톤산이다. 다른 보다 바람직한 양태에서, 유기산은 아디프산이다. 다른 보다 바람직한 양태에서, 유기산은 아스코르브산이다. 다른 보다 바람직한 양태에서, 유기산은 시트르산이다. 다른 보다 바람직한 양태에서, 유기산은 2,5-디케토-D-글루콘산이다. 다른 보다 바람직한 양태에서, 유기산은 포름산이다. 다른 보다 바람직한 양태에서, 유기산은 푸마르산이다. 다른 보다 바람직한 양태에서, 유기산은 글루칼산이다. 다른 보다 바람직한 양태에서, 유기산은 글루콘산이다. 다른 보다 바람직한 양태에서, 유기산은 글루쿠론산이다. 다른 보다 바람직한 양태에서, 유기산은 글루타르산이다. 다른 바람직한 양태에서, 유기산은 3-히드록시프로피온산이다. 다른 보다 바람직한 양태에서, 유기산은 이타콘산이다. 다른 보다 바람직한 양태에서, 유기산은 락트산이다. 다른 보다 바람직한 양태에서, 유기산은 말산이다. 다른 보다 바람직한 양태에서, 유기산은 말론산이다. 다른 보다 바람직한 양태에서, 유기산은 옥살산이다. 다른 보다 바람직한 양태에서, 유기산은 프로피온산이다. 다른 보다 바람직한 양태에서, 유기산은 숙신산이다. 다른 보다 바람직한 양태에서, 유기산은 자일론산이다. 예컨대 Chen, R., and Lee, Y. Y., 1997, Membrane-mediated extractive fermentation for lactic acid production from cellulosic biomass, Appl. Biochem. Biotechnol. 63-65: 435-448 참고.
다른 바람직한 양태에서, 발효 산물은 케톤이다. 용어 "케톤"은 하나 이상의 케톤 모이어티를 함유하는 물질을 포괄할 수 있다. 다른 보다 바람직한 양태에서, 케톤은 아세톤이다. 예컨대, 상기 Qureshi and Blaschek, 2003 참고.
다른 바람직한 양태에서, 발효 산물은 알데히드이다. 다른 보다 바람직한 양태에서, 알데히드는 포름알데히드이다.
다른 바람직한 양태에서, 발효 산물은 아미노산이다. 다른 보다 바람직한 양태에서, 유기산은 아스파르트산이다. 다른 보다 바람직한 양태에서, 아미노산은 글루탐산이다. 다른 보다 바람직한 양태에서, 아미노산은 글리신이다. 다른 보다 바람직한 양태에서, 아미노산은 리신이다. 다른 보다 바람직한 양태에서, 아미노산은 세린이다. 다른 보다 바람직한 양태에서, 아미노산은 트레오닌이다. 예컨대, Richard, A., and Margaritis, A., 2004, Empirical modeling of batch fermentation kinetics for poly(glutamic acid) production and other microbial biopolymers, Biotechnology and Bioengineering 87 (4): 501-515 참고.
다른 바람직한 양태에서, 발효 산물은 가스이다. 다른 보다 바람직한 양태에서, 가스는 메탄이다. 다른 보다 바람직한 양태에서, 가스는 H2이다. 다른 보다 바람직한 양태에서, 가스는 CO2이다. 다른 보다 바람직한 양태에서, 가스는 CO이다. 예컨대 Kataoka, N., A. Miya, and K. Kiriyama, 1997, Studies on hydrogen production by continuous culture system of hydrogen-producing anaerobic bacteria, Water Science and Technology 36 (6-7): 41-47; 및 Gunaseelan V.N. in Biomass and Bioenergy, Vol. 13 (1-2), pp. 83-114, 1997, Anaerobic digestion of biomass for methane production: A review 참고.
회수. 발효 산물(들)은 크로마토그래피(예컨대, 이온 교환, 친화성, 소수성, 크로마토포커싱, 및 크기 배제), 전기영동법(예컨대, 예비 등전 집속), 용해도차(예컨대, 황산 암모늄 침전), 증류 또는 추출을 포함하지만 이에 제한되지 않는 기술분야에 알려진 어떤 방법을 사용하여 발효 배지로부터 선택적으로 회수할 수 있다. 예컨대, 에탄올은 발효된 셀룰로오스-함유 물질로부터 분리되어 종래의 증류 방법에 의해 정제된다. 순도가 최대 약 96vol.%인 에탄올을 얻을 수 있으며, 이것은 예컨대 연료 에탄올, 음용 에탄올, 즉 음료 중성 주정 또는 산업용 에탄올로서 사용할 수 있다.
본 발명은 하기 실시예에 의하여 추가로 설명되나, 이는 본 발명의 범위를 제한하는 것으로 해석되어서는 안된다.
버퍼 및 기질로서 사용하는 화학물질은 적어도 시약 등급의 시중의 제품이다.
DNA 시퀀싱
염료 터미네이터 화학물질을 사용하는 Applied Biosystems Model 3130X 유전자 분석기(Applied Biosystems, Foster City, CA, USA)을 사용하여 DNA 시퀀싱을 행하였다(Giesecke et al., 1992, Journal of Virol. Methods 38: 47-60). 서열 특이적 프라이머와 함께 phred/phrap/consed (University of Washington, Seattle, WA, USA)을 사용하여 서열을 조립하였다.
배지 및 용액
YP 배지는 리터당 10g 효모 추출물 및 20g 박토 트립톤으로 이루어졌다.
셀룰라아제-유도 배지는 리터당 20g 셀룰로오스, 10g 옥수수 스티프(steep) 고체, 1.45g (NH4)2SO4, 2.08g KH2PO4, 0.28g CaCl2, 0.42g MgSO4·7H2O 및 0.42ml 미량 금속 용액으로 이루어졌다.
미량 금속 용액은 리터당 216g FeCl3·6H2O, 58g ZnSO4·7H2O, 27g MnSO4·H2O, 10g CuSO4·5H2O, 2.4g H3BO3, 및 336g 시트르산으로 이루어졌다.
STC는 1M 소르비톨, 10mM CaCl2, 및 10mM Tris-HCl, pH 7.5으로 이루어졌다.
COVE 플레이트는 리터당 342g 수크로스, 10ml COVE 염 용액, 10ml 1M 아세트아미드, 10ml 1.5M CsCl, 및 25g Noble 한천으로 이루어졌다.
COVE 염 용액은 리터당 26g KCl, 26g MgSO4, 76g KH2PO4, 및 50ml COVE 미량 금속 용액으로 이루어졌다.
COVE 미량 금속 용액은 리터당 0.04g Na2B4O7·10H2O, 0.4g CuSO4·5H2O, 1.2g FeSO4·7H2O, 0.7g MnSO4·H2O, 0.8g Na2MoO2·H2O 및 10g ZnSO4·7H2O로 이루어졌다.
COVE2 플레이트는 리터당 30g 수크로스, 20ml COVE 염 용액, 25g Noble 한천 및 10ml 1M 아세트아미드로 이루어졌다.
PDA 플레이트는 리터당 39그램 감자 덱스트로스 한천으로 이루어졌다.
LB 배지는 리터당 10g 트립톤, 5g 효모 추출물, 5g 염화나트륨으로 이루어졌 다.
2X YT-Amp 플레이트는 리터당 10g 트립톤, 5g 효모 추출물, 5g 염화나트륨 및 15g 박토 한천으로 이루어지고, 이어서 오토클레이빙 후 50mg/ml 암피실린의 2ml 필터-멸균 용액이다.
MDU2BP 배지는 리터당 45g 말토스, 1g MgSO4·7H2O, 1g NaCl, 2g K2HSO4, 12g KH2PO4, 2g 우레아 및 500μl AMG 미량 금속 용액으로 이루어지며, pH를 5.0로 조정한 다음 필터를 0.22μm 여과 유닛으로 멸균하였다.
AMG 미량 금속 용액은 리터당 14.3g ZnSO4·7H2O, 2.5g CuSO4·5H2O, 0.5g NiCl2·6H2O, 13.8g FeSO4·H2O, 8.5g MnSO4·7H2O 및 3g 시트르산으로 이루어졌다
최소 배지 플레이트는 리터당 6g NaNO3, 0.52 KCl, 1.52g KH2PO4, 1ml COVE 미량 금속 용액, 20g Noble 한천, 20ml 50% 글루코스, 2.5ml 20% MgSO4·7H2O 및 20ml 비오틴 스톡 용액으로 이루어졌다.
비오틴 스톡 용액은 리터당 0.2g 비오틴으로 이루어졌다.
SOC 배지는 2% 트립톤, 0.5% 효모 추출물, 10mM NaCl, 2.5mM KCl, 10mM MgCl2, 및 10mM MgSO4로 이루어졌고, 이어서 오토클레이빙 후 여과-멸균 글루코스로 20mM이다.
맨델 배지는 리터당 1.4g (NH4)2SO4, 2.0g KH2PO4, 0.3g 우레아, 0.3g CaCl2, 0.3g MgSO4·7H2O, 5mg FeSO4·7H2O, 1.6mg MnSO4·H20, 1.4mg ZnSO4·H2O, 및 2mg CoCl2로 이루어졌다.
실시예 1: pMJ04 발현 벡터의 구성
하기 나타낸 바와 같이 프라이머 993429(안티센스) 및 993428(센스)를 사용하여 Trichoderma reesei RutC30 게놈 DNA로부터 Trichoderma reesei 셀로비오히드롤라아제 1 유전자(cbh1, CEL7A) 터미네이터를 PCR 증폭시켜 발현 벡터 pMJ04을 구성하였다. 안티센스 프라이머는 Pac I 부위를 센스 프라이머의 5'-말단에서 갖고 Spe I 부위를 3'-말단에서 가지도록 조작되었다.
프라이머 993429(안티센스):
5'-AACGTTAATTAAGGAATCGTTTTGTGTTT-3' (SEQ ID NO: 65)
프라이머 993428(센스):
5'-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3' (SEQ ID NO: 66)
Trichoderma reesei RutC30 게놈 DNA를 DNEASY® 플랜트 맥시 키트(QIAGEN Inc., Valencia, CA, USA)를 사용하여 분리하였다.
증폭 반응물(50μl)은 1X ThermoPol 반응 버퍼(New England Biolabs. Beverly, MA, USA), 0.3mM dNTPs, 100ng Trichoderma reesei RutC30 게놈 DNA, 0.3μM 프라이머 993429, 0.3μM 프라이머 993428 및 2유닛의 Vent DNA 폴리메라제(New England Biolabs, Beverly, MA1 USA)로 이루어졌다. 반응물을 94℃에서 30초, 50℃에서 30초 및 72℃에서 60초 동안 각각 5 사이클, 이어서 94℃에서 30초, 65℃에서 30초 및 72℃에서 120초 동안 각각 25 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333(Eppendorf Scientific, Inc., Westbury, NY, USA)에서 인큐베이션하였다(5분 최종 확장). 40mM Tris 염기-20mM 아세트산 나트륨-1mM 이나트륨 EDTA(TAE) 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 반응 산물을 분리하였으며, 여기서 229bp 산물 밴드를 겔로부터 절제하고 QIAQUICK® 겔 추출 키트(QIAGEN Inc., Valencia, CA, USA)를 사용하여 제조자의 지시에 따라 정제하였다.
얻어진 PCR 단편을 Pac I 및 Spe I으로 분해하고 Rapid 라이게이션 키트(Roche, Indianapolis, IN, USA)를 사용하여 동일한 제한 효소로 분해되는 pAILo1으로 라이게션하여(WO 05/067531) pMJ04를 발생시켰다(도 1).
실시예 2: pCaHj568의 구성
pCaHj170(미국 특허 제5,763,254호) 및 pMT2188로부터 플라스미드 pCaHj568을 구성하였다. 플라스미드 pCaHj170는 Humicola insolens 엔도글루카나아제 V (CEL45A) 전장 암호화 영역(SEQ ID NO: 15, SEQ ID NO: 16의 아미노산 서열을 암호화)을 포함한다. 하기 나타낸 프라이머 142779 및 142780을 사용하여 pCaHj483(WO 98/00529)로부터 pUC19 복제 원점을 PCR 증폭함으로써 pMT2188의 구성을 시작하였다. 프라이머 142780는 PCR 단편에서 Bbu I 부위를 도입한다. .
프라이머 142779:
5'-TTGAATTGAAAATAGATTGATTTAAAACTTC-3' (SEQ ID NO: 67)
프라이머 142780:
5'-TTGCATGCGTAATCATGGTCATAGC-3' (SEQ ID NO: 68)
EXPAND® PCR 시스템(Roche Molecular Biochemicals, Basel, Switzerland)을 제조자의 지시에 따라 이 증폭에 사용하였다. PCR 산물을 아가로스 겔 상에서 분리하고 Jetquick 겔 추출 스핀 키트(Genomed, Wielandstr, Germany)을 사용하여 1160 bp 단편을 분리하고 정제하였다. .
EXPAND® PCR 시스템을 사용하여 하기에 나타낸 프라이머 140288 및 142778를 사용하여 일반적인 Saccharomyces cerevisiae 클로닝 벡터 pYES2 (Invitrogen, Carlsbad, CA, USA)로부터 URA3 유전자를 증폭하였다. 프라이머 140288은 PCR 단편으로 Eco Rl 부위를 도입하였다.
프라이머 140288:
5'-TTGAATTCATGGGTAATAACTGATAT-3' (SEQ ID NO: 69)
프라이머 142778:
5'-AAATCAATCTATTTTCAATTCAATTCATCATT-3'(SEQ ID NO: 70)
PCR 산물을 아가로스 겔 상에서 분리하고 Jetquick 겔 추출 스핀 키트를 사용하여 1126 bp 단편을 분리하고 정제하였다.
오버랩 스플라이싱법에 의해 하기에 나타낸 142780 및 140288 프라이머를 사용하여 혼합 및 증폭함으로써 두 PCR 단편을 융합하였다(Horton et al., 1989, Gene 77: 61-68). PCR 산물을 아가로스 겔 상에서 분리하고 Jetquick 겔 추출 스핀 키트를 사용하여 2263 bp 단편을 분리하고 정제하였다.
얻어진 단편을 Eco Rl 및 Bbu I으로 분해하고 표준 프로토콜을 사용하여 동 일한 제한 효소로 분해되는 pCaHj483의 최대 단편으로 라이게이션하였다. 라이게이션 혼합물을 Mandel and Higa, 1970, J. Mol. Biol. 45: 154의 방법에 의해 적격(competent) 제조된 pyrF-음성 E. coli 균주 DB6507(ATCC 35673)로 형질변환하였다. 형질전환주는 리터당 1g 카사미노산, 500μg 티아민 및 10mg 카나마이신이 보충된 고체 M9 배지(Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, 2nd edition, Cold Spring Harbor Laboratory Press)에서 선택하였다. 하나의 형질전환주로부터의 플라스미드를 분리하고 pCaHj527로 지정하였다(도 2).
pCaHj527 상에 존재하는 NA2-tpi 프로모터에 EXPAND® PCR 시스템을 사용하여 제조자의 지시에 따라 PCR에 의해 부위-지정 돌연변이를 실시하였다. 하기 나타낸 돌연변이유발 프라이머 141223을 사용하여 뉴클레오티드 134-144가 GTACTAAAACC(SEQ ID NO: 71)로부터 CCGTTAAATTT(SEQ ID NO: 72)으로 전환되었다.
프라이머 141223:
5'-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3' (SEQ ID NO: 73)
하기 나타낸 돌연변이유발 프라이머 141222를 사용하여 뉴클레오티드 423-436가 ATGCAATTTAAACT(SEQ ID NO: 74)으로부터 CGGCAATTTAACGG(SEQ ID NO: 75)으로 전환되었다.
프라이머 141222:
5'-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3' (SEQ ID NO: 76)
얻어진 플라스미드는 pMT2188로 지정하였다(도 3).
Humicola insolens 엔도글루카나아제 V 암호화 영역을 pCaHj170으로부터 Bam HI-Sal I 단편으로서 Bam HI 및 Xho I으로 분해되는 pMT2188으로 이동시켜 pCaHj568을 발생시켰다(도 4). 플라스미드 pCaHj568는 Humicola insolens 엔도글루카나아제 V 전장 암호화 서열에 작동가능하게 연결된 돌연변이 NA2-tpi 프로모터를 포함한다.
실시예 3: pMJO5의 구성
하기 나타낸 프라이머 HiEGV-F 및 HiEGV-R를 사용하여 pCaHj568로부터 915 bp Humicola insolens 엔도글루카나아제 V 전장 암호화 영역을 PCR 증폭하여 플라스미드 pMJ05를 구성하였다.
프라이머 HiEGV-F(센스):
5'-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3' (SEQ ID NO: 77)
프라이머 HiEGV-R(안티센스):
5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3' (SEQ ID NO: 78)
증폭 반응물(50μl)은 1X ThermoPol 반응 버퍼(New England Biolabs, Beverly, MA, USA), 0.3mM dNTPs, 10ng/μl pCaHj568, 0.3μM HiEGV-F 프라이머, 0.3μM HiEGV-R 프라이머 및 2유닛 Vent DNA 폴리메라제(New England Biolabs, Beverly, MA, USA)로 이루어졌다. 반응물을 94℃에서 30초, 50℃에서 30초 및 72℃에서 60초 동안 각각 5 사이클, 이어서 94℃에서 30초, 65℃에서 30초 및 72℃에서 120초 동안 각각 25 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(5분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 937 bp 산물 벤드가 겔로부터 절제되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
937 bp 정제된 단편을 하기 프라이머와 함께 후속 증폭을 위한 주형 DNA로서 사용하였다:
프라이머 HiEGV-R(안티센스):
5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3'(SEQ ID NO: 79)
프라이머 HiEGV-F-오버랩(센스):
5'-ACCGCGGACTGCGCATC ATGCGTTCCTCCCCCCTCC-3' (SEQ ID NO: 80)
이탤릭체의 프라이머 서열은 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 (cbh1) 프로모터의 17 bp과 상동이고 밑줄친 프라이머 서열은 Humicola insolens 엔도글루카나아제 V 암호화 영역의 29 bp와 상동이다. 프로모터와 암호화 서열간의 36 bp 오버랩은 Humicola insolens 엔도글루카나아제 V 암호화 영역을 포함하는 918 bp 단편으로 Trichoderma reesei cbM 프로모터를 포함하는 994 bp 단편을 정확하게 융합시켰다.
증폭 반응물(50μl)은 1X ThermoPol 반응 버퍼, 0.3mM dNTPs, 10μl 정제된 937 bp PCR 단편, 0.3μM HiEGV-F-오버랩 프라이머, 0.3μM HiEGV-R 프라이머 및 2유닛 Vent DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 30초, 50℃에서 30초 및 72℃에서 60초 동안 각각 5 사이클, 이어서 94℃에서 30초, 65℃에서 30초 및 72℃에서 120초 동안 각각 25 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(5분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 945 bp 산물 벤드가 겔로부터 절제되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
분리 PCR을 행하여 하기 나타낸 프라이머를 사용하여 Trichoderma reesei RutC30 게놈 DNA로부터 유전자의 ATG 개시 코톤의 994 bp 상류로부터 확장되는 Trichoderma reesei cbh1 프로모터 서열을 증폭하였다(센스 프라이머는 5'-말단에서 Sal I 제한 부위를 가지도록 조작되었다). Trichoderma reesei RutC30 게놈 DNA를 DNEASY® 플랜트 맥시 키트를 사용하여 분리하였다.
프라이머 TrCBHIpro-F(센스):
5'-AAACGTCGACCGAATGTAGGATTGTTATC-3' (SEQ ID NO: 81)
프라이머 TrCBHIpro-R(안티센스):
5'-GATGCGCAGTCCGCGGT-3' (SEQ ID NO: 82)
증폭 반응물(50μl)은 1X ThermoPol 반응 버퍼, 0.3mM dNTPs, 10ng/μl Trichoderma reesei RutC30 게놈 DNA, 0.3μM HiEGV-F-오버랩 프라이머, 0.3μM TrCBHIpro-FHiEGV-R 프라이머 및 2유닛 Vent DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 30초, 55℃에서 30초 및 72℃에서 120초 동안 각각 50 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(5분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 998 bp 산물 밴드가 겔로부터 절제되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
정제된 998 bp PCR 단편을 하기 나타낸 프라이머를 사용하는 후속 증폭을 위한 주형 DNA로서 사용하였다.
프라이머 TrCBHIpro-F:
5'-AAACGTCGACCGAATGTAGGATTGTTATC-3' (SEQ ID NO: 83)
프라이머 TrCBHIpro-R-오버랩:
5'-GGAGGGGGGAGGAACGCAT GATGCGCAGTCCGCGGT-3' (SEQ ID NO: 84)
이탤릭체의 프라이머 서열은 Trichoderma reesei cbh1 프로모터의 17 bp과 상동이고 밑줄친 프라이머 서열은 Humicola insolens 엔도글루카나아제 V 암호화 영역의 29 bp에 상동이다. 프로모터와 암호화 서열간의 36 bp 오버랩은 Humicola insolens 엔도글루카나아제 V 전장 암호화 영역을 포함하는 918 bp 단편으로 Trichoderma reesei cbh1 프로모터를 포함하는 994 bp 단편을 정확히 융합시켰다.
증폭 반응물(50μl)은 1X ThermoPol 반응 버퍼, 0.3mM dNTPs, 1μl 정제된 998 pb PCR 단편, 0.3μM TrCBH1pro-F 프라이머, 0.3μM TrCBH1pro-R-오버랩 프라이머 및 2유닛 Vent DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 30초, 55℃에서 30초 및 72℃에서 60초 동안 각각 50 사이클, 이어서 94℃에서 30초, 65℃에서 30초 및 72℃에서 120초 동안 각각 25 사이클로로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(5분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 1017 bp 산물 밴드가 겔로부터 절제되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
1017 bp Trichoderma reesei cbh1 프로모터 PCR 단편 및 945 bp Humicola insolens 엔도글루카나아제 V PCR 단편을 하기 프라이머를 사용하는 후속 증폭을 위한 주형 DNA로서 사용하여 994 bp cbM 프로모터를 918 bp 엔도글루카나아제 V 전장 암호화 영역에 오버래핑 PCR을 사용하여 정확하게 융합하였다.
프라이머 TrCBHIpro-F:
5'-AAACGTCGACCGAATGTAGGATTGTTATC-3' (SEQ ID NO: 85)
프라이머 HiEGV-R:
5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3' (SEQ ID NO: 86)
증폭 반응물(50μl)은 1X ThermoPol 반응 버퍼, 0.3mM dNTPs, 0.3μM TrCBH1pro-F 프라이머, 0.3μM HiEGV-R 프라이머 및 2유닛 Vent DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 30초, 50℃에서 30초 및 72℃에서 60초 동안 각각 5 사이클, 이어서 94℃에서 30초, 65℃에서 30초 및 72℃에서 120초 동안 각각 25 사이클로로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(5분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 1926 bp 산물 밴드가 겔로부터 제거되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
ZEROBLUNT® TOPO® PCR 클로닝 키트(Invitrogen, Carlsbad, CA, USA)를 사용하여 제조자의 프로토콜에 따라 얻어진 1926 bp 단편을 pCR®-Blunt-II-TOPO® 벡터(Invitrogen, Carlsbad, CA1 USA)로 클로닝하였다. 얻어진 플라스미드를 Not I 및 Sal I으로 분해하고 1926 bp 단편을 QIAQUICK® 겔 추출 키트를 사용하여 겔 정제하고 T4 DNA 리가아제(Roche, Indianapolis, IN, USA)를 사용하여, 동일한 두 제한 효소로 분해되는 pMJ04로 라이게이션하여 pMJ05를 발생시켰다(도 5). 플라스미 드 pMJ05는 Humicola insolens 엔도글루카나아제 V 전장 암호화 서열에 작동가능하게 결합된 Trichoderma reesei 셀로비오히드롤라아제 I 프로모터 및 터미네이터를 포함한다.
실시예 4: pSMai130 발현 벡터의 구성
Aspergillus oryzae 베타-글루코시다아제 전장 암호화 서열(cDNA 서열을 위한 SEQ ID NO: 15 및 연역 아미노산 서열을 위한 SEQ ID NO: 16; E. coli DSM 14240)의 ATG 개시 코돈으로부터 TAA 정지 코돈에 걸친 2586 bp DNA 단편을, 주형으로서 pJaL660 (WO 2002/095014)로부터 하기 나타낸 프라이머 993467(센스) 및 993456(안티센스)를 가지고 PCR에 의해 증폭하였다. Spe I 부위는 안티센스 프라이머의 5' 말단을 조작하여 라이게이션을 편리하게 하였다. 이탤릭체의 프라이머 서열은 Trichoderma reesei cbh1 프로모터의 24 bp과 상동이고 밑줄친 서열은 Aspergillus oryzae 베타-글루코시다아제 암호화 영역의 22 bp에 상동이다.
프라이머 993467:
5'-ATAGTCAACCGCGGCTGCGCATC ATGAAGCTTGGTTGGATCGAGG-3' (SEQ ID NO: 87)
프라이머 993456:
5'-ACTAGTTTACTGGGCCTTAGGCAGCG-3' (SEQ ID NO: 88)
증폭 반응물(50μl)은 Pfx 증폭 버퍼(Invitrogen, Carlsbad, CA, USA), 0.25mM dNTPs, 10ng pJaL660, 6.4μM 프라이머 993467, 3.2μM 프라이머 993456, 1mM MgCl2 및 2.5유닛의 Pfx DNA 폴리메라제(Invitrogen, Carlsbad, CA, USA)로 이 루어졌다. 반응물을 94℃에서 1분, 55℃에서 1분 및 72℃에서 3분 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(15분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 2586 bp 산물 밴드가 겔로부터 제거되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
분리 PCR을 행하여 하기 나타낸 프라이머 993453(센스) 및 프라이머 993463(안티센스)을 사용하여 유전자의 ATG 개시 코돈의 1000 bp 상류로부터 확장되는 Trichoderma reesei cbh1 프로모터 서열을 증폭하여 1000 bp PCR 단편을 발생시켰다.
프라이머 993453:
5'-GTCGACTCGAAGCCCGAATGTAGGAT-3' (SEQ ID NO: 89)
프라이머 993463:
5'- CCTCGATCCAACCAAGCTTCAT GATGCGCAGTCCGCGGTTGACTA-3' (SEQ ID NO: 90)
이탤릭체의 프라이머 서열은 Trichoderma reesei cbh1 프로모터의 24 bp과 상동이고 밑줄친 프라이머 서열은 Aspergillus oryzae 베타-글루코시다아제 전장 암호화 영역의 22 bp에 상동이다. 프로모터와 암호화 서열간의 46 bp 오버랩은 Aspergillus oryzae 베타-글루코시다아제 암호화 영역을 포함하는 2586 bp 단편으로 Trichoderma reesei cbh1 프로모터를 포함하는 1000 bp 단편을 정확히 융합시켰다.
증폭 반응물(50μl)은 Pfx 증폭 버퍼, 0.25mM dNTPs, 100ng Trichoderma reesei RutC30 게놈 DNA, 6.4μM 프라이머 993453, 3.2μM 프라이머 993463, 1mM MgCl2 및 2.5유닛의 Pfx DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 1분, 55℃에서 1분 및 72℃에서 3분 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(15분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 1000 bp 산물 밴드가 겔로부터 절제되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
정제된 단편을 상기 나타낸 프라이머 993453(센스) 및 프라이머 993456(안티센스)을 사용하는 PCR 오버래핑에 의한 후속 증폭을 위한 주형 DNA로서 사용하여 Trichoderma reesei cbh1 프로모터를 포함하는 1000 bp 단편을 Aspergillus oryzae 베타-글루코시다아제 전장 암호화 영역을 포함하는 2586 bp 단편에 정확하게 융합하였다.
증폭 반응물(50μl)은 Pfx 증폭 버퍼, 0.25mM dNTPs, 6.4μM 프라이머 99353, 3.2μM 프라이머 993456, 1mM MgCl2 및 2.5유닛의 Pfx DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 1분, 60℃에서 1분 및 72℃에서 4분 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(15분 최종 확장).
얻어진 3586 bp 단편을 Sal I 및 Spe I으로 분해하고 동일한 두 제한 효소로 분해되는 pMJ04으로 라이게이션하여 pSMai130을 발생시켰다(도 6). 플라스미드 pSMai130은 Aspergillus oryzae 천연 베타-글루코시다아제 신호 서열 및 암호화 서열(즉, 전장 Aspergillus oryzae 베타-글루코시다아제 암호화 서열)에 작동가능하게 연결된 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 프로모터 및 터미네이터를 포함한다.
실시예 5: pSMai 135의 구성
Lys-20으로부터 TAA 정지 코돈까지의 Aspergillus oryzae 베타-글루코시다아제 성숙한 암호화 영역(천연 신호 서열 없음, 도 7 참조; 신호 펩티드 및 그것의 암호화 서열을 위한 SEQ ID NO: 91 및 92)을, 주형으로서 pJaL660으로부터 하기 나타낸 프라이머 993728(센스) 및 프라이머 993727(안티센스)을 가지고 PCR 증폭하였다.
프라이머 993728:
5'-TGCCGGTGTTGGCCCTTGCC AAGGATGATCTCGCGTACTCCC-3' (SEQ ID NO: 93)
프라이머 993727:
5'-GACTAGTCTTACTGGGCCTTAGGCAGCG-3' (SEQ ID NO: 94)
이탤릭체의 서열은 Humicofa insolens 엔도글루카나아제 V 신호 서열의 20 bp과 상동이고 밑줄친 서열은 Aspergillus oryzae 베타-글루코시다아제 암호화 영역의 22 bp에 상동이다. Spe I 부위를 안티센스 프라이머의 5' 말단으로 조작하였다.
증폭 반응물(50μl)은 Pfx 증폭 버퍼, 0.25mM dNTPs, 10ng/μl pJaL660, 6.4 μM 프라이머 993728, 3.2μM 프라이머 993727, 1mM MgCl2 및 2.5유닛의 Pfx DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 1분, 55℃에서 1분 및 72℃에서 3분 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(15분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 2523 bp 산물 밴드가 겔로부터 제거되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
하기 나타낸 프라이머 993724(센스) 및 프라이머 993729(안티센스)를 사용하여, 분리 PCR 증폭을 행하여 Trichoderma reesei cbh1 프로모터의 1000 bp 및 Humicola insolens 엔도글루카나아제 V 신호 서열의 63 bp(Ala-21에 대한 ATG 개시 코돈, 도 8, SEQ ID NO: 95 및 96)을 증폭하였다.
프라이머 993724:
5'-ACGCGTCGACCGAATGTAGGATTGTTATCC-3' (SEQ ID NO: 97)
프라이머 993729:
5'-GGGAGTACGCGAGATCATCCTT GGCAAGGGCCAACACCGGCA-3' (SEQ ID NO: 98)
이탤릭체의 프라이머 서열은 Humicofa insolens 엔도글루카나아제 V 신호 서열의 20 bp과 상동이고 밑줄친 서열은 Aspergillus oryzae 베타-글루코시다아제 암호화 영역의 22 bp에 상동이다.
cbh1 프로모터의 제어하에 Humicola insolens 엔도글루카나아제 V 암호화 영역을 포함하는 플라스미드 pMJO5를 주형으로 사용하여 Trichoderma reesei cbh1 프 로모터 및 Humicola insolens 엔도글루카나아제 V 신호 서열 단편을 포함하는 1063 bp 단편을 발생시켰다. 오버랩의 42 bp는 Trichoderma reesei cbh1 프로모터와 Humicola insolens 엔도글루카나아제 V 신호 서열 및 Aspergillus oryzae 베타-글루코시다아제 성숙한 암호화 서열간에 공유되어 2523 bp의 Aspergillus oryzae 베타-글루코시다아제 암호화 영역의 프로모터와 ATG 개시 코돈간에 완전한 결합을 제공하였다.
증폭 반응물(50μl)은 Pfx 증폭 버퍼, 0.25mM dNTPs, 10ng/μl pMJ05, 6.4μM 프라이머 993728, 3.2μM 프라이머 993727, 1mM MgCl2 및 2.5유닛의 Pfx DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 1분, 60℃에서 1분 및 72℃에서 4분 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(15분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 1063 bp 산물 밴드가 겔로부터 제거되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
상기 설명한 프라이머 993724(센스) 및 프라이머 993727(안티센스)를 사용하는 증폭을 위한 주형으로서 정제된 오버래핑 단편을 사용하여 Trichoderma reesei cbh1 프로모터 및 Humicola insolens 엔도글루카나아제 V 신호 서열을 포함하는 1063 bp 단편을 PCR 오버래핑에 의해 Aspergillus oryzae 베타-글루코시다아제 성숙한 암호화 영역 프레임을 포함하는 2523 bp 단편에 정확하게 융합하였다.
증폭 반응물(50μl)은 Pfx 증폭 버퍼, 0.25mM dNTPs, 6.4μM 프라이머 993724, 3.2μM 프라이머 993727, 1mM MgCl2 및 2.5유닛의 Pfx DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 1분, 60℃에서 1분 및 72℃에서 4분 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(15분 최종 확장). 반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 3591 bp 산물 밴드가 겔로부터 제거되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
얻어진 3591 bp 단편을 Sal I 및 Spe I로 분해하고 동일한 제한 효소로 분해되는 pMJ04으로 라이게이션하여 pSMai135을 발생시켰다(도 9). 플라스미드 pSMai135는 Humicola insolens 엔도글루카나아제 V 신호 서열 및 Aspergillus oryzae 베타-글루코시다아제 성숙한 암호화 서열에 작동가능하게 결합된 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 프로모터 및 터미네이터를 포함한다.
실시예 6: Humicola insolens 엔도글루카나아제 V 분비 신호를 갖는 Aspergillus oryzae 베타-글루코시다아제의 발현
Humicola insolens 엔도글루카나아제 V 분비 신호에 결합된 성숙한 Aspergillus oryzae 베타-글루코시다아제를 암호화하는 플라스미드 pSMai135(도 8)를 PEG-매개 형질전환에 의해 Trichoderma reesei RutC30으로 도입하였다(Penttila et al., 1987, Gene 61 155-164). 플라스미드는 Aspergillus nidulans amdS 유전자를 함유하여 형질전환주를 단일 질소원으로서 아세트아미드 상에서 성장하게 하였 다.
Trichoderma reesei RutC30을 27℃ 및 90rpm에서 2%(w/v) 글루코스 및 10 mM 유리딘 보충된 25ml YP 배지에서 17시간 동안 배양하였다. Vacuum Driven Disposable Filtration System(Millipore, Bedford, MA1 USA)를 사용하여 여과에 의해 균사체를 수집하고 탈이온수로 2회 1.2M 소르비톨로 2회 세정하였다. 세정한 균사체를 ml당 15mg GLUCANEX®(Novozymes AJS, Bagsvasrd, Denmark) 및 ml당 0.36유닛 키티나제(Sigma Chemical Co., St. Louis, MO, USA)를 함유하는 20ml 1.2M 소르비톨에 현탁하고 15-25분 동안 34℃에서 90rpm의 가벼운 쉐이킹과 함께 인큐베이션하여 원형질체를 발생시켰다. 400 x g에서 7분 동안 원심분리하여 원형질체를 수집하고 차가운 1.2M 소르비톨로 2회 세정하였다. 혈구 측정기를 사용하여 원형질체를 계수하고 STC에 ml당 최종 농도 1 X 108 원형질체로 재현탁하였다. 과잉의 원형질체를 Cryo 1℃ 냉동 용기(Nalgene, Rochester, NY, USA)에서 -80℃에 저장하였다.
Pme I로 분해되는 pSMai135 약 7μg을 100μl 원형질체 용액에 첨가하고 가볍게 혼합한 후 260μl PEG 버퍼를 첨가하고, 혼합하고, 실온에서 30분 동안 인큐베이션하였다. 그 다음 STC(3ml)을 첨가하고 혼합하고 Aspergillus nidulans amdS 선택을 사용하는 COVE 플레이트로 형질전환 용액을 플레이팅하였다. 플레이트를 28℃에서 5-7일 동안 인큐베이션하였다. 형질전환주를 COVE2 플레이트로 2차-배양하고 28℃에서 성장시켰다.
pSMai135를 가지고 얻어진 지정된 67 형질전환주 SMA135를 아세트아미드를 함유하는 신선한 플레이트에서 2차 배양하고 7일 동안 28℃에서 포자형성하였다.
67 SMA135 Trichoderma reesei 형질전환주를 pH 6.0에서 형질전환주의 포자가 접종된 25ml 셀룰라아제-유도 배지를 함유하는 125ml의 배플 쉐이크 플라스크에서 배양하고 28℃ 및 200rpm에서 7일 동안 인큐베이션하였다. Trichoderma reesei RutC30는 대조구로서 수행하였다. 배양 브로스 샘플을 7일째에 이동시켰다. 각 배양 브로스의 1ml를 15,700 x g에서 5분 동안 마이크로-원심분리기에서 원심분리하고 상청액을 새로운 튜브로 이동시켰다. 효소 분석시까지 샘플을 4℃에 보관하였다. 기질로서 p-니트로페닐-베타-D-글루코피라노시드를 사용하여 하기 설명한 바와 같이 상청액을 베타-글루코시다아제 활성에 대하여 분석하였다.
50mM 숙시네이트 pH 5.0 중에 기질로서 0.5mg/ml p-니트로페닐-베타-D-글루코피라노시드의 200μl에서, 50mM 숙시네이트 pH 5.0에 1:10으로 희석된 배양 상청액의 25μl 분액을 사용하여 주위 온도에서 베타-글루코시다아제 활성을 결정하였다. 15분 인큐베이션 후, 100μl 1M Tris-HCl pH 8.0을 첨가하여 반응을 정지하고 405nm에서 분광광도로 흡광도를 판독하였다. 베타-글루코시다아제 활성의 하나의 유닛은 분당 리터당 pH 5.0, 주변 온도에서 1μmol p-니트로페닐의 생성에 상응하였다. Aspergillus niger 베타-글루코시다아제(NOVOZYM™ 188, Novozymes A/S, Bagsvaerd, Denmark)를 효소 표준으로서 사용하였다.
다수의 SMA135 형질전환주는 Trichoderma reesei RutC30에 의해 분비된 것 보다 수배 더 높은 베타-글루코시다아제 활성을 생성하였다. 선별된 SMA135 형질전 환주 중에서, 형질전환주 SMA135-04가 가장 높은 베타- 글루코시다아제 활성을 생성하였다.
CRITERION® 시스템(Bio-Rad, Hercules, CA, USA)과 함께 CRITERION® Tris-HCl(5% 용해) 겔(Bio-Rad, Hercules, CA, USA)을 사용하여 SDS-PAGE를 행하였다. 7일 상청액(상기 참조)의 5μl를 2X 농도의 Laemmli Sample Buffer(Bio-Rad, Hercules, CA, USA)에 현탁하고 5% 베타-메르캅토에탄올의 존재하에서 3분 동안 가열하였다. 상청액 샘플을 폴리아크릴아미드 겔로 로딩하고 러닝 버퍼로서 1X Tris/글리신/SDS(Bio-Rad, Hercules, CA, USA)을 가지고 전기영동을 행하였다. 얻어진 겔을 BIO- SAFE® 쿠마시 색소(Bio-Rad, Hercules, CA, USA)로 착색하였다.
SDS-PAGE에 의해 분석한 38 Trichoderma reesei SMA135 형질전환주 중에서, 26이 대조구로서 Trichoderma reesei RutC30에서 볼 수 없었던 약 110kDa의 단백질을 생성하였다. 형질전환주 Trichoderma reesei SMA135-04은 SDS-PAGE에 의해 목격된 풍부한 110 kDa 밴드에 의해 증명된 바와 같이, 가장 높은 수준의 베타-글루코시다아제를 생성하였다 .
실시예 7: 발현 벡터 pSMai140의 구성
Nco I으로 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 전장 암호화 영역(SEQ ID NO: 18의 아미노산 서열을 암호화하는 SEQ ID NO: 17)을 보유하는 플라스미드 pSATe111BG41을 분해함으로써 발현 벡터 pSMai140을 구성하였다(WO 04/099228). 얻어진 1243 bp 단편을 TAE 버퍼를 사용하는 1.0% 아가로스 겔 전기영동에 의해 분리하고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정 제하였다.
발현 벡터 pSMai135를 Nco I로 분해하고 8286 bp 단편을 TAE 버퍼를 사용하는 1.0% 아가로스 겔 전기영동에 의해 분리하고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다. 1243 bp Nco I 분해된 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 단편을 그 다음 T4 DNA 리가아제(Roche, Indianapolis, IN, USA)을 사용하여 제조자의 프로토콜에 따라 8286 bp 벡터 단편으로 라이게이션하여 발현 벡터 pSMai140를 생성하였다(도 10). 플라스미드 pSMai140는 Humicola insolens 엔도글루카나아제 V 신호 서열 및 Aspergillus oryzae 베타-글루코시다아제 변이체 성숙한 암호화 서열에 작동가능하게 결합된 Trichoderma reesei 셀로비오히드롤라아제 I(CEL7A) 유전자 프로모터 및 터미네이터를 포함한다.
실시예 8: pSMai140을 가지고 Trichoderma reesei RutC30의 형질전환
Pme I을 가지고 플라스미드 pSMai140을 선형화하고 실시예 6에 설명한 바와 같이 Trichoderma reesei RutC30 균주로 형질전환하였다. 총 100 형질전환주를 네번의 독립적인 형질전환 실험으로부터 얻었고, 이들 모두는 셀룰라아제-유도 배지 상의 쉐이크 플라스크에서 배양하였고, 베타-글루코시다아제 활성을 실시예 6에 설명한 바와 같이 형질전환주의 배양 배지로부터 측정하였다. 다수의 Trichoderma reesei SMA140 형질전환주는 Trichoderma reesei RutC30보다 수배 더 높은 베타-글루코시다아제 활성을 나타내었다.
실시예 6에 설명된 바와 같은 SDS-폴리아크릴아미드 겔 전기영동 및 효소 활 성을 분석하는 동일한 13 배양 상청액으로부터 쿠마시 착색에 의해 배양 배지 중에 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 단백질의 존재를 검출하였다. 높은 베타-글루코시다아제 활성을 갖는 모든 13개 형질전환주는 또한 다양한 수율로 대략 110KDa Aspergillus oryzae 베타-글루코시다아제 변이체 BG41를 발현하였다.
베타-글루코시다아제 활성 분석 및 SDS-폴리아크릴아미드 겔 전기영동에 의해 평가한 바와 같이, 최대 베타-글루코시다아제 변이체 발현 형질전환주는 Trichoderma reesei SMA140-43로 나타났다.
실시예 9: 발현 벡터 pSaMe-F1의 구성
209bp의 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 프로모터 및 Humicola insolens 엔도글루카나아제 V 유전자의 코어 영역(SEQ ID NO: 15의 뉴클레오티드 1 내지 702, SEQ ID NO: 16의 아미노산 1 내지 234를 암호화; WO 91/17243)을 함유하는 DNA 단편을, 주형으로서 pMJO5 및 하기 나타낸 프라이머를 사용하여 PCR 증폭하였다.
프라이머 995103:
5'-cccaagcttagccaagaaca-3' (SEQ ID NO: 99)
프라이머 995137:
5'-gggggaggaacgcatgggatctggacggc-3' (SEQ ID NO: 100)
증폭 반응물(50μl)은 1X Pfx 증폭 버퍼, 10mM dNTPs, 50mM MgSO4, 10ng/μl pMJ05, 50피코몰 995103 프라이머, 50피코몰 995137 프라이머 및 2유닛의 Pfx DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 30초, 55℃에서 30초 및 72℃에서 60초 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(3분 최종 확장).
반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 911 bp 산물 밴드가 겔로부터 제거되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
806bp Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 유전자를 함유하는 DNA 단편을, 주형으로서 pSMai140 및 하기 나타낸 프라이머를 사용하여 PCR 증폭하였다.
프라이머 995133:
5'-gccgtccagatccccatgcgttcctccccc-3' (SEQ ID NO: 101)
프라이머 995111:
5'-ccaagcttgttcagagtttc-3' (SEQ ID NO: 102)
증폭 반응물(50μl)은 1X Pfx 증폭 버퍼, 10mM dNTPs, 50mM MgSO4, 100ng pSMai140, 50피코몰 995103 프라이머, 50피코몰 995111 프라이머 및 2유닛의 Pfx DNA 폴리메라제로 이루어졌다. 반응물을 94℃에서 30초, 55℃에서 30초 및 72℃에서 120초 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다(3분 최종 확장).
반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 806bp 산물 밴드가 겔로부터 제거되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
그 다음 상기 두 PCR 단편을 오버래핑 PCR 수행하였다. 정제된 오버래핑 단편을, 상기 설명된 프라이머 995103(센스) 및 프라이머 995111(안티센스)를 사용하는 증폭을 위한 주형으로서 사용하여, 오버래핑 PCR에 의해 209bp Trichoderma reesei 셀로비오히드롤라아제 I 유전자 프로모터 및 Humicola insolens 엔도글루카나아제 V 코어 서열을 포함하는 702bp 단편을 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 암호화 영역의 일부를 포함하는 806 bp 단편에 정확하게 융합하였다.
증폭 반응물(50μl)은 1X Pfx 증폭 버퍼, 10mM dNTPs, 50mM MgSO4, 2.5μl의 각 단편(20ng/μl), 50피코몰 995103 프라이머, 50피코몰 995111 프라이머 및 2유닛의 고충실도 Pfx DNA 폴리메라제로 이루어졌다. 반응물을 95℃에서 3분의 초기 변성에 이어서 변성 1분, 60℃에서 아닐링 1분 및 72℃에서 3분 확장으로 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333에서 인큐베이션하였다.
반응 산물을 TAE 버퍼를 사용하여 1.0% 아가로스 겔 전기영동에 의해 분리하였고, 이때 1.7kb 산물 밴드가 겔로부터 절제되고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다.
1.7kb 단편을 pCR®4 Blunt 벡터(Invitrogen, Carlsbad, CA, USA)로 제조자 의 지시에 따라 라이게이션하였다. 그 다음 구조체를 ONE SHOT® TOP10 화학적 적격 E. coli 세포(Invitrogen, Carlsbad, CA, USA)로 제조자의 신속한 화학적 형질전환 과정에 따라 형질전환하였다. 군집을 선택하고 플라스미드 분리 및 Hind III 으로의 분해에 의해 분석하여 1.7kb 오버래핑 PCR 단편을 방출하였다.
또한 플라스미드 pSMai140를 Hind III으로 분해하여 플라스미드를 선형화하였다. 두 분해된 단편을 DNA 라이게이션 키트를 사용하여 제조자의 지시에 따라 라이게이션 반응으로 조합하여 pSaMe-F1를 생성하였다(도 11).
E coli XL1-블루 서브클로닝-등급 적격 세포(Stratagene, La Jolla, CA, USA)를 라이게이션 산물로 형질전환하였다. 구조체의 동일성을 형질전환된 E coli로부터 정제된 플라스미드로부터의 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 프로모터, Humicola insolens 엔도글루카나아제 V 신호 서열, Humicola insolens 엔도글루카나아제 V 코어, Humicola insolens 엔도글루카나아제 V 신호 서열, Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 및 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 터미네이터 서열의 DNA 시퀀싱에 의해 확인하였다. 재조합 플라스미드를 함유하는 하나의 클론은 pSaMe-F1으로 지정되었다. 플라스미드 pSaMe-F1는 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 프로모터 및 터미네이터, 및 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 성숙한 암호화 서열에 직접 연결된 Humicola insolens 엔도글루카나아제 V 신호 펩티드에 직접 융합된 Humicola insolens 엔도글루카나아제 V 코어 폴리펩티드에 직접 연결된 Humicola insolens 엔도글루카나아제 V 신호 펩티드 서열을 포함한다. Aspergillus oryzae 베타-글루코시다아제 변이체 BG 융합 단백질의 DNA 서열 및 연역 아미노산 서열을 각각 SEQ ID NO: 103 및 104에 나타낸다.
실시예 10: pSaMe-F1을 가지고 Trichoderma reesei RutC30 의 형질전환
2% 글루코스 및 10mM 유리딘이 보충된 YP 배지 25ml를 함유하는 쉐이크 플라스크를 Trichoderma reesei RutC30의 5 X 107 포자로 접종하였다. 27℃, 90rpm에서 대략 16시간 동안 밤새 인큐베이한 후, 균사체를 Vacuum Driven Disposable Filtration System을 사용하여 수집하였다. 균사체를 100ml 탈이온수에서 2회 및 1.2M 소르비톨에서 2회 세정하였다. 실시예 6에 설명한 바와 같이 원형질체를 발생시켰다.
Pme I으로 선형화된 pSaMe-F1 DNA의 2마이크로그램, 100μl Trichoderma reesei RutC30 원형질체 및 50% PEG(4000)을 혼합하고 실온에서 30분 동안 인큐베이션하였다. 그 다음 3ml STC를 첨가하고 성분들을 10 mM 유리딘 보충된 COVE 플레이트에 부었다. 그 다음 플레이트를 28℃에서 인큐베이션하였다. 형질전환주가 6일에 보이기 시작하였고 28℃에서 6일 성장을 위해 COVE2 플레이트로 수집하였다. 22 Trichoderma reesei 형질전환주를 회수하였다.
형질전환주를 셀룰라아제-유도 배지 상에서 쉐이크 플라스크에서 배양하였고, 실시예 6에 설명한 바와 같이 베타-글루코시다아제 활성을 측정하였다. 다수의 pSaMe-F1 형질전환주는 베타-글루코시다아제 활성을 생성하였다. Trichoderma reesei SaMeFI-9로 지정된 한 형질전환주는 최대량의 베타-글루코시다아제를 생성 하였고, Aspergillus oryzae 베타-글루코시다아제 변이체를 발현하는 균주의 활성의 두배이다(실시예 9).
Beguin, 1983, Analytical Biochem. 131(2): 333-336에 따라 카르복시메틸 셀룰로오스(CMC) 오버레이 분석을 사용하여 엔도글루카나아제 활성을 분석하였다. 브로스 샘플로부터 5개의 5μg 총 단백질(최대 베타-글루코시다아제 활성을 갖는 것)을 Native Sample Buffer(Bio-Rad, Hercules, CA, USA)로 희석하고 10X Tris/글리신 러닝 버퍼(Bio-Rad, Hercules, CA, USA)를 사용하여 CRITERION® 8-16% Tris-HCl 겔(Bio-Rad, Hercules, CA, USA) 상에서 실행한 다음 겔을 1% 카르복시메틸셀룰로오스(CMC)를 함유하는 플레이트의 상부에 두었다. 37℃에서 1시간 인큐베이션 후 겔을 0.1% 콩고 레드로 20분 동안 착색하였다. 그 다음 플레이트를 1M NaCl을 사용하여 탈색하여 엔도글루카나아제 활성의 명백한 표시의 영역을 식별하였다. 두개의 명백한 구역이 눈에 보이는데, 하나의 상단 구역은 110kDa 근처이며 하단 구역은 25kDa 근처이다. Humicola insolens 엔도글루카나아제 V 및 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 융합의 예상되는 단백질 크기는, 두 단백질이 분열되지 않고 단일 폴리펩티드로서 남아있고; 개별 엔도글루카나아제 V 코어 도메인의 글리코실화 및 베타-글루코시다아제의 글리코실화가 1차 서열로부터 예상되는 것보다 더 높은 mw에서 개별 단백질의 이동을 유발한다면, 118kDa이다. 두 단백질이 분열된다면 예상되는 Humicola insolens 엔도글루카나아제 V 코어 도메인의 크기는 24kDa이고 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41에 대해서는 94kDa이다. 110kDa에서 명백한 구역이 존재하므로 이 결과는 적어도 엔도글루카 나아제 및 베타-글루코시다아제 융합 단백질의 군집이 단일 대형 단백질로서 무손상으로 남아있다는 것을 나타내었다. 하부의 명백한 구역은 아마도 내인성 엔도글루카나아제 활성을 나타내며, 가능하게는 추가적으로 Aspergillus oryzae 베타-글루코시다아제로부터 Humicola insolens 엔도글루카나아제 V 코어 도메인의 부분 분열로부터 유래한다.
이 결과는 Humicola insolens 엔도글루카나아제 V 코어이 Aspergillus oryzae 베타-글루코시다아제에 결합되었더라도 활성이었다는 것을 입증하였다. 또한, 베타-글루코시다아제 활성 증가는 비융합 베타-글루코시다아제의 분비 효율에 비하여 증가된 단백질 분비에 기인하는 것으로 나타났다. Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 서열을 효율적으로 분비된 Humicola insolens 엔도글루카나아제 V 코어에 결합함으로써, 베타-글루코시다아제가 보다 많이 분비되었다.
실시예 11: 벡터 pSaMe-FX의 구성
pSaMe-F1을 변형시킴으로써 플라스미드 pSaMe-FX를 구성하였다. 플라스미드 pSaMe-F1을 Bst Z17 및 Eco R1으로 분해하여 베타-글루코시다아제 변이체 BG41 암호화 서열을 함유하는 1kb 단편 및 플라스미드의 나머지를 함유하는 9.2kb 단편을 발생시켰다. TAE 버퍼를 사용하는 1.0% 아가로스 겔 전기영동에 의해 단편을 분리하고 9.2kb 단편을 절제하고 QIAQUICK® 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다. 플라스미드 pSMai135 또한 Bst Z17 및 Eco R1으로 분해하여 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 암호화 서열에 상동인 염기를 함유하는 1kb 단편 및 플라스미드의 나머지를 함유하는 8.5 kb 단편을 발생시켰 다. 1kb 단편을 상기와 같이 분리하고 정제하였다.
9.2kb 및 1kb 단편을 Rapid DNA 라이게이션 키트를 사용하여 제조자의 지시에 따라 라이게이션 반응으로 조합하여 pSaMe-FX를 생성하였으며, 이것은 변이체 성숙한 암호화 서열보다는 야생형 베타-글루코시다아제 성숙한 암호화 서열을 함유한다는 것 이외에 pSaMe-F1과 동일하다.
E. coli SURE® 적격 세포(Stratagene, La Jolla, CA, USA)를 라이게이션 산물로 형질전환하였다. 형질전환된 E. coli로부터 정제된 플라스미드로부터의 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 프로모터, Humicola insolens 엔도글루카나아제 V 신호 서열, Humicola insolens 엔도글루카나아제 V 코어 서열, Humicola insolens 엔도글루카나아제 V 신호 서열, Aspergillus oryzae 베타-글루코시다아제 성숙한 암호화 서열 및 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 터미네이터 서열의 DNA 시퀀싱에 의해 구조체의 동일성을 확인하였다. 재조합 플라스미드를 함유하는 하나의 클론을 pSaMe-FX로 지정하였다(도 12). Aspergillus oryzae 베타-글루코시다아제 융합 단백질의 DNA 서열 및 연역 아미노산 서열을 각각 SEQ ID NO: 105 및 106에 나타낸다.
실시예 12: Trichoderma 형질전환주의 형질전환 및 발현
pSaMe-FX 구조체를 실시예 10에 설명한 바와 같이 Pme I으로 선형화하고 Trichoderma reesei RutC30 균주로 형질전환하였다. 총 63 형질전환주를 단일 형질전환으로부터 얻었다. 셀룰라아제-유도 배지 상에서 쉐이크 플라스크에서 형질전환주를 배양하고, 실시예 6에 설명한 바와 같이 베타-글루코시다아제 활성을 측정하 였다. 다수의 pSaMe-FX 형질전환주는 베타-글루코시다아제 활성을 생성하였다. 하나의 형질전환주 지정된 SaMe-FX16은 Trichoderma reesei SaMeF 1-9와 비교하여 두배량의 베타-글루코시다아제 활성을 생성하였다(실시예 10).
실시예 13: Trichoderma reesei 형질전환주의 분석
Humicola insolens 엔도글루카나아제 V 코어(그 자신의 천연 신호 서열을 함유)를 Humicola insolens 엔도글루카나아제 V 신호 서열에 연결된 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 성숙한 암호화 서열과 융합함으로써 실시예 9에 설명된 바와 같이 융합 단백질을 구성하였다. 이 융합 구조체는 Humicola insolens 엔도글루카나아제 V 신호 서열에 연결된 Aspergillus oryzae 베타-글루코시다아제 변이체 BG41 성숙한 암호화 서열에 비하여 두배의 베타-글루코시다아제 활성 분비를 야기하였다. 제2 융합 구조체는 Humicola insolens 엔도글루카나아제 V 신호 서열에 연결된 Aspergillus oryzae 야생형 베타-글루코시다아제 암호화 서열과 융합된 Humicola insolens 엔도글루카나아제 V 코어(그 자신의 신호 서열 함유)으로 구성되며 실시예 11에 설명한 바와 같이 제조되었고, 이는 베타-글루코시다아제 활성을 보다 더욱 개선시켰다. 야생형 융합으로 형질전환된 균주는 베타-글루코시다아제 변이체 BG41 융합으로 형질전환된 균주에 비하여 두배의 분비된 베타-글루코시다아제 활성을 갖는다.
실시예 14: 베타-글루코시다아제 융합 단백질 암호화 서열을 Aspergillus oryzae 발현 백터로 클로닝
하기 나타낸 두 합성 올리고뉴클레오티드 프라이머를 설계하여 베타- 글루코 시다아제 융합 단백질을 암호화하는 pSaMeFX로부터의 전장 개방 리딩 프레임을 PCR 증폭하였다.
PCR 순방향 프라이머:
5'-GGACTGCGCAGCATGCGTTC-3' (SEQ ID NO: 107)
PCR 역방향 프라이머:
5'-AGTTAATTAATTACTGGGCCTTAGGCAGCG-3' (SEQ ID NO: 108)
굵은 문자는 암호화 서열을 나타낸다. 순방향 프라이머 중의 밑줄친 "G"는 Sph I 제한 부위를 생성하도록 도입된 염기 변화를 나타낸다. 나머지 서열은 pSaMeFX의 삽입 부위에 비교하여 서열 동일성을 함유한다. 역방향 프라이머 중의 밑줄친 서열은 발현 벡터 pAILo2로의 클로닝을 용이하게 하기 위해 첨가된 Pac I 제한 부위를 나타낸다(WO 04/099228).
상기 프라이머 각각의 50피코몰을 최종 부피 50μl 중의 50ng pSaMeFX DNA, 1X Pfx 증폭 버퍼, dATP, dTTP, dGTP 및 dCTP의 10mM 배합물의 6μl, 2.5유닛의 PLATINUM® Pfx DNA 폴리메라제 및 50mM MgSO4 1μl을 함유하는 PCR 반응에 사용하였다. 98℃에서 2분 동안 1사이클; 96℃에서 30초 동안, 61℃에서 30초 동안, 및 68℃에서 3분 동안 각각 35 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333을 사용하여 단편을 증폭하였다. 35 사이클 후, 반응물을 68℃에서 10분 동안 인큐베이션한 후 다음 처리시까지 10℃에서 냉각하였다. 3.3kb PCR 반응 산물을 TAE 버퍼 및 ml당 0.1μg 에티듐 브로마이드를 사용하는 0.8% GTG-아가로스 겔(Cambrex Bioproducts One Meadowlands Plaza East Rutherford, NJ, USA) 상에서 분리하였다. DNA를 DARK READER™(Clare Chemical Research, Dolores, CO, USA)을 사용하여 가시화하여 UV-유도 돌연변이를 회피하였다. 3.3kb DNA 밴드를 일회용 면도날로 절제하고 ULTRAFREE®-DA 스핀 컵(Miilipore, Billerica, MA, USA)으로 제조자의 지시에 따라 정제하였다.
정제된 3.3kb PCR 산물을 pCR®4Blunt-TOPO® 벡터(Invitrogen, Carlsbad, CA, USA)로 클로닝하였다. 4마이크로리터의 정제된 PCR 산물을 1μl의 2M 염화나트륨 용액 및 1μl의 TOPO® 벡터와 혼합하였다. 반응물을 실온에서 15분 동안 인큐베이션한 다음 2μl 반응물을 사용하여 One Shot® TOP10 화학적 적격 E. coli 세포를 제조자의 지시에 따라 형질전환하였다. 형질전환 반응의 각 83μl의 3개 분획을 ml당 100μg 암피실린으로 보충된 3개의 150mm 2X YT 플레이트에 스프레드하고 37℃에서 밤새 인큐베이션하였다.
8개 재조합 군집을 사용하여 ml당 100μg 암피실린이 보충된 LB 배지 3ml를 함유하는 액체 배양액을 접종하였다. BIOROBOT® 9600(QIAGEN Inc., Valencia, CA, USA)을 사용하여 이들 배양액으로부터 플라스미드 DNA를 제조하였다. Pac I으로 제한 효소 분해에 의해 클론을 분석하였다. 각 클론으로부터의 플라스미드 DNA를 Pac I으로 분해하고, TAE 버퍼를 사용하는 1.0% 아가로스 겔 전기영동에 의해 분석하였다. 모든 8개 클론은 예상된 제한 분해 패턴을 가졌으며 클론 5, 6, 7 및 8을 시퀀싱하는데 선택하여 클로닝된 삽입 내에 돌연변이가 존재하지 않는다는 것을 확인하였다. 이들의 5' 및 3' 말단의 서열 분석은 모든 4개 클론이 정확한 서열을 가진다 는 것을 나타내었다. 다음 시퀀싱을 위해 클론 5 및 7를 선택하였다. 두 클론을 40을 초과하는 Phred Q값으로 시퀀싱하여 PCR 유도 오류가 없다는 것을 확보하였다. 클론 5 및 7은 예상된 서열을 가지는 것으로 나타났으며 클론 5를 선택하여 pAILo2으로 재-클로닝하였다.
클론 5로부터의 플라스미드 DNA를 Sph I로의 분해에 의해 선형화하였다. 그 다음 선형화된 클론에 dATP, dTTP, dGTP 및 dCTP의 10mM 배합물 1.2μl 및 6유닛의 T4 DNA 폴리메라제(New England Bioloabs, Inc., Ipswich, MA, USA)를 첨가하여 평활-말단화하였다. 혼합물을 12℃에서 20분 동안 인큐베이션한 다음 1μl의 0.5M EDTA를 첨가하고 75℃에서 20분 동안 가열하여 효소를 불활성화함으로써 반응을 정지하였다. 베타-글루코시다아제 융합 단백질을 암호화하는 3.3kb 단편을 상기 설명한 바와 같이 겔 전기영동 및 한외여과에 의해 정제하였다.
벡터 pAILo2를 Nco I으로의 분해에 의해 선형화하였다. 그 다음 dATP, dTTP, dGTP 및 dCTP의 10mM 배합물 0.5μl 및 1유닛의 DNA 폴리메라제 I을 첨가하여 선형화된 벡터를 평활-말단화하였다. 혼합물을 25℃에서 15분 동안 인큐베이션한 다음 1μl의 0.5M EDTA를 첨가하고 75℃에서 15분 동안 가열하여 효소를 불활성화함으로써 반응을 정지하였다. 그 다음 벡터를 Pac I으로 분해하였다. 평활-말단화된 벡터를 상기 설명한 바와 같이 겔 전기영동 및 한외여과에 의해 정제하였다.
베타-글루코시다아제 융합 단백질을 암호화하는 3.3kb 단편의 선형화되고 정제된 pAILo2 벡터로의 클로닝을 Rapid 라이게이션 키트로 행하였다. 1μl의 반응 샘플을 사용하여 제조자의 지시에 따라 E. coli XL10 SOLOPACK® Gold 세 포(Stratagene, La JoIIa, CA, USA)를 형질전환하였다. 회수 기간 후, 형질전환 반응으로부터의 두 100μl 분액을 ml당 100μg 암피실린 보충된 두 150mm 2X YT 플레이트로 플레이트하고 37℃에서 밤새 인큐베이션하였다. 8개 추정 재조합 클론의 세트를 선택 플레이트로부터 임의로 선택하고 BIOROBOT® 9600을 사용하여 각각으로부터 플라스미드 DNA를 제조하였다. 클론 1-4를 선택하여 pAILo2-특이적 서열로 시퀀싱하여 접합 벡터/삽입이 정확한 서열을 가졌다는 것을 확인하였다. 클론 3은 완전한 벡터/삽입 접합을 가졌으며 pAILo47으로 지정하였다(도 13).
마커-프리 발현 균주를 생성하기 위해서, 제한효소 엔도뉴클레아제 분해를 행하여 발현 구조체의 나머지로부터 항생물질 암피실린에 대한 내성을 부여하는 blaA 유전자를 분리하였다. pAILo47 30마이크로그램을 Pme I으로 분해하였다. 그 다음 분해된 DNA를 상기 설명한 바와 같이 아가로스 겔 전기영동으로 정제하였다. 발현 구조체를 함유하지만 blaA 유전자가 결핍인 6.4kb DNA 밴드를 면도날로 절제하고 QIAQUICK® 겔 추출 키트로 정제하였다.
실시예 15: Aspergillus oryzae JaL355에서 Humlcola Insolens/Asperglllus oryzae cel45Acore-cel3A 융합 유전자의 발현
Aspergillus oryzae JaL355(WO 00/240694) 원형질체를 Christensen et al, 1988, Bio/Technology 6: 1419-1422의 방법에 따라 제조하였다. 실시예 14의 정제된 발현 구조체의 10마이크로리터를 사용하여 Aspergillus oryzae Jal355 원형질체를 형질전환하였다. Aspergillus oryzae JaL355의 형질전환은 대략 90 형질전환주를 산출하였다. 50 형질전환주를 개별 PDA 플레이트로 분리하고 5일 동안 34℃에서 인큐베이션하였다.
48 유착성 포자 플레이트를 3ml 0.01% TWEEN® 80으로 세정하고 포자 현탁물을 사용하여 125ml 유리 쉐이크 플라스크에서 25ml MDU2BP 배지를 접종하였다. 형질전환주 배양액을 34℃에서 200rpm의 일정한 쉐이킹과 함께 인큐베이션하였다. 5일 후, 각 배양액의 1ml 분액을 12,000 x g으로 원심분리하고 이들의 상청액을 수집하였다. 각 상청액의 5μl을 동일한 부피의 2X 로딩 버퍼(10% 베타-메르캅토에탄올)와 혼합하고 1.5mm 8%-16% Tris-글리신 SDS-PAGE 겔로 로딩하고 BIO-SAFE® 쿠마시 블루 G250 단백질 색소(Bio-Rad, Hercules, CA, USA)로 착색하였다. 배양 브로스의 SDS-PAGE 프로파일은 48 중 33의 형질전환주가 예상된 118kDa에 매우 근접한 겉보기 분자량을 갖는 새로운 단백질을 발현할 수 있다는 것을 나타내었다. 형질전환주 21가 최고 수율로 제조되었고 다음 연구를 위해 선택하였다.
실시예 16: Aspergillus oryzae JaL355 형질전환주 21의 단일 포자 분리
Aspergillus oryzae JaL355 형질전환주 21 포자를 PDA 플레이트 상에 스프레드하고 5일 동안 34℃에서 인큐베이션하였다. 유착 포자 플레이트의 작은 면적을 0.5ml 0.01% TWEEN® 80으로 세정하여 포자를 재현탁하였다. 포자 현탁액의 100μl 분액을 0.01% TWEEN® 80로 0.5ml 최종 농도로 희석하였다. 혈구 측정기를 사용하여 포자 농도를 결정하고 마이크로리터당 0.1 포자의 최종 농도로 희석하였다. 포자 희석액의 200μl 분액을 150mm 최소 배지 플레이트에 스프레드하고 2-3일 동안 34℃에서 인큐베이션하였다. 발생한 군집을 플레이트로부터 제거하고 PDA 플레이트로 이동하고 3일 동안 34℃에서 인큐베이션하였다. 그 다음 포자를 플레이트에 걸 쳐서 스프레드하고 다시 5일 동안 34℃에서 인큐베이션하였다.
유착 포자 플레이트를 3ml 0.01% TWEEN® 80으로 세정하고 포자 현탁물을 사용하여 125ml 유리 쉐이크 플라스크에서 25ml MDU2BP 배지를 접종하였다. 단일-포자 배양액을 34℃에서 200rpm의 일정한 쉐이킹과 함께 인큐베이션하였다. 5일 후, 각 배양액의 1ml 분액을 12,000 x g으로 원심분리하고 이들의 상청액을 수집하였다. 각 상청액의 5μl을 동일한 부피의 2X 로딩 버퍼(10% 베타-메르캅토에탄올)와 혼합하고 1.5mm 8%-16% Tris-글리신 SDS-PAGE 겔로 로딩하고 BIO-SAFE® 쿠마시 블루 G250 단백질 색소로 착색하였다. 배양 브로스의 SDS-PAGE 프로파일은 모든 8개 형질전환주가 매우 높은 수준으로 베타-글루코사다아제 융합 단백질을 발현할 수 있었다는 것을 나타내었고 Aspergillus oryzae JaL355AlLo47 지정된 배양액 중 하나는 최고 수율을 생성하였다.
실시예 17: pCW087의 구성
하기 나타낸 두 합성 올리고뉴클레오티드 프라이머를 설계하여 플라즈마 pDZA2-7로부터 Thermoascus aurantiacus GH61A 폴리펩티드 유전자를 PCR 증폭하였다(WO 2005/074656). 순방향 프라이머는 평활한 5' 말단으로 되고 역방향 프라이머는 3' 말단에서 Pac I 부위를 조합한다.
순방향 프라이머:
5'-ATGTCCTTTTCCAAGATAATTGCTACTG-3' (SEQ ID NO: 109)
역방향 프라이머:
5'-GCTTAATTAACCAGTATACAGAGGAG-3' (SEQ ID NO: 110)
상기 프라이머 각각의 50피코몰을 최종 부피 50μl 중의 50ng pDZA2-7, dATP, dTTP, dGTP 및 dCTP의 10mM 배합물 1μl, 1OX ACCUTAQ™ DNA 폴리메라제 버퍼(Sigma-Aldrich, St. Louis, MO, USA) 5μl, 및 5유닛의 ACCUTAQ™ DNA 폴리메라제(Sigma-Aldrich, St. Louis, MO1 USA)로 구성된 PCR 반응에 사용하였다. 95℃에서 3분 동안 1사이클; 94℃에서 45초 동안, 55℃에서 60초 동안, 및 72℃에서 1분 30초 동안 각각 30 사이클로 프로그램된 EPPENDORF® MASTERCYCLER® 5333을 사용하여 DNA 단편을 증폭하였다. 25 사이클 후, 반응물을 72℃에서 10분 동안 인큐베이션한 다음 다음 처리시까지 4℃에서 냉각하였다. Thermoascus aurantiacus GH61A PCR 단편의 3' 말단을 Pac I을 사용하여 분해하였다. 분해 산물을 MINELUTE™ 반응 클린업 키트(QIAGEN Inc., Valencia, CA1 USA)를 사용하여 제조자의 지시에 따라 정제하였다.
평활한 Nco I 부위를 사용하여 5' 말단에서 그리고 Pac I 부위를 사용하여 3' 말단에서 GH61A 단편을 pSMai155으로 직접 클로닝하였다(WO 2005/074647). 플라스미드 pSMai155를 Nco I 및 Pac I로 분해하였다. 그 다음 Nco I 부위를 Klenow 효소를 사용하여 평활하게 하여 5' 리세스된 Nco I 부위를 채웠다. Klenow 반응은 20μl pSma155 분해 반응 혼합 플러스 1mM dNTPs 및 1μl Klenow 효소로 구성되었으며 이것을 실온에서 짧게 인큐베이션하였다. 새롭게 선형화된 pSMai155 플라스미드를 MINELUTE™ 반응 클린업 키트를 사용하여 제조자의 지시에 따라 정제하였다. 이들 반응은 새롭게 발생된 GH61A 단편에 융화가능한 5' 평활 말단 및 3' Pac I 부위를 생성하였다. 그 다음 Rapid DNA 라이게이션 키트(Roche, Indianapolis, IN, USA)을 사용하여 제조자의 지시에 따라 GH61A 단편을 pSMai155 발현 벡터로 클로닝하였다. E. coli XL1-Blue 2차배양-등급 적격 세포(Stratagene, La Jolla, CA, USA)를 라이게이션 산물로 형질전환하였다. 형질전환된 E. coli로부터 정제된 플라스미드로부터 GH61A 암호화 서열의 DNA 시퀀싱에 의해 구조체의 동일성을 확인하였다. 재조합 플라스미드를 함유하는 하나의 E. coli 클론은 pCW087-8로 지정되었다.
실시예 18: pSaMe-Ta61A의 구성
플라스미드 pMJ09를 분해함으로써 발현 벡터 pSaMe-Ta61을 구성하였으며(WO 2005/056772), 이는 amdS 선택가능 마커를 2.7kb amdS 단편을 유리시키는 Nsi I와 함께 보유한다. 그 다음 2.7kb amdS 단편을 TAE 버퍼를 사용하는 1.0% 아가로스 겔 전기영동으로 분리하고 QIAQUICK® 겔 추출 키트를 사용하여 정제하였다.
발현 벡터 pCW087을 Nsi I로 분해하고 4.7kb 단편을 TAE 버퍼를 사용하는 1.0% 아가로스 겔 전기영동으로 분리하고 QIAQUICK® 겔 추출 키트를 사용하여 정제하였다. 그 다음 2.7kb amdS 단편을 T4 DNA 리가아제(Roche, Indianapolis, IN, USA)를 사용하여 제조자의 프로토콜에 따라 4.7kb 벡터 단편으로 라이게이션하여 발현 벡터 pSaMe-Ta61A를 생성하였다. 플라스미드 pSaMe-Ta61A는 Thermoascus aurantiacus GH61A 성숙한 암호화 서열에 작동가능하게 결합된 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A) 유전자 프로모터 및 터미테이터를 포함한다.
실시예 19: Trichoderma reesei 균주 SaMe-MF268의 구성
동시-형질전환을 사용하여 플라스미드 pSaMe-FX 및 pSaMe-Ta61A를 Trichoderma reesei RutC30으로 도입하였다. 플라스미드 pSaMe-FX 및 pSaMe-Ta61A 를 PEG-매개 형질전환에 의해 Trichoderma reesei RutC30으로 도입하였다(상기 Penttila et al., 1987). 각 플라스미드는 형질전환주를 단일 질소원으로서 아세트아미드 상에서 성장시킬 수 있도록 Aspergillus nidulans amdS 유전자를 함유하였다.
Trichoderma reesei RutC30를 27℃ 및 90rpm에서 2%(w/v) 글루코스 및 10mM 유리딘이 보충된 25ml YP 배지에서 17시간 동안 배양하였다. Vacuum Driven Disposable Filtration System을 사용하여 여과에 의해 균사체를 수집하고 탈이온수로 2회 1.2M 소르비톨로 2회 세정하였다. 세정한 균사체를 ml당 15mg GLUCANEX®(Novozymes A/S, Bagsvasrd, Denmark) 및 ml당 0.36유닛의 키티나제(Sigma Chemical Co., St. Louis, MO, USA)를 함유하는 20ml의 1.2M 소르비톨에 현탁시키고 15-25분 동안 34℃에서 90rpm에서의 가벼운 쉐이킹과 함께 배양시킴으로써 원형질체를 발생시켰다. 원형질체를 7분 동안 400 x g에서 원심분리에 의해 수집하고 차가운 1.2M 소르비톨로 2회 세정하였다. 원형질체를 혈구 측정기를 사용하여 계수하고 ml당 1 X 108 원형질체의 최종 농도로 STC에 재현탁하였다. 과잉의 원형질체를 Cryo 1℃ 냉동 용기(Nalgene, Rochester, NY1 USA)에 -80℃에서 보관하였다.
대략 4μg의 각 플라스미드 pSaMe-FX 및 pSaMe-Ta61A을 Pme I으로 분해하여 항생물질 내성 마커, ampR의 제거를 용이하게 하였다. Pme I로의 분해 후에 선형 단편을 TAE 버퍼를 사용하는 1% 아가로스 겔 상에서 수행하여 여러 단편을 분리하였다. pSaMe-FX으로부터 7.5kb 단편 및 pSaMe-Ta61A로부터 4.7 kb 단편을 겔 밖으 로 절단하고 QIAquick 겔 추출 키트를 사용하여 제조자의 지시에 따라 정제하였다. 이들 정제된 단편은 amdS 선택가능 마커 카세트, Trichoderma reesei chb1 유전자 프로모터 및 터미네이터를 함유하며; 추가적으로 단편은 Humicola insolens EGV 코어/Aspergillus oryzae BG 융합 암호화 서열 또는 T. aurantiacus GH61A 암호화 서열을 포함한다. ampR 단편을 이 겔 정제 단계에 의해 제거함에 따라 형질전환에 사용되는 단편은 항생물질 내성 마커를 함유하지 않았다. 그 다음 정제된 단편을 100μl 원형질체 용액에 첨가하고 가볍게 혼합한 후, 260μl PEG 버퍼를 혼합하고 실온에서 30분 동안 인큐베이션하였다. 그 다음 STC(3ml)를 첨가하고 혼합하고 형질전환 용액을 amdS 선택을 사용하는 COVE 플레이트로 플레이트하였다. 플레이트를 28℃에서 5-7일 동안 인큐베이션하였다. 형질전환주를 COVE2 플레이트로 2차 배양하고 28℃에서 성장시켰다.
400 이상의 형질전환주를 아세트아미드를 함유하는 신선한 플레이트로 2차 배양하고 7일 동안 28℃에서 포자형성하도록 하였다.
Trichoderma reesei 형질전환주를 pH 6.0에서 형질전환주의 포자로 접종되고 28℃ 및 200rpm에서 5일 동안 인큐베이션된 셀룰라아제-유도 배지 25ml를 함유하는 125ml 배플 쉐이크 플라스크에서 배양하였다. Trichoderma reesei RutC30를 대조구로서 수행하였다. 배양 브로스 샘플을 5일째에 제거하였다. 각 배양 브로스의 1ml를 15,700 x g에서 5분 동안 마이크로-원심분리기에서 원심분리하고 상청액을 새로운 튜브로 이동시켰다.
CRITERION® Tris-HCl(5% 용해) 겔을 사용하여 CRITERION® 시스템으로 SDS- PAGE를 행하였다. 5일 상청액(상기 참조) 5μL를 2X 농도의 Laemmli Sample Buffer(Bio-Rad, Hercules, CA, USA)에 현탁하고 5% 베타-메르캅토에탄올의 존재하여 3분 동안 가열하였다. 상청액 샘플을 폴리아크릴아미드 겔로 로딩하고 러닝 버퍼로서 1X Tris/글리신/SDS(Bio-Rad, Hercules, CA, USA)을 가지고 전기영동을 행하였다. 얻어진 겔을 BIO-SAFE® 쿠마시 색소로 착색하였다. SDS-PAGE 겔 상의 밴드의 가시화에 의해 목격되는 바와 같이 Thermoascus aurantiacus GH61 A 폴리펩티드 및 Aspergillus oryzae 베타-글루코시다아제와 융합된 Humicola insolens 엔도글루카나아제 V 코어 (Cel45A)로 구성된 융합 단백질 모두의 발현을 나타내는 형질전환주를 PCS 가수분해 반응에서 테스트하여 최고 가수분해 브로스를 생성하는 균주를 식별하였다.
실시예 20: Trichoderma reesei 균주 SaMe - MF268 의 식별
Thermoascus aurantiacus GH61A 폴리펩티드 및 Aspergillus oryzae 베타-글루코시다아제 융합 단백질 모두의 발현을 나타내는 형질전환주를 pH 6.0에서 형질전환주의 포자로 접종되고 28℃ 및 200rpm에서 5일 동안 인큐베이션된 셀룰라아제-유도 배지 25ml를 함유하는 125ml 배플 쉐이크 플라스크에서 배양하였다.
쉐이크 플라스크 배양 브로스를 가수분해 전에 6000 x g으로 원심분리하고 STERICUP™ EXPRESS™(Millipore, Bedford, MA, USA)을 사용하여 0.22μm으로 여과하였다. 배양 브로스의 활성을, PCS를 가수분해하고 그들의 환원 말단의 화학적 분석에 의해 검출가능한 당을 생성하는 능력에 의해 측정하였다.
국립 재생 에너지 연구소(NREL) 미국 부서, Boulder, CO, USA에서 희석된 황 산을 사용하여 옥수수대를 전처리하였다. 전처리에 하기 조건을 사용하였다: 0.048g 황산/g 건조 바이오매스 19O℃ 및 25% w/w 건조 고체로 약 1분 동안. 전처리된 옥수수대(PCS) 중의 수불용성 고체는 글루코스 및 셀로비오스를 방출하기 위한 PCS의 제한 분해에 의해 결정된 바와 같이 59.2% 셀룰로오스를 함유한다. 효소적 가수분해 전에, PCS를 대량의 두배 탈이온수로 세정하였고; 수세된 PCS의 건조중량은 17.73%으로 발견되었다.
1kg 양의 PCS를 대략 20리터의 두배 탈이온수에 현탁하고, PCS를 가라앉히고 물을 디캔팅하였다. 이것을 세정수가 pH 4.0 이상일 때까지 반복하였고, 이때 환원당은 리터당 0.06g 미만이었다. 적은 부피 분석을 위해서(예컨대 1ml) 가라앉은 슬러리를 100메쉬 체로 걸러서 피펫을 사용할 수 있도록 하였다. 샘플을 105℃ 오븐에서 적어도 24시간 동안 건조하고(일정한 중량까지) 습중량과 비교함으로써 세정된 PCS의 퍼센트 건중량 함량을 결정하였다.
PCS 가수분해를 ALPS 300™ 자동 랩 플레이트 밀봉제(ABgene Inc., Rochester, NY, USA)로 가열 밀봉된 96-딥-웰 플레이트(Axygen Scientific)에서 1ml 부피로 행하였다. PCS 농도는 50mM 아세트산나트륨 pH 5.0에서 리터당 10g이었다. 설명한 바와 같이 샘플링 동안을 제외하고 추가의 교반 없이 PCS 가수분해를 5O℃에서 행하였다. 각 반응을 3회로 행하였다. 방출된 환원당을 하기 설명한 바와 같이 p-히드록시 벤조산 히드라지드(PHBAH) 시약으로 분석하였다.
0.8ml 부피의 PCS(물에서 리터당 12.5g)를 96-딥-웰 플레이트의 각 웰에 피펫팅하고 0.10ml 0.5M 아세트산나트륨 pH 5.0 및 그 다음 0.10ml 희석된 효소 용 액을 피페팅하여 1.0ml의 최종 반응 부피 및 리터당 10g PCS 농도로 반응을 시작하였다. 플레이트를 밀봉하였다. 가수분해 시작시 및 각 샘플 시점을 취하기 전에 딥-웰 플레이트를 반전시킴으로써 반응 혼합물을 혼합하였다. 각 샘플 시점에서 플레이트를 혼합한 다음 딥-웰 플레이트를 2000rpm에서 10분 동안 원심분리한 후(Sorvall RT7 with RTH-250 로터) 20μl 가수분해물(상청액)을 이동시키고 180μl 0.4% NaOH을 96-웰 마이크로플레이트에 첨가하였다. 필요한 경우 이 정지 용액을 적절한 범위로 더 희석하였다. 방출된 환원당을 파라-히드록시 벤조산 히드라지드 시약(PHBAH, Sigma, 4-히드록시 벤질히드라지드)으로 분석하고: 50μl PHBAH 시약(1.5%)을 V-형 바닥 96-웰 THERMOWELL™ 플레이트(Costar 6511)에서 100μl 샘플과 혼합하고, 95℃의 플레이트 가열 블록 상에서 10분 동안 인큐베이션한 다음, 50μl 두배 탈이온수를 각 웰에 첨가하하고, 혼합하고, 100μl을 다른 편평한 바닥의 96-웰 플레이트(Costar 9017)로 이동시키고 410nm에서 흡광도를 판독하였다. 동일한 조건하에서의 셀룰로오스 검정곡선을 사용하여 환원당을 산출하였다. 환원당에 대한 셀룰로오스의 전환 퍼센트를 하기와 같이 산출하였다:
전환 %= 환원당(mg/ml)/(첨가한 셀룰로오스(mg/ml) x 1.11)
인자 1.11은 셀룰로오스의 글루코스로의 가수분해에서 중량 증가를 보정한다.
1ml PCS 가수분해 테스트 후, 상부 후보물질을 2리터 배양기에서 중복 성장시켰다.
쉐이크 플라스크 배지는 리터당 20g 덱스트로스, 10g 옥수수대 고체, 1.45g (NH4)2SO4, 2.08g KH2PO4, 0.36g CaCl2, 0.42g MgSO4-7H2O 및 0.42ml 미량 금속 용액으로 이루어졌다. 미량 금속 용액은 리터당 216g FeCl3-6H2O, 58g ZnSO4-7H2O, 27g MnSO4·H20, 10g CuSO4·5H2O, 2.4g H3BO3, 및 336g 시트르산으로 이루어졌다.
쉐이크 플라스크 배지의 10ml를 500ml 쉐이크 플라스크에 첨가하였다. 쉐이크 플라스크를 고체 플레이트 배양으로부터 두 플러그로 접종하고 28℃에서 오비탈 쉐이커 상에서 200rpm에서 48시간 동안 인큐베이션하였다. 50ml 쉐이크 플라스크 브로스를 사용하여 3리터 발효 용기를 접종하였다.
발효 배치 배지는 리터당 30g 셀룰로오스, 4g 덱스트로스, 10g 옥수수대 고체, 3.8g (NH4)2SO4, 2.8g KH2PO4, 2.64g CaCl2, 1.63g MgSO4·7H20, 1.8ml 소포제, 및 0.66ml 미량 금속 용액으로 이루어졌다. 미량 금속 용액은 리터당 216g FeCl3·6H2O, 58g ZnSO4·7H2O, 27g MnSO4·H2O, 10g CuSO4·5H2O, 2.4g H3BO3, 및 336g 시트르산으로 이루어졌다. 발효 공급 배지는 덱스트로스 및 셀룰로오스로 이루어졌다.
총 1.8리터 발효 배치 배지를 3리터 발효기에 첨가하였다. 발효 공급 배지는 165시간 동안 0 내지 4g/l/hr 속도로 투여되었다. 발효 용기를 28℃ 온도에서 유지하고 pH를 4.75 +/- 0.1의 세트-포인트로 제어하였다. 용기에 1vvm의 속도로 공기를 가하고 1100 내지 1300rpm으로 회전하는 Rushton 임펠러로 브로스를 교반하였다. 배양의 마지막에 전체 브로스를 용기로부터 수확하고 3000rpm x g에서 원심분리하여 바이오매스를 제거하였다. 상청액을 멸균 여과하고 35 내지 40℃에서 보관 하였다.
하기 설명하는 바와 같이 총 단백질 농도를 결정하고 50g PCS 가수분해 반응에서 브로스를 재테스트하였다. 각 실험 전에 스톡 효소 용액으로부터 신선한 효소 희석액을 제조하였고, 이를 4℃에 보관하였다.
총 반응 질량 50g을 사용하여 NREL Laboratory Analytical Protocol #008에 따라 125ml 나선형-뚜껑의 Erlenmeyer 플라스크(VWR, West Chester, PA, USA)를 사용하여 PCS의 가수분해를 행하였다. 이 프로토콜에서 2리터 발효 브로스 샘플의 상이한 단백질 로딩(셀룰로오스 그램당 단백질의 mg으로 표시됨)을 사용하여 PCS(대략 PCS에서 11.4% 및 수성 50mM 아세트산나트륨 pH 5.0 버퍼에서 6.8% 셀룰로오스) 가수분해를 행하였다. PCS 가수분해 성능 테스트를 50℃에서 150rpm에서 오비탈 쉐이킹과 함께 INNOVA℃ 4080 인큐베이터(New Brunswick Scientific, Edison, NJ, USA)를 사용하여 행하였다. 가수분해 과정 동안 72, 120 및 168시간에 분액을 취하고 원심분리하고, MULTISCREEN® HV 0.45μm 멤브레인(Millipore, Billerica, MA, USA)을 사용하여 2000rpm에서의 원심분리에 의해 10분 동안 SORVALL® RT7 플레이트 원심분리기(Thermo Fisher Scientific, Waltham, MA, USA)를 사용하여 상청액을 여과하였다. 즉시 사용하지 않는 경우, 여과된 당 분액을 -20℃에서 냉동시켰다. 0.005M H2SO4에 희석된 샘플의 당 농도를, 순수한 당 샘플에 의해 조정된 CHEMSTATION® AGILENT® 1100 HPLC(Agilent Technologies, Santa Clara, CA, USA)를 사용하여 굴절률 검출로부터 글루코스 및 셀로비오스 신호의 통합에 의한 정량 과 함께 65℃에서 4.6 x 250 mm AMINEX® HPX-87H 컬럼(Bio-Rad, Hercules, CA, USA)으로부터 분당 0.4ml의 유속으로 0.005M H2SO4 의한 용리 후 측정하였다. 결과 등량을 사용하여 각 반응의 셀룰로오스 전환의 백분율을 산출하였다.
글루코스 플러스 셀로비오스 당에 대한 셀룰로오스 전환도(전환율, %)를 하기 식을 사용하여 산출하였다:
전환율(%) = (글루코스 + 셀로비오스 x 1.053)(mg/ml) x 100 x 162 / (셀룰로오스 (mg/ml)x 180) =
(글루코스+셀로비오스 x 1.053)(mg/ml) x 100/(셀룰로오스(mg/ml) x 1.111 )
이 식에서 인자 1.111은 셀룰로오스의 글루코스로의 전환에서 중량 증가를 반영하며, 인자 1.053은 셀로비오스의 글루코스로의 전환에서 중량 증가를 반영한다.
상기 설명한 50g 플라스크 분석에서 PCS 가수분해 반응의 결과를 표 1에 나타낸다. 최대 이행 브로스를 생성하는 하나의 균주를 Trichoderma reesei SaMe-MF268로 지정하였다.
Figure 112009076188430-PCT00001
실시예 21: 벡터 pSaMe-FH의 구성
플라스미드 pSMai155(WO 2005/074647) 및 플라스미드 pSaMe-FX(실시예 11)를 Bsp 1201 및 Pac I로 분해하여 발현 벡터 pSaMe-FH(도 14)를 구성하였다. pSMai155로부터 5.5kb 단편 및 pSaMeFX로부터의 3.9kb 단편을 1.0% 아가로스 겔 전기영동에 의해 TAE 버퍼를 사용하여 분리하고 QIAQUICK® 겔 추출 키트를 사용하여 정제하였다. 그 다음 두 단편을 T4 DNA 리가아제를 사용하여 제조자의 프로토콜에 따라 라이게이션하였다. E. coli SURE® 적격 세포를 라이게이션 산물로 형질전환하였다. 형질전환된 E. coli로부터 정제된 플라스미드로부터 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 프로모터, Humicola insolens 엔도글루카나아제 V 신호 서열, Humicola insolens 엔도글루카나아제 V 코어 서열, Humicola insolens 엔도글루카나아제 V 신호 서열, Aspergillus oryzae 베타-글루코시다아제 성숙한 암호화 서열 및 Trichoderma reesei 셀로비오히드롤라아제 I 유전자 터미네이터 서열의 DNA 시퀀싱에 의해 구조체의 동일성을 확인하였다. 재조합 플라스미드를 함유하는 하나의 클론을 pSaMe-FH로 지정하였다. 플라스미드 pSaMe-FH는 Humicola insolens Cel45A 코어/Aspergillus oryzae 베타-글루코시다아제의 유전자 융합에 작동가능하게 연결된 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A) 유전자 프로모터 및 터미네이터를 포함한다. 플라스미드 pSaMe-FH는 amdS 선택가능 마커가 제거되었고 하이그로마이신 내성 선택가능 마커로 대체된 것을 제외하고 pSaMe-FX와 동일하다.
실시예 22: 셀룰라아제 생성이 증가되고 전처리된 옥수수대(PCS) 분해능이 증진된 Trichoderma reesei SMA135-04의 돌연변이의 분리
셀룰로오스 가수분해 효소 분석 및 플레이트 선택을 위한 셀룰로오스 기질로서 PCS(실시예 20)를 사용하였다. 분석 전에, PCS를 대량의 탈이온수로 여과액 pH가 pH 4.0 보다 클 때 까지 세정하였다. 또한, 100MF 금속 필터를 사용하여 PCS를 선별하여 입자를 제거하였다. 세정 및 여과된 PCS를 60mg/ml 현탁액의 농도로 증류수에 재현탁하고, 4℃에 보관하였다.
Trichoderma reesei 균주 SMA135-04(실시예 6)를 N-메틸-N-니트로-N-니트로소구아니딘(NTG)(Sigma Chemical Co., St. Louis, MO1 USA), 주요 염기 치환 및 일부 결실을 유도하는 화학적 돌연변이원으로 돌연변이 유발 처리하였다(Rowlands, 1984, Enzyme Microb. Technol. 6: 3-10). 일정한 노출 시간 및 다양한 NTG 투여, 및 일정한 NTG 농도 및 상이한 노출시간으로 생존 곡선을 행하여 10%의 생존 수준을 얻었다. 이 생존률을 얻기 위해서, 코니디아 현탁물을 0.2mg/ml NTG로 20분 동안 37℃에서 가벼운 회전과 함께 처리하였다. 코니디아를 NTG로 처리하지 않은 대조구로 각 실험을 행하였고, 이는 비-돌연변이유발 배양에 걸쳐서 돌연변이의 경쟁적 성장에 대한 대조구로서 기능하였다.
NTG 처리후 1차 돌연변이 선택을 행하였다. 돌연변이 유발이 생존한 총 8 x 106 코니디아를 0.5% 펩톤, 0.1% 트리톤 X-100 및 1.5g 한천을 함유하는 30ml 맨델 배지에 혼합하였다. 그 다음 이 현탁물을 깊은 플레이트(직경 150mm 및 깊이 25mm; Corning Inc, NY, USA)에 첨가하고 한천을 실온에서 경화시켰다. 한천의 경화 후, 0.5% 펩톤, 0.1% 트리톤 X-100, 1.5% 한천 및 1.0% PCS를 함유하는 맨델 배지 200ml를 첨가하였다. 한천의 경화 후 플레이트를 28℃에서 인큐베이션하였다. 3-5일 인큐베이션 후, 미처리 대조 균주 전에 PCS 선택층을 통과한 700 군집을 2차 선택에 사용하였다.
2차 선택을 위해서, 각 분리체로부터 코니디아의 세 백금이량(loopful)을 25ml 셀룰라아제-유도 배지를 함유하는 125ml 쉐이크 플라스크에 첨가하고 28℃ 및 200rpm에서 5일 동안 인큐베이션하여 셀룰라아제의 발현 및 분비를 유도하였다. 각 배양 브로스의 1ml를 400 x g에서 5분 동안 마이크로-원심분리기에서 원심분리하고 상청액을 PCS의 가수분해 활성 및 총 단백질 수율에 대하여 분석하였다.
쉐이크 플라스크 브로스 샘플을 50mM 아세트산나트륨 pH 5.0에 1:20으로 희석하여 "로보틱" PCS 가수분해 분석을 행하였다. 희석된 샘플을 희석전 PCS의 g당 400μl 샘플로 분석 플레이트(96-웰 편평한-바닥 플레이트)에 첨가하였다. BIOMEK® FX(Beckman Coulter, Fullerton, CA)를 사용하여 PCS를 리터당 10g PCS로 첨가하고 이어서 180μl 최종 부피로 50mM 아세트산나트륨 pH 5.0을 첨가하였다. 분석 플레이트를 5일 동안 30℃에서 250rpm으로 쉐이킹되는 습윤 박스에서 인큐베이션하였다. 분석의 통계 정밀도를 높이기 위해서, 각 샘플에 대하여 6회 반복으로 행하였다. 그러나, 1:20 샘플 희석에 대해서 2회 반복으로 행하였다. 5일 인큐베이션 후, 가수분해된 PCS 샘플 중의 환원당(RS)의 농도를 PHBAH 분석을 사용하여 측정하였는데, 이것은 96-웰 마이크로플레이트 포맷에 대하여 변형되고 적합화되었다. ORCA™ 로봇(Beckman Coulter, Fullerton, CA, USA)을 사용하여, 성장 플레이트를 BIOMEK® FX로 운반하고 9μl 브로스 샘플을 분석 플레이트로부터 제거하고 96-웰 V-형 바닥 플레이트(MJ Research, Waltham, MA, USA)로 분액하였다. 2% 수산화나트륨 중 0.533% PHBAH의 135μl을 첨가하여 반응을 개시하였다. 각 분석 플레이트를 TETRAD® Thermal Cycler(MJ Research, Waltham, MA, USA) 상에서 10분 동안 95℃에서 가열하고 실온으로 냉각하였다. 인큐베이션 후, 40μl 반응 샘플을 160μl 탈이온수로 희석하고 96-웰 편평한 바닥 플레이트로 이동하였다. 그 다음, SPECTRAMAX® 250(Molecular Devices, Sunnyvale, CA)을 사용하여 405nm 흡광도에 대하여 샘플을 측정하였다. A405 값은 6개 글루코스 표준(0.000, 0.040, 0.800, 0.120, 0.165 및 0.200 mg/ml의 탈이온수)으로 발생한 표준 곡선을 사용하여 글루코스 등가물로 번역되었으며, 샘플과 유사하게 처리하였다. 표준 곡선에 대한 평균 상관 계수는 0.98 보다 컸다. 환원당에 대한 셀룰로오스 전환율(RS 수율, %)을 실시예 20에 설명된 식을 사용하여 산출하였다.
비신코닌산(bicinchoninic acid)(BCA) 분석을 사용하여 총 단백질 수율을 측정하였다. 샘플을 물에 1:8로 희석하여 농도를 적절한 범위로 하였다. 2.0mg/ml 농도에서 0.25mg/ml 농도까지 다양한 범위로 알부민 표준(BSA)을 물에 희석하였다. BIOMEK® FX를 사용하여, 표준을 포함하는 각 희석액의 총 20μl를 96-웰 평면 바닥 플레이트로 이동하였다. BCA 기질 용액(BCA 단백질 분석 키트, Pierce, Rockford, IL, USA)의 200마이크로리터를 각 웰에 첨가한 다음 37℃에서 45분 동안 인큐베이션하였다. 인큐베이션의 종료시, SPECTRAMAX® 250을 사용하여 96-웰 플레이트에 대하여 562nm의 광학 밀도를 얻었다. 마이크로소프트 엑셀(Microsoft Corporation, Redmond, WA)에 의해 발생된 표준 곡선으로부터의 외삽에 의해 샘플 농도를 결정하였다.
선택한 1차 분리체 중에서, 20개는 균주 SMA135-04로부터의 브로스와 비교했을 때 향상된 PCS의 가수분해 활성을 나타내는 브로스를 생성하였다. 이들 분리체는 모체 균주에 비하여 5-15% 높은 수준의 환원당을 생성할 수 있는 셀룰로오스 가수분해 브로스를 생성하였다. 일부 분리체, 예컨대 SMai-M104는 부피 브로스당 셀룰로오스 PCS의 향상된 가수분해 성능을 나타내었으며, 추가적으로 높은 수준의 총 단백질을 분비하였다.
발효에 의해 생성된 브로스의 셀룰라아제 성능을 평가함으로써 최적 이행 Trichoderma reesei 돌연변이 균주, SMai-M104의 선택을 결정하였다. 실시예 20에 설명한 바와 같이 7일 동안 발효를 행하였다. 발효 샘플을 나선형 뚜껑이 있는 125-ml Erlenmeyer 플라스크(VWR, West Chester, PA, USA) 중의 50g PCS 가수분해에서 테스트하였다. 반응 조건은: 셀룰로오스 로딩 6.7%; 효소 로딩 6 및 12mg/g 셀룰로오스; 총 반응물 50g; 5O℃ 및 pH 5.0을 포함한다. 이 실험을 시작하기 위해서, 각 쉐이크 플라스크 및 뚜껑을 칭량하고 원하는 양의 PCS를 쉐이크 플라스크에 첨가하고 총 중량을 기록하였다. 10ml 증류수를 각 쉐이크 플라스크에 첨가한 다음 모든 쉐이크 플라스크를 30분 동안 121℃에서 오토클레이빙하였다. 오토클레이빙 후, 플라스크를 실온으로 냉각시켰다. 각 플라스크의 총 중량을 50그램으로 하기 위해서, 5ml의 0.5M 아세트산나트륨 pH 5.0을 첨가하고 이어서 셀룰라아제 브로스를 첨가하여 원하는 로딩을 달성한 다음, 적절한 양의 증류수를 원하는 최종 50g 중량에 이르도록 첨가하였다. 그 다음 플라스크를 5O℃ 및 130rpm에서 인큐베이터 쉐이커(New Brunswick Scientific, Edison, NJ, USA)에 두었다. 3, 5 및 7일째에, 1ml 샘플을 각 플라스크로부터 취하고 96-딥-웰 플레이트에 첨가하였다(2.0-ml 총 부피). 그 다음 96 웰-플레이트를 3000rpm에서 15분 동안 SORVALL® RT7 플레이트 원심분리기(Thermo Fisher Scientific, Waltham, MA, USA)를 사용하여 원심분리하였다. 원심분리 후, 200μl 상청액을 96-웰 0.45μm 구멍 크기 여과 플레이트(Millipore, Bedford, MA, USA)로 이동시키고 진공을 가하여 여과액을 수집하였다. 그 다음 여과액을 0.4% NaOH으로 환원당의 적절한 범위로 희석하고 PHBAH 시약(1.5%)을 사용하여 하기와 같이 측정하였다: 50ul PHBAH 시약 및 100μl 샘플을 V-형 바닥 96-웰 플레이트에 첨가하고 95℃에서 10분 동안 인큐베이션하였다. 반응을 완료하기 위해서, 50μl 증류수를 각 웰에 첨가하고 샘플을 혼합한 후, 100μl 혼합물을 다른 평면-바닥 96-웰 플레이트로 이동시켜서 A410에서의 분광광도 판독을 얻었다. 글루코스 검정 곡성을 사용하여 환원당의 양을 산출하고 분해 퍼센트를 하기와 같이 산출하였다:
분해 % = 환원당(mg/ml)/(첨가된 셀룰로오스(mg/ml) x 1.11), 여기서 인자 1.11은 셀룰로오스의 글루코스로의 전환에서 중량 증가를 반영한다.
PCS 가수분해 분석 결과는 SMai-M104 지정된 하나의 돌연변이가 모체 균주 SMA135-04보다 특히 높은 로딩(12mg/g 셀룰로오스)에서 약간(대략 5% 글루코스 증가) 성능이 우수하였다.
실시예 23: Trichoderma reesei 균주 SMai26 -30의 구성
동시-형질전환을 사용하여 플라스미드 pCW085(WO 2006/074435), pSaMe-FH, 및 pCW087(실시예 17)를 Trichoderma reesei SMai-M104로 도입하였다. 플라스미드 pCW085는 Thielavia terrestris NRRL 8126 셀로비히드롤라아제(CEL6A)를 위한 발현 벡터이다. 모든 3개 플라스미드를 Trichoderma reesei SMai-M104로 PEG-매개 형질전환에 의해 도입하였다(상기 Penttila et al., 1987). 각 플라스미드는 Escherichia coli 하이그로마이신 B 포스포트랜스페라제(hph) 유전자를 함유하여 형질전환주를 하이그로마신 B 상에서 성장시킬 수 있다.
Trichoderma reesei SMai-M104을 27℃ 및 90rpm에서 2%(w/v) 글루코스 및 10 mM 유리딘 보충된 25ml YP 배지에서 17시간 동안 배양하였다. Vacuum Driven Disposable Filtration System를 사용하여 여과에 의해 균사체를 수집하고 탈이온수로 2회 1.2M 소르비톨로 2회 세정하였다. 세정한 균사체를 ml당 15mg GLUCANEX® 및 ml당 0.36유닛 키티나제을 함유하는 20ml 1.2M 소르비톨에 현탁하고 15-25분 동안 34℃에서 90rpm에서 가벼운 쉐이킹과 함께 인큐베이션하여 원형질체를 발생시켰다. 400 x g에서 7분 동안 원심분리하여 원형질체를 수집하고 차가운 1.2M 소르비톨로 2회 세정하였다. 혈구 측정기를 사용하여 원형질체를 계수하고 STC에 ml당 최종 농도 1 X 108 원형질체로 재현탁하였다. 과잉의 원형질체를 Cryo 1℃ 냉동 용기에서 -80℃에 저장하였다.
대략 10μg의 각 플라스미드 pCW085, pSaMe-FH 및 pCW087를 Pme I으로 분해하고 100μl 원형질체 용액에 첨가하고 가볍게 혼합한 후, 260μl PEG 버퍼를 혼합하고 실온에서 30분 동안 인큐베이션하였다. 그 다음 STC(3ml)를 첨가하고 혼합하고 형질전환 용액을 1M 수크로스 및 10mM 유리딘을 함유하는 PDA로 플레이트하였다. 플레이트를 28℃에서 16시간 동안 인큐베이션한 다음 하이그로마이신 B(30μg/ml) 최종 농도)를 함유하는 한천 오버레이를 첨가하고 4-6일 동안 배양을 계속하였다. 80 형질전환주를 PDA 플레이트로 2차배양하고 28℃에서 성장시켰다.
Trichoderma reesei 형질전환주를 pH 6.0에서 형질전환주의 포자가 접종된 25ml 셀룰라아제-유도 배지를 함유하는 125ml 배플이 있는 쉐이크 플라스크에서 배양하고 28℃ 및 200rpm에서 5일 동안 인큐베이션하였다. Trichoderma reesei SMai-M104는 대조구로서 수행하였다. 배양 브로스 샘플을 5일째에 제거하였다. 각 배양 브로스의 1ml를 15,700 x g에서 5분 동안 마이크로-원심분리기에서 원심분리하고 상청액을 새로운 튜브로 이동시켰다.
CRITERION® 시스템과 함께 CRITERION® Tris-HCl(5% 용해) 겔을 사용하여 SDS-PAGE를 행하였다. 5일 상청액(상기 참조)의 5μl를 2X 농도의 Laemmli Sample Buffer에 현탁하고 5% 베타-메르캅토에탄올의 존재하에서 3분 동안 가열하였다. 상청액 샘플을 폴리아크릴아미드 겔로 로딩하고 러닝 버퍼로서 1X Tris/글리신/SDS을 가지고 전기영동을 행하였다. 얻어진 겔을 BIO-SAFE® 쿠마시 색소로 착색하였다. SDS-PAGE 겔 상의 밴드의 가시화에 의해 목격되는 바와 같이 Aspergillus oryzae 베타-글루코시다아제 및 Thielavia terrestris 셀로비오히드롤라아제 II와 융합된 Humicola insolens 엔도글루카나아제 V 코어 (Cel45A)으로 구성된 융합 단백질의 발현을 나타내는 형질전환주를 실시예 20에 설명한 바와 같이 PCS 가수분해 반응에서 테스트하여 최고 가수분해 브로스를 생성하는 균주를 식별하였다. 최대 이행 브로스를 생성하는 하나의 형질전환주를 Trichoderma reesei SMai26-30로 지정하였다.
Trichoderma reesei 균주 SMai26-30 브로스에 의한 PCS의 가수분해를 하기 변형과 함께 실시예 20에 설명된 바와 같이 행하였다. PCS는 실시예 20에서 사용한 것과 상이하지만 유사한 조건하에서 제조되었다. 이 프로토콜에서 PCS(대략 PCS 중 11.3% 및 수성 50mM 시트르산나트륨 pH 5.0 버퍼 중 6.7% 셀룰로오스)의 가수분해를 Trichoderma reesei 균주 SMai26-30 발효 브로스의 상이한 단백질 로딩(셀룰로오스의 그램당 단백질 mg으로 표현됨)을 사용하여 행하였다. 가수분해 과정 동안 48, 120 및 168시간에서 분액을 취하였다. 상기 설명한 50g 플라스크 분석에서 PCS 가수분해 반응의 결과를 표 2에 나타낸다.
Figure 112009076188430-PCT00002
생물학적 물질의 기탁
다음의 생물학적 물질을 부다페스트 조약에 의거하여 아그리컬쳐럴 리서치 서비스 패턴트 컬쳐 컬렉션, 노던 리저널 리서치 센터, 1815 University Street, Peoria, Illinois, 61604에 기탁하였으며, 다음의 승인 번호를 부여받았다:
기탁 승인 번호 기탁일
E. coli 균주 pEJG120 NRRL B-30699 2003년 12월 19일
E. coli 균주 pTter61C NRRL B-30813 2005년 1월 21일
E. coli 균주 pTter61D NRRL B-30812 2005년 1월 21일
E. coli 균주 pTter61E NRRL B-30814 2005년 1월 21일
E. coli 균주 pTter61G NRRL B-30811 2005년 1월 21일
E. coli 균주 pDZA2-7 NRRL B-30704 2004년 1월 30일
E. coli 균주 pTr3337 NRRL B-30878 2005년 9월 20일
E. coliTOP10(pEJG113) NRRL B-30695 2003년 10월 17일
E. coliTOP1O pKKAB NRRL B-30860 2005년 7월 8일
NN049573 DSM 14240 2001년 4월 19일
균주는 특허 출원이 되는 동안 37 C. F. R. §1.14 및 35 U. S. C. §122에 의거한 특허 및 상표의 관서장이 결정한 자가 배양물을 입수 가능한 상태로 기탁되었다. 기탁은 기탁된 균주의 실질적으로 순수한 배양물을 나타낸다. 이 기탁물은 대상 발명의 상대방 국가인 외국법에 의하여 요구되는 바대로 사용되거나 또는 이들의 승계인도 기록된다. 그러나, 기탁물의 사용은 정부에 의하여 수여된 특허권을 훼손하기 위하여 증명서를 사용하는 것으로 활용되어서는 아니된다는 것을 이해하여야 한다.
본원에 기재되고 청구된 발명은 본 발명의 특정 특징에 의하여 범위를 제한하는 것이 아니며, 이는 본 발명의 몇몇 특징을 설명하기 위하여 의도된 것이기 때문이다. 모든 동등한 특징을 본 발명의 범위에 포함하는 것으로 의도되었다. 물론, 본원에서 기재하고 나타낸 본 발명의 다양한 변형은 전술한 설명에 의하여 당해 기술 분야의 숙련자에게 자명하다. 이러한 변형은 첨부한 청구 범위의 범위 내에 포함되는 것을 의도하였다. 분쟁이 발생하는 경우, 정의를 포함한 본 명세서를 대조한다.
다양한 참고자료를 본원에서 인용하였으며, 이 문헌들은 전체로서 본원에서 참고 자료로 포함되었다.
SEQUENCE LISTING <110> Novozymes, Inc. Merino, Sandra McFarland, Keith Cherry, Joel Teter, Sarah <120> Compositions for degrading cellulosic material <130> 11250.204-WO <150> 60/941,251 <151> 2007-05-31 <160> 110 <170> PatentIn version 3.5 <210> 1 <211> 1846 <212> DNA <213> Thielavia terrestris <400> 1 aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga 60 tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg 120 gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg 180 ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc 240 atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac 300 gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc 360 ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc 420 acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg 480 caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac 540 ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc 600 cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc 660 tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac 720 gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc 780 gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc 840 gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc 900 ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc 960 atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac 1020 gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg 1080 gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc 1140 gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc 1200 ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg 1260 tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct 1320 ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga 1380 gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata 1440 tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt 1500 ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg 1560 ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg 1620 gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg 1680 agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc 1740 atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg 1800 ggatcgaacc cgagacctcg cacatgactt atttcaagtc aggggt 1846 <210> 2 <211> 326 <212> PRT <213> Thielavia terrestris <400> 2 Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu 1 5 10 15 Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp 20 25 30 Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr 35 40 45 Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro 50 55 60 Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met 65 70 75 80 His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly 85 90 95 Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala 100 105 110 Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser 115 120 125 Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly 130 135 140 Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro 145 150 155 160 Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala 165 170 175 Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys 180 185 190 Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val 195 200 205 Asn Phe Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn 210 215 220 Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr 225 230 235 240 Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu 245 250 255 Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro 260 265 270 Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly 275 280 285 Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly 290 295 300 Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro 305 310 315 320 Tyr Tyr Ser Gln Cys Leu 325 <210> 3 <211> 880 <212> DNA <213> Thielavia terrestris <400> 3 accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc 60 cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat 120 catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac 180 gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg 240 ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac 300 ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg 360 ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct 420 gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac 480 cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca 540 cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct 600 ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt 660 ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct 720 ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct 780 acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg 840 gctacgaggg gaaggcatct gttcgcatga gcgtgggtac 880 <210> 4 <211> 478 <212> PRT <213> Thielavia terrestris <400> 4 Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala 1 5 10 15 Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro 20 25 30 Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr 35 40 45 Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met 50 55 60 Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala 65 70 75 80 Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly 85 90 95 Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser 100 105 110 His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp 115 120 125 Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys 130 135 140 Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn 145 150 155 160 Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro 165 170 175 Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser 180 185 190 Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro 195 200 205 Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr 210 215 220 Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe Met 225 230 235 240 Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala Gly 245 250 255 His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro Gly 260 265 270 Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr Gln 275 280 285 Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met Arg 290 295 300 Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala Gly 305 310 315 320 Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly Pro 325 330 335 Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser His 340 345 350 Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp Gly 355 360 365 Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys Thr 370 375 380 Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr 385 390 395 400 Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro Gln 405 410 415 Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser Ala 420 425 430 Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro Gln 435 440 445 Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr Ser 450 455 460 Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe 465 470 475 <210> 5 <211> 1000 <212> DNA <213> Thielavia terrestris <400> 5 ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag 60 agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg 120 cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag 180 ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc 240 agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac 300 tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc 360 accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg 420 cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt 480 gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc 540 aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc 600 aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc 660 cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag 720 gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc 780 ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac 840 tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc 900 atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag 960 gcccgggact tcaccgcctg aagttgttga atcgatggag 1000 <210> 6 <211> 516 <212> PRT <213> Thielavia terrestris <400> 6 Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly 1 5 10 15 Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn 20 25 30 Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile 35 40 45 Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser 50 55 60 Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala 65 70 75 80 Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser 85 90 95 Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser 100 105 110 Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly 115 120 125 Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser 130 135 140 Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser 145 150 155 160 Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu 165 170 175 Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys 180 185 190 Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser 195 200 205 Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile 210 215 220 Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro 225 230 235 240 Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe 245 250 255 Thr Ala Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala 260 265 270 Ser Gly Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly 275 280 285 Lys Asn Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn 290 295 300 Val Ile Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser 305 310 315 320 Asp Ser Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala 325 330 335 Thr Ala Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr 340 345 350 His Ser Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser 355 360 365 Phe Ser Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu 370 375 380 Ala Gly Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn 385 390 395 400 Pro Ser Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp 405 410 415 Ser Ser Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg 420 425 430 His Glu Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro 435 440 445 Glu Cys Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp 450 455 460 Ala Ser Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro 465 470 475 480 Asn Ile Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys 485 490 495 Ile Pro Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg 500 505 510 Asp Phe Thr Ala 515 <210> 7 <211> 681 <212> DNA <213> Thielavia terrestris <400> 7 atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac 60 acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg 120 caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc 180 ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc 240 aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc 300 gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat 360 cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc 420 atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac 480 gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc 540 ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg 600 gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc 660 ccggccgtct tcagctgctg a 681 <210> 8 <211> 452 <212> PRT <213> Thielavia terrestris <400> 8 Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val 1 5 10 15 Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln 20 25 30 Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp 35 40 45 Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala 50 55 60 Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala 65 70 75 80 Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg 85 90 95 Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val 100 105 110 Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr 115 120 125 Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys 130 135 140 Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His 145 150 155 160 Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln 165 170 175 Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala 180 185 190 Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile 195 200 205 Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe 210 215 220 Ser Cys Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu 225 230 235 240 Gly Val Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp 245 250 255 Trp Gln Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val 260 265 270 Gly Asp Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser 275 280 285 Pro Ala Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr 290 295 300 Trp Ala Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met 305 310 315 320 Ala Arg Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly 325 330 335 Ala Val Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln 340 345 350 Leu Thr Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro 355 360 365 Pro Cys Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly 370 375 380 Leu His Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys 385 390 395 400 Ala Gln Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys 405 410 415 Val Ala Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile 420 425 430 Asn Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala 435 440 445 Val Phe Ser Cys 450 <210> 9 <211> 960 <212> DNA <213> Thielavia terrestris <400> 9 atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat 60 tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc 120 aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat 180 gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc 240 ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc 300 ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc 360 ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac 420 atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac 480 aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc 540 ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc 600 gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg 660 gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg 720 cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg 780 acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg 840 tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac 900 tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc 960 <210> 10 <211> 608 <212> PRT <213> Thielavia terrestris <400> 10 Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln 1 5 10 15 Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln 20 25 30 Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro 35 40 45 Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln 50 55 60 Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr 65 70 75 80 Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr 85 90 95 Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly 100 105 110 Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr 115 120 125 Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys 130 135 140 Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His 145 150 155 160 Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln 165 170 175 Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu 180 185 190 Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile 195 200 205 Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser 210 215 220 Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr 225 230 235 240 Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr 245 250 255 Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys 260 265 270 Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala 275 280 285 Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu 290 295 300 Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln 305 310 315 320 Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln 325 330 335 Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro 340 345 350 Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln 355 360 365 Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr 370 375 380 Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr 385 390 395 400 Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly 405 410 415 Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr 420 425 430 Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys 435 440 445 Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His 450 455 460 Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln 465 470 475 480 Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu 485 490 495 Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile 500 505 510 Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser 515 520 525 Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr 530 535 540 Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr 545 550 555 560 Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys 565 570 575 Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala 580 585 590 Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu 595 600 605 <210> 11 <211> 799 <212> DNA <213> Thermoascus aurantiacus <400> 11 atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60 ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120 acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180 atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240 tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300 agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360 tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420 tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480 caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540 caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600 tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660 cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720 cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780 tcctctgtat actggttaa 799 <210> 12 <211> 250 <212> PRT <213> Thermoascus aurantiacus <400> 12 Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala 1 5 10 15 Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly 20 25 30 Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser 35 40 45 Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly 50 55 60 Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg 65 70 75 80 Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr 85 90 95 Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val 100 105 110 Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys 115 120 125 Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp 130 135 140 Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn 145 150 155 160 Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr 165 170 175 Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp 180 185 190 Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly 195 200 205 Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp 210 215 220 Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr 225 230 235 240 Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly 245 250 <210> 13 <211> 1172 <212> DNA <213> Trichoderma reesei <400> 13 ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc 60 cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca 120 gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc 180 tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc 240 cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg 300 cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt 360 tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg 420 ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct 480 gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta 540 tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa 600 ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg 660 aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac 720 aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta 780 cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag 840 gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga 900 acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac 960 cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga 1020 atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac 1080 atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa 1140 acactacatg taaaaaaaaa aaaaaaaaaa aa 1172 <210> 14 <211> 249 <212> PRT <213> Trichoderma reesei <400> 14 Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser 1 5 10 15 Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr 20 25 30 Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly 35 40 45 His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly 50 55 60 Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys 65 70 75 80 Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn 85 90 95 Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro 100 105 110 Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn 115 120 125 Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr 130 135 140 Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys 145 150 155 160 Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe 165 170 175 Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met 180 185 190 Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr 195 200 205 Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr 210 215 220 Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr 225 230 235 240 Ile Pro Gly Pro Ala Leu Trp Gln Gly 245 <210> 15 <211> 2771 <212> DNA <213> Aspergillus oryzae <400> 15 ctgttctgct ggttacctgc cacgttatca tgaagcttgg ttggatcgag gtggccgcat 60 tggcggctgc ctcagtagtc agtgccaagg atgatctcgc gtactcccct cctttctacc 120 cttccccatg ggcagatggt cagggtgaat gggcggaagt atacaaacgc gctgtagaca 180 tagtttccca gatgacgttg acagagaaag tcaacttaac gactggaaca ggatggcaac 240 tagagaggtg tgttggacaa actggcagtg ttcccagact caacatcccc agcttgtgtt 300 tgcaggatag tcctcttggt attcgtttct cggactacaa ttcagctttc cctgcgggtg 360 ttaatgtcgc tgccacctgg gacaagacgc tcgcctacct tcgtggtcag gcaatgggtg 420 aggagttcag tgataagggt attgacgttc agctgggtcc tgctgctggc cctctcggtg 480 ctcatccgga tggcggtaga aactgggaag gtttctcacc agatccagcc ctcaccggtg 540 tactttttgc ggagacgatt aagggtattc aagatgctgg tgtcattgcg acagctaagc 600 attatatcat gaacgaacaa gagcatttcc gccaacaacc cgaggctgcg ggttacggat 660 tcaacgtaag cgacagtttg agttccaacg ttgatgacaa gactatgcat gaattgtacc 720 tctggccctt cgcggatgca gtacgcgctg gagtcggtgc tgtcatgtgc tcttacaacc 780 aaatcaacaa cagctacggt tgcgagaata gcgaaactct gaacaagctt ttgaaggcgg 840 agcttggttt ccaaggcttc gtcatgagtg attggaccgc tcatcacagc ggcgtaggcg 900 ctgctttagc aggtctggat atgtcgatgc ccggtgatgt taccttcgat agtggtacgt 960 ctttctgggg tgcaaacttg acggtcggtg tccttaacgg tacaatcccc caatggcgtg 1020 ttgatgacat ggctgtccgt atcatggccg cttattacaa ggttggccgc gacaccaaat 1080 acacccctcc caacttcagc tcgtggacca gggacgaata tggtttcgcg cataaccatg 1140 tttcggaagg tgcttacgag agggtcaacg aattcgtgga cgtgcaacgc gatcatgccg 1200 acctaatccg tcgcatcggc gcgcagagca ctgttctgct gaagaacaag ggtgccttgc 1260 ccttgagccg caaggaaaag ctggtcgccc ttctgggaga ggatgcgggt tccaactcgt 1320 ggggcgctaa cggctgtgat gaccgtggtt gcgataacgg tacccttgcc atggcctggg 1380 gtagcggtac tgcgaatttc ccatacctcg tgacaccaga gcaggcgatt cagaacgaag 1440 ttcttcaggg ccgtggtaat gtcttcgccg tgaccgacag ttgggcgctc gacaagatcg 1500 ctgcggctgc ccgccaggcc agcgtatctc tcgtgttcgt caactccgac tcaggagaaa 1560 gctatcttag tgtggatgga aatgagggcg atcgtaacaa catcactctg tggaagaacg 1620 gcgacaatgt ggtcaagacc gcagcgaata actgtaacaa caccgtggtc atcatccact 1680 ccgtcggacc agttttgatc gatgaatggt atgaccaccc caatgtcact ggtattctct 1740 gggctggtct gccaggccag gagtctggta actccatcgc cgatgtgctg tacggtcgtg 1800 tcaaccctgg cgccaagtct cctttcactt ggggcaagac ccgggagtcg tatggttctc 1860 ccttggtcaa ggatgccaac aatggcaacg gagcgcccca gtctgatttc acccagggtg 1920 ttttcatcga ttaccgccat ttcgataagt tcaatgagac ccctatctac gagtttggct 1980 acggcttgag ctacaccacc ttcgagctct ccgacctcca tgttcagccc ctgaacgcgt 2040 cccgatacac tcccaccagt ggcatgactg aagctgcaaa gaactttggt gaaattggcg 2100 atgcgtcgga gtacgtgtat ccggaggggc tggaaaggat ccatgagttt atctatccct 2160 ggatcaactc taccgacctg aaggcatcgt ctgacgattc taactacggc tgggaagact 2220 ccaagtatat tcccgaaggc gccacggatg ggtctgccca gccccgtttg cccgctagtg 2280 gtggtgccgg aggaaacccc ggtctgtacg aggatctttt ccgcgtctct gtgaaggtca 2340 agaacacggg caatgtcgcc ggtgatgaag ttcctcagct gtacgtttcc ctaggcggcc 2400 cgaatgagcc caaggtggta ctgcgcaagt ttgagcgtat tcacttggcc ccttcgcagg 2460 aggccgtgtg gacaacgacc cttacccgtc gtgaccttgc aaactgggac gtttcggctc 2520 aggactggac cgtcactcct taccccaaga cgatctacgt tggaaactcc tcacggaaac 2580 tgccgctcca ggcctcgctg cctaaggccc agtaaggggc aagtcctgat tgtacagagc 2640 atttcgagat ttatgatgta catgtttatg aatgacctag ggtagggtaa tacttagtag 2700 ggttagttct aattcttgga gtcaagtatt gactcactgg gccgataaaa aaaaaaaaaa 2760 aaaaaaaaaa a 2771 <210> 16 <211> 861 <212> PRT <213> Aspergillus oryzae <400> 16 Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val 1 5 10 15 Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser 20 25 30 Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala 35 40 45 Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr 50 55 60 Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser 65 70 75 80 Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu 85 90 95 Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn 100 105 110 Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala 115 120 125 Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro 130 135 140 Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu 145 150 155 160 Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr 165 170 175 Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr 180 185 190 Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly 195 200 205 Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys 210 215 220 Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala 225 230 235 240 Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr 245 250 255 Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu 260 265 270 Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly 275 280 285 Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val 290 295 300 Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly 305 310 315 320 Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val 325 330 335 Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr 340 345 350 Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His 355 360 365 Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp 370 375 380 Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser 385 390 395 400 Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu 405 410 415 Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly 420 425 430 Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met 435 440 445 Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu 450 455 460 Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala 465 470 475 480 Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln 485 490 495 Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Ser Tyr 500 505 510 Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp 515 520 525 Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn 530 535 540 Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp 545 550 555 560 Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly 565 570 575 Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn 580 585 590 Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr 595 600 605 Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln 610 615 620 Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys 625 630 635 640 Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr 645 650 655 Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg 660 665 670 Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu 675 680 685 Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile 690 695 700 His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser 705 710 715 720 Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu 725 730 735 Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly 740 745 750 Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val 755 760 765 Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu 770 775 780 Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys 785 790 795 800 Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr 805 810 815 Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp 820 825 830 Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser 835 840 845 Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln 850 855 860 <210> 17 <211> 5172 <212> DNA <213> Aspergillus oryzae <400> 17 atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60 gatgatctcg cgtactcccc tcctttctac ccttccccat tacttcgaac caacctagct 120 ccaccggcgt aaccgccgac ggagtcatca gtcacggttc ctactagagc gcatgagggg 180 aggaaagatg ggaaggggta gggcagatgg tcagggtgaa tgggcggaag tatacaaacg 240 cgctgtagac atagtttccc agatgacgtt gacagagaaa gtcaacttaa cgactggaac 300 cccgtctacc agtcccactt acccgccttc atatgtttgc gcgacatctg tatcaaaggg 360 tctactgcaa ctgtctcttt cagttgaatt gctgaccttg aggatggcaa ctagagaggt 420 gtgttggaca aactggcagt gttcccagac tcaacatccc cagcttgtgt ttgcaggata 480 gtcctcttgg tattcgtttc tcctaccgtt gatctctcca cacaacctgt ttgaccgtca 540 caagggtctg agttgtaggg gtcgaacaca aacgtcctat caggagaacc ataagcaaag 600 tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 660 ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca agcctgatgt taagtcgaaa 720 gggacgccca caattacagc gacggtggac cctgttctgc gagcggatgg aagcaccagt 780 ccgttaccca ctcctcaagt gtgataaggg tattgacgtt cagctgggtc ctgctgctgg 840 ccctctcggt gctcatccgg atggcggtag aaactgggaa ggtttctcac cagatccagc 900 cactattccc ataactgcaa gtcgacccag gacgacgacc gggagagcca cgagtaggcc 960 taccgccatc tttgaccctt ccaaagagtg gtctaggtcg cctcaccggt gtactttttg 1020 cggagacgat taagggtatt caagatgctg gtgtcattgc gacagctaag cattatatca 1080 tgaacgaaca agagcatttc ggagtggcca catgaaaaac gcctctgcta attcccataa 1140 gttctacgac cacagtaacg ctgtcgattc gtaatatagt acttgcttgt tctcgtaaag 1200 cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 1260 gttgatgaca agactatgca tgaattgtac ctctggccct gcggttgttg ggctccgacg 1320 cccaatgcct aagttgcatt cgctgtcaaa ctcaaggttg caactactgt tctgatacgt 1380 acttaacatg gagaccggga tcgcggatgc agtacgcgct ggagtcggtg ctgtcatgtg 1440 ctcttacaac caaatcaaca acagctacgg ttgcgagaat agcgaaactc tgaacaagct 1500 agcgcctacg tcatgcgcga cctcagccac gacagtacac gagaatgttg gtttagttgt 1560 tgtcgatgcc aacgctctta tcgctttgag acttgttcga tttgaaggcg gagcttggtt 1620 tccaaggctt cgtcatgagt gattggaccg ctcatcacag cggcgtaggc gctgctttag 1680 caggtctgga tatgtcgatg aaacttccgc ctcgaaccaa aggttccgaa gcagtactca 1740 ctaacctggc gagtagtgtc gccgcatccg cgacgaaatc gtccagacct atacagctac 1800 cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 1860 gtccttaacg gtacaatccc ccaatggcgt gttgatgaca gggccactac aatggaagct 1920 atcaccatgc agaaagaccc cacgtttgaa ctgccagcca caggaattgc catgttaggg 1980 ggttaccgca caactactgt tggctgtccg tatcatggcc gcttattaca aggttggccg 2040 cgacaccaaa tacacccctc ccaacttcag ctcgtggacc agggacgaat atggtttcgc 2100 accgacaggc atagtaccgg cgaataatgt tccaaccggc gctgtggttt atgtggggag 2160 ggttgaagtc gagcacctgg tccctgctta taccaaagcg gcataaccat gtttcggaag 2220 gtgcttacga gagggtcaac gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc 2280 gtcgcatcgg cgcgcagagc cgtattggta caaagccttc cacgaatgct ctcccagttg 2340 cttaagcacc tgcacgttgc gctagtacgg ctggattagg cagcgtagcc gcgcgtctcg 2400 actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 2460 cttctgggag aggatgcggg ttccaactcg tggggcgcta tgacaagacg acttcttgtt 2520 cccacggaac gggaactcgg cgttcctttt cgaccagcgg gaagaccctc tcctacgccc 2580 aaggttgagc accccgcgat acggctgtga tgaccgtggt tgcgataacg gtacccttgc 2640 catggcctgg ggtagcggta ctgcgaattt cccatacctc gtgacaccag agcaggcgat 2700 tgccgacact actggcacca acgctattgc catgggaacg gtaccggacc ccatcgccat 2760 gacgcttaaa gggtatggag cactgtggtc tcgtccgcta tcagaacgaa gttcttcagg 2820 gccgtggtaa tgtcttcgcc gtgaccgaca gttgggcgct cgacaagatc gctgcggctg 2880 cccgccaggc cagcgtatct agtcttgctt caagaagtcc cggcaccatt acagaagcgg 2940 cactggctgt caacccgcga gctgttctag cgacgccgac gggcggtccg gtcgcataga 3000 ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 3060 gatcgtaaca acatcactct gtggaagaac ggcgacaatg gagcacaagc agttgaggct 3120 gagtcctctt ccgatagaat cacacctacc tttactcccg ctagcattgt tgtagtgaga 3180 caccttcttg ccgctgttac tggtcaagac cgcagcgaat aactgtaaca acaccgttgt 3240 catcatccac tccgtcggac cagttttgat cgatgaatgg tatgaccacc ccaatgtcac 3300 accagttctg gcgtcgctta ttgacattgt tgtggcaaca gtagtaggtg aggcagcctg 3360 gtcaaaacta gctacttacc atactggtgg ggttacagtg tggtattctc tgggctggtc 3420 tgccaggcca ggagtctggt aactccattg ccgatgtgct gtacggtcgt gtcaaccctg 3480 gcgccaagtc tcctttcact accataagag acccgaccag acggtccggt cctcagacca 3540 ttgaggtaac ggctacacga catgccagca cagttgggac cgcggttcag aggaaagtga 3600 tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 3660 ggagcgcccc agtctgattt cacccagggt gttttcatcg accccgttct gggccctcag 3720 cataccaaga gggaaccagt tcctacggtt gttaccgttg cctcgcgggg tcagactaaa 3780 gtgggtccca caaaagtagc attaccgcca tttcgataag ttcaatgaga cccctatcta 3840 cgagtttggc tacggcttga gctacaccac cttcgagctc tccgacctcc atgttcagcc 3900 taatggcggt aaagctattc aagttactct ggggatagat gctcaaaccg atgccgaact 3960 cgatgtggtg gaagctcgag aggctggagg tacaagtcgg cctgaacgcg tcccgataca 4020 ctcccaccag tggcatgact gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg 4080 agtacgtgta tccggagggg ggacttgcgc agggctatgt gagggtggtc accgtactga 4140 cttcgacgtt tcttgaaacc actttaaccg ctacgcagcc tcatgcacat aggcctcccc 4200 ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 4260 tctgacgatt ctaactacgg ctgggaagac tccaagtata gacctttcct aggtactcaa 4320 atagataggg acctagttga gatggctgga cttccgtagc agactgctaa gattgatgcc 4380 gacccttctg aggttcatat ttcccgaagg cgccacggat gggtctgccc agccccgttt 4440 gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac gaggatcttt tccgcgtctc 4500 aagggcttcc gcggtgccta cccagacggg tcggggcaaa cgggcgatca ccaccacggc 4560 ctcctttggg gccagacatg ctcctagaaa aggcgcagag tgtgaaggtc aagaacacgg 4620 gcaatgtcgc cggtgatgaa gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc 4680 ccaaggtggt actgcgcaag acacttccag ttcttgtgcc cgttacagcg gccactactt 4740 caaggagtcg acatgcaaag ggatccgccg ggcttactcg ggttccacca tgacgcgttc 4800 tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 4860 cgtgaccttg caaactggga cgtttcggct caggactgga aaactcgcat aagtgaaccg 4920 gggaagcgtc ctccggcaca cctgttgctg ggaatgggca gcactggaac gtttgaccct 4980 gcaaagccga gtcctgacct ccgtcactcc ttaccccaag acgatctacg ttggaaactc 5040 ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc cagtaaggca gtgaggaatg 5100 gggttctgct agatgcaacc tttgaggagt gcctttgacg gcgaggtccg gagcgacgga 5160 ttccgggtca tt 5172 <210> 18 <211> 861 <212> PRT <213> Aspergillus oryzae <400> 18 Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val 1 5 10 15 Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser 20 25 30 Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala 35 40 45 Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr 50 55 60 Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser 65 70 75 80 Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu 85 90 95 Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn 100 105 110 Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala 115 120 125 Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro 130 135 140 Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu 145 150 155 160 Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr 165 170 175 Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr 180 185 190 Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly 195 200 205 Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys 210 215 220 Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala 225 230 235 240 Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr 245 250 255 Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu 260 265 270 Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly 275 280 285 Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val 290 295 300 Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly 305 310 315 320 Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val 325 330 335 Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr 340 345 350 Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His 355 360 365 Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp 370 375 380 Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser 385 390 395 400 Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu 405 410 415 Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly 420 425 430 Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met 435 440 445 Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu 450 455 460 Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala 465 470 475 480 Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln 485 490 495 Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr 500 505 510 Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp 515 520 525 Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn 530 535 540 Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp 545 550 555 560 Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly 565 570 575 Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn 580 585 590 Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr 595 600 605 Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln 610 615 620 Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys 625 630 635 640 Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr 645 650 655 Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg 660 665 670 Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu 675 680 685 Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile 690 695 700 His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser 705 710 715 720 Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu 725 730 735 Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly 740 745 750 Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val 755 760 765 Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu 770 775 780 Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys 785 790 795 800 Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr 805 810 815 Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp 820 825 830 Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser 835 840 845 Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln 850 855 860 <210> 19 <211> 3060 <212> DNA <213> Aspergillus fumigatus <400> 19 atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60 gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120 aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180 gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240 ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300 actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360 aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420 acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480 gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540 tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600 cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660 gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720 cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780 agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840 acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900 ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960 ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020 ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080 ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140 actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200 agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260 gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320 aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380 tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440 gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500 gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560 ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620 ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680 aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740 cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800 gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860 cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920 gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980 cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040 tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100 gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160 tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220 ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280 gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340 aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400 caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460 accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520 ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580 tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640 gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700 tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760 gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820 ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880 cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940 ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000 cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060 <210> 20 <211> 863 <212> PRT <213> Aspergillus fumigatus <400> 20 Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val 1 5 10 15 Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro 20 25 30 Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val 35 40 45 Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr 50 55 60 Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val 65 70 75 80 Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu 85 90 95 Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn 100 105 110 Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala 115 120 125 Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro 130 135 140 Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu 145 150 155 160 Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr 165 170 175 Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr 180 185 190 Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly 195 200 205 Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys 210 215 220 Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala 225 230 235 240 Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr 245 250 255 Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu 260 265 270 Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly 275 280 285 Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile 290 295 300 Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser 305 310 315 320 Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val 325 330 335 Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile 340 345 350 Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His 355 360 365 Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn 370 375 380 Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser 385 390 395 400 Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu 405 410 415 Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly 420 425 430 Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met 435 440 445 Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu 450 455 460 Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala 465 470 475 480 Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln 485 490 495 Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe 500 505 510 Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp 515 520 525 Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn 530 535 540 Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp 545 550 555 560 Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly 565 570 575 Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn 580 585 590 Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr 595 600 605 Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln 610 615 620 Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys 625 630 635 640 Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr 645 650 655 Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser 660 665 670 Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr 675 680 685 Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys 690 695 700 Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu 705 710 715 720 Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile 725 730 735 Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly 740 745 750 Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val 755 760 765 Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro 770 775 780 Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu 785 790 795 800 Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp 805 810 815 Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala 820 825 830 Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser 835 840 845 Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr 850 855 860 <210> 21 <211> 2800 <212> DNA <213> Penicillium brasilianum <400> 21 tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60 ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120 gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180 cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240 ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300 tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360 tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420 tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480 cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540 aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600 ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660 ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720 gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780 gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840 gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900 ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960 tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020 cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080 ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140 gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200 aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260 cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320 atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380 tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440 aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500 gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560 acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620 actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680 ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740 acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800 acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860 acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920 tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980 aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040 ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100 tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160 tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220 caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat 2280 acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340 cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400 cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460 acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520 aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580 ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640 gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700 gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760 catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800 <210> 22 <211> 878 <212> PRT <213> Penicillium brasilianum <400> 22 Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln 1 5 10 15 Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu 20 25 30 His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser 35 40 45 Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys 50 55 60 Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu 65 70 75 80 Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly 85 90 95 Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro 100 105 110 Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln 115 120 125 Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln 130 135 140 Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly 145 150 155 160 Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp 165 170 175 Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu 180 185 190 Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His 195 200 205 Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala 210 215 220 Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp 225 230 235 240 Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg 245 250 255 Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser 260 265 270 Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu 275 280 285 Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser 290 295 300 Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp 305 310 315 320 Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile 325 330 335 Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala 340 345 350 Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp 355 360 365 Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr 370 375 380 Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val 385 390 395 400 Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys 405 410 415 Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln 420 425 430 Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys 435 440 445 Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala 450 455 460 Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro 465 470 475 480 Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu 485 490 495 Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser 500 505 510 Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu 515 520 525 Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr 530 535 540 Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys 545 550 555 560 Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn 565 570 575 Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met 580 585 590 Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn 595 600 605 Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu 610 615 620 Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala 625 630 635 640 Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe 645 650 655 Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser 660 665 670 Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val 675 680 685 Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile 690 695 700 Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr 705 710 715 720 Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val 725 730 735 Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe 740 745 750 Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala 755 760 765 Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu 770 775 780 Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp 785 790 795 800 Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg 805 810 815 Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser 820 825 830 Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile 835 840 845 Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val 850 855 860 Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu 865 870 875 <210> 23 <211> 2235 <212> DNA <213> Trichoderma reesei <400> 23 atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60 agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120 ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180 ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240 tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300 acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360 atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420 cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480 ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540 tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600 gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660 gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720 acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780 ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840 gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900 gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960 actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020 aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080 ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140 gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200 gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260 ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320 gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380 gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440 gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500 gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560 cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620 agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680 tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740 agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800 cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860 ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920 ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980 gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040 cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100 aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160 tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220 ctgtcggtag cgtag 2235 <210> 24 <211> 744 <212> PRT <213> Trichoderma reesei <400> 24 Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe 1 5 10 15 Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val 20 25 30 Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys 35 40 45 Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser 50 55 60 Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala 65 70 75 80 Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly 85 90 95 Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala 100 105 110 Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile 115 120 125 Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val 130 135 140 Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile 165 170 175 Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile 180 185 190 Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp 195 200 205 Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val 210 215 220 Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr 225 230 235 240 Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp 245 250 255 Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His 260 265 270 Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly 275 280 285 Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn 290 295 300 Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val 305 310 315 320 Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly 325 330 335 Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr 340 345 350 Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp 355 360 365 Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly 370 375 380 Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn 385 390 395 400 Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly 405 410 415 Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr 420 425 430 Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn 435 440 445 Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val 450 455 460 Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn 465 470 475 480 Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu 485 490 495 Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His 500 505 510 Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val 515 520 525 Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala 530 535 540 Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val 545 550 555 560 Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser 565 570 575 Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His 580 585 590 Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu 595 600 605 Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala 610 615 620 Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp 625 630 635 640 Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly 645 650 655 Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser 660 665 670 Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu 675 680 685 Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg 690 695 700 Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro 705 710 715 720 Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg 725 730 735 Leu Thr Ser Thr Leu Ser Val Ala 740 <210> 25 <211> 2583 <212> DNA <213> Aspergillus niger <400> 25 atgaggttca ctttgatcga ggcggtggct ctgactgccg tctcgctggc cagcgctgat 60 gaattggcct actccccacc gtattaccca tccccttggg ccaatggcca gggcgactgg 120 gcgcaggcat accagcgcgc tgttgatatt gtctcgcaaa tgacattgga tgagaaggtc 180 aatctgacca caggaactgg atgggaattg gaactatgtg ttggtcagac tggcggtgtt 240 ccccgattgg gagttccggg aatgtgttta caggatagcc ctctgggcgt tcgcgactcc 300 gactacaact ctgctttccc tgccggcatg aacgtggctg caacctggga caagaatctg 360 gcataccttc gcggcaaggc tatgggtcag gaatttagtg acaagggtgc cgatatccaa 420 ttgggtccag ctgccggccc tctcggtaga agtcccgacg gtggtcgtaa ctgggagggc 480 ttctccccag accctgccct aagtggtgtg ctctttgccg agaccatcaa gggtatccaa 540 gatgctggtg tggttgcgac ggctaagcac tacattgctt acgagcaaga gcatttccgt 600 caggcgcctg aagcccaagg ttttggattt aatatttccg agagtggaag tgcgaacctc 660 gatgataaga ctatgcacga gctgtacctc tggcccttcg cggatgccat ccgtgcaggt 720 gctggcgctg tgatgtgctc ctacaaccag atcaacaaca gttatggctg ccagaacagc 780 tacactctga acaagctgct caaggccgag ctgggcttcc agggctttgt catgagtgat 840 tgggctgctc accatgctgg tgtgagtggt gctttggcag gattggatat gtctatgcca 900 ggagacgtcg actacgacag tggtacgtct tactggggta caaacttgac cattagcgtg 960 ctcaacggaa cggtgcccca atggcgtgtt gatgacatgg ctgtccgcat catggccgcc 1020 tactacaagg tcggccgtga ccgtctgtgg actcctccca acttcagctc atggaccaga 1080 gatgaatacg gctacaagta ctactacgtg tcggagggac cgtacgagaa ggtcaaccag 1140 tacgtgaatg tgcaacgcaa ccacagcgaa ctgattcgcc gcattggagc ggacagcacg 1200 gtgctcctca agaacgacgg cgctctgcct ttgactggta aggagcgcct ggtcgcgctt 1260 atcggagaag atgcgggctc caacccttat ggtgccaacg gctgcagtga ccgtggatgc 1320 gacaatggaa cattggcgat gggctgggga agtggtactg ccaacttccc atacctggtg 1380 acccccgagc aggccatctc aaacgaggtg cttaagcaca agaatggtgt attcaccgcc 1440 accgataact gggctatcga tcagattgag gcgcttgcta agaccgccag tgtctctctt 1500 gtctttgtca acgccgactc tggtgagggt tacatcaatg tggacggaaa cctgggtgac 1560 cgcaggaacc tgaccctgtg gaggaacggc gataatgtga tcaaggctgc tgctagcaac 1620 tgcaacaaca caatcgttgt cattcactct gtcggaccag tcttggttaa cgagtggtac 1680 gacaacccca atgttaccgc tatcctctgg ggtggtttgc ccggtcagga gtctggcaac 1740 tctcttgccg acgtcctcta tggccgtgtc aaccccggtg ccaagtcgcc ctttacctgg 1800 ggcaagactc gtgaggccta ccaagactac ttggtcaccg agcccaacaa cggcaacgga 1860 gcccctcagg aagactttgt cgagggcgtc ttcattgact accgtggatt tgacaagcgc 1920 aacgagaccc cgatctacga gttcggctat ggtctgagct acaccacttt caactactcg 1980 aaccttgagg tgcaggtgct gagcgcccct gcatacgagc ctgcttcggg tgagaccgag 2040 gcagcgccaa ccttcggaga ggttggaaat gcgtcggatt acctctaccc cagcggattg 2100 cagagaatta ccaagttcat ctacccctgg ctcaacggta ccgatctcga ggcatcttcc 2160 ggggatgcta gctacgggca ggactcctcc gactatcttc ccgagggagc caccgatggc 2220 tctgcgcaac cgatcctgcc tgccggtggc ggtcctggcg gcaaccctcg cctgtacgac 2280 gagctcatcc gcgtgtcagt gaccatcaag aacaccggca aggttgctgg tgatgaagtt 2340 ccccaactgt atgtttccct tggcggtccc aatgagccca agatcgtgct gcgtcaattc 2400 gagcgcatca cgctgcagcc gtcggaggag acgaagtgga gcacgactct gacgcgccgt 2460 gaccttgcaa actggaatgt tgagaagcag gactgggaga ttacgtcgta tcccaagatg 2520 gtgtttgtcg gaagctcctc gcggaagctg ccgctccggg cgtctctgcc tactgttcac 2580 taa 2583 <210> 26 <211> 860 <212> PRT <213> Aspergillus niger <400> 26 Met Arg Phe Thr Leu Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu 1 5 10 15 Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro 20 25 30 Trp Ala Asn Gly Gln Gly Asp Trp Ala Gln Ala Tyr Gln Arg Ala Val 35 40 45 Asp Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr 50 55 60 Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val 65 70 75 80 Pro Arg Leu Gly Val Pro Gly Met Cys Leu Gln Asp Ser Pro Leu Gly 85 90 95 Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Met Asn Val 100 105 110 Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Lys Ala Met 115 120 125 Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala 130 135 140 Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile 165 170 175 Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile 180 185 190 Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Phe 195 200 205 Gly Phe Asn Ile Ser Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr 210 215 220 Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly 225 230 235 240 Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly 245 250 255 Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly 260 265 270 Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val 275 280 285 Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp 290 295 300 Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val 305 310 315 320 Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg 325 330 335 Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro 340 345 350 Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Tyr Lys Tyr Tyr 355 360 365 Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Tyr Val Asn Val 370 375 380 Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr 385 390 395 400 Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg 405 410 415 Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala 420 425 430 Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly 435 440 445 Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln 450 455 460 Ala Ile Ser Asn Glu Val Leu Lys His Lys Asn Gly Val Phe Thr Ala 465 470 475 480 Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala 485 490 495 Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile 500 505 510 Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg 515 520 525 Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr 530 535 540 Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr 545 550 555 560 Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln 565 570 575 Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro 580 585 590 Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln 595 600 605 Asp Tyr Leu Val Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu 610 615 620 Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg 625 630 635 640 Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr 645 650 655 Phe Asn Tyr Ser Asn Leu Glu Val Gln Val Leu Ser Ala Pro Ala Tyr 660 665 670 Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val 675 680 685 Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Ser Gly Leu Gln Arg Ile Thr 690 695 700 Lys Phe Ile Tyr Pro Trp Leu Asn Gly Thr Asp Leu Glu Ala Ser Ser 705 710 715 720 Gly Asp Ala Ser Tyr Gly Gln Asp Ser Ser Asp Tyr Leu Pro Glu Gly 725 730 735 Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Pro 740 745 750 Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr 755 760 765 Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr 770 775 780 Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe 785 790 795 800 Glu Arg Ile Thr Leu Gln Pro Ser Glu Glu Thr Lys Trp Ser Thr Thr 805 810 815 Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Lys Gln Asp Trp 820 825 830 Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Val Gly Ser Ser Ser Arg 835 840 845 Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His 850 855 860 <210> 27 <211> 2583 <212> DNA <213> Aspergillus aculeatus <400> 27 atgaagctca gttggcttga ggcggctgcc ttgacggctg cttcagtcgt cagcgctgat 60 gaactggcgt tctctcctcc tttctacccc tctccgtggg ccaatggcca gggagagtgg 120 gcggaagcct accagcgtgc agtggccatt gtatcccaga tgactctgga tgagaaggtc 180 aacctgacca ccggaactgg atgggagctg gagaagtgcg tcggtcagac tggtggtgtc 240 ccaagactga acatcggtgg catgtgtctt caggacagtc ccttgggaat tcgtgatagt 300 gactacaatt cggctttccc tgctggtgtc aacgttgctg cgacatggga caagaacctt 360 gcttatctac gtggtcaggc tatgggtcaa gagttcagtg acaaaggaat tgatgttcaa 420 ttgggaccgg ccgcgggtcc cctcggcagg agccctgatg gaggtcgcaa ctgggaaggt 480 ttctctccag acccggctct tactggtgtg ctctttgcgg agacgattaa gggtattcaa 540 gacgctggtg tcgtggcgac agccaagcat tacattctca atgagcaaga gcatttccgc 600 caggtcgcag aggctgcggg ctacggattc aatatctccg acacgatcag ctctaacgtt 660 gatgacaaga ccattcatga aatgtacctc tggcccttcg cggatgccgt tcgcgccggc 720 gttggcgcca tcatgtgttc ctacaaccag atcaacaaca gctacggttg ccagaacagt 780 tacactctga acaagcttct gaaggccgag ctcggcttcc agggctttgt gatgtctgac 840 tggggtgctc accacagtgg tgttggctct gctttggccg gcttggatat gtcaatgcct 900 ggcgatatca ccttcgattc tgccactagt ttctggggta ccaacctgac cattgctgtg 960 ctcaacggta ccgtcccgca gtggcgcgtt gacgacatgg ctgtccgtat catggctgcc 1020 tactacaagg ttggccgcga ccgcctgtac cagccgccta acttcagctc ctggactcgc 1080 gatgaatacg gcttcaagta tttctacccc caggaagggc cctatgagaa ggtcaatcac 1140 tttgtcaatg tgcagcgcaa ccacagcgag gttattcgca agttgggagc agacagtact 1200 gttctactga agaacaacaa tgccctgccg ctgaccggaa aggagcgcaa agttgcgatc 1260 ctgggtgaag atgctggatc caactcgtac ggtgccaatg gctgctctga ccgtggctgt 1320 gacaacggta ctcttgctat ggcttggggt agcggcactg ccgaattccc atatctcgtg 1380 acccctgagc aggctattca agccgaggtg ctcaagcata agggcagcgt ctacgccatc 1440 acggacaact gggcgctgag ccaggtggag accctcgcta aacaagccag tgtctctctt 1500 gtatttgtca actcggacgc gggagagggc tatatctccg tggacggaaa cgagggcgac 1560 cgcaacaacc tcaccctctg gaagaacggc gacaacctca tcaaggctgc tgcaaacaac 1620 tgcaacaaca ccatcgttgt catccactcc gttggacctg ttttggttga cgagtggtat 1680 gaccacccca acgttactgc catcctctgg gcgggcttgc ctggccagga gtctggcaac 1740 tccttggctg acgtgctcta cggccgcgtc aacccgggcg ccaaatctcc attcacctgg 1800 ggcaagacga gggaggcgta cggggattac cttgtccgtg agctcaacaa cggcaacgga 1860 gctccccaag atgatttctc ggaaggtgtt ttcattgact accgcggatt cgacaagcgc 1920 aatgagaccc cgatctacga gttcggacat ggtctgagct acaccacttt caactactct 1980 ggccttcaca tccaggttct caacgcttcc tccaacgctc aagtagccac tgagactggc 2040 gccgctccca ccttcggaca agtcggcaat gcctctgact acgtgtaccc tgagggattg 2100 accagaatca gcaagttcat ctatccctgg cttaattcca cagacctgaa ggcctcatct 2160 ggcgacccgt actatggagt cgacaccgcg gagcacgtgc ccgagggtgc tactgatggc 2220 tctccgcagc ccgttctgcc tgccggtggt ggctctggtg gtaacccgcg cctctacgat 2280 gagttgatcc gtgtttcggt gacagtcaag aacactggtc gtgttgccgg tgatgctgtg 2340 cctcaattgt atgtttccct tggtggaccc aatgagccca aggttgtgtt gcgcaaattc 2400 gaccgcctca ccctcaagcc ctccgaggag acggtgtgga cgactaccct gacccgccgc 2460 gatctgtcta actgggacgt tgcggctcag gactgggtca tcacttctta cccgaagaag 2520 gtccatgttg gtagctcttc gcgtcagctg ccccttcacg cggcgctccc gaaggtgcaa 2580 tga 2583 <210> 28 <211> 860 <212> PRT <213> Aspergillus aculeatus <400> 28 Met Lys Leu Ser Trp Leu Glu Ala Ala Ala Leu Thr Ala Ala Ser Val 1 5 10 15 Val Ser Ala Asp Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro 20 25 30 Trp Ala Asn Gly Gln Gly Glu Trp Ala Glu Ala Tyr Gln Arg Ala Val 35 40 45 Ala Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr 50 55 60 Gly Thr Gly Trp Glu Leu Glu Lys Cys Val Gly Gln Thr Gly Gly Val 65 70 75 80 Pro Arg Leu Asn Ile Gly Gly Met Cys Leu Gln Asp Ser Pro Leu Gly 85 90 95 Ile Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val 100 105 110 Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met 115 120 125 Gly Gln Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala 130 135 140 Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile 165 170 175 Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile 180 185 190 Leu Asn Glu Gln Glu His Phe Arg Gln Val Ala Glu Ala Ala Gly Tyr 195 200 205 Gly Phe Asn Ile Ser Asp Thr Ile Ser Ser Asn Val Asp Asp Lys Thr 210 215 220 Ile His Glu Met Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly 225 230 235 240 Val Gly Ala Ile Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly 245 250 255 Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly 260 265 270 Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser Gly Val 275 280 285 Gly Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Thr 290 295 300 Phe Asp Ser Ala Thr Ser Phe Trp Gly Thr Asn Leu Thr Ile Ala Val 305 310 315 320 Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg 325 330 335 Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Tyr Gln Pro 340 345 350 Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Phe 355 360 365 Tyr Pro Gln Glu Gly Pro Tyr Glu Lys Val Asn His Phe Val Asn Val 370 375 380 Gln Arg Asn His Ser Glu Val Ile Arg Lys Leu Gly Ala Asp Ser Thr 385 390 395 400 Val Leu Leu Lys Asn Asn Asn Ala Leu Pro Leu Thr Gly Lys Glu Arg 405 410 415 Lys Val Ala Ile Leu Gly Glu Asp Ala Gly Ser Asn Ser Tyr Gly Ala 420 425 430 Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala 435 440 445 Trp Gly Ser Gly Thr Ala Glu Phe Pro Tyr Leu Val Thr Pro Glu Gln 450 455 460 Ala Ile Gln Ala Glu Val Leu Lys His Lys Gly Ser Val Tyr Ala Ile 465 470 475 480 Thr Asp Asn Trp Ala Leu Ser Gln Val Glu Thr Leu Ala Lys Gln Ala 485 490 495 Ser Val Ser Leu Val Phe Val Asn Ser Asp Ala Gly Glu Gly Tyr Ile 500 505 510 Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Leu Thr Leu Trp Lys 515 520 525 Asn Gly Asp Asn Leu Ile Lys Ala Ala Ala Asn Asn Cys Asn Asn Thr 530 535 540 Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asp Glu Trp Tyr 545 550 555 560 Asp His Pro Asn Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln 565 570 575 Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro 580 585 590 Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gly 595 600 605 Asp Tyr Leu Val Arg Glu Leu Asn Asn Gly Asn Gly Ala Pro Gln Asp 610 615 620 Asp Phe Ser Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg 625 630 635 640 Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr Thr 645 650 655 Phe Asn Tyr Ser Gly Leu His Ile Gln Val Leu Asn Ala Ser Ser Asn 660 665 670 Ala Gln Val Ala Thr Glu Thr Gly Ala Ala Pro Thr Phe Gly Gln Val 675 680 685 Gly Asn Ala Ser Asp Tyr Val Tyr Pro Glu Gly Leu Thr Arg Ile Ser 690 695 700 Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ser 705 710 715 720 Gly Asp Pro Tyr Tyr Gly Val Asp Thr Ala Glu His Val Pro Glu Gly 725 730 735 Ala Thr Asp Gly Ser Pro Gln Pro Val Leu Pro Ala Gly Gly Gly Ser 740 745 750 Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr 755 760 765 Val Lys Asn Thr Gly Arg Val Ala Gly Asp Ala Val Pro Gln Leu Tyr 770 775 780 Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe 785 790 795 800 Asp Arg Leu Thr Leu Lys Pro Ser Glu Glu Thr Val Trp Thr Thr Thr 805 810 815 Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Ala Ala Gln Asp Trp 820 825 830 Val Ile Thr Ser Tyr Pro Lys Lys Val His Val Gly Ser Ser Ser Arg 835 840 845 Gln Leu Pro Leu His Ala Ala Leu Pro Lys Val Gln 850 855 860 <210> 29 <211> 918 <212> DNA <213> Humicola insolens <400> 29 atgcgttcct cccccctcct cccgtccgcc gttgtggccg ccctgccggt gttggccctt 60 gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120 aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180 gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240 accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300 agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360 gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420 ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480 ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540 cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600 ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660 cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct 720 ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca 780 gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat 840 ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg 900 taccatcagt gcctgtag 918 <210> 30 <211> 305 <212> PRT <213> Humicola insolens <400> 30 Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro 1 5 10 15 Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys 20 25 30 Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro 35 40 45 Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala 50 55 60 Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln 65 70 75 80 Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr 85 90 95 Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu 100 105 110 Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln 115 120 125 Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn 130 135 140 Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe 145 150 155 160 Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu 165 170 175 Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe 180 185 190 Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val 195 200 205 Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp 210 215 220 Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser 225 230 235 240 Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr 245 250 255 Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu 260 265 270 Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys 275 280 285 Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys 290 295 300 Leu 305 <210> 31 <211> 1188 <212> DNA <213> Myceliophthora thermophila <400> 31 cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc 60 gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac 120 tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc 180 gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc 240 cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag 300 tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc 360 ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac 420 ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc 480 cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac 540 ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc 600 ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac 660 aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac 720 ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc 780 ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac 840 aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag 900 tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc 960 aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag 1020 gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc 1080 tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc 1140 accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa 1188 <210> 32 <211> 389 <212> PRT <213> Myceliophthora thermophila <400> 32 Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala 1 5 10 15 Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser 20 25 30 Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr 35 40 45 Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr 50 55 60 Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr 65 70 75 80 Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly 85 90 95 Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe 100 105 110 Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr 115 120 125 Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln 130 135 140 Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val 145 150 155 160 Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His 165 170 175 Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe 180 185 190 Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu 195 200 205 Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu 210 215 220 Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly 225 230 235 240 Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala 245 250 255 Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro 260 265 270 Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser 275 280 285 Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg 290 295 300 Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val 305 310 315 320 Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val 325 330 335 Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly 340 345 350 Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser 355 360 365 Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu 370 375 380 Lys Lys Tyr Leu Pro 385 <210> 33 <211> 1232 <212> DNA <213> BASIDIOMYCETE CBS 495.95 <400> 33 ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac 60 ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg 120 gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca 180 acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta 240 gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca 300 gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga 360 acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct 420 tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc 480 ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg 540 tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct 600 acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag 660 gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc 720 ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg 780 cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga 840 cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc 900 agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca 960 ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg 1020 gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg 1080 cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc 1140 cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga 1200 tcctcccgca ggccctgctg ccgttcgcgt aa 1232 <210> 34 <211> 397 <212> PRT <213> BASIDIOMYCETE CBS 495.95 <400> 34 Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser 1 5 10 15 Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe 20 25 30 Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn 35 40 45 Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala 50 55 60 Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro 65 70 75 80 Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly 85 90 95 Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val 100 105 110 Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe 115 120 125 Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg 130 135 140 Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr 145 150 155 160 Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly 165 170 175 Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr 180 185 190 Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly 195 200 205 Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro 210 215 220 His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val 225 230 235 240 Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu 245 250 255 Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser 260 265 270 Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln 275 280 285 Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys 290 295 300 Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp 305 310 315 320 Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly 325 330 335 Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met 340 345 350 Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro 355 360 365 Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala 370 375 380 Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala 385 390 395 <210> 35 <211> 1303 <212> DNA <213> BASIDIOMYCETE CBS 495.95 <400> 35 ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc 60 ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc 120 cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt 180 gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc 240 tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac 300 aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg 360 ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg 420 gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt 480 ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat 540 gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac 600 caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt 660 catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa 720 tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta 780 cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc 840 cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac 900 gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac 960 ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt 1020 ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg 1080 actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt 1140 gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg 1200 ggctgcgggt ccctggtggg gcacgtacat ttactcgatt gaacctccga gcggtgccgc 1260 tatcccagaa gtccttcctc agggtctcgc tccattcctc tag 1303 <210> 36 <211> 429 <212> PRT <213> BASIDIOMYCETE CBS 495.95 <400> 36 Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala 1 5 10 15 Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly 20 25 30 Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu 35 40 45 Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr 50 55 60 Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val 65 70 75 80 Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr 85 90 95 Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser 100 105 110 Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val 115 120 125 Asn Glu Ser Gly Ala Glu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu 130 135 140 Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met 145 150 155 160 Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met 165 170 175 Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu 180 185 190 Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr 195 200 205 Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile 210 215 220 Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val 225 230 235 240 Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr 245 250 255 Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn 260 265 270 Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly 275 280 285 Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala 290 295 300 Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met 305 310 315 320 His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val 325 330 335 Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu 340 345 350 Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser 355 360 365 Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln 370 375 380 Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro 385 390 395 400 Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala 405 410 415 Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu 420 425 <210> 37 <211> 1580 <212> DNA <213> Thielavia terrestris <400> 37 agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa 60 gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc 120 cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga 180 cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga 240 ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt 300 ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc 360 ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg 420 ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta 480 caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa 540 agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca 600 caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc 660 aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac 720 gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc 780 tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag 840 aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc 900 tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag 960 ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc 1020 gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa 1080 gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat 1140 gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg 1200 gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt 1260 tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga 1320 tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg 1380 gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg 1440 tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc 1500 ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa 1560 gacggtccag catcatccgg 1580 <210> 38 <211> 396 <212> PRT <213> Thielavia terrestris <400> 38 Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala 1 5 10 15 Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser 20 25 30 Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp 35 40 45 Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu 50 55 60 Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys 65 70 75 80 Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn 85 90 95 Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile 100 105 110 Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys 115 120 125 Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr 130 135 140 Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr 145 150 155 160 Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr 165 170 175 Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu 180 185 190 Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met 195 200 205 Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu 210 215 220 Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser 225 230 235 240 Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser 245 250 255 Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr 260 265 270 Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala 275 280 285 Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg 290 295 300 Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val 305 310 315 320 Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu 325 330 335 Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly 340 345 350 Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp 355 360 365 Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr 370 375 380 Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe 385 390 395 <210> 39 <211> 1203 <212> DNA <213> Thielavia terrestris <400> 39 atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca 60 cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt 120 attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac 180 cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg 240 gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct 300 cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc 360 tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag 420 aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt 480 gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg 540 tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc 600 aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac 660 aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac 720 cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct 780 gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac 840 gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga 900 cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct 960 gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg 1020 attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg 1080 tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg 1140 ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg 1200 taa 1203 <210> 40 <211> 400 <212> PRT <213> Thielavia terrestris <400> 40 Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu 1 5 10 15 Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro 20 25 30 Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu 35 40 45 Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala 50 55 60 Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser 65 70 75 80 Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu 85 90 95 Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val 100 105 110 Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu 115 120 125 Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn 130 135 140 Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe 145 150 155 160 Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala 165 170 175 Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile 180 185 190 Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile 195 200 205 Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro 210 215 220 Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn 225 230 235 240 Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn 245 250 255 Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala 260 265 270 Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala 275 280 285 Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys 290 295 300 Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala 305 310 315 320 Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro 325 330 335 Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly 340 345 350 Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro 355 360 365 Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr 370 375 380 Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp 385 390 395 400 <210> 41 <211> 1501 <212> DNA <213> Thielavia terrestris <400> 41 gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt 60 ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg 120 ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc 180 gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc 240 ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa 300 ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag 360 tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc 420 tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat 480 ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc 540 ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc 600 cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc 660 tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc 720 tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac 780 aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc 840 cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat 900 gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc 960 ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg 1020 ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac 1080 agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac 1140 tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc 1200 caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg 1260 acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc 1320 ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg 1380 cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac 1440 ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg 1500 g 1501 <210> 42 <211> 464 <212> PRT <213> Thielavia terrestris <400> 42 Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val 1 5 10 15 Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val 20 25 30 His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val 35 40 45 Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His 50 55 60 Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His 65 70 75 80 Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu 85 90 95 Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu 100 105 110 Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val 115 120 125 Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu 130 135 140 Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu 145 150 155 160 Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr 165 170 175 Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly 180 185 190 Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu 195 200 205 Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu 210 215 220 Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly 225 230 235 240 Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr 245 250 255 Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe 260 265 270 Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr 275 280 285 Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala 290 295 300 Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser 305 310 315 320 Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg 325 330 335 Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met 340 345 350 Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly 355 360 365 Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe 370 375 380 Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly 385 390 395 400 Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg 405 410 415 Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His 420 425 430 Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu 435 440 445 Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu 450 455 460 <210> 43 <211> 1368 <212> DNA <213> Thielavia terrestris <400> 43 accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc 60 gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac 120 gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc 180 gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga 240 cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc 300 ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc 360 cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa 420 ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct 480 cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag 540 cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa 600 gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt 660 tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca 720 acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca 780 acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt 840 gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc 900 gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca 960 acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg 1020 tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct 1080 tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg 1140 ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga 1200 actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga 1260 tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg 1320 gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt 1368 <210> 44 <211> 423 <212> PRT <213> Thielavia terrestris <400> 44 Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu 1 5 10 15 Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys 20 25 30 Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg 35 40 45 Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly 50 55 60 Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala 65 70 75 80 Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala 85 90 95 His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu 100 105 110 Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu 115 120 125 Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala 130 135 140 Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn 145 150 155 160 Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro 165 170 175 Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln 180 185 190 Cys Pro Lys Leu Asp Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr 195 200 205 Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu 210 215 220 Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys 225 230 235 240 Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu 245 250 255 Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr 260 265 270 Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr 275 280 285 Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile 290 295 300 Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val 305 310 315 320 Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn 325 330 335 Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly 340 345 350 Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp 355 360 365 Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys 370 375 380 Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp 385 390 395 400 Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr 405 410 415 Tyr Lys Ser Glu Cys Ser His 420 <210> 45 <211> 1011 <212> DNA <213> Thielavia terrestris <400> 45 atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc 60 gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc 120 tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc 180 gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc 240 gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc 300 tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg 360 gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag 420 atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc 480 cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg 540 acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac 600 gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc 660 accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac 720 atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct 780 tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg 840 agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct 900 tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc 960 gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g 1011 <210> 46 <211> 336 <212> PRT <213> Thielavia terrestris <400> 46 Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala 1 5 10 15 Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr 20 25 30 Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val 35 40 45 Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg 50 55 60 Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala 65 70 75 80 Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala 85 90 95 Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met 100 105 110 Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu 115 120 125 Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp 130 135 140 Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys 145 150 155 160 Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met 165 170 175 Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg 180 185 190 Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr 195 200 205 Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr 210 215 220 Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr 225 230 235 240 Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys 245 250 255 Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu 260 265 270 Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln 275 280 285 Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly 290 295 300 Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val 305 310 315 320 Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn 325 330 335 <210> 47 <211> 1480 <212> DNA <213> Cladorrhinum foecundissimum <400> 47 gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca 60 caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac 120 cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg 180 ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg 240 cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc 300 tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga 360 cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac 420 tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct 480 ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc 540 tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc 600 cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga 660 ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa 720 ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga 780 aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa 840 cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc 900 ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt 960 cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat 1020 ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc 1080 ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat 1140 ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga 1200 gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc 1260 ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc 1320 gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg 1380 gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt 1440 agagcgggtt ggttggatat gaatacgttg aattggatgt 1480 <210> 48 <211> 440 <212> PRT <213> Cladorrhinum foecundissimum <400> 48 Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala 1 5 10 15 Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu 20 25 30 Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr 35 40 45 Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp 50 55 60 Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys 65 70 75 80 Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp 85 90 95 Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro 100 105 110 Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr 115 120 125 Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala 130 135 140 Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met 145 150 155 160 Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly 165 170 175 Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala 180 185 190 Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln 195 200 205 Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser 210 215 220 Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr 225 230 235 240 Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp 245 250 255 Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe 260 265 270 Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr 275 280 285 Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu 290 295 300 Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn 305 310 315 320 Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr 325 330 335 Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu 340 345 350 Lys Ala Met Gly Glu Ala Ile Gly Arg Gly Met Val Leu Val Phe Ser 355 360 365 Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly 370 375 380 Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys 385 390 395 400 Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu 405 410 415 Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg 420 425 430 Val Ala Arg Gly Leu Thr Ala Ser 435 440 <210> 49 <211> 1380 <212> DNA <213> Trichoderma reesei <400> 49 atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60 gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120 tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180 cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240 ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300 gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360 tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420 gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480 tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540 tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600 acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660 atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720 tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780 cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840 aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900 gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960 tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020 atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080 agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140 ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200 ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260 ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320 acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag 1380 <210> 50 <211> 459 <212> PRT <213> Trichoderma reesei <400> 50 Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile 1 5 10 15 Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val 20 25 30 His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val 35 40 45 Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His 50 55 60 Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr 65 70 75 80 Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly 85 90 95 Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr 100 105 110 Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser 115 120 125 Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys 130 135 140 Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro 145 150 155 160 Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly 165 170 175 Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr 180 185 190 Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn 195 200 205 Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly 210 215 220 Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala 225 230 235 240 Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys 245 250 255 Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr 260 265 270 Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu 275 280 285 Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser 290 295 300 Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala 305 310 315 320 Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val 325 330 335 Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu 340 345 350 Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser 355 360 365 Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile 370 375 380 Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro 385 390 395 400 Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr 405 410 415 Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly 420 425 430 Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys 435 440 445 Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu 450 455 <210> 51 <211> 1542 <212> DNA <213> Trichoderma reesei <400> 51 atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60 tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120 acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180 acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240 aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300 gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360 gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420 ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480 ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540 ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600 aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660 ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720 gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780 ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840 aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900 accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960 tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020 aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080 tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140 atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200 aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260 cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320 ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380 ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440 tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500 acaacttgcc aggtcctgaa cccttactac tctcagtgcc tg 1542 <210> 52 <211> 514 <212> PRT <213> Trichoderma reesei <400> 52 Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg 1 5 10 15 Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr 20 25 30 Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser 35 40 45 Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser 50 55 60 Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp 65 70 75 80 Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala 85 90 95 Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe 100 105 110 Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met 115 120 125 Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe 130 135 140 Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala 145 150 155 160 Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro 165 170 175 Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln 180 185 190 Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly 195 200 205 Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly 210 215 220 Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu 225 230 235 240 Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu 245 250 255 Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr 260 265 270 Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr 275 280 285 Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys 290 295 300 Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr 305 310 315 320 Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly 325 330 335 Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu 340 345 350 Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln 355 360 365 Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp 370 375 380 Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr 385 390 395 400 Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr 405 410 415 Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys 420 425 430 Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn 435 440 445 Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr 450 455 460 Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln 465 470 475 480 Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val 485 490 495 Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln 500 505 510 Cys Leu <210> 53 <211> 1413 <212> DNA <213> Trichoderma reesei <400> 53 atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct 60 ctagaggagc ggcaagcttg ctcaagcgtc tggggccaat gtggtggcca gaattggtcg 120 ggtccgactt gctgtgcttc cggaagcaca tgcgtctact ccaacgacta ttactcccag 180 tgtcttcccg gcgctgcaag ctcaagctcg tccacgcgcg ccgcgtcgac gacttctcga 240 gtatccccca caacatcccg gtcgagctcc gcgacgcctc cacctggttc tactactacc 300 agagtacctc cagtcggatc gggaaccgct acgtattcag gcaacccttt tgttggggtc 360 actccttggg ccaatgcata ttacgcctct gaagttagca gcctcgctat tcctagcttg 420 actggagcca tggccactgc tgcagcagct gtcgcaaagg ttccctcttt tatgtggcta 480 gatactcttg acaagacccc tctcatggag caaaccttgg ccgacatccg caccgccaac 540 aagaatggcg gtaactatgc cggacagttt gtggtgtatg acttgccgga tcgcgattgc 600 gctgcccttg cctcgaatgg cgaatactct attgccgatg gtggcgtcgc caaatataag 660 aactatatcg acaccattcg tcaaattgtc gtggaatatt ccgatatccg gaccctcctg 720 gttattgagc ctgactctct tgccaacctg gtgaccaacc tcggtactcc aaagtgtgcc 780 aatgctcagt cagcctacct tgagtgcatc aactacgccg tcacacagct gaaccttcca 840 aatgttgcga tgtatttgga cgctggccat gcaggatggc ttggctggcc ggcaaaccaa 900 gacccggccg ctcagctatt tgcaaatgtt tacaagaatg catcgtctcc gagagctctt 960 cgcggattgg caaccaatgt cgccaactac aacgggtgga acattaccag ccccccatcg 1020 tacacgcaag gcaacgctgt ctacaacgag aagctgtaca tccacgctat tggacctctt 1080 cttgccaatc acggctggtc caacgccttc ttcatcactg atcaaggtcg atcgggaaag 1140 cagcctaccg gacagcaaca gtggggagac tggtgcaatg tgatcggcac cggatttggt 1200 attcgcccat ccgcaaacac tggggactcg ttgctggatt cgtttgtctg ggtcaagcca 1260 ggcggcgagt gtgacggcac cagcgacagc agtgcgccac gatttgactc ccactgtgcg 1320 ctcccagatg ccttgcaacc ggcgcctcaa gctggtgctt ggttccaagc ctactttgtg 1380 cagcttctca caaacgcaaa cccatcgttc ctg 1413 <210> 54 <211> 471 <212> PRT <213> Trichoderma reesei <400> 54 Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala 1 5 10 15 Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly 20 25 30 Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly 35 40 45 Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly 50 55 60 Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg 65 70 75 80 Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly 85 90 95 Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr 100 105 110 Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr 115 120 125 Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met 130 135 140 Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu 145 150 155 160 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 165 170 175 Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 180 185 190 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 195 200 205 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 210 215 220 Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu 225 230 235 240 Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr 245 250 255 Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr 260 265 270 Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala 275 280 285 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala 290 295 300 Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu 305 310 315 320 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr 325 330 335 Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu 340 345 350 Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn 355 360 365 Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly 370 375 380 Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly 385 390 395 400 Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val 405 410 415 Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala 420 425 430 Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala 435 440 445 Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr 450 455 460 Asn Ala Asn Pro Ser Phe Leu 465 470 <210> 55 <211> 1377 <212> DNA <213> Trichoderma reesei <400> 55 atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60 gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120 tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180 cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240 ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300 gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360 tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420 gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480 tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540 tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600 acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660 atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720 tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780 cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840 aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900 gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960 tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020 atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080 agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140 ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200 ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260 ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320 acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctt 1377 <210> 56 <211> 459 <212> PRT <213> Trichoderma reesei <400> 56 Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile 1 5 10 15 Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val 20 25 30 His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val 35 40 45 Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His 50 55 60 Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr 65 70 75 80 Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly 85 90 95 Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr 100 105 110 Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser 115 120 125 Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys 130 135 140 Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro 145 150 155 160 Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly 165 170 175 Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr 180 185 190 Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn 195 200 205 Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly 210 215 220 Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala 225 230 235 240 Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys 245 250 255 Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr 260 265 270 Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu 275 280 285 Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser 290 295 300 Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala 305 310 315 320 Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val 325 330 335 Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu 340 345 350 Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser 355 360 365 Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile 370 375 380 Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro 385 390 395 400 Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr 405 410 415 Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly 420 425 430 Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys 435 440 445 Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu 450 455 <210> 57 <211> 1254 <212> DNA <213> Trichoderma reesei <400> 57 atgaacaagt ccgtggctcc attgctgctt gcagcgtcca tactatatgg cggcgccgtc 60 gcacagcaga ctgtctgggg ccagtgtgga ggtattggtt ggagcggacc tacgaattgt 120 gctcctggct cagcttgttc gaccctcaat ccttattatg cgcaatgtat tccgggagcc 180 actactatca ccacttcgac ccggccacca tccggtccaa ccaccaccac cagggctacc 240 tcaacaagct catcaactcc acccacgagc tctggggtcc gatttgccgg cgttaacatc 300 gcgggttttg actttggctg taccacagat ggcacttgcg ttacctcgaa ggtttatcct 360 ccgttgaaga acttcaccgg ctcaaacaac taccccgatg gcatcggcca gatgcagcac 420 ttcgtcaacg aggacgggat gactattttc cgcttacctg tcggatggca gtacctcgtc 480 aacaacaatt tgggcggcaa tcttgattcc acgagcattt ccaagtatga tcagcttgtt 540 caggggtgcc tgtctctggg cgcatactgc atcgtcgaca tccacaatta tgctcgatgg 600 aacggtggga tcattggtca gggcggccct actaatgctc aattcacgag cctttggtcg 660 cagttggcat caaagtacgc atctcagtcg agggtgtggt tcggcatcat gaatgagccc 720 cacgacgtga acatcaacac ctgggctgcc acggtccaag aggttgtaac cgcaatccgc 780 aacgctggtg ctacgtcgca attcatctct ttgcctggaa atgattggca atctgctggg 840 gctttcatat ccgatggcag tgcagccgcc ctgtctcaag tcacgaaccc ggatgggtca 900 acaacgaatc tgatttttga cgtgcacaaa tacttggact cagacaactc cggtactcac 960 gccgaatgta ctacaaataa cattgacggc gccttttctc cgcttgccac ttggctccga 1020 cagaacaatc gccaggctat cctgacagaa accggtggtg gcaacgttca gtcctgcata 1080 caagacatgt gccagcaaat ccaatatctc aaccagaact cagatgtcta tcttggctat 1140 gttggttggg gtgccggatc atttgatagc acgtatgtcc tgacggaaac accgactagc 1200 agtggtaact catggacgga cacatccttg gtcagctcgt gtctcgcaag aaag 1254 <210> 58 <211> 418 <212> PRT <213> Trichoderma reesei <400> 58 Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr 1 5 10 15 Gly Gly Ala Val Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile 20 25 30 Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr 35 40 45 Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr 50 55 60 Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr 65 70 75 80 Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala 85 90 95 Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr 100 105 110 Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser 115 120 125 Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Glu 130 135 140 Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val 145 150 155 160 Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr 165 170 175 Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val 180 185 190 Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly 195 200 205 Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser 210 215 220 Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro 225 230 235 240 His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val 245 250 255 Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro 260 265 270 Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala 275 280 285 Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu 290 295 300 Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His 305 310 315 320 Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala 325 330 335 Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly 340 345 350 Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln 355 360 365 Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly 370 375 380 Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Ser 385 390 395 400 Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala 405 410 415 Arg Lys <210> 59 <211> 702 <212> DNA <213> Trichoderma reesei <400> 59 atgaagttcc ttcaagtcct ccctgccctc ataccggccg ccctggccca aaccagctgt 60 gaccagtggg caaccttcac tggcaacggc tacacagtca gcaacaacct ttggggagca 120 tcagccggct ctggatttgg ctgcgtgacg gcggtatcgc tcagcggcgg ggcctcctgg 180 cacgcagact ggcagtggtc cggcggccag aacaacgtca agtcgtacca gaactctcag 240 attgccattc cccagaagag gaccgtcaac agcatcagca gcatgcccac cactgccagc 300 tggagctaca gcgggagcaa catccgcgct aatgttgcgt atgacttgtt caccgcagcc 360 aacccgaatc atgtcacgta ctcgggagac tacgaactca tgatctggct tggcaaatac 420 ggcgatattg ggccgattgg gtcctcacag ggaacagtca acgtcggtgg ccagagctgg 480 acgctctact atggctacaa cggagccatg caagtctatt cctttgtggc ccagaccaac 540 actaccaact acagcggaga tgtcaagaac ttcttcaatt atctccgaga caataaagga 600 tacaacgctg caggccaata tgttcttagc taccaatttg gtaccgagcc cttcacgggc 660 agtggaactc tgaacgtcgc atcctggacc gcatctatca ac 702 <210> 60 <211> 234 <212> PRT <213> Trichoderma reesei <400> 60 Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala 1 5 10 15 Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr 20 25 30 Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys 35 40 45 Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp 50 55 60 Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln 65 70 75 80 Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro 85 90 95 Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val 100 105 110 Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser 115 120 125 Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly 130 135 140 Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp 145 150 155 160 Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val 165 170 175 Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe 180 185 190 Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val 195 200 205 Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu 210 215 220 Asn Val Ala Ser Trp Thr Ala Ser Ile Asn 225 230 <210> 61 <211> 726 <212> DNA <213> Trichoderma reesei <400> 61 atgaaggcaa ctctggttct cggctccctc attgtaggcg ccgtttccgc gtacaaggcc 60 accaccacgc gctactacga tgggcaggag ggtgcttgcg gatgcggctc gagctccggc 120 gcattcccgt ggcagctcgg catcggcaac ggagtctaca cggctgccgg ctcccaggct 180 ctcttcgaca cggccggagc ttcatggtgc ggcgccggct gcggtaaatg ctaccagctc 240 acctcgacgg gccaggcgcc ctgctccagc tgcggcacgg gcggtgctgc tggccagagc 300 atcatcgtca tggtgaccaa cctgtgcccg aacaatggga acgcgcagtg gtgcccggtg 360 gtcggcggca ccaaccaata cggctacagc taccatttcg acatcatggc gcagaacgag 420 atctttggag acaatgtcgt cgtcgacttt gagcccattg cttgccccgg gcaggctgcc 480 tctgactggg ggacgtgcct ctgcgtggga cagcaagaga cggatcccac gcccgtcctc 540 ggcaacgaca cgggctcaac tcctcccggg agctcgccgc cagcgacatc gtcgagtccg 600 ccgtctggcg gcggccagca gacgctctat ggccagtgtg gaggtgccgg ctggacggga 660 cctacgacgt gccaggcccc agggacctgc aaggttcaga accagtggta ctcccagtgt 720 cttcct 726 <210> 62 <211> 242 <212> PRT <213> Trichoderma reesei <400> 62 Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser 1 5 10 15 Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala 20 25 30 Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile 35 40 45 Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr 50 55 60 Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu 65 70 75 80 Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala 85 90 95 Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn 100 105 110 Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly 115 120 125 Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp 130 135 140 Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala 145 150 155 160 Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro 165 170 175 Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser 180 185 190 Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr 195 200 205 Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys 210 215 220 Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys 225 230 235 240 Leu Pro <210> 63 <211> 1446 <212> DNA <213> Thielavia terrestris <400> 63 atggctcaga agctccttct cgccgccgcc cttgcggcca gcgccctcgc tgctcccgtc 60 gtcgaggagc gccagaactg cggttccgtc tggagccaat gcggcggcat tggctggtcc 120 ggcgcgacct gctgcgcttc gggcaatacc tgcgttgagc tgaacccgta ctactcgcag 180 tgcctgccca acagccaggt gactacctcg accagcaaga ccacctccac caccaccagg 240 agcagcacca ccagccacag cagcggtccc accagcacga gcaccaccac caccagcagt 300 cccgtggtca ctaccccgcc gagtacctcc atccccggcg gtgcctcgtc aacggccagc 360 tggtccggca acccgttctc gggcgtgcag atgtgggcca acgactacta cgcctccgag 420 gtctcgtcgc tggccatccc cagcatgacg ggcgccatgg ccaccaaggc ggccgaggtg 480 gccaaggtgc ccagcttcca gtggcttgac cgcaacgtca ccatcgacac gctgttcgcc 540 cacacgctgt cgcagatccg cgcggccaac cagaaaggcg ccaacccgcc ctacgcgggc 600 atcttcgtgg tctacgacct tccggaccgc gactgcgccg ccgccgcgtc caacggcgag 660 ttctccatcg cgaacaacgg ggcggccaac tacaagacgt acatcgacgc gatccggagc 720 ctcgtcatcc agtactcaga catccgcatc atcttcgtca tcgagcccga ctcgctggcc 780 aacatggtga ccaacctgaa cgtggccaag tgcgccaacg ccgagtcgac ctacaaggag 840 ttgaccgtct acgcgctgca gcagctgaac ctgcccaacg tggccatgta cctggacgcc 900 ggccacgccg gctggctcgg ctggcccgcc aacatccagc cggccgccaa cctcttcgcc 960 gagatctaca cgagcgccgg caagccggcc gccgtgcgcg gcctcgccac caacgtggcc 1020 aactacaacg gctggagcct ggccacgccg ccctcgtaca cccagggcga ccccaactac 1080 gacgagagcc actacgtcca ggccctcgcc ccgctgctca ccgccaacgg cttccccgcc 1140 cacttcatca ccgacaccgg ccgcaacggc aagcagccga ccggacaacg gcaatgggga 1200 gactggtgca acgttatcgg aactggcttc ggcgtgcgcc cgacgacaaa caccggcctc 1260 gacatcgagg acgccttcgt ctgggtcaag cccggcggcg agtgcgacgg cacgagcaac 1320 acgacctctc cccgctacga ctaccactgc ggcctgtcgg acgcgctgca gcctgctccg 1380 gaggccggca cttggttcca ggcctacttc gagcagctcc tgaccaacgc caacccgccc 1440 ttttaa 1446 <210> 64 <211> 481 <212> PRT <213> Thielavia terrestris <400> 64 Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu 1 5 10 15 Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser 20 25 30 Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly 35 40 45 Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn 50 55 60 Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg 65 70 75 80 Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr 85 90 95 Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro 100 105 110 Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly 115 120 125 Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu 130 135 140 Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val 145 150 155 160 Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp 165 170 175 Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys 180 185 190 Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro 195 200 205 Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala 210 215 220 Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser 225 230 235 240 Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro 245 250 255 Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala 260 265 270 Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln 275 280 285 Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly 290 295 300 Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala 305 310 315 320 Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala 325 330 335 Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser 340 345 350 Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala 355 360 365 Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr 370 375 380 Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly 385 390 395 400 Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr 405 410 415 Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly 420 425 430 Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr 435 440 445 His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr 450 455 460 Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro 465 470 475 480 Phe <210> 65 <211> 29 <212> DNA <213> Trichoderma reesei <400> 65 aacgttaatt aaggaatcgt tttgtgttt 29 <210> 66 <211> 29 <212> DNA <213> Trichoderma reesei <400> 66 agtactagta gctccgtggc gaaagcctg 29 <210> 67 <211> 31 <212> DNA <213> Saccharomyces cerevisiae <400> 67 ttgaattgaa aatagattga tttaaaactt c 31 <210> 68 <211> 25 <212> DNA <213> Saccharomyces cerevisiae <400> 68 ttgcatgcgt aatcatggtc atagc 25 <210> 69 <211> 26 <212> DNA <213> Saccharomyces cerevisiae <400> 69 ttgaattcat gggtaataac tgatat 26 <210> 70 <211> 32 <212> DNA <213> Saccharomyces cerevisiae <400> 70 aaatcaatct attttcaatt caattcatca tt 32 <210> 71 <211> 11 <212> DNA <213> Aspergillus niger <400> 71 gtactaaaac c 11 <210> 72 <211> 11 <212> DNA <213> Aspergillus niger <400> 72 ccgttaaatt t 11 <210> 73 <211> 45 <212> DNA <213> Aspergillus niger <400> 73 ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc 45 <210> 74 <211> 14 <212> DNA <213> Aspergillus niger <400> 74 atgcaattta aact 14 <210> 75 <211> 14 <212> DNA <213> Aspergillus niger <400> 75 cggcaattta acgg 14 <210> 76 <211> 44 <212> DNA <213> Aspergillus niger <400> 76 ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc 44 <210> 77 <211> 29 <212> DNA <213> Humicola insolens <400> 77 aagcttaagc atgcgttcct cccccctcc 29 <210> 78 <211> 32 <212> DNA <213> Humicola insolens <400> 78 ctgcagaatt ctacaggcac tgatggtacc ag 32 <210> 79 <211> 32 <212> DNA <213> Trichoderma reesei <400> 79 ctgcagaatt ctacaggcac tgatggtacc ag 32 <210> 80 <211> 36 <212> DNA <213> Trichoderma reesei <400> 80 accgcggact gcgcatcatg cgttcctccc ccctcc 36 <210> 81 <211> 29 <212> DNA <213> Trichoderma reesei <400> 81 aaacgtcgac cgaatgtagg attgttatc 29 <210> 82 <211> 17 <212> DNA <213> Trichoderma reesei <400> 82 gatgcgcagt ccgcggt 17 <210> 83 <211> 29 <212> DNA <213> Trichoderma reesei <400> 83 aaacgtcgac cgaatgtagg attgttatc 29 <210> 84 <211> 36 <212> DNA <213> Trichoderma reesei <400> 84 ggagggggga ggaacgcatg atgcgcagtc cgcggt 36 <210> 85 <211> 29 <212> DNA <213> Trichoderma reesei <400> 85 aaacgtcgac cgaatgtagg attgttatc 29 <210> 86 <211> 32 <212> DNA <213> Trichoderma reesei <400> 86 ctgcagaatt ctacaggcac tgatggtacc ag 32 <210> 87 <211> 46 <212> DNA <213> Aspergillus oryzae <400> 87 atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg 46 <210> 88 <211> 26 <212> DNA <213> Aspergillus oryzae <400> 88 actagtttac tgggccttag gcagcg 26 <210> 89 <211> 26 <212> DNA <213> Trichoderma reesei <400> 89 gtcgactcga agcccgaatg taggat 26 <210> 90 <211> 45 <212> DNA <213> Trichoderma reesei <400> 90 cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta 45 <210> 91 <211> 57 <212> DNA <213> Aspergillus oryzae <400> 91 atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgcc 57 <210> 92 <211> 19 <212> PRT <213> Aspergillus oryzae <400> 92 Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val 1 5 10 15 Val Ser Ala <210> 93 <211> 42 <212> DNA <213> Aspergillus oryzae <400> 93 tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc 42 <210> 94 <211> 28 <212> DNA <213> Aspergillus oryzae <400> 94 gactagtctt actgggcctt aggcagcg 28 <210> 95 <211> 63 <212> DNA <213> Humicola insolens <400> 95 atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60 gcc 63 <210> 96 <211> 21 <212> PRT <213> Humicola insolens <400> 96 Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro 1 5 10 15 Val Leu Ala Leu Ala 20 <210> 97 <211> 30 <212> DNA <213> Trichoderma reesei <400> 97 acgcgtcgac cgaatgtagg attgttatcc 30 <210> 98 <211> 42 <212> DNA <213> Trichoderma reesei <400> 98 gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca 42 <210> 99 <211> 20 <212> DNA <213> Trichoderma reesei <400> 99 cccaagctta gccaagaaca 20 <210> 100 <211> 29 <212> DNA <213> Trichoderma reesei <400> 100 gggggaggaa cgcatgggat ctggacggc 29 <210> 101 <211> 30 <212> DNA <213> Aspergillus oryzae <400> 101 gccgtccaga tccccatgcg ttcctccccc 30 <210> 102 <211> 20 <212> DNA <213> Aspergillus oryzae <400> 102 ccaagcttgt tcagagtttc 20 <210> 103 <211> 3294 <212> DNA <213> Aspergillus oryzae <400> 103 atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60 gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120 aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180 gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240 accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300 agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360 gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420 ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480 ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540 cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600 ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660 cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720 ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780 tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840 tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900 actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960 aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020 tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080 cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140 gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca 1200 gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260 gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320 gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380 actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440 gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500 aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560 caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620 accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680 acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740 gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800 ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860 gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920 aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980 gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040 acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100 caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160 tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220 aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280 atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340 accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400 aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460 gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520 cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580 tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640 cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700 gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760 aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820 catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880 aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940 ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000 cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060 tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120 cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180 aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240 ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294 <210> 104 <211> 1097 <212> PRT <213> Aspergillus oryzae <400> 104 Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro 1 5 10 15 Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys 20 25 30 Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro 35 40 45 Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala 50 55 60 Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln 65 70 75 80 Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr 85 90 95 Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu 100 105 110 Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln 115 120 125 Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn 130 135 140 Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe 145 150 155 160 Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu 165 170 175 Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe 180 185 190 Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val 195 200 205 Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp 210 215 220 Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu 225 230 235 240 Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys 245 250 255 Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp 260 265 270 Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val 275 280 285 Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly 290 295 300 Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu 305 310 315 320 Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe 325 330 335 Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr 340 345 350 Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu 355 360 365 Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro 370 375 380 Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro 385 390 395 400 Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile 405 410 415 Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu 420 425 430 Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn 435 440 445 Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu 450 455 460 Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala 465 470 475 480 Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn 485 490 495 Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly 500 505 510 Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala 515 520 525 Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser 530 535 540 Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly 545 550 555 560 Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala 565 570 575 Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe 580 585 590 Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser 595 600 605 Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp 610 615 620 His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu 625 630 635 640 Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala 645 650 655 Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys 660 665 670 Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser 675 680 685 Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln 690 695 700 Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser 705 710 715 720 Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser 725 730 735 Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp 740 745 750 Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp 755 760 765 Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile 770 775 780 Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro 785 790 795 800 Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly 805 810 815 Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys 820 825 830 Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu 835 840 845 Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr 850 855 860 Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr 865 870 875 880 Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu 885 890 895 Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr 900 905 910 Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala 915 920 925 Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile 930 935 940 Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser 945 950 955 960 Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp 965 970 975 Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn 980 985 990 Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn 995 1000 1005 Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser 1010 1015 1020 Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu 1025 1030 1035 Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr 1040 1045 1050 Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp 1055 1060 1065 Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser 1070 1075 1080 Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln 1085 1090 1095 <210> 105 <211> 3294 <212> DNA <213> Aspergillus oryzae <400> 105 atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60 gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120 aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180 gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240 accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300 agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360 gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420 ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480 ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540 cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600 ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660 cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720 ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780 tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840 tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900 actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960 aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020 tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080 cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140 gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca 1200 gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260 gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320 gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380 actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440 gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500 aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560 catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620 accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680 acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740 gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800 ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860 gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920 aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980 gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040 acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100 caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160 tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220 aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280 atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340 accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400 aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460 gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520 cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580 tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640 cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700 gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760 aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820 catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880 aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940 ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000 cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060 tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120 cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180 aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240 ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294 <210> 106 <211> 1097 <212> PRT <213> Aspergillus oryzae <400> 106 Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro 1 5 10 15 Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys 20 25 30 Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro 35 40 45 Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala 50 55 60 Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln 65 70 75 80 Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr 85 90 95 Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu 100 105 110 Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln 115 120 125 Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn 130 135 140 Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe 145 150 155 160 Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu 165 170 175 Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe 180 185 190 Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val 195 200 205 Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp 210 215 220 Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu 225 230 235 240 Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys 245 250 255 Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp 260 265 270 Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val 275 280 285 Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly 290 295 300 Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu 305 310 315 320 Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe 325 330 335 Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr 340 345 350 Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu 355 360 365 Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro 370 375 380 Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro 385 390 395 400 Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile 405 410 415 Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu 420 425 430 Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn 435 440 445 Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu 450 455 460 Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala 465 470 475 480 Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn 485 490 495 Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly 500 505 510 Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala 515 520 525 Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser 530 535 540 Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly 545 550 555 560 Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala 565 570 575 Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe 580 585 590 Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser 595 600 605 Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp 610 615 620 His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu 625 630 635 640 Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala 645 650 655 Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys 660 665 670 Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser 675 680 685 Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln 690 695 700 Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser 705 710 715 720 Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser 725 730 735 Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp 740 745 750 Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp 755 760 765 Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile 770 775 780 Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro 785 790 795 800 Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly 805 810 815 Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys 820 825 830 Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu 835 840 845 Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr 850 855 860 Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr 865 870 875 880 Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu 885 890 895 Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr 900 905 910 Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala 915 920 925 Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile 930 935 940 Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser 945 950 955 960 Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp 965 970 975 Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn 980 985 990 Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn 995 1000 1005 Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser 1010 1015 1020 Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu 1025 1030 1035 Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr 1040 1045 1050 Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp 1055 1060 1065 Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser 1070 1075 1080 Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln 1085 1090 1095 <210> 107 <211> 20 <212> DNA <213> Aspergillus oryzae <400> 107 ggactgcgca gcatgcgttc 20 <210> 108 <211> 30 <212> DNA <213> Aspergillus oryzae <400> 108 agttaattaa ttactgggcc ttaggcagcg 30 <210> 109 <211> 28 <212> DNA <213> Thermoascus aurantiacus <400> 109 atgtcctttt ccaagataat tgctactg 28 <210> 110 <211> 26 <212> DNA <213> Thermoascus aurantiacus <400> 110 gcttaattaa ccagtataca gaggag 26

Claims (51)

  1. (a) 셀룰로오스 가수분해 증진 활성을 갖는 천연 또는 이종 폴리펩티드를 암호화하는 제1 폴리뉴클레오티드; (b) 천연 또는 이종 베타-글루코시다아제를 암호화하는 제2 폴리뉴클레오티드; 및 (c) Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A) 및 Trichoderma reesei 엔도글루카나아제 I (CEL7B), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 선택된 천연 또는 이종 셀룰로오스 가수분해 효소를 암호화하는 하나 이상의(다수의) 제3 폴리뉴클레오티드를 포함하는 사상 진균 숙주 세포.
  2. 제 1 항에 있어서, 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는
    (a) [ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ] 및 [FW]-[TF]-K-[AIV]를 포함하는 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드, 여기서 X는 어떤 아미노산이고, X(4,5)는 4 또는 5개 연속 위치된 어떤 아미노산이고, X(4)는 4개 연속 위치된 어떤 아미노산이다; 및
    (b) [ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]를 포함하는 셀룰로오스 가수분해 증진 활성을 갖는 폴레핍티드, 여기서 x는 어떤 아미노산이고, x(4,5)는 4 또는 5개 연속 위치된 어떤 아미노산이고, x(3)는 3개 연속 위치된 어떤 어미노산이다;
    으로 구성된 군에서 선택되고,
    여기서 [ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ] 및 [FW]-[TF]-K-[AIV]를 포함하는 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는
    H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
    [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV], 또는
    H-X(1,2)-G-P-X(3)-[YW]-[AILMV] 및 [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X- [ILV]을 선택적으로 더 포함하고,
    여기서 X는 어떤 아미노산이고, X(1,2)는 1개 위치된 또는 2개 연속 위치된 어떤 아미노산이고, X(3)는 3개 연속 위치된 어떤 아미노산이고, X(2)는 2개 연속 위치된 어떤 아미노산인 것을 특징으로 하는 사상 진균 숙주 세포.
  3. 제 1 항에 있어서, 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는
    (a) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, 또는 SEQ ID NO: 11의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열, 또는 SEQ ID NO: 7, SEQ ID NO: 9 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드의 변이체; 및
    (e) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함하거나 또는 이들로 구성된 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드
    로 구성된 군에서 선택된 것을 특징으로 하는 사상 진균 숙주 세포.
  4. 제 1 항에 있어서, 베타-글루코시다아제는 베타-글루코시다아제 융합 단백질인 것을 특징으로 하는 사상 진균 숙주 세포.
  5. 제 4 항에 있어서, 베타-글루코시다아제 융합 단백질은 (a) 신호 펩티드를 포함하는 제1 아미노산 서열; (b) 적어도 엔도글루카나아제의 촉매 도메인을 포함하는 제2 아미노산 서열; 및 (c) 적어도 베타-글루코시다아제의 촉매 도메인을 포함하는 제3 아미노산 서열을 포함하며; 여기서 제1 아미노산 서열의 C-말단은 제2 아미노산 서열의 N-말단에 프레임 내에서 결합되고, 제2 아미노산 서열의 C-말단은 제3 아미노산 서열의 N-말단에 프레임 내에서 결합된 것을 특징으로 하는 사상 진균 숙주 세포.
  6. 제 5 항에 있어서, 베타-글루코시다아제 융합 단백질은 SEQ ID NO: 103 또는 SEQ ID NO: 105를 포함하거나 또는 이들로 구성된 것을 특징으로 하는 사상 진균 숙주 세포.
  7. 제 1 항에 있어서, Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 52의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람 직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (C) SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 52의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 사상 진균 숙주 세포.
  8. 제 1 항에 있어서, Trichoderma reesei 셀로비오히드롤라아제 I(CEL7A)은 SEQ ID NO: 52의 성숙한 폴리펩티드를 포함하거나 또는 그것으로 구성된 것을 특징으로 하는 사상 진균 숙주 세포.
  9. 제 1 항에 있어서, Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 54의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (C) SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어 도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 54의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 사상 진균 숙주 세포.
  10. 제 1 항에 있어서, Trichoderma reesei 셀로비오히드롤라아제 II(CEL6A)은 SEQ ID NO: 54의 성숙한 폴리펩티드를 포함하거나 또는 그것으로 구성된 것을 특징으로 하는 사상 진균 숙주 세포.
  11. 제 1 항에 있어서, Trichoderma reesei 엔도글루카나아제 I (CEL7B)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 56의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 56의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 사상 진균 숙주 세포.
  12. 제 1 항에 있어서, Trichoderma reesei 엔도글루카나아제 I (CEL7B)은 SEQ ID NO: 56의 성숙한 폴리펩티드를 포함하거나 또는 그것으로 구성된 것을 특징으로 하는 사상 진균 숙주 세포.
  13. 제 1 항 내지 제 12 항 중 어느 한 항에 있어서, Trichoderma reesei 엔도글루카나아제 II (CEL5A), Trichoderma reesei 엔도글루카나아제 III (CEL12A), 및 Trichoderma reesei 엔도글루카나아제 V (CEL45A), 및 이들의 오르소로그 또는 변 이체로 구성된 군에서 선택된 셀룰로오스 가수분해 효소를 암호화하는 하나 이상의(다수의) 제4 폴리뉴클레오티드를 더 포함하는 것을 특징으로 하는 사상 진균 숙주 세포.
  14. 제 13 항에 있어서, Trichoderma reesei 엔도글루카나아제 II (CEL5A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 58의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람 직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 58의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 사상 진균 숙주 세포.
  15. 제 13 항에 있어서, Trichoderma reesei 엔도글루카나아제 II (CEL5A)은 SEQ ID NO: 58의 성숙한 폴리펩티드를 포함하거나 또는 그것으로 구성된 것을 특징으로 하는 사상 진균 숙주 세포.
  16. 제 13 항에 있어서, Trichoderma reesei 엔도글루카나아제 III (CEL12A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 60의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 60의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 사상 진균 숙주 세포.
  17. 제 13 항에 있어서, Trichoderma reesei 엔도글루카나아제 III (CEL12A)은 SEQ ID NO: 60을 포함하거나 또는 그것으로 구성된 성숙한 폴리펩티드인 것을 특징으로 하는 사상 진균 숙주 세포.
  18. 제 13 항에 있어서, Trichoderma reesei 엔도글루카나아제 V (CEL45A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 62의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 62의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 사상 진균 숙주 세포.
  19. 제 13 항에 있어서, Trichoderma reesei 엔도글루카나아제 V (CEL45A)은 SEQ ID NO: 61을 포함하거나 또는 그것으로 구성된 성숙한 폴리펩티드인 것을 특징으로 하는 사상 진균 숙주 세포.
  20. 제 1 항에 있어서, SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하는 셀룰로오스 가수분해 단백질 조성물을 생성하는 것을 특징으로 하는 사상 진균 숙주 세포.
  21. 제 1 항 내지 제 20 항 중 어느 한 항에 있어서, SEQ ID NO: 58의 Trichoderma reesei 엔도글루카나아제 II (CEL5A), SEQ ID NO: 62의 Trichoderma reesei 엔도글루카나아제 V (CEL45A), 및 SEQ ID NO: 60의 Trichoderma reesei 엔도글루카나아제 III (CEL12A)로 구성된 군에서 선택된 하나 이상의(다수의) 효소를 더 생성하는 것을 특징으로 하는 사상 진균 숙주 세포.
  22. 제 1 항 내지 제 21 항 중 어느 한 항에 있어서, SEQ ID NO: 64의 성숙한 폴 리펩티드의 Thielavia terrestris 셀로비오히드롤라아제를 더 생성하는 것을 특징으로 하는 사상 진균 숙주 세포.
  23. (a) 제 1 항 내지 제 22 항 중 어느 한 항의 숙주 세포를 폴리펩티드의 생성 조건하에서 배양하는 단계; 및 (b) 폴리펩티드를 회수하는 단계를 포함하는, 셀룰로오스 가수분해 단백질 조성물의 제조방법.
  24. 제 23 항의 방법에 의해 얻어진 셀룰로오스 가수분해 단백질 조성물.
  25. (a) 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; (b) 베타-글루코시다아제; 및 (c) Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 Trichoderma reesei 엔도글루카나아제 I (CEL7B), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 선택된 하나 이상의(다수의) 셀룰로오스 가수분해 효소를 포함하는, 셀룰로오스 가수분해 단백질 조성물.
  26. 제 25 항에 있어서, 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는
    (a) [ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ] 및 [FW]-[TF]-K-[AIV]를 포함하는 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드, 여기서 X는 어떤 아미노산이고, X(4,5)는 4 또는 5개 연속 위치된 어떤 아미노산이고, X(4)는 4개 연속 위치된 어떤 아미노산이다; 및
    (b) [ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]를 포함하는 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드, 여기서 x는 어떤 아미노산이고, x(4,5)는 4 또는 5개 연속 위치된 어떤 아미노산이고, x(3)는 3개 연속 위치된 어떤 어미노산이다;
    으로 구성된 군에서 선택되고,
    여기서 [ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ] 및 [FW]-[TF]-K-[AIV]를 포함하는 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는
    H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
    [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV], 또는
    H-X(1,2)-G-P-X(3)-[YW]-[AILMV] 및 [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X- [ILV]을 더 포함하고,
    여기서 X는 어떤 아미노산이고, X(1,2)는 1개 위치된 또는 2개 연속 위치된 어떤 아미노산이고, X(3)는 3개 연속 위치된 어떤 아미노산이고, X(2)는 2개 연속 위치된 어떤 아미노산인 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  27. 제 25 항에 있어서, 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드는
    (a) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어 도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, 또는 SEQ ID NO: 11의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열, 또는 SEQ ID NO: 7, SEQ ID NO: 9 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, 또는 SEQ ID NO: 13의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드의 변이체; 및
    (e) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, 또는 SEQ ID NO: 10, SEQ ID NO: 12, 또는 SEQ ID NO: 14의 성숙한 폴리펩티드 또는 셀룰로오스 가수분해 증진 활성을 갖는 이들의 단편을 포함하거나 또는 이들로 구성된 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드
    로 구성된 군에서 선택된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  28. 제 25 항에 있어서, 베타-글루코시다아제는 베타-글루코시다아제 융합 단백질인 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  29. 제 28 항에 있어서, 베타-글루코시다아제 융합 단백질은 (a) 신호 펩티드를 포함하는 제1 아미노산 서열; (b) 적어도 엔도글루카나아제의 촉매 도메인을 포함하는 제2 아미노산 서열; 및 (c) 적어도 베타-글루코시다아제의 촉매 도메인을 포함하는 제3 아미노산 서열을 포함하며; 여기서 제1 아미노산 서열의 C-말단은 제2 아미노산 서열의 N-말단에 프레임 내에서 결합되고, 제2 아미노산 서열의 C-말단은 제3 아미노산 서열의 N-말단에 프레임 내에서 결합된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  30. 제 29 항에 있어서, 베타-글루코시다아제 융합 단백질은 SEQ ID NO: 103 또 는 SEQ ID NO: 105를 포함하거나 또는 이들로 구성된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  31. 제 25 항에 있어서, Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 52의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (C) SEQ ID NO: 51의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어 도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 52의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  32. 제 25 항에 있어서, Trichoderma reesei 셀로비오히드롤라아제 I(CEL7A)은 SEQ ID NO: 52의 성숙한 폴리펩티드를 포함하거나 또는 그것으로 구성된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  33. 제 25 항에 있어서, Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 54의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (C) SEQ ID NO: 53의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 54의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  34. 제25항에 있어서, Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A)은 SEQ ID NO: 54의 성숙한 폴리펩티드를 포함하거나 또는 그것으로 구성된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  35. 제 25 항에 있어서, Trichoderma reesei 엔도글루카나아제 I (CEL7B)의 오르 소로그 또는 변이체는
    (a) SEQ ID NO: 56의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 55의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 56의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  36. 제 25 항에 있어서, Trichoderma reesei 엔도글루카나아제 I (CEL7B)은 SEQ ID NO: 56의 성숙한 폴리펩티드를 포함하거나 또는 그것으로 구성된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  37. 제 25 항 내지 제 36 항 중 어느 한 항에 있어서, Trichoderma reesei 엔도글루카나아제 II (CEL5A), Trichoderma reesei 엔도글루카나아제 III (CEL12A), 및 Trichoderma reesei 엔도글루카나아제 V (CEL45A), 및 이들의 오르소로그 또는 변이체로 구성된 군에서 선택된 셀룰로오스 가수분해 효소를 암호화하는 하나 이상의(다수의) 제4 폴리뉴클레오티드를 더 포함하는 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  38. 제 37 항에 있어서, Trichoderma reesei 엔도글루카나아제 II (CEL5A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 58의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미 노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (C) SEQ ID NO: 57의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 58의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  39. 제 37 항에 있어서, Trichoderma reesei 엔도글루카나아제 II (CEL5A)은 SEQ ID NO: 58의 성숙한 폴리펩티드를 포함하거나 또는 그것으로 구성된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  40. 제 37 항에 있어서, Trichoderma reesei 엔도글루카나아제 III (CEL12A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 60의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 59의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩 티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 60의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  41. 제 37 항에 있어서, Trichoderma reesei 엔도글루카나아제 III (CEL12A)은 SEQ ID NO: 60을 포함하거나 또는 그것으로 구성된 성숙한 폴리펩티드인 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  42. 제 37 항에 있어서, Trichoderma reesei 엔도글루카나아제 V (CEL45A)의 오르소로그 또는 변이체는
    (a) SEQ ID NO: 62의 성숙한 폴리펩티드에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 아미노산 서열을 포함하는 폴리펩티드;
    (b) 바람직하게는 적어도 중간 긴축 조건, 보다 바람직하게는 적어도 중상 긴축 조건, 가장 바람직하게는 적어도 높은 긴축 조건하에서 (i) SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열, (ii) SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열에 함유된 cDNA 서열 또는 그것을 포함하는 게놈 DNA 서열, 또는 (iii) (i) 또는 (ii)의 전장 상보 가닥과 혼성화하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드;
    (c) SEQ ID NO: 61의 성숙한 폴리펩티드 암호화 서열에 대한 동일성이 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 가장 바람직하게는 적어도 90%, 가장 더 바람직하게는 적어도 95%인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 의해 암호화된 폴리펩티드; 및
    (d) 하나 이상의(다수의) 아미노산의 치환, 결실 및/또는 삽입을 포함하는 SEQ ID NO: 62의 성숙한 폴리펩티드의 변이체
    로 구성된 군에서 선택된 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  43. 제 37 항에 있어서, Trichoderma reesei 엔도글루카나아제 V (CEL45A)은 SEQ ID NO: 61을 포함하거나 또는 그것으로 구성된 성숙한 폴리펩티드인 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  44. 제 25 항에 있어서, SEQ ID NO: 8의 성숙한 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 갖는 폴리펩티드; SEQ ID NO: 106의 베타-글루코시다아제 융합 단 백질; SEQ ID NO: 52의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 I (CEL7A), SEQ ID NO: 54의 성숙한 폴리펩티드의 Trichoderma reesei 셀로비오히드롤라아제 II (CEL6A), 및 SEQ ID NO: 56의 성숙한 폴리펩티드의 Trichoderma reesei 엔도글루카나아제 I (CEL7B)를 포함하는 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  45. 제 25 항 내지 제 44 항 중 어느 한 항에 있어서, SEQ ID NO: 58의 Trichoderma reesei 엔도글루카나아제 II (CEL5A), SEQ ID NO: 62의 Trichoderma reesei 엔도글루카나아제 V (CEL45A), 및 SEQ ID NO: 60의 Trichoderma reesei 엔도글루카나아제 III (CEL12A)로 구성된 군에서 선택된 하나 이상의(다수의) 효소를 더 포함하는 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  46. 제 25 항 내지 제 45 항 중 어느 한 항에 있어서, SEQ ID NO: 64의 성숙한 폴리펩티드의 Thielavia terrestris 셀로비오히드롤라아제를 더 포함하는 것을 특징으로 하는 셀룰로오스 가수분해 단백질 조성물.
  47. 셀룰로오스-함유 물질을 제 25 항 내지 제 46 항 중 어느 한 항의 셀룰로오스 가수분해 단백질 조성물의 유효량으로 처리하는 단계를 포함하는 셀룰로오스-함유 물질의 분해 또는 전환 방법.
  48. 제 47 항에 있어서, 셀룰로오스-함유 물질을 헤미셀룰라아제, 에스테라제, 프로테아제, 라카아제, 퍼옥시다제 또는 이들의 혼합물로 구성된 군에서 선택된 하나 이상의(다수의) 효소의 유효량으로 처리하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  49. 제 47 항 또는 제 48 항에 있어서, 분해된 셀룰로오스-함유 물질을 회수하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  50. (a) 셀룰로오스-함유 물질을 제 25 항 내지 제 46 항 중 어느 한 항의 셀룰로오스 가수분해 단백질 조성물의 유효량으로 당화하는 단계; (b) 단계 (a)의 당화된 셀룰로오스-함유 물질을 하나 이상의(다수의) 발효 미생물로 발효하여 발효 산물을 생성하는 단계; 및 (c) 발효로부터 발효 산물을 회수하는 단계를 포함하는, 발효 산물의 제조방법.
  51. 제 50 항에 있어서, 셀룰로오스-함유 물질을 헤미셀룰라아제, 에스테라제, 프로테아제, 라카아제, 퍼옥시다제 또는 이들의 혼합물로 구성된 군에서 선택된 하나 이상의(다수의) 효소의 유효량으로 처리하는 단계를 더 포함하는 것을 특징으로 하는 방법.
KR1020097025755A 2007-05-31 2008-05-30 셀룰로오스성 물질의 분해를 위한 조성물 KR20100029088A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US94125107P 2007-05-31 2007-05-31
US60/941,251 2007-05-31

Publications (1)

Publication Number Publication Date
KR20100029088A true KR20100029088A (ko) 2010-03-15

Family

ID=40088716

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097025755A KR20100029088A (ko) 2007-05-31 2008-05-30 셀룰로오스성 물질의 분해를 위한 조성물

Country Status (8)

Country Link
US (2) US9969993B2 (ko)
JP (1) JP2010528624A (ko)
KR (1) KR20100029088A (ko)
CN (1) CN101970651B (ko)
BR (1) BRPI0812267A2 (ko)
MX (1) MX2009012844A (ko)
NZ (1) NZ581257A (ko)
RU (1) RU2494146C2 (ko)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0812267A2 (pt) * 2007-05-31 2014-10-14 Novozymes Inc Célula hospedeira fúngica filamentosa, método para produzir uma composição de proteína celulolítica, composição de proteína celulolítica, e, métodos para degradar ou converter um material, contendo celulose e para produzir um produto de fermentação
US20090246844A1 (en) * 2007-10-26 2009-10-01 Arbor Fuel Inc. Methods for the production of ethanol
US8338121B2 (en) * 2008-12-19 2012-12-25 Novozymes, Inc. Methods for determining cellulolytic enhancing activity of a polypeptide
JP5618478B2 (ja) * 2008-12-25 2014-11-05 Meiji Seikaファルマ株式会社 新規セルラーゼ遺伝子
WO2010096488A1 (en) * 2009-02-17 2010-08-26 The Regents Of The University Of California Method of reducing acetylation in plants to improve biofuel production
US20100233775A1 (en) * 2009-03-13 2010-09-16 Tech V, LLC System for the production of methane and other useful products and method of use
WO2010110773A1 (en) * 2009-03-27 2010-09-30 Tech V. Llc Methanogenic reactor
US20100248344A1 (en) * 2009-03-27 2010-09-30 Tech V, LLC Methanogenic reactor
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
EP2478096B1 (en) 2009-09-17 2017-05-24 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
RU2012116081A (ru) 2009-09-23 2013-10-27 ДАНИСКО ЮЭс ИНК. Новые гликозилгидролазные ферменты и их применения
MX2012003473A (es) 2009-09-29 2012-05-22 Novozymes Inc Polipeptidos que tienen actividad celulitica mejorada y polinucleotidos que codifican para los mismos.
BR112012013468A2 (pt) * 2009-12-04 2016-05-17 Georgia Tech Res Inst processo para tratar uma carga de alimentação compreendendo holocelulose, e, composição adequada para reduzir a cristalinidade da celulose
EP2516663B1 (en) 2009-12-23 2020-02-12 Danisco US Inc. Methods for improving the efficiency of simultaneous saccharification and fermentation reactions
US20120058534A1 (en) * 2010-03-09 2012-03-08 Stover & Associates, Inc. Optimized biogas (biomethane) production process
CN102939376B (zh) 2010-03-31 2016-07-06 明治制果药业株式会社 新纤维素酶基因
CN107435058A (zh) * 2010-08-06 2017-12-05 诺维信公司 降解或水解多糖的方法
MX2013003102A (es) * 2010-09-29 2013-06-28 Beta Renewables Spa Biomasa pretratada que tiene accesibilidad enzimatica potenciada.
BR112013023737A2 (pt) * 2011-03-17 2016-12-13 Danisco Us Inc enzimas de glicosil hidrolase e utilização das mesmas para a hidrólise de biomassa
CA2830508A1 (en) 2011-03-17 2012-09-20 Danisco Us Inc. Method for reducing viscosity in saccharification process
BR112013023715A2 (pt) * 2011-03-17 2016-09-13 Danisco Us Inc "polipeptídeo, polinucleotídeo, vetor, célula hospedeira, e composição para uso em hidrólise de biomassa, bem como métodos para hidrolisar material de biomassa celulósica e para produzir composição de mistura de cultura ou caldo de fermentação"
CN109136114A (zh) * 2011-08-24 2019-01-04 诺维信股份有限公司 在丝状真菌宿主细胞中产生多种重组多肽的方法
BR112014007651A2 (pt) * 2011-09-30 2017-04-11 Novozymes Inc polipeptídeo quimérico isolado, polinucleotídeo isolado, métodos para produzir um polipeptídeo quimérico e um produto de fermentação, para degradar ou converter um material celulósico, e para fermentar um material celulósico, planta, parte de planta ou célula de planta transgênica, e, formulação de caldo inteiro ou composição de cultura de células
US9611462B2 (en) * 2011-12-20 2017-04-04 Codexis, Inc. Endoglucanase 1B (EG1B) variants
US9938551B2 (en) 2012-12-12 2018-04-10 Danisco Us Inc Variants of cellobiohydrolases
CN106190874B (zh) * 2015-05-06 2020-06-26 中国科学院天津工业生物技术研究所 一种强化丝状真菌蛋白质生产的方法
CN107988127B (zh) * 2017-11-02 2021-09-03 南京农业大学 里氏木霉木质纤维素酶基因工程乳酸菌组合在调制优质苜蓿青贮饲料中的应用
EP3488854A1 (en) * 2017-11-22 2019-05-29 Technische Universität München Method for preparing xyloglucan-oligosaccharides
CN108048430B (zh) * 2018-01-08 2021-03-26 中国农业科学院北京畜牧兽医研究所 内切葡聚糖酶NfEG12A突变体及其编码基因和应用
AU2019200694B2 (en) * 2018-02-09 2019-10-10 Department Of Biotechnology Additive composition useful for improved production of fermentable sugars from lignocellulosic biomass
RU2696074C1 (ru) * 2018-11-16 2019-07-30 Федеральное государственное бюджетное учреждение науки Федеральный исследовательский центр питания, биотехнологии и безопасности пищи Штамм мицелиального гриба trichoderma reesei - продуцент комплекса эндоглюканазы, ксиланазы и пектиназ для получения белковых добавок на основе зернового и зернобобового сырья для применения в кормопроизводстве
CN110819582B (zh) * 2019-11-28 2021-04-06 华派生物工程集团有限公司 大肠杆菌表达口蹄疫病毒样颗粒抗原的发酵培养基及培养方法
CN112062616A (zh) * 2020-09-29 2020-12-11 东北农业大学 一种促进农作物秸秆原位还田的腐熟剂及其应用
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5275944A (en) * 1989-09-26 1994-01-04 Midwest Research Institute Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068
EP0976838A1 (en) * 1998-05-06 2000-02-02 Rhone-Poulenc Nutrition Animale Enzymes mixture
US7375197B2 (en) 2002-01-14 2008-05-20 Midwest Research Institute Cellobiohydrolase I gene and improved variants
AU2001268603B2 (en) 2000-06-26 2006-11-09 University Of Florida Research Foundation, Inc. Methods and compositions for simultaneous saccharification and fermentation
DK2295559T3 (en) * 2002-08-16 2015-12-14 Danisco Us Inc Hitherto UNKNOWN HYPROCREA JECORINA CBH1 CELLULASE VARIETY WITH INCREASED THERMAL STABILITY COMPREHENSIVE SUBSTITUTION OR DELETION AT POSITION T255
US7413888B2 (en) * 2003-05-02 2008-08-19 Novozymes, Inc. Variants of beta-glucosidases
EP1660637A4 (en) * 2003-08-25 2009-10-21 Novozymes Inc VARIANTS OF GLYCOSIDE HYDROLASES
JP4842834B2 (ja) 2003-12-09 2011-12-21 ノボザイムス,インコーポレイティド 糸状菌株における遺伝子の発現を排除するか又は低めるための方法
CN104726431B (zh) 2004-01-30 2018-06-01 诺维信股份有限公司 具有分解纤维增强活性的多肽及其编码多核苷酸
JP5015610B2 (ja) * 2004-02-06 2012-08-29 ノボザイムス,インコーポレイティド セルロース分解増強活性を有するポリペプチド及びそれをコードするポリヌクレオチド
CN101321857A (zh) * 2005-09-30 2008-12-10 诺维信股份有限公司 用于增强纤维素材料降解或转化的方法
BRPI0812267A2 (pt) * 2007-05-31 2014-10-14 Novozymes Inc Célula hospedeira fúngica filamentosa, método para produzir uma composição de proteína celulolítica, composição de proteína celulolítica, e, métodos para degradar ou converter um material, contendo celulose e para produzir um produto de fermentação

Also Published As

Publication number Publication date
BRPI0812267A2 (pt) 2014-10-14
MX2009012844A (es) 2009-12-15
US20180237759A1 (en) 2018-08-23
JP2010528624A (ja) 2010-08-26
NZ581257A (en) 2012-03-30
US9969993B2 (en) 2018-05-15
RU2009149633A (ru) 2011-07-10
CN101970651A (zh) 2011-02-09
CN101970651B (zh) 2013-10-09
RU2494146C2 (ru) 2013-09-27
US20080299613A1 (en) 2008-12-04

Similar Documents

Publication Publication Date Title
US20180237759A1 (en) Compositions for degrading cellulosic material
AU2008259937C1 (en) Compositions for degrading cellulosic material
DK2069491T3 (en) COMPOSITIONS AND PROCEDURES FOR IMPROVING THE DECOMPOSITION OR CONVERSION OF CELLULOSE SUBSTANCES
KR20100105849A (ko) 셀룰로오스 가수분해 향상 활성을 가지는 폴리펩티드 및 그것을 암호화하는 폴리뉴클레오티드
DK2640833T3 (en) Chimeric polypeptides having cellulolytic enhancing ACTIVITY AND POLYNUCLEOTIDES ENCODING THEM
DK2670853T3 (en) Process for enzymatic refining of pretreated cellulosic material for sugars
CN101910406A (zh) 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法
US8586828B2 (en) Polypeptides having beta-glucosidase activity and polynucleotides encoding same
AU2012205191B2 (en) Compositions for degrading cellulosic material
AU2012204055B2 (en) Methods of increasing the cellulolytic enhancing activity of a polypeptide

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application