KR20170040246A - 아글리코실화된 효소 및 이의 용도 - Google Patents

아글리코실화된 효소 및 이의 용도 Download PDF

Info

Publication number
KR20170040246A
KR20170040246A KR1020177003329A KR20177003329A KR20170040246A KR 20170040246 A KR20170040246 A KR 20170040246A KR 1020177003329 A KR1020177003329 A KR 1020177003329A KR 20177003329 A KR20177003329 A KR 20177003329A KR 20170040246 A KR20170040246 A KR 20170040246A
Authority
KR
South Korea
Prior art keywords
gly
ser
ala
thr
leu
Prior art date
Application number
KR1020177003329A
Other languages
English (en)
Inventor
마샬 메도프
나타샤 크레더
제임스 린치
션 랜드리
아이치로 요시다
데지레 팡길리난
토마스 크레이그 마스터맨
Original Assignee
질레코 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 질레코 인코포레이티드 filed Critical 질레코 인코포레이티드
Publication of KR20170040246A publication Critical patent/KR20170040246A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Processing Of Solid Wastes (AREA)
  • Purification Treatments By Anaerobic Or Anaerobic And Aerobic Bacteria Or Animals (AREA)

Abstract

본 발명은 셀로비아제 활성을 지닌 아글리코실화된 폴리펩타이드를 포함하는 조성물, 그리고 이를 생성하는 방법 및 이를 이용하는 방법에 관한 것이다. 본 발명은, 비진균 세포주에서 발현되고 효소를 유의하게 글리코실화하지 못하는 숙주 세포로부터 단리된 트리코더마 리세이로부터의 셀로비아제가 트리코더마 리세이로부터 (글리코실화되고 분비된) 내인성 셀로비아제보다 순수한 기질 상에서 더 높은 특이적 활성을 지녔다는 놀라운 발견에 적어도 부분적으로 기초하고 있다.

Description

아글리코실화된 효소 및 이의 용도{AGLYCOSYLATED ENZYME AND USES THEREOF}
관련 출원
본 출원은 2014년 8월 8일자로 출원된 미국 가출원 제62/035,346호의 유익을 주장하며, 이 기초 출원의 전체 내용은 참고로 본 명세서에 편입된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하고, 이 서열 목록은 그의 전문이 참고로 본 명세서에 편입된다. 2015년 8월 5일자로 작성된 상기 ASCII 사본은 X2002-7000WO_SL.txt란 명칭이고 그 크기가 76,949 바이트이다.
발명의 기술분야
본 발명은 일반적으로 셀로비아제 활성을 가진 조성물 및 본 명세서에 기재된 조성물을 제조하는 방법에 관한 것이다. 본 발명은 또한 이러한 조성물을 이용하는, 예를 들어, 바이오매스 물질을 가공처리하는 방법을 제공한다.
바이오매스-분해 효소, 예컨대, 셀룰라제, 자일라나제 및 리그니나제는, 바이오매스, 예컨대, 공급원료의 분해에 중요하다. 셀룰로스 및 리그노셀룰로스 물질이 생산되고, 가공처리되어, 많은 용도에 대량으로 이용되고 있다. 이러한 재료는 종종 일단 사용되고 나면 쓰레기로서 폐기되거나, 또는 단순히 폐기물 재료, 예컨대, 오수(sewage), 버개스(bagasse), 톱밥 및 여물로 되는 것으로 여겨진다.
본 발명은, 비진균(non-fungal) 세포주에서 발현되고 효소를 유의하게 글리코실화하지 못하는 숙주 세포로부터 단리된 트리코더마 리세이(T. reesei)로부터의 셀로비아제가 트리코더마 리세이로부터 (글리코실화되고 분비된) 내인성 셀로비아제보다 순수한 기질 상에서 더 높은 특이적 활성을 지녔다는 놀라운 발견에 적어도 부분적으로 기초하고 있다. 또한, 아글리코실화된 셀로비아제(aglycosylated cellobiase)가 다른 당화 효소를 함유하는 효소 혼합물과 당화 반응에서 사용된 경우, 아글리코실화된 셀로비아제 없는 반응에 비해서 당 생성물의 실질적인 수율 증가가 관찰되었다. 따라서, 본 명세서에서는, 효소 활성, 예컨대, 셀로비아제 활성을 가진 아글리코실화된 폴리펩타이드, 아글리코실화된 폴리펩타이드를 포함하는 조성물, 그리고 본 명세서에 기재된 조성물을 제조하는 방법 및 이를 이용하는 방법이 제공된다.
따라서, 일 양상에 있어서, 본 개시내용은 셀로비아제 활성을 지닌 아글리코실화된 폴리펩타이드를 특징으로 한다. 하나의 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 야생형 트리코더마 리세이 또는 이의 돌연변이체, 예컨대, 트리코더마 리세이(T. reesei) RUTC30로부터의 글라이코실화된 Cel3A 효소에 비해서 증가된 셀로비아제 활성을 지녔다. 예를 들어, 아글리코실화된 폴리펩타이드는 야생형 트리코더마 리세이로부터의 글라이코실화된 Cel3A 효소에 비해서 증가된 기질 인식 또는 더욱 활성인 기질 인식 부위를 지닐 수 있다. 하나의 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 야생형 트리코더마 리세이로부터의 글라이코실화된 Cel3A 효소에 비해서 저감된 입체 장해를 지닌다.
하나의 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 서열번호 1에 대해서 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%의 동일성 또는 이의 작용성 단편을 포함한다. 하나의 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 아미노산 서열 서열번호 1을 포함한다(예컨대, 로 이루어진다). 다른 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 서열번호 1의 아미노산 서열로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 또는 20개 이하의 아미노산만큼 상이하다.
하나의 실시형태에 있어서, 폴리펩타이드는 야생형 트리코더마 리세이, 또는 이의 돌연변이체, 예컨대, 트리코더마 리세이 RUTC30로부터의 Cel3A 효소, 또는 이의 작용성 변이체 또는 단편을 포함한다.
하나의 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 핵산 서열에 의해 암호화되되, 여기서 핵산 서열은 서열번호 2 또는 서열번호 3에 대해서 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%의 동일성을 포함한다(예컨대, 으로 이루어진다). 하나의 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 서열번호 2 또는 서열번호 3을 포함하는(예컨대, 으로 이루어진) 핵산 서열에 의해 암호화된다.
하나의 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 하나 이상의 글리코실화 부위에 근접한 돌연변이 또는 해당 부위에서 돌연변이를 포함하는 유전자에 의해 발현되고, 여기서 돌연변이는 글리코실화 부위에서 글리코실화를 방지한다. 하나의 실시형태에 있어서, 돌연변이는 서열번호 1의 아미노산 위치 78에서의 트레오닌, 아미노산 위치 241에서의 트레오닌, 아미노산 위치 343에서의 세린, 아미노산 위치 450에서의 세린, 아미노산 위치 599에서의 트레오닌, 아미노산 위치 616에서의 세린, 아미노산 위치 691에서의 트레오닌, 아미노산 위치 21에서의 세린, 아미노산 위치 24에서의 트레오닌, 아미노산 위치 25에서의 세린, 아미노산 위치 28에서의 세린, 아미노산 위치 38에서의 트레오닌, 아미노산 위치 42에서의 트레오닌, 아미노산 위치 303에서의 트레오닌, 아미노산 위치 398에서의 세린, 아미노산 위치 435에서의 세린, 아미노산 위치 436에서의 세린, 아미노산 위치 439에서의 트레오닌, 아미노산 위치 442에서의 트레오닌, 아미노산 위치 446에서의 트레오닌, 아미노산 위치 451에서의 세린, 아미노산 위치 619에서의 세린, 아미노산 위치 622에서의 세린, 아미노산 위치 623에서의 트레오닌, 아미노산 위치 626에서의 세린, 또는 아미노산 위치 630에서의 트레오닌 중 하나 이상에 있다. 하나 이상의 글리코실화 부위에 근접한 돌연변이는, 예를 들어, 폴리펩타이드의 입체 형태를 변화시키거나 또는 글리코실화가 글리코실화 부위에서 일어나지 않도록 글리코실화 효소에 의해 인식된 공통 부위(consensus site)를 변화시킴으로써, 그 부위에서 글리코실화를 방지할 수 있다.
하나의 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 탄수화물, 예컨대, 글루코스의 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체 또는 올리고머; 또는 글루코스와 자일로스의 올리고머를 1종 이상의 단당류, 예컨대, 글루코스로 가수분해시킨다. 하나의 실시형태에 있어서, 셀로비아제 활성은 셀로비오스의 베타 1,4 글리코사이드 결합의 가수분해를 포함한다.
다른 양상에 있어서, 본 개시내용은 본 명세서에 기재된 아글리코실화된 폴리펩타이드를 암호화하는 핵산 서열을 특징으로 한다.
하나의 실시형태에 있어서, 핵산 서열은 Cel3A 효소 또는 이의 작용성 단편을 암호화하되, 여기서 핵산 서열은 서열번호 2 또는 서열번호 3에 대해서 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%의 동일성을 포함한다(예컨대, 로 이루어진다). 하나의 실시형태에 있어서, 핵산 서열은 Cel3A 효소를 암호화하되, 여기서 핵산 서열은 서열번호 2 또는 서열번호 3을 포함한다(예컨대, 로 이루어진다).
일 양상에 있어서, 본 개시내용은 본 명세서에 기재된 핵산 서열을 포함하는 핵산 분자를 특징으로 한다.
하나의 실시형태에 있어서, 핵산 분자는 프로모터, 예컨대, 원핵 세포 발현, 예컨대, 박테리아 세포 발현, 예컨대, 이. 콜라이 내 발현용의 프로모터를 더 포함한다. 하나의 실시형태에 있어서, 프로모터 서열은 구성적 프로모터 서열, 유도성 프로모터 서열, 또는 억제성 프로모터 서열이다. 하나의 실시형태에 있어서, 프로모터는 T7 프로모터이다.
하나의 실시형태에 있어서, 핵산 분자는 태그, 예컨대, 검출 및/또는 정제 및/또는 다른 분자에 연결하기 위한 태그, 예컨대, His 태그를 암호화하는 핵산 서열을 더 포함한다.
하나의 실시형태에 있어서, 핵산 분자는 하나 이상의 신호 서열, 예컨대, 분비 신호 서열을 암호화하는 핵산을 더 포함한다.
일 양상에 있어서, 본 개시내용은 본 명세서에 기재된 핵산 서열 또는 본 명세서에 기재된 핵산 분자를 포함하는 발현 벡터를 특징으로 한다.
하나의 실시형태에 있어서, 벡터는 선택 마커, 예컨대, 카나마이신 또는 암피실린 마커를 암호화하는 핵산 서열을 더 포함한다.
일 양상에 있어서, 본 개시내용은 본 명세서에 기재된 벡터를 포함하는 세포를 특징으로 한다.
하나의 실시형태에 있어서, 세포는 원핵세포/박테리아 세포, 예컨대, 이. 콜라이 세포, 예컨대, 오리가미(Origami) 이. 콜라이 세포이다.
하나의 실시형태에 있어서, 세포는 본 명세서에 기재된 아글리코실화된 폴리펩타이드를 발현한다.
하나의 실시형태에 있어서, 세포는 글리코실화를 해친다.
일 양상에 있어서, 본 개시내용은 본 명세서에 기재된 아글리코실화된 폴리펩타이드를 생성하는 방법을 특징으로 하되, 해당 방법은, 폴리펩타이드의 발현에 적합한 조건 하에서 본 명세서에 기재된 폴리펩타이드를 발현하는 세포를 배양하는 단계를 포함하며, 여기서 세포는 폴리펩타이드를 글리코실화하지 못하고, 예컨대, 박테리아 세포, 예컨대, 이. 콜라이 세포, 예컨대, 오리가미 이. 콜라이 세포이다.
일 양상에 있어서, 본 개시내용은 본 명세서에 기재된 아글리코실화된 폴리펩타이드를 생성하는 방법을 특징으로 하되, 해당 방법은 서열번호 1의 아미노산 서열, 또는 서열번호 1에 대해서 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%의 동일성을 가진 아미노산 서열을 탈글리코실화 효소로 처리하는 단계를 포함한다. 예를 들어, 탈글리코실화 효소는 PGNase 또는 EndoH일 수 있다.
일 양상에 있어서, 본 개시내용은 본 명세서에 기재된 아글리코실화된 폴리펩타이드를 제조하는 방법을 특징으로 하되, 해당 방법은 서열번호 1에 대해서 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%의 동일성을 가진 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 세포를 배양하는 단계 및 임의로 배양으로부터 아글리코실화된 폴리펩타이드를 얻는 단계를 포함하며, 여기서 핵산은 암호화된 폴리펩타이드의 글리코실화를 방지하는 하나 이상의 돌연변이를 갖는다.
일 양상에 있어서, 본 개시내용은 글리코실화 저해제의 존재 하에 본 명세서에 기재된 아글리코실화된 폴리펩타이드를 발현하는 세포를 배양하는 방법을 특징으로 한다. 예를 들어, 글리코실화 저해제는 투니카마이신(tunicamycin)이다.
일 양상에 있어서, 본 개시내용은 본 명세서에 기재된 아글리코실화된 폴리펩타이드 및 1종 이상의 추가의 효소, 예컨대, 1종 이상의 글리코실화 효소, 예컨대, 진균 세포로부터의 셀룰라제를 포함하는 효소 혼합물을 특징으로 한다. 하나의 실시형태에 있어서, 효소 혼합물은 본 명세서에 기재된 아글리코실화된 폴리펩타이드 및 서열번호 1에 대해서 적어도 75%, 80%, 95%, 90%, 95%, 96%, 97%, 98%, 99%의 동일성을 가진 아미노산 서열을 포함하는 글리코실화 폴리펩타이드를 포함하되, 글리코실화 폴리펩타이드와 아글리코실화 펩타이드는 둘 다 셀로비아제 활성을 지닌다.
하나의 실시형태에 있어서, 효소 혼합물은 글리코실화 폴리펩타이드 및 아글리코실화된 폴리펩타이드를 포함하고, 글리코실화 폴리펩타이드와 아글리코실화된 폴리펩타이드 둘 다는 야생형 트리코더마 리세이 또는 이의 돌연변이체, 예컨대, 트리코더마 리세이 RUTC30로부터의 Cel3A 효소를 포함한다.
하나의 실시형태에 있어서, 효소 혼합물은 미생물로부터 유래된 적어도 1종의 추가의 효소를 더 포함하되, 여기서 추가의 효소는 바이오매스-분해 활성을 지닌다. 하나의 실시형태에 있어서, 추가의 효소는 리그니나제, 엔도글루카나제, 셀로비오하이드롤라제, 자일라나제, 및 셀로비아제로부터 선택된다.
하나의 실시형태에 있어서, 반응 혼합물은 적어도 1:32, 예컨대, 1:32 내지 1:300의 아글리코실화된 폴리펩타이드와 효소의 비를 갖는다. 하나의 실시형태에 있어서, 반응 혼합물은 적어도 1:32, 예컨대, 1:32 내지 1:300인 아글리코실화된 폴리펩타이드 대 글리코실화 폴리펩타이드의 비를 갖는다.
일 양상에 있어서, 본 개시내용은, 바이오매스, 예컨대, 방사선, 예컨대, 전자빔으로부터의 방사선으로 처리된 바이오매스를 본 명세서에 기재된 아글리코실화된 폴리펩타이드와, 당 생성물의 생성에 적합한 조건 하에서 접촉시키는 단계를 포함하는, 바이오매스로부터 생성물(예컨대, 수소, 당, 알코올 등)을 생성하는(또는 바이오매스를 생성물로 전환시키는) 방법을 특징으로 한다. 하나의 실시형태에 있어서, 방법은 바이오매스를 1종 이상의 바이오매스-분해 효소 또는 바이오매스-분해 효소들을 포함하는 효소 혼합물, 예컨대, 본 명세서에 기재된 효소 혼합물을 생산하는 미생물과 접촉시키는 단계를 더 포함한다.
일 양상에 있어서, 본 개시내용은, 바이오매스를 본 명세서에 기재된 효소 혼합물과 생성물의 생성에 적합한 조건 하에서 접촉시키는 단계를 포함하는, 바이오매스로부터 생성물(예컨대, 수소, 당, 알코올 등)을 생성하는(또는 바이오매스를 생성물로 전환시키는) 방법을 특징으로 한다.
하나의 실시형태에 있어서, 생성물은 당 생성물, 예컨대, 본 명세서에 기재된 당 생성물이다. 하나의 실시형태에 있어서, 당 생성물은 글루코스 및/또는 자일로스, 또는 기타 당 생성물, 예컨대, 프럭토스, 아라비노스, 갈락토스 및 셀로비오스이다.
하나의 실시형태에 있어서, 방법은 당 생성물을 단리시키는 단계를 더 포함한다. 하나의 실시형태에 있어서, 당 생성물의 단리는 석출, 결정화, 크로마토그래피, 원심분리, 및/또는 추출을 포함한다.
하나의 실시형태에 있어서, 효소 혼합물은 B2AF03, CIP1, CIP2, Cel1a, Cel3a, Cel5a, Cel6a, Cel7a, Cel7b, Cel12a, Cel45a, Cel74a, paMan5a, paMan26a, 스월레닌(Swollenin), 또는 표 1에 나열된 효소 중 어느 하나로부터 선택된 효소의 적어도 2종을 포함한다. 일 실시형태에 있어서, 위에 나열된 효소는 효소를 이종적으로 또는 내재적(혹은 내인성)으로 발현하는 세포로부터 단리되며, 예컨대, 트리코더마 리세이(Trichoderma reesei) 또는 포도스포라 안세리나(Podospora anserina)이다.
하나의 실시형태에 있어서, 바이오매스는 전분 물질 또는 셀룰로스 성분을 포함하는 전분 물질을 포함한다. 몇몇 실시형태에 있어서, 바이오매스는 농업 생성물 또는 폐기물, 종이 생성물 또는 폐기물, 산림 생성물, 또는 일반 폐기물, 또는 이들의 임의의 조합물 중 한 가지 이상을 포함하되; 여기서: a) 농업 생성물 또는 폐기물은 사탕 수수, 황마, 대마, 아마, 대나무, 사이잘마, 알팔파, 건초, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 옥수수 속대, 옥수수 겉대, 옥수수 섬유, 코코넛 헤어, 사탕무우박, 버개스, 대두 여물, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 또는 비즈윙(beeswing), 또는 이들의 조합물을 포함하고; b) 종이 생성물 또는 폐기물은 종이, 색소지, 적재지, 코팅지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 또는 제지용 펄프, 또는 이들의 조합을 포함하며; c) 산림 생성물은 백양나무 목재, 파티클 보드, 목재 칩, 또는 톱밥, 또는 이들의 조합을 포함하고; 그리고 d) 일반 폐기물은 거름, 오수 또는 왕겨, 또는 이들의 조합을 포함한다. 하나의 실시형태에 있어서, 방법은 바이오매스의 난분해성(recalcitrance)을 저감시키기 위하여 미생물 또는 효소 혼합물을 도입하기 전에, 예컨대, 바이오매스를 전자를 이용한 충격, 초음파처리, 산화, 열분해, 증기 폭발, 화학적 처리, 기계적 처리, 및/또는 동결 분쇄에 의해 처리함으로써, 바이오매스를 처리하는 단계를 더 포함한다.
하나의 실시형태에 있어서, 바이오매스-분해 효소를 생산하는 미생물은, 바실러스(Bacillus), 코프리누스(Coprinus), 마이셀리오프토라(Myceliophthora), 세팔로스포륨(Cephalosporium), 사이탈리듐(Scytalidium), 페니실륨(Penicillium), 아스페르길루스(Aspergillus), 슈도모나스(Pseudomonas), 후미콜라(Humicola), 푸사륨(Fusarium), 티엘라비아(Thielavia), 아크레모늄(Acremonium), 크리소스포륨(Chrysosporium) 및 트리코더마(Trichoderma)로부터 선택된 속 내의 종으로부터 유래한다. 하나의 실시형태에 있어서, 바이오매스-분해 효소를 생산하는 미생물은 아스페르길루스(Aspergillus), 후미콜라 인솔렌스(Humicola insolens)(사이탈리듐 써모필룸(Scytalidium thermophilum)), 코프리누스 시네레우스(Coprinus cinereus), 푸사륨 옥시스포룸(Fusarium oxysporum), 마이셀리오프토라 써모필라(Myceliophthora thermophila), 메리필루스 기간테우스(Meripilus giganteus), 티엘라비아 테레스트리스(Thielavia terrestris), 아크레모늄 페르시시넘(Acremonium persicinum), 아크레모늄 아크레모늄(Acremonium acremonium), 아크레모늄 브라키페늄(Acremonium brachypenium), 아크레모늄 디클로모스포룸(Acremonium dichromosporum), 아크레모늄 오브클라바툼(Acremonium obclavatum), 아크레모늄 핀커토니애(Acremonium pinkertoniae), 아크레모늄 로세오그리세움(Acremonium roseogriseum), 아크레모늄 인콜로라툼(Acremonium incoloratum), 아크레모늄 푸라툼(Acremonium furatum), 크리소스포륨 룩노웬스(Chrysosporium lucknowense), 트리코더마 비리데(Trichoderma viride), 트리코더마 리세이(T. reesei) 또는 트리코더마 코닌기(Trichoderma koningii)로부터 선택된다.
하나의 실시형태에 있어서, 미생물은 미유도 미생물에 비해서 바이오매스-분해 효소의 생산을 증가시키기에 적합한 조건 하에서 상기 미생물을 유도 바이오매스 샘플과 배합함으로써 바이오매스-분해 효소를 생산하도록 유도되었다. 하나의 실시형태에 있어서, 유도 바이오매스 샘플은 종이, 종이제품, 폐지, 제지용 펄프, 색소지, 적재지(loaded paper), 코팅지, 충전 종이(filled papers), 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 목면, 목재, 파티클 보드, 산림 폐기물, 톱밥, 백양나무 목재, 목재 칩, 목초, 지팽이풀, 억새, 코드 그래스(cord grass), 리이드 카나리 그래스(reed canary grass), 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 농업 폐기물, 사일리지, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 황마, 대마, 아마, 대나무, 사이잘마, 마닐라삼, 옥수수 속대, 옥수수 겉대, 대두 여물, 옥수수 섬유, 알팔파, 건초, 코코넛 헤어, 당 가공처리 잔류물, 버개스, 사탕무우박, 용설란 버개스, 해조류, 해초, 거름, 오수, 왕겨, 농업 또는 산업 폐기물, 아라카차(arracacha), 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 또는 이들의 임의의 조합물을 포함한다.
도 1은 이. 콜라이에서 발현된 정제된 Cel3a의 사진이다. 레인 1은 분자량 마커(프레시션 플러스 올 블루 단백질 마커(Precision Plus All Blue Protein marker), 바이오라드사(Biorad))를 나타내고; 레인 2는 정제된 Cel3a-His 단백질을 나타낸다.
도 2는 31분에 Cel3a-N'His의 검출을 나타내는, Cel3a-N'His 샘플의 크로마토그래피 프로파일이다.
도 3은 31분에 Cel3a-N'His의 크로마토그래피 프로파일에서 피크에 대한 질량 스펙트럼 영역에서의 글리코실화의 증거가 없는 것을 나타내는 프로파일이다.
도 4는 주 성분(아글리코실화 Cel3a-N'His) 및 미량 성분(변형된 Cel3a-N'His)의 분자량을 확인하는, 하전 상태 엔빌로프의 디컨볼루션(deconvolution)을 도시한 프로파일이다.
도 5는 정제된 Cel3a-N'His의, 셀로비아제 검정에 의해 결정된 바와 같은, 셀로비아제 활성을 나타낸 그래프이다.
도 6은 미지의 농도의 Cel3a을 지닌 샘플의 Cel3a의 농도를 결정하기 위하여 사용될 수 있는 기지의 농도의 Cel3a-N'His에 대해서 발생된 셀루비아제 활성에 대한 표준 곡선을 나타낸 그래프이다.
도 7은 트리코더마 리세이(L4196)로부터의 내인성 셀로비아제와 비교된 재조합체 Cel3a의 특이적 활성을 나타낸 그래프이다.
도 8은 아글리코실화된 셀로비아제 Cel3a(L331(0.8mg/ml Cel3a)의 첨가를 지닌 표준 효소 믹스(L331 대조군)와 비교된 표준 효소 믹스로 수행된 당화 반응으로부터의 글루코스 생성물의 수득량을 나타낸 그래프이다.
정의
달리 정의되지 않는 한, 본 명세서에서 이용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술 분야에서 통상의 기술을 가진 자(이하 당업자라 약칭함)가 통상적으로 이해하는 바와 같은 의미를 지닌다.
단수 형태의 용어는 관사의 문법적 대상체의 하나 또는 하나 초과(즉, 적어도 하나)를 지칭한다. 예로서, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미한다.
본 명세서에서 이용되는 바와 같은 용어 "아글리코실화"는, 분자가 그의 자연 환경에서 생성된 경우 부착된 글리칸을 가진 1개 이상의 부위에서 글리코실화되지 않은 분자, 예컨대, 폴리펩타이드를 지칭한다(즉, 이것은 글리코실레이트기에 부착되지 않은 하이드록실기 또는 다른 작용기를 포함한다). 예를 들어, Cel3A 효소는, Cel3A 효소가 트리코더마 리세이에서 생산되지 않은 경우 그에 부착된 통상적으로 글리칸기를 가진 단백질 내의 1개 이상의 부위가 그 부위에서 부착된 글리칸을 갖지 않은 경우 아글리코실화된다. 몇몇 실시형태에 있어서, 아글리코실화 분자는 어떠한 부착된 글리칸도 갖지 않는다. 하나의 실시형태에 있어서, 분자는 그 분자가 글리코실화될 수 없도록 변경되었거나 돌연변이되었으며, 예컨대, 1개 이상의 글리코실화 부위가 글리칸이 글리코실화 부위에 부착될 수 없도록 돌연변이된다. 다른 실시형태에 있어서, 부착된 글리칸은, 예컨대, 효소 과정에 의해, 예컨대, 글리칸을 제거하거나 탈글리코실화 활성을 갖는 효소를 이용해서 인큐베이팅함으로써, 그 분자로부터 제거될 수 있다. 또 다른 실시형태에 있어서, 분자의 글리코실화는, 예컨대, 글리코실화 저해제(글리코실화 효소를 저해함)의 사용에 의해서 저해될 수 있다. 다른 실시형태에 있어서, 분자, 예컨대, 폴리펩타이드는, 글리코실화되지 않은 숙주 세포, 예컨대, 이. 콜라이에 의해 생성될 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "바이오매스"는, 임의의 비화석화된 유기물을 지칭한다. 바이오매스는 전분 물질 및/또는 셀룰로스, 헤미셀룰로스, 또는 리그노셀룰로스 물질일 수 있다. 예를 들어, 바이오매스는 농업 생성물, 종이 제품, 산림 생성물, 또는 이들의 임의의 중간체, 부산물, 잔류물 또는 폐기물일 수 있다. 바이오매스는 이러한 물질들의 조합일 수 있다. 일 실시형태에 있어서, 바이오매스는, 예컨대, 본 명세서에 기재된 당화 및/또는 발효에 의해 가공처리되어, 생성물, 예컨대, 당, 알코올, 유기산 또는 바이오연료를 생성한다.
본 명세서에서 이용되는 바와 같은 용어 "바이오매스 분해 효소"는, 본 명세서에 기재된 바이오매스 물질의 성분을 중간체 또는 최종 생성물로 파괴시키는 효소를 지칭한다. 예를 들어, 바이오매스-분해 효소는 적어도 아밀라제, 예컨대, 알파, 베타 또는 감마 아밀라제, 셀룰라제, 헤미셀룰라제, 리그니나제, 엔도글루카나제, 셀로비아제, 자일라나제 및 셀로비오하이드롤라제를 포함한다. 바이오매스-분해 효소는 광범위한 미생물에 의해 생산되고, 그리고 트리코더마 리세이와 같은 미생물로부터 단리될 수 있다. 바이오매스 분해 효소는 내재적으로 발현되거나 또는 이종적으로 발현될 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "셀로비아제"는, 글루코스의 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체 또는 올리고머, 또는 글루코스와 자일로스의 올리고머를 글루코스 및/또는 자일로스의 가수분해를 촉매하는 효소를 지칭한다. 예를 들어, 셀로비아제는 셀로비오스 내 베타-1,4 결합을 촉매하여 2개의 글루코스 분자를 유리시하는 베타-글루코시다제이다.
본 명세서에서 이용되는 바와 같은 용어 "셀로비아제 활성"은, 베타-D-글루코스를 유리시키기 위하여, 셀로비오스의 글루코스로의 가수분해를 촉매하는, 예컨대, 베타-D-글루코스 잔기의 가수분해를 촉매하는 셀룰라제의 범주의 활성을 지칭한다. 셀로비아제 활성은 본 명세서에 기재된 검정에 따라서, 예컨대, 실시예 6에서 결정될 수 있다. 셀로비아제 활성의 1 단위는 [글루코스] g/L/[Cel3a] g/L/30분으로서 정의될 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "셀로비오하이드롤라제"는, 셀로비오스 중 글리코사이드 결합을 가수분해시키는 효소를 지칭한다. 예를 들어, 셀로비오하이드롤라제는 1,4-베타-D-글루칸 셀로비오하이드롤라제이고, 이것은 셀룰로스, 셀로올리고당, 또는 임의의 베타-1,4-결합된 글루코스 함유 중합체에서 1,4-베타-D-글루코사이드 결합의 가수분해를 촉매하여 그 중합체 사슬로부터 올리고당을 유리시킨다.
본 명세서에서 이용되는 바와 같은 용어 "엔도글루카나제"는, 셀룰로스의 내부 β-1,4 글루코사이드 결합의 가수분해를 촉매하는 효소를 지칭한다. 예를 들어, 엔도글루카나제는, 셀룰로스, 셀룰로스 유도체(예컨대 카복시메틸 셀룰로스 및 하이드록시에틸 셀룰로스), 리케난, 시리얼 베타-D-글루칸 또는 자일로글루칸과 같은 혼합된 베타-1,3 글루칸에서의 베타-1,4 결합, 및 셀룰로스 성분을 함유하는 기타 식물에서의 1,4-베타-D-글리코사이드 연결의 엔도가수분해를 촉매하는, 엔도-l,4-(l,3;l,4)-베타-D-글루칸 4-글루카노하이드롤라제이다.
본 명세서에서 이용되는 바와 같은 용어 "효소 혼합물"은, 적어도 2종의 상이한 효소, 또는 적어도 2종의 상이한 효소의 변이체의 조합(예컨대, 효소의 글리코실화된 및 아글리코실화 버전)을 지칭한다. 여기서 지칭되는 효소 혼합물은 본 명세서에 기재된 셀로비아제 활성을 지닌 적어도 아글리코실화된 폴리펩타이드를 포함한다. 하나의 실시형태에 있어서, 효소 혼합물은 셀로비아제, 엔도글루카나제, 셀로비오하이드롤라제, 리그니나제, 및/또는 자일라나제 중 1종 이상을 포함한다. 몇몇 실시형태에 있어서, 효소 혼합물은, 1종 이상의 효소를 발현하고 예컨대 분비하는 세포, 예컨대, 미생물을 포함한다. 예를 들어, 효소 혼합물은 본 명세서에 기재된 아글리코실화된 폴리펩타이드 및 세포, 예컨대, 1종 이상의 추가의 효소 및/또는 폴리펩타이드의 변이체를 발현하고 예컨대 분비하는 미생물을 포함할 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "리그니나제"는, 예컨대, 산화 반응 등에 의해 식물의 세포벽에서 통상적으로 발견되는, 리그닌의 파괴를 촉매하는 효소를 지칭한다.
용어 "핵산" 또는 "폴리뉴클레오타이드"는 호환 가능하게 사용되고, 단일- 또는 이중-가닥 형태의 데옥시리보핵산(DNA) 또는 리보핵산(RNA) 및 이들의 중합체를 지칭한다. 구체적으로 제한되지 않는 한, 이 용어는 참조 핵산으로서 유사한 결합 특성을 지니고 천연형 뉴클레오타이드와 유사한 방식으로 대사되는 천연 뉴클레오타이드의 공지된 유사체를 함유하는 핵산을 포함한다. 달리 나타내지 않는 한, 특정 핵산 서열은 또한 명백하게 나타낸 서열뿐만 아니라 그의 보존적으로 변형된 변이체(예컨대, 축퇴 코돈 치환), 대립 형질, 오쏘로그(ortholog), SNP, 및 상보적 서열을 암시적으로 포함한다. 구체적으로는, 축퇴 코돈 치환은, 하나 이상의 선택된(또는 모든) 코돈의 제3 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 발생시킴으로써 달성될 수 있다(Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985); 및 Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)).
본 명세서에서 이용되는 바와 같은 용어 "작동 가능하게 연결된"은, 제어 서열이 폴리펩타이드(DNA 서열에 의해 암호화됨)의 발현에 영향을 미치도록, 제어 또는 조절 서열이 폴리펩타이드를 암호화하는 핵산 서열에 대한 위치에 배치된다. 일 실시형태에 있어서, 제어 또는 조절 서열은 셀로비아제 활성을 지닌 폴리펩타이드를 암호화하는 핵산 서열의 상류에 있다. 일 실시형태에 있어서, 제어 또는 조절 서열은 셀로비아제 활성을 가진 폴리펩타이드를 암호화하는 핵산 서열의 하류에 있다.
용어 "펩타이드," "폴리펩타이드", 및 "단백질"은 호환 가능하게 사용되며, 그리고 펩타이드 결합에 의해 공유 연결된 아미노산 잔기로 구성된 화합물을 지칭한다. 단백질 또는 펩타이드는 적어도 2개의 아미노산을 함유해야 하고, 제한 없이, 단백질 또는 펩타이드 서열을 포함할 수 있는 최대 개수의 아미노산 상에 배치된다. 폴리펩타이드는 펩타이드 결합에 의해 서로 연결된 2개 이상의 아미노산을 포함하는 임의의 펩타이드 또는 단백질을 포함한다. "폴리펩타이드"는, 예를 들어, 특히, 생물학적으로 활성인 단편, 실질적으로 상동성 폴리펩타이드, 올리고펩타이드, 폴리펩타이드의 동종이량체, 이종이량체, 변이체, 변형된 폴리펩타이드, 유도체, 유사체, 융합 단백질을 포함한다. 폴리펩타이드는 천연 펩타이드, 재조합체 펩타이드, 또는 이들의 조합물을 포함한다.
본 명세서에서 이용되는 바와 같은 용어 "프로모터"는, 폴리뉴클레오타이드 서열의 특정 전사를 개시시키는데 요구되는, 세포의 합성기에 의해 인식된 또는 합성기에 의해 도입된 DNA 서열을 지칭한다.
본 명세서에서 호환 가능하게 사용되는 바와 같은 용어 "조절 서열" 또는 "제어 서열"은, 핵산 생성물의 발현을 위하여 요구되는 핵산 서열을 지칭한다. 몇몇 경우에, 이 서열은 프로모터 서열일 수 있고, 다른 경우에, 이 서열은 또한 인핸서 서열 및 유전자 산물의 발현을 위하여 요구되는 기타 조절 요소를 포함할 수 있다. 조절/제어 서열은, 예를 들어, 조절된 방식, 예컨대, 유도성 방식으로 핵산 생성물을 발현하는 것일 수 있다.
용어 "구성적" 프로모터는, 폴리펩타이드를 암호화하는 폴리뉴클레오타이드와 작동 가능하게 연결된 경우, 세포의 거의 또는 모든 생리적 조건 하에서 세포에서 폴리펩타이드를 생성시키는 뉴클레오타이드 서열을 지칭한다. 일 실시형태에 있어서, 폴리펩타이드는 셀로비아제 활성을 지닌 폴리펩타이드이다.
용어 "유도성" 프로모터는, 폴리펩타이드를 암호화하는 폴리뉴클레오타이드와 작동 가능하게 연결된 경우, 프로모터에 대응하는 인듀서(inducer)가 세포에 존재할 경우에만 실질적으로 세포 내에서 폴리펩타이드를 생성시키는 뉴클레오타이드 서열을 지칭한다. 일 실시형태에 있어서, 폴리펩타이드는 셀로비아제 활성을 지닌 폴리펩타이드이다.
용어 "억제성" 프로모터는, 폴리펩타이드를 암호화하는 폴리뉴클레오타이드와 작동 가능하게 연결된 경우, 프로모터에 대응하는 리프레서(repressor)가 세포에 존재할 경우에만 실질적으로 세포 내에서 폴리펩타이드를 생성시키는 뉴클레오타이드 서열을 지칭한다. 일 실시형태에 있어서, 폴리펩타이드는 셀로비아제 활성을 지닌 폴리펩타이드이다.
본 명세서에서 이용되는 바와 같은 용어 "자일라나제"는, 자일란-함유 물질을 가수분해시키는 효소를 지칭한다. 자일란은 자일로스의 단위를 포함하는 다당류이다. 자일라나제는 엔도자일라나제, 베타-자일로시다제, 아라비노푸라노시다제, 알파-글루쿠로니다제, 아세틸자일란 에스테라제, 페룰로일 에스테라제, 또는 알파-글루코로닐 에스테라제일 수 있다.
설명
글리코실화는 효소 활성, 용해도, 안정성, 폴딩(folding), 및/또는 분비 등과 같은 효소 구조 및 기능에서 중요한 역할을 하는 것으로 여겨진다. 따라서, 바이오매스를 바이오연료 및 다른 생성물로 전환시키는 공정은, 셀룰로스 및/또는 리그노셀룰로스 물질의 당화에 이용하기 위하여, 글리코실화된 효소, 예를 들어, 셀로비아제를 생산하고 이용하는데 초점을 두고 있었다. 당화에 이용하기 위한 효소는 전형적으로 피키아 파스토리스(Pichia pastoris) 등과 같이, 단백질을 적절하게 글리코실화하고, 폴딩하며 분비하는 진핵생물 숙주 세포에서 전형적으로 생산된다.
본 발명은, 비진균 세포주에서 발현되고 효소를 유의하게 글리코실화하지 못하는 숙주 세포로부터 단리된 트리코더마 리세이로부터의 셀로비아제가 트리코더마 리세이로부터 (글리코실화되고 분비된) 내인성 셀로비아제보다 순수한 기질 상에서 더 높은 특이적 활성을 지녔다는 놀라운 발견에 적어도 부분적으로 기초하고 있다. 또한, 아글리코실화된 셀로비아제가 다른 당화 효소를 함유하는 효소 혼합물과 당화 반응에서 사용된 경우, 아글리코실화된 셀로비아제 없는 반응에 비해서 당 생성물의 실질적인 수율 증가가 관찰되었다. 따라서, 본 명세서에서는, 효소 활성, 예컨대, 셀로비아제 활성을 가진 아글리코실화된 폴리펩타이드, 아글리코실화된 폴리펩타이드를 포함하는 조성물, 그리고 본 명세서에 기재된 조성물을 제조하는 방법 및 이를 이용하는 방법이 제공된다.
폴리펩타이드 변이체
본 개시내용은 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드를 제공한다. 일 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 셀로비아제이다. 셀로비아제는 그의 기질인 셀로비오스에서 베타-1,4 결합을 가수분해시켜 2개의 글루코스 분자를 유리시키는 효소이다. 셀로비오스는 글루코스의 수 가용성 1,4-결합된 이량체이다.
Cel3a(BglI로도 알려짐)는 트리코더마 리세이에서 확인된 셀로비아제이다. Cel3a(GenBank 수탁번호 NW_006711153)에 대한 아미노산 서열은 하기에 제공된다:
Figure pct00001
본 개시내용은 또한 본 명세서에 기재된 셀로비아제 활성을 지닌 아글리코실화된 폴리펩타이드의 작용성 변이체, 예컨대, Cel3a를 제공한다. 일 실시형태에 있어서, 작용성 변이체는 본 명세서에 기재된 Cel3a에 대해서 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 지니거나 또는 이의 작용성 단편, 예컨대, 본 명세서에 기재된 Cel3a에 대해서 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 가진 아미노산 서열, 또는 이의 작용성 단편을 지닌다. 일 실시형태에 있어서, 작용성 변이체는 서열번호 1에 대해서 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%의 동일성, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 지니는 아미노산 서열 또는 이의 작용성 단편을 지닌다.
2개 이상의 아미노산 또는 핵산 서열의 맥락에서 동일성 퍼센트는, 동일한 2개 이상의 서열을 지칭한다. 2개의 서열은, 비교 창 또는 이하의 서열 비교 알고리즘들 중 하나를 사용해서 측정된 바와 같이 또는 수동 정렬 및 육안 검사에 의해 설계된 영역에 걸쳐서 최대 대응관계로 비교되고 정렬된 경우, 두 서열이 동일한 아미노산 잔기 또는 뉴클레오타이드의 특정 퍼센트(예컨대, 특정 영역에 걸쳐서 또는 특정되지 않은 경우에는, 전체 서열에 걸쳐서, 60%의 동일성, 임의로 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 동일성)를 가진다면 "실질적으로 동일"하다. 임의로, 동일성은 적어도 약 50개의 뉴클레오타이드, 100개의 뉴클레오타이드, 150개의 뉴클레오타이드 길이인 영역에 걸쳐서 존재한다. 더욱 바람직하게는, 동일성은 적어도 약 200개 이상의 아미노산, 또는 적어도 약 500 또는 1000개 이상의 뉴클레오타이드 길이인 영역에 걸쳐서 존재한다.
서열 비교를 위하여, 하나의 서열은 전형적으로 참조 서열로서 작용하고, 이것과 하나 이상의 시험 서열이 비교된다. 서열 비교 알고리즘을 이용한 경우, 시험 서열과 참조 서열이 컴퓨터에 입력되고, 필요한 경우 하위서열 좌표가 지정되며, 서열 알고리즘 프로그램 파라미터가 지정된다. 디폴트 프로그램 파라미터가 이용될 수 있거나, 또는 대안적인 파라미터가 지정될 수 있다. 이어서 서열 비교 알고리즘은, 프로그램 파라미터에 기초하여, 참조 서열에 디해서 시험 서열에 대한 퍼센트 서열 동일성을 계산한다. 비교용의 서열의 정렬 방법은 당업계에 충분히 공지되어 있다. 비교용의 서열의 최적 정렬은, 예컨대, 문헌[Smith and Waterman, (1970) Adv. Appl. Math. 2:482c]의 로컬 상동성 알고리즘에 의해, 문헌[Needleman and Wunsch, (1970) J. Mol. Biol. 48:443]의 상동성 정렬 알고리즘에 의해, 문헌[Pearson and Lipman, (1988) Proc. Nat'l. Acad. Sci. USA 85:2444]의 유사성 방법에 대한 검색에 의해, 이들 알고리즘의 컴퓨터 구현(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI)에 의해, 또는 수동 정렬 및 육안 검사(예컨대, 문헌[Brent et al., (2003) Current Protocols in Molecular Biology] 참조)에 의해 수행될 수 있다.
퍼센트 서열 동일성 및 서열 유사성을 결정하는데 적합한 알고리즘의 두 예는 문헌[Altschul et al., (1977) Nuc. Acids Res. 25:3389-3402; 및 Altschul et al., (1990) J. Mol. Biol. 215:403-410]에 각각 기재된 BLAST 및 BLAST 2.0 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information)를 통해서 공개적으로 입수 가능하다.
작용성 변이체는, 해당 변이체가 트리코더마 리세이에 의해 생산된 서열번호 1의 효소의 셀로비아제 활성과 비교해서 더 양호한, 예컨대, 보다 증가된 셀로비아제 활성을 보유하도록 하나 이상의 돌연변이를 포함할 수 있다. 일 실시형태에 있어서, 작용성 변이체는 이. 콜라이에 의해 생산된 바와 같은 서열번호 1의 아글리코실화 버전으로서 셀로비아제 활성의 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%)를 지닌다. 셀로비아제 활성은 본 명세서에 기재된 작용성 검정을 이용해서 시험될 수 있다.
다른 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 참조 아미노산 서열, 예컨대, 서열번호 1의 아미노산 서열로부터 1개 이하, 2개 이하, 3개 이하, 4개 이하, 5개 이하, 6개 이하, 7개 이하, 8개 이하, 9개 이하, 10개 이하, 15개 이하, 20개 이하, 30개 이하, 40개 이하 또는 50개 이하의 아미노산만큼 상이하다.
작용성 변이체에 존재하는 돌연변이는 아미노산 치환, 부가 및 결실을 포함한다. 돌연변이는 당업계에 공지된 표준 수법, 예컨대, 부위-지향적 돌연변이 유발 및 PCR-매개 돌연변이 유발에 의해 도입될 수 있다. 돌연변이는 보존적 아미노산 치환일 수 있고, 여기서 아미노산 잔기는 유사한 곁사슬을 가진 아미노산 잔기로 교체된다. 유사한 곁사슬을 가진 아미노산 잔기의 패밀리는 당업계에 규정된 바 있다. 이들 패밀리는 염기성 곁사슬(예컨대, 라이신, 아르기닌, 히스티딘), 산성 곁사슬(예컨대, 아스파르트산, 글루탐산), 미대전된 극성 곁사슬(예컨대, 글리세린, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인, 트립토판), 비극성 곁사슬(예컨대, 알라닌, 발린, 류신, 아이소류신, 프롤린, 페닐알라닌, 메티오닌), 베타-분지된 곁사슬(예컨대, 트레오닌, 발린, 아이소류신) 및 방향족 곁사슬(예컨대, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 가진 아미노산을 포함한다. 따라서, 본 개시내용의 셀로비아제 활성을 지니는 폴리펩타이드 내의 하나 이상의 아미노산 잔기는 동일한 곁사슬 패밀리로부터 다른 아미노산으로 교체될 수 있고, 얻어진 폴리펩타이드는, 야생형 폴리펩타이드의 것과 견줄만한 셀로비아제 활성(예컨대, 적어도 80%, 85%, 90%, 95% 또는 99%의 셀로비아제 활성)을 보유한다. 대안적으로, 돌연변이는 아미노산 치환일 수 있고, 여기서 아미노산 잔기는 상이한 곁사슬을 가진 아미노산 잔기로 교체된다.
이러한 돌연변이는 셀로비아제의 각종 효소 특징을 변화시키거나 영향을 미칠 수 있다. 예를 들어, 이러한 돌연변이는 셀로비아제 활성, 열안정성, 반응에 최적인 pH, 효소 카이네틱, 또는 셀로비아제의 기질 인식을 변화시키거나 영향을 미칠 수 있다. 몇몇 실시형태에 있어서, 돌연변이는 트리코더마 리세이에 의해 생산된 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 변이체의 셀로비아제 활성을 증가시킨다. 몇몇 실시형태에 있어서, 돌연변이는 야생형 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 변이체의 열안정성을 증가 또는 감소시킨다. 일 실시형태에 있어서, 돌연변이는 변이체가 야생형 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 셀로비오스 반응을 최적으로 수행하는 pH 범위를 변화시킨다. 일 실시형태에 있어서, 돌연변이는 야생형 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 셀로비아제 반응(예컨대, kcat, KM 또는 KD)의 카이네틱을 증가 또는 감소시킨다. 일 실시형태에 있어서, 돌연변이는 야생형 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 기질(예컨대, 셀로비오스)을 인식하거나 이에 결합하는 셀로비아제의 능력을 증가 또는 감소시킨다.
본 발명은 또한 본 명세서에 기재된 셀로비아제 활성을 지닌 폴리펩타이드, 예컨대, Cel3a 또는 서열번호 1의 작용성 단편을 제공한다. 당업자라면 효소 활성을 담당하는 작용성 도메인을 포함하는 본 명세서에 기재된 셀로비아제 활성을 지니는 폴리펩타이드의 단편이 작용성 활성, 예컨대, 셀로비아제 활성을 보유할 것으로 용이하게 상정할 수 있었으므로, 이러한 단편은 본 발명에 포함된다. 일 실시형태에 있어서, 작용성 단편은 적어도 700개의 아미노산, 적어도 650개의 아미노산, 적어도 600개의 아미노산, 적어도 550개의 아미노산, 적어도 500개의 아미노산, 적어도 450개의 아미노산, 적어도 400개의 아미노산, 적어도 350개의 아미노산, 적어도 300개의 아미노산, 적어도 250개의 아미노산, 적어도 200개의 아미노산, 적어도 150개의 아미노산, 적어도 100개의 아미노산, 또는 적어도 50개의 아미노산 길이이다. 일 실시형태에 있어서, 작용성 단편은 700 내지 744개의 아미노산, 650 내지 699개의 아미노산, 600 내지 649개의 아미노산, 550 내지 599개의 아미노산, 500 내지 549개의 아미노산, 450 내지 499개의 아미노산, 400 내지 449개의 아미노산, 350 내지 399개의 아미노산, 300 내지 349개의 아미노산, 250 내지 299개의 아미노산, 200 내지 249개의 아미노산, 150 내지 199개의 아미노산, 100 내지 149개의 아미노산, 또는 50 내지 99개의 아미노산이다. 위에서 기재된 아미노산 길이의 범위에 관하여, 아미노산 길이의 최저값 및 최고값은 각 개시된 범위 내에 포함된다. 일 실시형태에 있어서, 작용성 단편은 이. 콜라이에서 생산된 서열번호 1을 포함하는 폴리펩타이드 또는 야생형 Cel3a로서 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 셀로비아제 활성을 지닌다.
셀로비아제 활성을 검출하기 위한 검정법은 당업계에 공지되어 있다. 예를 들어, 셀로비오스로부터 유리된 글루코스의 양의 검출은 정제된 셀로비아제를 기질, 예컨대, 셀로비오스, D-(+)-셀로비오스와 함께 인큐베이팅하고, 반응 완결 후 얻어진 유리 글루코스의 양을 검출함으로써 결정될 수 있다. 유리 글루코스의 양은 당업계에 공지된 각종 방법을 이용해서 결정될 수 있다. 예를 들어, 정제된 셀로비아제의 희석물은 50mM 일염기성 시트르산 나트륨, pH 5.0 NaOH를 함유하는 완충액에서 제조된다. 셀로비오스 기질은 반응 혼합물 중 셀로비오스의 최종 농도가 30mM이 되도록 하는 양으로 정제된 셀로비아제에 첨가된다. 반응 혼합물은, 예컨대, 48℃에서 30분 동안 진탕기(700 rpm)에서 일어나는 반응에 적합한 조건 하에 인큐베이팅된다. 이 반응을 중지시키기 위하여, 반응 혼합물은 100℃에서 5분 동안 가열된다. 반응 혼합물은 0.45㎛ 필터를 통해서 여과되고, 여과액은 글루코스 및/또는 셀로비아제의 양을 정량화하기 위하여 분석된다. 글루코스 등과 같은 분석물을 측정하는 YSI 기기가 이 반응으로부터 생성된 글루코스의 농도를 결정하는데 이용될 수 있다. 대안적으로, UPLC(초고성능 액체 크로마토그래피)는 이 반응으로부터 글루코스 및 셀로비오스의 농도를 결정하는데 이용될 수 있다. 이 검정은 단일 반응으로 또는 다중 반응 형식, 예컨대, 96 웰 형식으로 형식화될 수 있다. 몇몇 실시형태에 있어서, 다중 반응 형식은 정제된 셀로비아제의 상이한 농도에 관하여 셀로비아제 활성을 나타내는 활성 곡선을 생성하기 위하여 바람직할 수 있다. 정제된 셀로비아제의 농도는 표준 브래드포드 검정(Bradford assay)을 이용해서 결정될 수 있다. 정제된 셀로비아제 검정의 희석물, 예컨대, 2-배 희석물이 제조되고, 2배 희석물의 96 웰 플레이트, 예컨대, 12개의 웰에 분취된다. 셀로비오스 기질은 앞서 기재된 바와 같이 첨가되므로, 반응에서 셀로비아제의 최종 농도는 30mM이다. 플레이트는 밀봉되고, 셀로비아제 반응을 일으키는데 충분한 조건 하에서 처리되고, 이어서 반응을 중지시키기 위한 조건 하에서 처리된다. 이 반응물은 이어서 96 웰 형식 0.45㎛ 멤브레인(예컨대, 듀라포어(Durapore))을 통해서 여과되고, YSI 및/또는 HPLC 방법, 예컨대, UPLC에 의해 분석된다.
이 활성 검정은 또한 기지의 농도의 Cel3a 샘플의 희석물의 활성의 표준 곡선을 생성함으로써 샘플 내 Cel3a의 농도 또는 역가를 결정하는데 이용될 수 있다. 미지의 농도의 샘플의 희석액의 활성은 표준 곡선에 기초하여 대략의 농도를 확인하기 위하여 결정되고 표준 곡선과 비교된다. 이 방법은 실시예 6에서 더욱 상세히 기재된다.
다른 실시형태에 있어서, 비색/형광측정 검정이 이용될 수 있다. 정제된 셀로비아제는 반응이 일어나는 조건 하에서 기질 셀로비오스와 인큐베이팅된다. 생성물 글루코스의 검출은 다음과 같다. 글루코스 옥시다제는 혼합물에 첨가되어 글루코스(생성물)를 글루콘산 및 과산화수소로 산화시킨다. 퍼옥시다제 및 o-다이아니시딘이 이어서 첨가된다. O-다이아니시딘은 퍼옥시다제의 존재 중에서 과산화수소와 반응하여 착색된 생성물을 형성한다. 황산이 첨가되고, 이것은 산화된 o-다이아니시딘과 반응하여 더욱 안정적인 착색된 생성물을 형성한다. 예컨대, 분광광도계 또는 비색계에 의해, 예컨대, 540㎚에서 측정된 경우의 색의 강도는, 글루코스 농도에 직접 비례한다. 이러한 비색/형광측정 글루코스 검정법은, 예를 들어, 시그마 알드리치사(Sigma Aldrich)로부터 카탈로그 번호 GAGO-20으로 상업적으로 입수 가능하다.
위에서 기재된 셀로비아제 활성을 지니는 폴리펩타이드 전부에 대해서, 폴리펩타이드는 본 명세서에 기재된 아글리코실화된 폴리펩타이드를 생성하기 위한 방법을 이용해서 아글리코실화된다.
글리코실화는 탄수화물이 글리코실 수용체, 예컨대, 아르기닌 또는 아스파르기닌 곁사슬의 질소, 또는 세린, 트레오닌 또는 티로신 곁사슬의 하이드록실 산소에 부착되는 효소 과정이다. 2가지 유형의 글리코실화, 즉, N-결합된 글리코실화 및 O-결합된 글리코실화가 있다. N-결합된 글리코실화는 공통 부위 Asn-X-Ser/Thr에서 일어나되, 여기서 X는 프롤린을 제외한 임의의 아미노산일 수 있다. O-결합된 글리코실화는 Ser/Thr 잔기에서 일어난다. 글리코실화 부위는, 당업계에 공지된 각종 알고리즘, 예컨대, 스위스 생명정보 연구소(Swiss Institute of Bioinformatics)에 의해 공개적으로 입수 가능한 프로사이트(Prosite), 및 생물학적 서열 분석 센터(Center for Biological Sequence Analysis)에 의해 공개적으로 입수 가능한 NetNGlyc 1.0 또는 NetOGlyc 4.0을 이용해서 예측될 수 있다
실시형태들에 있어서, 작용성 변이체는, 글리칸이 더 이상 글리코실화 부위에 부착되거나 연결되지 않을 수 있도록 돌연변이된 본 명세서에 기재된 핵산 서열에 의해 발현된 Cel3a 폴리펩타이드에 존재하는 하나 이상의 글리코실화 부위에 하나 이상의 돌연변이를 포함한다. 다른 실시형태에 있어서, 작용성 변이체는 글리칸이 더 이상 글리코실화 부위에 부착되거나 연결되지 않을 수 있도록 돌연변이된 본 명세서에 기재된 핵산 서열에 의해 발현된 Cel3a 폴리펩타이드에 존재하는 하나 이상의 글리코실화 부위에 근접한 하나 이상의 돌연변이를 포함한다. 예를 들어, 글리코실화 부위에 근접한 돌연변이는 글리코실화 효소에 의해 인식된 공통 모티프(consensus motif)를 돌연변이시키거나, 또는 폴리펩타이드가 글리코실화되지 않도록, 예컨대, 글리코실화 부위가 은폐되거나 또는 새로운 입체 형태로 인한 입체 장해가 글리코실화 효소가 글리코실화 부위에 접근하는 것을 방지하도록 폴리펩타이드의 입체 형태를 변화시킨다. Cel3a 폴리펩타이드에서 글리코실화 부위에 근접한 돌연변이는 글리코실화 부위에 직접 인접하거나, 또는 글리코실화 부위로부터 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 15, 적어도 20, 적어도 30 또는 적어도 40개의 아미노산이 있고, 이 근접 돌연변이의 결과로서 글리코실화되지 않을 것이다.
일 실시형태에 있어서, Cel3a, 또는 서열번호 1의 이하의 글리코실화 부위 중 하나 이상이 돌연변이된다: 아미노산 위치 78에서의 트레오닌, 아미노산 위치 241에서의 트레오닌, 아미노산 위치 343에서의 세린, 아미노산 위치 450에서의 세린, 아미노산 위치 599에서의 트레오닌, 아미노산 위치 616에서의 세린, 아미노산 위치 691에서의 트레오닌, 아미노산 위치 21에서의 세린, 아미노산 위치 24에서의 트레오닌, 아미노산 위치 25에서의 세린, 아미노산 위치 28에서의 세린, 아미노산 위치 38에서의 트레오닌, 아미노산 위치 42에서의 트레오닌, 아미노산 위치 303에서의 트레오닌, 아미노산 위치 398에서의 세린, 아미노산 위치 435에서의 세린, 아미노산 위치 436에서의 세린, 아미노산 위치 439에서의 트레오닌, 아미노산 위치 442에서의 트레오닌, 아미노산 위치 446에서의 트레오닌, 아미노산 위치 451에서의 세린, 아미노산 위치 619에서의 세린, 아미노산 위치 622에서의 세린, 아미노산 위치 623에서의 트레오닌, 아미노산 위치 626에서의 세린, 또는 아미노산 위치 630에서의 트레오닌 또는 이들의 임의의 조합. 실시형태들에 있어서, 글리코실화 부위는 세린 또는 트레오닌으로부터 알라닌으로 돌연변이된다. 예를 들어, 본 명세서에 기재된 아글리코실화된 폴리펩타이드는 이하의 돌연변이: T78A, T241A, S343A, S450A, T599A, S616A, T691A, S21A, T24A, S25A, S28A, T38A, T42A, T303A, T398A, S435A, S436A, T439A, T442A, T446A, S451A, S619A, S622A, T623A, S626A 또는 T630A, 또는 이들의 임의의 조합 중 하나 이상을 갖는다. 대안적으로, 본 명세서에 기재된 글리코실화 부위에 근접한 하나 이상의 아미노산이 돌연변이된다.
폴리펩타이드가 글리칸에 의해 변형되는지의 여부(예컨대, 폴리펩타이드가 글리코실화되는지 또는 아글리코실화되는지의 여부)를 검출하는 검정법은 당업계에 공지되어 있다. 폴리펩타이드는 정제되거나 단리될 수 있고, 그리고 글리칸 모이어티의 검출 및 정량화를 위하여 염색될 수 있거나, 또는 폴리펩타이드는 질량 분광법에 의해 분석될 수 있고, 대응하는 참조 폴리펩타이드와 비교될 수 있다. 참조 폴리펩타이드는 시험 폴리펩타이드와 동일한 일차 서열(글리코실화 상태가 결정되어야 함)을 갖지만, 글리코실화되거나 또는 아글리코실화된다.
본 명세서에 기재된 아글리코실화된 폴리펩타이드는 대응하는 글리코실화 폴리펩타이드, 예컨대, 글라이코실화된 Cel3a 폴리펩타이드에 비해서 증가된 셀로비아제 활성을 지닌다. 예를 들어, 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드는 글리코실화된 폴리펩타이드에 비해서 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% 또는 200%의 셀로비아제 활성을 지닌다.
핵산
본 발명은 또한 본 발명의 셀로비아제 활성을 지닌 폴리펩타이드를 암호화하는 핵산 서열을 제공한다. 일 실시형태에 있어서, 핵산 서열은 본 명세서에 기재된 아미노산 서열을 가진 Cel3a 효소 또는 이의 작용성 단편을 암호화한다.
일 실시형태에 있어서, Cel3a를 암호화하는 핵산 서열은 이하에 제공된다:
Figure pct00002
본 명세서에 기재된 셀로비아제 활성을 가진 폴리펩타이드를 암호화하는 핵산 서열은 숙주 세포에서 증가된 발현을 위하여 코돈-최적화될 수 있다. 코돈 최적화는, 숙주 내에서 암호화된 폴리펩타이드의 발현을 증가시키기 위하여, 코돈 사용빈도 편향(codon usage bias), 숨은 스플라이싱(cryptic splicing) 부위, mRNA 이차 구조, 조숙한 polyA 부위, 코돈과 안티코돈의 상호작용, 및 RNA 불안성 모티프를 포함하는 인자를 고려하도록 핵산 서열을 변경시키는 것을 포함한다. 코돈-최적화를 위한 각종 알고리즘 및 상업적 서비스가 당업계에 공지되어 있고 입수 가능하다.
Cel3a를 암호화하는 코돈-최적화된 핵산은 이하에 제공된다:
Figure pct00003
일 실시형태에 있어서, Cel3a 효소 또는 이의 작용성 변이체를 암호화하는 핵산 서열은 서열번호 2에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 포함한다. 일 실시형태에 있어서, Cel3a 효소 또는 이의 작용성 변이체를 암호화하는 핵산 서열은 서열번호 2 또는 서열번호 3에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 포함한다.
본 명세서에서는, 위에서 기재된 바와 같은, 아글리코실화된 폴리펩타이드, 예컨대, Cel3a 폴리펩타이드를 암호화하는 핵산 서열이 제공되되, 여기서 폴리펩타이드에 존재하는 하나 이상의 글리코실화 부위는 글리칸이 더 이상 글리코실화 부위에 부착되거나 연결되지 않을 수 있도록 돌연변이되었다. 다른 실시형태에 있어서, 위에서 기재된 바와 같이, 아글리코실화된 폴리펩타이드, 예컨대, Cel3a 폴리펩타이드를 암호화하는 본 명세서에 기재된 핵산 서열에서, 앞서 기재된 바와 같이, 폴리펩타이드에 존재하는 하나 이상의 글리코실화 부위에 근접한 하나 이상의 돌연변이는 글리칸이 더 이상 글리코실화 부위에 부착되거나 연결되지 않을 수 있도록 돌연변이되어 있었다. 일 실시형태에 있어서, 핵산 서열은 Cel3a, 또는 서열번호 1의 이하의 글리코실화 부위 중 하나 이상에서 하나 이상의 돌연변이를 포함하는 폴리펩타이드를 암호화한다: 서열번호 1의 아미노산 위치 78에서의 트레오닌, 아미노산 위치 241에서의 트레오닌, 아미노산 위치 343에서의 세린, 아미노산 위치 450에서의 세린, 아미노산 위치 599에서의 트레오닌, 아미노산 위치 616에서의 세린, 아미노산 위치 691에서의 트레오닌, 아미노산 위치 21에서의 세린, 아미노산 위치 24에서의 트레오닌, 아미노산 위치 25에서의 세린, 아미노산 위치 28에서의 세린, 아미노산 위치 38에서의 트레오닌, 아미노산 위치 42에서의 트레오닌, 아미노산 위치 303에서의 트레오닌, 아미노산 위치 398에서의 세린, 아미노산 위치 435에서의 세린, 아미노산 위치 436에서의 세린, 아미노산 위치 439에서의 트레오닌, 아미노산 위치 442에서의 트레오닌, 아미노산 위치 446에서의 트레오닌, 아미노산 위치 451에서의 세린, 아미노산 위치 619에서의 세린, 아미노산 위치 622에서의 세린, 아미노산 위치 623에서의 트레오닌, 아미노산 위치 626에서의 세린, 또는 아미노산 위치 630에서의 트레오닌 또는 이들의 임의의 조합. 실시형태들에 있어서, 글리코실화 부위는 세린 또는 트레오닌에서 알라닌으로 돌연변이된다. 예를 들어, 본 발명의 핵산 서열은 이하의 돌연변이들 중 하나 이상을 포함하는 아글리코실화된 폴리펩타이드를 암호화한다: T78A, T241A, S343A, S450A, T599A, S616A, T691A, S21A, T24A, S25A, S28A, T38A, T42A, T303A, T398A, S435A, S436A, T439A, T442A, T446A, S451A, S619A, S622A, T623A, S626A 또는 T630A, 또는 이들의 임의의 조합. 당업자라면 당업계에 공지된 방법, 예컨대, 부위-지향 돌연변이 유발을 이용해서 하나 이상의 글리코실화 부위 돌연변이를 가진 폴리펩타이드를 암호화하도록 야생형 Cel3a의 핵산 서열(서열번호 2)을 용이하게 변형시킬 수 있었다.
폴리펩타이드를 암호화하는 핵산 서열을 단리 또는 클로닝하는데 이용되는 수법은, 당업계에 공지되어 있고, 게놈 DNA로부터의 단리, cDNA로부터의 제조, 또는 이들의 조합을 포함한다. 이러한 게놈 DNA로부터 본 발명의 핵산 서열의 클로닝은, 예컨대, 공유된 구조적 구조를 가진 클로닝된 DNA 단편을 검출하기 위하여, 잘 알려진 중합효소 연쇄 반응(PCR) 또는 발현 라이브러리의 항체 선별을 이용함으로써 영향받을 수 있다. 예컨대, 문헌[Innis et al., 1990, PCR: A Guide to Methods and Application, Academic Press, New York] 참조. 리가제 연쇄 반응(LCR), 결찰된 활성화 전사(LAT) 및 뉴클레오타이드 서열-기반 증폭(NASBA) 등과 같은 기타 증폭 절차가 이용될 수 있다. 핵산 서열은 트리코더마 리세이, 예컨대, 야생형 트리코더마 리세이, 또는 트리코더마 리세이 RUTC30, 또는 따른 또는 관련된 유기체의 균주로부터 클로닝될 수 있고, 따라서, 예를 들어, 핵산 서열의 영역을 암호화하는 폴리펩타이드의 대립형질 또는 종 변이체일 수 있다.
핵산 서열은 핵산 서열을 그의 천연 개소로부터 재생될 상이한 부위로 이동시키도록 유전자 공학에서 이용되는 표준 클로닝 절차에 의해 얻어질 수 있다. 클로닝 절차는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 목적으로 하는 단편의 적출 및 단리, 이 단편의 벡터 분자에의 삽입, 및 뉴클레오타이드 서열의 다수의 카피 또는 클론이 복제될 숙주 세포 내로 재조합체 벡터의 편입을 포함할 수 있다. 뉴클레오타이드 서열은 게놈, cDNA, RNA, 반합성, 합성 기원, 또는 이들의 임의의 조합일 수 있다.
발현 벡터 및 숙주 세포
본 발명은 또한 발현, 분비, 및/또는 발현된 폴리펩타이드의 단리를 지향하는 1개 이상의 제어 서열에 작동 가능하게 연결된 본 명세서에 기재된 셀로비아제 활성을 지닌 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 핵산 작제물을 제공한다.
본 명세서에서 이용되는 바와 같은, "발현 벡터"는 숙주 세포 내로 관심 대상 핵산 서열을 도입하고 발현하기 위한 핵산 작제물이다. 몇몇 실시형태에 있어서, 벡터는 관심 대상 핵산 서열에서 암호화된 폴리펩타이드의 발현을 가능하게 하고 이에 작동 가능하게 연결된 적합한 제어 서열을 포함한다. 제어 서열은 핵산 서열의 발현을 위하여 숙주 세포에 의해 인식된 적절한 프로모터 서열일 수 있다. 일 실시형태에 있어서, 관심 대상 핵산 서열은 본 명세서에 기재된 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열이다.
본 발명의 발현 벡터에서 프로모터는 숙주 세포에 대해서 상동성이거나 이종성인 세포외 또는 세포내 폴리펩타이드를 암호화하는 유전자로부터 얻어진 프로모터, 돌연변이 프로모터, 절두된 프로모터, 및 하이브리드 프로모터를 포함한다.
박테리아 숙주 세포에서 본 발명의 핵산 작제물의 전사를 지시하기 위한 적절한 프로모터의 예는 이. 콜라이 lac 오페론, 이. 콜라이 tac 프로모터(하이브리드 프로모터, DeBoer et al, PNAS, 1983, 80:21-25), 이. 콜라이 rec A, 이. 콜라이는 araBAD, 이. 콜라이 tetA 및 원핵 베타-락타마제로부터 얻어진 프로모터이다. 적절한 프로모터의 다른 예는 T7 프로모터, T5 프로모터, T3 프로모터, M13 프로모터, 및 SP6 프로모터를 포함하는, 박테리오파지로부터의 프로모터 등과 같은 바이러스성 프로모터를 포함한다. 몇몇 실시형태에 있어서, 하나 초과의 프로모터, 예컨대, 이. 콜라이 lac 프로모터 및 T7 프로모터가 관심 대상 핵산 서열의 발현을 제어한다. 본 발명에서 사용하기 적합할 수 있는 추가의 프로모터는 문헌["Useful proteins from recombinant bacteria" in Scientific American, 1980, 242:74-94, 및 Sambrook et al., Molecular Cloning: A Laboratory Manual, 1989]에 기재되어 있다. 몇몇 바람직한 실시형태에 있어서, 프로모터는 유도성이고, 여기서 분자의 부가는 하류의 리딩 프레임(reading frame)의 전사 및 발현을 자극시킨다.
진핵생물 숙주 세포에서, 예컨대, 진균 또는 효모 세포에서 본 발명의 핵산 작제물의 전사를 지시하는 적절한 프로모터의 예는 트리코더마 리세이의 속으로부터 얻어진 프로모터, 메탄올-유도성 알코올 옥시다제(AOX 프로모터), 아스페르길루스 니둘란스(Aspergillus nidulans) 트립토판 생합성(trpC 프로모터), 아스페르길루스 니거 변종 아와모리(Aspergillus niger var. awamori) 플루코아밀라제(glaA), 사카로마이세스 세레비시아(Saccharomyces cerevisiae) 갈락토키나제(GAL1), 또는 클루이베로마이세스 락티스(Kluyveromyces lactis) Plac4 - PBI 프로모터이다.
본 발명의 발현 벡터에 존재하는 제어 서열은 또한 폴리펩타이드의 아미노 말단에 연결된 아미노산 서열을 암호화하고 세포의 분비 경로 내로 암호화된 폴리펩타이드를 지향시키는 신호 서열, 예컨대, 분비 신호 서열일 수 있다. 이 신호 서열은 예컨대, 내인성 신호 서열일 수 있고, 여기서 이 신호 서열은 관심 대상 폴리펩타이드가 기원되는 유기체에 의해 내재적으로 발현될 경우 야생형 폴리펩타이드의 N-말단에 존재한다. 신호 서열은 이물, 이종 신호 펩타이드일 수 있고, 여기서 신호 서열은 발현되는 관심 대상 폴리펩타이드의 것과는 상이한 폴리펩타이드 또는 상이한 유기체로부터 유래된다. 숙주 세포의 분비 경로에 발현된 폴리펩타이드를 지향시키는 임의의 신호 서열은 본 발명에서 사용될 수 있다. 전형적으로, 신호 서열은 6 내지 136개의 염기성 및/또는 소수성 아미노산으로 구성된다.
본 발명에 적합한 신호 서열의 예는 사카로마이세스 세레비시아 알파-인자로부터의 신호 서열을 포함한다.
융합 태그는 또한 발현된 폴리펩타이드의 검출 및 정제를 용이하게 하기 위하여 본 발명의 발현 벡터에 사용될 수 있다. 적절한 융합 태그의 예는 His-태그(예컨대, 3xHis, 6x His(서열번호 6), 또는 8xHis(서열번호 7)), GST-태그, HSV-태그, S-태그, T7 태그를 포함한다. 기타 적절한 융합 태그는 myc 태그, 혈구응집소(HA) 태그, 및 형광 단백질 태그(예컨대, 녹색 형광 단백질)를 포함한다. 융합 태그는 전형적으로 발현될 폴리펩타이드의 N 또는 C 말단에 작동 가능하게 연결된다. 몇몇 실시형태에 있어서, 발현될 폴리펩타이드의 N-말단 또는 C-말단과 융합 태그 서열 간의 링커 영역이 있을 수 있다. 일 실시형태에 있어서, 링커 영역은 1 내지 20개의 아미노산의 서열을 포함하며, 이는 발현된 폴리펩타이드의 발현 또는 기능에 영향을 미치거나 변화시키지 않는다.
본 명세서에 기재된 융합 태그의 이용은, 예컨대, 태그를 특이적으로 인식하는 항체를 이용함으로써 웨스턴 블롯에 의해 발현된 단백질의 검출을 허용한다. 태그는 또한 예컨대 친화도 크로마토그래피에 의해 숙주 세포로부터 발현된 폴리펩타이드의 정제를 허용한다. 예를 들어, His-태그에 융합된 발현된 폴리펩타이드는 니켈 친화도 크로마토그래피를 이용해서 정제될 수 있다. His 태그는 니켈 이온에 대한 친화도를 지니며, 니켈 칼럼은 His-태그된 폴리펩타이드를 보유할 것인 반면, 모든 다른 단백질 및 세포 지스러기가 이 칼럼을 통해 흐르게 한다. 예컨대, 이미다졸을 함유하는 용리 완충제를 이용하는 His-태그된 폴리펩타이드의 용리는, 칼럼으로부터 His-태그된 폴리펩타이드를 유리시켜, 실질적으로 정제된 폴리펩타이드를 얻는다.
본 발명의 발현 벡터는 당업자에게 공지된 바와 같이 작제물로 형질전환된 통상적으로 공지된 유전자 변형된 미생물의 단리를 가능하게 하는 선택 가능한 마커 유전자를 더 포함할 수 있다. 선택 가능한 마커 유전자는, 그렇지 않을 경우 이들 조건 하에 성장하지 못했을 숙주 유기체에 특정 영양소를 결여하는 배지에서 성장하는 능력 또는 항생제에 대한 저항을 부여할 수 있다. 본 발명은 선택 가능한 마커 유전자의 선택에 의해 제한되지 않고, 당업자라면 적절한 유전자를 용이하게 결정할 수 있다. 예를 들어, 선택 가능한 마커 유전자는 암피실린, 클로람페니콜, 테트라사이클린, 카나마이신, 하이그로마이신, 프레오마이신, 제네티신 또는 G418에 대한 저항성을 부여할 수 있거나, 또는 trp, arg, leu, pyr4, pyr, ura3, ura5, his, 또는 ade 유전자 중 하나에서 숙주 미생물의 결여를 보완할 수 있거나, 또는 단독 질소 공급원으로서 아세트아마이드를 성장시키는 능력을 부여할 수 있다.
본 발명의 발현 벡터는 다른 핵산 서열, 예컨대, 당업자에게 통상 공지된 바와 같은 추가의 제어 서열, 예를 들어, 전사 종결자, 각종 다른 핵산 서열을 함께 연결하는 합성 서열, 복제의 기원, 리보좀 결합 부위, 다수의 클로닝 부위(또는 폴리링커 부위), 폴리아데닐화 신호 등을 더 포함할 수 있다. 발현 벡터에 적합한 리보좀 결합 부위는, 예를 들어, 원핵 숙주 세포에서 발현하기 위하여 이용되는 숙주 세포에 좌우되며, 원핵 RBS, 예컨대, T7 파지 RBS가 이용될 수 있다. 다수의 클로닝 부위 또는 폴리링커 부위는, 바람직하게는 발현 벡터의 나머지 서열에 존재하지 않는 하나 이상의 제한 효소 부위를 함유한다. 제한 효소 부위는 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열 또는 기타 목적으로 하는 제어 서열의 삽입을 위해 사용된다. 본 발명의 실시는 이들 다른 핵산 서열, 예컨대, 다른 제어 서열의 임의의 하나 이상의 존재에 의해 제한되지 않는다.
본 발명에서 이용하기 위한 적절한 발현 벡터의 예는 원핵생물에서 발현을 위한 벡터, 예컨대, 박테리아 발현 벡터를 포함한다. pET 벡터(노바젠사(Novagen))에서 사용하기 적합한 박테리아 발현 벡터는, 단지 T7 RNA 중합효소(박테리아 RNA 중합효소가 아님)에 특이적이고 원핵 게놈 내 어느 곳에서도 존재하지 않는 바이러스성 T7 프로모터, lac 프로모터를 포함하고 lac 리프레서 단백질(lacI 유전자)용의 서열을 암호화하는 lac 오퍼레이터, 폴리링커, 복제의 f1 기원(M13 헬퍼 파지로 공동 감염된 경우 단일 가닥 플라스미드가 생성될 수 있도록), 암피실린 저항 유전자 및 복제의 ColE1 기원(Blaber, 1998)을 함유한다. 프로모터와 lac 오퍼레이터는 둘 다 폴리링커의 5' 또는 상류에 위치하며, 여기서 본 명세서에 기재된 폴리펩타이드를 암호화하는 핵산 서열이 삽입된다. lac 오퍼레이터는 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열의 유도성 발현을 부여한다. 락토스 대사산물인 IPTG(아이소프로필 β-D-1-티오갈락토피라노사이드)의 첨가는 lac 오페론의 잔사를 촉발시키고 lac 오퍼레이터의 제어 하에 핵산 서열의 단백질 발현을 유도한다. 이 시스템의 사용은 벡터 발현용의 숙주 세포에 T7 RNA 중합효소의 첨가를 필요로 한다. T7 RNA 중합효소는 제2 발현 벡터를 통해서 도입될 수 있거나, 또는 T7 RNA 중합효소를 발현하도록 유전자 조작된 숙주 세포 균주가 사용될 수 있다.
본 발명에서 이용하기 위한 예시적인 발현 벡터는 노바젠사로부터 상업적으로 입수 가능한 pET 벡터이다. pET 발현 시스템은 미국 특허 제4,952,496호; 제5,693,489호; 및 제5,869,320호에 기재되어 있다. 하나의 실시형태에 있어서, pET 벡터는 pET-DUET 벡터, 예컨대, 노바젠사로부터 상업적으로 입수 가능한 pET-Duet1이다. 본 발명에서 사용하기 적합한 기타 벡터는 미국 특허 제5,310,663호 및 제5,284,933호; 및 유럽 특허 제282042호에 기재된 것들과 같은 His-태그 서열을 함유하는 벡터를 포함한다.
본 발명은 셀로비아제 활성을 지니는 폴리펩타이드의 재조합체 생성물에서 이용되는 본 발명의 핵산 서열 또는 발현 벡터를 포함하는 숙주 세포에 관한 것이다.
본 발명의 핵산 서열을 포함하는 발현 벡터는 폴리펩타이드가 발현되도록 벡터가 유지되도록(예컨대, 염색체 통합에 의해 또는 자체-복제 염색체외 벡터로서) 숙주 세포 내로 도입된다.
숙주 세포는 원핵생물 또는 진핵생물일 수 있다. 숙주 세포는 이. 콜라이 균주, 예컨대, K12 균주 노바블루(NovaBlue), 노바블루(NovaBlue) T1R, JM109, 및 DH5α 등과 같은 박테리아일 수 있다. 바람직하게는, 박테리아 세포는 이. 콜라이 오리가미(Origami) 균주, 예컨대, 오리가미 B, 오리가미 B(DE3), 오리가미 2 및 오리가미 2(DE3) 균주 등과 같은 외재적으로 발현된 단백질을 폴딩하거나 부분적으로 폴딩하는 능력을 가진다. 몇몇 실시형태에 있어서, 글리코실화를 결여하거나, 숙주 세포에 의해 발현된 단백질이 충분히 글리코실화되지 않도록 손상된 글리코실화 경로를 가진 숙주 세포를 사용하는 것이 바람직할 수 있다.
숙주 세포는 효모 또는 사상균, 특히 아스코마이코타(Ascomycota)로서 분류된 것들일 수 있다. 본 발명의 변형된 TrCel3A베타-글루코시다제의 발현을 위한 숙주 미생물로서 유용한 효모의 속은 사카로마이세스, 피키아(Pichia), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 야로위아(Yarrowia) 및 아륵술라(Arxula)를 포함한다. 본 발명의 폴리펩타이드의 발현을 위한 미생물로서 유용한 진균의 속은 트리코더마, 하이포크레아(Hypocrea), 아스페르길루스, 푸사륨, 후미콜라, 뉴로스포라(Neurospora), 크리소스포리륨, 마이셀리오프토라, 티엘라비아(Thielavia), 스포로트리쿰(Sporotrichum) 및 페니실륨(Penicillium)을 포함한다. 예를 들어, 숙주 세포는 피키아 파스토리스일 수 있다. 예를 들어, 숙주 세포는 트리코더마 리세이의 산업적 균주, 또는 이의 돌연변이체, 예컨대, 트리코더마 리세이 RUTC30일 수 있다. 전형적으로, 숙주 세포는 친(parental) 셀로비아제 또는 Cel3a를 발현하지 않는 것이다.
특정 숙주 세포, 예컨대, 박테리아 세포 또는 진균 세포의 선택은, 이하에 더욱 상세히 설명되는 바와 같이, 본 발명의 아글리코실화된 폴리펩타이드를 생성하기 위하여 이용된 방법에 좌우된다.
본 발명의 발현 벡터는 미생물 형질전환 분야의 숙련된 자에 의해 공지된 많은 방법에 의해 숙주 세포 내에 도입될 수 있으며, 이 방법은 형질전환, CaCl2에 의한 세포의 처리, 전기천공법, 유전자 충격(biolistic bombardment), 리포펙션, 및 프로토플라스트(protoplast)의 PEG-매개 융합(예컨대, White 등의 WO 2005/093072, 이것은 참고로 본 명세서에 편입됨)을 포함하지만, 이들로 제한되는 것은 아니다. 발현 벡터를 함유하는 재조합 숙주 세포를 (예컨대, 발현 벡터의 선택 가능한 마커를 이용한 선택에 의해) 선택한 후, 재조합 숙주 세포는 본 발명의 셀로비아제 활성을 지니는 폴리펩타이드의 발현을 유도하는 조건 하에서 배양될 수 있다.
아글리코실화된 폴리펩타이드를 생성하는 방법
본 발명은 본 명세서에 기재된 바와 같이 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드를 생성하는 방법을 더 제공한다. 해당 방법은 폴리펩타이드의 발현을 위하여 적합한 조건 하에서 본 발명의 폴리펩타이드를 발현시키는 재조합 숙주 세포를 배양하는 단계를 포함한다. 이 방법은 또한 재조합 숙주 세포로부터 아글리코실화된 폴리펩타이드를 회수하는 단계를 포함할 수 있다.
원핵생물 및 진핵생물 세포로부터 발현된 폴리펩타이드를 회수하는 방법은 당업계에 공지되어 있다. 실시형태들에 있어서, 폴리펩타이드를 회수하는 방법은, 예컨대, 기계적, 화학적 또는 효소적 수단에 의해 세포를 용해시키는 것을 포함한다. 예를 들어, 세포는, 예컨대, 초음파처리, 밀링(비드를 이용한 진탕), 또는 전단력에 의해 물리적으로 쪼개질 수 있다. 세포막은 세포의 내용물이 방출되도록 침투되도록 세제, 예컨대, 트리톤(Triton), NP-40, 또는 SDS에 의한 처리로 처리될 수 있다. 세포벽을 가진 세포, 예컨대, 박테리아 세포는, 라이소자임 또는 라이소나제 등과 같은 효소를 이용해서 침투될 수 있다. 위에서 기재된 기계적, 화학적 및 효소적 수법의 임의의 조합은 또한 본 발명의 맥락에서 숙주 세포로부터 관심 대상인 발현된 폴리펩타이드를 회수하는데 적합하다. 예를 들어, 박테리아 세포, 예컨대, 이. 콜라이 세포에서 본 명세서에 기재된 셀로비아제 활성을 지닌 아글리코실화된 폴리펩타이드를 발현할 경우, 세포는 전형적으로 세포 배양액을 원심 분리하고 펠릿화하고, 라이소자임을 함유하는 용해 완충액에 재현탁시킴으로써 용해된다. 완전한 용해를 확보하기 위하여, 재현탁된 세포에 이하의 방법 중 하나를 실시한다: 초음파처리, 밀링 또는 균질화.
하나의 실시형태에 있어서, 본 명세서에 기재된 셀로비아제 활성을 지니는 발현된 아글리코실화 폴리펩타이드는, 당화 반응을 위하여 바이오매스에의 첨가 전에 용해되지 않는다. 몇몇 경우에, 숙수 세포를 용해시키는 방법은 단백질 변성 및/또는 감소된 효소 활성을 초래할 수 있어, 하루 가공처리의 비용 증가를 유발한다. 따라서, 본 발명은 또한 당화 단계 전에 본 명세서에 기재된 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드를 발현하는 숙주 세포를 바이오매스에 직접 첨가하는 방법을 제공한다.
일 실시형태에 있어서, 본 명세서에 기재된 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드를 발현하는 숙주 세포, 예컨대, 이. 콜라이 세포는, 예컨대, 원심분리에 의해 단리되어, 당화 반응, 예컨대, 바이오매스를 수용하는 당화 반응기에 첨가된다. 세포는 바이오매스의 전단, 임펠러 및 증가된 온도에 의해 용해된다. 일 실시형태에 있어서, 본 명세서에 기재된 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드를 발현하는 숙주 세포, 예컨대, 이. 콜라이 세포의 배양액은 발효 탱크로부터 당화 탱크에 직접 첨가되어, 원심분리에 의해 세포를 펠릿화할 필요성을 제거한다.
글리코실화가 불충분한 숙주 세포의 이용
실시형태들에 있어서, 발현 벡터는 세포, 예컨대, 박테리아 숙주 세포에서 발현된 단백질을 충분히 글리코실화하지 못하는 세포에 도입되고 당해 세포에서 발현되는 융합 태그에 작동 가능하게 연결된 본 명세서에 기재된 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 재조합 숙주 세포는 폴리펩타이드의 발현 조건 하에 배양되어, 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드의 생성을 유발한다. 아글리코실화된 폴리펩타이드는 본 명세서에 기재된 바와 같은 융합 태그를 위하여 친화도 크로마토그래피 방법을 이용해서 숙주 세포로부터 정제 또는 단리될 수 있다.
예를 들어, 이 실시형태에 있어서, 발현 벡터는 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열의 상류에 lac 오퍼레이터 및 T7 프로모터를 함유하고, 숙주 세포는 T7 RNA 중합효소를 발현하는 능력을 지닌다. 셀로비아제 활성을 지니는 폴리펩타이드의 발현은 IPTG의 첨가에 의해 유도된다. 바람직하게는, 숙주 세포는 이. 콜라이 세포, 바람직하게는 이. 콜라이 오리가미 세포이다. 이 실시형태에 있어서, 융합 태그는 His-태그이고, 발현된 아글리코실화된 폴리펩타이드의 정제는 니켈 친화도 크로마토그래피를 포함한다.
글리코실화를 위한 능력을 가진 숙주 세포의 이용
다른 실시형태에 있어서, 폴리펩타이드가 본 명세서에 기재된 바와 같이 글리코실화되지 않도록 1개 이상의 글리코실화 부위 돌연변이를 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 발현 벡터는 숙주 세포에서 발현되고, 여기서 숙주 세포는 당해 세포, 예컨대, 효모 또는 진균 숙주 세포 내에서 발현된 단백질을 글리코실화할 수 있다. 대안적으로, 숙주 세포는 세포, 예컨대, 박테리아 숙주 세포 내에서 발현된 단백질을 글리코실화할 수 없다. 이 실시형태에 있어서, 폴리펩타이드는 융합 태그에 작동 가능하게 연결된다. 아글리코실화된 폴리펩타이드는 본 명세서에 기재된 바와 같은 융합 태그에 대해서 친화도 크로마토그래피 방법을 이용해서 박테리아 숙주 세포로부터 정제 또는 단리될 수 있다.
또 다른 실시형태에 있어서, 본 명세서에 기재된 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 발현 벡터는 숙주 세포에서 발현되고, 여기서 숙주 세포는 해당 세포 내에서 발현된 단백질을 글리코실화할 수 있다. 세포는 폴리펩타이드의 발현 및 글리코실화를 위하여 충분한 조건 하에서 배양된다. 이 실시형태에 있어서, 폴리펩타이드는 융합 태그에 작동 가능하게 연결된다. 글리코실화 폴리펩타이드는 본 명세서에 기재된 바와 같은 융합 태그를 위하여 친화도 크로마토그래피 방법을 이용해서 박테리아 숙주 세포로부터 정제 또는 단리될 수 있다. 숙주 세포 및 기타 내인성 숙주 효소, 예컨대, 글리코실화 효소로부터의 정제 후에, 단리된 글리코실화 폴리펩타이드의 글리칸은 탈글리코실화 효소와의 인큐베이션에 의해 제거될 수 있다. 탈글리코실화 효소는 PNGase F, PNGase A, EndoH(엔도글리코시다제 H), EndoS(엔도글리코시다제 S), EndoD(엔도글리코시다제 D), EndoF(엔도글리코시다제 F), EndoF1(엔도글리코시다제 F1), 또는 EndoF2(엔도글리코시다제 F2)를 포함한다. 글리칸의 완전한 제거를 위하여 충분한 효소를 함유하는 단백질 탈글리코실화 믹스는, 예컨대, 뉴잉글랜드 바이오랩스사(New England Biolabs)로부터 상업적으로 입수 가능하다. 단리된 폴리펩타이드는 폴리펩타이드로부터 글리칸의 전부를 제거하는데 충분한 조건 하에서 1종 이상의 탈글리코실화 효소와 함께 인큐베이팅된다. 폴리펩타이드로부터 글리칸을 제거하기 위하여, 기타 방법, 예컨대, 온화한 알칼리 또는 온화한 하이드라진분해에 의한 β-제거가 당업계에 공지되어 있다. 폴리펩타이드의 글리코실화 상태의 평가는 당업계에 공지된 글리칸의 염색 및 시각화를 위한 방법 또는 질량 분광법을 이용해서 결정될 수 있다.
또 다른 실시형태에 있어서, 본 명세서에 기재된 셀로비아제 활성을 가진 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 발현 벡터는 숙주 세포에서 발현되되, 여기서 숙주 세포는 세포 내에 발현된 단백질을 글리코실화할 수 있다. 세포는 폴리펩타이드의 발현을 위하여 충분한 조건 하이지만 글리코실화 저해제의 존재하에서 배양된다. 글리코실화 저해제는 발현된 폴리펩타이드가 글리코실화되지 않도록 하는 농도에서 그리고 충분한 시간 동안 존재한다. 이 실시형태에 있어서, 폴리펩타이드는 융합 태그에 작동 가능하게 연결된다. 얻어진 아글리코실화된 폴리펩타이드는 본 명세서에 기재된 바와 같은 융합 태그에 대해서 친화도 크로마토그래피 방법을 이용해서 박테리아 숙주 세포로부터 정제되거나 단리될 수 있다.
본 실시형태에서 사용하기 위한 적절한 글리코실화 저해제의 예는 투니카마이신, 벤질-GalNAc(벤질 2-아세트아미도-2-데옥시-α-D-갈락토피라노사이드), 2-플루오로-2-데옥시-D-글루코스, 및 5'CDP(5' 시티딜레이트 다이포스페이트)를 포함한다. 몇몇 실시형태에 있어서, 글리코실화 저해제의 조합물이 사용된다. 바람직하게는, 본 실시형태에서 사용되는 글리코실화 저해제의 농도는 폴리펩타이드의 글리코실화를 저해하는데 충분하지만, 숙주 세포의 단백질 발현의 세포독성 또는 저해를 일으키지 않는다.
아글리코실화된 폴리펩타이드를 이용하여 생성물을 생성하는 방법
본 발명은, 본 명세서에 기재된 바와 같은 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드를 이용해서 바이오매스를 생성물로 전환 또는 가공처리하기 위한 방법 및 조성물을 제공한다. 바이오매스를 당 생성물 등과 같은 생성물로 전환시키는 방법은, 예를 들어, 미국 특허 출원 제2014/0011258호(이의 내용은 그의 전문이 참고로 편입됨)에 기재된 바와 같이, 당업계에 공지되어 있다. 요약하면, 바이오매스는, 예컨대, 난분해성을 저감시키기 위하여 최적으로 전처리되고, 처리된 바이오매스를 바이오매스-분해, 또는 셀룰로스 분해 효소와 함께 인큐베이팅하여 당(예컨대, 글루코스 및/또는 자일로스)을 생성하는 당화 공정에 의해 당화된다. 당 생성물은 이어서 예컨대, 발효 또는 증류에 의해 최종 생성물을 생산하기 위하여 더욱 가공처리될 수 있다. 최종 생성물은 알코올(예컨대, 에탄올, 아이소뷰탄올 또는 n-뷰탄올), 당 알코올(예컨대, 에리트리톨, 자일리톨 또는 솔비톨), 또는 유기산(예컨대, 락트산, 피루브산, 숙신산)을 포함한다.
본 명세서에 기재된 공정을 이용해서, 바이오매스 물질은 1종 이상의 생성물, 예컨대, 에너지, 연료, 식품 및 물질로 전환될 수 있다. 생성물의 구체적인 예는, 수소, 당(예컨대, 글루코스, 자일로스, 아라비노스, 만노스, 갈락토스, 프럭토스, 셀로비오스, 이당류, 올리고당 및 다당류), 알코올(예컨대, 1가 알코올 또는 2가 알코올, 예컨대, 에탄올, n-프로판올, 아이소뷰탄올, sec-뷰탄올, tert-뷰탄올 또는 n-뷰탄올), 수화 또는 함수 알코올(예컨대, 10%, 20%, 30% 초과 또는 심지어 40% 초과의 물을 함유), 바이오디젤, 유기산, 탄화수소(예컨대, 메탄, 에탄, 프로판, 아이소뷰텐, 펜탄, n-헥산, 바이오디젤, 바이오-가솔린 및 이들의 혼합물), 공동-생성물(예컨대, 단백질, 예를 들어, 셀룰로스분해 단백질(효소) 또는 단세포 단백질), 및 이들의 임의의 혼합물을 임의의 조합 또는 상대 농도 그리고 임의로 임의의 첨가제(예컨대, 연료 첨가제)와 조합하여 포함하지만, 이들로 제한되는 것은 아니다. 기타 예는 카복실산, 카복실산의 염, 카복실산과 카복실산의 염의 혼합물 및 카복실산의 에스터(예컨대, 메틸, 에틸 및 n-프로필 에스터), 케톤(예컨대, 아세톤), 알데하이드(예컨대, 아세트알데하이드), 알파 및 베타 블포화산(예컨대, 아크릴산) 및 올레핀(예컨대, 에틸렌)을 포함한다. 기타 알코올 및 알코올 유도체는 프로판올, 프로필렌 글리콜, 1,4-뷰탄다이올, 1,3-프로판다이올, 당 알코올 및 폴리올(예컨대, 글리콜, 글리세롤, 에리트리톨, 트레이톨, 아라비톨, 자일리톨, 리비톨, 만니톨, 솔비톨, 갈락티톨, 이디톨, 이노시톨, 볼레미톨, 아이소말트, 말티톨, 락티톨, 말토트라이이톨, 말토테트라이톨 및 폴리글리시톨 및 기타 폴리올), 및 이들 알코올 중의 임의의 것의 메틸 또는 에틸 에스터를 포함한다. 기타 생성물은 메틸 아크릴레이트 메틸메타크릴레이트, 락트산, 시트르산, 폼산, 아세트산, 프로피온산, 뷰티르산, 숙신산, 발레르산, 카프로산, 3-하이드록시프로피온산, 팔미트산, 스테아르산, 옥살산, 말론산, 글루타르산, 올레산, 리놀레산, 글리콜산, 감마-하이드록시뷰티르산, 및 이들의 혼합물 이들 산의 임의의 염, 이들 산과 이들의 각각의 염의 혼합물을 포함한다.
바이오매스
본 명세서에 기재된 방법을 이용해서 가공처리된 바이오매스는 셀룰로스를 포함하는 전분 물질 및/또는 셀룰로스 물질, 예컨대, 리그노셀룰로스 물질이다. 바이오매스는 또한 헤미셀룰로스 및/또는 리그닌을 포함할 수 있다. 바이오매스는 농업 생성물 또는 폐기물, 종이 생성물 또는 폐기물, 산림 생성물, 또는 일반 폐기물, 또는 이들의 임의의 조합물 중 하나 이상을 포함할 수 있다. 농업 생성물 또는 폐기물은, 예컨대, 인간 또는 동물에 의해 사용 또는 소비하기 위하여 경작, 수확 또는 가공처리될 수 있는 물질, 또는 그 경작, 수확 또는 가공처리 방법으로부터 생성된 임의의 중간체, 부산물 또는 폐기물을 포함한다. 농업 생성물 또는 폐기물은 사탕 수수, 황마, 대마, 아마, 대나무, 사이잘마, 알팔파, 건초, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 옥수수 속대, 옥수수 겉대, 옥수수 섬유, 코코넛 헤어, 사탕무우박, 버개스, 대두 여물, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 또는 비즈윙, 또는 이들의 조합을 포함하지만, 이들로 제한되는 것은 아니다. 종이 생성물 또는 폐기물은 종이 제품을 제조하거나 파괴시키는 것으로부터 생성된 종이 제품, 임의의 종이 제품, 또는 임의의 중간체, 부산물 또는 폐기물을 제조하는데 이용되는 물질을 포함한다. 종이 제품 또는 폐기물은, 종이, 색소지, 적재지, 코팅지, 골판지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 또는 제지용 펄프, 또는 이들의 조합물을 포함하지만, 이들로 제한되는 것은 아니다. 산림 생성물 또는 폐기물은 목재의 경작, 수확 또는 가공처리에 의해 생성된 물질, 또는 목재의 경작, 수확 또는 가공처리로부터 생성된 임의의 중간체, 부산물 또는 폐기물을 포함한다. 산림 생성물 또는 폐기물은, 백양나무 목재, 나무의 임의의 속 또는 종으로부터의 목재, 파티클 보드, 목재 칩, 또는 톱밥, 또는 이들의 조합물을 포함하지만, 이들로 제한되는 것은 아니다. 일반 폐기물은 거름, 오수, 또는 왕겨, 또는 이들의 조합물을 포함하지만, 이들로 제한되는 것은 아니다.
일 실시형태에 있어서, 바이오매스는 농업 폐기물, 예컨대, 옥수수 속대, 예컨대, 옥수수 겉대를 포함한다. 다른 실시형태에 있어서, 바이오매스는 목초를 포함한다.
하나의 실시형태에 있어서, 바이오매스는 본 명세서에 기재된 조성물과 접촉하기 전에 처리된다. 예를 들어, 바이오매스는 바이오매스의 난분해성을 저감시키고/시키거나, 그의 부피 밀도를 저감시키고/시키거나, 그의 표면적을 증가시키기 위하여 처리된다. 적절한 바이오매스 처리 방법은 전자를 이용한 충격, 초음파처리, 산화, 열분해, 증기 폭발, 화학적 처리, 기계적 처리, 및 동결 분쇄를 포함하지만, 이들로 제한되는 것은 아니다. 바람직하게는, 처리 방법은 전자를 이용한 충격이다.
몇몇 실시형태에 있어서, 전자 충격은 바이오매스가 적어도 0.5 M㎭, 예컨대, 적어도 5, 10, 20, 30, 또는 적어도 40 M㎭의 총 선량을 입수할 때까지 수행된다. 몇몇 실시형태에 있어서, 처리는 바이오매스가 약 0.5 M㎭ 내지 약 150 M㎭, 약 1 M㎭ 내지 약 100 M㎭, 약 5 M㎭ 내지 약 75 M㎭, 약 2 M㎭ 내지 약 75 M㎭, 약 10 M㎭ 내지 약 50 M㎭, 예컨대, 약 5 M㎭ 내지 약 50 M㎭, 약 20 M㎭ 내지 약 40 M㎭, 약 10 M㎭ 내지 약 35 M㎭, 또는 약 20 M㎭ 내지 약 30 M㎭의 선량을 받을 때까지 수행된다. 몇몇 구현예에서, 25 내지 35 M㎭의 총 선량이 바람직한데, 이상적으로는 각 패스(pass)가 약 1초 동안 적용되되 2초에 걸쳐서 적용되며, 예컨대, 5 M㎭/패스로 적용된다. 7 내지 9 M㎭/패스 이상의 선량을 적용하면, 몇몇 경우에 공급원료 재료의 열분해를 초래할 수 있다.
바이오매스 물질(예컨대, 식물 바이오매스, 동물 바이오매스, 종이, 및 도시 폐기물 바이오매스)은 유용한 중간체 및 생성물, 예를 들어, 유기산, 유기산의 염, 무수물, 유기산의 에스터 및 연료, 예컨대, 내연기관용 연료 또는 연료 전지용 공급원료를 생성하기 위하여 공급원료로서 이용될 수 있다. 용이하게 입수 가능한 공급원료 셀룰로스 및/또는 리그노셀룰로스 물질로서 이용될 수 있는 시스템 및 방법이 본 명세서에 기재되어 있지만, 예컨대, 도시 폐 스트림 및 폐지 스트림, 예컨대, 신문지, 크래프트지, 골판지 혹은 이들의 혼합물을 포함하는 스트림을 처리하는데 어려울 수 있다.
바이오매스를 용이하게 가공처리될 수 있는 형태로 전환시키기 위하여, 공급원료 내 글루칸- 또는 자일란-함유 셀룰로스는, 당화제, 예컨대, 효소 혹은 산에 의해 저분자량 탄수화물, 예컨대, 당으로 가수분해될 수 있으며, 이 과정은 당화라 지칭된다. 저분자량 탄수화물은 이어서 예를 들어 기존의 제조 공장, 예컨대, 단세포 단백질 공장, 효소 제조 공장, 혹은 연료 공장, 예컨대, 에탄올 제조 설비에서 이용될 수 있다.
바이오매스는, 예컨대, 용매 중, 예컨대, 수성 용액 중에서 효소와 재료를 조합함으로써, 효소, 예컨대, 바이오매스 분해 효소를 이용해서 가수분해될 수 있다. 효소는 본 명세서에 기재된 방법에 따라서 유도될 수 있다.
구체적으로, 바이오매스 분해 효소는 바이오매스(예컨대, 바이오매스의 셀룰로스 및/또는 리그닌 부분)를 파괴시키거나, 각종 셀룰로스분해 효소(셀룰라제), 리그니나제 혹은 각종 소분자 바이오매스-분해 대사산물을 함유하거나 제조하는, 유기체, 예컨대, 미생물에 의해 공급될 수 있다. 이들 효소는 바이오매스의 결정성 셀룰로스 또는 리그닌 부분을 분해시키기 위하여 상승작용적으로 작용하는 효소의 복합체일 수 있다. 셀룰로스분해 효소의 예로는 엔도글루카나제, 셀로비오하이드롤라제 및 셀로비아제(베타-글루코시다제)를 포함한다.
당화 동안, 셀룰로스 기질은 올리고머성 중간체를 생성하는 랜덤한 개소에서 엔도글루카나제에 의해 초기에 가수분해될 수 있다. 이어서, 이들 중간체는 셀룰로스 중합체의 말단으로부터 셀로비오스를 생산하기 위하여 셀로비오하이드롤라제 등과 같은 글루카나제를 외부 분열시키기 위한 기질이다. 셀로비오스는 글루코스의 수-가용성 1,4-결합 이량체이다. 최종적으로, 셀로비아제는 셀로비오스를 분할시켜 글루코스를 수득한다. 이 과정의 효율(예컨대, 가수분해 시간 및 가수분해 완성도)은 셀룰로스 물질의 난분해성에 좌우된다.
당화
난분해성-저감된 바이오매스는 일반적으로 해당 난분해성-저감된 바이오매스와 바이오매스-분해 효소를 유체 배지, 예를 들어, 수성 용액 중에서 배합함으로써, 위에서 논의된 바이오매스-분해 효소로 처리된다. 몇몇 경우에, 공급원료는 미국 특허 출원 공개 제2012/0100577 A1호(Medoff 및 Masterman, 공개일; 2012년 4월 26일, 이 문헌의 전체 내용은 본 명세서에 포함됨)에 기재된 바와 같이 당화 전에 온수에서 비등되거나, 적셔지거나 혹은 조리된다.
본 명세서에서는, 본 명세서에 기재된 당화 공정에서 사용하기 위하여, 바이오매스를 분해시킬 수 있는 효소의 혼합물, 예컨대, 바이오매스-분해 효소의 효소 혼합물이 제공된다.
당화 공정은 제조 공장 내의 탱크(예컨대, 적어도 4000, 40,000 혹은 500,000 L의 체적을 지니는 탱크)에서 부분적으로 혹은 완전히 수행될 수 있고/있거나, 수송 중에, 예컨대, 레일 카 내, 탱커 트럭 내, 또는 초대형 유조선이나 선박의 선창 내에서 부분적으로 혹은 완전히 수행될 수 있다. 완전한 당화를 위해 필요한 시간은 이용된 바이오매스 물질과 효소 그리고 처리 조건에 좌우될 것이다. 당화가 제어된 조건 하에 제조 공장에서 수행된다면, 셀룰로스는 약 12 내지 96시간에 글루코스로 실질적으로 완전히 전환될 수 있다. 당화가 수송 중에 부분적으로 혹은 완전히 수행된다면, 당화는 더 오랜 시간이 걸릴 수도 있다.
바람직한 실시형태에 있어서, 당화 반응은, 예컨대, 바이오매스-분해 효소의 활성에 최적인 pH에서 일어나도록 효소 반응에 최적인 pH에서 일어난다. 바람직하게는, 당화 반응의 pH는 pH 4 내지 4.5이다. 바람직한 실시형태에 있어서, 당화 반응은, 예컨대, 바이오매스-분해 효소의 활성에 최적인 온도에서 일어나도록 효소 반응에 최적인 온도에서 일어난다. 바람직하게는, 당화 반응의 온도는 42℃ 내지 52℃이다.
일반적으로, 탱크 내용물은 당화 동안, 예를 들어, 국제 출원 제PCT/US2010/035331호(출원일: 2010년 5월 18일, 제WO 2010/135380호로 영어로 공개되고 미국을 지정함, 이 문헌의 전체 개시내용은 본 명세서에 참고로 편입됨)에 기재된 바와 같은 제트 혼합을 이용해서 혼합되는 것이 바람직하다.
계면활성제의 첨가는 당화의 속도를 증대시킬 수 있다. 계면활성제의 예로는, 비이온성 계면활성제, 예컨대, 트윈(Tween)(등록상표) 20 혹은 트윈(등록상표) 80, 폴리에틸렌 글라이콜 계면활성제, 이온성 계면활성제, 또는 양성 계면활성제를 포함한다.
일반적으로 당화로부터 얻어지는 당 용액의 농도는 비교적 높은 것, 예컨대, 40중량% 이상, 또는 50, 60, 70, 80, 90 이상 또는 심지어 95중량% 이상인 것이 일반적으로 바람직하다. 물은, 당 용액의 농도를 증가시키기 위하여, 예컨대, 증발에 의해 제거될 수 있다. 이것은 출하될 부피를 감소시키며, 또한 용액 중의 미생물 증식을 억제한다.
대안적으로, 보다 낮은 농도의 당 용액이 이용될 수 있으며, 이 경우, 항균제 첨가제, 예컨대, 광범위 항생제를 낮은 농도, 예컨대, 50 내지 150 ppm으로 첨가하는 것이 바람직할 수 있다. 기타 적절한 항생제로는 암포테리신 B, 암피실린, 클로르암페니콜, 시프로플록사신, 겐타마이신, 하이그로마이신 B, 카나마이신, 네오마이신, 페니실린, 퓨로마이신, 스트렙토마이신을 포함한다. 항생제는 수송 및 저장 동안 미생물의 성장을 저해할 것이며, 적절한 농도, 예컨대, 15 내지 1000 중량ppm, 예컨대, 25 내지 500 중량ppm, 또는 50 내지 150 중량ppm에서 이용될 수 있다. 필요한 경우, 항생제는 당 농도가 비교적 높더라도 포함될 수 있다. 대안적으로, 보존성의 항균제와 함께 다른 첨가제가 이용될 수 있다. 바람직하게는, 향균제 첨가제(들)는 식품-등급이다.
효소와 함께 바이오매스 재료에 첨가되는 물의 양을 제한함으로써 비교적 고농도의 용액이 얻어질 수 있다. 농도는 예컨대 얼마나 많은 당화가 일어나는지를 제어함으로써 제어될 수 있다. 예를 들어, 농도는 용액에 더 많은 바이오매스 재료를 첨가함으로써 증가될 수 있다. 용액 내에서 생성되고 있는 당을 유지하기 위하여, 계면활성제, 예컨대, 위에서 논의된 것들 중 하나가 첨가될 수 있다. 용해도는 용액의 온도를 증가시킴으로써 또한 증가될 수 있다. 예를 들어, 용액은 40 내지 50℃, 60 내지 80℃ 혹은 심지어 그 이상의 온도에서 유지될 수 있다.
본 명세서에 기재된 공정에 있어서, 예를 들어 당화 후, 당(예컨대, 글루코스 및 자일로스)은 단리될 수 있다. 예를 들어, 당은 석출, 결정화, 크로마토그래피(예컨대, 모사 이동상(simulated moving bed) 크로마토그래피, 고압 크로마토그래피), 원심분리, 추출, 당업계에 공지된 임의의 기타 단리 방법 및 이들의 조합에 의해 단리될 수 있다.
당화의 효소 혼합물
본 발명은 서열번호 1에 대해서 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 포함하는 글리코실화 폴리펩타이드, 및 서열번호 1에 대해서 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 포함하는 아글리코실화된 폴리펩타이드를 포함하는 효소 혼합물을 제공하며, 여기서 글리코실화 폴리펩타이드와 아글리코실화된 폴리펩타이드는 둘 다 셀로비아제 활성을 지닌다. 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드는, 예컨대, 본 명세서에 기재된 방법을 이용해서 생성된, 본 명세서에 기재된 아글리코실화된 폴리펩타이드 중 어느 하나이다. 서열번호 1에 대해서 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 포함하는 글리코실화 폴리펩타이드는 폴리펩타이드를 내재적으로 발현하는 미생물로부터 단리되거나 얻어질 수 있다.
일 실시형태에 있어서, 글리코실화된 폴리펩타이드와 아글리코실화된 폴리펩타이드는 둘 다, 예컨대, 서열번호 1을 포함하는 야생형 트리코더마 리세이로부터의 Cel3A 효소를 포함한다.
실시형태들에 있어서, 효소 혼합물은 미생물로부터 유래된 적어도 1종의 추가의 효소를 더 포함하되, 여기서 추가의 효소는 바이오매스 또는 셀룰로스계 물질-분해 활성을 지니며, 예컨대, 추가의 효소는 셀룰로스분해 효소, 예컨대, 셀룰라제이다. 예를 들어, 추가의 효소는 리그니나제, 엔도글루카나제, 셀로비오하이드롤라제, 자일라나제, 및 셀로비아제이다. 일 실시형태에 있어서, 혼합물은 1종 이상의 리그니나제, 1종 이상의 엔도글루코나제, 1종 이상의 셀로비오하이드롤라제, 및 1종 이상의 자일라나제를 더 포함한다. 실시형태들에 있어서, 추가의 바이오매스-분해 효소는 글리코실화된다. 실시형태들에 있어서, 효소 혼합물은 본 명세서에 기재된 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10종의 추가의 바이오매스-분해 효소를 더 포함한다. 예를 들어, 효소 혼합물은 표 1에 나열된 효소 중 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15종 또는 전부를 더 포함한다.
예를 들어, 효소 혼합물은 미생물, 예컨대, 진균 세포, 예를 들어, 야생형 트리코더마 리세이, 또는 이의 돌연변이체, 예컨대, 트리코더마 리세이 RUTC30에 의해 생산된 추가의 바이오매스-분해 효소들의 혼합물을 더 포함한다. 일 실시형태에 있어서, 추가의 바이오매스-분해 효소는 미생물로부터 단리된다. 일 실시형태에 있어서, 혼합물은 바이오매스-분해 효소 중 하나 이상을 포함한다: B2AF03, CIP1, CIP2, Cel1a, Cel3a, Cel5a, Cel6a, Cel7a, Cel7b, Cel12a, Cel45a, Cel74a, paMan5a, paMan26a 또는 스월레닌, 또는 이들의 임의의 조합물. 예컨대 위에서 나열된 추가의 바이오매스-분해 효소는, 미생물, 예컨대, 진균 세포로부터 내재적으로 발현되고 단리될 수 있으며, 이 세포로부터 (표 1에서 이하에 나열된) 효소가 유래된다. 대안적으로, 예컨대, 위에서 나열된 추가의 바이오매스-분해 효소는, 본 명세서에 기재된 숙주 세포에서 유사한 발현 방법을 이용해서 이종적으로 발현될 수 있고 숙주 세포로부터 단리될 수 있다. 일 실시형태에 있어서, 이종적으로 발현된 추가의 바이오매스-분해 효소는 당해 효소의 C 또는 N 말단에서 His 태그로 태깅되고, 당업계에 공지된 니켈 친화도 크로마토그래피 수법을 이용해서 단리된다. 예를 들어, 추가의 바이오매스-분해 효소는 이하의 표 1로부터 선택될 수 있다.
Figure pct00004
표 1에 나열된 바이오매스-분해 효소에 대한 아미노산 서열은 이하에 제공된다.
B2AF03 (포도스포라 안세리나)
MKSSVFWGASLTSAVVRAIDLPFQFYPNCVDDLLSTNQVCNTTLSPPERAAALVAALTPEEKLQNIVSKSLGAPRIGLPAYNWWSEALHGVAYAPGTQFWQGDGPFNSSTSFPMPLLMAATFDDELLEKIAEVIGIEGRAFGNAGFSGLDYWTPNVNPFKDPRWGRGSETPGEDVLLVKRYAAAMIKGLEGPVPEKERRVVATCKHYAANDFEDWNGATRHNFNAKISLQDMAEYYFMPFQQCVRDSRVGSIMCAYNAVNGVPSCASPYLLQTILREHWNWTEHNNYITSDCEAVLDVSLNHKYAATNAEGTAISFEAGMDTSCEYEGSSDIPGAWSQGLLKESTVDRALLRLYEGIVRAGYFDGKQSLYSSLGWADVNKPSAQKLSLQAAVDGTVLLKNDGTLPLSDLLDKSRPKKVAMIGFWSDAKDKLRGGYSGTAAYLHTPAYAASQLGIPFSTASGPILHSDLASNQSWTDNAMAAAKDADYILYFGGIDTSAAGETKDRYDLDWPGAQLSLINLLTTLSKPLIVLQMGDQLDNTPLLSNPKINAILWANWPGQDGGTAVMELVTGLKSPAGRLPVTQYPSNFTELVPMTDMALRPSAGNSQLGRTYRWYKTPVQAFGFGLHYTTFSPKFGKKFPAVIDVDEVLEGCDDKYLDTCPLPDLPVVVENRGNRTSDYVALAFVSAPGVGPGPWPIKTLGAFTRLRGVKGGEKREGGLKWNLGNLARHDEEGNTVVYPGKYEVSLDEPPKARLRFEIVRGGKGKGKVKGKGKAAQKGGVVLDRWPKPPKGQEPPAIERV (서열번호 9)
CIP1 (트리코더마 리세이)
MVRRTALLALGALSTLSMAQISDDFESGWDQTKWPISAPDCNQGGTVSLDTTVAHSGSNSMKVVGGPNGYCGHIFFGTTQVPTGDVYVRAWIRLQTALGSNHVTFIIMPDTAQGGKHLRIGGQSQVLDYNRESDDATLPDLSPNGIASTVTLPTGAFQCFEYHLGTDGTIETWLNGSLIPGMTVGPGVDNPNDAGWTRASYIPEITGVNFGWEAYSGDVNTVWFDDISIASTRVGCGPGSPGGPGSSTTGRSSTSGPTSTSRPSTTIPPPTSRTTTATGPTQTHYGQCGGIGYSGPTVCASGTTCQVLNPYYSQCL (서열번호 10)
CIP2 (트리코더마 리세이)
MASRFFALLLLAIPIQAQSPVWGQCGGIGWSGPTTCVGGATCVSYNPYYSQCIPSTQASSSIASTTLVTSFTTTTATRTSASTPPASSTGAGGATCSALPGSITLRSNAKLNDLFTMFNGDKVTTKDKFSCRQAEMSELIQRYELGTLPGRPSTLTASFSGNTLTINCGEAGKSISFTVTITYPSSGTAPYPAIIGYGGGSLPAPAGVAMINFNNDNIAAQVNTGSRGQGKFYDLYGSSHSAGAMTAWAWGVSRVIDALELVPGARIDTTKIGVTGCSRNGKGAMVAGAFEKRIVLTLPQESGAGGSACWRISDYLKSQGANIQTASEIIGEDPWFSTTFNSYVNQVPVLPFDHHSLAALIAPRGLFVIDNNIDWLGPQSCFGCMTAAHMAWQALGVSDHMGYSQIGAHAHCAFPSNQQSQLTAFVQKFLLGQSTNTAIFQSDFSANQSQWIDWTTPTLS (서열번호 11)
Cel1a (트리코더마 리세이)
MLPKDFQWGFATAAYQIEGAVDQDGRGPSIWDTFCAQPGKIADGSSGVTACDSYNRTAEDIALLKSLGAKSYRFSISWSRIIPEGGRGDAVNQAGIDHYVKFVDDLLDAGITPFITLFHWDLPEGLHQRYGGLLNRTEFPLDFENYARVMFRALPKVRNWITFNEPLCSAIPGYGSGTFAPGRQSTSEPWTVGHNILVAHGRAVKAYRDDFKPASGDGQIGIVLNGDFTYPWDAADPADKEAAERRLEFFTAWFADPIYLGDYPASMRKQLGDRLPTFTPEERALVHGSNDFYGMNHYTSNYIRHRSSPASADDTVGNVDVLFTNKQGNCIGPETQSPWLRPCAAGFRDFLVWISKRYGYPPIYVTENGTSIKGESDLPKEKILEDDFRVKYYNEYIRAMVTAVELDGVNVKGYFAWSLMDNFEWADGYVTRFGVTYVDYENGQKRFPKKSAKSLKPLFDELIAAA (서열번호 12)
Cel3a (트리코더마 리세이)
MRYRTAAALALATGPFARADSHSTSGASAEAVVPPAGTPWGTAYDKAKAALAKLNLQDKVGIVSGVGWNGGPCVGNTSPASKISYPSLCLQDGPLGVRYSTGSTAFTPGVQAASTWDVNLIRERGQFIGEEVKASGIHVILGPVAGPLGKTPQGGRNWEGFGVDPYLTGIAMGQTINGIQSVGVQATAKHYILNEQELNRETISSNPDDRTLHELYTWPFADAVQANVASVMCSYNKVNTTWACEDQYTLQTVLKDQLGFPGYVMTDWNAQHTTVQSANSGLDMSMPGTDFNGNNRLWGPALTNAVNSNQVPTSRVDDMVTRILAAWYLTGQDQAGYPSFNISRNVQGNHKTNVRAIARDGIVLLKNDANILPLKKPASIAVVGSAAIIGNHARNSPSCNDKGCDDGALGMGWGSGAVNYPYFVAPYDAINTRASSQGTQVTLSNTDNTSSGASAARGKDVAIVFITADSGEGYITVEGNAGDRNNLDPWHNGNALVQAVAGANSNVIVVVHSVGAIILEQILALPQVKAVVWAGLPSQESGNALVDVLWGDVSPSGKLVYTIAKSPNDYNTRIVSGGSDSFSEGLFIDYKHFDDANITPRYEFGYGLSYTKFNYSRLSVLSTAKSGPATGAVVPGGPSDLFQNVATVTVDIANSGQVTGAEVAQLYITYPSSAPRTPPKQLRGFAKLNLTPGQSGTATFNIRRRDLSYWDTASQKWVVPSGSFGISVGASSRDIRLTSTLSVA (서열번호 13)
Cel5a (트리코더마 리세이)
MNKSVAPLLLAASILYGGAAAQQTVWGQCGGIGWSGPTNCAPGSACSTLNPYYAQCIPGATTITTSTRPPSGPTTTTRATSTSSSTPPTSSGVRFAGVNIAGFDFGCTTDGTCVTSKVYPPLKNFTGSNNYPDGIGQMQHFVNDDGMTIFRLPVGWQYLVNNNLGGNLDSTSISKYDQLVQGCLSLGAYCIVDIHNYARWNGGIIGQGGPTNAQFTSLWSQLASKYASQSRVWFGIMNEPHDVNINTWAATVQEVVTAIRNAGATSQFISLPGNDWQSAGAFISDGSAAALSQVTNPDGSTTNLIFDVHKYLDSDNSGTHAECTTNNIDGAFSPLATWLRQNNRQAILTETGGGNVQSCIQDMCQQIQYLNQNSDVYLGYVGWGAGSFDSTYVLTETPTGSGNSWTDTSLVSSCLARK (서열번호 14)
Cel6a (트리코더마 리세이)
MIVGILTTLATLATLAASVPLEERQACSSVWGQCGGQNWSGPTCCASGSTCVYSNDYYSQCLPGAASSSSSTRAASTTSRVSPTTSRSSSATPPPGSTTTRVPPVGSGTATYSGNPFVGVTPWANAYYASEVSSLAIPSLTGAMATAAAAVAKVPSFMWLDTLDKTPLMEQTLADIRTANKNGGNYAGQFVVYDLPDRDCAALASNGEYSIADGGVAKYKNYIDTIRQIVVEYSDIRTLLVIEPDSLANLVTNLGTPKCANAQSAYLECINYAVTQLNLPNVAMYLDAGHAGWLGWPANQDPAAQLFANVYKNASSPRALRGLATNVANYNGWNITSPPSYTQGNAVYNEKLYIHAIGPLLANHGWSNAFFITDQGRSGKQPTGQQQWGDWCNVIGTGFGIRPSANTGDSLLDSFVWVKPGGECDGTSDSSAPRFDSHCALPDALQPAPQAGAWFQAYFVQLLTNANPSFL (서열번호 15)
Cel7a (트리코더마 리세이)
MYRKLAVISAFLATARAQSACTLQSETHPPLTWQKCSSGGTCTQQTGSVVIDANWRWTHATNSSTNCYDGNTWSSTLCPDNETCAKNCCLDGAAYASTYGVTTSGNSLSIGFVTQSAQKNVGARLYLMASDTTYQEFTLLGNEFSFDVDVSQLPCGLNGALYFVSMDADGGVSKYPTNTAGAKYGTGYCDSQCPRDLKFINGQANVEGWEPSSNNANTGIGGHGSCCSEMDIWEANSISEALTPHPCTTVGQEICEGDGCGGTYSDNRYGGTCDPDGCDWNPYRLGNTSFYGPGSSFTLDTTKKLTVVTQFETSGAINRYYVQNGVTFQQPNAELGSYSGNELNDDYCTAEEAEFGGSSFSDKGGLTQFKKATSGGMVLVMSLWDDYYANMLWLDSTYPTNETSSTPGAVRGSCSTSSGVPAQVESQSPNAKVTFSNIKFGPIGSTGNPSGGNPPGGNPPGTTTTRRPATTTGSSPGPTQSHYGQCGGIGYSGPTVCASGTTCQVLNPYYSQCL (서열번호 16)
Cel7b (트리코더마 리세이)
MAPSVTLPLTTAILAIARLVAAQQPGTSTPEVHPKLTTYKCTKSGGCVAQDTSVVLDWNYRWMHDANYNSCTVNGGVNTTLCPDEATCGKNCFIEGVDYAASGVTTSGSSLTMNQYMPSSSGGYSSVSPRLYLLDSDGEYVMLKLNGQELSFDVDLSALPCGENGSLYLSQMDENGGANQYNTAGANYGSGYCDAQCPVQTWRNGTLNTSHQGFCCNEMDILEGNSRANALTPHSCTATACDSAGCGFNPYGSGYKSYYGPGDTVDTSKTFTIITQFNTDNGSPSGNLVSITRKYQQNGVDIPSAQPGGDTISSCPSASAYGGLATMGKALSSGMVLVFSIWNDNSQYMNWLDSGNAGPCSSTEGNPSNILANNPNTHVVFSNIRWGDIGSTTNSTAPPPPPASSTTFSTTRRSSTTSSSPSCTQTHWGQCGGIGYSGCKTCTSGTTCQYSNDYYSQCL (서열번호 17)
Cel12a (트리코더마 리세이)
MKFLQVLPALIPAALAQTSCDQWATFTGNGYTVSNNLWGASAGSGFGCVTAVSLSGGASWHADWQWSGGQNNVKSYQNSQIAIPQKRTVNSISSMPTTASWSYSGSNIRANVAYDLFTAANPNHVTYSGDYELMIWLGKYGDIGPIGSSQGTVNVGGQSWTLYYGYNGAMQVYSFVAQTNTTNYSGDVKNFFNYLRDNKGYNAAGQYVLSYQFGTEPFTGSGTLNVASWTASIN (서열번호 18)
Cel45a (트리코더마 리세이)
MKATLVLGSLIVGAVSAYKATTTRYYDGQEGACGCGSSSGAFPWQLGIGNGVYTAAGSQALFDTAGASWCGAGCGKCYQLTSTGQAPCSSCGTGGAAGQSIIVMVTNLCPNNGNAQWCPVVGGTNQYGYSYHFDIMAQNEIFGDNVVVDFEPIACPGQAASDWGTCLCVGQQETDPTPVLGNDTGSTPPGSSPPATSSSPPSGGGQQTLYGQCGGAGWTGPTTCQAPGTCKVQNQWYSQCLP (서열번호 19)
Cel74a (트리코더마 리세이)
MKVSRVLALVLGAVIPAHAAFSWKNVKLGGGGGFVPGIIFHPKTKGVAYARTDIGGLYRLNADDSWTAVTDGIADNAGWHNWGIDAVALDPQDDQKVYAAVGMYTNSWDPSNGAIIRSSDRGATWSFTNLPFKVGGNMPGRGAGERLAVDPANSNIIYFGARSGNGLWKSTDGGVTFSKVSSFTATGTYIPDPSDSNGYNSDKQGLMWVTFDSTSSTTGGATSRIFVGTADNITASVYVSTNAGSTWSAVPGQPGKYFPHKAKLQPAEKALYLTYSDGTGPYDGTLGSVWRYDIAGGTWKDITPVSGSDLYFGFGGLGLDLQKPGTLVVASLNSWWPDAQLFRSTDSGTTWSPIWAWASYPTETYYYSISTPKAPWIKNNFIDVTSESPSDGLIKRLGWMIESLEIDPTDSNHWLYGTGMTIFGGHDLTNWDTRHNVSIQSLADGIEEFSVQDLASAPGGSELLAAVGDDNGFTFASRNDLGTSPQTVWATPTWATSTSVDYAGNSVKSVVRVGNTAGTQQVAISSDGGATWSIDYAADTSMNGGTVAYSADGDTILWSTASSGVQRSQFQGSFASVSSLPAGAVIASDKKTNSVFYAGSGSTFYVSKDTGSSFTRGPKLGSAGTIRDIAAHPTTAGTLYVSTDVGIFRSTDSGTTFGQVSTALTNTYQIALGVGSGSNWNLYAFGTGPSGARLYASGDSGASWTDIQGSQGFGSIDSTKVAGSGSTAGQVYVGTNGRGVFYAQGTVGGGTGGTSSSTKQSSSSTSSASSSTTLRSSVVSTTRASTVTSSRTSSAAGPTGSGVAGHYAQCGGIGWTGPTQCVAPYVCQKQNDYYYQCV (서열번호 20)
paMan5a (포도스포라 안세리나)
MKGLFAFGLGLLSLVNALPQAQGGGAAASAKVSGTRFVIDGKTGYFAGTNSYWIGFLTNNRDVDTTLDHIASSGLKILRVWGFNDVNNQPSGNTVWFQRLASSGSQINTGPNGLQRLDYLVRSAETRGIKLIIALVNYWDDFGGMKAYVNAFGGTKESWYTNARAQEQYKRYIQAVVSRYVNSPAIFAWELANEPRCKGCNTNVIFNWATQISDYIRSLDKDHLITLGDEGFGLPGQTTYPYQYGEGTDFVKNLQIKNLDFGTFHMYPGHWGVPTSFGPGWIKDHAAACRAAGKPCLLEEYGYESDRCNVQKGWQQASRELSRDGMSGDLFWQWGDQLSTGQTHNDGFTIYYGSSLATCLVTDHVRAINALPA (서열번호 21)
paMan26a (포도스포라 안세리나)
MVKLLDIGLFALALASSAVAKPCKPRDGPVTYEAEDAILTGTTVDTAQVGYTGRGYVTGFDEGSDKITFQISSATTKLYDLSIRYAAIYGDKRTNVVLNNGAVSEVFFPAGDSFTSVAAGQVLLNAGQNTIDIVNNWGWYLIDSITLTPSAPRPPHDINPNLNNPNADTNAKKLYSYLRSVYGNKIISGQQELHHAEWIRQQTGKTPALVAVDLMDYSPSRVERGTTSHAVEDAIAHHNAGGIVSVLWHWNAPVGLYDTEENKWWSGFYTRATDFDIAATLANPQGANYTLLIRDIDAIAVQLKRLEAAGVPVLWRPLHEAEGGWFWWGAKGPEPAKQLWDILYERLTVHHGLDNLIWVWNSILEDWYPGDDTVDILSADVYAQGNGPMSTQYNELIALGRDKKMIAAAEVGAAPLPGLLQAYQANWLWFAVWGDDFINNPSWNTVAVLNEIYNSDYVLTLDEIQGWRS (서열번호 22)
스월레닌 (트리코더마 리세이)
MAGKLILVALASLVSLSIQQNCAALFGQCGGIGWSGTTCCVAGAQCSFVNDWYSQCLASTGGNPPNGTTSSSLVSRTSSASSSVGSSSPGGNSPTGSASTYTTTDTATVAPHSQSPYPSIAASSCGSWTLVDNVCCPSYCANDDTSESCSGCGTCTTPPSADCKSGTMYPEVHHVSSNESWHYSRSTHFGLTSGGACGFGLYGLCTKGSVTASWTDPMLGATCDAFCTAYPLLCKDPTGTTLRGNFAAPNGDYYTQFWSSLPGALDNYLSCGECIELIQTKPDGTDYAVGEAGYTDPITLEIVDSCPCSANSKWCCGPGADHCGEIDFKYGCPLPADSIHLDLSDIAMGRLQGNGSLTNGVIPTRYRRVQCPKVGNAYIWLRNGGGPYYFALTAVNTNGPGSVTKIEIKGADTDNWVALVHDPNYTSSRPQERYGSWVIPQGSGPFNLPVGIRLTSPTGEQIVNEQAIKTFTPPATGDPNFYYIDIGVQFSQN (서열번호 23)
혼합물에서 본 명세서에 기재된 아글리코실화된 폴리펩타이드 대 다른 바이오매스-분해 효소의 비는, 예를 들어, 적어도 1:1; 1:2; 1:4; 1:8; 1:16; 1:32; 1:50; 1:75; 1:100, 1:150; 1:200; 1:300, 1:400 또는 1:500이다. 일 실시형태에 있어서, 혼합물에서 본 명세서에 기재된 아글리코실화된 폴리펩타이드 대 다른 효소의 비는 1:32이다. 본 명세서에 기재된 아글리코실화된 폴리펩타이드 대 글리코실화 폴리펩타이드의 비는, 예를 들어, 적어도 1:1; 1:2; 1:4; 1:8; 1:16; 1:32; 1:50; 1:75; 1:100, 1:150; 1:200; 1:300, 1:400 또는 1:500이다.
본 발명의 효소 혼합물에서 사용하기 위하여 적절한 바이오매스-분해 효소의 다른 예는 바실러스, 코프리누스, 마이셀리오프토라, 세팔로스포륨, 사이탈리듐, 페니실륨, 아스페르길루스, 슈도모나스, 후미콜라, 푸사륨, 티엘라비아, 아크레모늄, 크리소스포륨 및 트리코더마 속으로부터의 셀룰라제를 포함하며, 특히 아스페르길루스(예컨대, EP 공개 제0 458 162호), 후미콜라 인솔렌스(사이탈리듐 써모필룸으로서 재분류됨, 예컨대, 미국 특허 제4,435,307호 참조), 코프리누스 시네레우스, 푸사륨 옥시스포룸, 마이셀리오프토라 써모필라, 메리필루스 기간테우스, 티엘라비아 테레스트리스, 아크레모늄 종(Acremonium sp.)(아크레모늄 페르시시넘(A. persicinum), 아크레모늄 아크레모늄(A. acremonium), 아크레모늄 브라키페늄(A. brachypenium), 아크레모늄 디클로모스포룸(A. dichromosporum), 아크레모늄 오브클라바툼(A. obclavatum), 아크레모늄 핀커토니애(A. pinkertoniae), 아크레모늄 로세오그리세움(A. roseogriseum), 아크레모늄 인콜로라툼(A. incoloratum) 및 아크레모늄 푸라툼(A, furatum)을 포함하지만, 이들로 제한되는 것은 아님) 종으로부터 선택된 균주에 의해 생산된 것들을 포함한다. 바람직한 균주로는, 후미콜라 인솔렌스 DSM 1800, 푸사륨 옥시스포룸 DSM 2672, 마이셀리오프토라 써모필라 CBS 117.65, 세팔로스포륨종 RYM-202, 아크레모늄종 CBS 478.94, 아크레모늄종 CBS 265.95, 아크레모늄 페르시시넘 CBS 169.65, 아크레모늄 아크레모늄 AHU 9519, 세팔로스포륨종 CBS 535.71, 아크레모늄 브라키페늄 CBS 866.73, 아크레모늄 디클로모스포룸 CBS 683.73, 아크레모늄 오브클라바툼 CBS 311.74, 아크레모늄 핀커토니애 CBS 157.70, 아크레모늄 로세오그리세움 CBS 134.56, 아크레모늄 인콜로라툼 CBS 146.62, 및 아크레모늄 푸라툼 CBS 299.70H를 포함한다. 바이오매스-분해 효소는 또한 크리소스포륨, 바람직하게는, 크리소스포륨 룩노웬스로부터 얻어질 수 있다. 이용될 수 있는 부가적인 균주로는 트리코더마(특히 트리코더마 비리데(T. viride), 트리코더마 리세이(T. reesei) 및 트리코더마 코닌기(T. koningii)), 호알칼리성 바실러스(alkalophilic Bacillus))(예를 들어, 미국 특허 제3,844,890호 및 EP 공보 제0 458 162호 참조) 및 스트렙토마이세스(Streptomyces)(예컨대, EP 공보 제0 458 162호 참조)를 포함하지만, 이들로 제한되는 것은 아니다.
실시형태들에 있어서, 미생물은 미유도 미생물에 비해서 바이오매스-분해 효소의 생성을 중가시키는데 적합한 조건 하에서 본 명세서에 기재된 바이오매스-분해 효소를 생성하도록 유도된다. 예를 들어, 본 명세서에 기재된 바와 같은 바이오매스를 포함하는 유도 바이오매스 샘플은 바이오매스-분해 효소의 생성을 증가시키기 위하여 미생물과 인큐베이팅된다. 유도 과정의 추가의 설명은 US 2014/0011258에서 찾을 수 있으며, 이 공보의 내용은 그의 전문이 참고로 본 명세서에 편입된다.
상기 언급된 미생물에 의해 생산되고/되거나 분비된 바이오매스-분해 효소는 단리되어 본 발명의 효소 혼합물에 첨가될 수 있다. 대안적으로, 하나의 실시형태에 있어서, 본 명세서에서 그리고 위에서 기재된 바이오매스-분해 효소를 발현하는 전술한 미생물 또는 숙주 세포는 당화 반응에 첨가 전에 용해되지 않는다.
일 실시형태에 있어서, 효소 혼합물은 아글리코실화된 본 명세서에 기재된 셀로비아제 활성을 지니는 폴리펩타이드를 발현하는 숙주 세포, 및 본 명세서에 기재된 1종 이상의 추가의 바이오매스-분해 효소를 포함한다. 일 실시형태에 있어서, 효소 혼합물은 아글리코실화된 본 명세서에 기재된 셀로비아제 활성을 지니는 폴리펩타이드를 발현하는 숙주 세포, 및 본 명세서에 기재된 1종 이상의 추가의 바이오매스-분해 효소를 발현하는 1종 이상의 숙주 세포를 포함한다. 예를 들어,
셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드를 포함하는 본 명세서에 기재된 효소 혼합물의 사용은 바이오매스-분해 효소(예컨대, RUTC30 칵테일, 예컨대, 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드의 첨가 없이)의 표준 혼합물을 이용하는 당화로부터의 당 생성물의 수득량과 비교해서 당화로부터의 당 생성물의 증가된 수득량을 초래한다. 당 생성물의 수율은, 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드가 당화 과정에 첨가된 경우, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100% 증가된다.
추가의 가공처리
추가의 가공처리 단계들이 대안적인 생성물을 생산하기 위하여 당화에 의해 생성된 당에 대해서 수행될 수 있다. 예를 들어, 당은 수소화되거나 발효되거나 또는 다른 화학약품으로 처리되어 다른 생성물을 생산할 수 있다.
글루코스는 솔비톨로 수소화될 수 있다. 자일로스는 자일리톨로 수소화될 수 있다. 수소화는 고압(예컨대, 10 내지 12000 psi) 하에 H2와 조합하여 촉매(예컨대, Pt/감마-Al2O3, Ru/C, 라니 니켈(Raney Nickel), 또는 당업계에 공지된 다른 촉매)의 사용에 의해 달성될 수 있다. 솔비톨 및/또는 자일리톨 생성물은 당업계에 공지된 방법을 이용해서 단리되고 정제될 수 있다.
당화로부터의 당 생성물은 또한 발효되어 알코올, 당 알코올, 예컨대, 에리트리톨, 또는 유기산, 예컨대, 락트산, 글루탐산 또는 시트르산 또는 아미노산을 생성할 수 있다.
예를 들어, 효모 및 지모모나스(Zymomonas) 박테리아는, 발효 또는 당(들)의 알코올(들)로의 전환을 위하여 이용될 수 있다. 다른 미생물이 이하에 논의되어 있다. 발효를 위한 최적 pH는 약 pH 4 내지 7이다. 예를 들어, 효모를 위한 최적 pH는 약 pH 4 내지 5인 반면, 지모모나스를 위한 최적 pH는 약 pH 5 내지 6이다. 전형적인 발효 시간은 약 24 내지 168시간(예컨대, 24 내지 96시간)이고 이때의 온도 범위는 20℃ 내지 40℃(예컨대, 26℃ 내지 40℃)이지만, 호열성 미생물은 보다 높은 온도를 선호한다.
몇몇 실시형태에 있어서, 예컨대, 혐기성 유기체가 사용될 경우, 발효의 적어도 일부는 산소의 부재, 예컨대, N2, Ar, He, CO2 또는 이들의 혼합물 등과 같은 불활성 기체의 블랭킷 하에 수행된다. 부가적으로, 상기 혼합물은 발효의 일부 혹은 전부 동안 탱크를 통해 흐르는 불활성 기체의 일정한 퍼지를 지닐 수 있다. 몇몇 경우에, 혐기성 조건은 발효 동안 이산화탄소 생산에 의해 달성되거나 유지될 수 있고, 부가적인 불활성 기체는 필요로 되지 않는다.
몇몇 실시형태에 있어서, 발효공정의 전부 혹은 일부는 저분자량 당이 생성물(예컨대, 에탄올)로 완전히 전환되기 전에 중단될 수 있다. 중간생성물인 발효 산물은 고농도의 당과 탄수화물을 포함한다. 당과 탄수화물은 당업계에 공지된 임의의 수단을 통해서 단리될 수 있다. 이들 중간생성물인 발효 산물은 인간 혹은 동물 소비를 위한 식품의 제조에 이용될 수 있다. 부가적으로 혹은 대안적으로, 중간생성물인 발효 산물은 밀가루-유사 물질을 생산하기 위하여 스테인레스강제 실험실 밀로 미립자 크기로 분쇄될 수 있다.
제트 혼합은 발효 동안 이용될 수 있고, 몇몇 경우에 당화와 발효는 동일 탱크에서 수행된다.
미생물에 대한 영양물질, 예를 들어, 미국 특허 출원 공개 제2012/0052536호(출원일: 2011년 7월 15일)에 기재된 식품-기반 영양물질 패키지가 당화 및/또는 발효 동안 첨가될 수 있으며, 이 문헌의 전체 개시내용은 참고로 본 명세서에 편입된다.
"발효"는 미국 특허 가출원 제61/579,559호(출원일: 2012년 12월 22일) 및 미국 특허 가출원 제61/579,576호(출원일: 2012년 12월 12일)에 개시된 방법 및 생성물을 포함하며, 이들 두 문헌의 내용은 그들의 전문이 본 명세서에 참고로 편입된다.
국제 특허 출원 제PCT/US2007/074028호(출원일: 2007년 7월 20일, WO 2008/011598로서 공개되었고, 미국을 지정함)에 기재된 바와 같은 이동식 발효기가 이용될 수 있고, 이들 문헌의 내용은 그들의 전문이 본 명세서에 포함된다. 마찬가지로, 당화 장비는 이동식일 수 있다. 또, 당화 및/또는 발효는 수송 동안 부분적으로 전체적으로 수행될 수 있다.
발효에 이용되는 미생물(들)은 천연-유래 미생물 및/또는 공학적으로 조작된 미생물일 수 있다. 예를 들어, 미생물은 박테리아(예컨대, 셀룰로스 분해 박테리아를 포함하지만, 이로써 제한되는 것은 아님), 균류(예컨대, 효모를 포함하지만, 이로써 제한되는 것은 아님), 식물, 원생생물, 예컨대, 원생동물문 혹은 균류-유사 원생생물(예컨대, 점균류를 포함하지만, 이로써 제한되는 것은 아님), 또는 조류일 수 있다. 유기체가 거부반응을 일으키지 않을 경우, 유기체의 혼합물이 이용될 수 있다.
적절한 발효 미생물은, 예컨대, 글루코스, 프럭토스, 자일로스, 아라비노스, 만노스, 갈락토스, 올리고당 혹은 다당류 등의 탄수화물을 발효 생성물로 전환시키는 능력을 지닌다. 발효 미생물로는, 사카로마이세스종(Saccharomyces spp.)의 속(genus)(사카로마이세스 세레비시아(S. cerevisiae)(빵 효모), 사카로마이세스 디스타티쿠스(S. distaticus), 사카로마이세스 우바룸(S. uvarum)을 포함하지만 이들로 제한되는 것은 아님), 클루이베로마이세스(Kluyveromyces)속(클루이베로마이세스 마르시아누스(K. marxianus), 클루이베로마이세스 프라길리스(K. fragilis) 을 포함하지만 이들로 제한되는 것은 아님), 칸디다(Candida)속(칸디다 슈도트로피칼리스(C. pseudotropicalis) 및 칸디다 브라시카에(C. brassicae)를 포함하지만 이들로 제한되는 것은 아님), 피키아 스티피티스(Pichia stipitis)(칸디다 쉐하타에(Candida shehatae)와 관련됨), 클라비스포라(Clavispora)속(클라비스포라 루시타니에(C. lusitaniae) 및 클라비스포라 오푼티애(C. opuntiae)를 포함하지만 이들로 제한되는 것은 아님), 파키솔렌(Pachysolen)속(파키솔렌 탄노필루스(P. tannophilus)을 포함하지만, 이로써 제한되는 것은 아님), 브레탄노마이세스(Bretannomyces)속(브레탄노마이세스 클라우세니이(B. clausenii)(Philippidis, G. P., 1996, Celluose bioconversion technology, Handbook on Bioethanol: Production and Utilization, Wyman, C.E., ed., Taylor & Francis, Washington, DC, 179-212)를 포함하지만, 이로써 제한되는 것은 아님)의 균주들을 포함한다. 기타 적절한 미생물로는, 예를 들어, 지모모나스 모빌리스(Zymomonas mobilis), 클로스트리듐 종(클로스트리듐 써모셀륨(C. thermocellum)(Philippidis, 1996, 전술함), 클로스트리듐 사카로뷰틸아세토니쿰(C. saccharobutylacetonicum), 클로스트리듐 티로뷰티리쿰(C. tyrobutyricum), 클로스트리듐 사카로뷰틸리쿰(C. saccharobutylicum), 클로스트리듐 푸니세움(C. Puniceum), 클로스트리듐 베이전키이(C. beijernckii), 클로스트리듐 아세토뷰틸리쿰(C. acetobutylicum)을 포함하지만, 이들로 제한되는 것은 아님), 모닐리엘라 폴리니스(Moniliella pollinis), 모닐리엘라 메가실리엔시스(Moniliella megachiliensis)), 락토바실러스 종(Lactobacillus spp.), 야로위아 리포리타카(Yarrowia lipolytica), 유레오바시디움 종(Aureobasidium sp.), 트리코스포로노이데스 종(Trichosporonoides sp.), 트리고놉시스 바리아빌리스(Trigonopsis variabilis), 트리코스포론 종(Trichosporon sp.), 모닐리엘라아세토아부탄스 종(Moniliellaacetoabutans sp .), 티풀라 바리아빌리스(Typhula variabilis), 칸디다 마그놀리애(Candida magnoliae), 우스틸라기노마이세테스 종(Ustilaginomycetes sp.), 슈도지마 츠쿠바엔시스(Pseudozyma tsukubaensis)의 균주, 지고사카로마이세스(Zygosaccharomyces), 데바리오마이세스(Debaryomyces), 한세눌라(Hansenula) 및 피키아(Pichia) 속의 효모 종, 및 데마티이드속 토룰라(Torula)의 진균을 포함한다.
예를 들어, 클로스트리듐 종(Clostridium spp.)은 에탄올, 뷰탄올, 뷰티르산, 아세트산 및 아세톤을 생산하는데 이용될 수 있다. 락토바실러스 종은 락트산을 생산하는데 이용될 수 있다.
이러한 많은 미생물 균주는, 두서너 가지 예를 들면, ATCC(American Type Culture Collection, 미국 버지니아주의 머내서스시에 소재), NRRL(Agricultural Research Service Culture Collection, 미국 일리노이주의 피오리아시에 소재) 또는 DSMZ(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH, 독일의 브라운슈바이크에 소재) 등과 같은 기탁소를 통해서 혹은 상업적으로 공개적으로 입수 가능하다.
시판의 효모로는, 예를 들어, 레드 스타(Red Star)(등록상표)/라사프레 에탄올 레드(Lesaffre Ethanol Red)(미국 레드 스타/레사프레사(Red Star/Lesaffre)로부터 입수 가능), 팔리(FALI)(등록상표)(미국 번즈 필립스 푸드사(Burns Philip Food Inc.)의 분사인 플레이쉬만즈 이스트사(Fleischmann's Yeast)로부터 입수 가능), 수퍼스타트(SUPERSTART)(등록상표)(알테크사(Alltech), 이제는 랄레만드사(Lalemand)로부터 입수 가능), 거트 스트란드(GERT STRAND)(등록상표)(스웨덴의 거트 스트란트 아베(Gert Strand AB)로부터 입수 가능) 및 페르몰(FERMOL)(등록상표)(DSM 스페셜티즈사(DSM Specialties)로부터 입수 가능)을 포함한다.
바이오매스 물질을 당화시키고 당을 생산하는데 이용될 수 있는 많은 미생물은 또한 이들 당을 유용한 생성물로 발효 및 전환시키는데 이용될 수 있다.
발효 후, 얻어지는 유체는, 예를 들어, "비어탑"(beer column)을 이용해서 증류되어 대부분의 물과 잔류 고체로부터 에탄올과 기타 알코올을 분리할 수 있다. 비어탑을 나온 증기는 예컨대, 35중량% 에탄올일 수 있고 정류탑으로 공급될 수 있다. 정류탑으로부터 거의 공비(azeotropic)(92.5%) 에탄올과 물의 혼합물은 기상 분자체(vapor-phase molecular sieve)를 이용해서 순수한(99.5%) 에탄올로 정제될 수 있다. 비어탑 바닥부분은 3-작용 증발기의 제1 작용부에 보내질 수 있다. 정류탑 환류 컨덴서는 이 제1 작용부를 위해 열을 제공할 수 있다. 제1 작용 후, 고체는 원심분리기를 이용해서 분리되고 회전 건조기에서 건조될 수 있다. 원심분리기 유출물의 일부(25%)는 발효로 재순환될 수 있고, 나머지는 제2 및 제3 증발기 작용부로 보내질 수 있다. 대부분의 증발기 응축물은 적은 부분이 폐수 처리로 분리되어 낮은 비등 화합물의 구축을 방지하면서 상당히 깨끗한 응축물로서 상기 처리로 되돌아갈 수 있다.
본 명세서에 기재된 방법으로부터 생성물의 화학적 변형의 기타 유형, 예를 들어, 유기 당 유래 생성물(예컨대, 푸르푸랄 및 푸르푸랄-유래 생성물)이 이용될 수 있다. 당 유래 생성물의 화학적 변형은 미국 가출원 제61/667,481호(출원일: 2012년 7월 3일)에 기재되어 있으며, 이 문헌의 전체 개시내용은 참고로 본 명세서에 편입된다.
실시예
본 발명은 이하의 실험적 실시예를 참조하여 상세히 더욱 설명된다. 이들 실시예는 단지 예시적인 목적을 위하여 제공되며, 달리 특정되지 않는 한 제한이 되도록 의도되지 않는다. 따라서 본 발명은 여하튼 이하의 실시예로 제한되는 것으로 해석되어서는 안 되고, 오히려 본 명세서에서 제공된 교시의 결과로서 명백해지는 모든 변형을 망라하도록 해석되어야 한다.
추가의 설명 없이도, 당업자라면, 선행하는 설명 및 이하의 예시적인 실시예를 이용해서 본 발명의 화합물을 제조하고 이용하고 그리고 청구된 방법을 실시할 수 있는 것으로 여겨진다. 이하의 작업예는 본 발명의 각종 양상을 구체적으로 가리키고 본 개시내용의 나머지를 어떠한 방식으로 제한하는 것으로 해석되어서는 안 된다.
실시예 1: 발현 벡터로의 Cel3a - C'His 클로닝
Cel3a(아미노산 20 내지 744)에 대한 성숙 서열은 제네비즈사(Genewiz)에 의해 이. 콜라이 발현에 대해서 합성되고 코돈-최적화되었다. 이하의 실시예에서 지칭되는 Cel3a-C'His는 C-말단에서 8xHis(서열번호 7) 태그를 가진 Cel3a(aas 20 내지 744)에 대한 코돈-최적화된 성숙 서열을 지칭한다. 이하의 프라이머는 Cel3a-C'His를 pET-Duet(노바젠사, 카탈로그 번호 71146) 내로 클로닝하는데 이용되었다:
순방향 5' -CATGCC ATG GGCGATAGTCACAGTACCAGC (서열번호 4)
역방향 3' -CCCAAGCTT TCATTA GTGATGATGATGATGATGATGATGGCTGCCGCTGCCGGCAACACTCAGGGTGC(서열번호 5)
(NcoI 및 HindIII 부위는 밑줄그어져 있고; 개시 및 정지 코돈은 볼드체로 되어 있으며; 폴리히스티딘(8-His(서열번호 7)) 태그; 및 글리세린-세린(GSGS) 링커(서열번호 8)는 이탤릭체로 되어 있다.)
증폭 반응은 PfuUltra II 융합 HS 중합효소(애질런트사(Agilent), 카탈로그 번호 600672)를 이용해서 수행되었다.
증폭된 DNA는 제조사에 의해 제안된 조건 하에서 NcoI 제한 효소(뉴잉글랜드 바이오랩스사, R3193) 및 HindIII 제한 효소(뉴잉글랜드 바이오랩스사, R3104)를 이용해서 제한 소화에 의해 클로닝되었다. 소화된 증폭된 DNA는 T4 DNA 리가제(뉴잉글랜드 바이오랩스사, M0202)를 이용해서 pETDuet 벡터에서 NcoI-HindIII 부위로 결찰되고 나서, 이. 콜라이 클로닝 숙주인 탑10 원 샷(Top10 One Shot)(인비트로젠사(Invitrogen))의 형질전환되었다. 플라스미드 정제는 퀴아젠사(Qiagen)의 플라스미드 정제 키트를 이용해서 수행되었다.
실시예 2: Cel3a - C'His 의 발현 및 정제
Cel3A-C'His 작제물은 이. 콜라이 발현 숙주인 오리가미 B(DE3)(EMD 밀리포어사(Millipore), 카탈로그 번호 70837)로 형질전환시키고, LB 배지 및 100 ㎍/ml 암피실린(피셔 사이언티픽사(Fisher Scientific), 카탈로그 번호 BP1760), 15 ㎍/ml 카나마이신(피셔 사이언티픽사, 카탈로그 번호 BP906) 및 12.5 ㎍/ml 테트라사이클린(피셔 사이언티픽사, 카탈로그 번호 BP912)을 수용하는 플레이트 상에 스트리킹하였다. 재조합 DNA를 보유하는 콜로니를 2ml의 개시 배양액의 접촉 동안 플레이트로부터 선별하고, 37℃에서 하룻밤 성장시키고 나서, 후속하여 적절한 항생제를 함유하는 LB 배지 100ml를 접종하는데 이용하였다. 배양액은 OD600이 0.8에 도달할 때까지 37℃에서 증식시켰다.
단백질 발현을 유도하기 위하여, 500μM IPTG(아이소프로필-b-D-티오갈락토피라노사이드; 피셔 사이언티픽사, 카탈로그 번호 BP1755)를 첨가하였다. 발현 배양액을 37℃에서 4시간 동안 더욱 증식시켰다. 세포를 소발(Sorvall) St16 회전자 TX400을 이용해서 20분 동안 실온(RT)에서 4000g에서 원심분리에 의해 수확하고; 펠릿을 -80℃에서 보관하였다.
단백질 추출을 위하여, 세포 펠릿을 얼음 상에서 해동시키고, 50mM Tris-HCl pH 7.5, 0.1% 트리톤 X-100, 5mM 이미다졸(피셔 사이언티픽사, 카탈로그 번호 O3196), 및 1 mg/ml 라이소자임(피셔 사이언티픽사, 카탈로그 번호 BP535)를 함유하는 천연 용해 완충액 2ml에 재현탁시키고 나서, 20분 동안 얼음 상에서 인큐베이팅하였다. 샘플 내 DNA를 소화시키기 위하여, 2μl의 라이소나제(EMD 밀리포어사, 카탈로그 번호 71230)를 첨가하고 더욱 10분 동안 인큐베이팅하였다. 이어서 샘플을 4℃에서 10분 동안 최대 속도에서 미세원심분리에서 스피닝하였다. 정화된 용해물을 사전-평형화된 프로피니티(Profinity)(바이오라드사) Ni-주입된 IMAC 수지 슬러리(바이오라드사, 카탈로그 번호 732-4614) 100μl를 수용하는 새로운 튜브로 옮겼다. 천연 결합 완충액은 50mM Tris HCl pH 7.5, 150mM NaCl, 0.1% 트리톤 X-100, 및 5μM 이미다졸로 구성되었다. 단백질은 실온에서 1시간 동안 배취-결합되었고, 이어서 25μM 이미다졸을 함유하는 천연 완충액으로 세척하였다. 단백질을 200μM 이미다졸을 함유하는 천연 완충액 300ml에 용리시켰다. 위에서 기재된 발현 및 정제 과정으로부터의 정제된 Cel3a 단백질은 도 1에 도시되어 있다.
실시예 3: 생물반응기 내 Cel3a - C'His 의 발현
이 실시예에서, Cel3a의 발현 및 정제는 3리터 및 5리터 생물반응기로 규모 확대된다. 당업자라면 생산을, 예를 들어, 3L 및 7L 생물반응기로 더욱 확대시키기 위하여 본 명세서에 기재된 과정을 용이하게 이용할 수 있었다.
각 생물반응기 시행을 위하여, pET Duet-1 Cel3a-C'His 작제물을 이. 콜라이 오리가미 B(DE3) 숙주 세포주로 형질전환시키고, LB 배지 및 100 μg/ml 암피실린(피셔 사이언티픽사, 카탈로그 번호 BP1760), 15 μg/ml 카나마이신(피셔 사이언티픽사, 카탈로그 번호 BP906) 및 12.5 μg/ml 테트라사이클린(피셔 사이언티픽사, 카탈로그 번호 BP912)을 수용하는 플레이트에 스트리킹한다.
1일째에, 재조합 DNA를 보유하는 콜로니를 200 ml의 개시 배양액의 접종 동안 플레이트로부터 선별하고, 37℃에서 하룻밤 성장시켰다. 생물반응기들을 준비하고, 예컨대, 1.5L의 LB 배지는 각 3L 반응기에 첨가하고, 그리고 4L의 LB 배지는 각 5L 반응기에 첨가하고, 각 반응기는 적절한 항생제를 구비한다. 각 반응기는 pH 프로브, 용존 산소(DO) 프로브 및 응축기를 구비한다.
2일째에, 하룻밤 접종원의 OD를 600 nM에서 분광광도계에 의해 측정하였다. 분광광도계는 LB 배지를 이용해서 블랭킹될 수 있다. 생물반응기는 37℃, 300rpm, 및 2.5vvm으로 설정하였다. 일단 생물반응기가 37℃에 도달하면, 하룻밤 접종원의 적절한 ml를 0.05의 목표 개시 OD값에 대해서 각 1.5L 및 각 4L 배양액에 첨가하였다. 반응기의 OD는 경우에 따라서 멸균 피펫 및 에탄올로 상부로부터 샘플링해냄으로써 측정되었다. OD가 0.8에 도달함에 따라서, 샘플을 더욱 빈번하게 채취하였다.
반응기의 OD가 0.7 내지 0.8에 도달한 경우(접종 후 대략 2 내지 4시간), 생물반응기의 온도를 20℃로 감소시키고, 배양액을 Cel3a-C'His 단백질 발현을 위하여 IPTG로 유도하였다. 750ml의 IPTG를 각 1.5L 반응기에 첨가하고, 1.5ml의 IPTG를 각 5L 반응기에 첨가하였다. 반응기들은 하룻밤 가동시켰다.
3일째에, 아침에, 세포를 깨끗한 2L 원심분리병에 수확하고 4200 rpm에서 45분 동안 스피닝하였다. 상청액을 따라버리고, 펠릿을 저장하고, 펠릿의 무게를 기록하였다. PBS 완충액을 이용해서, 펠릿을 50 mL 원추형 원심분리관에 옮겼다. 50 mL의 관을 4500 rpm에서 45분 동안 소발 St-16 테이블탑 원심분리기에서 스피닝하였다. 상청액을 따라버리고, 펠릿은 정제 준비가 될 때까지 -20℃에서 동결시키거나, 또는 정제를 위하여 즉시 가공처리하였다.
실시예 4: 세포로부터의 단백질 추출
탈이온수 중 50mM Tris-HCl pH 7.5, 0.1% 트리톤 X-100, 1% 글리세롤, 5mM 이미다졸, 1 mg/mL 라이소자임, 및 1 mM EDTA를 함유하는, EDTA를 지닌 용해 완충액을 준비하였다. 세포 펠릿을 EDTA를 지닌 용해 완충액 5 mL 용적에 재현탁시켰다. 이 샘플에 10μl의 라이소나제(DNAse)를 첨가하였다. 이어서 샘플을 실온에서 1시간 동안 인큐베이팅하였다.
이어서, 샘플은 3회의 1분 간격 동안(예컨대, 총 3분 동안 세팅 17에서 소버발 초음파처리기(Sorvall sonicator)) 얼음 상에서 초음파처리하였다.
이 시점에서, 1000μl 분취액을 추출 및 정제 과정으로부터 Cel3a-C'His 단백질의 수율 및 활성을 분석하기 위하여 추출 과정의 각 분획으로부터 남겨두었다. 분취액은 단리된 충 단백질을 나타내기 위하여 초음파처리된 샘플로부터 취하였다(샘플 A). 이어서 샘플을 5분 동안 13000rpm에서 원심분리하고, 상청액을 제거하였다. 가용성 분획을 나타내는 분취액을 상청액으로부터 취하였다(샘플 D). 나머지 펠릿을 1000μl의 용해 완충액 + EDTA에 재현탁시키고, 이어서 13000 rpm에서 5분 동안 원심분리하였다. 상청액을 제거하고, 가용성 세척 분획을 나타내는 분취액을 상청액으로부터 취하였다(샘플 E). 불용성 분획을 나타내는 나머지 펠릿은 남겼다(샘플 C). 모든 샘플은 분석 때까지 냉장고(예컨대, 4℃)에 보관하였다.
셀로비아제 활성 검정은, 예를 들어, 실시예 6에 기재된 바와 같이, 총 단백질 분취액(샘플 A)을 이용해서 수행하였다.
샘플 A, C, D 및 E는 또한 SDS-PAGE 및 웨스턴 블로팅에 의해 분석하였다. 샘플은 2.00 OD로 희석시켜 정규화하였다. 17.5μl의 LDS 샘플 완충액(375μl의 LDS 완충액 및 150μl의 NuPAGE 환원제를 혼합하여 525μl의 LDS 샘플 완충액을 제조함)을 각 샘플 32.5μl에 첨가하였다. 샘플을 5분 동안 끓이고, 각 샘플 20μl를 각 겔 웰에 장입하였다. 표준(분자량 래더(ladder))을 또한 겔 웰에 장입하였다.
실시예 5: 정제된 Cel3a - N'His 의 질량 분광 분석
N-말단에서 His-태그를 가진 Cel3a(Cel3a-N'His)를, 실시예 1 내지 4에서 위에서 기재된 것들과 유사한 방법을 이용해서, 클로닝하고 이. 콜라이에서 발현시키고, 수확하였다. Cel3a-N'His는 pET-Duet1 벡터로 클로닝하였다. 발현된 Cel3a-N'His는 프로피니티 Ni-주입 IMAC 수지 슬러리를 수용하는 친화도 칼럼으로 정제시키고, 용해 완충액 중 200mM 이미다졸을 함유하는 용리 완충액을 이용해서 용리시켰다.
정제된 Cel3a-N'His는 50mM Tris-HCl 및 0.5M EDTA를 함유하는 완충액 중에 투석하였다. 투석된 단백질은 이어서 액체 크로마토그래피-질량 분광법(LCMS) 온전한 질량 분석을 실시하였다.
샘플 농도는, 예컨대, 브래드포드 검정에 의해 그리고 나노드랍(Nanodrop) 검정에 의해 결정되었다. 샘플 농도는 약 4 mg/mL였다. 탈이온수 중 0.1% 폼산을 이용한 10X 및 100X 희석 샘플을 LCMS를 위하여 준비하여, 0.4 mg/mL 및 0.04 mg/mL 샘플을 제공하였다.
LC 조건은 다음과 같았다:
- 액퀴티 UPLC H-클래스 바이오 시스템(Acquity UPLC H-Class Bio System): BEH300 C4 칼럼, 1.7㎛, 2.1x150 mm (p/n: 186004497)
- 칼럼 온도: 45℃
- MPA: 수중 0.1% FA
- MPB: ACN 중 0.1% FA
질량 분광계 조건은 다음과 같았다:
- 공급원 온도: 125℃
- 탈용매화 온도: 450℃
- 콘 전압(Cone Voltage): 40V
- 교정: Csl (500 내지 5000 Da)
- 록매스(Lockmass): Csl
샘플의 크로마토그래피 프로파일은 도 2에 도시되어 있다. 이 프로파일은 3개의 관심 대상 영역을 나타낸다: 31분에 커다란 피크, 38분 내지 40분 사이의 피크의 클러스터 및 약 45분의 피크. 약 45분에서의 피크 및 약 39분에서의 피크 클러스터의 질량 스펙트럼의 수동 디컨볼루션은 주 피크가 하전 상태 엔빌로프의 일부가 아니고, 오히려 중합체 시리즈(반복 단위로서 44 amu를 지님)이며, 따라서 가능하게는 용해 완충액 중에서 사용된 트리톤-X로부터 기인하였다.
31분에 검출된 파크에 대한 질량 스펙트럼 영역의 분석은 단백질 하전 상태 엔빌로프를 나타내고, 중요하게는 글리코실화의 증거가 없다(도 3). 하전 상태 엔빌로프의 확장은 주 성분보다 약간 크게 2 내지 3개의 미량 단백질의 존재를 나타낸다. 하전 상태 엔빌로프의 디컨볼루션은 주 성분이 78,052의 분자량을 지닌 것을 나타내었고(도 4), 이것은 Cel3a-N'His의 예상된 분자량에 대응한다. 미량 성분은 이하의 분자량: 78,100, 78,182 및 78,229(도 4)을 지녔고, 따라서 Cel3a-N'His 단백질에 대한 미소한 변형을 나타낸다.
주 성분에 대한 하전 상태 중에서, 보다 작은 펩타이드 단편에 상당하는 수개의 신호가 있다. 이들은 더욱 넓게 이격된 동위원소 피크에 의해 구분된다. 확인된 단편의 몇몇은 8,491, 9,261 및 11,629의 분자량을 지닌다. 이들 단편은 MS 공급원에서 발생될 수 있거나, 또는 샘플로부터 유래될 수 있다.
이 실험의 결과는, 아글리코실화된 셀로비아제인 Cel3a-N'His가 본 발명에 의해 망라되는 방법을 이용해서 클로닝되고, 발현되고 단리되는 것을 입증한다.
실시예 6: 셀로비아제 활성 검정
His-태그된 Cel3a(예컨대, N 또는 C-말단에서 His-태그를 가진 Cel3a)는 IMAC 수법을 이용해서 정제시켰다. 정제된 His-태그된 Cel3a의 양(역가)은 브래드포드 검정 및/또는 나노드랍을 이용해서 결정되었다. 나노드랍 정량화를 위하여, 몰 소광 계수는 Cel3a의 표적 형태의 아미노산 서열을 ExPASy ProtParam 온라인 툴에 삽입함으로써 추정되었다.
활성 검정을 위하여, Cel3a-N'His를 함유하는 샘플의 2배 연속 희석은 96 웰 플레이트 형식에서 수행되었다. 희석물은 pH 5.0에서 50mM의 일염기성 시트르산나트륨 완충액 중 D-(+)-셀로비오스(플루카사(Fluka)) 기질 용액과 함께 48℃에서 30분 동안 인큐베이팅하였다. 30분 후, 샘플을 10분 동안 100℃로 가열하여 반응을 중지시켰다. 샘플들은 YSI 생화학 분석기)(YSI Biochemistry analyser)(YSI 라이프 사이언시스사(YSI Life Sciences)) 및/또는 HPLC 방법을 이용해서 글루코스 및 셀로비오스에 대해서 분석하였다. 정제된 Cel3a-N'His의 단백질 활성은 30분 당 셀로비오스에서 글루코스로의 전환 퍼센트로서 기록하였다(도 5).
Cel3a의 양이 브래드포드 검정 및/또는 나노드랍을 이용해서 검정될 수 없는 샘플, 예컨대, 조질의 용해물 샘플에 대해서, 활성 검정은 Cel3a의 역가를 결정하기 위하여 이용될 수 있다. 기지의 농도의 정제된 Cel3a-N'His의 샘플의 셀로비아제 활성의 표준 곡선이 생성된다. 기지의 농도의 Cel3a-N'His의 2배 연속 희석물은 96 웰 플레이트의 1열에, 예컨대, 12개의 2배 연속 희석물을 준비하였다. 다른 열은 역가가 예컨대 용해물 샘플에 대해서 결정될 다른 나머지 샘플의 2배 연속 희석물을 수용하였다. 희석물은 pH 5.0에서 50mM의 일염기성 시트르산나트륨 완충액 중 D-(+)-셀로비오스(플루카사) 기질 용액으로 48℃에서 30분 동안 인큐베이팅하였다. 30분 후, 샘플을 100℃로 10분 동안 가열하여 반응을 중지시켰다. 샘플은 YSI 생화학 분석기(YSI 라이프 사이언시스사) 및/또는 HPLC 방법을 이용해서 글루코스 및 셀로비오스에 대해서 분석되었다. 기지의 농도의 Cel3a-N'His 샘플을 이용해서, 표준 곡선은 선형 범위의 검정 범위 내에서 데이터 점들을 이용해서 생성하였다(도 6). 미지의 Cel3a 역가를 가진 샘플로부터 검출된 셀로비아제 활성은 표준 곡선과 비교하여 해당 샘플의 Cel3a의 역가를 결정할 수 있다.
활성 단위는, 선형 범위의 검정 내의 값들을 계산한다면, 단지 상대적이다. 검정의 선형 범위는 원래의 가용성 기질 장입의 30% 미만인 글루코스 값을 이용해서 정의된다. 또한, 0.05g/L 미만의 글루코스 값은 기기 보고 수준으로 인해 생략된다. 셀로비아제 활성이 하나의 단위는 30분 당 Cel3a의 양 당 글루코스의 양: [글루코스]g/L / [Cel3a]g/L / 30분으로서 정의된다.
이. 콜라이로부터 정제된 아글리코실화 Cel3a와 트리코더마 리세이로부터의 내인성 (글리코실화된) 셀로비아제 Cel3a 간의 활성의 비교는, 본 명세서에 기재된 셀로비아제 활성을 이용해서 수행되었다. 그 결과는 도 7에 도시되어 있으며, 이는 재조합체 Cel3a(이. 콜라이로부터 정제된 아글리코실화 Cel3a; 도 7에서 Cel3a로 표기됨)가 내인성 Cel3a(도 7에서 L4196으로 표기됨)에 비해서 셀로비오스를 글루코스로 전환시키기 위하여 더 높은 특이적 활성을 입증한 것을 나타낸다. 구체적으로, 0.2 mg/mL보다 낮은 농도의 셀로비아제에서, 재조합체 Cel3a는 내인성 Cel3a보다 30분 후에 더 많은 양의 글루코스를 생성할 수 있었다.
실시예 7: 아글리코실화된 셀로비아제의 첨가는 당화 과정으로부터 생성물을 증가시킨다
이 실시예에 있어서, 글루코스 수득량이 두 당화 반응 간에 비교되었다. 하나의 당화 반응에 있어서, 표 1에 기재된 효소를 포함하는 효소 혼합물을 바이오매스에 첨가하였다. 두 번째 당화 반응에 있어서, 이. 콜라이로부터 정제된 아글리코실화 Cel3a 0.8 mg/ml를 표 1에 기재된 효소를 포함하는 효소 혼합물에 첨가하고, 그리고 바이오매스에 첨가하였다. 당화 반응은 본 명세서에 기재된 바와 같은 조건 하에 시행되었고, 샘플은 이 반응의 0분 내지 80분 사이의 다수의 시점에서 취하였다. 얻어진 글루코스를 YSI 기기 또는 HPLC에 의하는 등과 같은 당업계에서의 방법을 이용해서 측정하고 정량화하고, 도 8에 도시된 바와 같이 시간에 따라 그래프화하였다. 이들 결과는 아글리코실화 Cel3a의 첨가가 당화 반응에서 당 생성물, 예컨대, 글루코스의 수득량을 증가시킨 것을 나타낸다.
등가물
본 명세서에서 인용된 모든 특허, 특허 출원 및 간행물의 개시내용은 그들의 전문이 참고로 본 명세서에 편입된다. 본 발명은 특정 양상들을 참조하여 개시되었지만, 본 발명의 기타 양상 및 변형이 본 발명의 진정한 정신과 범주로부터 벗어나는 일 없이 당업자에 의해 고안될 수 있는 것은 명백하다. 첨부된 청구범위는 이러한 모든 양상 및 등가의 변형을 포함하도록 해석되게끔 의도되어 있다.
SEQUENCE LISTING <110> XYLECO, INC. <120> AGLYCOSYLATED ENZYME AND USES THEREOF <130> WO 2016/022878 <140> PCT/US2015/044136 <141> 2015-08-07 <150> US 62/035,346 <151> 2014-08-08 <160> 23 <170> PatentIn version 3.5 <210> 1 <211> 731 <212> PRT <213> Trichoderma reesei <400> 1 Met Gly Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val Val 1 5 10 15 Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys Ala 20 25 30 Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser Gly 35 40 45 Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala Ser 50 55 60 Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly Val 65 70 75 80 Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala Ala 85 90 95 Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile Gly 100 105 110 Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val Ala 115 120 125 Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly Phe 130 135 140 Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile Asn 145 150 155 160 Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile Leu 165 170 175 Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp Asp 180 185 190 Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val Gln 195 200 205 Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr Thr 210 215 220 Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp Gln 225 230 235 240 Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His Thr 245 250 255 Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly Thr 260 265 270 Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn Ala 275 280 285 Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val Thr 290 295 300 Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly Tyr 305 310 315 320 Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr Asn 325 330 335 Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp Ala 340 345 350 Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly Ser 355 360 365 Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn Asp 370 375 380 Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly Ala 385 390 395 400 Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr Arg 405 410 415 Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn Thr 420 425 430 Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val Phe 435 440 445 Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn Ala 450 455 460 Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu Val 465 470 475 480 Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His Ser 485 490 495 Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val Lys 500 505 510 Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala Leu 515 520 525 Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val Tyr 530 535 540 Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser Gly 545 550 555 560 Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His Phe 565 570 575 Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu Ser 580 585 590 Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala Lys 595 600 605 Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp Leu 610 615 620 Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly Gln 625 630 635 640 Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser Ser 645 650 655 Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu Asn 660 665 670 Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg Arg 675 680 685 Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro Ser 690 695 700 Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg Leu 705 710 715 720 Thr Ser Thr Leu Ser Val Ala Gly Ser Gly Ser 725 730 <210> 2 <211> 2232 <212> DNA <213> Trichoderma reesei <400> 2 atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60 agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120 ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180 ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240 tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300 acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360 atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420 cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480 ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540 tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600 gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660 gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720 acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780 ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840 gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900 gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960 actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020 aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080 ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140 gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200 gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260 ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320 gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380 gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440 gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500 gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560 cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620 agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680 tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740 agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800 cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860 ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920 ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980 gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040 cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100 aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160 tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220 ctgtcggtag cg 2232 <210> 3 <211> 2232 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 3 atgcgttatc gtacagccgc agccctggca ctggccacag gtccgttcgc acgtgccgat 60 agtcacagta ccagcggtgc cagcgcagaa gccgtggttc cgccggcagg cacaccgtgg 120 ggcacagcct atgataaagc caaagccgcc ctggccaagc tgaatctgca ggataaagtg 180 ggcatcgtga gtggcgtggg ctggaacggt ggtccgtgcg ttggcaacac cagcccggca 240 agcaagatca gctatccgag cttatgcctg caggatggtc cgctgggcgt gcgctatagc 300 accggtagta ccgcctttac acctggtgtg caggccgcca gtacctggga cgttaacctg 360 atccgcgaac gtggccaatt tatcggcgaa gaagttaaag ccagcggcat tcatgttatt 420 ctgggtccgg tggccggtcc tctgggtaaa accccgcagg gcggccgtaa ttgggaaggc 480 ttcggcgttg atccgtattt aaccggcatc gcaatgggcc agaccattaa tggcatccag 540 agcgtgggtg ttcaagccac cgccaaacac tacatattaa acgaacagga actgaatcgt 600 gaaaccatca gcagcaatcc ggatgatcgc accctgcatg agctgtatac atggcctttt 660 gccgacgcag ttcaggccaa cgtggcaagt gtgatgtgta gctataacaa ggtgaacacc 720 acctgggcct gcgaagacca gtacaccctg cagaccgttt taaaagacca actgggcttc 780 cctggttacg tgatgacaga ttggaatgcc cagcacacaa ccgttcagag cgcaaacagt 840 ggcctggata tgagcatgcc gggcaccgac ttcaacggca ataatcgtct gtggggtccg 900 gcactgacca atgccgttaa cagcaaccag gtgccgacca gtcgtgtgga cgatatggtt 960 acccgtattc tggccgcctg gtacctgaca ggtcaagacc aggccggcta cccgagcttc 1020 aacatcagcc gcaacgtgca gggtaatcac aagaccaacg ttcgcgcaat cgcacgcgat 1080 ggtatcgtgc tgttaaagaa cgatgccaac attctgccgc tgaaaaaacc ggccagcatc 1140 gccgttgttg gtagcgcagc catcattggc aaccacgccc gtaacagtcc gagctgcaat 1200 gataaaggct gtgacgacgg tgccctgggc atgggttggg gtagtggtgc cgtgaactac 1260 ccgtatttcg tggccccgta cgacgccatt aacacccgtg caagtagcca gggtacccag 1320 gttaccctga gcaacaccga caacacaagc agcggtgcca gtgcagcacg tggtaaggat 1380 gtggccatcg tgttcatcac cgccgacagc ggcgaaggct acattaccgt ggagggtaat 1440 gccggtgatc gcaataatct ggacccgtgg cataacggca acgccctggt tcaggcagtg 1500 gcaggcgcaa atagcaacgt gatcgttgtg gtgcatagcg tgggtgccat cattctggag 1560 cagatcctgg ccctgccgca agttaaggca gttgtgtggg caggtctgcc gagccaagaa 1620 agtggcaatg ccctggtgga cgttctgtgg ggcgatgtta gtccgagcgg caagctggtg 1680 tatacaatcg ccaagagccc gaacgactat aacacccgca tcgttagcgg cggcagtgat 1740 agcttcagcg agggcctgtt tatcgactac aagcatttcg atgatgccaa tattaccccg 1800 cgctacgaat ttggttatgg cctgagctat accaagttca actacagccg cctgagcgtt 1860 ttaagtaccg ccaagagtgg tccggcaaca ggtgccgtgg ttcctggtgg tccgagtgat 1920 ctgtttcaga atgtggccac cgtgaccgtg gatatcgcca acagtggtca ggttaccggc 1980 gccgaagtgg cacagctgta catcacctat ccgagcagtg caccgcgcac cccgccgaaa 2040 cagctgcgtg gcttcgccaa attaaacctg accccgggcc agagcggtac agcaaccttc 2100 aatattcgcc gccgtgatct gagctattgg gacaccgcca gccaaaaatg ggtggtgccg 2160 agcggcagct ttggcattag tgtgggtgca agtagccgcg acattcgctt aacaagcacc 2220 ctgagtgttg cc 2232 <210> 4 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 4 catgccatgg gcgatagtca cagtaccagc 30 <210> 5 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 5 cgtgggactc acaacggccg tcgccgtcgg tagtagtagt agtagtagta gtgattactt 60 tcgaaccc 68 <210> 6 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 6 His His His His His His 1 5 <210> 7 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 8xHis tag <400> 7 His His His His His His His His 1 5 <210> 8 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 8 Gly Ser Gly Ser 1 <210> 9 <211> 800 <212> PRT <213> Podospora anserina <400> 9 Met Lys Ser Ser Val Phe Trp Gly Ala Ser Leu Thr Ser Ala Val Val 1 5 10 15 Arg Ala Ile Asp Leu Pro Phe Gln Phe Tyr Pro Asn Cys Val Asp Asp 20 25 30 Leu Leu Ser Thr Asn Gln Val Cys Asn Thr Thr Leu Ser Pro Pro Glu 35 40 45 Arg Ala Ala Ala Leu Val Ala Ala Leu Thr Pro Glu Glu Lys Leu Gln 50 55 60 Asn Ile Val Ser Lys Ser Leu Gly Ala Pro Arg Ile Gly Leu Pro Ala 65 70 75 80 Tyr Asn Trp Trp Ser Glu Ala Leu His Gly Val Ala Tyr Ala Pro Gly 85 90 95 Thr Gln Phe Trp Gln Gly Asp Gly Pro Phe Asn Ser Ser Thr Ser Phe 100 105 110 Pro Met Pro Leu Leu Met Ala Ala Thr Phe Asp Asp Glu Leu Leu Glu 115 120 125 Lys Ile Ala Glu Val Ile Gly Ile Glu Gly Arg Ala Phe Gly Asn Ala 130 135 140 Gly Phe Ser Gly Leu Asp Tyr Trp Thr Pro Asn Val Asn Pro Phe Lys 145 150 155 160 Asp Pro Arg Trp Gly Arg Gly Ser Glu Thr Pro Gly Glu Asp Val Leu 165 170 175 Leu Val Lys Arg Tyr Ala Ala Ala Met Ile Lys Gly Leu Glu Gly Pro 180 185 190 Val Pro Glu Lys Glu Arg Arg Val Val Ala Thr Cys Lys His Tyr Ala 195 200 205 Ala Asn Asp Phe Glu Asp Trp Asn Gly Ala Thr Arg His Asn Phe Asn 210 215 220 Ala Lys Ile Ser Leu Gln Asp Met Ala Glu Tyr Tyr Phe Met Pro Phe 225 230 235 240 Gln Gln Cys Val Arg Asp Ser Arg Val Gly Ser Ile Met Cys Ala Tyr 245 250 255 Asn Ala Val Asn Gly Val Pro Ser Cys Ala Ser Pro Tyr Leu Leu Gln 260 265 270 Thr Ile Leu Arg Glu His Trp Asn Trp Thr Glu His Asn Asn Tyr Ile 275 280 285 Thr Ser Asp Cys Glu Ala Val Leu Asp Val Ser Leu Asn His Lys Tyr 290 295 300 Ala Ala Thr Asn Ala Glu Gly Thr Ala Ile Ser Phe Glu Ala Gly Met 305 310 315 320 Asp Thr Ser Cys Glu Tyr Glu Gly Ser Ser Asp Ile Pro Gly Ala Trp 325 330 335 Ser Gln Gly Leu Leu Lys Glu Ser Thr Val Asp Arg Ala Leu Leu Arg 340 345 350 Leu Tyr Glu Gly Ile Val Arg Ala Gly Tyr Phe Asp Gly Lys Gln Ser 355 360 365 Leu Tyr Ser Ser Leu Gly Trp Ala Asp Val Asn Lys Pro Ser Ala Gln 370 375 380 Lys Leu Ser Leu Gln Ala Ala Val Asp Gly Thr Val Leu Leu Lys Asn 385 390 395 400 Asp Gly Thr Leu Pro Leu Ser Asp Leu Leu Asp Lys Ser Arg Pro Lys 405 410 415 Lys Val Ala Met Ile Gly Phe Trp Ser Asp Ala Lys Asp Lys Leu Arg 420 425 430 Gly Gly Tyr Ser Gly Thr Ala Ala Tyr Leu His Thr Pro Ala Tyr Ala 435 440 445 Ala Ser Gln Leu Gly Ile Pro Phe Ser Thr Ala Ser Gly Pro Ile Leu 450 455 460 His Ser Asp Leu Ala Ser Asn Gln Ser Trp Thr Asp Asn Ala Met Ala 465 470 475 480 Ala Ala Lys Asp Ala Asp Tyr Ile Leu Tyr Phe Gly Gly Ile Asp Thr 485 490 495 Ser Ala Ala Gly Glu Thr Lys Asp Arg Tyr Asp Leu Asp Trp Pro Gly 500 505 510 Ala Gln Leu Ser Leu Ile Asn Leu Leu Thr Thr Leu Ser Lys Pro Leu 515 520 525 Ile Val Leu Gln Met Gly Asp Gln Leu Asp Asn Thr Pro Leu Leu Ser 530 535 540 Asn Pro Lys Ile Asn Ala Ile Leu Trp Ala Asn Trp Pro Gly Gln Asp 545 550 555 560 Gly Gly Thr Ala Val Met Glu Leu Val Thr Gly Leu Lys Ser Pro Ala 565 570 575 Gly Arg Leu Pro Val Thr Gln Tyr Pro Ser Asn Phe Thr Glu Leu Val 580 585 590 Pro Met Thr Asp Met Ala Leu Arg Pro Ser Ala Gly Asn Ser Gln Leu 595 600 605 Gly Arg Thr Tyr Arg Trp Tyr Lys Thr Pro Val Gln Ala Phe Gly Phe 610 615 620 Gly Leu His Tyr Thr Thr Phe Ser Pro Lys Phe Gly Lys Lys Phe Pro 625 630 635 640 Ala Val Ile Asp Val Asp Glu Val Leu Glu Gly Cys Asp Asp Lys Tyr 645 650 655 Leu Asp Thr Cys Pro Leu Pro Asp Leu Pro Val Val Val Glu Asn Arg 660 665 670 Gly Asn Arg Thr Ser Asp Tyr Val Ala Leu Ala Phe Val Ser Ala Pro 675 680 685 Gly Val Gly Pro Gly Pro Trp Pro Ile Lys Thr Leu Gly Ala Phe Thr 690 695 700 Arg Leu Arg Gly Val Lys Gly Gly Glu Lys Arg Glu Gly Gly Leu Lys 705 710 715 720 Trp Asn Leu Gly Asn Leu Ala Arg His Asp Glu Glu Gly Asn Thr Val 725 730 735 Val Tyr Pro Gly Lys Tyr Glu Val Ser Leu Asp Glu Pro Pro Lys Ala 740 745 750 Arg Leu Arg Phe Glu Ile Val Arg Gly Gly Lys Gly Lys Gly Lys Val 755 760 765 Lys Gly Lys Gly Lys Ala Ala Gln Lys Gly Gly Val Val Leu Asp Arg 770 775 780 Trp Pro Lys Pro Pro Lys Gly Gln Glu Pro Pro Ala Ile Glu Arg Val 785 790 795 800 <210> 10 <211> 316 <212> PRT <213> Trichoderma reesei <400> 10 Met Val Arg Arg Thr Ala Leu Leu Ala Leu Gly Ala Leu Ser Thr Leu 1 5 10 15 Ser Met Ala Gln Ile Ser Asp Asp Phe Glu Ser Gly Trp Asp Gln Thr 20 25 30 Lys Trp Pro Ile Ser Ala Pro Asp Cys Asn Gln Gly Gly Thr Val Ser 35 40 45 Leu Asp Thr Thr Val Ala His Ser Gly Ser Asn Ser Met Lys Val Val 50 55 60 Gly Gly Pro Asn Gly Tyr Cys Gly His Ile Phe Phe Gly Thr Thr Gln 65 70 75 80 Val Pro Thr Gly Asp Val Tyr Val Arg Ala Trp Ile Arg Leu Gln Thr 85 90 95 Ala Leu Gly Ser Asn His Val Thr Phe Ile Ile Met Pro Asp Thr Ala 100 105 110 Gln Gly Gly Lys His Leu Arg Ile Gly Gly Gln Ser Gln Val Leu Asp 115 120 125 Tyr Asn Arg Glu Ser Asp Asp Ala Thr Leu Pro Asp Leu Ser Pro Asn 130 135 140 Gly Ile Ala Ser Thr Val Thr Leu Pro Thr Gly Ala Phe Gln Cys Phe 145 150 155 160 Glu Tyr His Leu Gly Thr Asp Gly Thr Ile Glu Thr Trp Leu Asn Gly 165 170 175 Ser Leu Ile Pro Gly Met Thr Val Gly Pro Gly Val Asp Asn Pro Asn 180 185 190 Asp Ala Gly Trp Thr Arg Ala Ser Tyr Ile Pro Glu Ile Thr Gly Val 195 200 205 Asn Phe Gly Trp Glu Ala Tyr Ser Gly Asp Val Asn Thr Val Trp Phe 210 215 220 Asp Asp Ile Ser Ile Ala Ser Thr Arg Val Gly Cys Gly Pro Gly Ser 225 230 235 240 Pro Gly Gly Pro Gly Ser Ser Thr Thr Gly Arg Ser Ser Thr Ser Gly 245 250 255 Pro Thr Ser Thr Ser Arg Pro Ser Thr Thr Ile Pro Pro Pro Thr Ser 260 265 270 Arg Thr Thr Thr Ala Thr Gly Pro Thr Gln Thr His Tyr Gly Gln Cys 275 280 285 Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys Ala Ser Gly Thr Thr 290 295 300 Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys Leu 305 310 315 <210> 11 <211> 460 <212> PRT <213> Trichoderma reesei <400> 11 Met Ala Ser Arg Phe Phe Ala Leu Leu Leu Leu Ala Ile Pro Ile Gln 1 5 10 15 Ala Gln Ser Pro Val Trp Gly Gln Cys Gly Gly Ile Gly Trp Ser Gly 20 25 30 Pro Thr Thr Cys Val Gly Gly Ala Thr Cys Val Ser Tyr Asn Pro Tyr 35 40 45 Tyr Ser Gln Cys Ile Pro Ser Thr Gln Ala Ser Ser Ser Ile Ala Ser 50 55 60 Thr Thr Leu Val Thr Ser Phe Thr Thr Thr Thr Ala Thr Arg Thr Ser 65 70 75 80 Ala Ser Thr Pro Pro Ala Ser Ser Thr Gly Ala Gly Gly Ala Thr Cys 85 90 95 Ser Ala Leu Pro Gly Ser Ile Thr Leu Arg Ser Asn Ala Lys Leu Asn 100 105 110 Asp Leu Phe Thr Met Phe Asn Gly Asp Lys Val Thr Thr Lys Asp Lys 115 120 125 Phe Ser Cys Arg Gln Ala Glu Met Ser Glu Leu Ile Gln Arg Tyr Glu 130 135 140 Leu Gly Thr Leu Pro Gly Arg Pro Ser Thr Leu Thr Ala Ser Phe Ser 145 150 155 160 Gly Asn Thr Leu Thr Ile Asn Cys Gly Glu Ala Gly Lys Ser Ile Ser 165 170 175 Phe Thr Val Thr Ile Thr Tyr Pro Ser Ser Gly Thr Ala Pro Tyr Pro 180 185 190 Ala Ile Ile Gly Tyr Gly Gly Gly Ser Leu Pro Ala Pro Ala Gly Val 195 200 205 Ala Met Ile Asn Phe Asn Asn Asp Asn Ile Ala Ala Gln Val Asn Thr 210 215 220 Gly Ser Arg Gly Gln Gly Lys Phe Tyr Asp Leu Tyr Gly Ser Ser His 225 230 235 240 Ser Ala Gly Ala Met Thr Ala Trp Ala Trp Gly Val Ser Arg Val Ile 245 250 255 Asp Ala Leu Glu Leu Val Pro Gly Ala Arg Ile Asp Thr Thr Lys Ile 260 265 270 Gly Val Thr Gly Cys Ser Arg Asn Gly Lys Gly Ala Met Val Ala Gly 275 280 285 Ala Phe Glu Lys Arg Ile Val Leu Thr Leu Pro Gln Glu Ser Gly Ala 290 295 300 Gly Gly Ser Ala Cys Trp Arg Ile Ser Asp Tyr Leu Lys Ser Gln Gly 305 310 315 320 Ala Asn Ile Gln Thr Ala Ser Glu Ile Ile Gly Glu Asp Pro Trp Phe 325 330 335 Ser Thr Thr Phe Asn Ser Tyr Val Asn Gln Val Pro Val Leu Pro Phe 340 345 350 Asp His His Ser Leu Ala Ala Leu Ile Ala Pro Arg Gly Leu Phe Val 355 360 365 Ile Asp Asn Asn Ile Asp Trp Leu Gly Pro Gln Ser Cys Phe Gly Cys 370 375 380 Met Thr Ala Ala His Met Ala Trp Gln Ala Leu Gly Val Ser Asp His 385 390 395 400 Met Gly Tyr Ser Gln Ile Gly Ala His Ala His Cys Ala Phe Pro Ser 405 410 415 Asn Gln Gln Ser Gln Leu Thr Ala Phe Val Gln Lys Phe Leu Leu Gly 420 425 430 Gln Ser Thr Asn Thr Ala Ile Phe Gln Ser Asp Phe Ser Ala Asn Gln 435 440 445 Ser Gln Trp Ile Asp Trp Thr Thr Pro Thr Leu Ser 450 455 460 <210> 12 <211> 466 <212> PRT <213> Trichoderma reesei <400> 12 Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln 1 5 10 15 Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp 20 25 30 Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val 35 40 45 Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu 50 55 60 Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg 65 70 75 80 Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile 85 90 95 Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr 100 105 110 Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln 115 120 125 Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu 130 135 140 Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp 145 150 155 160 Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser 165 170 175 Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val 180 185 190 Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg 195 200 205 Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu 210 215 220 Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys 225 230 235 240 Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp 245 250 255 Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly 260 265 270 Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly 275 280 285 Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg 290 295 300 His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp 305 310 315 320 Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln 325 330 335 Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val 340 345 350 Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn 355 360 365 Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu 370 375 380 Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met 385 390 395 400 Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala 405 410 415 Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg 420 425 430 Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro 435 440 445 Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala 450 455 460 Ala Ala 465 <210> 13 <211> 744 <212> PRT <213> Trichoderma reesei <400> 13 Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe 1 5 10 15 Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val 20 25 30 Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys 35 40 45 Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser 50 55 60 Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala 65 70 75 80 Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly 85 90 95 Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala 100 105 110 Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile 115 120 125 Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val 130 135 140 Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile 165 170 175 Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile 180 185 190 Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp 195 200 205 Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val 210 215 220 Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr 225 230 235 240 Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp 245 250 255 Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His 260 265 270 Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly 275 280 285 Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn 290 295 300 Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val 305 310 315 320 Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly 325 330 335 Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr 340 345 350 Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp 355 360 365 Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly 370 375 380 Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn 385 390 395 400 Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly 405 410 415 Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr 420 425 430 Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn 435 440 445 Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val 450 455 460 Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn 465 470 475 480 Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu 485 490 495 Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His 500 505 510 Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val 515 520 525 Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala 530 535 540 Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val 545 550 555 560 Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser 565 570 575 Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His 580 585 590 Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu 595 600 605 Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala 610 615 620 Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp 625 630 635 640 Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly 645 650 655 Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser 660 665 670 Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu 675 680 685 Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg 690 695 700 Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro 705 710 715 720 Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg 725 730 735 Leu Thr Ser Thr Leu Ser Val Ala 740 <210> 14 <211> 418 <212> PRT <213> Trichoderma reesei <400> 14 Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr 1 5 10 15 Gly Gly Ala Ala Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile 20 25 30 Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr 35 40 45 Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr 50 55 60 Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr 65 70 75 80 Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala 85 90 95 Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr 100 105 110 Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser 115 120 125 Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Asp 130 135 140 Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val 145 150 155 160 Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr 165 170 175 Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val 180 185 190 Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly 195 200 205 Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser 210 215 220 Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro 225 230 235 240 His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val 245 250 255 Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro 260 265 270 Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala 275 280 285 Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu 290 295 300 Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His 305 310 315 320 Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala 325 330 335 Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly 340 345 350 Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln 355 360 365 Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly 370 375 380 Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Gly 385 390 395 400 Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala 405 410 415 Arg Lys <210> 15 <211> 471 <212> PRT <213> Trichoderma reesei <400> 15 Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala 1 5 10 15 Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly 20 25 30 Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly 35 40 45 Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly 50 55 60 Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg 65 70 75 80 Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly 85 90 95 Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr 100 105 110 Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr 115 120 125 Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met 130 135 140 Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu 145 150 155 160 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 165 170 175 Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 180 185 190 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 195 200 205 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 210 215 220 Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu 225 230 235 240 Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr 245 250 255 Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr 260 265 270 Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala 275 280 285 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala 290 295 300 Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu 305 310 315 320 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr 325 330 335 Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu 340 345 350 Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn 355 360 365 Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly 370 375 380 Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly 385 390 395 400 Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val 405 410 415 Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala 420 425 430 Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala 435 440 445 Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr 450 455 460 Asn Ala Asn Pro Ser Phe Leu 465 470 <210> 16 <211> 514 <212> PRT <213> Trichoderma reesei <400> 16 Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg 1 5 10 15 Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr 20 25 30 Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser 35 40 45 Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser 50 55 60 Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp 65 70 75 80 Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala 85 90 95 Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe 100 105 110 Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met 115 120 125 Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe 130 135 140 Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala 145 150 155 160 Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro 165 170 175 Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln 180 185 190 Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly 195 200 205 Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly 210 215 220 Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu 225 230 235 240 Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu 245 250 255 Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr 260 265 270 Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr 275 280 285 Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys 290 295 300 Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr 305 310 315 320 Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly 325 330 335 Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu 340 345 350 Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln 355 360 365 Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp 370 375 380 Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr 385 390 395 400 Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr 405 410 415 Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys 420 425 430 Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn 435 440 445 Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr 450 455 460 Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln 465 470 475 480 Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val 485 490 495 Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln 500 505 510 Cys Leu <210> 17 <211> 459 <212> PRT <213> Trichoderma reesei <400> 17 Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile 1 5 10 15 Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val 20 25 30 His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val 35 40 45 Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His 50 55 60 Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr 65 70 75 80 Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly 85 90 95 Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr 100 105 110 Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser 115 120 125 Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys 130 135 140 Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro 145 150 155 160 Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly 165 170 175 Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr 180 185 190 Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn 195 200 205 Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly 210 215 220 Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala 225 230 235 240 Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys 245 250 255 Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr 260 265 270 Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu 275 280 285 Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser 290 295 300 Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala 305 310 315 320 Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val 325 330 335 Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu 340 345 350 Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser 355 360 365 Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile 370 375 380 Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro 385 390 395 400 Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr 405 410 415 Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly 420 425 430 Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys 435 440 445 Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu 450 455 <210> 18 <211> 234 <212> PRT <213> Trichoderma reesei <400> 18 Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala 1 5 10 15 Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr 20 25 30 Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys 35 40 45 Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp 50 55 60 Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln 65 70 75 80 Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro 85 90 95 Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val 100 105 110 Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser 115 120 125 Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly 130 135 140 Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp 145 150 155 160 Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val 165 170 175 Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe 180 185 190 Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val 195 200 205 Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu 210 215 220 Asn Val Ala Ser Trp Thr Ala Ser Ile Asn 225 230 <210> 19 <211> 242 <212> PRT <213> Trichoderma reesei <400> 19 Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser 1 5 10 15 Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala 20 25 30 Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile 35 40 45 Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr 50 55 60 Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu 65 70 75 80 Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala 85 90 95 Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn 100 105 110 Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly 115 120 125 Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp 130 135 140 Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala 145 150 155 160 Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro 165 170 175 Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser 180 185 190 Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr 195 200 205 Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys 210 215 220 Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys 225 230 235 240 Leu Pro <210> 20 <211> 838 <212> PRT <213> Trichoderma reesei <400> 20 Met Lys Val Ser Arg Val Leu Ala Leu Val Leu Gly Ala Val Ile Pro 1 5 10 15 Ala His Ala Ala Phe Ser Trp Lys Asn Val Lys Leu Gly Gly Gly Gly 20 25 30 Gly Phe Val Pro Gly Ile Ile Phe His Pro Lys Thr Lys Gly Val Ala 35 40 45 Tyr Ala Arg Thr Asp Ile Gly Gly Leu Tyr Arg Leu Asn Ala Asp Asp 50 55 60 Ser Trp Thr Ala Val Thr Asp Gly Ile Ala Asp Asn Ala Gly Trp His 65 70 75 80 Asn Trp Gly Ile Asp Ala Val Ala Leu Asp Pro Gln Asp Asp Gln Lys 85 90 95 Val Tyr Ala Ala Val Gly Met Tyr Thr Asn Ser Trp Asp Pro Ser Asn 100 105 110 Gly Ala Ile Ile Arg Ser Ser Asp Arg Gly Ala Thr Trp Ser Phe Thr 115 120 125 Asn Leu Pro Phe Lys Val Gly Gly Asn Met Pro Gly Arg Gly Ala Gly 130 135 140 Glu Arg Leu Ala Val Asp Pro Ala Asn Ser Asn Ile Ile Tyr Phe Gly 145 150 155 160 Ala Arg Ser Gly Asn Gly Leu Trp Lys Ser Thr Asp Gly Gly Val Thr 165 170 175 Phe Ser Lys Val Ser Ser Phe Thr Ala Thr Gly Thr Tyr Ile Pro Asp 180 185 190 Pro Ser Asp Ser Asn Gly Tyr Asn Ser Asp Lys Gln Gly Leu Met Trp 195 200 205 Val Thr Phe Asp Ser Thr Ser Ser Thr Thr Gly Gly Ala Thr Ser Arg 210 215 220 Ile Phe Val Gly Thr Ala Asp Asn Ile Thr Ala Ser Val Tyr Val Ser 225 230 235 240 Thr Asn Ala Gly Ser Thr Trp Ser Ala Val Pro Gly Gln Pro Gly Lys 245 250 255 Tyr Phe Pro His Lys Ala Lys Leu Gln Pro Ala Glu Lys Ala Leu Tyr 260 265 270 Leu Thr Tyr Ser Asp Gly Thr Gly Pro Tyr Asp Gly Thr Leu Gly Ser 275 280 285 Val Trp Arg Tyr Asp Ile Ala Gly Gly Thr Trp Lys Asp Ile Thr Pro 290 295 300 Val Ser Gly Ser Asp Leu Tyr Phe Gly Phe Gly Gly Leu Gly Leu Asp 305 310 315 320 Leu Gln Lys Pro Gly Thr Leu Val Val Ala Ser Leu Asn Ser Trp Trp 325 330 335 Pro Asp Ala Gln Leu Phe Arg Ser Thr Asp Ser Gly Thr Thr Trp Ser 340 345 350 Pro Ile Trp Ala Trp Ala Ser Tyr Pro Thr Glu Thr Tyr Tyr Tyr Ser 355 360 365 Ile Ser Thr Pro Lys Ala Pro Trp Ile Lys Asn Asn Phe Ile Asp Val 370 375 380 Thr Ser Glu Ser Pro Ser Asp Gly Leu Ile Lys Arg Leu Gly Trp Met 385 390 395 400 Ile Glu Ser Leu Glu Ile Asp Pro Thr Asp Ser Asn His Trp Leu Tyr 405 410 415 Gly Thr Gly Met Thr Ile Phe Gly Gly His Asp Leu Thr Asn Trp Asp 420 425 430 Thr Arg His Asn Val Ser Ile Gln Ser Leu Ala Asp Gly Ile Glu Glu 435 440 445 Phe Ser Val Gln Asp Leu Ala Ser Ala Pro Gly Gly Ser Glu Leu Leu 450 455 460 Ala Ala Val Gly Asp Asp Asn Gly Phe Thr Phe Ala Ser Arg Asn Asp 465 470 475 480 Leu Gly Thr Ser Pro Gln Thr Val Trp Ala Thr Pro Thr Trp Ala Thr 485 490 495 Ser Thr Ser Val Asp Tyr Ala Gly Asn Ser Val Lys Ser Val Val Arg 500 505 510 Val Gly Asn Thr Ala Gly Thr Gln Gln Val Ala Ile Ser Ser Asp Gly 515 520 525 Gly Ala Thr Trp Ser Ile Asp Tyr Ala Ala Asp Thr Ser Met Asn Gly 530 535 540 Gly Thr Val Ala Tyr Ser Ala Asp Gly Asp Thr Ile Leu Trp Ser Thr 545 550 555 560 Ala Ser Ser Gly Val Gln Arg Ser Gln Phe Gln Gly Ser Phe Ala Ser 565 570 575 Val Ser Ser Leu Pro Ala Gly Ala Val Ile Ala Ser Asp Lys Lys Thr 580 585 590 Asn Ser Val Phe Tyr Ala Gly Ser Gly Ser Thr Phe Tyr Val Ser Lys 595 600 605 Asp Thr Gly Ser Ser Phe Thr Arg Gly Pro Lys Leu Gly Ser Ala Gly 610 615 620 Thr Ile Arg Asp Ile Ala Ala His Pro Thr Thr Ala Gly Thr Leu Tyr 625 630 635 640 Val Ser Thr Asp Val Gly Ile Phe Arg Ser Thr Asp Ser Gly Thr Thr 645 650 655 Phe Gly Gln Val Ser Thr Ala Leu Thr Asn Thr Tyr Gln Ile Ala Leu 660 665 670 Gly Val Gly Ser Gly Ser Asn Trp Asn Leu Tyr Ala Phe Gly Thr Gly 675 680 685 Pro Ser Gly Ala Arg Leu Tyr Ala Ser Gly Asp Ser Gly Ala Ser Trp 690 695 700 Thr Asp Ile Gln Gly Ser Gln Gly Phe Gly Ser Ile Asp Ser Thr Lys 705 710 715 720 Val Ala Gly Ser Gly Ser Thr Ala Gly Gln Val Tyr Val Gly Thr Asn 725 730 735 Gly Arg Gly Val Phe Tyr Ala Gln Gly Thr Val Gly Gly Gly Thr Gly 740 745 750 Gly Thr Ser Ser Ser Thr Lys Gln Ser Ser Ser Ser Thr Ser Ser Ala 755 760 765 Ser Ser Ser Thr Thr Leu Arg Ser Ser Val Val Ser Thr Thr Arg Ala 770 775 780 Ser Thr Val Thr Ser Ser Arg Thr Ser Ser Ala Ala Gly Pro Thr Gly 785 790 795 800 Ser Gly Val Ala Gly His Tyr Ala Gln Cys Gly Gly Ile Gly Trp Thr 805 810 815 Gly Pro Thr Gln Cys Val Ala Pro Tyr Val Cys Gln Lys Gln Asn Asp 820 825 830 Tyr Tyr Tyr Gln Cys Val 835 <210> 21 <211> 373 <212> PRT <213> Podospora anserina <400> 21 Met Lys Gly Leu Phe Ala Phe Gly Leu Gly Leu Leu Ser Leu Val Asn 1 5 10 15 Ala Leu Pro Gln Ala Gln Gly Gly Gly Ala Ala Ala Ser Ala Lys Val 20 25 30 Ser Gly Thr Arg Phe Val Ile Asp Gly Lys Thr Gly Tyr Phe Ala Gly 35 40 45 Thr Asn Ser Tyr Trp Ile Gly Phe Leu Thr Asn Asn Arg Asp Val Asp 50 55 60 Thr Thr Leu Asp His Ile Ala Ser Ser Gly Leu Lys Ile Leu Arg Val 65 70 75 80 Trp Gly Phe Asn Asp Val Asn Asn Gln Pro Ser Gly Asn Thr Val Trp 85 90 95 Phe Gln Arg Leu Ala Ser Ser Gly Ser Gln Ile Asn Thr Gly Pro Asn 100 105 110 Gly Leu Gln Arg Leu Asp Tyr Leu Val Arg Ser Ala Glu Thr Arg Gly 115 120 125 Ile Lys Leu Ile Ile Ala Leu Val Asn Tyr Trp Asp Asp Phe Gly Gly 130 135 140 Met Lys Ala Tyr Val Asn Ala Phe Gly Gly Thr Lys Glu Ser Trp Tyr 145 150 155 160 Thr Asn Ala Arg Ala Gln Glu Gln Tyr Lys Arg Tyr Ile Gln Ala Val 165 170 175 Val Ser Arg Tyr Val Asn Ser Pro Ala Ile Phe Ala Trp Glu Leu Ala 180 185 190 Asn Glu Pro Arg Cys Lys Gly Cys Asn Thr Asn Val Ile Phe Asn Trp 195 200 205 Ala Thr Gln Ile Ser Asp Tyr Ile Arg Ser Leu Asp Lys Asp His Leu 210 215 220 Ile Thr Leu Gly Asp Glu Gly Phe Gly Leu Pro Gly Gln Thr Thr Tyr 225 230 235 240 Pro Tyr Gln Tyr Gly Glu Gly Thr Asp Phe Val Lys Asn Leu Gln Ile 245 250 255 Lys Asn Leu Asp Phe Gly Thr Phe His Met Tyr Pro Gly His Trp Gly 260 265 270 Val Pro Thr Ser Phe Gly Pro Gly Trp Ile Lys Asp His Ala Ala Ala 275 280 285 Cys Arg Ala Ala Gly Lys Pro Cys Leu Leu Glu Glu Tyr Gly Tyr Glu 290 295 300 Ser Asp Arg Cys Asn Val Gln Lys Gly Trp Gln Gln Ala Ser Arg Glu 305 310 315 320 Leu Ser Arg Asp Gly Met Ser Gly Asp Leu Phe Trp Gln Trp Gly Asp 325 330 335 Gln Leu Ser Thr Gly Gln Thr His Asn Asp Gly Phe Thr Ile Tyr Tyr 340 345 350 Gly Ser Ser Leu Ala Thr Cys Leu Val Thr Asp His Val Arg Ala Ile 355 360 365 Asn Ala Leu Pro Ala 370 <210> 22 <211> 469 <212> PRT <213> Podospora anserina <400> 22 Met Val Lys Leu Leu Asp Ile Gly Leu Phe Ala Leu Ala Leu Ala Ser 1 5 10 15 Ser Ala Val Ala Lys Pro Cys Lys Pro Arg Asp Gly Pro Val Thr Tyr 20 25 30 Glu Ala Glu Asp Ala Ile Leu Thr Gly Thr Thr Val Asp Thr Ala Gln 35 40 45 Val Gly Tyr Thr Gly Arg Gly Tyr Val Thr Gly Phe Asp Glu Gly Ser 50 55 60 Asp Lys Ile Thr Phe Gln Ile Ser Ser Ala Thr Thr Lys Leu Tyr Asp 65 70 75 80 Leu Ser Ile Arg Tyr Ala Ala Ile Tyr Gly Asp Lys Arg Thr Asn Val 85 90 95 Val Leu Asn Asn Gly Ala Val Ser Glu Val Phe Phe Pro Ala Gly Asp 100 105 110 Ser Phe Thr Ser Val Ala Ala Gly Gln Val Leu Leu Asn Ala Gly Gln 115 120 125 Asn Thr Ile Asp Ile Val Asn Asn Trp Gly Trp Tyr Leu Ile Asp Ser 130 135 140 Ile Thr Leu Thr Pro Ser Ala Pro Arg Pro Pro His Asp Ile Asn Pro 145 150 155 160 Asn Leu Asn Asn Pro Asn Ala Asp Thr Asn Ala Lys Lys Leu Tyr Ser 165 170 175 Tyr Leu Arg Ser Val Tyr Gly Asn Lys Ile Ile Ser Gly Gln Gln Glu 180 185 190 Leu His His Ala Glu Trp Ile Arg Gln Gln Thr Gly Lys Thr Pro Ala 195 200 205 Leu Val Ala Val Asp Leu Met Asp Tyr Ser Pro Ser Arg Val Glu Arg 210 215 220 Gly Thr Thr Ser His Ala Val Glu Asp Ala Ile Ala His His Asn Ala 225 230 235 240 Gly Gly Ile Val Ser Val Leu Trp His Trp Asn Ala Pro Val Gly Leu 245 250 255 Tyr Asp Thr Glu Glu Asn Lys Trp Trp Ser Gly Phe Tyr Thr Arg Ala 260 265 270 Thr Asp Phe Asp Ile Ala Ala Thr Leu Ala Asn Pro Gln Gly Ala Asn 275 280 285 Tyr Thr Leu Leu Ile Arg Asp Ile Asp Ala Ile Ala Val Gln Leu Lys 290 295 300 Arg Leu Glu Ala Ala Gly Val Pro Val Leu Trp Arg Pro Leu His Glu 305 310 315 320 Ala Glu Gly Gly Trp Phe Trp Trp Gly Ala Lys Gly Pro Glu Pro Ala 325 330 335 Lys Gln Leu Trp Asp Ile Leu Tyr Glu Arg Leu Thr Val His His Gly 340 345 350 Leu Asp Asn Leu Ile Trp Val Trp Asn Ser Ile Leu Glu Asp Trp Tyr 355 360 365 Pro Gly Asp Asp Thr Val Asp Ile Leu Ser Ala Asp Val Tyr Ala Gln 370 375 380 Gly Asn Gly Pro Met Ser Thr Gln Tyr Asn Glu Leu Ile Ala Leu Gly 385 390 395 400 Arg Asp Lys Lys Met Ile Ala Ala Ala Glu Val Gly Ala Ala Pro Leu 405 410 415 Pro Gly Leu Leu Gln Ala Tyr Gln Ala Asn Trp Leu Trp Phe Ala Val 420 425 430 Trp Gly Asp Asp Phe Ile Asn Asn Pro Ser Trp Asn Thr Val Ala Val 435 440 445 Leu Asn Glu Ile Tyr Asn Ser Asp Tyr Val Leu Thr Leu Asp Glu Ile 450 455 460 Gln Gly Trp Arg Ser 465 <210> 23 <211> 493 <212> PRT <213> Trichoderma reesei <400> 23 Met Ala Gly Lys Leu Ile Leu Val Ala Leu Ala Ser Leu Val Ser Leu 1 5 10 15 Ser Ile Gln Gln Asn Cys Ala Ala Leu Phe Gly Gln Cys Gly Gly Ile 20 25 30 Gly Trp Ser Gly Thr Thr Cys Cys Val Ala Gly Ala Gln Cys Ser Phe 35 40 45 Val Asn Asp Trp Tyr Ser Gln Cys Leu Ala Ser Thr Gly Gly Asn Pro 50 55 60 Pro Asn Gly Thr Thr Ser Ser Ser Leu Val Ser Arg Thr Ser Ser Ala 65 70 75 80 Ser Ser Ser Val Gly Ser Ser Ser Pro Gly Gly Asn Ser Pro Thr Gly 85 90 95 Ser Ala Ser Thr Tyr Thr Thr Thr Asp Thr Ala Thr Val Ala Pro His 100 105 110 Ser Gln Ser Pro Tyr Pro Ser Ile Ala Ala Ser Ser Cys Gly Ser Trp 115 120 125 Thr Leu Val Asp Asn Val Cys Cys Pro Ser Tyr Cys Ala Asn Asp Asp 130 135 140 Thr Ser Glu Ser Cys Ser Gly Cys Gly Thr Cys Thr Thr Pro Pro Ser 145 150 155 160 Ala Asp Cys Lys Ser Gly Thr Met Tyr Pro Glu Val His His Val Ser 165 170 175 Ser Asn Glu Ser Trp His Tyr Ser Arg Ser Thr His Phe Gly Leu Thr 180 185 190 Ser Gly Gly Ala Cys Gly Phe Gly Leu Tyr Gly Leu Cys Thr Lys Gly 195 200 205 Ser Val Thr Ala Ser Trp Thr Asp Pro Met Leu Gly Ala Thr Cys Asp 210 215 220 Ala Phe Cys Thr Ala Tyr Pro Leu Leu Cys Lys Asp Pro Thr Gly Thr 225 230 235 240 Thr Leu Arg Gly Asn Phe Ala Ala Pro Asn Gly Asp Tyr Tyr Thr Gln 245 250 255 Phe Trp Ser Ser Leu Pro Gly Ala Leu Asp Asn Tyr Leu Ser Cys Gly 260 265 270 Glu Cys Ile Glu Leu Ile Gln Thr Lys Pro Asp Gly Thr Asp Tyr Ala 275 280 285 Val Gly Glu Ala Gly Tyr Thr Asp Pro Ile Thr Leu Glu Ile Val Asp 290 295 300 Ser Cys Pro Cys Ser Ala Asn Ser Lys Trp Cys Cys Gly Pro Gly Ala 305 310 315 320 Asp His Cys Gly Glu Ile Asp Phe Lys Tyr Gly Cys Pro Leu Pro Ala 325 330 335 Asp Ser Ile His Leu Asp Leu Ser Asp Ile Ala Met Gly Arg Leu Gln 340 345 350 Gly Asn Gly Ser Leu Thr Asn Gly Val Ile Pro Thr Arg Tyr Arg Arg 355 360 365 Val Gln Cys Pro Lys Val Gly Asn Ala Tyr Ile Trp Leu Arg Asn Gly 370 375 380 Gly Gly Pro Tyr Tyr Phe Ala Leu Thr Ala Val Asn Thr Asn Gly Pro 385 390 395 400 Gly Ser Val Thr Lys Ile Glu Ile Lys Gly Ala Asp Thr Asp Asn Trp 405 410 415 Val Ala Leu Val His Asp Pro Asn Tyr Thr Ser Ser Arg Pro Gln Glu 420 425 430 Arg Tyr Gly Ser Trp Val Ile Pro Gln Gly Ser Gly Pro Phe Asn Leu 435 440 445 Pro Val Gly Ile Arg Leu Thr Ser Pro Thr Gly Glu Gln Ile Val Asn 450 455 460 Glu Gln Ala Ile Lys Thr Phe Thr Pro Pro Ala Thr Gly Asp Pro Asn 465 470 475 480 Phe Tyr Tyr Ile Asp Ile Gly Val Gln Phe Ser Gln Asn 485 490

Claims (53)

  1. 서열번호 1에 대해서 적어도 90%의 동일성을 포함하는 셀로비아제 활성을 가진 아글리코실화된 폴리펩타이드(aglycosylated polypeptide) 또는 이의 작용성 단편.
  2. 제1항에 있어서, 상기 폴리펩타이드는 야생형 트리코더마 리세이(T. reesei)로부터의 Cel3A 효소, 또는 작용성 변이체 또는 이의 단편을 포함하는, 아글리코실화된 폴리펩타이드.
  3. 제2항에 있어서, 상기 Cel3A 효소는 아미노산 서열 서열번호 1을 포함하는(예컨대, 로 이루어진), 아글리코실화된 폴리펩타이드.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 서열번호 2를 포함하는(예컨대, 로 이루어진) 핵산 서열로 암호화된, 아글리코실화된 폴리펩타이드.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 하나 이상의 글리코실화 부위에서 또는 근접하여 돌연변이를 포함하되, 상기 돌연변이는 상기 하나 이상의 글리코실화 부위에서 글리코실화를 방지하는, 아글리코실화된 폴리펩타이드.
  6. 제5항에 있어서, 상기 돌연변이는 서열번호 1의 아미노산 위치 78에서의 트레오닌, 아미노산 위치 241에서의 트레오닌, 아미노산 위치 343에서의 세린, 아미노산 위치 450에서의 세린, 아미노산 위치 599에서의 트레오닌, 아미노산 위치 616에서의 세린, 아미노산 위치 691에서의 트레오닌, 아미노산 위치 21에서의 세린, 아미노산 위치 24에서의 트레오닌, 아미노산 위치 25에서의 세린, 아미노산 위치 28에서의 세린, 아미노산 위치 38에서의 트레오닌, 아미노산 위치 42에서의 트레오닌, 아미노산 위치 303에서의 트레오닌, 아미노산 위치 398에서의 세린, 아미노산 위치 435에서의 세린, 아미노산 위치 436에서의 세린, 아미노산 위치 439에서의 트레오닌, 아미노산 위치 442에서의 트레오닌, 아미노산 위치 446에서의 트레오닌, 아미노산 위치 451에서의 세린, 아미노산 위치 619에서의 세린, 아미노산 위치 622에서의 세린, 아미노산 위치 623에서의 트레오닌, 아미노산 위치 626에서의 세린, 또는 아미노산 위치 630에서의 트레오닌 중 하나 이상에 있는, 아글리코실화된 폴리펩타이드.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 아글리코실화된 폴리펩타이드는 야생형 트리코더마 리세이로부터 글라이코실화된 Cel3A 효소에 비해서 증가된 셀로비아제 활성을 지니는, 아글리코실화된 폴리펩타이드.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 아글리코실화된 폴리펩타이드는 야생형 트리코더마 리세이로부터의 글라이코실화된 Cel3A 효소에 비해서 증가된 기질 인식, 더욱 활성인 기질 인식 부위, 또는 저감된 입체 장해를 지니는, 아글리코실화된 폴리펩타이드.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 아글리코실화된 폴리펩타이드는 셀로비오스와 같은 탄수화물을 1종 이상의 단당류, 예컨대, 글루코스로 가수분해시키는, 아글리코실화된 폴리펩타이드.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 셀로비아제 활성은 셀로비오스의 베타 1,4 글리코사이드 결합의 가수분해를 포함하는, 아글리코실화된 폴리펩타이드.
  11. 제1항 내지 제10항 중 어느 한 항의 폴리펩타이드를 암호화하는 핵산 서열.
  12. Cel3A 효소 또는 이의 작용성 변이체를 암호화하는 핵산 서열로서, 상기 핵산 서열은 서열번호 2 또는 서열번호 3에 대해서 적어도 90%의 동일성을 포함하는(예컨대, 으로 이루어진), 핵산 서열.
  13. 제11항 또는 제12항의 핵산 서열을 포함하는 핵산 분자.
  14. 제13항에 있어서, 프로모터, 예컨대, 원핵 세포 발현, 예컨대, 박테리아 세포 발현, 예컨대, 이. 콜라이(E. coli) 내 발현을 위한 프로모터를 더 포함하는, 핵산 분자.
  15. 제14항에 있어서, 상기 프로모터 서열은 구성적 프로모터 서열, 유도성 프로모터 서열, 또는 억제성 프로모터 서열인, 핵산 분자.
  16. 제14항 또는 제15항에 있어서, 상기 프로모터는 T7 프로모터인, 핵산 분자.
  17. 제13항 내지 제16항 중 어느 한 항에 있어서, 태그, 예컨대, 검출 및/또는 정제 및/또는 다른 분자에 연결하기 위한 태그, 예컨대, His 태그를 암호화하는 핵산 서열을 더 포함하는, 핵산 분자.
  18. 제13항 내지 제17항 중 어느 한 항에 있어서, 하나 이상의 신호 서열, 예컨대, 분비 신호 서열을 암호화하는 핵산을 더 포함하는, 핵산 분자.
  19. 제11항 내지 제18항 중 어느 한 항의 핵산 서열을 포함하는 발현 벡터.
  20. 제18항에 있어서, 선택 마커, 예컨대, 카나마이신 또는 암피실린 마커를 암호화하는 핵산 서열을 더 포함하는, 발현 벡터.
  21. 제13항 내지 제20항 중 어느 한 항의 벡터를 포함하는 세포.
  22. 제13항 내지 제20항 중 어느 한 항의 벡터를 포함하는 원핵세포 또는 박테리아 세포.
  23. 제1항 내지 제10항 중 어느 한 항의 폴리펩타이드를 발현하는 세포.
  24. 제1항 내지 제10항 중 어느 한 항의 폴리펩타이드를 발현하는 원핵세포 또는 박테리아 세포.
  25. 제22항 또는 제24항에 있어서, 상기 박테리아 세포는 글리코실화를 해치는, 박테리아 세포.
  26. 제25항에 있어서, 상기 박테리아 세포는 이. 콜라이 세포인, 박테리아 세포.
  27. 제26항에 있어서, 상기 이. 콜라이 세포는 오리가미(origami) 이. 콜라이 세포인, 박테리아 세포.
  28. 제1항 내지 제4항 및 제7항 내지 제10항 중 어느 한 항의 아글리코실화된 폴리펩타이드를 제조하는 방법으로서, 제1항 내지 제4항 및 제7항 내지 제10항 중 어느 한 항의 폴리펩타이드를 발현시키는 세포를 상기 폴리펩타이드의 발현에 적합한 조건 하에서 배양하는 단계를 포함하되, 상기 세포는 상기 폴리펩타이드, 예컨대, 박테리아 세포, 예컨대, 이. 콜라이 세포, 예컨대, 오리가미 이. 콜라이 세포를 글리코실화하지 않는, 아글리코실화된 폴리펩타이드를 제조하는 방법.
  29. 제1항 내지 제4항 및 제7항 내지 제10항 중 어느 한 항의 아글리코실화된 폴리펩타이드를 제조하는 방법으로서, 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산을 포함하는 폴리펩타이드를 탈글리코실화 효소로 처리하는 단계를 포함하는, 아글리코실화된 폴리펩타이드를 제조하는 방법.
  30. 제29항에 있어서, 상기 탈글리코실화 효소는 PGNase 및 EndoH로부터 선택되는, 아글리코실화된 폴리펩타이드를 제조하는 방법.
  31. 제1항 내지 제4항 및 제7항 내지 제10항 중 어느 한 항의 아글리코실화된 폴리펩타이드를 제조하는 방법으로서, 제1항 내지 제4항 및 제7항 내지 제10항 중 어느 한 항의 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 세포를 배양하는 단계를 포함하되, 상기 핵산 서열은 암호화된 상기 폴리펩타이드의 글리코실화를 방지하는 하나 이상의 돌연변이를 가진, 아글리코실화된 폴리펩타이드를 제조하는 방법.
  32. 글리코실화 저해제, 예컨대, 투니카마이신(tunicamycin)의 존재 하에 제1항 내지 제4항 및 제7항 내지 제10항 중 어느 한 항의 아글리코실화된 폴리펩타이드를 발현하는 세포를 배양하는 방법.
  33. 효소 혼합물로서, 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 가진 글리코실화 폴리펩타이드 및 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함하는 아글리코실화된 폴리펩타이드를 포함하되, 상기 글리코실화 폴리펩타이드와 상기 아글리코실화 펩타이드는 둘 다 셀로비아제 활성을 지니는, 효소 혼합물.
  34. 제33항에 있어서, 상기 아글리코실화된 폴리펩타이드는 제1항 내지 제10항 중 어느 한 항의 아글리코실화된 폴리펩타이드인, 효소 혼합물.
  35. 제33항 또는 제34항에 있어서, 상기 글리코실화 폴리펩타이드와 상기 아글리코실화된 폴리펩타이드는 둘 다 야생형 트리코더마 리세이로부터의 Cel3A 효소를 포함하는, 효소 혼합물.
  36. 제33항 내지 제35항 중 어느 한 항에 있어서, 미생물로부터 유래된 적어도 1종의 추가의 효소를 더 포함하되, 상기 추가의 효소는 셀룰로스계 물질의 바이오매스-분해 활성을 지니는, 효소 혼합물.
  37. 제36항에 있어서, 상기 추가의 효소는 리그니나제, 엔도글루카나제, 셀로비오하이드롤라제, 자일라나제 및 셀로비아제로부터 선택되는, 효소 혼합물.
  38. 제33항 또는 제34항에 있어서, 상기 혼합물은 1종 이상의 리그니나제, 1종 이상의 엔도글루카나제, 1종 이상의 셀로비오하이드롤라제, 1종 이상의 자일라나제를 더 포함하는, 효소 혼합물.
  39. 제33항 내지 제38항 중 어느 한 항에 있어서, 상기 혼합물 중의 상기 아글리코실화된 폴리펩타이드 대 나머지 효소의 비가 적어도 1:32, 예컨대, 1:32 내지 1:300인, 효소 혼합물.
  40. 제33항 내지 제38항 중 어느 한 항에 있어서, 상기 아글리코실화된 폴리펩타이드 대 글리코실화 폴리펩타이드의 비가 적어도 1:32, 예컨대, 1:32 내지 1:300인, 효소 혼합물.
  41. 바이오매스로부터 생성물(예컨대, 수소, 당, 알코올 등)을 생성하는(또는 바이오매스를 생성물로 전환시키는) 방법으로서, 당 생성물의 생성에 적합한 조건 하에서, 예컨대, 전자빔을 이용한 처리에 의한 바이오매스를, 제1항 내지 제10항 중 어느 한 항의 아글리코실화된 폴리펩타이드와 1종 이상의 바이오매스-분해 효소 또는 바이오매스-분해 효소들을 포함하는 효소 혼합물을 생산하는 미생물(혼합물)과 접촉시키는 단계를 포함하는, 바이오매스로부터 생성물을 생성하는 방법.
  42. 바이오매스로부터 생성물(예컨대, 수소, 당, 알코올)을 생성하는 방법으로서, 상기 생성물의 생성에 적합한 조건 하에서 바이오매스를 제33항 내지 제40항 중 어느 한 항의 효소 혼합물과 접촉시키는 단계를 포함하는, 바이오매스로부터 생성물을 생성하는 방법.
  43. 제41항 또는 제42항에 있어서, 상기 생성물은 당 생성물인, 바이오매스로부터 생성물을 생성하는 방법.
  44. 제41항 내지 제43항 중 어느 한 항에 있어서, 상기 당 생성물을 단리시키는 단계를 더 포함하는, 바이오매스로부터 생성물을 생성하는 방법.
  45. 제44항에 있어서, 상기 당 생성물을 단리시키는 단계는 석출, 결정화, 크로마토그래피, 원심분리 및/또는 추출을 포함하는, 바이오매스로부터 생성물을 생성하는 방법.
  46. 제43항 내지 제45항 중 어느 한 항에 있어서, 상기 당 생성물은 글루코스 및/또는 자일로스인, 바이오매스로부터 생성물을 생성하는 방법.
  47. 제41항 내지 제46항 중 어느 한 항에 있어서, 상기 효소 혼합물은 B2AF03, CIP1, CIP2, Cel1a, Cel3a, Cel5a, Cel6a, Cel7a, Cel7b, Cel12a, Cel45a, Cel74a, paMan5a, paMan26a, 스월레닌(Swollenin), 및 표 1에 열거된 효소로 이루어진 군으로부터 선택된 효소들 중 적어도 2종을 포함하는, 바이오매스로부터 생성물을 생성하는 방법.
  48. 제41항 내지 제47항 중 어느 한 항에 있어서, 상기 바이오매스는 농업 생성물 또는 폐기물, 종이 생성물 또는 폐기물, 산림 생성물, 또는 일반 폐기물, 또는 이들의 임의의 조합물 중 한가지 이상을 포함하되;
    a) 농업 생성물 또는 폐기물은 사탕 수수, 황마, 대마, 아마, 대나무, 사이잘마, 알팔파, 건초, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 옥수수 속대, 옥수수 겉대, 옥수수 섬유, 코코넛 헤어, 사탕무우박, 버개스, 대두 여물, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 또는 비즈윙(beeswing), 또는 이들의 조합물을 포함하고;
    b) 종이 생성물 또는 폐기물은 종이, 색소지, 적재지, 코팅지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 또는 제지용 펄프, 또는 이들의 조합물을 포함하며;
    c) 산림 생성물은 백양나무 목재, 파티클 보드, 목재 칩, 또는 톱밥, 또는 이들의 조합물을 포함하고; 그리고
    d) 일반 폐기물은 거름, 오수, 또는 왕겨, 또는 이들의 조합물을 포함하는, 바이오매스로부터 생성물을 생성하는 방법.
  49. 제41항 내지 제48항 중 어느 한 항에 있어서, 상기 바이오매스의 난분해성(recalcitrance)을 저감시키기 위하여 상기 미생물 또는 상기 효소 혼합물을 도입하기 전에 상기 바이오매스를 처리하는 단계를 더 포함하되, 상기 처리는 전자를 이용한 충격, 초음파처리, 산화, 열분해, 증기 폭발(steam explosion), 화학적 처리, 기계적 처리, 또는 동결 분쇄를 포함하는, 바이오매스로부터 생성물을 생성하는 방법.
  50. 제41항 내지 제49항 중 어느 한 항에 있어서, 상기 바이오매스-분해 효소를 생산하는 미생물은, 바실러스(Bacillus), 코프리누스(Coprinus), 마이셀리오프토라(Myceliophthora), 세팔로스포륨(Cephalosporium), 사이탈리듐(Scytalidium), 페니실륨(Penicillium), 아스페르길루스(Aspergillus), 슈도모나스(Pseudomonas), 후미콜라(Humicola), 푸사륨(Fusarium), 티엘라비아(Thielavia), 아크레모늄(Acremonium), 크리소스포륨(Chrysosporium) 또는 트리코더마(Trichoderma)로부터 선택된 속 내의 종으로부터 유래되는, 바이오매스로부터 생성물을 생성하는 방법.
  51. 제41항 내지 제50항 중 어느 한 항에 있어서, 상기 바이오매스-분해 효소를 생산하는 미생물은 아스페르길루스(Aspergillus), 후미콜라 인솔렌스(Humicola insolens)(사이탈리듐 써모필룸(Scytalidium thermophilum)), 코프리누스 시네레우스(Coprinus cinereus), 푸사륨 옥시스포룸(Fusarium oxysporum), 마이셀리오프토라 써모필라(Myceliophthora thermophila), 메리필루스 기간테우스(Meripilus giganteus), 티엘라비아 테레스트리스(Thielavia terrestris), 아크레모늄 페르시시넘(Acremonium persicinum), 아크레모늄 아크레모늄(Acremonium acremonium), 아크레모늄 브라키페늄(Acremonium brachypenium), 아크레모늄 디클로모스포룸(Acremonium dichromosporum), 아크레모늄 오브클라바툼(Acremonium obclavatum), 아크레모늄 핀커토니애(Acremonium pinkertoniae), 아크레모늄 로세오그리세움(Acremonium roseogriseum), 아크레모늄 인콜로라툼(Acremonium incoloratum), 아크레모늄 푸라툼(Acremonium furatum), 크리소스포륨 룩노웬스(Chrysosporium lucknowense), 트리코더마 비리데(Trichoderma viride), 트리코더마 리세이(T. reesei) 또는 트리코더마 코닌기(Trichoderma koningii)로부터 선택되는, 바이오매스로부터 생성물을 생성하는 방법.
  52. 제41항 내지 제51항 중 어느 한 항에 있어서, 상기 미생물은 미유도 미생물에 비해서 바이오매스-분해 효소의 생산을 증가시키기에 적합한 조건 하에서 상기 미생물을 유도 바이오매스 샘플과 배합함으로써 바이오매스-분해 효소를 생산하도록 유도된, 바이오매스로부터 생성물을 생성하는 방법.
  53. 제52항에 있어서, 상기 유도 바이오매스 샘플은 종이, 종이제품, 폐지, 제지용 펄프, 색소지, 적재지, 코팅지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 목면, 목재, 파티클 보드, 산림 폐기물, 톱밥, 백양나무 목재, 목재 칩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 농업 폐기물, 사일리지, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 황마, 대마, 아마, 대나무, 사이잘마, 마닐라삼, 옥수수 속대, 옥수수 겉대, 대두 여물, 옥수수 섬유, 알팔파, 건초, 코코넛 헤어, 당 가공처리 잔류물, 버개스, 사탕무우박, 용설란 버개스, 해조류, 해초, 거름, 오수, 왕겨, 농업 또는 산업 폐기물, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 또는 이들의 임의의 조합물을 포함하는, 바이오매스로부터 생성물을 생성하는 방법.
KR1020177003329A 2014-08-08 2015-08-07 아글리코실화된 효소 및 이의 용도 KR20170040246A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462035346P 2014-08-08 2014-08-08
US62/035,346 2014-08-08
PCT/US2015/044136 WO2016022878A1 (en) 2014-08-08 2015-08-07 Aglycosylated enzyme and uses thereof

Publications (1)

Publication Number Publication Date
KR20170040246A true KR20170040246A (ko) 2017-04-12

Family

ID=55264604

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177003329A KR20170040246A (ko) 2014-08-08 2015-08-07 아글리코실화된 효소 및 이의 용도

Country Status (16)

Country Link
US (2) US10131894B2 (ko)
EP (1) EP3177719A4 (ko)
JP (1) JP2017524363A (ko)
KR (1) KR20170040246A (ko)
CN (1) CN106536730A (ko)
AP (1) AP2016009640A0 (ko)
AU (1) AU2015300897A1 (ko)
BR (1) BR112017002391A2 (ko)
CA (1) CA2955960A1 (ko)
CU (1) CU20170011A7 (ko)
EA (1) EA201790054A1 (ko)
IL (1) IL250272A0 (ko)
MX (1) MX2017001596A (ko)
PH (1) PH12016502604A1 (ko)
SG (1) SG11201610894UA (ko)
WO (1) WO2016022878A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3177719A4 (en) 2014-08-08 2018-04-04 Xyleco, Inc. Aglycosylated enzyme and uses thereof

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5028515B2 (ko) 1971-09-30 1975-09-16
US5997913A (en) * 1990-12-10 1999-12-07 Genencor International, Inc. Method enhancing flavor and aroma in foods by overexpression of β-glucosidase
ES2272333T3 (es) 1999-11-19 2007-05-01 Yissum Research Development Company Of The Hebrew University Of Jerusalem Procedimiento para aumentar el nivel de una sustancia de fermentacion.
US6946277B2 (en) 2001-01-31 2005-09-20 Council Of Scientific And Industrial Research Method for enhancing cellobiase activity of termitomyces clypeatus using a glycosylation inhibitor
FI120045B (fi) * 2005-12-22 2009-06-15 Roal Oy Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit
BRPI0714870A2 (pt) 2006-07-21 2013-05-28 Novozymes Inc mÉtodo para produzir um polipeptÍdeo secretado tendo atividade biolàgica, proteÍna de fusço isolada, polinucleotÍdeo isolado, construÇço de proteÍna de fusço, vetor de expressço, cÉlula hospedeira féngica, mÉtodos para degradar ou conventer um material celulàsico e para produzir uma substÂncia
US8318453B2 (en) 2006-07-21 2012-11-27 Xyleco, Inc. Conversion systems for biomass
EP2037274A1 (de) * 2007-09-11 2009-03-18 GALAB Technologies GmbH Lektinbasierter Glykan-Assay
FR2935986B1 (fr) * 2008-09-12 2012-11-23 Inst Francais Du Petrole Variants de beta-glucosidase a activite amelioree et leurs utilisations.
MX2011012456A (es) 2009-05-20 2012-01-12 Xyleco Inc Procesar materiales conteniendo hidrocarburo.
CN102844429B (zh) * 2009-11-20 2015-11-25 丹尼斯科美国公司 具有改善的特性的β-葡萄糖苷酶I变体
WO2012012297A1 (en) 2010-07-19 2012-01-26 Xyleco, Inc. Processing biomass
SG10201509880SA (en) 2010-10-20 2016-01-28 Xyleco Inc Method for treating lignocellulosic material by irradiating with an electron beam
US20140073017A1 (en) * 2011-03-17 2014-03-13 Danisco Us Inc. Cellulase compositions and methods of using the same for improved conversion of lignocellulosic biomass into fermentable sugars
IN2014MN00989A (ko) 2011-12-22 2015-04-24 Xyleco Inc
FR2994981B1 (fr) 2012-09-05 2014-09-12 Centre Nat Rech Scient Polypeptide a activite beta-glucosidase renforcee a basse temperature
EP2929028A1 (en) 2012-12-07 2015-10-14 Novozymes A/S Method for generating site-specific mutations in filamentous fungi
EP3177719A4 (en) * 2014-08-08 2018-04-04 Xyleco, Inc. Aglycosylated enzyme and uses thereof

Also Published As

Publication number Publication date
EP3177719A1 (en) 2017-06-14
WO2016022878A1 (en) 2016-02-11
AP2016009640A0 (en) 2016-12-31
JP2017524363A (ja) 2017-08-31
CN106536730A (zh) 2017-03-22
IL250272A0 (en) 2017-03-30
US20190024068A1 (en) 2019-01-24
MX2017001596A (es) 2017-05-15
PH12016502604A1 (en) 2017-04-24
CA2955960A1 (en) 2016-02-11
EP3177719A4 (en) 2018-04-04
US20170137797A1 (en) 2017-05-18
BR112017002391A2 (pt) 2017-11-28
SG11201610894UA (en) 2017-01-27
CU20170011A7 (es) 2017-08-08
AU2015300897A1 (en) 2017-01-05
US10131894B2 (en) 2018-11-20
EA201790054A1 (ru) 2017-07-31

Similar Documents

Publication Publication Date Title
US9914946B2 (en) Polypeptides having xylanase activity and polynucleotides encoding same
CA2807702C (en) Use of glycoside hydrolase 61 family proteins in processing of cellulose
US11168315B2 (en) Expression of beta-glucosidases for hydrolysis of lignocellulose and associated oligomers
US9260705B2 (en) Cellobiohydrolase variants
CA2778998A1 (en) Heterologous expression of fungal cellobiohydrolase 2 genes in yeast
US20190316108A1 (en) Solubilized enzyme and uses thereof
US20190024068A1 (en) Aglycosylated enzyme and uses thereof
CN110997701A (zh) 具有海藻糖酶活性的多肽以及编码其的多核苷酸
CN111094562A (zh) 具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途
CA2981059A1 (en) Compositions for enhanced enzyme production
WO2018069499A1 (en) Method for processing lignocellulosic biomass
OA18211A (en) Aglycosylated enzyme and uses thereof.
OA18252A (en) Solubilized enzyme and uses thereof.