KR20170060056A - 가용화된 효소 및 이의 용도 - Google Patents

가용화된 효소 및 이의 용도 Download PDF

Info

Publication number
KR20170060056A
KR20170060056A KR1020177010147A KR20177010147A KR20170060056A KR 20170060056 A KR20170060056 A KR 20170060056A KR 1020177010147 A KR1020177010147 A KR 1020177010147A KR 20177010147 A KR20177010147 A KR 20177010147A KR 20170060056 A KR20170060056 A KR 20170060056A
Authority
KR
South Korea
Prior art keywords
gly
ser
ala
thr
biomass
Prior art date
Application number
KR1020177010147A
Other languages
English (en)
Inventor
마샬 메도프
나타샤 크레더
제임스 린치
션 랜드리
아이치로 요시다
데지레 팡길리난
토마스 크레이그 마스터맨
Original Assignee
질레코 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 질레코 인코포레이티드 filed Critical 질레코 인코포레이티드
Publication of KR20170060056A publication Critical patent/KR20170060056A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Processing Of Solid Wastes (AREA)

Abstract

본 발명은 봉입체로부터 가용화되는 바이오매스-분해활성을 지니는 폴리펩타이드 또는 복수의 폴리펩타이드를 포함하고 바이오매스-분해 활성을 지니는 혼합물, 및 이를 제조하고 이용하는 방법에 관한 것이다. 본 명세서에 기재된 본 발명은 숙주 세포로부터 단리될 수 있는 바이오매스-분해 활성을 지니는 재조합 단백질의 수율을 증가시키기 위한 방법을 제공한다.

Description

가용화된 효소 및 이의 용도{SOLUBILIZED ENZYME AND USES THEREOF}
관련 출원
본 출원은 2014년 9월 26일자로 출원된 미국 가출원 제62/055,702호의 유익을 주장하며, 이 기초 출원의 전체 내용은 참고로 본 명세서에 편입된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하고, 이 서열 목록은 그의 전문이 참고로 본 명세서에 편입된다. 2015년 9월 1일자로 작성된 상기 ASCII 사본은 X2002-7003WO_SL.txt란 명칭이고 그 크기가 76,946 바이트이다.
발명의 기술분야
본 발명은 일반적으로 봉입체(inclusion body)로부터 가용화된 바이오매스-분해활성을 지니는 폴리펩타이드를 포함하고 바이오매스-분해 활성을 지니는 혼합물, 및 본 명세서에 기재된 혼합물을 제조하는 방법에 관한 것이다 본 발명은 또한 이러한 혼합물을 이용하는 방법, 예를 들어 바이오매스 물질을 가공처리하는 방법을 제공한다.
바이오매스-분해 효소, 예컨대, 셀룰라제, 자일라나제 및 리그니나제는, 바이오매스, 예컨대, 공급원료의 분해에 중요하다. 셀룰로스 및 리그노셀룰로스 물질이 생산되고, 가공처리되어, 많은 용도에 대량으로 이용되고 있다. 이러한 재료는 종종 일단 사용되고 나면 쓰레기로서 폐기되거나, 또는 단순히 폐기물 재료, 예컨대, 오수(sewage), 버개스(bagasse), 톱밥 및 여물로 되는 것으로 여겨진다.
이. 콜라이(E. coli)와 같은 숙주 세포 내 재조합 단백질의 높은 수준의 발현은 숙주 세포 내에서 재조합 단백질의 불용성 응집체로의 축적을 초래한다. 이들 불용성 응집체는 봉입체라 지칭되고, 그리고 또한 기타 성분, 예컨대, 숙주 세포에 내재하는 단백질, 리보솜 성분, 핵산, 및 세포 찌꺼기(cellular debris)를 함유할 수 있다. 봉입체로부터 재조합 단백질의 가용화는 요소(urea) 등과 같은 고농도의 가용화제(solubilizing agent)에 의한 처리를 통해서 달성되며, 이러한 처리는 수소 결합 및 소수성 상호작용을 파괴한다. 그러나, 가용화제, 예컨대, 요소에 의한 처리는, 단백질의 변성 및 효소 활성의 손실을 초래할 수 있다. 따라서, 재조합 단백질의 봉입체 내로의 응집은 숙주 세포로부터 단리될 수 있는 효소적 활성을 지니는 재조합 단백질의 수율을 감소시킬 수 있다.
본 발명은, 요소와 같은 가용화제에 의해 봉입체로부터 가용화된 이종적으로 발현된 셀로비아제가 셀로비아제 활성을 보유한다는 놀라운 발견에 적어도 부분적으로 기초한다. 따라서, 이종적으로 발현된 셀로비아제, 또는 다른 바이오매스-분해 효소의 가용화를 위한 본 명세서에 기재된 방법은, 바이오매스-분해 활성을 지니는 이종적으로 발현된 효소의 수율을 예컨대 30 내지 40%만큼 증가시키는데 유용하다. 또한, 가용화된 바이오매스-분해 효소, 예컨대, 셀로비아제의 첨가로부터 가용화제, 예컨대, 요소의 존재는, 바이오매스를 당 생성물로 전환시키기 위한 당화 반응 및/또는 생성물의 수율에 악영향을 미치지 않는다.
따라서, 일 양상에 있어서, 본 개시내용은 바이오매스-분해 활성을 지니는 폴리펩타이드 또는 복수의 폴리펩타이드와 가용화제, 예컨대, 요소를 포함하는 혼합물을 특징으로 하며, 여기서 폴리펩타이드 또는 이의 복수개는 천연 폴리펩타이드에 비해서 적어도 8 내지 10%의 바이오매스-분해 활성을 지닌다.
일 실시형태에 있어서, 혼합물은 봉입체와 연관된 1종 이상의 단백질을 더 포함한다. 대안적으로, 일 실시형태에 있어서, 혼합물은 봉입체와 연관된 1종 이상의 단백질을 포함하지 않는다. 일 실시형태에 있어서, 혼합물은 세포 찌꺼기, 1종 이상의 리보솜 성분, 1종 이상의 숙주 단백질, 예컨대, 숙주 세포에 의해 내생적으로 발현되는 단백질, 및/또는 숙주 핵산, 예컨대, DNA 및/또는 RNA를 더 포함한다.
일 실시형태에 있어서, 바이오매스-분해 활성은 셀로비아제 활성, 리그니나제 활성, 엔도글루카나제 활성, 셀로바이오하이드롤라제 활성 또는 자일라나제 활성이다.
일 실시형태에 있어서, 폴리펩타이드는 부분적으로 언폴딩되거나(unfolded), 부분적으로 미스폴딩되거나(misfolded) 또는 부분적으로 변성된다.
다른 양상에 있어서, 본 개시내용은 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 가진 폴리펩타이드 또는 복수의 폴리펩타이드 및 가용화제, 예컨대, 요소를 포함하는 혼합물을 특징으로 하되, 여기서 폴리펩타이드 또는 이의 복수개는 천연 폴리펩타이드, 예컨대, 서열번호 1 또는 트리코더마 리세이(T. reesei)로부터의 Cel3a의 활성의 적어도 20%를 갖는다. 예를 들어, 혼합물은 봉입체와 연관된 1종 이상의 단백질을 더 포함한다. 대안적으로, 혼합물은 봉입체와 연관된 1종 이상의 단백질을 포함하지 않는다. 혼합물은 하기 중 하나 이상을 더 포함할 수 있다: 세포 찌꺼기, 1종 이상의 리보솜 성분, 1종 이상의 숙주 단백질, 예컨대, 숙주 세포에 의해 내재적으로 발현되는 단백질, 및/또는 숙주 핵산, 예컨대, DNA 및/또는 RNA. 서열번호 1에 대해서 적어도 90%의 동일성을 가진 폴리펩타이드는 부분적으로 언폴딩될 수 있거나, 부분적으로 미스폴딩될 수 있거나 또는 부분적으로 변성될 수 있다.
일 실시형태에 있어서, 폴리펩타이드는 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함한다. 일 실시형태에 있어서, 폴리펩타이드는 트리코더마 리세이로부터의 Cel3A 효소, 또는 이의 기능적 변이체 또는 단편을 포함한다. 일 실시형태에 있어서, Cel3A 효소는 서열번호 1의 아미노산 서열을 포함한다(또는 이로 이루어진다). 일 실시형태에 있어서, 폴리펩타이드는 서열번호 2 또는 서열번호 3에 대해서 적어도 90%의 동일성을 포함하는(예컨대, 이로 이루어진) 핵산 서열에 의해 암호화된다.
일 실시형태에 있어서, 폴리펩타이드는 아글리코실된다.
일 실시형태에 있어서, 가용화제, 예컨대, 요소는 0.2M 내지 6M의 농도에서 혼합물 중에 존재한다.
일 실시형태에 있어서, 혼합물은 바이오매스-분해 활성을 가진 적어도 1종의 추가의 폴리펩타이드 또는 바이오매스-분해 활성을 가진 1종 이상의 효소를 생산하는 미생물을 더 포함한다. 일 실시형태에 있어서, 추가의 폴리펩타이드는 리그니나제, 엔도글루카나제, 셀로바이오하이드롤라제, 셀로비아제 및 자일라나제, 또는 이들의 임의의 조합으로부터 선택된다. 일 실시형태에 있어서, 추가의 폴리펩타이드는,
a. 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함하는 폴리펩타이드;
b. 트리코더마 리세이로부터의 Cel3A 효소, 또는 이의 기능적 변이체 또는 단편; 또는
c. 서열번호 2 또는 서열번호 3을 포함하는(예컨대, 이로 이루어진) 핵산 서열에 의해 암호화된 폴리펩타이드로부터 선택된다.
일 실시형태에 있어서, 추가의 폴리펩타이드는 아글리코실화된다.
일 실시형태에 있어서, 추가의 폴리펩타이드는 글리코실화된다.
일 양상에 있어서, 본 개시내용은 바이오매스-분해 활성을 지니는 폴리펩타이드, 봉입체와 연관된 1종 이상의 단백질 및 가용화제, 예컨대, 요소를 포함하는 본 명세서에 기재된 혼합물을 제조하는 방법을 특징으로 하되, 여기서 상기 방법은 바이오매스-분해 활성을 지니는 폴리펩타이드를 발현하는 세포, 또는 이의 용해물을, 폴리펩타이드를 가용화시키는데 적합한 농도의 가용화제, 예컨대, 요소와 접촉시키는 단계를 포함한다. 일 실시형태에 있어서, 상기 방법은 세포를 용해시켜 용해물을 얻는 단계, 용해물의 불용성 분획으로부터 가용성 분획을 분리하는 단계, 및 불용성 분획을 가용화제, 예컨대, 요소에 재현탁시키는 단계를 더 포함한다. 일 실시형태에 있어서, 가용화제, 예컨대, 요소의 농도는 0.2M 내지 6M, 예컨대, 6M이다.
일 실시형태에 있어서, 바이오매스-분해 활성은 셀로비아제 활성, 리그니나제 활성, 엔도글루카나제 활성, 셀로바이오하이드롤라제, 또는 자일라나제 활성이다.
일 실시형태에 있어서, 폴리펩타이드는 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함한다. 일 실시형태에 있어서, 폴리펩타이드는 트리코더마 리세이로부터의 Cel3A, 또는 이의 기능적 변이체 또는 단편을 포함한다.
일 실시형태에 있어서, 폴리펩타이드는 아글리코실화된다.
일 양상에 있어서, 본 개시내용은, 폴리펩타이드를 세포 중에서 발현시키는 단계 및 세포 또는 이의 용해물을 폴리펩타이드를 가용화시키는데 적합한 농도의 가용화제, 예컨대, 요소와 접촉시키는 단계를 포함하는, 바이오매스-분해 활성을 지니는 폴리펩타이드를 생성하는 방법을 특징으로 한다.
다른 양상에 있어서, 본 개시내용은, 바이오매스-분해 활성을 지니는 적어도 하나의 폴리펩타이드를 생성하도록 유전자 변형된 세포를 제공하는 단계(여기서 상기 바이오매스-분해 활성을 지니는 폴리펩타이드의 적어도 일부는 봉입체 내에서 발견됨), 및 봉입체를 함유하는 세포 또는 이의 용해물을, 폴리펩타이드를 가용화시키는데 적합한 농도의 가용화제, 예컨대, 요소와 접촉시키는 단계를 포함하는, 바이오매스-분해 활성을 지니는 폴리펩타이드를 생성하는 방법을 특징으로 한다.
일 실시형태에 있어서, 본 명세서에 개시된 방법은 세포를 용해시켜 용해물을 얻는 단계, 용해물의 불용성 분획으로부터 가용성 분획을 분리하는 단계, 및 불용성 분획을 가용화제, 예컨대, 요소에 재현탁시키는 단계를 더 포함한다. 일 실시형태에 있어서, 가용화제, 예컨대, 요소의 농도는 0.2M 내지 6M, 예컨대, 6M이다.
일 실시형태에 있어서, 바이오매스-분해 활성은 셀로비아제 활성, 리그니나제 활성, 엔도글루카나제 활성, 셀로바이오하이드롤라제 활성, 또는 자일라나제 활성이다.
일 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함한다(예컨대, 이로 이루어진다). 일 실시형태에 있어서, 아글리코실화된 폴리펩타이드는 트리코더마 리세이로부터의 Cel3A, 또는 이의 기능적 변이체 또는 단편을 포함한다.
일 실시형태에 있어서, 세포는 원핵세포/박테리아 세포, 예컨대, 이. 콜라이 세포, 예컨대, 오리가미(Origami) 이. 콜라이 세포이다.
하나의 실시형태에 있어서, 폴리펩타이드는 아글리코실된다.
일 양상에 있어서, 본 개시내용은, 바이오매스를, 생성물의 생성에 적합한 조건 하에, 바이오매스-분해 활성을 지니는 폴리펩타이드, 봉입체와 연관된 1종 이상의 단백질, 및 가용화제, 예컨대, 요소를 포함하는 본 명세서에 기재된 혼합물과, 그리고 임의로, 1종 이상의 바이오매스-분해 효소를 생산하는 미생물 및/또는 바이오매스-분해 효소를 포함하는 효소 혼합물과 접촉시키는 단계를 포함하는, 바이오매스로부터 생성물(예컨대, 수소, 당, 알코올)을 생산하는(또는 바이오매스를 생성물로 전환시키는) 방법을 특징으로 한다.
일 실시형태에 있어서, 상기 방법은, 바이오매스를, 바이오매스-분해 활성을 지니는 폴리펩타이드, 봉입체와 연관된 1종 이상의 단백질, 및 가용화제, 예컨대, 요소를 포함하는 본 명세서에 기재된 혼합물과 접촉시키기 전에 바이오매스를 전자빔으로 처리하는 단계를 더 포함한다.
일 실시형태에 있어서, 생성물은 당 생성물이다. 일 실시형태에 있어서, 당 생성물은 글루코스 및/또는 자일로스이다.
일 실시형태에 있어서, 상기 방법은 생성물을 단리시키는 단계를 더 포함한다. 일 실시형태에 있어서, 생성물을 단리시키는 단계는 석출, 결정화, 크로마토그래피, 원심분리 및/또는 추출을 포함한다.
하나의 실시형태에 있어서, 효소 혼합물은 B2AF03, CIP1, CIP2, Cel1a, Cel3a, Cel5a, Cel6a, Cel7a, Cel7b, Cel12a, Cel45a, Cel74a, paMan5a, paMan26a, 스월레닌(Swollenin)으로부터 선택된 효소의 적어도 2종을 포함한다.
하나의 실시형태에 있어서, 바이오매스는 전분 물질, 사탕수수, 농업 폐기물, 종이, 종이제품, 폐지, 제지용 펄프, 색소지, 적재지(loaded paper), 코팅지, 충전 종이(filled papers), 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 목면, 목재, 파티클 보드, 산림 폐기물, 톱밥, 백양나무 목재, 목재 칩, 목초, 지팽이풀, 억새, 코드 그래스(cord grass), 리이드 카나리 그래스(reed canary grass), 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 농업 폐기물, 사일리지, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 황마, 대마, 아마, 대나무, 사이잘마, 마닐라삼, 옥수수 속대, 옥수수 겉대, 대두 여물, 옥수수 섬유, 알팔파, 건초, 코코넛 헤어, 당 가공처리 잔류물, 버개스, 사탕무우박, 용설란 버개스, 해조류, 해초, 거름, 오수, 왕겨, 농작물 또는 산업 폐기물, 아라카차(arracacha), 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 또는 이들의 임의의 조합물을 포함한다.
하나의 실시형태에 있어서, 바이오매스는 전분 물질 또는 셀룰로스 성분을 포함하는 전분 물질을 포함한다. 몇몇 실시형태에 있어서, 바이오매스는 농업 산물 또는 폐기물, 종이 제품 또는 폐기물, 임산물(forestry product), 또는 일반 폐기물, 또는 이들의 임의의 조합물 중 한 가지 이상을 포함하되; 여기서: a) 농업 산물 또는 폐기물은 사탕 수수 황마, 대마, 아마, 대나무, 사이잘마, 알팔파, 건초, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 옥수수 속대, 옥수수 겉대, 옥수수 섬유, 코코넛 헤어, 사탕무우박, 버개스, 대두 여물, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 또는 비즈윙(beeswing), 또는 이들의 조합물을 포함하고; b) 종이 제품 또는 폐기물은 종이, 색소지, 적재지, 코팅지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 또는 제지용 펄프, 또는 이들의 조합을 포함하며; c) 임산물은 백양나무 목재, 파티클 보드, 목재 칩, 또는 톱밥, 또는 이들의 조합을 포함하고; 그리고 d) 일반 폐기물은 거름, 오수 또는 왕겨, 또는 이들의 조합을 포함한다.
하나의 실시형태에 있어서, 방법은 바이오매스의 난분해성(recalcitrance)을 저감시키기 위하여 미생물 또는 효소 혼합물을 도입하기 전에 예컨대, 바이오매스를 전자를 이용한 충격, 초음파분해처리(sonication), 산화, 열분해, 증기 폭발, 화학적 처리, 기계적 처리, 및/또는 동결 분쇄에 의해 처리함으로써, 바이오매스를 처리하는 단계를 더 포함한다.
하나의 실시형태에 있어서, 바이오매스-분해 효소를 생산하는 미생물은, 바실러스(Bacillus), 코프리누스(Coprinus), 마이셀리오프토라(Myceliophthora), 세팔로스포륨(Cephalosporium), 사이탈리듐(Scytalidium), 페니실륨(Penicillium), 아스페르길루스(Aspergillus), 슈도모나스(Pseudomonas), 후미콜라(Humicola), 푸사륨(Fusarium), 티엘라비아(Thielavia), 아크레모늄(Acremonium), 크리소스포륨(Chrysosporium) 및 트리코더마(Trichoderma)로부터 선택된 속 내의 종으로부터 유래한다. 하나의 실시형태에 있어서, 바이오매스-분해 효소를 생산하는 미생물은 아스페르길루스(Aspergillus), 후미콜라 인솔렌스(Humicola insolens)(사이탈리듐 써모필룸(Scytalidium thermophilum)), 코프리누스 시네레우스(Coprinus cinereus), 푸사륨 옥시스포룸(Fusarium oxysporum), 마이셀리오프토라 써모필라(Myceliophthora thermophila), 메리필루스 기간테우스(Meripilus giganteus), 티엘라비아 테레스트리스(Thielavia terrestris), 아크레모늄 페르시시넘(Acremonium persicinum), 아크레모늄 아크레모늄(Acremonium acremonium), 아크레모늄 브라키페늄(Acremonium brachypenium), 아크레모늄 디클로모스포룸(Acremonium dichromosporum), 아크레모늄 오브클라바툼(Acremonium obclavatum), 아크레모늄 핀커토니애(Acremonium pinkertoniae), 아크레모늄 로세오그리세움(Acremonium roseogriseum), 아크레모늄 인콜로라툼(Acremonium incoloratum), 아크레모늄 푸라툼(Acremonium furatum), 크리소스포륨 룩노웬스(Chrysosporium lucknowense), 트리코더마 비리데(Trichoderma viride), 트리코더마 리세이(T. reesei) 또는 트리코더마 코닌기(Trichoderma koningii)로부터 선택된다.
하나의 실시형태에 있어서, 미생물은 미유도 미생물이 비해서 바이오매스-분해 효소의 생산을 증가시키기에 적합한 조건 하에서 상기 미생물을 유도 바이오매스 샘플과 배합함으로써 바이오매스-분해 효소를 생산하도록 유도되었다. 하나의 실시형태에 있어서, 유도 바이오매스 샘플은 전분 물질, 사탕수수, 종이, 종이제품, 폐지, 제지용 펄프, 색소지, 적재지(loaded paper), 코팅지, 충전 종이(filled papers), 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 목면, 목재, 파티클 보드, 산림 폐기물, 톱밥, 백양나무 목재, 목재 칩, 목초, 지팽이풀, 억새, 코드 그래스(cord grass), 리이드 카나리 그래스(reed canary grass), 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 농업 폐기물, 사일리지, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 황마, 대마, 아마, 대나무, 사이잘마, 마닐라삼, 옥수수 속대, 옥수수 겉대, 대두 여물, 옥수수 섬유, 알팔파, 건초, 코코넛 헤어, 당 가공처리 잔류물, 버개스, 사탕무우박, 용설란 버개스, 해조류, 해초, 거름, 오수, 왕겨, 농업 또는 산업 폐기물, 아라카차(arracacha), 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 또는 이들의 임의의 조합물을 포함한다.
하나의 실시형태에 있어서, 유도 바이오매스는 전분 물질 또는 셀룰로스 성분을 포함하는 전분 물질을 포함한다. 몇몇 실시형태에 있어서, 유도 바이오매스는 농업 산물 또는 폐기물, 종이 제품 또는 폐기물, 임산물, 또는 일반 폐기물, 또는 이들의 임의의 조합물 중 한 가지 이상을 포함하되; 여기서 a) 농업 산물 또는 폐기물은 사탕 수수, 황마, 대마, 아마, 대나무, 사이잘마, 알팔파, 건초, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 옥수수 속대, 옥수수 겉대, 옥수수 섬유, 코코넛 헤어, 사탕무우박, 버개스, 대두 여물, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 또는 비즈윙(beeswing), 또는 이들의 조합물을 포함하고; b) 종이 제품 또는 폐기물은 종이, 색소지, 적재지, 코팅지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 또는 제지용 펄프, 또는 이들의 조합물을 포함하며; c) 임산물은 백양나무 목재, 파티클 보드, 목재 칩, 또는 톱밥, 또는 이들의 조합물을 포함하고; 그리고 d) 일반 폐기물은 거름, 오수, 또는 왕겨, 또는 이들의 조합물을 포함한다.
일 실시형태에 있어서, 본 발명은 당업계에서 이용되는 현재의 방법에 비해 이점을 제공한다. 이러한 이점은 통상적으로 폐기될 불용성 효소에 대한 접근을 제공하는 것과, 효소 활성을 유지하는 바람직한 단백질의 수율을 증가시키는 것과, 보다 깨끗한 하류 가공처리용의 정제된 효소와, 유기체 선택(예컨대, 봉입체를 개발하는 성향으로 인해 사용으로 이전에 배제되었던 유기체의 이용 가능성 증가)을 포함한다.
도 1은 가용화된 Cel3a의 IMAC 정제의 결과를 나타내는 크로마토그램. 정제된 가용화된 Cel3a 피크는 화살표로 표시된다.
도 2는 IMAC 정제의 상이한 분획에서의 단백질을 나타내는 SDS-PAGE 겔의 사진. 레인 1은 분자량 표준을 나타낸다. 레인 2는 가용성 분획으로부터의 정제된 Cel3a를 나타낸 도면. 레인 3은 불용성 분획의 IMAC 정제로부터의 흐름을 나타낸 도면. 레인 4는 불용성 분획으로부터의 정제된 가용화된 Cel3a를 나타낸 도면.
도 3은 불용성 분획으로부터의 정제된 가용화된 Cel3a와 정제된 가용성 Cel3a의 셀로바이오스 활성을 비교한 그래프.
도 4는 정제된 가용성 Cel3a, 불용성 분획의 세척 분획 및 정제 없이 불용성 분획으로부터 가용화된 Cel3a의 셀로바이오스 활성을 비교한 그래프.
정의
달리 정의되지 않는 한, 본 명세서에서 이용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술 분야에서 통상의 기술을 가진 자(이하 당업자라 약칭함)가 통상적으로 이해하는 바와 같은 의미를 지닌다.
단수 형태의 용어는 관사의 문법적 대상체의 하나 또는 하나 초과(즉, 적어도 하나)를 지칭한다. 예로서, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미한다.
본 명세서에서 이용되는 바와 같은 용어 "아글리코실화"는, 분자가 그의 자연 환경에서 생성된 경우 부착된 글리칸을 가진 1개 이상의 부위에서 글리코실화되지 않은 분자, 예컨대, 폴리펩타이드를 지칭한다(즉, 이것은 글리코실레이트기에 부착되지 않은 하이드록실기 또는 다른 작용기를 포함한다). 몇몇 실시형태에 있어서, 아글리코실화 분자는 어떠한 부착된 글리칸도 갖지 않는다. 하나의 실시형태에 있어서, 분자는 그 분자가 글리코실화될 수 없도록 변경되었거나 돌연변이되었으며, 예컨대, 1개 이상의 글리코실화 부위가 글리칸이 글리코실화 부위에 부착될 수 없도록 돌연변이된다. 다른 실시형태에 있어서, 부착된 글리칸은, 예컨대, 효소 과정에 의해, 예컨대, 글리칸을 제거하거나 탈글리코실화 활성을 지니는 효소를 이용해서 인큐베이팅함으로써, 그 분자로부터 제거될 수 있다. 또 다른 실시형태에 있어서, 분자의 글리코실화는, 예컨대, 글리코실화 저해제(글리코실화 효소를 저해함)의 사용에 의해서 저해될 수 있다. 다른 실시형태에 있어서, 분자, 예컨대, 폴리펩타이드는, 글리코실화되지 않은 숙주 세포, 예컨대, 이. 콜라이에 의해 생성될 수 있다. 예를 들어, Cel3A 효소는, Cel3A 효소가 트리코더마 리세이에서 생산되지 않은 경우 그에 부착된 통상적으로 글리칸기를 가진 단백질 내의 하나 이상의 부위가 그 부위에서 부착된 글리칸을 갖지 않은 경우 아글리코실화된다.
본 명세서에서 이용되는 바와 같은 용어 "바이오매스"는, 임의의 비화석화된 유기물을 지칭한다. 각종 유형의 바이오매스는 식물 바이오매스(예컨대, 리그노셀룰로스 및 셀룰로스 바이오매스), 미생물 바이오매스, 동물 바이오매스(임의의 동물 부산물, 동물 폐기물 등) 및 도시 폐 바이오매스(제거된 금속 및 유리 등과 같은 재활용성을 가진 주거 및 및 광 상업적 쓰레기를 포함한다. 식물 바이오매스는 임의의 식물 기원 유기물질(목질 또는 비목질)을 지칭한다. 식물 바이오매스는 농작물 또는 식량작물(예컨대, 사탕수수, 사탕무 또는 옥수수 알갱이) 또는 이로부터의 추출물(예컨대, 사탕수수로부터의 당 및 옥수수로부터의 옥수수 전분), 농작물 폐기물 및 잔사, 예컨대, 옥수수 대, 밀짚, 볏짚, 사탕수수 버개스 등을 포함할 수 있지만 이들로 제한되는 것은 아니다. 식물 바이오매스는 목재, 목질 에너지 작물, 목재 폐기물 및 잔사, 예컨대, 침엽수림 벌목물, 나무껍질 폐기물, 톱밥, 종이 및 펄프 산업 폐 스트림, 목재 섬유 등을 추가로 포함하지만 이들로 제한되는 것은 아니다. 또한, 지팽이풀 등과 같은 목초 작물은 다른 식물 바이오매스 공급원으로서 대규모로 생산될 잠재성을 갖는다. 도시 지역에 대해서, 가장 가능성이 있는 식물 바이오매스 공급원료는 정원 폐기물(예컨대, 잔디 깍기한 잔사, 나뭇잎, 나무 깍기한 잔사 및 덤불) 및 야채 가공 폐기물을 포함한다.
본 명세서에서 이용되는 바와 같은 용어 "바이오매스 분해 효소"는, 본 명세서에 기재된 바이오매스 물질의 성분을 중간체 또는 최종 생성물로 파괴시키는 효소를 지칭한다. 예를 들어, 바이오매스-분해 효소는 적어도 리그니나제, 엔도글루칸카제, 셀로바이아제, 자일라나제 및 셀로바이오하이드롤라제를 포함한다. 바이오매스-분해 효소는 광범위한 미생물에 의해 생산되고, 그리고 트리코더마 리세이와 같은 미생물로부터 단리될 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "바이오매스 분해 활성"은 본 명세서에 기재된 바이오매스 물질의 성분들을 중간체 또는 최종 생성물로 파괴시키는 효소적 활성을 지칭한다. 바이오매스 분해 활성은 적어도 리그니나제 활성, 엔도글루카나제 활성, 셀로비아제 활성, 셀로바이오하이드롤라제 활성 및 자일라나제 활성을 포함한다. 예를 들어, 바이오매스 분해 활성을 지닌 폴리펩타이드는 트리코더마 리세이로부터의 Cel3a와 같은 셀로비아제이다.
본 명세서에서 이용되는 바와 같은 용어 "셀로비아제"는, 글루코스의 이량체, 삼량체, 사량체, 오량체, 육량체, 칠량체, 팔량체 또는 올리고머, 또는 글루코스와 자일로스의 올리고머를 글루코스 및/또는 자일로스의 가수분해를 촉매하는 효소를 지칭한다. 예를 들어, 셀로비아제는 셀로비오스 내 베타-1,4 결합을 촉매하여 2개의 글루코스 분자를 유리시키는 베타-글루코시다제이다.
본 명세서에서 이용되는 바와 같은 용어 "셀로비아제 활성"은, 베타-D-글루코스를 유리시키기 위하여, 셀로비오스의 글루코스로의 가수분해를 촉매하는, 예컨대, 베타-D-글루코스 잔기의 가수분해를 촉매하는 셀룰라제의 범주의 활성을 지칭한다. 셀로비아제 활성은 본 명세서에 기재된 검정에 따라서, 예컨대, 실시예 4에서 결정될 수 있다. 셀로비아제 활성의 1 단위는 [글루코스] g/ℓ/[Cel3a] g/ℓ/30분으로서 정의될 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "셀로바이오하이드롤라제"는, 셀로비오스 중 글리코사이드 결합을 가수분해시키는 효소를 지칭한다. 예를 들어, 셀로바이오하이드롤라제는 1,4-베타-D-굴루칸 셀로바이오하이드롤라제이고, 이것은 셀룰로스, 셀로올리고당, 또는 임의의 베타-1,4-결합된 글루코스 함유 중합체에서 1,4-베타-D-글루코사이드 연결의 가수분해를 촉매하여 그 중합체 사슬로부터 올리고당을 유리시킨다.
본 명세서에서 이용되는 바와 같은 용어 "셀로바이오하이드롤라제 활성"은, 셀룰로스 내의 글리코사이드 결합의 가수분해, 구체적으로는, 셀룰로스, 셀로올리고당류, 또는 임의의 베타-1,4-연결된 글루코스 함유 중합체 내의 1,4-베타-D-글루코사이드 연쇄의 가수분해를 촉매하여, 그 당류 사슬의 단부로부터, 예컨대, 그 사슬의 환원 또는 비환원 단부로부터 셀로바이오스를 유리시키는 효소의 활성을 지칭한다. 셀로바이오하이드롤라제 활성은 본 명세서에 기재된 검정에 따라서 결정될 수 있다. 셀로바이오하이드롤라제 활성의 1 단위는, 예를 들어, 기질(예컨대, 분당 기질(아비셀(Avicel))로부터 1μM 글루코스 당량을 유리시키는 효소의 양으로서 정의될 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "엔도글루카나제"는, 내부 β-1,4 글루코사이드 결합의 가수분해를 촉매하는 효소를 지칭한다. 예를 들어, 엔도글루카나제는, 셀룰로스, 셀룰로스 유도체(예컨대 카복시메틸 셀룰로스 및 하이드록시에틸 셀룰로스), 리케난, 시리얼 베타-D-글루칸 또는 자일로글루칸과 같은 혼합된 베타-1,3 글루칸에서의 베타-1,4 결합, 및 셀룰로스 성분을 함유하는 기타 식물에서의 1,4-베타-D-글리코사이드 연결의 엔도가수분해를 촉매하는, 엔도-1,4-(1,3;1,4)-베타-D-글루칸 4-글루카노하이드롤라제이다.
본 명세서에서 이용되는 바와 같은 용어 "엔도글루카나제 활성"은, 셀룰로스, 셀룰로스 유도체(예컨대 카복시메틸 셀룰로스 및 하이드록시에틸 셀룰로스), 리케난의 내부 글루코사이드 결합, 예컨대, 베타-1,4 글리코사이드 결합, 시리얼 베타-D-글루칸 또는 자일로글루칸과 같은 혼합된 베타-1,3 글루칸, 및 셀룰로스 성분을 함유하는 기타 식물에서의 베타-1,4 결합의 엔도가수분해를 촉매하는 효소의 활성을 지칭한다. 엔도글루카나제 활성은 본 명세서에 기재된 검정에 따라서 결정될 수 있다. 엔도글루카나제 활성의 1 단위는, 예를 들어, 분당 기질로부터 1μM만큼 환원 말단의 농도를 증가시키는 유리시키는 효소의 양으로서 정의될 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "효소 혼합물"은, 적어도 2종의 상이한 효소, 또는 2종의 상이한 효소의 변이체의 조합(예컨대, 효소의 글리코실화된 및 아글리코실화 버전)을 지칭한다. 여기서 지칭되는 효소 혼합물은 본 명세서에 기재된 셀로비아제 활성을 지닌 적어도 아글리코실화된 폴리펩타이드를 포함한다. 하나의 실시형태에 있어서, 효소 혼합물은 셀로비아제, 엔도글루카나제, 셀로바이오하이드롤라제, 리그니나제, 및/또는 자일라나제 중 1종 이상을 포함한다. 몇몇 실시형태에 있어서, 효소 혼합물은, 1종 이상의 효소를 발현하고 예컨대 분비하는 세포, 예컨대, 미생물을 포함한다. 예를 들어, 효소 혼합물은 본 명세서에 기재된 아글리코실화된 폴리펩타이드 및 세포, 예컨대, 1종 이상의 추가의 효소 및/또는 폴리펩타이드의 변이체를 발현하고 예컨대 분비하는 미생물을 포함할 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "봉입체"는, 이하 중 하나 이상을 함유하는, 미생물, 예컨대, 숙주 세포에 의해 생산된 불용성 응집체를 지칭한다: 이종적으로 발현된 폴리펩타이드, 예컨대, 바이오매스-분해 활성을 지닌 폴리펩타이드, 세포 찌꺼기, 1종 이상의 리보솜 성분, 숙주 세포로부터 내생적으로 발현되는 1종 이상의 단백질, 1종 이상의 핵산(예컨대, RNA 및/또는 DNA) 또는 이들의 임의의 조합. 봉입체는 통상 재조합 단백질의 높은 수준의 발현 동안 숙주 세포, 예컨대, 박테리아 세포에 존재한다. 봉입체 내에서 발견되는 이종적으로 발현된 폴리펩타이드는 부분적으로 언폴딩될(unfolded) 수 있거나, 부분적으로 미스폴딩될(misfolded) 수 있거나 또는 부분적으로 변성될 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "리그니나제"는, 예컨대, 산화 반응 등에 의해 식물의 세포벽에서 통상적으로 발견되는, 리그닌의 파괴를 촉매하는 효소를 지칭한다. 리그니나제는 리그닌-변형 효소, 리그닌 퍼옥시다제 및 라카제를 포함한다.
본 명세서에서 이용되는 바와 같은 용어 "리그니나제 활성"은 리그닌 및 리그닌-유사 중합체의 산화 반응에 의한 파괴를 촉매하는 효소의 활성을 지칭한다. 리그니나제 활성은 본 명세서에 기재된 검정에 따라서 결정될 수 있다.
용어 "핵산" 또는 "폴리뉴클레오타이드"는 호환 가능하게 사용되고, 단일- 또는 이중-가닥 형태의 데옥시리보핵산(DNA) 또는 리보핵산(RNA) 및 이들의 중합체를 지칭한다. 구체적으로 제한되지 않는 한, 이 용어는 참조 핵산으로서 유사한 결합 특성을 지니고 천연형 뉴클레오타이드와 유사한 방식으로 대사되는 천연 뉴클레오타이드의 공지된 유사체를 함유하는 핵산을 포함한다. 달리 나타내지 않는 한, 특정 핵산 서열은 또한 명백하게 나타낸 서열뿐만 아니라 그의 보존적으로 변형된 변이체(예컨대, 축퇴 코돈 치환), 대립 형질, 오쏘로그(ortholog), SNP, 및 상보적 서열을 암시적으로 포함한다. 구체적으로는, 축퇴 코돈 치환은, 하나 이상의 선택된(또는 모든) 코돈의 제3 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 발생시킴으로써 달성될 수 있다(Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985); 및 Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)).
본 명세서에서 이용되는 바와 같은 용어 "작동 가능하게 연결된"은, 제어 서열이 폴리펩타이드(DNA 서열에 의해 암호화됨)의 발현에 영향을 미치도록, 제어 또는 조절 서열이 폴리펩타이드를 암호화하는 핵산 서열에 대한 위치에 배치된다. 일 실시형태에 있어서, 제어 또는 조절 서열은 셀로비아제 활성을 지닌 폴리펩타이드를 암호화하는 핵산 서열의 상류에 있다. 일 실시형태에 있어서, 제어 또는 조절 서열은 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열의 하류에 있다.
용어 "펩타이드," "폴리펩타이드", 및 "단백질"은 호환 가능하게 사용되며, 그리고 펩타이드 결합에 의해 공유 연결된 아미노산 잔기로 구성된 화합물을 지칭한다. 단백질 또는 펩타이드는 적어도 2개의 아미노산을 함유해야 하고, 제한 없이, 단백질 또는 펩타이드 서열을 포함할 수 있는 최대 개수의 아미노산 상에 배치된다. 폴리펩타이드는 펩타이드 결합에 의해 서로 연결된 2개 이상의 아미노산을 포함하는 임의의 펩타이드 또는 단백질을 포함한다. "폴리펩타이드"는, 예를 들어, 특히, 생물학적으로 활성인 단편, 실질적으로 상동성 폴리펩타이드, 올리고펩타이드, 폴리펩타이드의 동종이량체, 이종이량체, 변이체, 변형된 폴리펩타이드, 유도체, 유사체, 융합 단백질을 포함한다. 폴리펩타이드는 천연 펩타이드, 재조합체 펩타이드, 또는 이들의 조합물을 포함한다. "복수의 폴리펩타이드"는 2개 이상의 폴리펩타이드, 예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200 또는 500개의 폴리펩타이드를 지칭한다.
본 명세서에서 이용되는 바와 같은 용어 "프로모터"는, 폴리뉴클레오타이드 서열의 특정 전사를 개시시키는데 요구되는, 세포의 합성기에 의해 인식된 또는 합성기에 의해 도입된 DNA 서열을 지칭한다.
본 명세서에서 호환 가능하게 사용되는 바와 같은 용어 "조절 서열" 또는 "제어 서열"은, 핵산 생성물의 발현을 위하여 요구되는 핵산 서열을 지칭한다. 몇몇 경우에, 이 서열은 프로모터 서열일 수 있고, 다른 경우에, 이 서열은 또한 인핸서 서열 및 유전자 산물의 발현을 위하여 요구되는 기타 조절 요소를 포함할 수 있다. 조절/제어 서열은, 예를 들어, 조절된 방식, 예컨대, 유도성 방식으로 핵산 생성물을 발현하는 것일 수 있다.
용어 "구성적" 프로모터는, 폴리펩타이드를 암호화하는 폴리뉴클레오타이드와 작동 가능하게 연결된 경우, 세포의 거의 또는 모든 생리적 조건 하에서 세포에서 폴리펩타이드를 생성시키는 뉴클레오타이드 서열을 지칭한다. 일 실시형태에 있어서, 폴리펩타이드는 셀로비아제 활성을 지닌 폴리펩타이드이다.
[001] 용어 "유도성" 프로모터는, 폴리펩타이드를 암호화하는 폴리뉴클레오타이드와 작동 가능하게 연결된 경우, 프로모터에 대응하는 인듀서(inducer)가 세포에 존재할 경우에만 실질적으로 세포 내에서 폴리펩타이드를 생성시키는 뉴클레오타이드 서열을 지칭한다. 일 실시형태에 있어서, 폴리펩타이드는 셀로비아제 활성을 지닌 폴리펩타이드이다.
용어 "억제성" 프로모터는, 폴리펩타이드를 암호화하는 폴리뉴클레오타이드와 작동 가능하게 연결된 경우, 프로모터에 대응하는 리프레서(repressor)가 세포에 존재할 경우에만 실질적으로 세포 내에서 폴리펩타이드를 생성시키는 뉴클레오타이드 서열을 지칭한다. 일 실시형태에 있어서, 폴리펩타이드는 셀로비아제 활성을 지닌 폴리펩타이드이다.
용어 "가용화제"는 비공유 결합, 예컨대, 수소 결합, 소수성 상호작용, 반데르발스 상호작용, 쌍극자-쌍극자 상호작용, 이온성 상호작용, 파이-스태킹(pi-stacking) 또는 이들의 임의의 조합을 파괴하기 위한 능력을 가진 제제를 지칭한다. 비공유 결합의 파괴는 이전에 불용성인 물질의 용액으로의 가용화 또는 용해를 초래한다. 구체적으로는 본 명세서에서 사용되는 가용화제는 봉입체 내로 응집되어 용액, 예컨대, 수계 용액 또는 완충액으로 용해되는 본 명세서에 기재된 바이오매스-분해 활성을 지닌 폴리펩타이드의 능력을 증가시킨다. 적절한 가용화제의 예는 본 명세서에 기재되어 있다.
본 명세서에서 이용되는 바와 같은 용어 "자일라나제"는, 자일란-함유 물질을 가수분해시키는 효소를 지칭한다. 자일란은 자일로스의 단위를 포함하는 다당류이다. 자일라나제는 엔도자일라나제, 베타-자일로시다제, 아라비노푸라노시다제, 알파-글루쿠로니다제, 아세틸자일란 에스테라제, 페룰로일 에스테라제, 또는 알파-글루코로닐 에스테라제일 수 있다.
본 명세서에서 이용되는 바와 같은 용어 "자일라나제 활성"은, 자일란 및 자일란-유사 중합체 내 1,4-베타-D-자일로사이드 연쇄의 엔도가수분해를 촉매하는 효소의 활성을 지칭한다. 자일라나제 활성은 본 명세서에 기재된 검정에 따라서 결정될 수 있다. 자일라나제 활성의 1 단위는 분당 자일란으로부터 1μM의 자일란 당량을 유리시킬 것이다.
설명
이. 콜라이와 같은 숙주 세포 내 재조합 단백질의 높은 수준의 발현은 종종 숙주 세포 내에서 재조합 단백질의 불활성의, 미스폴딩된 그리고 불용성 응집체로의 축적을 초래한다. 이들 불용성 응집체는 봉입체라 지칭되고, 그리고 또한 숙주 세포에 내재하는 기타 성분, 예컨대, 단백질, 리보솜 성분, 핵산, 및 세포 찌꺼기를 함유할 수 있다. 재조합 수법에 의해 생산된 단백질의 70 내지 80%와 같은 많은 부분이 봉입체를 형성할 수 있고, 이에 따라서 숙주 세포로부터 용이하게 단리될 수 있는 활성 재조합 단백질의 수율을 상당히 저감시킬 수 있다.
봉입체로부터의 재조합 단백질의 가용화는, 수소 결합 및 소수성 상호작용을 파괴하는 카오트로픽 제제(chaotropic agent), 예컨대, 고농도의 요소에 의한 처리를 통해서 달성될 수 있다. 그러나, 이러한 가용화 공정은 종종 단백질의 변성 및 고유 기능 또는 효소 활성의 손실을 초래한다. 가용성의 변성된 단백질은 카오트로픽 제제의 제거 후에 그의 천연 상태로 재홀딩될 수 있지만, 효소 활성을 가진 생활성 형태로의 재조합 단백질의 재폴딩은 번잡하고 비용이 많이 들 수 있고, 결과적으로 최종 산물의 낮은 회수를 초래할 수 있다.
본 발명은, 요소에 의해 봉입체로부터 가용화된 이종적으로 발현된 셀로비아제가 셀로비아제 활성을 보유한다는 놀라운 발견에 적어도 부분적으로 기초한다. 봉입체로부터의 이종적으로 발현된 셀로비아제의 회수는 셀로비아제의 전체 수율을 30 내지 40%만큼 증가시켰다. 게다가, 가용화된 바이오매스-분해 효소, 예컨대, 셀로비아제의 첨가로부터의 가용화제, 예컨대, 요소의 존재는, 바이오매스를 당 생성물로 전환시키기 위한 당화 반응 및/또는 생성물의 수율에 악영향을 미치지 않는다.
따라서, 본 발명은 봉입체로부터 바이오매스-분해 활성을 지니는 폴리펩타이드를 가용화시키는 방법을 제공하되, 여기서 얻어지는 가용화된 폴리펩타이드는 바이오매스-분해 활성을 보유하며, 이에 의해서 폴리펩타이드를 재폴딩시키고 가용화제를 제거하는 부가적인 처리 단계들이 요구되지 않는다. 본 발명은, 효소 활성을 보유하면서, 봉입체로부터 이종적으로 발현된 바이오매스-분해 효소의 회수를 증가시키는 방법, 및 바이오매스를, 예컨대, 당화에 의해서 생성물로 전환시키는 방법에서의 회수된 바이오매스-분해 효소의 용도를 제공한다.
바이오매스 -분해 활성을 지니는 폴리펩타이드
본 개시내용은 바이오매스-분해 활성을 지니는 폴리펩타이드, 복수의 폴리펩타이드를 제공한다. 실시형태에 있어서, 바이오매스-분해 활성을 지니는 폴리펩타이드 또는 이의 복수개는 1종 이상의 가용화제와 혼합물로 존재한다. 몇몇 혼합물은 또한 봉입체와 연관된 1종 이상의 단백질을 함유할 수 있다. 다른 실시형태에 있어서, 혼합물은 봉입체와 연관된 1종 이상의 단백질을 함유하지 않으며, 예컨대, 바이오매스-분해 활성을 지니는 폴리펩타이드 또는 이의 복수개는 봉입체와 연관된 1종 이상의 단백질로부터 정제되었다.
예를 들어 폴리펩타이드는 셀로비아제 활성, 리그니나제 활성, 엔도글루카나제 활성, 셀로바이오하이드롤라제 활성 또는 자일라나제 활성을 지닌다.
일 실시형태에 있어서, 폴리펩타이드는 셀로비아제이다. 셀로비아제는 그의 기질, 예컨대, 셀로비오스에서 베타-1,4 결합을 가수분해시켜 2개의 글루코스 분자를 유리시키는 효소이다. 셀로비오스는 글루코스의 수 가용성 1,4-결합된 이량체이다. 일 실시형태에 있어서, 폴리펩타이드는 Cel3a이다. Cel3a(BglI로도 알려짐)는 트리코더마 리세이에서 확인된 셀로비아제이다. Cel3a(젠뱅크(GenBank) 수탁번호 NW_006711153)에 대한 아미노산 서열은 하기에 제공된다:
Figure pct00001
일 실시형태에 있어서, 폴리펩타이드는 리그니나제이다. 리그니나제는 식물 및 몇몇 해조류의 2차 세포벽의 일체 부분으로 역할하고 모노리그놀로서 알려진 방향족 알코올의 복합 중합체인 리그닌을 파괴시키는 효소이다. 리그니나제는 리그닌 퍼옥시다제, 1,2-비스(3,4-다이메톡시페닐)프로판-1,3-다이올:과산화수소 옥시도리덕타제, 다이아릴프로판 옥시게나제, 리그니나제 I, 다이아릴프로판 퍼옥시다제, LiP, 과산화수소 옥시도리덕타제(C-C-결합-절단), 및 몇몇 라카제를 포함한다. 리그니나제의 예는 트리코더마 리세이로부터의 CIP2; 파네로카에테 크리소스포륨(Phanerochaete chrysosporium)으로부터의 LPOA, GLG2, GLG4, LIPA, GLG5, GLG3, GLG6 및 LIPB; 펠비아 라디아타(Phelbia radiata)로부터의 리그니나제-3; 코리올루스 베르시컬러(Coriolus versicolor)로부터의 리그니나제 A 및 B; 및 코리올루스 베르시컬러로부터의 LPG I 및 LPGIV를 포함한다.
일 실시형태에 있어서, 폴리펩타이드는 엔도글루카나제이다. 엔도글루카나제는, 셀룰로스의 가수분해를 촉매하는 효소이다. 구체적으로는, 엔도글루카나제는 셀룰로스 사슬의 내부 결합을 절단한다. 엔도글루카나제는 진균, 박테리아 및 원생동물에 의해 생산된다. 엔도글루카나제는 또한 베타-1-4 엔도글루카나제, 4-베타-D-글루칸 셀로바이오하이드롤라제, 엑소-셀로바이오하이드롤라제, 베타-1,4-글루칸 셀로바이오하이드롤라제, 베타-1,4-글루칸 셀로바이오실하이드롤라제, 1,4-베타-글루칸 셀로바이오시다제, 엑소글루카나제, 아비셀라제, CBH 1, C1 셀룰라제, 셀로바이오하이드롤라제 I, 셀로바이오하이드롤라제, 엑소-베타-1,4-글루칸 셀로바이오하이드롤라제, 1,4-베타-D-글루칸 셀로바이오하이드롤라제, 또는 셀로바이오시다제로서 일려져 있다. 엔도글루카나제의 예는 트리코더마 리세이로부터의 Cel5A, Cel5B, Cel7B, Cel12A, Cel45A, Cel61A, Cel61B 및 Cel74A를 포함한다.
일 실시형태에 있어서, 폴리펩타이드는 엑소글루카나제라고도 알려진 셀로바이오하이드롤라제이다. 셀로바이오하이드롤라제는, 예컨대, 셀룰로스 및 셀로테트라오스를 연결하는 것을 함유하는 올리고당 내 1-4-베타-D-글루코사이드 연쇄의 가수분해를 촉매하고, 이에 따라서 사슬의 비환원 말단으로부터 셀로바이오스를 유리시킨다. 셀로바이오하이드롤라제의 예는 트리코더마 리세이로부터의 셀로바이오하이드롤라제 I(CBHI) 및 셀로바이오하이드롤라제 II(CBHII)를 포함한다.
일 실시형태에 있어서, 폴리펩타이드는 자일라나제이다. 자일라나제는 또한 엔도-(1-4)-베타-자일란 4-자일라노하이드롤라제, 엔도-1,4-자일라나제, 엔도-1,4-베타-자일라나제, 베타-1,4-자일라나제, 엔도-1,4-베타-D-자일라나제, 1,4-베타-자일란 자일라노하이드롤라제, 베타-자일라나제, 베타-1,4-자일란 자일라노하이드롤라제, 베타-D-자일라나제로 알려져 있다. 자일라나제는 헤미셀룰로스라 불리는 식물 세포벽의 성분을 파괴시키고, 예컨대, 자일로스를 유리시키기 위하여 다당류, 예컨대, 자일란, 예컨대, 베타-1,4-자일란, 글루코노자일란, 아라비노자일란, 글루코만난, 및 자일로글루칸을 분해시킨다. 자일라나제의 예는 트리코더마 리세이로부터의 Xyn1, Xyn2 및 Xyn3; 및 테렌디니박터 투네래(Terendinibacter turnerae) T7901로부터의 TERTU_1599, TERTU_3603, TERTU_2546 및 TERTU_4506을 포함한다.
본 개시내용은 또한 본 명세서에 기재된 바이오매스-분해 활성을 지닌 폴리펩타이드의 기능적 변이체를 제공한다. 일 실시형태에 있어서, 기능적 변이체는 본 명세서에 기재된 바이오매스-분해 효소에 대해서 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 지니거나 또는 이의 작용성 단편, 예컨대, 본 명세서에 기재된 바이오매스-분해 효소에 대해서 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 가진 아미노산 서열, 또는 이의 작용성 단편을 지닌 아미노산 서열을 갖는다.
일 실시형태에 있어서, 기능적 변이체는 트리코더마 리세이에 의해 생성된 Cel3a 또는 서열번호 1에 대해서 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%의 동일성, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 지니는 아미노산 서열 또는 이의 작용성 단편을 지닌다.
2개 이상의 아미노산 또는 핵산 서열의 맥락에서 동일성 퍼센트는, 동일한 2개 이상의 서열을 지칭한다. 2개의 서열은, 비교 창 또는 이하의 서열 비교 알고리즘들 중 하나를 사용해서 측정된 바와 같이 또는 수동 정렬 및 육안 검사에 의해 설계된 영역에 걸쳐서 최대 대응관계로 비교되고 정렬된 경우, 두 서열이 동일한 아미노산 잔기 또는 뉴클레오타이드의 특정 퍼센트(예컨대, 특정 영역에 걸쳐서 또는 특정되지 않은 경우에는, 전체 서열에 걸쳐서, 60%의 동일성, 임의로 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성)를 가진다면 "실질적으로 동일"하다. 임의로, 동일성은 적어도 약 50개의 뉴클레오타이드, 100개의 뉴클레오타이드, 150개의 뉴클레오타이드 길이인 영역에 걸쳐서 존재한다. 더욱 바람직하게는, 동일성은 적어도 약 200개 이상의 아미노산, 또는 적어도 약 500 또는 1000개 이상의 뉴클레오타이드 길이인 영역에 걸쳐서 존재한다.
서열 비교를 위하여, 하나의 서열은 전형적으로 참조 서열로서 작용하고, 이것과 하나 이상의 시험 서열이 비교된다. 서열 비교 알고리즘을 이용한 경우, 시험 서열과 참조 서열이 컴퓨터에 입력되고, 필요한 경우 하위서열 좌표가 지정되며, 서열 알고리즘 프로그램 파라미터가 지정된다. 디폴트 프로그램 파라미터가 이용될 수 있거나, 또는 대안적인 파라미터가 지정될 수 있다. 이어서 서열 비교 알고리즘은, 프로그램 파라미터에 기초하여, 참조 서열에 대해서 시험 서열에 대한 퍼센트 서열 동일성을 계산한다. 비교용의 서열의 정렬 방법은 당업계에 충분히 공지되어 있다. 비교용의 서열의 최적 정렬은, 예컨대, 문헌[Smith and Waterman, (1970) Adv. Appl. Math. 2:482c]의 로컬 상동성 알고리즘에 의해, 문헌[Needleman and Wunsch, (1970) J. Mol. Biol. 48:443]의 상동성 정렬 알고리즘에 의해, 문헌[Pearson and Lipman, (1988) Proc. Nat'l. Acad. Sci. USA 85:2444]의 유사성 방법에 대한 검색에 의해, 이들 알고리즘의 컴퓨터 구현(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI)에 의해, 또는 수동 정렬 및 육안 검사(예컨대, 문헌[Brent et al., (2003) Current Protocols in Molecular Biology] 참조)에 의해 수행될 수 있다.
퍼센트 서열 동일성 및 서열 유사성을 결정하는데 적합한 알고리즘의 두 예는 문헌[Altschul et al., (1977) Nuc. Acids Res. 25:3389-3402; 및 Altschul et al., (1990) J. Mol. Biol. 215:403-410]에 각각 기재된 BLAST 및 BLAST 2.0 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information)를 통해서 공개적으로 입수 가능하다.
기능적 변이체는, 당해 변이체가 효소가 기원되는 미생물에 의해 생산된 본 명세서에 기재된 바이오매스-분해 효소의 바이오매스-분해 활성보다 더 양호한 바이오매스-분해 활성을 보유하도록, 하나 이상의 돌연변이를 포함할 수 있다. 일 실시형태에 있어서, 기능적 변이체는 이. 콜라이에 의해 생산된 바와 같은 바이오매스-분해 효소로서 바이오매스-분해 활성의 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%)를 지닌다. 일 실시형태에 있어서, 기능적 변이체는 효소가 기원되는 미생물 또는 이. 콜라이에 의해 생산된 바이오매스-분해 효소로서 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 1000% 또는 그 이상의 바이오매스-분해 활성을 지닌다. 바이오매스-분해 활성은 본 명세서에 기재된 작용성 검정을 이용해서 시험될 수 있다. 일 실시형태에 있어서, 기능적 변이체는 트리코더마 리세이에 의해 생산된 바와 같은 Cel3a의 셀로비아제 활성보다 더 양호한 셀로비아제 활성을 보유한다. 다른 실시형태에 있어서, 기능적 변이체는 이. 콜라이에 의해 생산된 바와 같은 서열번호 1을 포함하는 효소 또는 Cel3a로서 셀로비아제 활성의 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%)를 지닌다. 일 실시형태에 있어서, 기능적 변이체는, 본 명세서에 기재된 바이오매스-분해 효소에 비해서 증가된 바이오매스-분해 활성, 예컨대, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 1000% 또는 그 이상의, 본 명세서에 기재된 바이오매스-분해 효소의 바이오매스-분해 활성 활성, 또는 효소가 기원되는 미생물 또는 이. 콜라이에 의해 생산된 서열번호 1을 포함하는 효소 또는 Cel3a로서의 셀로바이오스 활성을 지닌다.
기능적 변이체에 존재하는 돌연변이는 아미노산 치환, 부가 및 결실을 포함한다. 돌연변이는 당업계에 공지된 표준 수법, 예컨대, 부위-지향적 돌연변이 유발 및 PCR-매개 돌연변이 유발에 의해 도입될 수 있다. 돌연변이는 보존적 아미노산 치환일 수 있고, 여기서 아미노산 잔기는 유사한 곁사슬을 가진 아미노산 잔기로 교체된다. 유사한 곁사슬을 가진 아미노산 잔기의 패밀리는 당업계에 규정된 바 있다. 이들 패밀리는 염기성 곁사슬(예컨대, 라이신, 아르기닌, 히스티딘), 산성 곁사슬(예컨대, 아스파르트산, 글루탐산), 미대전된 극성 곁사슬(예컨대, 글리세린, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인, 트립토판), 비극성 곁사슬(예컨대, 알라닌, 발린, 류신, 아이소류신, 프롤린, 페닐알라닌, 메티오닌), 베타-분지된 곁사슬(예컨대, 트레오닌, 발린, 아이소류신) 및 방향족 곁사슬(예컨대, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 가진 아미노산을 포함한다. 따라서, 본 개시내용의 셀로비아제 활성을 지니는 폴리펩타이드 내의 하나 이상의 아미노산 잔기는 동일한 곁사슬 패밀리로부터 다른 아미노산으로 교체될 수 있고, 얻어진 폴리펩타이드는, 야생형 폴리펩타이드의 것과 견줄만한 셀로비아제 활성(예컨대, 적어도 80%, 85%, 90%, 95% 또는 99%의 셀로비아제 활성)을 보유한다. 대안적으로, 돌연변이는 아미노산 치환일 수 있고, 여기서 아미노산 잔기는 상이한 곁사슬을 가진 아미노산 잔기로 교체된다.
이러한 돌연변이는 바이오매스-분해 효소, 예컨대, 셀로비아제, 리그니나제, 엔도글루카나제 또는 셀로바이오하이드롤라제의 각종 효소 특징을 변화시키거나 영향을 미칠 수 있다. 예를 들어, 이러한 돌연변이는 바이오매스-분해 활성, 열안정성, 반응에 최적인 pH, 효소 카이네틱, 또는 바이오매스-분해의 기질 인식을 변화시키거나 영향을 미칠 수 있다. 몇몇 실시형태에 있어서, 돌연변이는 트리코더마 리세이에 의해 생산된 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 변이체의 셀로비아제 활성을 증가시킨다. 몇몇 실시형태에 있어서, 돌연변이는 야생형 바이오매스 분해 효소, 예컨대, 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 변이체의 열안정성을 증가 또는 감소시킨다. 일 실시형태에 있어서, 돌연변이는 변이체가 야생형 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 바이오매스-분해 반응을 최적으로 수행하는 pH 범위를 변화시킨다. 일 실시형태에 있어서, 돌연변이는 야생형 바이오매스-분해 효소, 예컨대, 야생형 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 바이오매스-분해 반응(예컨대, kcat, KM 또는 KD)의 카이네틱을 증가 또는 감소시킨다. 일 실시형태에 있어서, 돌연변이는 야생형 셀로비아제 및/또는 이. 콜라이에서 생산된 서열번호 1과 비교해서 기질(예컨대, 셀로비오스)을 인식하거나 이에 결합하는 셀로비아제의 능력을 증가 또는 감소시킨다.
본 발명은 또한 본 명세서에 기재된 바와 같은 바이오매스-분해 활성, 예컨대, 셀로비아제 활성을 지닌 폴리펩타이드, 예컨대, Cel3a 또는 서열번호 1의 작용성 단편을 제공한다. 당업자라면 효소 활성을 담당하는 작용성 도메인을 포함하는 본 명세서에 기재된 바이오매스-분해 활성을 지니는 폴리펩타이드의 단편이 작용성 활성, 예컨대, 바이오매스-분해 활성을 보유할 것으로 용이하게 상정할 수 있었으므로, 이러한 단편은 본 발명에 포함된다. 일 실시형태에 있어서, 작용성 단편은 적어도 700개의 아미노산, 적어도 650개의 아미노산, 적어도 600개의 아미노산, 적어도 550개의 아미노산, 적어도 500개의 아미노산, 적어도 450개의 아미노산, 적어도 400개의 아미노산, 적어도 350개의 아미노산, 적어도 300개의 아미노산, 적어도 250개의 아미노산, 적어도 200개의 아미노산, 적어도 150개의 아미노산, 적어도 100개의 아미노산, 또는 적어도 50개의 아미노산 길이이다. 일 실시형태에 있어서, 작용성 단편은 700 내지 744개의 아미노산, 650 내지 699개의 아미노산, 600 내지 649개의 아미노산, 550 내지 599개의 아미노산, 500 내지 549개의 아미노산, 450 내지 499개의 아미노산, 400 내지 449개의 아미노산, 350 내지 399개의 아미노산, 300 내지 349개의 아미노산, 250 내지 299개의 아미노산, 200 내지 249개의 아미노산, 150 내지 199개의 아미노산, 100 내지 149개의 아미노산, 또는 50 내지 99개의 아미노산이다. 위에서 기재된 아미노산 길이의 범위에 관하여, 아미노산 길이의 최저값 및 최고값은 각 개시된 범위 내에 포함된다. 일 실시형태에 있어서, 작용성 단편은 본 명세서에 기재된 야생형 바이오매스-분해 효소 또는 이. 콜라이에서 생산된 바이오매스-분해 효소로서 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%의 바이오매스-분해 활성을 지닌다. 일 실시형태에 있어서, 작용성 단편은 이. 콜라이에서 생산된 서열번호 1을 포함하는 폴리펩타이드 또는 야생형 Cel3a로서 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 99%의 셀로비아제 활성을 지닌다.
셀로비아제 활성을 검출하기 위한 검정법은 당업계에 공지되어 있다. 예를 들어, 셀로비오스로부터 유리된 글루코스의 양의 검출은 정제된 셀로비아제를 기질, 예컨대, 셀로비오스, D-(+)-셀로비오스와 함께 인큐베이팅하고, 반응 완결 후 얻어진 유리 글루코스의 양을 검출함으로써 결정될 수 있다. 유리 글루코스의 양은 당업계에 공지된 각종 방법을 이용해서 결정될 수 있다. 예를 들어, 정제된 셀로비아제의 희석물은 50mM 시트르산 나트륨, pH 5.0 NaOH를 함유하는 완충액에서 제조된다. 셀로비오스 기질은 반응 혼합물 중 셀로비오스의 최종 농도가 30mM이 되도록 하는 양으로 정제된 셀로비아제에 첨가된다. 반응 혼합물은, 예컨대, 48℃에서 30분 동안 진탕기(700 rpm)에서 일어나는 반응에 적합한 조건 하에 인큐베이팅된다. 이 반응을 중지시키기 위하여, 반응 혼합물은 100℃에서 5분 동안 가열된다. 반응 혼합물은 0.45㎛ 필터를 통해서 여과되고, 여과액은 글루코스 및/또는 셀로비아제의 양을 정량화하기 위하여 분석된다. 글루코스 등과 같은 분석물을 측정하는 YSI 기기가 이 반응으로부터 생성된 글루코스의 농도를 결정하는데 이용될 수 있다. 대안적으로, UPLC(초고성능 액체 크로마토그래피)는 이 반응으로부터 글루코스 및 셀로비오스의 농도를 결정하는데 이용될 수 있다. 이 검정은 단일 반응으로 또는 다중 반응 형식, 예컨대, 96 웰 형식으로 형식화될 수 있다. 몇몇 실시형태에 있어서, 다중 반응 형식은 정제된 셀로비아제의 상이한 농도에 관하여 셀로비아제 활성을 나타내는 활성 곡선을 생성하기 위하여 바람직할 수 있다. 정제된 셀로비아제의 농도는 표준 브래드포드 검정(Bradford assay)을 이용해서 결정될 수 있다. 정제된 셀로비아제 검정의 희석물, 예컨대, 2-배 희석물이 제조되고, 2배 희석물의 96 웰 플레이트, 예컨대, 12개의 웰에 분취된다. 셀로비오스 기질은 앞서 기재된 바와 같이 첨가되므로, 반응에서 셀로비아제의 최종 농도는 30mM이다. 플레이트는 밀봉되고, 셀로비아제 반응을 일으키는데 충분한 조건 하에서 처리되고, 이어서 반응을 중지시키기 위한 조건 하에서 처리된다. 이 반응물은 이어서 96 웰 형식 0.45㎛ 멤브레인(예컨대, 듀라포어(Durapore))을 통해서 여과되고, YSI 및/또는 HPLC 방법, 예컨대, UPLC에 의해 분석된다.
이 활성 검정은 또한 미지의 농도 샘플에 대한 농도를 외삽하기 위하여 기지의 농도의 셀로비아제의 표준 활성 곡선을 생성함으로써 미지의 농도의 샘플에서 셀로비아제의 농도 또는 역가를 결정하는데 이용될 수 있다. 예를 들어, 기지의 농도의 셀로비아제의 2배 연속 희석물은 96 웰 플레이트의 1열에, 예컨대, 12개의 2배 연속 희석물로 준비하였다. 다른 열은 역가가 예컨대 조질의 용해물 샘플 또는 가용화된 봉입체 샘플에 대해서 결정될 다른 나머지 샘플의 2배 연속 희석물을 수용한다. 희석물은 pH 5.0에서 50mM의 일염기성 시트르산나트륨 완충액 중 D-(+)-셀로비오스(플루카사) 기질 용액으로 48℃에서 30분 동안 인큐베이팅하였다. 30분 후, 샘플을 100℃로 10분 동안 가열하여 반응을 중지시킨다. 샘플은 YSI 생화학 분석기(YSI 라이프 사이언시스사(YSI Life Sciences)) 및/또는 HPLC 방법을 이용해서 글루코스 및 셀로비오스에 대해서 분석된다. 기지의 농도의 샘플을 이용해서, 표준 곡선은 선형 범위의 검정 범위 내에서 데이터 점들을 이용해서 생성하였다. 미지의 역가를 가진 샘플로부터 검출된 셀로비아제 활성은 표준 곡선과 비교하여 해당 샘플의 셀로비아제의 역가를 결정할 수 있다.
활성 단위는, 선형 범위의 검정 내의 값들을 계산한다면, 단지 상대적이다. 검정의 선형 범위는 원래의 가용성 기질 장입의 30% 미만인 글루코스 값을 이용해서 정의된다. 또한, 0.05g/ℓ 미만의 글루코스 값은 기기 보고 수준으로 인해 생략된다. 셀로비아제 활성이 하나의 단위는 30분 당 Cel3a의 양 당 글루코스의 양: [글루코스]g/ℓ / [Cel3a]g/ℓ / 30분으로서 정의된다.
다른 실시형태에 있어서, 비색/형광측정 검정이 이용될 수 있다. 정제된 셀로비아제는 반응이 일어나는 조건 하에서 기질 셀로비오스와 인큐베이팅된다. 생성물 글루코스의 검출은 다음과 같다. 글루코스 옥시다제는 혼합물에 첨가되어 글루코스(생성물)를 글루콘산 및 과산화수소로 산화시킨다. 퍼옥시다제 및 o-다이아니시딘이 이어서 첨가된다. O-다이아니시딘은 퍼옥시다제의 존재 중에서 과산화수소와 반응하여 착색된 생성물을 형성한다. 황산이 첨가되고, 이것은 산화된 o-다이아니시딘과 반응하여 더욱 안정적인 착색된 생성물을 형성한다. 예컨대, 분광광도계 또는 비색계에 의해, 예컨대, 540㎚에서 측정된 경우의 색의 강도는, 글루코스 농도에 직접 비례한다. 이러한 비색/형광측정 글루코스 검정법은, 예를 들어, 시그마 알드리치사(Sigma Aldrich)로부터 카탈로그 번호 GAGO-20으로 상업적으로 입수 가능하다.
리그니나제 활성을 검출하기 위한 검정법은 당업계에 공지되어 있다. 리그니나제 활성은 베라트릴 알코올의 베라트릴알데하이드로의 산화(베라트릴 알코올 산화(veratryl alcohol oxidation)에 대해서 VAO로 약칭함) 속도를 결정함으로써 측정될 수 있다. 반응 혼합물을 제조하고, 효소의 희석물, 2mM 베라트릴 알코올, 0.4mM H2O2 및 20 또는 100mM 주석산나트륨(pH 2.9)을 0.5㎖의 최종 용적으로 함유한다. 이 반응은 H2O2 첨가에 의해 개시하고, 310㎚에서의 분광법에 의해 모니터링하였다. 단백질은, 문헌[Bradford, M.M., (1976) Anal. Biochem. 72:248-254]에 따라서, 소 혈청 알부민(시그마 케미컬사(Sigma Chemical Co.), 미주리주의 세인트루이스시에 소재)을 표준으로 이용하거나 또는 단백질 용액의 409㎚ 흡광도를 이용해서 리그니나제의 소광 계수로부터 단백질의 양을 산출함으로써 결정되었다.
엔도글루카나제 활성을 검출하기 위한 검정법은 당업계에 공지되어 있다. 예를 들어, 엔도글루카나제 활성은 기질인 카복시메틸 셀룰로스(CMC)의 가수분해를 측정하고 BCA 방법(환원 단부의 총 농도가 환원 단부의 농도에 비례해서 샘플 용액의 색 변화에 의해 나타남)에 의해 환원 단부의 농도를 정량함으로써 결정될 수 있다. 우선, 바이오매스-분해 활성을 지니는 폴리펩타이드를 pH 4.8에서 50mM 인산염 완충액 중에 희석시킨다. CMC 용액(인산나트륨 완충액 중 0.05% w/v CMC)을 반응관에 첨가하고 50C에서 평형화시킨다. 희석된 효소 샘플을 이 반응에 첨가하고, 50C에서 10분 동안 인큐베이팅시킨다. BCA 시약을 첨가하고, 75C에서 30분 동안 인큐베이팅시킨다. 효소 블랭크 및 기질 블랭크에 대한 판독치를 차감한 후에 560㎚에서 흡광도를 판독한다. 효소 활성은 환원 단부 농도와 효소 농도 사이의 선형 범위에 기초하여 산출될 수 있다. 예를 들어, 기질 점도의 저감을 결정함으로써 다른 엔도글루카나제 활성 검정이 당업계에 공지되어 있다(Zhang et al., Biotechnol Adv, 2006, 24:452-481).
셀로바이오하이드롤라제 활성을 검출하기 위한 검정은 당업계에 공지되어 있다. 셀로바이오하이드롤라제 활성은 페놀-황산 검정에서 기질 아비셀로부터 유리된 가용성 기질을 측정함으로써 결정될 수 있다. 아비셀 용액(기질 중 1.25% w/v)을 반응관에 분취하고 효소의 희석액을 제조한다. 기질과 효소 용액 둘 다는 50C에서 평형화된다. 희석된 효소 용액을 기질에 첨가하고, 반응에 충분한 시간 동안, 예컨대, 50C에서 2시간 동안 인큐베이팅시킨다. 반응은 냉수욕에 샘플을 침지시킴으로써 정지된다. 샘플을 원심분리시켜 샘플을 가용성 분획과 불용성 분획으로 분리시킨다. 가용성 분획 중의 가용성 당의 총 농도는 페놀-황산 검정에 의해 결정된다. 구체적으로는, 가용성 분획의 분취액을 5% 페놀과 혼합하고 농축된 황산을 첨가한다. 이 반응물을 실온으로 (약 20 내지 30분) 냉각시키고 샘플의 흡광도를 490㎚에서 판독한다. 효소 활성은 총 가용성 당 유리량과 효소 희석액 간의 선형 관계에 기초하여 산출된다. 기타 셀로바이오하이드롤라제 활성 검정은 문헌[Zhang et al., Biofuels: Methods and Protocols, Vol. 581, pages 213-231]에 기재되어 있다.
자일라나제 활성을 검출하기 위한 검정은 당업계에 공지되어 있다. 자일라나제 활성은 비색 검정에 의해 자일란 기질로부터 유리된 자일로스의 수준을 측정함으로써 결정될 수 있다. 자일란 기질은 50mM 아세트산 나트륨 완충액 pH 4.5 중 1.0% w/v 용액으로서 제조된다. 효소의 희석액이 제조된다. 자일란 및 효소 희석액을 혼합하고 반응이 일어나기에 충분한 조건 하에서, 예컨대, 30C 10분 동안 인큐베이팅시킨다. 이어서 16mM 황산구리, 1.3M 황산나트륨, 226mM 탄산나트륨, 190 mM 중탄산나트륨 및 43mM 주석산나트륨칼륨을 함유하는 용액을 이 반응물에 첨가한다. 이어서 이 반응물을 10분 동안 끓이고, 실온으로 냉각시킨다. 40mM 몰리브덴산, 19mM 비산(arsenic acid) 및 756mM 황산을 함유하는 용액을 첨가한다. 이 반응물을 발포가 중지되어 존재하는 어떠한 석출물이라도 용해될 때까지 진탕시키거나 와류시킨다. 반응물을 투명하게 되도록 원심분리시키고 나서, 용액을 540nM에서 분광광도계에 의해 판독하고, 총 가용성 당 유리량과 효소 희석액 간의 선형 관계에 기초하여 효소 활성을 산출한다.
아글리코실화된 폴리펩타이드
본 명세서에 기재된 바이오매스-분해 활성을 지니는 폴리펩타이드들 중 어떤 것은 글리코실화될 수 있거나 아글리코실화될 수 있다. 아글리코실화된 바이오매스-분해 활성을 지니는 폴리펩타이드는 본 명세서에 기재된 바와 같이 봉입체로부터 가용화될 수 있다. 대안적으로, 아글리코실화된 바이오매스-분해 활성을 지니는 폴리펩타이드는 봉입체로부터 가용화된 바이오매스-분해 활성을 지니는 폴리펩타이드를 포함하는 혼합물에 첨가될 수 있고, 이때 봉입체로부터 가용화된 폴리펩타이드는 글리코실화될 수 있거나 아글리코실화될 수 있다.
글리코실화는 탄수화물이 글리코실 수용체, 예컨대, 아르기닌 또는 아스파르기닌 곁사슬의 질소, 또는 세린, 트레오닌 또는 티로신 곁사슬의 하이드록실 산소에 부착되는 효소 과정이다. 2가지 유형의 글리코실화, 즉, N-결합된 글리코실화 및 O-결합된 글리코실화가 있다. N-결합된 글리코실화는 공통 부위 Asn-X-Ser/Thr에서 일어나되, 여기서 X는 프롤린을 제외한 임의의 아미노산일 수 있다. O-결합된 글리코실화는 Ser/Thr 잔기에서 일어난다. 글리코실화 부위는, 당업계에 공지된 각종 알고리즘, 예컨대, 스위스 생명정보 연구소(Swiss Institute of Bioinformatics)에 의해 공개적으로 입수 가능한 프로사이트(Prosite), 및 생물학적 서열 분석 센터(Center for Biological Sequence Analysis)에 의해 공개적으로 입수 가능한 NetNGlyc 1.0 또는 NetOGlyc 4.0을 이용해서 예측될 수 있다.
본 발명은 바이오매스-분해 활성을 지니는 아글리코실화된 폴리펩타이드를 생성하는 방법을 제공한다. 하나의 실시형태에 있어서, 폴리펩타이드를 암호화하는 핵산은 그 폴리펩타이드가 글리코실화될 수 없도록 변경되거나 돌연변이되었으며, 예컨대, 1개 이상의 글리코실화 부위가 글리칸이 글리코실화 부위에 부착될 수 없도록 돌연변이된다. 예를 들어, 본 명세서에 기재된 핵산 서열에 의해 암화화된 바이오매스-분해 활성을 지니는 아글리코실화된 폴리펩타이드는 글리칸이 더 이상 글리코실화 부위에 부착되거나 연결되지 않을 수 있도록 돌연변이된 하나 이상의 글리코실화 부위에서 1개 이상의 돌연변이를 함유한다. 다른 예에 있어서, 본 명세서에 기재된 핵산에 의해 암호화된 바이오매스-분해 활성을 지니는 폴리펩타이드는, 글리칸이 글리코실화 부위에 더 이상 부착되거나 연결되지 않도록 돌연변이된 하나 이상의 글리코실화 부위에 근접한 하나 이상의 돌연변이를 함유한다. 예를 들어, 글리코실화 부위에 근접한 돌연변이는 글리코실화 효소에 의해 인식된 공통 모티프(consensus motif)를 돌연변이시키거나, 또는 폴리펩타이드가 글리코실화되지 않도록, 예컨대, 글리코실화 부위가 은폐되거나 또는 새로운 입체 형태로 인한 입체 장해가 글리코실화 효소가 글리코실화 부위에 접근하는 것을 방지하도록 폴리펩타이드의 입체 형태를 변화시킨다. 바이오매스-분해 활성을 지니는 폴리펩타이드에서 글리코실화 부위에 근접한 돌연변이는 글리코실화 부위에 직접 인접하거나, 또는 글리코실화 부위로부터 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 15, 적어도 20, 적어도 30 또는 적어도 40개의 아미노산이 있고, 이 근접 돌연변이의 결과로서 글리코실화되지 않을 것이다.
일 실시형태에 있어서, 셀로비아제, 예컨대, Cel3a, 또는 서열번호 1의 이하의 글리코실화 부위 중 하나 이상이 돌연변이된다: 아미노산 위치 78에서의 트레오닌, 아미노산 위치 241에서의 트레오닌, 아미노산 위치 343에서의 세린, 아미노산 위치 450에서의 세린, 아미노산 위치 599에서의 트레오닌, 아미노산 위치 616에서의 세린, 아미노산 위치 691에서의 트레오닌, 아미노산 위치 21에서의 세린, 아미노산 위치 24에서의 트레오닌, 아미노산 위치 25에서의 세린, 아미노산 위치 28에서의 세린, 아미노산 위치 38에서의 트레오닌, 아미노산 위치 42에서의 트레오닌, 아미노산 위치 303에서의 트레오닌, 아미노산 위치 398에서의 세린, 아미노산 위치 435에서의 세린, 아미노산 위치 436에서의 세린, 아미노산 위치 439에서의 트레오닌, 아미노산 위치 442에서의 트레오닌, 아미노산 위치 446에서의 트레오닌, 아미노산 위치 451에서의 세린, 아미노산 위치 619에서의 세린, 아미노산 위치 622에서의 세린, 아미노산 위치 623에서의 트레오닌, 아미노산 위치 626에서의 세린, 또는 아미노산 위치 630에서의 트레오닌 또는 이들의 임의의 조합. 실시형태들에 있어서, 글리코실화 부위는 세린 또는 트레오닌으로부터 알라닌으로 돌연변이된다. 예를 들어, 본 명세서에 기재된 아글리코실화된 폴리펩타이드는 이하의 돌연변이들 중 하나 이상을 갖는다: T78A, T241A, S343A, S450A, T599A, S616A, T691A, S21A, T24A, S25A, S28A, T38A, T42A, T303A, T398A, S435A, S436A, T439A, T442A, T446A, S451A, S619A, S622A, T623A, S626A 또는 T630A, 또는 이들의 임의의 조합. 대안적으로, 본 명세서에 기재된 글리코실화 부위에 근접한 하나 이상의 아미노산이 돌연변이된다.
폴리펩타이드가 글리칸에 의해 변형되는지의 여부(예컨대, 폴리펩타이드가 글리코실화되는지 또는 아글리코실화되는지의 여부)를 검출하는 검정법은 당업계에 공지되어 있다. 폴리펩타이드는 정제되거나 단리될 수 있고, 그리고 글리칸 모이어티의 검출 및 정량화를 위하여 염색될 수 있거나, 또는 폴리펩타이드는 질량 분광법에 의해 분석될 수 있고, 대응하는 참조 폴리펩타이드와 비교될 수 있다. 참조 폴리펩타이드는 시험 폴리펩타이드와 동일한 일차 서열(글리코실화 상태가 결정되어야 함)을 갖지만, 글리코실화되거나 또는 아글리코실화된다.
본 명세서에 기재된 아글리코실화된 폴리펩타이드는 대응하는 글리코실화 폴리펩타이드, 예컨대, 글라이코실화된 Cel3a 폴리펩타이드에 비해서 증가된 바이오매스-분해 활성, 예컨대, 셀로비아제 활성을 지닌다. 예를 들어, 바이오매스-분해 활성, 예컨대, 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드는 글리코실화된 폴리펩타이드에 비해서 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% 또는 200%의 바이오매스-분해 활성, 예컨대, 셀로비아제 활성을 지닌다.
핵산, 발현 벡터 및 숙주 세포
본 명세서에 기재된 바와 같은 바이오매스-분해 활성을 지니는 폴리펩타이드는 숙주 세포에서 발현된다. 일 실시형태에 있어서, 바이오매스-분해 활성을 지니는 본 명세서에 기재된 임의의 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 발현 벡터를 숙주 세포 내로 도입하고, 숙주 세포를 바이오매스-분해 활성을 지니는 폴리펩타이드의 발현에 적절한 조건 하에 배양시킨다. 실시형태에 있어서, 바이오매스-분해 활성을 지니는 폴리펩타이드의 발현은 바이오매스-분해 활성을 지니는 폴리펩타이드를 포함하는 응집체, 또는 봉입체가 형성되도록 하는 수준에 있다. 숙주 세포에서 발현된 바이오매스-분해 활성을 지니는 가용성 폴리펩타이드를 발현 및 단리시키는 방법이 또한 본 명세서에 기재되어 있다. 봉입체로부터 바이오매스-분해 활성을 지니는 폴리펩타이드를 가용화시키고 단리시키는 방법은 "봉입체로부터의 가용화"란 표제 부문에 더욱 기재된다.
본 발명은 또한 바이오매스-분해 활성을 지니는 폴리펩타이드를 암호화하는 핵산을 제공한다. 일 실시형태에 있어서, 핵산 서열은 본 명세서에 기재된 리그니나제, 엔도글루카나제, 셀로바이오하이드롤라제, 자일라나제 또는 셀로비아제를 암호화한다. 바이오매스-분해 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열은 숙주 세포 내에서 증가된 발현을 위하여 코돈-최적화될 수 있다. 코돈 최적화는, 숙주 내에서 암호화된 폴리펩타이드의 발현을 증가시키기 위하여, 코돈 사용빈도 편향(codon usage bias), 숨은 스플라이싱(cryptic splicing) 부위, mRNA 이차 구조, 조숙한 polyA 부위, 코돈과 안티코돈의 상호작용, 및 RNA 불안성 모티프를 포함하는 인자를 고려하도록 핵산 서열을 변경시키는 것을 포함한다. 코돈-최적화를 위한 각종 알고리즘 및 상업적 서비스가 당업계에 공지되어 있고 입수 가능하다.
일 실시형태에 있어서, 핵산 서열은 본 명세서에 기재된 아미노산 서열, 예컨대, 서열번호 1을 가진 트리코더마 리세이로부터의 Cel3a 효소를 암호화한다. 일 실시형태에 있어서, Cel3a를 암호화하는 핵산 서열은 이하에 제공된다:
Figure pct00002
Cel3a를 암호화하는 코돈-최적화된 핵산은 이하에 제공된다:
Figure pct00003
일 실시형태에 있어서, Cel3a 효소 또는 이의 기능적 변이체를 암호화하는 핵산 서열은 서열번호 2에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 포함한다. 일 실시형태에 있어서, Cel3a 효소 또는 이의 기능적 변이체를 암호화하는 핵산 서열은 서열번호 2 또는 서열번호 3에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 포함한다.
또한 본 명세서에서는, 본 명세서에 기재된 바이오매스-분해 활성을 지니는 아글리코실화된 폴리펩타이드, 예컨대, Cel3폴리펩타이드를 암호화하는 핵산 서열이 제공되되, 여기서 폴리펩타이드에 존재하는 하나 이상의 글리코실화 부위는 글리칸이 더 이상 글리코실화 부위에 부착되거나 연결되지 않을 수 있도록 돌연변이되었다. 다른 실시형태에 있어서, 위에서 기재된 바와 같이, 아글리코실화된 폴리펩타이드, 예컨대, Cel3폴리펩타이드를 암호화하는 본 명세서에 기재된 핵산 서열에서, 앞서 기재된 바와 같이, 폴리펩타이드에 존재하는 하나 이상의 글리코실화 부위에 근접한 하나 이상의 돌연변이는 글리칸이 더 이상 글리코실화 부위에 부착되거나 연결되지 않을 수 있도록 돌연변이되어 있었다.
폴리펩타이드를 암호화하는 핵산 서열을 단리 또는 클로닝하는데 이용되는 수법은, 당업계에 공지되어 있고, 게놈 DNA로부터의 단리, cDNA로부터의 제조, 또는 이들의 조합을 포함한다. 이러한 게놈 DNA로부터 본 발명의 핵산 서열의 클로닝은, 예컨대, 공유된 구조적 구조를 가진 클로닝된 DNA 단편을 검출하기 위하여, 잘 알려진 중합효소 연쇄 반응(PCR) 또는 발현 라이브러리의 항체 선별을 이용함으로써 영향받을 수 있다. 예컨대, 문헌[Innis et al., 1990, PCR: A Guide to Methods and Application, Academic Press, New York] 참조. 리가제 연쇄 반응(LCR), 결찰된 활성화 전사(LAT) 및 뉴클레오타이드 서열-기반 증폭(NASBA) 등과 같은 기타 증폭 절차가 이용될 수 있다. 핵산 서열은 트리코더마 리세이, 예컨대, 야생형 트리코더마 리세이, 또는 트리코더마 리세이 RUTC30, 또는 다른 또는 관련된 유기체의 균주로부터 클로닝될 수 있고, 따라서, 예를 들어, 핵산 서열의 영역을 암호화하는 폴리펩타이드의 대립형질 또는 종 변이체일 수 있다.
핵산 서열은 핵산 서열을 그의 천연 개소로부터 재생될 상이한 부위로 이동시키도록 유전자 공학에서 이용되는 표준 클로닝 절차에 의해 얻어질 수 있다. 클로닝 절차는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 목적으로 하는 단편의 적출 및 단리, 이 단편의 벡터 분자에의 삽입, 및 뉴클레오타이드 서열의 다수의 카피 또는 클론이 복제될 숙주 세포 내로 재조합체 벡터의 편입을 포함할 수 있다. 뉴클레오타이드 서열은 게놈, cDNA, RNA, 반합성, 합성 기원, 또는 이들의 임의의 조합일 수 있다.
본 명세서에서 이용되는 바와 같은, "발현 벡터"는 숙주 세포 내로 관심 대상 핵산 서열을 도입하고 발현하기 위한 핵산 작제물이다. 몇몇 실시형태에 있어서, 벡터는 본 명세서에 기재된 핵산 서열에 의해 암호화된 폴리펩타이드의 발현을 가능하게 하고 이에 작동 가능하게 연결된 적합한 제어 서열을 포함한다. 제어 서열은 핵산 서열의 발현을 위하여 숙주 세포에 의해 인식된 적절한 프로모터 서열일 수 있다. 일 실시형태에 있어서, 관심 대상 핵산 서열은 본 명세서에 기재된 바와 같은 바이오매스-분해 활성, 예컨대, 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열이다.
본 명세서에 기재된 발현 벡터에서 프로모터는 숙주 세포에 대해서 상동성이거나 이종성인 세포외 또는 세포내 폴리펩타이드를 암호화하는 유전자로부터 얻어진 프로모터, 돌연변이 프로모터, 절두된 프로모터, 및 하이브리드 프로모터를 포함한다.
박테리아 숙주 세포에서 본 발명의 핵산 작제물의 전사를 지시하기 위한 적절한 프로모터의 예는 이. 콜라이 lac 오페론, 이. 콜라이 tac 프로모터(하이브리드 프로모터, DeBoer et al, PNAS, 1983, 80:21-25), 이. 콜라이 rec A, 이. 콜라이는 araBAD, 이. 콜라이 tetA 및 원핵 베타-락타마제로부터 얻어진 프로모터이다. 적절한 프로모터의 다른 예는 T7 프로모터, T5 프로모터, T3 프로모터, M13 프로모터, 및 SP6 프로모터를 포함하는, 박테리오파지로부터의 프로모터 등과 같은 바이러스성 프로모터를 포함한다. 몇몇 실시형태에 있어서, 하나 초과의 프로모터, 예컨대, 이. 콜라이 lac 프로모터 및 T7 프로모터가 관심 대상 핵산 서열의 발현을 제어한다. 본 발명에서 사용하기 적합할 수 있는 추가의 프로모터는 문헌["Useful proteins from recombinant bacteria" in Scientific American, 1980, 242:74-94, 및 Sambrook et al., Molecular Cloning: A Laboratory Manual, 1989]에 기재되어 있다. 몇몇 바람직한 실시형태에 있어서, 프로모터는 유도성이고, 여기서 분자의 부가는 하류의 리딩 프레임(reading frame)의 전사 및 발현을 자극시킨다.
진핵생물 숙주 세포에서, 예컨대, 진균 또는 효모 세포에서 본 발명의 핵산 작제물의 전사를 지시하는 적절한 프로모터의 예는 트리코더마 리세이의 속으로부터 얻어진 프로모터, 메탄올-유도성 알코올 옥시다제(AOX 프로모터), 아스페르길루스 니둘란스(Aspergillus nidulans) 트립토판 생합성(trpC 프로모터), 아스페르길루스 니거 변종 아와모리(Aspergillus niger var. awamori) 플루코아밀라제(glaA), 사카로마이세스 세레비시아(Saccharomyces cerevisiae) 갈락토키나제(GAL1), 또는 클루이베로마이세스 락티스(Kluyveromyces lactis) Plac4 - PBI 프로모터이다.
본 명세서에 기재된 발현 벡터에 존재하는 제어 서열은 또한 폴리펩타이드의 아미노 말단에 연결된 아미노산 서열을 암호화하고 세포의 분비 경로 내로 암호화된 폴리펩타이드를 지향시키는 신호 서열, 예컨대, 분비 신호 서열일 수 있다. 이 신호 서열은 예컨대, 내인성 신호 서열일 수 있고, 여기서 이 신호 서열은 관심 대상 폴리펩타이드가 기원되는 유기체에 의해 내재적으로 발현될 경우 야생형 폴리펩타이드의 N-말단에 존재한다. 신호 서열은 이물, 이종 신호 펩타이드일 수 있고, 여기서 신호 서열은 발현되는 관심 대상 폴리펩타이드의 것과는 상이한 폴리펩타이드 또는 상이한 유기체로부터 유래된다. 숙주 세포의 분비 경로에 발현된 폴리펩타이드를 지향시키는 임의의 신호 서열은 본 발명에서 사용될 수 있다. 전형적으로, 신호 서열은 6 내지 136개의 염기성 및/또는 소수성 아미노산으로 구성된다.
본 발명에 적합한 신호 서열의 예는 사카로마이세스 세레비시아 알파-인자로부터의 신호 서열을 포함한다.
융합 태그는 또한 발현된 폴리펩타이드의 검출 및 정제를 용이하게 하기 위하여 본 명세서에 기재된 발현 벡터에 사용될 수 있다. 적절한 융합 태그의 예는 His-태그(예컨대, 3xHis, 6x His(서열번호 22), 또는 8xHis(서열번호 21)), GST-태그, HSV-태그, S-태그, T7 태그를 포함한다. 기타 적절한 융합 태그는 myc 태그, 혈구응집소(HA) 태그, 및 형광 단백질 태그(예컨대, 녹색 형광 단백질)를 포함한다. 융합 태그는 전형적으로 발현될 폴리펩타이드의 N 또는 C 말단에 작동 가능하게 연결된다. 몇몇 실시형태에 있어서, 발현될 폴리펩타이드의 N-말단 또는 C-말단과 융합 태그 서열 간의 링커 영역이 있을 수 있다. 일 실시형태에 있어서, 링커 영역은 1 내지 20개의 아미노산의 서열을 포함하며, 이는 발현된 폴리펩타이드의 발현 또는 기능에 영향을 미치거나 변화시키지 않는다.
본 명세서에 기재된 융합 태그의 이용은, 예컨대, 태그를 특이적으로 인식하는 항체를 이용함으로써 웨스턴 블롯에 의해 발현된 단백질의 검출을 허용한다. 태그는 또한 예컨대 친화도 크로마토그래피에 의해 숙주 세포로부터 발현된 폴리펩타이드의 정제를 허용한다. 예를 들어, His-태그에 융합된 발현된 폴리펩타이드는 니켈 친화도 크로마토그래피를 이용해서 정제될 수 있다. His 태그는 니켈 이온에 대한 친화도를 지니며, 니켈 칼럼은 His-태그된 폴리펩타이드를 보유할 것인 반면, 모든 다른 단백질 및 세포 찌꺼기가 이 칼럼을 통해 흐르게 한다. 예컨대, 이미다졸을 함유하는 용리 완충제를 이용하는 His-태그된 폴리펩타이드의 용리는, 칼럼으로부터 His-태그된 폴리펩타이드를 유리시켜, 실질적으로 정제된 폴리펩타이드를 얻는다.
본 명세서에 기재된 발현 벡터는 당업자에게 공지된 바와 같이 작제물로 형질전환된 통상적으로 공지된 유전자 변형된 미생물의 단리를 가능하게 하는 선택 가능한 마커 유전자를 더 포함할 수 있다. 선택 가능한 마커 유전자는, 그렇지 않을 경우 이들 조건 하에 성장하지 못했을 숙주 유기체에 특정 영양소를 결여하는 배지에서 성장하는 능력 또는 항생제에 대한 저항을 부여할 수 있다. 본 발명은 선택 가능한 마커 유전자의 선택에 의해 제한되지 않고, 당업자라면 적절한 유전자를 용이하게 결정할 수 있다. 예를 들어, 선택 가능한 마커 유전자는 암피실린, 클로람페니콜, 테트라사이클린, 카나마이신, 하이그로마이신, 프레오마이신, 제네티신 또는 G418에 대한 저항성을 부여할 수 있거나, 또는 trp, arg, leu, pyr4, pyr, ura3, ura5, his, 또는 ade 유전자 중 하나에서 숙주 미생물의 결여를 보완할 수 있거나, 또는 단독 질소 공급원으로서 아세트아마이드를 성장시키는 능력을 부여할 수 있다.
본 명세서에 기재된 발현 벡터는 다른 핵산 서열, 예컨대, 당업자에게 통상 공지된 바와 같은 추가의 제어 서열, 예를 들어, 전사 종결자, 각종 다른 핵산 서열을 함께 연결하는 합성 서열, 복제의 기원, 리보좀 결합 부위, 다수의 클로닝 부위(또는 폴리링커 부위), 폴리아데닐화 신호 등을 더 포함할 수 있다. 발현 벡터에 적합한 리보좀 결합 부위는, 예를 들어, 원핵 숙주 세포에서 발현하기 위하여 이용되는 숙주 세포에 좌우되며, 원핵 RBS, 예컨대, T7 파지 RBS가 이용될 수 있다. 다수의 클로닝 부위 또는 폴리링커 부위는, 바람직하게는 발현 벡터의 나머지 서열에 존재하지 않는 하나 이상의 제한 효소 부위를 함유한다. 제한 효소 부위는 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열 또는 기타 목적으로 하는 제어 서열의 삽입을 위해 사용된다. 본 발명의 실시는 이들 다른 핵산 서열, 예컨대, 다른 제어 서열의 임의의 하나 이상의 존재에 의해 제한되지 않는다.
본 발명에서 이용하기 위한 적절한 발현 벡터의 예는 원핵생물에서 발현을 위한 벡터, 예컨대, 박테리아 발현 벡터를 포함한다. pET 벡터(노바젠사(Novagen))에서 사용하기 적합한 박테리아 발현 벡터는, 단지 T7 RNA 중합효소(박테리아 RNA 중합효소가 아님)에 특이적이고 원핵 게놈 내 어느 곳에서도 존재하지 않는 바이러스성 T7 프로모터, lac 프로모터를 포함하고 lac 리프레서 단백질(lacI 유전자)용의 서열을 암호화하는 lac 오퍼레이터, 폴리링커, 복제의 f1 기원(M13 헬퍼 파지로 공동 감염된 경우 단일 가닥 플라스미드가 생성될 수 있도록), 암피실린 저항 유전자 및 복제의 ColE1 기원(Blaber, 1998)을 함유한다. 프로모터와 lac 오퍼레이터는 둘 다 폴리링커의 5' 또는 상류에 위치하며, 여기서 본 명세서에 기재된 폴리펩타이드를 암호화하는 핵산 서열이 삽입된다. lac 오퍼레이터는 셀로비아제 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열의 유도성 발현을 부여한다. 락토스 대사산물인 IPTG(아이소프로필 β-D-1-티오갈락토피라노사이드)의 첨가는 lac 오페론의 잔사를 촉발시키고 lac 오퍼레이터의 제어 하에 핵산 서열의 단백질 발현을 유도한다. 이 시스템의 사용은 벡터 발현용의 숙주 세포에 T7 RNA 중합효소의 첨가를 필요로 한다. T7 RNA 중합효소는 제2 발현 벡터를 통해서 도입될 수 있거나, 또는 T7 RNA 중합효소를 발현하도록 유전자 조작된 숙주 세포 균주가 사용될 수 있다.
본 발명에서 이용하기 위한 예시적인 발현 벡터는 노바젠사로부터 상업적으로 입수 가능한 pET 벡터이다. pET 발현 시스템은 미국 특허 제4,952,496호; 제5,693,489호; 및 제5,869,320호에 기재되어 있다. 하나의 실시형태에 있어서, pET 벡터는 pET-DUET 벡터, 예컨대, 노바젠사로부터 상업적으로 입수 가능한 pET-Duet1이다. 본 발명에서 사용하기 적합한 기타 벡터는 미국 특허 제5,310,663호 및 제5,284,933호; 및 유럽 특허 제282042호에 기재된 것들과 같은 His-태그 서열을 함유하는 벡터를 포함한다.
본 발명은 바이오매스-분해 활성을 지니는 폴리펩타이드의 재조합체 생성물에서 이용되는 본 발명의 핵산 서열 또는 발현 벡터를 포함하는 숙주 세포에 관한 것이다.
본 발명의 핵산 서열을 포함하는 발현 벡터는 폴리펩타이드가 발현되도록 벡터가 유지되도록(예컨대, 염색체 통합에 의해 또는 자체-복제 염색체외 벡터로서) 숙주 세포 내로 도입된다.
숙주 세포는 원핵생물 또는 진핵생물일 수 있다. 숙주 세포는 이. 콜라이 균주, 예컨대, K12 균주 노바블루(NovaBlue), 노바블루(NovaBlue) T1R, JM109, 및 DH5α 등과 같은 박테리아일 수 있다. 바람직하게는, 박테리아 세포는 이. 콜라이 오리가미(Origami) 균주, 예컨대, 오리가미 B, 오리가미 B(DE3), 오리가미 2 및 오리가미 2(DE3) 균주 등과 같은 외재적으로 발현된 단백질을 폴딩하거나 부분적으로 폴딩하는 능력을 가진다. 몇몇 실시형태에 있어서, 글리코실화를 결여하거나, 숙주 세포에 의해 발현된 단백질이 충분히 글리코실화되지 않도록 손상된 글리코실화 경로를 가진 숙주 세포를 사용하는 것이 바람직할 수 있다.
숙주 세포는 효모 또는 사상균, 특히 아스코마이코타(Ascomycota)로서 분류된 것들일 수 있다. 본 발명의 변형된 TrCel3A 베타-글루코시다제의 발현을 위한 숙주 미생물로서 유용한 효모의 속은 사카로마이세스, 피키아(Pichia), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 야로위아(Yarrowia) 및 아륵술라(Arxula)를 포함한다. 본 발명의 폴리펩타이드의 발현을 위한 미생물로서 유용한 진균의 속은 트리코더마, 하이포크레아(Hypocrea), 아스페르길루스, 푸사륨, 후미콜라, 뉴로스포라(Neurospora), 크리소스포리륨, 마이셀리오프토라, 티엘라비아(Thielavia), 스포로트리쿰(Sporotrichum) 및 페니실륨(Penicillium)을 포함한다. 예를 들어, 숙주 세포는 피키아 파스토리스일 수 있다. 예를 들어, 숙주 세포는 트리코더마 리세이의 산업적 균주, 또는 이의 돌연변이체, 예컨대, 트리코더마 리세이 RUTC30일 수 있다. 전형적으로, 숙주 세포는 친(parental) 바이오매스-분해 활성, 예컨대, 셀로비아제 또는 Cel3a를 발현하지 않는 것이다.
특정 숙주 세포, 예컨대, 박테리아 세포 또는 진균 세포의 선택은, 이하에 더욱 상세히 설명되는 바와 같이, 본 발명의 아글리코실화된 폴리펩타이드를 생성하기 위하여 이용된 방법에 좌우된다.
본 발명의 발현 벡터는 미생물 형질전환 분야의 숙련된 자에 의해 공지된 많은 방법에 의해 숙주 세포 내에 도입될 수 있으며, 이 방법은 형질전환, CaCl2에 의한 세포의 처리, 전기천공법, 유전자 충격(biolistic bombardment), 리포펙션, 및 프로토플라스트(protoplast)의 PEG-매개 융합(예컨대, White 등의 WO 2005/093072, 이것은 참고로 본 명세서에 편입됨)을 포함하지만, 이들로 제한되는 것은 아니다. 발현 벡터를 함유하는 재조합 숙주 세포를 (예컨대, 발현 벡터의 선택 가능한 마커를 이용한 선택에 의해) 선택한 후, 재조합 숙주 세포는 본 발명의 바이오매스-분해 활성을 지니는 폴리펩타이드의 발현을 유도하는 조건 하에서 배양될 수 있다.
원핵생물 및 진핵생물 세포로부터 발현된 바이오매스-분해 활성을 지니는 가용성 폴리펩타이드를 회수하는 방법은 당업계에 공지되어 있다. 실시형태들에 있어서, 폴리펩타이드를 회수하는 방법은, 예컨대, 원심분리 또는 여과에 의해 세포를 수집하고, 그리고 예컨대, 기계적, 화학적 또는 효소적 수단에 의해 세포를 용해시키는 것을 포함한다. 예를 들어, 세포는, 예컨대, 초음파분해처리, 밀링(비드를 이용한 진탕), 또는 전단력에 의해 물리적으로 쪼개질 수 있다. 세포막은 세포의 내용물이 방출되도록 침투되도록 세제, 예컨대, 트리톤(Triton), NP-40, 또는 SDS에 의한 처리로 처리될 수 있다. 세포벽을 가진 세포, 예컨대, 박테리아 세포는, 라이소자임 또는 라이소나제 등과 같은 효소를 이용해서 침투될 수 있다. 위에서 기재된 기계적, 화학적 및 효소적 수법의 임의의 조합은 또한 본 발명의 맥락에서 숙주 세포로부터 관심 대상인 발현된 폴리펩타이드를 회수하는데 적합하다. 예를 들어, 박테리아 세포, 예컨대, 이. 콜라이 세포에서 본 명세서에 기재된 바이오매스-분해 활성을 지닌 폴리펩타이드를 발현할 경우, 세포는 전형적으로 세포 배양액을 원심 분리하고 펠릿화(pelleting)하고, 라이소자임을 함유하는 용해 완충액에 세포 펠릿을 재현탁시킴으로써 수집된다. 완전한 용해를 확보하기 위하여, 재현탁된 세포에 이하의 방법 중 하나를 실시한다: 초음파분해처리, 밀링 또는 균질화. 원심분리 후에, 바이오매스-분해 활성을 지니는 가용성 폴리펩타이드는 상청액 중에 존재하는 한편, 예컨대, 봉입체 중의 바이오매스-분해 활성을 지니는 불용성 폴리펩타이드는, 펠릿에서 발견된다. 예컨대, 봉입체로부터 바이오매스-분해 활성을 지니는 불용성 폴리펩타이드를 회수하는 방법은 이하에 "봉입체로부터의 가용화"란 표제 부문에서 더욱 설명된다.
바이오매스-분해 활성을 지니는 가용성 폴리펩타이드는 이어서 당업계에 공지된 표준 방법을 이용해서 세포 용해물로부터 정제되거나 단리될 수 있다. 태그, 예컨대, His 태그를 포함하는 바이오매스-분해 활성을 지니는 폴리펩타이드에 대해서, 친화 크로마토그래피는 용해물의 가용성 분획의 나머지로부터 가용성 폴리펩타이드를 분리시키는데 이용될 수 있다.
일 실시형태에 있어서, 본 명세서에 기재된 바이오매스-분해 활성을 지니는 폴리펩타이드를 발현하는 숙주 세포는 당화 반응을 위하여 바이오매스에 첨가되기 전에 용해되지 않는다. 몇몇 경우에, 숙주 세포를 용해시키고 바이오매스-분해 활성을 지니는 폴리펩타이드를 추출하는 방법은 단백질 변성 및/또는 감소된 효소 활성을 초래할 수 있고, 이는 하류 가공처리의 비용 증가를 유발한다. 따라서, 본 발명은 또한 당화 단계 전에 본 명세서에 기재된 아글리코실화된 바이오매스-분해 활성을 지니는 폴리펩타이드를 발현하는 숙주 세포를 바이오매스에 직접 첨가하는 방법을 제공한다.
하나의 실시형태에 있어서, 본 명세서에 기재된 바이오매스-분해 활성을 지니는 폴리펩타이드를 발현하는 숙주 세포, 예컨대, 이. 콜라이는, 예컨대, 원심분리에 의해 단리되어, 당화 반응, 예컨대, 바이오매스를 수용하는 당화 반응기에 첨가된다. 세포는 바이오매스의 전단, 임펠러 및 증가된 온도에 의해 용해된다. 하나의 실시형태에 있어서, 본 명세서에 기재된 바이오매스-분해 활성을 지니는 폴리펩타이드를 발현하는 숙주 세포, 예컨대, 이. 콜라이 세포의 배양은 발효 탱크로부터 당화 탱크에 직접 첨가되어, 원심분리에 의해 세포를 펠릿화할 필요를 제거한다. 하나의 실시형태에 있어서, 폴리펩타이드는 글리코실화되거나 아글리코실화된다.
봉입체로부터의 가용화
실시형태에 있어서, 세포, 예컨대, 본 명세서에 개시된 미생물은 바이오매스-분해 활성을 지니는 적어도 하나의 폴리펩타이드를 생산하기 위하여 본 명세서에 기재된 방법을 이용해서 유전자 변형되었다. 바이오매스-분해 활성을 지니는 폴리펩타이드의 적어도 일부분, 예컨대, 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% 또는 90%는 유전자 변형된 세포 내 봉입체에서 발견된다. 봉입체로부터 바이오매스-분해 활성을 지니는 적어도 1종의 폴리펩타이드를 가용화시키는 방법이 본 명세서에 개시되어 있다.
봉입체는, 높은 수준에서 발현될 경우, 이종적으로 발현된 단백질, 예컨대, 바이오매스-분해 활성을 지니는 폴리펩타이드를 포함하는 숙주 세포 내의 불용성 응집체이다. 봉입체는 핵 또는 세포질에서 발견될 수 있다. 봉입체는 또한 기타 성분, 예컨대, 숙주 세포에 내재하는 기타 단백질, 예컨대, 숙주 단백질, 리보솜 성분, 핵산(예컨대, RNA 및/또는 DNA), 및 세포 찌꺼기(예컨대, 세포벽 찌꺼기, 지질, 대사산물)를 함유할 수 있다. 숙주 세포에 내재하는 단백질은 숙주 세포의 게놈 DNA에 의해 암호화된 임의의 단백질을 포함한다. 숙주 세포에 내재하는 단백질은 세포질에 대해서 국재화될 수 있거나, 또는 이종적으로 발현된 단백질과 상호작용할 수 있다. 봉입체에서 발견될 수 있는 리보솜 성분의 예는 리보솜, 리보솜 소단위(예컨대, 50S 소단위 또는 30S 소단위)의 단편, 부분적으로 해독된 폴리펩타이드, 운반 RNA, 연장 인자, 및/또는 메신저 RNA를 포함한다. 봉입체에서 발견될 수 있는 핵산의 예는 숙주의 게놈 DNA, (예컨대, 숙주 세포 내로 도입된 플라스미드 또는 발현 벡터로부터의) 외인성 DNA, 메신저 RNA, 운반 RNA, 리보솜 RNA, 또는 이의 임의의 단편을 포함한다. 봉입체에서 발견될 수 있는 세포 찌꺼기의 예는 include 세포벽 또는 막 찌꺼기(예컨대, 세포벽 또는 막의 단편 또는 성분), 핵막 찌꺼기(예컨대, 핵막의 단편 또는 성분), 기타 숙주 세포소기관의 단편 또는 성분, 내독소, 지질, 및/또는 대사산물을 포함한다.
봉입체의 응집을 저감시키기 위한 추가의 방법은 초음파 처리, 다양한 온도에서의 인큐베이션, 산/염기 처리, 프로테아제 처리, 전기적 처리, 기계적 처리, 및 프로테아제를 생산하는 유기체의 추가를 포함한다. 예를 들어, 봉입체를 함유하는 세포 또는 이의 용해물은 -20℃ 내지 0℃, 0℃ 내지 4℃, 4℃ 내지 20℃, 20℃ 내지 40℃, 및 40℃ 내지 80℃의 범위의 온도에서 인큐베이팅된다.
봉입체를 단리시키기 위하여, 바이오매스-분해 활성을 지니는 폴리펩타이드를 발현하는 숙주 세포는 먼저 당업계에서의 표준 방법, 예컨대, 라이소자임에 의한 용해 또는 기타 변성제, 초음파 처리(ultrasound treatment), 초음파분해처리 또는 고압 균질화를 이용해서 용해시킨다. 숙주 세포는 봉입체의 가용화를 초래하지 않는 조건 하에서 용해시킨다. 봉입체는 당업계에 공지된 수법을 이용해서 숙주 세포로부터 단리시킨다. 예를 들어, 세포 용해물은, 바이오매스-분해 활성을 지니는 폴리펩타이드 및 기타 불용성 물질을 함유하는 봉입체가 불용성 분획에 존재하는 한편, 가용성 분획이 바이오매스-분해 활성을 지니는 가용성 폴리펩타이드를 함유하도록 분리시킨다. 이러한 분리는 원심분리를 통해서 달성될 수 있고, 이에 따라서 봉입체는 펠릿, 예컨대, 불용성 분획에서 발견되고, 가용성 폴리펩타이드는, 상청액, 예컨대, 가용성 분획에서 발견된다. 가용성 분획으로부터 불용성 분획을 분리에 적합한 다른 방법은 여과를 포함한다.
바이오매스-분해 활성을 지니는 폴리펩타이드를 유리시키는 봉입체의 가용화는 가용화제를 불용성 분획 또는 봉입체에 첨가하는 단계를 포함한다. 몇몇 실시형태에 있어서, 가용화제는 단백질 응집 또는 석출을 방지하거나 또는 단백질 응집체를 용해시키는 제제일 수 있다. 몇몇 실시형태에 있어서, 가용화제는 반데르발스 상호작용, 소수성 상호작용, 수소 결합, 쌍극자-쌍극자 상호작용, 이온성 상호작용, 파이 스태킹, 또는 이들의 임의의 조합을 파괴하는 제제를 포함한다.
몇몇 실시형태에 있어서, 가용화제는 소수성 상호작용을 파괴하는 제제, 예컨대, 세제일 수 있다. 예시적인 세제는 비이온성, 양성 이온성, 음이온성 및 양이온성 세제를 포함한다. 몇몇 실시형태에 있어서, 가용화제는 비이온성, 예컨대, NP-40 및 트리톤(Triton) X-100일 수 있다. 몇몇 실시형태에 있어서, 가용화제는 양성 이온성, 예컨대, CHAPS 및 설포베타인, 예컨대, SB3-10 또는 ASB 14일 수 있다. 몇몇 실시형태에 있어서, 단백질 제제는 음이온성, 예컨대, 도데실황산나트륨(SDS)일 수 있다.
몇몇 실시형태에 있어서, 가용화제는 다이설파이드 결합을 환원시키는 제제, 예컨대, 티올 환원제일 수 있다. 예시적인 티올 환원제는 2-머캅토에탄올 βME 및 다이티오트레이톨(DTT)을 포함한다. 몇몇 실시형태에 있어서, 다이설파이드 결합을 환원시키는 가용화제는 포스핀, 예컨대, 트라이부틸포스핀(TBP) 또는 트리스카복시에틸포스핀(TCEP)일 수 있다.
몇몇 실시형태에 있어서, 가용화제는 수소 결합 및 소수성 상호작용을 파괴하는 제제일 수 있다. 몇몇 실시형태에 있어서, 가용화제는 카오트로픽 화합물, 예컨대, 요소 및 치환된 요소(예컨대, 티오유레아), 및 구아니디듐 하이드로클로라이드일 수 있다.
몇몇 실시형태에 있어서, 가용화제는 비극성 용매인 제제일 수 있다. 비극성 용매는 탄소와 수소 등과 같은 유사한 전기음성도를 가진 원자들 사이에 결합을 함유하고, 그리고 매우 낮은 유전 상수를 지닌다. 예를 들어, 비극성 용매는 5 미만의 유전 상수를 지닌다. 비극성 용매의 예는 펜탄, 헥산, 사이클로헥산, 벤젠, 톨루엔, 클로로폼, 다이에틸 에터를 포함한다.
몇몇 실시형태에 있어서, 가용화제는 극성 용매인 제제일 수 있다. 극성 용매는 커다란 쌍극자 모멘트(또는 "부분 전하")를 특징으로 하고; 이것은 산소 및 수소 등과 같은 매우 상이한 전기음성도를 가진 원자들 사이에 결합을 함유한다. 일 실시형태에 있어서, 본 발명에서 사용하기에 적합한 극성 용매는 적어도 5, 또는 적어도 20의 유전 상수를 지닌다. 바람직한 실시형태에 있어서, 극성 용매는 높은 유전 상수, 예컨대, 25 초과의 유전 상수를 지닌다. 몇몇 실시형태에 있어서, 가용화제는 양성자성 극성 용매이며, 이는 O-H 또는 N-H 결합을 갖고 높은, 예컨대, 20초과, 25 초과의 유전 상수를 지니며 그리고 양호한 수소 결합 공여체, 예컨대, 폼산, n-부탄올, 아이소프로판올, n-프로판올, 에탄올, 메탄올 또는 나이트로메탄이다. 몇몇 실시형태에 있어서, 가용화제는 O-H 또는 N-H 결합을 결여하고, 그리고 5 내지 20의 유전 상수를 지니는 비양성자성 극성 용매, 예컨대, 다이메틸설폭사이드(DMSO), 다이클로로메탄(DCM), 테트라하이드로퓨란(THF), 에틸 아세테이트, 아세톤, 다이메톨폼아마이드(DMF), 또는 아세토나이트릴(MeCN)일 수 있다.
몇몇 실시형태에 있어서, 가용화제는 순 음하전 분자의 이온성 상호작용을 파괴하는데 적합할 수 있는 양 전하를 가진 제제일 수 있다. 예시적인 양하전 가용화제는 N-메틸 D-글루코사민, 콜린, 아르기닌, 라이신, 프로카인, 트로메타민(TRIS), 스퍼민, N-메틸-몰폴린, 글루코사민, N,N-비스 2-하이드록시에틸 글리신, 다이아자바이사이클로운데칸, 크레아틴, 아르기닌 에틸 에스터, 아만타딘, 리만타딘, 오르니틴, 타우린 및 시트룰린을 포함한다. 양이온성 모이어티는 부가적으로 나트륨, 칼륨, 칼슘, 마그네슘, 암모늄, 모노에탄올아민, 다이에탄올아민, 트라이에탄올아민, 트로메타민, 라이신, 히스티딘, 아르기닌, 몰폴린, 메틸글루코사민, 및 글루코사민을 포함할 수 있다.
몇몇 실시형태에 있어서, 가용화제는 순 양하전 분자의 이온성 상호작용을 파괴하는데 적합할 수 있는 음 전하를 가진 제제일 수 있다. 예시적인 음하전 가용화제는 아세테이트, 프로피오네이트, 뷰티레이트, 펜타노에이트, 헥사노에이트, 헵타노에이트, 레불리네이트, 염화물, 브로민화물, 요오드화물, 시트레이트, 숙시네이트, 말레에이트, 글리콜레이트, 글루코네이트, 글루쿠로네이트, 3-하이드록시아이소부티레이트, 2-하이드록시부티레이트, 락테이트, 말레이트, 피루베이트, 푸말이트, 타르타레이트, 타르트로네이트, 설포네이트, 아세트산, 아다만트산(adamantoic acid), 알파 케토 글루카르산, D- 또는 L-아스파르트산, 벤젠설폰산, 벤조산, 10-캄퍼설폰산, 시트르산, 1,2-에탄다이설폰산, 푸마르산, D-글루콘산, D-글루코론산, 글루카르산, D- 또는 L-글루탐산, 글루타르산, 글리콜산, 히푸르산, 브로민화수소산, 염화수소산, 1-하이드록실-2-나프토산, 락토바이온산, 말레산, L-말산, 만델산, 메탄설폰산, 뮤신산, 1,5 나프탈렌다이설폰산 4수화물, 2-나프탈렌설폰산, 질산, 올레산, 파모산, 인산, p-톨루엔설폰산 수화물, D-사카라이드산 일칼륨염, 살리실산, 스테아르산, 숙신산, 황산, 탄닌산 및 D- 또는 L-주석산을 포함한다.
가용화제는 봉입체, 또는 봉입체를 함유하는 분획에 봉입체로부터 바이오매스 분해 활성을 지니는 폴리펩타이드를 가용화시키는데 충분한 농도로, 예를 들어, 약 0.01-10M, 약 0.05-10M, 약 0.1-10M, 약 0.2-10M, 약 0.5-10M, 약 1-10M, 약 2-10M, 약 5-10M, 약 8-10M, 약 0.01-6M, 약 0.05-6M, 약 0.1-6M, 약 0.2-6M, 약 0.5-6M, 약 1-6M, 약 2-6M, 약 4-6M, 또는 약 5-6M의 농도로 첨가된다. 하나의 실시형태에 있어서, 가용화제는 봉입체, 또는 봉입체를 함유하는 분획에 약 0.01M, 약 0.02M, 약 0.05M, 약 0.1M, 약 0.2M, 약 0.5M, 약 1M, 약 2M, 약 3M, 약 4M, 약 5M, 약 6M, 약 7M, 약 8M, 약 9M, 또는 약 10M의 농도로 첨가된다.
바람직한 실시형태에 있어서, 가용화제는 요소이고, 봉입체, 또는 봉입체를 함유하는 분획에 약 0.01-10M, 약 0.05-10M, 약 0.1-10M, 약 0.2-10M, 약 0.5-10M, 약 1-10M, 약 2-10M, 약 5-10M, 약 8-10M, 약 0.01-6M, 약 0.05-6M, 약 0.1-6M, 약 0.2-6M, 약 0.5-6M, 약 1-6M, 약 2-6M, 약 4-6M, 또는 약 5-6M의 농도로 첨가된다. 하나의 실시형태에 있어서, 요소는 봉입체, 또는 봉입체를 함유하는 분획에 약 0.01M, 약 0.02M, 약 0.05M, 약 0.1M, 약 0.2M, 약 0.5M, 약 1M, 약 2M, 약 3M, 약 4M, 약 5M, 약 6M, 약 7M, 약 8M, 약 9M, 또는 약 10M의 농도로 첨가된다. 바람직한 실시형태에 있어서, 요소는 봉입체, 또는 봉입체를 함유하는 분획에 6M의 농도로 첨가된다.
가용화제를 이용한 가용화 후에, 얻어지는 혼합물은 본 명세서에 기재된 바와 같은 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드를 함유한다. 얻어지는 혼합물은 "가용화된 효소를 이용하여 생성물을 생산하는 방법"이란 표제 부문에서 더욱 상세히 설명된 바와 같이 생성물을 생산하기 위한 반응, 예컨대, 당화 반응과 같은 효소적 공정에서 직접 이용될 수 있다. 이 실시형태에 있어서, 혼합물은 봉입체의 다른 성분들, 예컨대, 숙주 세포에 내재화된 기타 단백질, 리보솜 성분, 핵산(예컨대, RNA 및/또는 DNA), 및 세포 찌꺼기(예컨대, 세포벽 찌꺼기, 지질, 대사산물)을 함유할 수 있다.
다른 실시형태에 있어서, 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드를 함유하는 얻어지는 혼합물은 봉입체의 다른 가용화된 성분으로부터 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드를 정제 또는 단리시키기 위하여 더욱 처리된다. 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드를 단리 또는 정제시키기 위한 적절한 방법은 친화도 정제 수법을 포함한다. 예를 들어, 바이오매스-분해 활성을 지니는 폴리펩타이드는 바람직하게는 친화도 정제를 위하여 이용될 수 있는 태그 또는 융합 펩타이드를 함유한다. 하나의 실시형태에 있어서, 바이오매스-분해 활성을 지니는 폴리펩타이드는 His-태그, 예컨대, 8X His 태그(서열번호 21)를 함유하고, 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드는 니켈 친화 크로마토그래피, 예컨대, 고정화된 금속 이온 친화 크로마토그래피(IMAC) 시스템을 이용해서 정제될 수 있다. 일 실시형태에 있어서, 모든 정제 단계는, 예컨대, 공제 공정의 세척 및 용리 단계에서 봉입체로부터 폴리펩타이드를 가용화시키는데 이용되는 가용화제의 존재에서 일어난다. 따라서, 일 실시형태에 있어서, 바이오매스-분해 활성을 지니는 얻어지는 정제된 가용화된 폴리펩타이드는 또한 가용화제를 함유한다.
본 발명은 바이오매스-분해 활성을 지니는 폴리펩타이드를 및 가용화제를 포함하는 혼합물을 제공한다. 혼합물은 위에서 기재된 바와 같이 봉입체의 가용화를 통해서 얻어진다. 얻어진 혼합물은 또한 봉입체와 연관된 1종 이상의 단백질을 더 포함할 수 있다. 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드는 또한 친화도 정제 수법에 의해 정제될 수 있다. 이 경우에, 얻어지는 혼합물은 봉입체와 연관된 1종 이상의 단백질을 포함하지 않는다. 혼합물은, 봉입체에서 발견되는 기타 성분, 예컨대, 숙주 세포에 내재하는 기타 단백질, 리보솜 성분, 핵산(예컨대, RNA 및/또는 DNA), 및 세포 찌꺼기(예컨대, 세포벽 찌꺼기, 지질, 대사산물)을 포함할 수 있다.
하나의 실시형태에 있어서, 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드는 언폴딩될 수 있거나, 부분적으로 미스폴딩될 수 있거나 또는 부분적으로 변성될 수 있다. 하나의 실시형태에 있어서, 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드는 천연 바이오매스-분해 활성을 지니는 폴리펩타이드에 비해서 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 6%, 적어도 7%, 적어도 8%, 적어도 9%, 적어도 10%, 적어도 8-10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100%의 바이오매스-분해 활성을 지닌다. 하나의 실시형태에 있어서, 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드는 바이오매스-분해 활성을 지니는 천연 폴리펩타이드에 비해서 약 1-10%, 1-20%, 1-30%, 1-40%, 1-50%, 1-60%, 1-70%, 1-80%, 1-90%, 1-100%, 10-20%, 10-30%, 10-40%, 10-50%, 10-60%, 10-70%, 10-80%, 10-90%, 10-100%, 20-30%, 20-40%, 20-50%, 20-60%, 20-70%, 20-80%, 20-90%, 20-100%, 30-40%, 30-50%, 30-60%, 30-70%, 30-80%, 30-90%, 30-100%, 40-50%, 40-60%, 40-70%, 40-80%, 40-90%, 40-100%, 50-60%, 50-70%, 50-80%, 50-90%, 50-100%, 60-70%, 60-80%, 60-90%, 60-100%, 70-80%, 70-90%, 70-100%, 80-90%, 80-100%, 또는 90-100%의 바이오매스-분해 활성을 지닌다. 바람직한 실시형태에 있어서, 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드는 천연 폴리펩타이드의 활성의 적어도 8 내지 10%를 지닌다. 천연 바이오매스-분해 활성을 지니는 폴리펩타이드는, 예컨대, 가용성 분획으로부터 단리된 바이오매스-분해 활성을 지니는 대응하는 폴리펩타이드, 그의 천연 형태에서 적절하게 발견되는 바이오매스-분해 활성을 지니는 대응하는 폴리펩타이드(이에 따라 100%의 바이오매스-분해 활성을 지님), 또는 폴리펩타이드가 기원되는 미생물로부터 내재적으로 발현되는 바이오매스-분해 활성을 지니는 대응하는 폴리펩타이드를 지칭한다. 바이오매스-분해 활성은 본 명세서에 기재된 검정들 중 어느 하나, 예컨대, 리그니나제 활성 검정, 엔도글루카나제 활성 검정, 셀로바이오하이드롤라제 활성 검정, 셀로비아제 활성 검정 또는 자일라나제 활성 검정에 의해 결정될 수 있다.
일 양상에 있어서, 혼합물은 셀로비아제 활성을 지니는 폴리펩타이드, 예컨대, 트리코더마 리세이로부터의 Cel3a 또는 이의 기능적 변이체, 예컨대, 서열번호 1에 대해서 적어도 90%의 동일성을 가진 폴리펩타이드, 및 가용화제, 예컨대, 요소를 포함한다. 일 실시형태에 있어서, 혼합물은 서열번호 1에 대해서 적어도 90%의 동일성을 가진 폴리펩타이드 및 가용화제, 예컨대, 요소를 포함하되, 여기서 폴리펩타이드는 천연 폴리펩타이드, 예컨대, 서열번호 1 또는 트리코더마 리세이로부터의 Cel3a에 비해서 적어도 20%의 셀로비아제 활성을 지닌다. 혼합물은 위에서 기재된 바와 같은 봉입체의 가용화를 통해서 얻어진다. 얻어지는 혼합물은 또한 봉입체와 연관된 1종 이상의 단백질을 더 포함할 수 있다. 셀로비아제 활성을 지니는 가용화된 폴리펩타이드, 예컨대, 서열번호 1에 대해서 적어도 90%의 동일성을 가진 폴리펩타이드는, 또한 친환도 정제 수법에 의해 정제될 수 있다. 이 경우에, 얻어지는 혼합물은 봉입체와 연관된 1종 이상의 단백질을 포함하지 않는다. 혼합물은 봉입체에서 발견되는 기타 성분, 예컨대, 숙주 세포에 내재하는 기타 단백질, 리보솜 성분, 핵산(예컨대, RNA 및/또는 DNA), 및 세포 찌꺼기(예컨대, 세포벽 찌꺼기, 지질, 대사산물)을 포함할 수 있다. 하나의 실시형태에 있어서, 가용화제는 요소이고, 요소는 0.2 내지 6M에서 존재한다.
하나의 실시형태에 있어서, 셀로비아제 활성을 지니거나 서열번호 1과 적어도 90%의 동일성을 지니는 가용화된 폴리펩타이드는, 언폴딩될 수 있거나, 부분적으로 미스폴딩될 수 있거나 또는 부분적으로 변성될 수 있다. 하나의 실시형태에 있어서, 셀로비아제 활성을 지니거나 서열번호 1과 적어도 90%의 동일성을 지니는 가용화된 폴리펩타이드는, 천연 폴리펩타이드에 비해서 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 6%, 적어도 7%, 적어도 8%, 적어도 9%, 적어도 10%, 적어도 8-10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100%의 셀로비아제 활성을 지닌다. 하나의 실시형태에 있어서, 셀로비아제 활성을 지니거나 서열번호 1과 적어도 90%의 동일성을 지니는 가용화된 폴리펩타이드는 천연 폴리펩타이드에 비해서 셀로비아제 활성의 약 1-10%, 1-20%, 1-30%, 1-40%, 1-50%, 1-60%, 1-70%, 1-80%, 1-90%, 1-100%, 10-20%, 10-30%, 10-40%, 10-50%, 10-60%, 10-70%, 10-80%, 10-90%, 10-100%, 20-30%, 20-40%, 20-50%, 20-60%, 20-70%, 20-80%, 20-90%, 20-100%, 30-40%, 30-50%, 30-60%, 30-70%, 30-80%, 30-90%, 30-100%, 40-50%, 40-60%, 40-70%, 40-80%, 40-90%, 40-100%, 50-60%, 50-70%, 50-80%, 50-90%, 50-100%, 60-70%, 60-80%, 60-90%, 60-100%, 70-80%, 70-90%, 70-100%, 80-90%, 80-100% 또는 90-100%를 지닌다. 천연 폴리펩타이드는, 예를 들어, 적절하게 폴딩된(예컨대, 100% 폴딩된) 서열번호 1, 트리코더마 리세이로부터 단리된 Cel3a, 또는 이의 기능적 변이체이다. 셀로비아제 활성은 본 명세서에 기재된 검정을 이용해서 측정될 수 있고, 그리고 30분 후에 유리된 글루코스의 농도(g/ℓ) 또는 30분 내에 글루코스로 전환된 셀로바이오스의 %로서 정량화될 수 있다.
아글리코실화된 폴리펩타이드를 생산하는 방법
본 발명은 숙주 세포에서 바이오매스-분해 활성을 지니는 아글리코실화된 폴리펩타이드를 생산하는 방법을 더 제공하되, 여기서 숙주 세포 또는 이의 용해물은, 본 명세서에 기재된 바와 같은, 아글리코실화된 폴리펩타이드를 가용화시키는데 적합한 농도의 가용화제로 처리된다. 상기 방법은 폴리펩타이드의 발현을 위하여 적합한 조건 하에서 바이오매스-분해 활성을 지니는 폴리펩타이드를 발현시키는 숙주 세포를 배양하는 단계를 포함한다. 상기 방법은 또한 숙주 세포로부터 바이오매스-분해 활성을 지니는 아글리코실화된 폴리펩타이드를 회수하는 단계를 포함할 수 있다. 이하의 추가의 상세한 설명에서 기재되는 방법에 있어서, 바이오매스-분해 활성을 지니는 폴리펩타이드는, 예컨대, 리그니나제 활성, 엔도글루카나제 활성, 셀로바이오하이드롤라제 활성, 셀로비아제 활성, 또는 자일라나제 활성을 지닌다. 일 실시형태에 있어서, 셀로비아제 활성을 지닌 폴리펩타이드는 트리코더마 리세이로부터의 Cel3a, 또는 이의 작용적 변이체 또는 이의 단편을 포함한다. 다른 실시형태에 있어서, 셀로비아제 활성을 지닌 폴리펩타이드는 서열번호 1을 포함한다.
글리코실화가 불충분한 숙주 세포의 이용
실시형태들에 있어서, 발현 벡터는 세포, 예컨대, 박테리아 숙주 세포에서 발현된 단백질을 충분히 글리코실화하지 못하는 세포에 도입되고 당해 세포에서 발현되는 융합 태그에 작동 가능하게 연결된 본 명세서에 기재된 바이오매스-분해 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열을 포함한다. 재조합 숙주 세포는 폴리펩타이드의 발현 조건 하에 배양되어, 바이오매스-분해 활성을 지니는 아글리코실화된 폴리펩타이드의 생성을 유발한다. 아글리코실화된 폴리펩타이드는 본 명세서에 기재된 바와 같은 융합 태그를 위하여 친화도 크로마토그래피 방법을 이용해서 숙주 세포로부터 정제 또는 단리될 수 있다.
예를 들어, 이 실시형태에 있어서, 발현 벡터는 바이오매스-분해 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열의 상류에 lac 오퍼레이터 및 T7 프로모터를 함유하고, 숙주 세포는 T7 RNA 중합효소를 발현하는 능력을 지닌다. 바이오매스-분해 활성을 지니는 폴리펩타이드의 발현은 IPTG의 첨가에 의해 유도된다. 바람직하게는, 숙주 세포는 이. 콜라이 세포, 바람직하게는 이. 콜라이 오리가미 세포이다. 이 실시형태에 있어서, 융합 태그는 His-태그이고, 발현된 아글리코실화된 폴리펩타이드의 정제는 니켈 친화도 크로마토그래피를 포함한다.
글리코실화를 위한 능력을 가진 숙주 세포의 이용
다른 실시형태에 있어서, 폴리펩타이드가 본 명세서에 기재된 바와 같이 글리코실화되지 않도록 1개 이상의 글리코실화 부위 돌연변이를 포함하는 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 발현 벡터는 숙주 세포에서 발현되고, 여기서 숙주 세포는 당해 세포, 예컨대, 효모 또는 진균 숙주 세포 내에서 발현된 단백질을 글리코실화할 수 있다. 대안적으로, 숙주 세포는 세포, 예컨대, 박테리아 숙주 세포 내에서 발현된 단백질을 글리코실화할 수 없다. 이 실시형태에 있어서, 폴리펩타이드는 융합 태그에 작동 가능하게 연결된다. 아글리코실화된 폴리펩타이드는 본 명세서에 기재된 바와 같은 융합 태그에 대해서 친화도 크로마토그래피 방법을 이용해서 박테리아 숙주 세포로부터 정제 또는 단리될 수 있다.
또 다른 실시형태에 있어서, 본 명세서에 기재된 바이오매스-분해 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 발현 벡터는 숙주 세포에서 발현되되, 여기서 숙주 세포는 세포 내에 발현된 단백질을 글리코실화할 수 있다. 세포는 폴리펩타이드의 발현 및 글리코실화를 위하여 충분한 조건 하에서 배양된다. 이 실시형태에 있어서, 폴리펩타이드는 융합 태그에 작동 가능하게 연결된다. 글리코실화 폴리펩타이드는 본 명세서에 기재된 바와 같은 융합 태그를 위하여 친화도 크로마토그래피 방법을 이용해서 박테리아 숙주 세포로부터 정제 또는 단리될 수 있다. 숙주 세포 및 기타 내인성 숙주 효소, 예컨대, 글리코실화 효소로부터의 정제 후에, 단리된 글리코실화 폴리펩타이드의 글리칸은 탈글리코실화 효소와의 인큐베이션에 의해 제거될 수 있다. 탈글리코실화 효소는 PNGase F, PNGase A, EndoH(엔도글리코시다제 H), EndoS(엔도글리코시다제 S), EndoD(엔도글리코시다제 D), EndoF(엔도글리코시다제 F), EndoF1(엔도글리코시다제 F1), 또는 EndoF2(엔도글리코시다제 F2)를 포함한다. 글리칸의 완전한 제거를 위하여 충분한 효소를 함유하는 단백질 탈글리코실화 믹스는, 예컨대, 뉴잉글랜드 바이오랩스사(New England Biolabs)로부터 상업적으로 입수 가능하다. 단리된 폴리펩타이드는 폴리펩타이드로부터 글리칸의 전부를 제거하는데 충분한 조건 하에서 1종 이상의 탈글리코실화 효소와 함께 인큐베이팅된다. 폴리펩타이드로부터 글리칸을 제거하기 위하여, 기타 방법, 예컨대, 온화한 알칼리 또는 온화한 하이드라진분해에 의한 β-제거가 당업계에 공지되어 있다. 폴리펩타이드의 글리코실화 상태의 평가는 당업계에 공지된 글리칸의 염색 및 시각화를 위한 방법 또는 질량 분광법을 이용해서 결정될 수 있다.
또 다른 실시형태에 있어서, 본 명세서에 기재된 바이오매스-분해 활성을 지니는 폴리펩타이드를 암호화하는 핵산 서열을 포함하는 발현 벡터는 숙주 세포에서 발현되되, 여기서 숙주 세포는 세포 내에 발현된 단백질을 글리코실화할 수 있다. 세포는 폴리펩타이드의 발현을 위하여 충분한 조건 하이지만 글리코실화 저해제의 존재하에서 배양된다. 글리코실화 저해제는 발현된 폴리펩타이드가 이글리코실화되도록 하는 농도에서 그리고 충분한 시간 동안 존재한다. 이 실시형태에 있어서, 폴리펩타이드는 융합 태그에 작동 가능하게 연결된다. 얻어진 아글리코실화된 폴리펩타이드는 본 명세서에 기재된 바와 같은 융합 태그에 대해서 친화도 크로마토그래피 방법을 이용해서 박테리아 숙주 세포로부터 정제되거나 단리될 수 있다.
본 실시형태에서 사용하기 위한 적절한 글리코실화 저해제의 예는 투니카마이신, 벤질-GalNAc(벤질 2-아세트아미도-2-데옥시-α-D-갈락토피라노사이드), 2-플루오로-2-데옥시-D-글루코스, 및 5'CDP(5' 시티딜레이트 다이포스페이트)를 포함한다. 몇몇 실시형태에 있어서, 글리코실화 저해제의 조합물이 사용된다. 바람직하게는, 본 실시형태에서 사용되는 글리코실화 저해제의 농도는 폴리펩타이드의 글리코실화를 저해하는데 충분하지만, 숙주 세포의 단백질 발현의 세포독성 또는 저해를 일으키지 않는다.
바이오매스의 생성물로의 전환 방법
본 발명은, 본 명세서에 기재된 바와 같은 셀로비아제 활성을 지니는 아글리코실화된 폴리펩타이드를 이용해서 바이오매스를 생성물로 전환 또는 가공처리하기 위한 방법 및 화합물을 제공한다. 바이오매스를 당 생성물 등과 같은 생성물로 전환시키는 방법은, 예를 들어, 미국 특허 출원 제2014/0011258호(이의 내용은 그의 전문이 참고로 편입됨)에 기재된 바와 같이, 당업계에 공지되어 있다. 요약하면, 바이오매스는, 예컨대, 난분해성을 저감시키기 위하여 최적으로 전처리되고, 처리된 바이오매스를 바이오매스-분해, 또는 셀룰로스 분해 효소와 함께 인큐베이팅하여 당(예컨대, 글루코스 및/또는 자일로스)을 생성하는 당화 공정에 의해 당화된다. 당 생성물은 이어서 예컨대, 발효 또는 증류에 의해 최종 생성물을 생산하기 위하여 더욱 가공처리될 수 있다. 최종 생성물은 알코올(예컨대, 에탄올, 아이소뷰탄올 또는 n-뷰탄올), 당 알코올(예컨대, 에리트리톨, 자일리톨 또는 솔비톨), 또는 유기산(예컨대, 락트산, 피루브산, 숙신산)을 포함한다.
본 명세서에 기재된 공정들을 이용해서, 바이오매스 물질을, 1종 이상의 생성물, 예컨대, 에너지, 연료, 식품 및 물질로 전환시킬 수 있다. 생성물의 구체적인 예로는, 수소, 당(예컨대, 글루코스, 자일로스, 아라비노스, 만노스, 갈락토스, 프럭토스, 셀로비오스, 이당류, 올리고당 및 다당류), 알코올(예컨대, 1가 알코올 혹은 2가 알코올, 예컨대, 에탄올, n-프로판올, 아이소뷰탄올, sec-뷰탄올, tert-뷰탄올 또는 n-뷰탄올), 수화된 혹은 함수 알코올(예컨대, 10%, 20%, 30% 초과 혹은 심지어 40% 초과의 물을 함유함), 바이오디젤, 유기산, 탄화수소(예컨대, 메탄, 에탄, 프로판, 아이소뷰텐, 펜탄, n-헥산, 바이오디젤, 바이오-가솔린 및 이들의 혼합물), 공동-생성물(예컨대, 단백질, 예를 들어, 셀룰로스 분해 단백질(효소) 또는 단세포 단백질), 및 임의의 조합 혹은 상대적인 농도에서, 그리고 선택적으로 임의의 첨가제(예컨대, 연료 첨가제)와의 조합에서의 이들의 임의의 혼합물을 포함하지만, 이들로 제한되는 것은 아니다. 기타 예로는, 카복실산, 카복실산의 염, 카복실산과 카복실산의 염과 카복실산의 에스터(예컨대, 메틸, 에틸 및 n-프로필 에스터)의 혼합물, 케톤(예컨대, 아세톤), 알데하이드(예컨대, 아세트알데하이드), 알파 및 베타 불포화 산(예컨대, 아크릴산) 및 올레핀(예컨대, 에틸렌)을 포함한다. 기타 알코올 및 알코올 유도체는 프로판올, 프로필렌 글리콜, 1,4-뷰탄다이올, 1,3-프로판다이올, 당 알코올 및 폴리올(예컨대, 글리콜, 글리세롤, 에리트리톨, 트레이톨, 아라비톨, 자일리톨, 리비톨, 만니톨, 솔비톨, 갈락티톨, 이디톨, 이노시톨, 볼레미톨, 아이소말트, 말티톨, 락티톨, 말토트리이톨, 말토테트라이톨 및 폴리글리시톨 및 기타 폴리올), 그리고 이들 알코올 중의 어느 것인가의 메틸 혹은 에틸 에스터를 포함한다. 기타 생성물로는, 메틸 아크릴레이트, 메틸 메타크릴레이트, 락트산, 시트르산, 폼산, 아세트산, 프로피온산, 뷰티르산, 숙신산, 발레르산, 카프로산, 3-하이드록시프로피온산, 팔미트산, 스테아르산, 옥살산, 말론산, 글루타르산, 올레산, 리놀레산, 글리콜산, 감마-하이드록시뷰티르산 및 이들의 혼합물, 이들 산의 어느 하나의 염, 이들 산의 어느 하나와 그들의 각각의 염의 혼합물을 포함한다.
바이오매스
본 명세서에 기재된 방법을 이용해서 가공처리된 바이오매스는 셀룰로스를 포함하는 전분 물질 및/또는 셀룰로스 물질, 예컨대, 리그노셀룰로스 물질이다. 바이오매스는 또한 헤미셀룰로스 및/또는 리그닌을 포함할 수 있다. 바이오매스는 농업 산물 또는 폐기물, 종이 제품 또는 폐기물, 임산물, 또는 일반 폐기물, 또는 이들의 임의의 조합물 중 하나 이상을 포함할 수 있다. 농업 산물 또는 폐기물은, 예컨대, 인간 또는 동물에 의해 사용 또는 소비하기 위하여 경작, 수확 또는 가공처리될 수 있는 물질, 또는 그 경작, 수확 또는 가공처리 방법으로부터 생성된 임의의 중간체, 부산물 또는 폐기물을 포함한다. 농업 산물 또는 폐기물은 사탕 수수, 황마, 대마, 아마, 대나무, 사이잘마, 알팔파, 건초, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 옥수수 속대, 옥수수 겉대, 옥수수 섬유, 코코넛 헤어, 사탕무우박, 버개스, 대두 여물, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 또는 비즈윙, 또는 이들의 조합을 포함하지만, 이들로 제한되는 것은 아니다. 종이 제품 또는 폐기물은 종이 제품을 제조하거나 파괴시키는 것으로부터 생성된 종이 제품, 임의의 종이 제품, 또는 임의의 중간체, 부산물 또는 폐기물을 제조하는데 이용되는 물질을 포함한다. 종이 제품 또는 폐기물은, 종이, 색소지, 적재지, 코팅지, 골판지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 또는 제지용 펄프, 또는 이들의 조합물을 포함하지만, 이들로 제한되는 것은 아니다. 임산물 또는 폐기물은 목재의 경작, 수확 또는 가공처리에 의해 생성된 물질, 또는 목재의 경작, 수확 또는 가공처리로부터 생성된 임의의 중간체, 부산물 또는 폐기물을 포함한다. 임산물 또는 폐기물은, 백양나무 목재, 나무의 임의의 속 또는 종으로부터의 목재, 파티클 보드, 목재 칩, 또는 톱밥, 또는 이들의 조합물을 포함하지만, 이들로 제한되는 것은 아니다. 일반 폐기물은 거름, 오수, 또는 왕겨, 또는 이들의 조합물을 포함하지만, 이들로 제한되는 것은 아니다.
하나의 실시형태에 있어서, 바이오매스는 전분 물질, 사탕수수, 농업 폐기물, 종이, 종이제품, 폐지, 제지용 펄프, 색소지, 적재지(loaded paper), 코팅지, 충전 종이(filled papers), 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 목면, 목재, 파티클 보드, 산림 폐기물, 톱밥, 백양나무 목재, 목재 칩, 목초, 지팽이풀, 억새, 코드 그래스(cord grass), 리이드 카나리 그래스(reed canary grass), 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 농업 폐기물, 사일리지, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 황마, 대마, 아마, 대나무, 사이잘마, 마닐라삼, 옥수수 속대, 옥수수 겉대, 대두 여물, 옥수수 섬유, 알팔파, 건초, 코코넛 헤어, 당 가공처리 잔류물, 버개스, 사탕무우박, 용설란 버개스, 해조류, 해초, 거름, 오수, 왕겨, 농작물 또는 산업 폐기물, 아라카차(arracacha), 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 또는 이들의 임의의 조합물을 포함하지만, 이들로 제한되는 것은 아니다. 바람직한 실시형태에 있어서, 바이오매스는 농업 폐기물, 예컨대, 옥수수 속대, 예컨대, 옥수수 겉대를 포함한다. 다른 실시형태에 있어서, 바이오매스는 목초를 포함한다.
하나의 실시형태에 있어서, 바이오매스는 본 명세서에 기재된 화합물과 접촉하기 전에 처리된다. 예를 들어, 바이오매스는 바이오매스의 난분해성을 저감시키고/시키거나, 그의 부피 밀도를 저감시키고/시키거나, 그의 표면적을 증가시키기 위하여 처리된다. 적절한 바이오매스 처리 방법은 전자를 이용한 충격, 초음파분해처리, 산화, 열분해, 증기 폭발, 화학적 처리, 기계적 처리, 및 동결 분쇄를 포함하지만, 이들로 제한되는 것은 아니다. 바람직하게는, 처리 방법은 전자를 이용한 충격이다.
몇몇 실시형태에 있어서, 전자 충격은 바이오매스가 적어도 0.5 M㎭, 예컨대, 적어도 5, 10, 20, 30, 또는 적어도 40 M㎭의 총 선량을 입수할 때까지 수행된다. 몇몇 실시형태에 있어서, 처리는 바이오매스가 약 0.5 M㎭ 내지 약 150 M㎭, 약 1 M㎭ 내지 약 100 M㎭, 약 5 M㎭ 내지 약 75 M㎭, 약 2 M㎭ 내지 약 75 M㎭, 약 10 M㎭ 내지 약 50 M㎭, 예컨대, 약 5 M㎭ 내지 약 50 M㎭, 약 20 M㎭ 내지 약 40 M㎭, 약 10 M㎭ 내지 약 35 M㎭, 또는 약 20 M㎭ 내지 약 30 M㎭의 선량을 받을 때까지 수행된다. 몇몇 구현예에서, 25 내지 35 M㎭의 총 선량이 바람직한데, 이상적으로는 각 패스(pass)가 약 1초 동안 적용되되 2초에 걸쳐서 적용되며, 예컨대, 5 M㎭/패스로 적용된다. 7 내지 9 M㎭/패스 이상의 선량을 적용하면, 몇몇 경우에 공급원료 재료의 열분해를 초래할 수 있다.
바이오매스 물질(예컨대, 식물 바이오매스, 동물 바이오매스, 종이, 및 도시 폐기물 바이오매스)은 유용한 중간체 및 생성물, 예를 들어, 유기산, 유기산의 염, 무수물, 유기산의 에스터 및 연료, 예컨대, 내연기관용 연료 또는 연료 전지용 공급원료를 생성하기 위하여 공급원료로서 이용될 수 있다. 용이하게 입수 가능한 공급원료 셀룰로스 및/또는 리그노셀룰로스 물질로서 이용될 수 있는 시스템 및 방법이 본 명세서에 기재되어 있지만, 예컨대, 도시 폐 스트림 및 폐지 스트림, 예컨대, 신문지, 크래프트지, 골판지 혹은 이들의 혼합물을 포함하는 스트림을 처리하는데 어려울 수 있다.
공급원료를 용이하게 가공처리될 수 있는 형태로 전환시키기 위하여, 공급원료 내 글루칸- 또는 자일란-함유 셀룰로스는, 당화제, 예컨대, 효소 혹은 산에 의해 저분자량 탄수화물, 예컨대, 당으로 가수분해될 수 있으며, 이 과정은 당화라 지칭된다. 저분자량 탄수화물은 이어서 예를 들어 기존의 제조 공장, 예컨대, 단세포 단백질 공장, 효소 제조 공장, 혹은 연료 공장, 예컨대, 에탄올 제조 설비에서 이용될 수 있다.
공급원료는, 용매 중, 예컨대, 수성 용액 중에서 효소와 재료를 배합함으로써, 예컨대, 효소를 이용해서 가수분해될 수 있다. 효소는 본 명세서에 기재된 방법에 따라서 유도될 수 있다.
구체적으로, 효소는 바이오매스(예컨대, 바이오매스의 셀룰로스 및/또는 리그닌 부분)를 파괴시킬 수 있거나, 각종 셀룰로스분해 효소(셀룰라제), 리그니나제 혹은 각종 소분자 바이오매스-분해 대사산물을 함유하거나 제조하는 유기체에 의해 공급될 수 있다. 이들 효소는 바이오매스의 결정성 셀룰로스 또는 리그닌 부분을 분해시키기 위하여 상승작용적으로 작용하는 효소의 복합체일 수 있다. 셀룰로스분해 효소의 예로는 엔도글루카나제, 셀로바이오하이드롤라제 및 셀로비아제(베타-글루코시다제)를 포함한다.
당화 동안, 셀룰로스 기질은 올리고머성 중간체를 생성하는 랜덤한 개소에서 엔도글루카나제에 의해 초기에 가수분해될 수 있다. 이어서, 이들 중간체는 셀룰로스 중합체의 말단으로부터 셀로비오스를 생산하기 위하여 셀로바이오하이드롤라제 등과 같은 글루카나제를 외부 분열시키기 위한 기질이다. 셀로비오스는 글루코스의 수-가용성 1,4-결합 이량체이다. 최종적으로, 셀로비아제는 셀로비오스를 분할시켜 글루코스를 수득한다. 이 과정의 효율(예컨대, 가수분해 시간 및 가수분해 완성도)은 셀룰로스 물질의 난분해성에 좌우된다.
당화
난분해성-저감된 바이오매스는 일반적으로 해당 난분해성-저감된 바이오매스와 바이오매스-분해 효소를 유체 배지, 예를 들어, 수성 용액 중에서 배합함으로써, 위에서 논의된 바이오매스-분해 효소로 처리된다. 몇몇 경우에, 공급원료는 미국 특허 출원 공개 제2012/0100577 A1호(Medoff 및 Masterman, 공개일; 2012년 4월 26일, 이 문헌의 전체 내용은 본 명세서에 포함됨)에 기재된 바와 같이 당화 전에 온수에서 비등되거나, 적셔지거나 혹은 조리된다.
본 명세서에서는, 본 명세서에 기재된 당화 공정에서 사용하기 위하여, 바이오매스를 분해시킬 수 있는 효소의 혼합물, 예컨대, 바이오매스-분해 효소의 효소 혼합물이 제공된다.
당화 공정은 제조 공장 내의 탱크(예컨대, 적어도 4000ℓ, 40,000ℓ, 500,000ℓ, 2,000,000ℓ, 4,000,000ℓ, 또는 6,000,000ℓ 혹은 그 이상의 체적을 지니는 탱크)에서 부분적으로 혹은 완전히 수행될 수 있고/있거나, 수송 중에, 예컨대, 레일 카 내, 탱커 트럭 내, 또는 초대형 유조선이나 선박의 선창 내에서 부분적으로 혹은 완전히 수행될 수 있다. 완전한 당화를 위해 필요한 시간은 이용된 바이오매스 물질과 효소 그리고 처리 조건에 좌우될 것이다. 당화가 제어된 조건 하에 제조 공장에서 수행된다면, 셀룰로스는 약 12 내지 96시간에 글루코스로 실질적으로 완전히 전환될 수 있다. 당화가 수송 중에 부분적으로 혹은 완전히 수행된다면, 당화는 더 오랜 시간이 걸릴 수도 있다.
바람직한 실시형태에 있어서, 당화 반응은, 예컨대, 바이오매스-분해 효소의 활성에 최적인 pH에서 일어나도록 효소 반응에 최적인 pH에서 일어난다. 바람직하게는, 당화 반응의 pH는 pH 4 내지 4.5이다. 바람직한 실시형태에 있어서, 당화 반응은, 예컨대, 바이오매스-분해 효소의 활성에 최적인 온도에서 일어나도록 효소 반응에 최적인 온도에서 일어난다. 바람직하게는, 당화 반응의 온도는 42℃ 내지 52℃이다.
일반적으로, 탱크 내용물은 당화 동안, 예를 들어, 국제 출원 제PCT/US2010/035331호(출원일: 2010년 5월 18일, 제WO 2010/135380호로 영어로 공개되고 미국을 지정함, 이 문헌의 전체 개시내용은 본 명세서에 참고로 편입됨)에 기재된 바와 같은 제트 혼합을 이용해서 혼합되는 것이 바람직하다.
계면활성제의 첨가는 당화의 속도를 증대시킬 수 있다. 계면활성제의 예로는, 비이온성 계면활성제, 예컨대, 트윈(Tween)(등록상표) 20 혹은 트윈(등록상표) 80, 폴리에틸렌 글리콜 계면활성제, 이온성 계면활성제, 또는 양성 계면활성제를 포함한다.
일반적으로 당화로부터 얻어지는 당 용액의 농도는 비교적 높은 것, 예컨대, 5 중량%, 7.5 중량%, 10 중량%, 10.5 중량% 초과, 또는 40 중량% 초과, 또는 50, 60, 70 중량% 초과, 또는 심지어 80중량% 초과인 것이 일반적으로 바람직하다. 물은, 당 용액의 농도를 증가시키기 위하여, 예컨대, 증발에 의해 제거될 수 있다. 이것은 출하될 부피를 감소시키며, 또한 용액 중의 미생물 증식을 억제한다.
대안적으로, 보다 낮은 농도의 당 용액이 이용될 수 있으며, 이 경우, 항균제 첨가제, 예컨대, 광범위 항생제를 낮은 농도, 예컨대, 50 내지 150 ppm으로 첨가하는 것이 바람직할 수 있다. 기타 적절한 항생제로는 암포테리신 B, 암피실린, 클로르암페니콜, 시프로플록사신, 겐타마이신, 하이그로마이신 B, 카나마이신, 네오마이신, 페니실린, 퓨로마이신, 스트렙토마이신을 포함한다. 항생제는 수송 및 저장 동안 미생물의 성장을 저해할 것이며, 적절한 농도, 예컨대, 15 내지 10,000 중량ppm, 예컨대, 25 내지 500 중량ppm, 또는 50 내지 150 중량ppm에서 이용될 수 있다. 필요한 경우, 항생제는 당 농도가 비교적 높더라도 포함될 수 있다. 대안적으로, 보존성의 항균제와 함께 다른 첨가제가 이용될 수 있다. 바람직하게는, 향균제 첨가제(들)는 식품-등급이다.
효소와 함께 바이오매스 재료에 첨가되는 물의 양을 제한함으로써 비교적 고농도의 용액이 얻어질 수 있다. 농도는 예컨대 얼마나 많은 당화가 일어나는지를 제어함으로써 제어될 수 있다. 예를 들어, 농도는 용액에 더 많은 바이오매스 재료를 첨가함으로써 증가될 수 있다. 용액 내에서 생성되고 있는 당을 유지하기 위하여, 계면활성제, 예컨대, 위에서 논의된 것들 중 하나가 첨가될 수 있다. 용해도는 용액의 온도를 증가시킴으로써 또한 증가될 수 있다. 예를 들어, 용액은 40 내지 50℃, 60 내지 80℃ 혹은 심지어 그 이상의 온도에서 유지될 수 있다.
본 명세서에 기재된 공정에 있어서, 예를 들어 당화 후, 당(예컨대, 글루코스 및 자일로스)은 단리될 수 있다. 예를 들어, 당은 석출, 결정화, 크로마토그래피(예컨대, 모사 이동상(simulated moving bed) 크로마토그래피, 고압 크로마토그래피), 원심분리, 추출, 당업계에 공지된 임의의 기타 단리 방법 및 이들의 조합에 의해 단리될 수 있다.
당화에서 이용하기 위한 혼합물
일 양상에 있어서, 본 발명은 본 명세서에 기재된 바와 같은 봉입체로부터 가용화된 바이오매스-분해 활성을 지닌 폴리펩타이드, 봉입체와 연관된 1종 이상의 단백질 및 가용화제를 포함하는 당화에 이용하기 위한 혼합물을 특징으로 한다. 하나의 실시형태에 있어서, 혼합물은 봉입체의 기타 성분, 숙주 세포에 내재하는 기타 단백질, 리보솜 성분, 핵산(예컨대, RNA 및/또는 DNA), 및 세포 찌꺼기(예컨대, 세포벽 찌꺼기, 지질, 대사산물)을 함유할 수 있다. 바이오매스-분해 활성을 지닌 폴리펩타이드는 글리코실화될 수 있거나 아글리코실화될 수 있다.
일 실시형태에 있어서, 혼합물은 셀로비아제 활성 및 요소를 지닌 폴리펩타이드를 포함한다. 하나의 실시형태에 있어서, 요소는 0.2 내지 6M에서 존재한다. 일 실시형태에 있어서, 혼합물은 트리코더마 리세이로부터의 Cel3a, 또는 이의 작용적 변이체 또는 이의 단편을 포함한다. 일 실시형태에 있어서, 혼합물은 트리코더마 리세이로부터의 Cel3a에 대해서 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 포함한다. 다른 실시형태에 있어서, 혼합물은 서열번호 1에 대해서 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 포함한다. 셀로비아제 활성을 지닌 폴리펩타이드는 글리코실화될 수 있거나 아글리코실화될 수 있다.
실시형태들에 있어서, 본 명세서에 기재된 효소 혼합물은 미생물로부터 유래된 적어도 1종의 추가의 효소를 더 포함하되, 여기서 추가의 효소는 바이오매스 또는 셀룰로스계 물질-분해 활성을 지닌다. 예를 들어, 추가의 효소는 리그니나제, 엔도글루카나제, 셀로바이오하이드롤라제, 자일라나제 또는 셀로비아제이다. 일 실시형태에 있어서, 혼합물은 1종 이상의 리그니나제, 1종 이상의 엔도글루코나제, 1종 이상의 셀로바이오하이드롤라제, 1종 이상의 자일라나제 또는 1종 이상의 셀로비아제를 더 포함한다. 실시형태들에 있어서, 추가의 바이오매스-분해 효소는 글리코실화된다. 실시형태들에 있어서, 효소 혼합물은 본 명세서에 기재된 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10 또는 적어도 20종 이상의 추가의 바이오매스-분해 효소를 더 포함한다. 수종의 바이오매스-분해 효소에 대한 전형적인 주된 아미노산 서열은 이하에 나타낸다.
예를 들어, 혼합물은 미생물, 예컨대, 진균 세포, 예를 들어, 야생형 트리코더마 리세이, 또는 이의 돌연변이체, 예컨대, 트리코더마 리세이 RUTC30에 의해 생산된 추가의 바이오매스-분해 효소들의 혼합물을 더 포함한다. 일 실시형태에 있어서, 추가의 바이오매스-분해 효소는 미생물로부터 단리된다. 일 실시형태에 있어서, 혼합물은 바이오매스-분해 효소 중 하나 이상을 포함한다: B2AF03, CIP1, CIP2, Cel1a, Cel3a, Cel5a, Cel6a, Cel7a, Cel7b, Cel12a, Cel45a, Cel74a, paMan5a, paMan26a 또는 스월레닌, 또는 이들의 임의의 조합물. 예컨대 위에서 나열된 추가의 바이오매스-분해 효소는, 미생물, 예컨대, 진균 세포로부터 내재적으로 발현되고 단리될 수 있으며, 이 세포로부터 (표 1에서 이하에 나열된) 효소가 유래된다. 대안적으로, 예컨대, 위에서 나열된 추가의 바이오매스-분해 효소는, 본 명세서에 기재된 숙주 세포에서 유사한 발현 방법을 이용해서 이종적으로 발현될 수 있고 숙주 세포로부터 단리될 수 있다. 일 실시형태에 있어서, 이종적으로 발현된 추가의 바이오매스-분해 효소는 당해 효소의 C 또는 N 말단에서 His 태그로 태깅되고, 당업계에 공지된 니켈 친화도 크로마토그래피 수법을 이용해서 단리된다. 예를 들어, 추가의 바이오매스-분해 효소는 이하의 표 1로부터 선택된다.
Figure pct00004
표 1에 나열된 바이오매스-분해 효소에 대한 아미노산 서열은 이하에 제공된다.
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
본 발명의 효소 혼합물에서 사용하기 위하여 적절한 바이오매스-분해 효소의 다른 예는 바실러스, 코프리누스, 마이셀리오프토라, 세팔로스포륨, 사이탈리듐, 페니실륨, 아스페르길루스, 슈도모나스, 후미콜라, 푸사륨, 티엘라비아, 아크레모늄, 크리소스포륨 및 트리코더마 속으로부터의 셀룰라제를 포함하며, 특히 아스페르길루스(예컨대, EP 공개 제0 458 162호), 후미콜라 인솔렌스(사이탈리듐 써모필룸으로서 재분류됨, 예컨대, 미국 특허 제4,435,307호 참조), 코프리누스 시네레우스, 푸사륨 옥시스포룸, 마이셀리오프토라 써모필라, 메리필루스 기간테우스, 티엘라비아 테레스트리스, 아크레모늄 종(Acremonium sp.)(아크레모늄 페르시시넘(A. persicinum), 아크레모늄 아크레모늄(A. acremonium), 아크레모늄 브라키페늄(A. brachypenium), 아크레모늄 디클로모스포룸(A. dichromosporum), 아크레모늄 오브클라바툼(A. obclavatum), 아크레모늄 핀커토니애(A. pinkertoniae), 아크레모늄 로세오그리세움(A. roseogriseum), 아크레모늄 인콜로라툼(A. incoloratum) 및 아크레모늄 푸라툼(A, furatum)을 포함하지만, 이들로 제한되는 것은 아님) 종으로부터 선택된 균주에 의해 생산된 것들을 포함한다. 바람직한 균주로는, 후미콜라 인솔렌스 DSM 1800, 푸사륨 옥시스포룸 DSM 2672, 마이셀리오프토라 써모필라 CBS 117.65, 세팔로스포륨종 RYM-202, 아크레모늄종 CBS 478.94, 아크레모늄종 CBS 265.95, 아크레모늄 페르시시넘 CBS 169.65, 아크레모늄 아크레모늄 AHU 9519, 세팔로스포륨종 CBS 535.71, 아크레모늄 브라키페늄 CBS 866.73, 아크레모늄 디클로모스포룸 CBS 683.73, 아크레모늄 오브클라바툼 CBS 311.74, 아크레모늄 핀커토니애 CBS 157.70, 아크레모늄 로세오그리세움 CBS 134.56, 아크레모늄 인콜로라툼 CBS 146.62, 및 아크레모늄 푸라툼 CBS 299.70H를 포함한다. 바이오매스-분해 효소는 또한 크리소스포륨, 바람직하게는, 크리소스포륨 룩노웬스로부터 얻어질 수 있다. 이용될 수 있는 부가적인 균주로는 트리코더마(특히 트리코더마 비리데(T. viride), 트리코더마 리세이 및 트리코더마 코닌기(T. koningii)), 호알칼리성 바실러스(alkalophilic Bacillus))(예를 들어, 미국 특허 제3,844,890호 및 EP 공보 제0 458 162호 참조) 및 스트렙토마이세스(Streptomyces)(예컨대, EP 공보 제0 458 162호 참조)를 포함하지만, 이들로 제한되는 것은 아니다.
실시형태들에 있어서, 미생물은 미유도 미생물에 비해서 바이오매스-분해 효소의 생성을 중가시키는데 적합한 조건 하에서 본 명세서에 기재된 바이오매스-분해 효소를 생성하도록 유도된다. 예를 들어, 본 명세서에 기재된 바와 같은 바이오매스를 포함하는 유도 바이오매스 샘플은 바이오매스-분해 효소의 생성을 증가시키기 위하여 미생물과 인큐베이팅된다. 유도 과정의 추가의 설명은 US 2014/0011258에서 찾을 수 있으며, 이 공보의 내용은 그의 전문이 참고로 본 명세서에 편입된다.
상기 언급된 미생물에 의해 생산되고/되거나 분비된 바이오매스-분해 효소는 단리되어 본 발명의 효소 혼합물에 또는 당화 반응에 직접 첨가될 수 있다. 대안적으로, 하나의 실시형태에 있어서, 본 명세서에서 그리고 위에서 기재된 바이오매스-분해 효소를 발현하는 전술한 미생물 또는 숙주 세포는 당화 반응에 첨가 전에 용해되지 않는다.
일 실시형태에 있어서, 명세서에 기재된 1종 이상의 추가의 바이오매스-분해 효소를 발현하는 숙주 세포를 포함하는 효소 혼합물은 명세서에 기재된 바이오매스-분해 활성을 지니는 가용화된 폴리펩타이드를 포함하는 혼합물과 함께 이용될 수 있다.
봉입체 및 가용화제로부터 가용화된 바이오매스-분해 활성을 지니는 폴리펩타이드를 포함하는 본 명세서에 기재된 혼합물의 사용은, 가용화된 폴리펩타이드의 추가가 없는 당화에 비해서 당화로부터의 당 생성물의 수율을 억제, 방지 또는 감소시키지 않는다. 몇몇 실시형태에 있어서, 당 생성물의 수율은, 가용화제 및 봉입체로부터 가용화된 바이오매스-분해활성을 지니는 폴리펩타이드를 포함하는 본 명세서에 기재된 혼합물의 사용 시 증가한다. 당 생성물의 수율은, 바이오매스-분해 효소드의 표준 혼합물이 가용화 폴리펩타이드 및 가용화제를 함유하는 혼합물 없이 당화에 첨가된 경우에 비해서 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100% 증가된다.
추가의 가공처리
추가의 가공처리 단계들이 대안적인 생성물을 생산하기 위하여 당화에 의해 생성된 당에 대해서 수행될 수 있다. 예를 들어, 당은 수소화되거나 발효되거나 또는 다른 화학약품으로 처리되어 다른 생성물을 생산할 수 있다.
글루코스는 솔비톨로 수소화될 수 있다. 자일로스는 자일리톨로 수소화될 수 있다. 수소화는 고압(예컨대, 10 내지 12000 psi) 하에 H2와 조합하여 촉매(예컨대, Pt/감마-Al2O3, Ru/C, 라니 니켈(Raney Nickel), 또는 당업계에 공지된 다른 촉매)의 사용에 의해 달성될 수 있다. 솔비톨 및/또는 자일리톨 생성물은 당업계에 공지된 방법을 이용해서 단리되고 정제될 수 있다.
당화로부터의 당 생성물은 또한 발효되어 알코올, 당 알코올, 예컨대, 에리트리톨, 또는 유기산, 예컨대, 락트산, 글루탐산 또는 시트르산 또는 아미노산을 생성할 수 있다.
예를 들어, 효모 및 지모모나스(Zymomonas) 박테리아는, 발효 또는 당(들)의 알코올(들)로의 전환을 위하여 이용될 수 있다. 다른 미생물이 이하에 논의되어 있다. 발효를 위한 최적 pH는 약 pH 4 내지 7이다. 예를 들어, 효모를 위한 최적 pH는 약 pH 4 내지 5인 반면, 지모모나스를 위한 최적 pH는 약 pH 5 내지 6이다. 전형적인 발효 시간은 약 24 내지 168시간(예컨대, 24 내지 96시간)이고 이때의 온도 범위는 20℃ 내지 40℃(예컨대, 26℃ 내지 40℃)이지만, 호열성 미생물은 보다 높은 온도를 선호한다.
몇몇 실시형태에 있어서, 예컨대, 혐기성 유기체가 사용될 경우, 발효의 적어도 일부는 산소의 부재, 예컨대, N2, Ar, He, CO2 또는 이들의 혼합물 등과 같은 불활성 기체의 블랭킷 하에 수행된다. 부가적으로, 상기 혼합물은 발효의 일부 혹은 전부 동안 탱크를 통해 흐르는 불활성 기체의 일정한 퍼지를 지닐 수 있다. 몇몇 경우에, 혐기성 조건은 발효 동안 이산화탄소 생산에 의해 달성되거나 유지될 수 있고, 부가적인 불활성 기체는 필요로 되지 않는다.
몇몇 실시형태에 있어서, 발효공정의 전부 혹은 일부는 저분자량 당이 생성물(예컨대, 에탄올)로 완전히 전환되기 전에 중단될 수 있다. 중간생성물인 발효 산물은 고농도의 당과 탄수화물을 포함한다. 당과 탄수화물은 당업계에 공지된 임의의 수단을 통해서 단리될 수 있다. 이들 중간생성물인 발효 산물은 인간 혹은 동물 소비를 위한 식품의 제조에 이용될 수 있다. 부가적으로 혹은 대안적으로, 중간생성물인 발효 산물은 밀가루-유사 물질을 생산하기 위하여 스테인레스강제 실험실 밀로 미립자 크기로 분쇄될 수 있다.
제트 혼합은 발효 동안 이용될 수 있고, 몇몇 경우에 당화와 발효는 동일 탱크에서 수행된다.
미생물에 대한 영양물질, 예를 들어, 미국 특허 출원 공개 제2012/0052536호(출원일: 2011년 7월 15일)에 기재된 식품-기반 영양물질 패키지가 당화 및/또는 발효 동안 첨가될 수 있으며, 이 문헌의 전체 개시내용은 참고로 본 명세서에 편입된다.
"발효"는 미국 특허 가출원 제61/579,559호(출원일: 2012년 12월 22일) 및 미국 특허 가출원 제61/579,576호(출원일: 2012년 12월 22일)에 개시된 방법 및 생성물을 포함하며, 이들 두 문헌의 내용은 그들의 전문이 본 명세서에 참고로 편입된다.
국제 특허 출원 제PCT/US2007/074028호(출원일: 2007년 7월 20일, WO 2008/011598로서 공개되었고, 미국을 지정함)에 기재된 바와 같은 이동식 발효기가 이용될 수 있고, 이들 문헌의 내용은 그들의 전문이 본 명세서에 포함된다. 마찬가지로, 당화 장비는 이동식일 수 있다. 또, 당화 및/또는 발효는 수송 동안 부분적으로 전체적으로 수행될 수 있다.
발효에 이용되는 미생물(들)은 천연-유래 미생물 및/또는 공학적으로 조작된 미생물일 수 있다. 예를 들어, 미생물은 박테리아(예컨대, 셀룰로스 분해 박테리아를 포함하지만, 이로써 제한되는 것은 아님), 균류(예컨대, 효모를 포함하지만, 이로써 제한되는 것은 아님), 식물, 원생생물, 예컨대, 원생동물문 혹은 균류-유사 원생생물(예컨대, 점균류를 포함하지만, 이로써 제한되는 것은 아님), 또는 조류일 수 있다. 유기체가 거부반응을 일으키지 않을 경우, 유기체의 혼합물이 이용될 수 있다.
적절한 발효 미생물은, 예컨대, 글루코스, 프럭토스, 자일로스, 아라비노스, 만노스, 갈락토스, 올리고당 혹은 다당류 등의 탄수화물을 발효 생성물로 전환시키는 능력을 지닌다. 발효 미생물로는, 사카로마이세스종(Saccharomyces spp.)의 속(genus)(사카로마이세스 세레비시아(S. cerevisiae)(빵 효모), 사카로마이세스 디스타티쿠스(S. distaticus), 사카로마이세스 우바룸(S. uvarum)을 포함하지만 이들로 제한되는 것은 아님), 클루이베로마이세스(Kluyveromyces)속(클루이베로마이세스 마르시아누스(K. marxianus), 클루이베로마이세스 프라길리스(K. fragilis) 을 포함하지만 이들로 제한되는 것은 아님), 칸디다(Candida)속(칸디다 슈도트로피칼리스(C. pseudotropicalis) 및 칸디다 브라시카에(C. brassicae)를 포함하지만 이들로 제한되는 것은 아님), 피키아 스티피티스(Pichia stipitis)(칸디다 쉐하타에(Candida shehatae)와 관련됨), 클라비스포라(Clavispora)속(클라비스포라 루시타니에(C. lusitaniae) 및 클라비스포라 오푼티애(C. opuntiae)를 포함하지만 이들로 제한되는 것은 아님), 파키솔렌(Pachysolen)속(파키솔렌 탄노필루스(P. tannophilus)을 포함하지만, 이로써 제한되는 것은 아님), 브레탄노마이세스(Bretannomyces)속(브레탄노마이세스 클라우세니이(B. clausenii)(Philippidis, G. P., 1996, Celluose bioconversion technology, Handbook on Bioethanol: Production and Utilization, Wyman, C.E., ed., Taylor & Francis, Washington, DC, 179-212)를 포함하지만, 이로써 제한되는 것은 아님)의 균주들을 포함한다. 기타 적절한 미생물로는, 예를 들어, 지모모나스 모빌리스(Zymomonas mobilis), 클로스트리듐 종(클로스트리듐 써모셀륨(C. thermocellum)(Philippidis, 1996, 전술함), 클로스트리듐 사카로뷰틸아세토니쿰(C. saccharobutylacetonicum), 클로스트리듐 티로뷰티리쿰(C. tyrobutyricum), 클로스트리듐 사카로뷰틸리쿰(C. saccharobutylicum), 클로스트리듐 푸니세움(C. Puniceum), 클로스트리듐 베이전키이(C. beijernckii), 클로스트리듐 아세토뷰틸리쿰(C. acetobutylicum)을 포함하지만, 이들로 제한되는 것은 아님), 모닐리엘라 폴리니스(Moniliella pollinis), 모닐리엘라 메가실리엔시스(Moniliella megachiliensis)), 락토바실러스 종(Lactobacillus spp.), 야로위아 리포리타카(Yarrowia lipolytica), 유레오바시디움 종(Aureobasidium sp.), 트리코스포로노이데스 종(Trichosporonoides sp.), 트리고놉시스 바리아빌리스(Trigonopsis variabilis), 트리코스포론 종(Trichosporon sp.), 모닐리엘라아세토아부탄스 종(Moniliellaacetoabutans sp.), 티풀라 바리아빌리스(Typhula variabilis), 칸디다 마그놀리애(Candida magnoliae), 우스틸라기노마이세테스 종(Ustilaginomycetes sp .), 슈도지마 츠쿠바엔시스(Pseudozyma tsukubaensis)의 균주, 지고사카로마이세스(Zygosaccharomyces), 데바리오마이세스(Debaryomyces), 한세눌라(Hansenula) 및 피키아(Pichia) 속의 효모 종, 및 데마티이드속 토룰라(Torula)의 진균을 포함한다.
예를 들어, 클로스트리듐 종(Clostridium spp.)은 에탄올, 뷰탄올, 뷰티르산, 아세트산 및 아세톤을 생산하는데 이용될 수 있다. 락토바실러스 종은 락트산을 생산하는데 이용될 수 있다.
이러한 많은 미생물 균주는, 두서너 가지 예를 들면, ATCC(American Type Culture Collection, 미국 버지니아주의 머내서스시에 소재), NRRL(Agricultural Research Service Culture Collection, 미국 일리노이주의 피오리아시에 소재) 또는 DSMZ(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH, 독일의 브라운슈바이크에 소재) 등과 같은 기탁소를 통해서 혹은 상업적으로 공개적으로 입수 가능하다.
상업적으로 입수 가능한 효모로는, 예를 들어, 레드 스타(Red Star)(등록상표)/라사프레 에탄올 레드(Lesaffre Ethanol Red)(미국 레드 스타/레사프레사(Red Star/Lesaffre)로부터 입수 가능), 팔리(FALI)(등록상표)(미국 번즈 필립스 푸드사(Burns Philip Food Inc.)의 분사인 플레이쉬만즈 이스트사(Fleischmann's Yeast)로부터 입수 가능), 수퍼스타트(SUPERSTART)(등록상표)(알테크(Alltech), 지금은 레일만드(Lalemand)로부터 입수 가능), 거트 스트란드(GERT STRAND)(등록상표)(스웨덴의 거트 스트란트 아베(Gert Strand AB)로부터 입수 가능) 및 페르몰(FERMOL)(등록상표)(DSM 스페셜티즈사(DSM Specialties)로부터 입수 가능)을 포함한다.
바이오매스 물질을 당화시키고 당을 생산하는데 이용될 수 있는 많은 미생물은 또한 이들 당을 유용한 생성물로 발효 및 전환시키는데 이용될 수 있다.
발효 후, 얻어지는 유체는, 예를 들어, "비어탑"(beer column)을 이용해서 증류되어 대부분의 물과 잔류 고체로부터 에탄올과 기타 알코올을 분리할 수 있다. 비어탑을 나온 증기는 예컨대, 35중량% 에탄올일 수 있고 정류탑으로 공급될 수 있다. 정류탑으로부터 거의 공비(azeotropic)(92.5%)의 에탄올과 물의 혼합물은 기상 분자체(vapor-phase molecular sieve)를 이용해서 순수한(99.5%) 에탄올로 정제될 수 있다. 비어탑 바닥부분은 3-작용 증발기의 제1 작용부에 보내질 수 있다. 정류탑 환류 응축기는 이 제1 작용부를 위해 열을 제공할 수 있다. 제1 작용 후, 고체는 원심분리기를 이용해서 분리되고 회전 건조기에서 건조될 수 있다. 원심분리기 유출물의 일부(25%)는 발효로 재순환될 수 있고, 나머지는 제2 및 제3 증발기 작용부로 보내질 수 있다. 대부분의 증발기 응축물은 적은 부분이 폐수 처리로 분리되어 낮은 비등 화합물의 구축을 방지하면서 상당히 깨끗한 응축물로서 상기 처리로 되돌아갈 수 있다.
본 명세서에 기재된 방법으로부터 생성물의 화학적 변형의 기타 유형, 예를 들어, (예컨대, 푸르푸랄 및 푸르푸랄-유래 생성물)과 같은 유기 당 유래 생성물이 이용될 수 있다. 당 유래 생성물의 화학적 변형은 미국 가출원 제61/667,481호(출원일: 2012년 7월 3일)에 기재되어 있으며, 이 문헌의 전체 개시내용은 참고로 그의 전문이 본 명세서에 편입된다.
실시예
본 발명은 이하의 실험적 실시예를 참조하여 상세히 더욱 설명된다. 이들 실시예는 단지 예시적인 목적을 위하여 제공되며, 달리 특정되지 않는 한 제한이 되도록 의도되지 않는다. 따라서 본 발명은 여하튼 이하의 실시예로 제한되는 것으로 해석되어서는 안 되고, 오히려 본 명세서에서 제공된 교시의 결과로서 명백해지는 모든 변형을 망라하도록 해석되어야 한다.
추가의 설명 없이도, 당업자라면, 선행하는 설명 및 이하의 예시적인 실시예를 이용해서 본 발명의 화합물을 제조하고 이용하고 그리고 청구된 방법을 실시할 수 있는 것으로 여겨진다. 이하의 작업예는 본 발명의 각종 양상을 구체적으로 가리키고 본 개시내용의 나머지를 어떠한 방식으로 제한하는 것으로 해석되어서는 안 된다.
실시예 1: 이. 콜라이 Cel3a - C'His 의 발현
Cel3a(아미노산 20 내지 744)에 대한 성숙 서열은 제네비즈사(Genewiz)에 의해 이. 콜라이 발현에 대해서 합성되고 코돈-최적화되었다. 이하의 실시예에서 지칭되는 Cel3a-C'His는 C-말단에서 8xHis(서열번호 21) 태그를 가진 Cel3a(aas 20 내지 744)에 대한 코돈-최적화된 성숙 서열을 지칭한다. 이하의 프라이머는 Cel3a-C'His를 pET-Duet(노바젠사, 카탈로그 번호 71146) 내로 클로닝하는데 이용되었다:
순방향 5'-CATGCC ATG GGCGATAGTCACAGTACCAGC(서열번호 4)
역방향 3'-CCCAAGCTT TCATTA GTGATGATGATGATGATGATGATGGCTGCCGCTGCCGGCAACACTCAGGGTGC(서열번호 5)
(NcoI 및 HindIII 부위는 밑줄그어져 있고; 개시 및 정지 코돈은 볼드체로 되어 있으며; 폴리히스티딘(8-His(서열번호 21)) 태그; 및 글리세린-세린(GSGS) 링커(서열번호 23)는 이탤릭체로 되어 있다.)
증폭 반응은 PfuUltra II 융합 HS 중합효소(애질런트사(Agilent), 카탈로그 번호 600672)를 이용해서 수행되었다.
증폭된 DNA는 제조사에 의해 제안된 조건 하에서 NcoI 제한 효소(뉴잉글랜드 바이오랩스사, R3193) 및 HindIII 제한 효소(뉴잉글랜드 바이오랩스사, R3104)를 이용해서 제한 소화에 의해 클로닝되었다. 소화된 증폭된 DNA는 T4 DN리가제(뉴잉글랜드 바이오랩스사, M0202)를 이용해서 pETDuet 벡터에서 NcoI-HindIII 부위로 결찰되고 나서, 이. 콜라이 클로닝 숙주인 탑10 원 샷(Top10 One Shot)(인비트로젠사(Invitrogen))의 형질전환되었다. 플라스미드 정제는 퀴아젠사(Qiagen)의 플라스미드 정제 키트를 이용해서 수행되었다.
Cel3A-C'His 작제물은 이. 콜라이 발현 숙주인 오리가미 B(DE3)(EMD 밀리포어사(Millipore), 카탈로그 번호 70837)로 형질전환시키고, LB 배지 및 100 ㎍/㎖ 암피실린(피셔 사이언티픽사(Fisher Scientific), 카탈로그 번호 BP1760), 15 ㎍/㎖ 카나마이신(피셔 사이언티픽사, 카탈로그 번호 BP906) 및 12.5 ㎍/㎖ 테트라사이클린(Fisher Scientified, 카탈로그 번호 BP912)을 수용하는 플레이트 상에 스트리킹하였다. 재조합 DNA를 보유하는 콜로니를 2㎖의 개시 배양액의 접촉 동안 플레이트로부터 선별하고, 37℃에서 하룻밤 성장시키고 나서, 후속하여 적절한 항생제를 함유하는 LB 배지 100㎖를 접종하는데 이용하였다. 배양액은 OD600이 0.8에 도달할 때까지 37℃에서 증식시켰다.
단백질 발현을 유도하기 위하여, 500μM IPTG(아이소프로필-b-D-티오갈락토피라노사이드; 피셔 사이언티픽사, 카탈로그 번호 BP1755)를 첨가하였다. 발현 배양액을 37℃에서 4시간 동안 더욱 증식시켰다. 세포를 소발(Sorvall) St16 회전자 TX400을 이용해서 30분 동안 실온(RT)에서 4200에서 원심분리에 의해 수확하였다.
실시예 2: 불용성 분획으로부터 Cel3a 가용화
실시예 1에 기재된 바와 같이, 바이오매스-분해 활성을 지니는 효소, Cel3a를 발현하는 이. 콜라이 배양액을 배양시키고 효소 발현을 유도하였다. 가용성 및 불용성 분획으로부터 C-말단에 His 태그가 태그된 Cel3a(Cel3a-C'His)의 단리는 다음과 같이 수행하였다. 세포 배양액을 4200 rpm에서 30분 동안 원심분리시켰다. 상청액을 따라내고 세포 펠릿을 1 ㎎/㎖ 라이소좀과 함께 용해 완충액 중에 재현탁시켰다. 세포 페이스트 1그램당 라이소나제, 예컨대, 10㎕의 라이소나제 바이오프로세싱 시약(Lysonase Bioprocessing Reagent)(EMD 밀리포어(Millipore) 71320)을 첨가하고, 이 샘플을 주위 온도에서 1시간 동안 인큐베이팅시켰다. 1시간 후에, 샘플을 30초의 간격으로 총 2분 동안 초음파분쇄처리하였다. 초음파분쇄 처리 후, 샘플을 10000 rpm에서 30분 동안 원심분리시켰다. 상청액, 또는 가용성 분획은 가용화된 Cel3a를 함유하는 한편, 나머지 펠릿, 또는 불용성 분획은 봉입체 및 불용성 Cel3a를 함유한다.
불용성 분획을 15분 동안 가용화제를 함유하는 완충액에 재현탁시키고, 구체적으로는, 6M 요소 pH 8 IMAC 결합 완충액 중에서 실온에서 와류시켰다. IMAC 정제를 위하여 준비하기 위하여 샘플을 이어서 0.45㎛ 막을 통해 여과시켰다. 첨가된 6M 요소 pH 8 IMAC 결합 완충액의 양은 세포 덩어리의 양에 비례하였고, 예컨대, 세포 덩어리 1 용적에 대해서 완충액 2 또는 3 용적이었다. 결합 완충액의 양은 가능한 샘플의 여과를 이루기 위하여 세포 덩어리가 증가함에 따라서 증가된다.
실시예 3: Cel3a 의 정제
Cel3a 의 정제
실시예 2로부터의 가용성 분획을 사전-평형화된 바이오-스케일(Bio-Scale)(상표명) 프로피니티(Profinity)(바이오라드사) Ni-주입된 IMAC 수지 슬러리(바이오라드사, 카탈로그 번호 732-4614) 100㎕를 수용하는 새로운 튜브로 옮겼다. 천연 결합 완충액은 50mM Tris HCl pH 7.5, 150mM NaCl, 0.1% 트리톤 X-100, 및 5μM 이미다졸을 함유하였다. 단백질은 실온(RT)에서 1시간 동안 배취-결합되었고, 이어서 25μM 이미다졸을 함유하는 천연 완충액으로 세척하였다. 단백질을 200μM 이미다졸을 함유하는 천연 완충액 300㎕에 용리시켰다.
불용성 Cel3a 의 정제
바이오-스케일(상표명) 미니 프로피니티 IMAC 5mL 카트리지(바이오라드사, 카탈로그 번호 732-4614)를 5 칼럼 용적의 6M 요소 pH8 IMAC 결합 완충액과 5 ㎖/분의 유량으로 평형화시켰다. 칼럼 평형화 후에, 실시예 2로부터의 재현탁된 불용성 분획을 1 ㎖/분의 유량으로 장입하였다. 이어서 칼럼에 15 칼럼 용적 세척액의 6M 요소 pH8 IMAC 결합 완충액을 5 ㎖/분의 유량으로 수용하였다. 가용화된 Cel3a를 이어서 10 칼럼 용적의 6M 요소 pH 4 IMAC 용리 완충액으로부터 5 ㎖/분의 유량으로 용리시켰다. 얻어진 가용화된 Cel3a 샘플은 6M 요소를 함유한다.
IMAC 크로마토그래피 분석은 (IMAC 칼럼, 바이오-스케일(상표명) 미니 프로피니티(상표명) IMAC 카트리지 5㎖(카탈로그 번호 732-4614)를 이용해서) 수행하였고, 도 1에 도시된 바와 같이 정제된 가용화된 Cel3a가 검출되었다.
SDS-PAGE 분석은 이하의 분획들에서 위에 기재된 정제로부터 Cel3a의 양을 평가하기 위하여 수행하였다: 정제된 가용성 Cel3a(도 2에서 레인 2); 불용성 분획의 IMAC 정제를 통한 흐름(도 2의 레인3); 및 불용성 분획으로부터의 정제된 Cel3a(가용화된 Cel3a)(도 2의 레인 4). 도 2에 도시된 바와 같이, Cel3a는 위에서 기재된 방법을 이용해서 불용성 분획의 봉입체로부터 성공적으로 단리되었다.
실시예 4: 가용화된 Cel3a 셀로비아제 활성의 분석
Cel3a는 실시예 3에 기재된 바와 같이 IMAC 수법을 이용해서 정제하였다. 활성 검정을 수행하기 전에, 정제된 Cel3a의 양(역가)은 브래드포드 검정 및/또는 나노드랍을 이용해서 결정되었다. 나노드랍 정량화를 위하여, 몰 소광 계수는 Cel3a의 표적 형태의 아미노산 서열을 ExPASy ProtParam 온라인 툴에 삽입함으로써 추정되었다.
활성 검정을 위하여, 정제된 Cel3a를 함유하는 샘플의 2배 연속 희석물은 완충액으로서 50mM 시트르산 나트륨, pH 5.0 NaOH를 이용해서 제조되었다. 희석물을 96 웰 플레이트의 하나의 열에 대해서 분취하였다. 희석물은 pH 5.0에서 50mM의 일염기성 시트르산나트륨 완충액 중 D-(+)-셀로비오스(플루카사(Fluka)) 기질 용액과 함께 48℃에서 30분 동안 인큐베이팅하였다. 플레이트를 접착제 플레이트 시일을 이용해서 즉시 밀봉하고, 48℃, 700 rpm에서 설정된 마이크로플레이트 인큐베이터 진탕기 상에 배치하였다. 30분 후에, 샘플을 가열건조욕 위에서 5분 동안 100℃에서 가열시켜 반응을 중지시켰다. 이어서 플레이트를 96 웰 포맷 0.45㎛ 듀라포어(Durapore) 막을 통해 여과시켰다. 여과액 샘플은 글루코스 및 셀로바이오스에 대해서 YSI 바이오케미스트리 분석기(Biochemistry analyser)(YSI 라이프 사이언시스사) 및/또는 HPLC(UPLC) 방법을 이용해서 분석하였다. 가용성 및 불용성 분획으로부터의 정제된 Cel3a의 희석액의 셀로비아제 활성은 그래프 상에 플롯하였으며, 그 결과를 도 3에 나타낸다. 도 3은 가용화된 Cel3a가 요소의 존재 중에서도 셀로비아제 활성을 지니는 것을 나타낸다.
셀로비아제 활성은 또한 실시예 3에 기재된 IMAC 정제 방법에 의해 정제되지 않았던 가용화된 Cel3a에 대해서 평가되었다. Cel3a를 발현하는 세포의 세포 펠릿을 6M 요소를 함유하는 가용화 완충액으로 가용화시키기 전에 용해 완충액으로 세척하였다. 6M 요소 완충액 중에 가용화된 Cel3a를 함유하는 조질의 용해 샘물의 셀로비아제 활성은 위에서 기재된 셀로비아제 검정에 의해 검정된다. 30분 내에 글루코스로 전환된 셀로바이오스의 백분율을 가용성 Cel3a, 가용성 세척액 및 조질의 용해물로부터의 가용화된 Cel3a 간에 비교하였다(도 4). 정제 없이 가용화된 Cel3a 또한 셀로비아제 활성을 지녔다.
등가물
본 명세서에서 인용된 모든 특허, 특허 출원 및 간행물의 개시내용은 그들의 전문이 참고로 본 명세서에 편입된다. 본 발명은 특정 양상들을 참조하여 개시되었지만, 본 발명의 기타 양상 및 변형이 본 발명의 진정한 정신과 범주로부터 벗어나는 일 없이 당업자에 의해 고안될 수 있는 것은 명백하다. 첨부된 청구범위는 이러한 모든 양상 및 등가의 변형을 포함하도록 해석되게끔 의도되어 있다.
SEQUENCE LISTING <110> XYLECO, INC. <120> SOLUBILIZED ENZYME AND USES THEREOF <130> WO 2016/049443 <140> PCT/US2015/052200 <141> 2015-09-25 <150> US 62/055,702 <151> 2014-09-26 <160> 23 <170> PatentIn version 3.5 <210> 1 <211> 731 <212> PRT <213> Trichoderma reesei <400> 1 Met Gly Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val Val 1 5 10 15 Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys Ala 20 25 30 Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser Gly 35 40 45 Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala Ser 50 55 60 Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly Val 65 70 75 80 Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala Ala 85 90 95 Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile Gly 100 105 110 Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val Ala 115 120 125 Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly Phe 130 135 140 Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile Asn 145 150 155 160 Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile Leu 165 170 175 Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp Asp 180 185 190 Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val Gln 195 200 205 Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr Thr 210 215 220 Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp Gln 225 230 235 240 Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His Thr 245 250 255 Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly Thr 260 265 270 Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn Ala 275 280 285 Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val Thr 290 295 300 Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly Tyr 305 310 315 320 Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr Asn 325 330 335 Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp Ala 340 345 350 Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly Ser 355 360 365 Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn Asp 370 375 380 Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly Ala 385 390 395 400 Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr Arg 405 410 415 Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn Thr 420 425 430 Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val Phe 435 440 445 Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn Ala 450 455 460 Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu Val 465 470 475 480 Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His Ser 485 490 495 Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val Lys 500 505 510 Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala Leu 515 520 525 Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val Tyr 530 535 540 Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser Gly 545 550 555 560 Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His Phe 565 570 575 Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu Ser 580 585 590 Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala Lys 595 600 605 Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp Leu 610 615 620 Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly Gln 625 630 635 640 Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser Ser 645 650 655 Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu Asn 660 665 670 Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg Arg 675 680 685 Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro Ser 690 695 700 Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg Leu 705 710 715 720 Thr Ser Thr Leu Ser Val Ala Gly Ser Gly Ser 725 730 <210> 2 <211> 2232 <212> DNA <213> Trichoderma reesei <400> 2 atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60 agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120 ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180 ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240 tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300 acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360 atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420 cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480 ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540 tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600 gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660 gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720 acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780 ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840 gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900 gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960 actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020 aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080 ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140 gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200 gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260 ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320 gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380 gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440 gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500 gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560 cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620 agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680 tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740 agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800 cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860 ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920 ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980 gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040 cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100 aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160 tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220 ctgtcggtag cg 2232 <210> 3 <211> 2232 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 3 atgcgttatc gtacagccgc agccctggca ctggccacag gtccgttcgc acgtgccgat 60 agtcacagta ccagcggtgc cagcgcagaa gccgtggttc cgccggcagg cacaccgtgg 120 ggcacagcct atgataaagc caaagccgcc ctggccaagc tgaatctgca ggataaagtg 180 ggcatcgtga gtggcgtggg ctggaacggt ggtccgtgcg ttggcaacac cagcccggca 240 agcaagatca gctatccgag cttatgcctg caggatggtc cgctgggcgt gcgctatagc 300 accggtagta ccgcctttac acctggtgtg caggccgcca gtacctggga cgttaacctg 360 atccgcgaac gtggccaatt tatcggcgaa gaagttaaag ccagcggcat tcatgttatt 420 ctgggtccgg tggccggtcc tctgggtaaa accccgcagg gcggccgtaa ttgggaaggc 480 ttcggcgttg atccgtattt aaccggcatc gcaatgggcc agaccattaa tggcatccag 540 agcgtgggtg ttcaagccac cgccaaacac tacatattaa acgaacagga actgaatcgt 600 gaaaccatca gcagcaatcc ggatgatcgc accctgcatg agctgtatac atggcctttt 660 gccgacgcag ttcaggccaa cgtggcaagt gtgatgtgta gctataacaa ggtgaacacc 720 acctgggcct gcgaagacca gtacaccctg cagaccgttt taaaagacca actgggcttc 780 cctggttacg tgatgacaga ttggaatgcc cagcacacaa ccgttcagag cgcaaacagt 840 ggcctggata tgagcatgcc gggcaccgac ttcaacggca ataatcgtct gtggggtccg 900 gcactgacca atgccgttaa cagcaaccag gtgccgacca gtcgtgtgga cgatatggtt 960 acccgtattc tggccgcctg gtacctgaca ggtcaagacc aggccggcta cccgagcttc 1020 aacatcagcc gcaacgtgca gggtaatcac aagaccaacg ttcgcgcaat cgcacgcgat 1080 ggtatcgtgc tgttaaagaa cgatgccaac attctgccgc tgaaaaaacc ggccagcatc 1140 gccgttgttg gtagcgcagc catcattggc aaccacgccc gtaacagtcc gagctgcaat 1200 gataaaggct gtgacgacgg tgccctgggc atgggttggg gtagtggtgc cgtgaactac 1260 ccgtatttcg tggccccgta cgacgccatt aacacccgtg caagtagcca gggtacccag 1320 gttaccctga gcaacaccga caacacaagc agcggtgcca gtgcagcacg tggtaaggat 1380 gtggccatcg tgttcatcac cgccgacagc ggcgaaggct acattaccgt ggagggtaat 1440 gccggtgatc gcaataatct ggacccgtgg cataacggca acgccctggt tcaggcagtg 1500 gcaggcgcaa atagcaacgt gatcgttgtg gtgcatagcg tgggtgccat cattctggag 1560 cagatcctgg ccctgccgca agttaaggca gttgtgtggg caggtctgcc gagccaagaa 1620 agtggcaatg ccctggtgga cgttctgtgg ggcgatgtta gtccgagcgg caagctggtg 1680 tatacaatcg ccaagagccc gaacgactat aacacccgca tcgttagcgg cggcagtgat 1740 agcttcagcg agggcctgtt tatcgactac aagcatttcg atgatgccaa tattaccccg 1800 cgctacgaat ttggttatgg cctgagctat accaagttca actacagccg cctgagcgtt 1860 ttaagtaccg ccaagagtgg tccggcaaca ggtgccgtgg ttcctggtgg tccgagtgat 1920 ctgtttcaga atgtggccac cgtgaccgtg gatatcgcca acagtggtca ggttaccggc 1980 gccgaagtgg cacagctgta catcacctat ccgagcagtg caccgcgcac cccgccgaaa 2040 cagctgcgtg gcttcgccaa attaaacctg accccgggcc agagcggtac agcaaccttc 2100 aatattcgcc gccgtgatct gagctattgg gacaccgcca gccaaaaatg ggtggtgccg 2160 agcggcagct ttggcattag tgtgggtgca agtagccgcg acattcgctt aacaagcacc 2220 ctgagtgttg cc 2232 <210> 4 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 4 catgccatgg gcgatagtca cagtaccagc 30 <210> 5 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 5 cgtgggactc acaacggccg tcgccgtcgg tagtagtagt agtagtagta gtgattactt 60 tcgaaccc 68 <210> 6 <211> 800 <212> PRT <213> Podospora anserina <400> 6 Met Lys Ser Ser Val Phe Trp Gly Ala Ser Leu Thr Ser Ala Val Val 1 5 10 15 Arg Ala Ile Asp Leu Pro Phe Gln Phe Tyr Pro Asn Cys Val Asp Asp 20 25 30 Leu Leu Ser Thr Asn Gln Val Cys Asn Thr Thr Leu Ser Pro Pro Glu 35 40 45 Arg Ala Ala Ala Leu Val Ala Ala Leu Thr Pro Glu Glu Lys Leu Gln 50 55 60 Asn Ile Val Ser Lys Ser Leu Gly Ala Pro Arg Ile Gly Leu Pro Ala 65 70 75 80 Tyr Asn Trp Trp Ser Glu Ala Leu His Gly Val Ala Tyr Ala Pro Gly 85 90 95 Thr Gln Phe Trp Gln Gly Asp Gly Pro Phe Asn Ser Ser Thr Ser Phe 100 105 110 Pro Met Pro Leu Leu Met Ala Ala Thr Phe Asp Asp Glu Leu Leu Glu 115 120 125 Lys Ile Ala Glu Val Ile Gly Ile Glu Gly Arg Ala Phe Gly Asn Ala 130 135 140 Gly Phe Ser Gly Leu Asp Tyr Trp Thr Pro Asn Val Asn Pro Phe Lys 145 150 155 160 Asp Pro Arg Trp Gly Arg Gly Ser Glu Thr Pro Gly Glu Asp Val Leu 165 170 175 Leu Val Lys Arg Tyr Ala Ala Ala Met Ile Lys Gly Leu Glu Gly Pro 180 185 190 Val Pro Glu Lys Glu Arg Arg Val Val Ala Thr Cys Lys His Tyr Ala 195 200 205 Ala Asn Asp Phe Glu Asp Trp Asn Gly Ala Thr Arg His Asn Phe Asn 210 215 220 Ala Lys Ile Ser Leu Gln Asp Met Ala Glu Tyr Tyr Phe Met Pro Phe 225 230 235 240 Gln Gln Cys Val Arg Asp Ser Arg Val Gly Ser Ile Met Cys Ala Tyr 245 250 255 Asn Ala Val Asn Gly Val Pro Ser Cys Ala Ser Pro Tyr Leu Leu Gln 260 265 270 Thr Ile Leu Arg Glu His Trp Asn Trp Thr Glu His Asn Asn Tyr Ile 275 280 285 Thr Ser Asp Cys Glu Ala Val Leu Asp Val Ser Leu Asn His Lys Tyr 290 295 300 Ala Ala Thr Asn Ala Glu Gly Thr Ala Ile Ser Phe Glu Ala Gly Met 305 310 315 320 Asp Thr Ser Cys Glu Tyr Glu Gly Ser Ser Asp Ile Pro Gly Ala Trp 325 330 335 Ser Gln Gly Leu Leu Lys Glu Ser Thr Val Asp Arg Ala Leu Leu Arg 340 345 350 Leu Tyr Glu Gly Ile Val Arg Ala Gly Tyr Phe Asp Gly Lys Gln Ser 355 360 365 Leu Tyr Ser Ser Leu Gly Trp Ala Asp Val Asn Lys Pro Ser Ala Gln 370 375 380 Lys Leu Ser Leu Gln Ala Ala Val Asp Gly Thr Val Leu Leu Lys Asn 385 390 395 400 Asp Gly Thr Leu Pro Leu Ser Asp Leu Leu Asp Lys Ser Arg Pro Lys 405 410 415 Lys Val Ala Met Ile Gly Phe Trp Ser Asp Ala Lys Asp Lys Leu Arg 420 425 430 Gly Gly Tyr Ser Gly Thr Ala Ala Tyr Leu His Thr Pro Ala Tyr Ala 435 440 445 Ala Ser Gln Leu Gly Ile Pro Phe Ser Thr Ala Ser Gly Pro Ile Leu 450 455 460 His Ser Asp Leu Ala Ser Asn Gln Ser Trp Thr Asp Asn Ala Met Ala 465 470 475 480 Ala Ala Lys Asp Ala Asp Tyr Ile Leu Tyr Phe Gly Gly Ile Asp Thr 485 490 495 Ser Ala Ala Gly Glu Thr Lys Asp Arg Tyr Asp Leu Asp Trp Pro Gly 500 505 510 Ala Gln Leu Ser Leu Ile Asn Leu Leu Thr Thr Leu Ser Lys Pro Leu 515 520 525 Ile Val Leu Gln Met Gly Asp Gln Leu Asp Asn Thr Pro Leu Leu Ser 530 535 540 Asn Pro Lys Ile Asn Ala Ile Leu Trp Ala Asn Trp Pro Gly Gln Asp 545 550 555 560 Gly Gly Thr Ala Val Met Glu Leu Val Thr Gly Leu Lys Ser Pro Ala 565 570 575 Gly Arg Leu Pro Val Thr Gln Tyr Pro Ser Asn Phe Thr Glu Leu Val 580 585 590 Pro Met Thr Asp Met Ala Leu Arg Pro Ser Ala Gly Asn Ser Gln Leu 595 600 605 Gly Arg Thr Tyr Arg Trp Tyr Lys Thr Pro Val Gln Ala Phe Gly Phe 610 615 620 Gly Leu His Tyr Thr Thr Phe Ser Pro Lys Phe Gly Lys Lys Phe Pro 625 630 635 640 Ala Val Ile Asp Val Asp Glu Val Leu Glu Gly Cys Asp Asp Lys Tyr 645 650 655 Leu Asp Thr Cys Pro Leu Pro Asp Leu Pro Val Val Val Glu Asn Arg 660 665 670 Gly Asn Arg Thr Ser Asp Tyr Val Ala Leu Ala Phe Val Ser Ala Pro 675 680 685 Gly Val Gly Pro Gly Pro Trp Pro Ile Lys Thr Leu Gly Ala Phe Thr 690 695 700 Arg Leu Arg Gly Val Lys Gly Gly Glu Lys Arg Glu Gly Gly Leu Lys 705 710 715 720 Trp Asn Leu Gly Asn Leu Ala Arg His Asp Glu Glu Gly Asn Thr Val 725 730 735 Val Tyr Pro Gly Lys Tyr Glu Val Ser Leu Asp Glu Pro Pro Lys Ala 740 745 750 Arg Leu Arg Phe Glu Ile Val Arg Gly Gly Lys Gly Lys Gly Lys Val 755 760 765 Lys Gly Lys Gly Lys Ala Ala Gln Lys Gly Gly Val Val Leu Asp Arg 770 775 780 Trp Pro Lys Pro Pro Lys Gly Gln Glu Pro Pro Ala Ile Glu Arg Val 785 790 795 800 <210> 7 <211> 316 <212> PRT <213> Trichoderma reesei <400> 7 Met Val Arg Arg Thr Ala Leu Leu Ala Leu Gly Ala Leu Ser Thr Leu 1 5 10 15 Ser Met Ala Gln Ile Ser Asp Asp Phe Glu Ser Gly Trp Asp Gln Thr 20 25 30 Lys Trp Pro Ile Ser Ala Pro Asp Cys Asn Gln Gly Gly Thr Val Ser 35 40 45 Leu Asp Thr Thr Val Ala His Ser Gly Ser Asn Ser Met Lys Val Val 50 55 60 Gly Gly Pro Asn Gly Tyr Cys Gly His Ile Phe Phe Gly Thr Thr Gln 65 70 75 80 Val Pro Thr Gly Asp Val Tyr Val Arg Ala Trp Ile Arg Leu Gln Thr 85 90 95 Ala Leu Gly Ser Asn His Val Thr Phe Ile Ile Met Pro Asp Thr Ala 100 105 110 Gln Gly Gly Lys His Leu Arg Ile Gly Gly Gln Ser Gln Val Leu Asp 115 120 125 Tyr Asn Arg Glu Ser Asp Asp Ala Thr Leu Pro Asp Leu Ser Pro Asn 130 135 140 Gly Ile Ala Ser Thr Val Thr Leu Pro Thr Gly Ala Phe Gln Cys Phe 145 150 155 160 Glu Tyr His Leu Gly Thr Asp Gly Thr Ile Glu Thr Trp Leu Asn Gly 165 170 175 Ser Leu Ile Pro Gly Met Thr Val Gly Pro Gly Val Asp Asn Pro Asn 180 185 190 Asp Ala Gly Trp Thr Arg Ala Ser Tyr Ile Pro Glu Ile Thr Gly Val 195 200 205 Asn Phe Gly Trp Glu Ala Tyr Ser Gly Asp Val Asn Thr Val Trp Phe 210 215 220 Asp Asp Ile Ser Ile Ala Ser Thr Arg Val Gly Cys Gly Pro Gly Ser 225 230 235 240 Pro Gly Gly Pro Gly Ser Ser Thr Thr Gly Arg Ser Ser Thr Ser Gly 245 250 255 Pro Thr Ser Thr Ser Arg Pro Ser Thr Thr Ile Pro Pro Pro Thr Ser 260 265 270 Arg Thr Thr Thr Ala Thr Gly Pro Thr Gln Thr His Tyr Gly Gln Cys 275 280 285 Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys Ala Ser Gly Thr Thr 290 295 300 Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys Leu 305 310 315 <210> 8 <211> 460 <212> PRT <213> Trichoderma reesei <400> 8 Met Ala Ser Arg Phe Phe Ala Leu Leu Leu Leu Ala Ile Pro Ile Gln 1 5 10 15 Ala Gln Ser Pro Val Trp Gly Gln Cys Gly Gly Ile Gly Trp Ser Gly 20 25 30 Pro Thr Thr Cys Val Gly Gly Ala Thr Cys Val Ser Tyr Asn Pro Tyr 35 40 45 Tyr Ser Gln Cys Ile Pro Ser Thr Gln Ala Ser Ser Ser Ile Ala Ser 50 55 60 Thr Thr Leu Val Thr Ser Phe Thr Thr Thr Thr Ala Thr Arg Thr Ser 65 70 75 80 Ala Ser Thr Pro Pro Ala Ser Ser Thr Gly Ala Gly Gly Ala Thr Cys 85 90 95 Ser Ala Leu Pro Gly Ser Ile Thr Leu Arg Ser Asn Ala Lys Leu Asn 100 105 110 Asp Leu Phe Thr Met Phe Asn Gly Asp Lys Val Thr Thr Lys Asp Lys 115 120 125 Phe Ser Cys Arg Gln Ala Glu Met Ser Glu Leu Ile Gln Arg Tyr Glu 130 135 140 Leu Gly Thr Leu Pro Gly Arg Pro Ser Thr Leu Thr Ala Ser Phe Ser 145 150 155 160 Gly Asn Thr Leu Thr Ile Asn Cys Gly Glu Ala Gly Lys Ser Ile Ser 165 170 175 Phe Thr Val Thr Ile Thr Tyr Pro Ser Ser Gly Thr Ala Pro Tyr Pro 180 185 190 Ala Ile Ile Gly Tyr Gly Gly Gly Ser Leu Pro Ala Pro Ala Gly Val 195 200 205 Ala Met Ile Asn Phe Asn Asn Asp Asn Ile Ala Ala Gln Val Asn Thr 210 215 220 Gly Ser Arg Gly Gln Gly Lys Phe Tyr Asp Leu Tyr Gly Ser Ser His 225 230 235 240 Ser Ala Gly Ala Met Thr Ala Trp Ala Trp Gly Val Ser Arg Val Ile 245 250 255 Asp Ala Leu Glu Leu Val Pro Gly Ala Arg Ile Asp Thr Thr Lys Ile 260 265 270 Gly Val Thr Gly Cys Ser Arg Asn Gly Lys Gly Ala Met Val Ala Gly 275 280 285 Ala Phe Glu Lys Arg Ile Val Leu Thr Leu Pro Gln Glu Ser Gly Ala 290 295 300 Gly Gly Ser Ala Cys Trp Arg Ile Ser Asp Tyr Leu Lys Ser Gln Gly 305 310 315 320 Ala Asn Ile Gln Thr Ala Ser Glu Ile Ile Gly Glu Asp Pro Trp Phe 325 330 335 Ser Thr Thr Phe Asn Ser Tyr Val Asn Gln Val Pro Val Leu Pro Phe 340 345 350 Asp His His Ser Leu Ala Ala Leu Ile Ala Pro Arg Gly Leu Phe Val 355 360 365 Ile Asp Asn Asn Ile Asp Trp Leu Gly Pro Gln Ser Cys Phe Gly Cys 370 375 380 Met Thr Ala Ala His Met Ala Trp Gln Ala Leu Gly Val Ser Asp His 385 390 395 400 Met Gly Tyr Ser Gln Ile Gly Ala His Ala His Cys Ala Phe Pro Ser 405 410 415 Asn Gln Gln Ser Gln Leu Thr Ala Phe Val Gln Lys Phe Leu Leu Gly 420 425 430 Gln Ser Thr Asn Thr Ala Ile Phe Gln Ser Asp Phe Ser Ala Asn Gln 435 440 445 Ser Gln Trp Ile Asp Trp Thr Thr Pro Thr Leu Ser 450 455 460 <210> 9 <211> 466 <212> PRT <213> Trichoderma reesei <400> 9 Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln 1 5 10 15 Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp 20 25 30 Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val 35 40 45 Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu 50 55 60 Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg 65 70 75 80 Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile 85 90 95 Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr 100 105 110 Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln 115 120 125 Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu 130 135 140 Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp 145 150 155 160 Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser 165 170 175 Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val 180 185 190 Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg 195 200 205 Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu 210 215 220 Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys 225 230 235 240 Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp 245 250 255 Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly 260 265 270 Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly 275 280 285 Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg 290 295 300 His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp 305 310 315 320 Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln 325 330 335 Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val 340 345 350 Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn 355 360 365 Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu 370 375 380 Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met 385 390 395 400 Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala 405 410 415 Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg 420 425 430 Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro 435 440 445 Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala 450 455 460 Ala Ala 465 <210> 10 <211> 744 <212> PRT <213> Trichoderma reesei <400> 10 Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe 1 5 10 15 Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val 20 25 30 Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys 35 40 45 Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser 50 55 60 Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala 65 70 75 80 Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly 85 90 95 Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala 100 105 110 Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile 115 120 125 Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val 130 135 140 Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly 145 150 155 160 Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile 165 170 175 Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile 180 185 190 Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp 195 200 205 Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val 210 215 220 Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr 225 230 235 240 Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp 245 250 255 Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His 260 265 270 Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly 275 280 285 Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn 290 295 300 Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val 305 310 315 320 Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly 325 330 335 Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr 340 345 350 Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp 355 360 365 Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly 370 375 380 Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn 385 390 395 400 Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly 405 410 415 Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr 420 425 430 Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn 435 440 445 Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val 450 455 460 Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn 465 470 475 480 Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu 485 490 495 Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His 500 505 510 Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val 515 520 525 Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala 530 535 540 Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val 545 550 555 560 Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser 565 570 575 Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His 580 585 590 Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu 595 600 605 Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala 610 615 620 Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp 625 630 635 640 Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly 645 650 655 Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser 660 665 670 Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu 675 680 685 Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg 690 695 700 Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro 705 710 715 720 Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg 725 730 735 Leu Thr Ser Thr Leu Ser Val Ala 740 <210> 11 <211> 418 <212> PRT <213> Trichoderma reesei <400> 11 Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr 1 5 10 15 Gly Gly Ala Ala Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile 20 25 30 Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr 35 40 45 Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr 50 55 60 Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr 65 70 75 80 Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala 85 90 95 Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr 100 105 110 Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser 115 120 125 Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Asp 130 135 140 Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val 145 150 155 160 Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr 165 170 175 Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val 180 185 190 Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly 195 200 205 Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser 210 215 220 Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro 225 230 235 240 His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val 245 250 255 Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro 260 265 270 Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala 275 280 285 Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu 290 295 300 Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His 305 310 315 320 Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala 325 330 335 Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly 340 345 350 Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln 355 360 365 Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly 370 375 380 Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Gly 385 390 395 400 Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala 405 410 415 Arg Lys <210> 12 <211> 471 <212> PRT <213> Trichoderma reesei <400> 12 Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala 1 5 10 15 Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly 20 25 30 Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly 35 40 45 Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly 50 55 60 Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg 65 70 75 80 Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly 85 90 95 Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr 100 105 110 Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr 115 120 125 Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met 130 135 140 Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu 145 150 155 160 Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile 165 170 175 Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val 180 185 190 Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu 195 200 205 Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp 210 215 220 Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu 225 230 235 240 Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr 245 250 255 Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr 260 265 270 Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala 275 280 285 Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala 290 295 300 Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu 305 310 315 320 Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr 325 330 335 Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu 340 345 350 Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn 355 360 365 Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly 370 375 380 Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly 385 390 395 400 Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val 405 410 415 Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala 420 425 430 Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala 435 440 445 Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr 450 455 460 Asn Ala Asn Pro Ser Phe Leu 465 470 <210> 13 <211> 514 <212> PRT <213> Trichoderma reesei <400> 13 Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg 1 5 10 15 Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr 20 25 30 Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser 35 40 45 Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser 50 55 60 Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp 65 70 75 80 Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala 85 90 95 Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe 100 105 110 Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met 115 120 125 Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe 130 135 140 Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala 145 150 155 160 Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro 165 170 175 Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln 180 185 190 Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly 195 200 205 Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly 210 215 220 Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu 225 230 235 240 Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu 245 250 255 Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr 260 265 270 Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr 275 280 285 Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys 290 295 300 Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr 305 310 315 320 Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly 325 330 335 Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu 340 345 350 Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln 355 360 365 Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp 370 375 380 Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr 385 390 395 400 Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr 405 410 415 Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys 420 425 430 Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn 435 440 445 Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr 450 455 460 Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln 465 470 475 480 Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val 485 490 495 Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln 500 505 510 Cys Leu <210> 14 <211> 459 <212> PRT <213> Trichoderma reesei <400> 14 Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile 1 5 10 15 Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val 20 25 30 His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val 35 40 45 Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His 50 55 60 Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr 65 70 75 80 Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly 85 90 95 Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr 100 105 110 Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser 115 120 125 Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys 130 135 140 Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro 145 150 155 160 Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly 165 170 175 Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr 180 185 190 Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn 195 200 205 Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly 210 215 220 Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala 225 230 235 240 Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys 245 250 255 Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr 260 265 270 Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu 275 280 285 Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser 290 295 300 Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala 305 310 315 320 Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val 325 330 335 Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu 340 345 350 Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser 355 360 365 Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile 370 375 380 Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro 385 390 395 400 Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr 405 410 415 Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly 420 425 430 Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys 435 440 445 Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu 450 455 <210> 15 <211> 234 <212> PRT <213> Trichoderma reesei <400> 15 Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala 1 5 10 15 Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr 20 25 30 Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys 35 40 45 Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp 50 55 60 Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln 65 70 75 80 Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro 85 90 95 Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val 100 105 110 Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser 115 120 125 Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly 130 135 140 Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp 145 150 155 160 Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val 165 170 175 Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe 180 185 190 Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val 195 200 205 Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu 210 215 220 Asn Val Ala Ser Trp Thr Ala Ser Ile Asn 225 230 <210> 16 <211> 242 <212> PRT <213> Trichoderma reesei <400> 16 Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser 1 5 10 15 Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala 20 25 30 Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile 35 40 45 Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr 50 55 60 Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu 65 70 75 80 Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala 85 90 95 Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn 100 105 110 Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly 115 120 125 Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp 130 135 140 Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala 145 150 155 160 Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro 165 170 175 Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser 180 185 190 Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr 195 200 205 Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys 210 215 220 Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys 225 230 235 240 Leu Pro <210> 17 <211> 838 <212> PRT <213> Trichoderma reesei <400> 17 Met Lys Val Ser Arg Val Leu Ala Leu Val Leu Gly Ala Val Ile Pro 1 5 10 15 Ala His Ala Ala Phe Ser Trp Lys Asn Val Lys Leu Gly Gly Gly Gly 20 25 30 Gly Phe Val Pro Gly Ile Ile Phe His Pro Lys Thr Lys Gly Val Ala 35 40 45 Tyr Ala Arg Thr Asp Ile Gly Gly Leu Tyr Arg Leu Asn Ala Asp Asp 50 55 60 Ser Trp Thr Ala Val Thr Asp Gly Ile Ala Asp Asn Ala Gly Trp His 65 70 75 80 Asn Trp Gly Ile Asp Ala Val Ala Leu Asp Pro Gln Asp Asp Gln Lys 85 90 95 Val Tyr Ala Ala Val Gly Met Tyr Thr Asn Ser Trp Asp Pro Ser Asn 100 105 110 Gly Ala Ile Ile Arg Ser Ser Asp Arg Gly Ala Thr Trp Ser Phe Thr 115 120 125 Asn Leu Pro Phe Lys Val Gly Gly Asn Met Pro Gly Arg Gly Ala Gly 130 135 140 Glu Arg Leu Ala Val Asp Pro Ala Asn Ser Asn Ile Ile Tyr Phe Gly 145 150 155 160 Ala Arg Ser Gly Asn Gly Leu Trp Lys Ser Thr Asp Gly Gly Val Thr 165 170 175 Phe Ser Lys Val Ser Ser Phe Thr Ala Thr Gly Thr Tyr Ile Pro Asp 180 185 190 Pro Ser Asp Ser Asn Gly Tyr Asn Ser Asp Lys Gln Gly Leu Met Trp 195 200 205 Val Thr Phe Asp Ser Thr Ser Ser Thr Thr Gly Gly Ala Thr Ser Arg 210 215 220 Ile Phe Val Gly Thr Ala Asp Asn Ile Thr Ala Ser Val Tyr Val Ser 225 230 235 240 Thr Asn Ala Gly Ser Thr Trp Ser Ala Val Pro Gly Gln Pro Gly Lys 245 250 255 Tyr Phe Pro His Lys Ala Lys Leu Gln Pro Ala Glu Lys Ala Leu Tyr 260 265 270 Leu Thr Tyr Ser Asp Gly Thr Gly Pro Tyr Asp Gly Thr Leu Gly Ser 275 280 285 Val Trp Arg Tyr Asp Ile Ala Gly Gly Thr Trp Lys Asp Ile Thr Pro 290 295 300 Val Ser Gly Ser Asp Leu Tyr Phe Gly Phe Gly Gly Leu Gly Leu Asp 305 310 315 320 Leu Gln Lys Pro Gly Thr Leu Val Val Ala Ser Leu Asn Ser Trp Trp 325 330 335 Pro Asp Ala Gln Leu Phe Arg Ser Thr Asp Ser Gly Thr Thr Trp Ser 340 345 350 Pro Ile Trp Ala Trp Ala Ser Tyr Pro Thr Glu Thr Tyr Tyr Tyr Ser 355 360 365 Ile Ser Thr Pro Lys Ala Pro Trp Ile Lys Asn Asn Phe Ile Asp Val 370 375 380 Thr Ser Glu Ser Pro Ser Asp Gly Leu Ile Lys Arg Leu Gly Trp Met 385 390 395 400 Ile Glu Ser Leu Glu Ile Asp Pro Thr Asp Ser Asn His Trp Leu Tyr 405 410 415 Gly Thr Gly Met Thr Ile Phe Gly Gly His Asp Leu Thr Asn Trp Asp 420 425 430 Thr Arg His Asn Val Ser Ile Gln Ser Leu Ala Asp Gly Ile Glu Glu 435 440 445 Phe Ser Val Gln Asp Leu Ala Ser Ala Pro Gly Gly Ser Glu Leu Leu 450 455 460 Ala Ala Val Gly Asp Asp Asn Gly Phe Thr Phe Ala Ser Arg Asn Asp 465 470 475 480 Leu Gly Thr Ser Pro Gln Thr Val Trp Ala Thr Pro Thr Trp Ala Thr 485 490 495 Ser Thr Ser Val Asp Tyr Ala Gly Asn Ser Val Lys Ser Val Val Arg 500 505 510 Val Gly Asn Thr Ala Gly Thr Gln Gln Val Ala Ile Ser Ser Asp Gly 515 520 525 Gly Ala Thr Trp Ser Ile Asp Tyr Ala Ala Asp Thr Ser Met Asn Gly 530 535 540 Gly Thr Val Ala Tyr Ser Ala Asp Gly Asp Thr Ile Leu Trp Ser Thr 545 550 555 560 Ala Ser Ser Gly Val Gln Arg Ser Gln Phe Gln Gly Ser Phe Ala Ser 565 570 575 Val Ser Ser Leu Pro Ala Gly Ala Val Ile Ala Ser Asp Lys Lys Thr 580 585 590 Asn Ser Val Phe Tyr Ala Gly Ser Gly Ser Thr Phe Tyr Val Ser Lys 595 600 605 Asp Thr Gly Ser Ser Phe Thr Arg Gly Pro Lys Leu Gly Ser Ala Gly 610 615 620 Thr Ile Arg Asp Ile Ala Ala His Pro Thr Thr Ala Gly Thr Leu Tyr 625 630 635 640 Val Ser Thr Asp Val Gly Ile Phe Arg Ser Thr Asp Ser Gly Thr Thr 645 650 655 Phe Gly Gln Val Ser Thr Ala Leu Thr Asn Thr Tyr Gln Ile Ala Leu 660 665 670 Gly Val Gly Ser Gly Ser Asn Trp Asn Leu Tyr Ala Phe Gly Thr Gly 675 680 685 Pro Ser Gly Ala Arg Leu Tyr Ala Ser Gly Asp Ser Gly Ala Ser Trp 690 695 700 Thr Asp Ile Gln Gly Ser Gln Gly Phe Gly Ser Ile Asp Ser Thr Lys 705 710 715 720 Val Ala Gly Ser Gly Ser Thr Ala Gly Gln Val Tyr Val Gly Thr Asn 725 730 735 Gly Arg Gly Val Phe Tyr Ala Gln Gly Thr Val Gly Gly Gly Thr Gly 740 745 750 Gly Thr Ser Ser Ser Thr Lys Gln Ser Ser Ser Ser Thr Ser Ser Ala 755 760 765 Ser Ser Ser Thr Thr Leu Arg Ser Ser Val Val Ser Thr Thr Arg Ala 770 775 780 Ser Thr Val Thr Ser Ser Arg Thr Ser Ser Ala Ala Gly Pro Thr Gly 785 790 795 800 Ser Gly Val Ala Gly His Tyr Ala Gln Cys Gly Gly Ile Gly Trp Thr 805 810 815 Gly Pro Thr Gln Cys Val Ala Pro Tyr Val Cys Gln Lys Gln Asn Asp 820 825 830 Tyr Tyr Tyr Gln Cys Val 835 <210> 18 <211> 373 <212> PRT <213> Podospora anserina <400> 18 Met Lys Gly Leu Phe Ala Phe Gly Leu Gly Leu Leu Ser Leu Val Asn 1 5 10 15 Ala Leu Pro Gln Ala Gln Gly Gly Gly Ala Ala Ala Ser Ala Lys Val 20 25 30 Ser Gly Thr Arg Phe Val Ile Asp Gly Lys Thr Gly Tyr Phe Ala Gly 35 40 45 Thr Asn Ser Tyr Trp Ile Gly Phe Leu Thr Asn Asn Arg Asp Val Asp 50 55 60 Thr Thr Leu Asp His Ile Ala Ser Ser Gly Leu Lys Ile Leu Arg Val 65 70 75 80 Trp Gly Phe Asn Asp Val Asn Asn Gln Pro Ser Gly Asn Thr Val Trp 85 90 95 Phe Gln Arg Leu Ala Ser Ser Gly Ser Gln Ile Asn Thr Gly Pro Asn 100 105 110 Gly Leu Gln Arg Leu Asp Tyr Leu Val Arg Ser Ala Glu Thr Arg Gly 115 120 125 Ile Lys Leu Ile Ile Ala Leu Val Asn Tyr Trp Asp Asp Phe Gly Gly 130 135 140 Met Lys Ala Tyr Val Asn Ala Phe Gly Gly Thr Lys Glu Ser Trp Tyr 145 150 155 160 Thr Asn Ala Arg Ala Gln Glu Gln Tyr Lys Arg Tyr Ile Gln Ala Val 165 170 175 Val Ser Arg Tyr Val Asn Ser Pro Ala Ile Phe Ala Trp Glu Leu Ala 180 185 190 Asn Glu Pro Arg Cys Lys Gly Cys Asn Thr Asn Val Ile Phe Asn Trp 195 200 205 Ala Thr Gln Ile Ser Asp Tyr Ile Arg Ser Leu Asp Lys Asp His Leu 210 215 220 Ile Thr Leu Gly Asp Glu Gly Phe Gly Leu Pro Gly Gln Thr Thr Tyr 225 230 235 240 Pro Tyr Gln Tyr Gly Glu Gly Thr Asp Phe Val Lys Asn Leu Gln Ile 245 250 255 Lys Asn Leu Asp Phe Gly Thr Phe His Met Tyr Pro Gly His Trp Gly 260 265 270 Val Pro Thr Ser Phe Gly Pro Gly Trp Ile Lys Asp His Ala Ala Ala 275 280 285 Cys Arg Ala Ala Gly Lys Pro Cys Leu Leu Glu Glu Tyr Gly Tyr Glu 290 295 300 Ser Asp Arg Cys Asn Val Gln Lys Gly Trp Gln Gln Ala Ser Arg Glu 305 310 315 320 Leu Ser Arg Asp Gly Met Ser Gly Asp Leu Phe Trp Gln Trp Gly Asp 325 330 335 Gln Leu Ser Thr Gly Gln Thr His Asn Asp Gly Phe Thr Ile Tyr Tyr 340 345 350 Gly Ser Ser Leu Ala Thr Cys Leu Val Thr Asp His Val Arg Ala Ile 355 360 365 Asn Ala Leu Pro Ala 370 <210> 19 <211> 469 <212> PRT <213> Podospora anserina <400> 19 Met Val Lys Leu Leu Asp Ile Gly Leu Phe Ala Leu Ala Leu Ala Ser 1 5 10 15 Ser Ala Val Ala Lys Pro Cys Lys Pro Arg Asp Gly Pro Val Thr Tyr 20 25 30 Glu Ala Glu Asp Ala Ile Leu Thr Gly Thr Thr Val Asp Thr Ala Gln 35 40 45 Val Gly Tyr Thr Gly Arg Gly Tyr Val Thr Gly Phe Asp Glu Gly Ser 50 55 60 Asp Lys Ile Thr Phe Gln Ile Ser Ser Ala Thr Thr Lys Leu Tyr Asp 65 70 75 80 Leu Ser Ile Arg Tyr Ala Ala Ile Tyr Gly Asp Lys Arg Thr Asn Val 85 90 95 Val Leu Asn Asn Gly Ala Val Ser Glu Val Phe Phe Pro Ala Gly Asp 100 105 110 Ser Phe Thr Ser Val Ala Ala Gly Gln Val Leu Leu Asn Ala Gly Gln 115 120 125 Asn Thr Ile Asp Ile Val Asn Asn Trp Gly Trp Tyr Leu Ile Asp Ser 130 135 140 Ile Thr Leu Thr Pro Ser Ala Pro Arg Pro Pro His Asp Ile Asn Pro 145 150 155 160 Asn Leu Asn Asn Pro Asn Ala Asp Thr Asn Ala Lys Lys Leu Tyr Ser 165 170 175 Tyr Leu Arg Ser Val Tyr Gly Asn Lys Ile Ile Ser Gly Gln Gln Glu 180 185 190 Leu His His Ala Glu Trp Ile Arg Gln Gln Thr Gly Lys Thr Pro Ala 195 200 205 Leu Val Ala Val Asp Leu Met Asp Tyr Ser Pro Ser Arg Val Glu Arg 210 215 220 Gly Thr Thr Ser His Ala Val Glu Asp Ala Ile Ala His His Asn Ala 225 230 235 240 Gly Gly Ile Val Ser Val Leu Trp His Trp Asn Ala Pro Val Gly Leu 245 250 255 Tyr Asp Thr Glu Glu Asn Lys Trp Trp Ser Gly Phe Tyr Thr Arg Ala 260 265 270 Thr Asp Phe Asp Ile Ala Ala Thr Leu Ala Asn Pro Gln Gly Ala Asn 275 280 285 Tyr Thr Leu Leu Ile Arg Asp Ile Asp Ala Ile Ala Val Gln Leu Lys 290 295 300 Arg Leu Glu Ala Ala Gly Val Pro Val Leu Trp Arg Pro Leu His Glu 305 310 315 320 Ala Glu Gly Gly Trp Phe Trp Trp Gly Ala Lys Gly Pro Glu Pro Ala 325 330 335 Lys Gln Leu Trp Asp Ile Leu Tyr Glu Arg Leu Thr Val His His Gly 340 345 350 Leu Asp Asn Leu Ile Trp Val Trp Asn Ser Ile Leu Glu Asp Trp Tyr 355 360 365 Pro Gly Asp Asp Thr Val Asp Ile Leu Ser Ala Asp Val Tyr Ala Gln 370 375 380 Gly Asn Gly Pro Met Ser Thr Gln Tyr Asn Glu Leu Ile Ala Leu Gly 385 390 395 400 Arg Asp Lys Lys Met Ile Ala Ala Ala Glu Val Gly Ala Ala Pro Leu 405 410 415 Pro Gly Leu Leu Gln Ala Tyr Gln Ala Asn Trp Leu Trp Phe Ala Val 420 425 430 Trp Gly Asp Asp Phe Ile Asn Asn Pro Ser Trp Asn Thr Val Ala Val 435 440 445 Leu Asn Glu Ile Tyr Asn Ser Asp Tyr Val Leu Thr Leu Asp Glu Ile 450 455 460 Gln Gly Trp Arg Ser 465 <210> 20 <211> 493 <212> PRT <213> Trichoderma reesei <400> 20 Met Ala Gly Lys Leu Ile Leu Val Ala Leu Ala Ser Leu Val Ser Leu 1 5 10 15 Ser Ile Gln Gln Asn Cys Ala Ala Leu Phe Gly Gln Cys Gly Gly Ile 20 25 30 Gly Trp Ser Gly Thr Thr Cys Cys Val Ala Gly Ala Gln Cys Ser Phe 35 40 45 Val Asn Asp Trp Tyr Ser Gln Cys Leu Ala Ser Thr Gly Gly Asn Pro 50 55 60 Pro Asn Gly Thr Thr Ser Ser Ser Leu Val Ser Arg Thr Ser Ser Ala 65 70 75 80 Ser Ser Ser Val Gly Ser Ser Ser Pro Gly Gly Asn Ser Pro Thr Gly 85 90 95 Ser Ala Ser Thr Tyr Thr Thr Thr Asp Thr Ala Thr Val Ala Pro His 100 105 110 Ser Gln Ser Pro Tyr Pro Ser Ile Ala Ala Ser Ser Cys Gly Ser Trp 115 120 125 Thr Leu Val Asp Asn Val Cys Cys Pro Ser Tyr Cys Ala Asn Asp Asp 130 135 140 Thr Ser Glu Ser Cys Ser Gly Cys Gly Thr Cys Thr Thr Pro Pro Ser 145 150 155 160 Ala Asp Cys Lys Ser Gly Thr Met Tyr Pro Glu Val His His Val Ser 165 170 175 Ser Asn Glu Ser Trp His Tyr Ser Arg Ser Thr His Phe Gly Leu Thr 180 185 190 Ser Gly Gly Ala Cys Gly Phe Gly Leu Tyr Gly Leu Cys Thr Lys Gly 195 200 205 Ser Val Thr Ala Ser Trp Thr Asp Pro Met Leu Gly Ala Thr Cys Asp 210 215 220 Ala Phe Cys Thr Ala Tyr Pro Leu Leu Cys Lys Asp Pro Thr Gly Thr 225 230 235 240 Thr Leu Arg Gly Asn Phe Ala Ala Pro Asn Gly Asp Tyr Tyr Thr Gln 245 250 255 Phe Trp Ser Ser Leu Pro Gly Ala Leu Asp Asn Tyr Leu Ser Cys Gly 260 265 270 Glu Cys Ile Glu Leu Ile Gln Thr Lys Pro Asp Gly Thr Asp Tyr Ala 275 280 285 Val Gly Glu Ala Gly Tyr Thr Asp Pro Ile Thr Leu Glu Ile Val Asp 290 295 300 Ser Cys Pro Cys Ser Ala Asn Ser Lys Trp Cys Cys Gly Pro Gly Ala 305 310 315 320 Asp His Cys Gly Glu Ile Asp Phe Lys Tyr Gly Cys Pro Leu Pro Ala 325 330 335 Asp Ser Ile His Leu Asp Leu Ser Asp Ile Ala Met Gly Arg Leu Gln 340 345 350 Gly Asn Gly Ser Leu Thr Asn Gly Val Ile Pro Thr Arg Tyr Arg Arg 355 360 365 Val Gln Cys Pro Lys Val Gly Asn Ala Tyr Ile Trp Leu Arg Asn Gly 370 375 380 Gly Gly Pro Tyr Tyr Phe Ala Leu Thr Ala Val Asn Thr Asn Gly Pro 385 390 395 400 Gly Ser Val Thr Lys Ile Glu Ile Lys Gly Ala Asp Thr Asp Asn Trp 405 410 415 Val Ala Leu Val His Asp Pro Asn Tyr Thr Ser Ser Arg Pro Gln Glu 420 425 430 Arg Tyr Gly Ser Trp Val Ile Pro Gln Gly Ser Gly Pro Phe Asn Leu 435 440 445 Pro Val Gly Ile Arg Leu Thr Ser Pro Thr Gly Glu Gln Ile Val Asn 450 455 460 Glu Gln Ala Ile Lys Thr Phe Thr Pro Pro Ala Thr Gly Asp Pro Asn 465 470 475 480 Phe Tyr Tyr Ile Asp Ile Gly Val Gln Phe Ser Gln Asn 485 490 <210> 21 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 8xHis tag <400> 21 His His His His His His His His 1 5 <210> 22 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 22 His His His His His His 1 5 <210> 23 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 Gly Ser Gly Ser 1

Claims (60)

  1. 바이오매스-분해 활성을 지니는 복수의 폴리펩타이드 및 가용화제(solubilizing agent)를 포함하는 혼합물로서, 상기 폴리펩타이드는 바이오매스-분해 활성을 지니는 천연 폴리펩타이드에 비해서 적어도 8 내지 10%의 바이오매스-분해 활성을 지니는, 혼합물.
  2. 제1항에 있어서, 봉입체(inclusion body)와 연관된 1종 이상의 단백질을 더 포함하는, 혼합물.
  3. 제1항에 있어서, 상기 혼합물은 봉입체와 연관된 1종 이상의 단백질을 포함하지 않는, 혼합물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 세포 찌꺼기(cellular debris), 1종 이상의 리보솜 성분, 1종 이상의 숙주 단백질, 및/또는 DNA 및/또는 RNA를 포함하는 숙주 핵산을 더 포함하는, 혼합물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 바이오매스-분해 활성은 셀로비아제 활성, 리그니나제 활성, 엔도글루카나제 활성, 셀로바이오하이드롤라제 활성 또는 자일라나제 활성인, 혼합물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 부분적으로 언폴딩되거나(unfolded), 부분적으로 미스폴딩되거나(misfolded) 또는 부분적으로 변성되는, 혼합물.
  7. 제1항에 있어서, 상기 폴리펩타이드는 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함하는, 혼합물.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 트리코더마 리세이(T. reesei)로부터의 Cel3A 효소, 또는 이의 기능적 변이체 또는 단편을 포함하는, 혼합물.
  9. 제8항에 있어서, 상기 Cel3A 효소는 서열번호 1의 아미노산 서열, 또는 이의 적어도 90%의 동일성을 가진 아미노산 서열을 포함하는, 혼합물.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 서열번호 2 또는 서열번호 3에 대해서 적어도 90%의 동일성을 포함하는 핵산 서열에 의해 암호화되는, 혼합물.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 아글리코실화되는, 혼합물.
  12. 제1항 내지 제3항 및 제7항 중 어느 한 항에 있어서, 상기 가용화제는 요소(urea)를 포함하고, 그리고 임의로, 0.2M 내지 6M의 농도에서 존재하는, 혼합물.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 바이오매스-분해 활성을 지니는 적어도 1종의 추가의 폴리펩타이드 또는 바이오매스-분해 활성을 지니는 1종 이상의 효소를 생산하는 미생물을 더 포함하는, 혼합물.
  14. 제13항에 있어서, 상기 추가의 폴리펩타이드는 리그니나제, 엔도글루카나제, 셀로바이오하이드롤라제, 셀로비아제 및 자일라나제, 또는 이들의 임의의 조합으로부터 선택되는, 혼합물.
  15. 제13항 또는 제14항에 있어서, 상기 추가의 폴리펩타이드는,
    a. 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함하는 폴리펩타이드;
    b. 트리코더마 리세이로부터의 Cel3A 효소, 또는 이의 기능적 변이체 또는 단편; 또는
    c. 서열번호 2 또는 서열번호 3을 포함하는(예컨대, 이로 이루어진) 핵산 서열에 의해 암호화된 폴리펩타이드로부터 선택되는, 혼합물.
  16. 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 추가의 폴리펩타이드는 아글리코실화되는, 혼합물.
  17. 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 추가의 폴리펩타이드는 글리코실화되는, 혼합물.
  18. 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열 및 가용화제를 가진 복수의 폴리펩타이드를 포함하는 혼합물로서, 상기 복수의 폴리펩타이드는 서열번호 1을 포함하는 천연 폴리펩타이드의 활성의 적어도 20% 내지 40%를 갖는, 혼합물.
  19. 제18항에 있어서, 봉입체와 연관된 1종 이상의 단백질을 더 포함하는, 혼합물.
  20. 제18항에 있어서, 상기 혼합물은 봉입체와 연관된 1종 이상의 단백질을 포함하지 않는, 혼합물.
  21. 제18항 내지 제20항 중 어느 한 항에 있어서, 세포 찌꺼기, 1종 이상의 리보솜 성분, 1종 이상의 숙주 단백질, 및/또는 DNA 및/또는 RNA를 포함하는 숙주 핵산을 더 포함하는, 혼합물.
  22. 제18항 내지 제21항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 부분적으로 언폴딩되거나, 부분적으로 미스폴딩되거나 또는 부분적으로 변성되는, 혼합물.
  23. 제18항 내지 제22항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 서열번호 2 또는 서열번호 3에 대해서 적어도 90%의 동일성을 포함하는 핵산 서열에 의해 암호화되는, 혼합물.
  24. 제18항 내지 제23항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 아글리코실화되는, 혼합물.
  25. 제18항 내지 제20항 중 어느 한 항에 있어서, 상기 가용화제는 요소를 포함하고, 그리고 임의로, 0.2M 내지 6M의 농도에서 존재하는, 혼합물.
  26. 제18항 내지 제25항 중 어느 한 항에 있어서, 바이오매스-분해 활성을 지니는 적어도 1종의 추가의 폴리펩타이드 또는 바이오매스-분해 활성을 지니는 1종 이상의 효소를 생산하는 미생물을 더 포함하는, 혼합물.
  27. 제26항에 있어서, 상기 추가의 폴리펩타이드는 리그니나제, 엔도글루카나제, 셀로바이오하이드롤라제, 셀로비아제 및 자일라나제, 또는 이들의 임의의 조합으로부터 선택되는, 혼합물.
  28. 제26항 또는 제27항에 있어서, 상기 추가의 폴리펩타이드는,
    a. 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함하는 폴리펩타이드;
    b. 트리코더마 리세이로부터의 Cel3A 효소, 또는 이의 기능적 변이체 또는 단편; 또는
    c. 서열번호 2 또는 서열번호 3을 포함하는(예컨대, 이로 이루어진) 핵산 서열에 의해 암호화된 폴리펩타이드로부터 선택되는, 혼합물.
  29. 제26항 내지 제28항 중 어느 한 항에 있어서, 상기 추가의 폴리펩타이드는 아글리코실화되는, 혼합물.
  30. 제26항 내지 제28항 중 어느 한 항에 있어서, 상기 추가의 폴리펩타이드는 글리코실화되는, 혼합물.
  31. 제1항 내지 제30항 중 어느 한 항의 혼합물을 제조하는 방법으로서, 바이오매스-분해 활성을 지니는 폴리펩타이드를 발현하는 세포, 또는 이의 용해물을, 상기 폴리펩타이드를 가용화시키는데 적합한 농도의 가용화제와 접촉시키는 단계를 포함하는, 혼합물을 제조하는 방법.
  32. 제31항에 있어서, 상기 세포를 용해시켜 용해물을 얻는 단계, 상기 용해물의 불용성 분획으로부터 가용성 분획을 분리하는 단계, 및 상기 불용성 분획을 상기 가용화제에 재현탁시키는 단계를 더 포함하는, 혼합물을 제조하는 방법.
  33. 제31항 또는 제32항에 있어서, 상기 가용화제는 요소를 포함하고, 그리고 임의로, 0.2M 내지 6M의 농도에서 존재하는, 혼합물을 제조하는 방법.
  34. 제31항 내지 제33항 중 어느 한 항에 있어서, 상기 바이오매스-분해 활성은 셀로비아제 활성, 리그니나제 활성, 엔도글루카나제 활성, 셀로바이오하이드롤라제, 또는 자일라나제 활성인, 혼합물을 제조하는 방법.
  35. 제31항 내지 제34항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함하는, 혼합물을 제조하는 방법.
  36. 제31항 내지 제35항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 트리코더마 리세이로부터의 Cel3A, 또는 이의 기능적 변이체 또는 단편을 포함하는, 혼합물을 제조하는 방법.
  37. 제31항 내지 제36항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 아글리코실화되는, 혼합물을 제조하는 방법.
  38. 바이오매스-분해 활성을 지니는 폴리펩타이드를 생성하는 방법으로서, 상기 폴리펩타이드를 세포 중에서 발현시키는 단계 및 상기 세포 또는 이의 용해물을 상기 폴리펩타이드를 가용화시키는데 적합한 농도의 가용화제와 접촉시키는 단계를 포함하는, 폴리펩타이드를 생성하는 방법.
  39. 바이오매스-분해 활성을 지니는 폴리펩타이드를 생성하는 방법으로서, 바이오매스-분해 활성을 지니는 적어도 하나의 폴리펩타이드를 생성하도록 유전자 변형된 세포를 제공하는 단계로서, 상기 바이오매스-분해 활성을 지니는 폴리펩타이드의 적어도 일부는 봉입체 내에서 발견되는, 상기 제공하는 단계, 및 상기 봉입체를 함유하는 상기 세포 또는 이의 용해물을, 상기 폴리펩타이드를 가용화시키는데 적합한 농도의 가용화제와 접촉시키는 단계를 포함하는, 폴리펩타이드를 생성하는 방법.
  40. 제38항 또는 제39항에 있어서, 상기 가용화제는 요소를 포함하는, 폴리펩타이드를 생성하는 방법.
  41. 제38항 내지 제40항 중 어느 한 항에 있어서, 상기 가용화제의 상기 농도는 0.2M 내지 6M인, 폴리펩타이드를 생성하는 방법.
  42. 제38항 내지 제41항 중 어느 한 항에 있어서, 상기 세포를 용해시켜 용해물을 얻는 단계, 상기 용해물의 불용성 분획으로부터 가용성 분획을 분리하는 단계, 및 상기 불용성 분획을 상기 가용화제에 재현탁시키는 단계를 더 포함하는, 폴리펩타이드를 생성하는 방법.
  43. 제38항 내지 제42항 중 어느 한 항에 있어서, 상기 바이오매스-분해 활성은 셀로비아제 활성, 리그니나제 활성, 엔도글루카나제 활성, 셀로바이오하이드롤라제 활성, 또는 자일라나제 활성인, 폴리펩타이드를 생성하는 방법.
  44. 제38항 또는 제39항에 있어서, 상기 폴리펩타이드는 서열번호 1에 대해서 적어도 90%의 동일성을 가진 아미노산 서열을 포함하는, 폴리펩타이드를 생성하는 방법.
  45. 제38항 내지 제44항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 트리코더마 리세이로부터의 Cel3A, 또는 이의 기능적 변이체 또는 단편을 포함하는, 폴리펩타이드를 생성하는 방법.
  46. 제38항 내지 제45항 중 어느 한 항에 있어서, 상기 세포는 원핵세포/박테리아 세포, 예컨대, 이. 콜라이(E. coli) 세포, 예컨대, 오리가미(Origami) 이. 콜라이 세포인, 폴리펩타이드를 생성하는 방법.
  47. 제38항 내지 제46항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 아글리코실화되는, 폴리펩타이드를 생성하는 방법.
  48. 바이오매스로부터 생성물을 생산하는 방법으로서, 바이오매스를, 상기 생성물의 생산에 적합한 조건 하에, 제1항 내지 제30항 중 어느 한 항의 혼합물, 및 임의로, 1종 이상의 바이오매스-분해 효소를 생산하는 미생물 및/또는 바이오매스-분해 효소를 포함하는 효소 혼합물과 접촉시키는 단계를 포함하는, 바이오매스로부터 생성물을 생산하는 방법.
  49. 제48항에 있어서, 상기 바이오매스를 상기 혼합물과 접촉시키기 전에 상기 바이오매스를 전자빔으로 처리하는 단계를 더 포함하는, 바이오매스로부터 생성물을 생산하는 방법.
  50. 제48항 또는 제49항에 있어서, 상기 생성물은 당 생성물인, 바이오매스로부터 생성물을 생산하는 방법.
  51. 제50항에 있어서, 상기 당 생성물은 글루코스 및/또는 자일로스인, 바이오매스로부터 생성물을 생산하는 방법.
  52. 제48항 내지 제51항 중 어느 한 항에 있어서, 상기 생성물을 단리시키는 단계를 더 포함하는, 바이오매스로부터 생성물을 생산하는 방법.
  53. 제52항에 있어서, 상기 생성물을 단리시키는 단계는 석출, 결정화, 크로마토그래피, 원심분리 및/또는 추출을 포함하는, 바이오매스로부터 생성물을 생산하는 방법.
  54. 제48항 내지 제53항 중 어느 한 항에 있어서, 상기 효소 혼합물은 B2AF03, CIP1, CIP2, Cel1a, Cel3a, Cel5a, Cel6a, Cel7a, Cel7b, Cel12a, Cel45a, Cel74a, paMan5a, paMan26a, 스월레닌(Swollenin)으로부터 선택된 효소의 적어도 2종을 포함하는, 바이오매스로부터 생성물을 생산하는 방법.
  55. 제48항 내지 제54항 중 어느 한 항에 있어서, 상기 바이오매스는 농업 산물 또는 폐기물, 종이 제품 또는 폐기물, 임산물(forestry product), 또는 일반 폐기물, 또는 이들의 임의의 조합물 중 한가지 이상을 포함하되;
    a) 농업 산물 또는 폐기물은 사탕 수수, 황마, 대마, 아마, 대나무, 사이잘마, 알팔파, 건초, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 옥수수 속대, 옥수수 겉대, 옥수수 섬유, 코코넛 헤어, 사탕무우박, 버개스, 대두 여물, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 또는 비즈윙(beeswing), 또는 이들의 조합물을 포함하고;
    b) 종이 제품 또는 폐기물은 종이, 색소지, 적재지, 코팅지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 또는 제지용 펄프, 또는 이들의 조합물을 포함하며;
    c) 임산물은 백양나무 목재, 파티클 보드, 목재 칩, 또는 톱밥, 또는 이들의 조합물을 포함하고; 그리고
    d) 일반 폐기물은 거름, 오수, 또는 왕겨, 또는 이들의 조합물을 포함하는, 바이오매스로부터 생성물을 생산하는 방법.
  56. 제48항 내지 제55항 중 어느 한 항에 있어서, 상기 바이오매스의 난분해성(recalcitrance)을 저감시키기 위하여 상기 미생물 또는 상기 효소 혼합물을 도입하기 전에 상기 바이오매스를 처리하는 단계를 더 포함하되, 상기 처리는 전자를 이용한 충격, 초음파분해처리, 산화, 열분해, 증기 폭발(steam explosion), 화학적 처리, 기계적 처리, 또는 동결 분쇄를 포함하는, 바이오매스로부터 생성물을 생산하는 방법.
  57. 제48항 내지 제56항 중 어느 한 항에 있어서, 상기 바이오매스-분해 효소를 생산하는 미생물은, 바실러스(Bacillus), 코프리누스(Coprinus), 마이셀리오프토라(Myceliophthora), 세팔로스포륨(Cephalosporium), 사이탈리듐(Scytalidium), 페니실륨(Penicillium), 아스페르길루스(Aspergillus), 슈도모나스(Pseudomonas), 후미콜라(Humicola), 푸사륨(Fusarium), 티엘라비아(Thielavia), 아크레모늄(Acremonium), 크리소스포륨(Chrysosporium) 또는 트리코더마(Trichoderma)로부터 선택된 속 내의 종으로부터 유래되는, 바이오매스로부터 생성물을 생산하는 방법.
  58. 제48항 내지 제57항 중 어느 한 항에 있어서, 상기 바이오매스-분해 효소를 생산하는 미생물은 아스페르길루스(Aspergillus), 후미콜라 인솔렌스(Humicola insolens)(사이탈리듐 써모필룸(Scytalidium thermophilum)), 코프리누스 시네레우스(Coprinus cinereus), 푸사륨 옥시스포룸(Fusarium oxysporum), 마이셀리오프토라 써모필라(Myceliophthora thermophila), 메리필루스 기간테우스(Meripilus giganteus), 티엘라비아 테레스트리스(Thielavia terrestris), 아크레모늄 페르시시넘(Acremonium persicinum), 아크레모늄 아크레모늄(Acremonium acremonium), 아크레모늄 브라키페늄(Acremonium brachypenium), 아크레모늄 디클로모스포룸(Acremonium dichromosporum), 아크레모늄 오브클라바툼(Acremonium obclavatum), 아크레모늄 핀커토니애(Acremonium pinkertoniae), 아크레모늄 로세오그리세움(Acremonium roseogriseum), 아크레모늄 인콜로라툼(Acremonium incoloratum), 아크레모늄 푸라툼(Acremonium furatum), 크리소스포륨 룩노웬스(Chrysosporium lucknowense), 트리코더마 비리데(Trichoderma viride), 트리코더마 리세이(T. reesei) 또는 트리코더마 코닌기(Trichoderma koningii)로부터 선택되는, 바이오매스로부터 생성물을 생산하는 방법.
  59. 제48항 내지 제58항 중 어느 한 항에 있어서, 상기 미생물은 미유도 미생물에 비해서 바이오매스-분해 효소의 생산을 증가시키기에 적합한 조건 하에서 상기 미생물을 유도 바이오매스 샘플과 배합함으로써 바이오매스-분해 효소를 생산하도록 유도된, 바이오매스로부터 생성물을 생산하는 방법.
  60. 제48항 내지 제59항 중 어느 한 항에 있어서, 상기 유도 바이오매스 샘플은 농업 생성물 또는 폐기물, 종이 제품 또는 폐기물, 임산물, 또는 일반 폐기물, 또는 이들의 임의의 조합물 중 한가지 이상을 포함하되;
    a) 농업 산물 또는 폐기물은 사탕 수수, 황마, 대마, 아마, 대나무, 사이잘마, 알팔파, 건초, 아라카차, 메밀, 바나나, 보리, 카사바, 칡, 안데스괭이밥, 사고, 사탕수수, 감자, 고구마, 타로토란, 참마, 콩, 잠두, 렌즈콩, 완두콩, 목초, 지팽이풀, 억새, 코드 그래스, 리이드 카나리 그래스, 곡물 잔류물, 카놀라짚, 밀짚, 보리짚, 귀리짚, 볏짚, 옥수수 속대, 옥수수 겉대, 옥수수 섬유, 코코넛 헤어, 사탕무우박, 버개스, 대두 여물, 곡물 잔류물, 벼 껍질, 귀리 껍질, 밀 껍질, 보리 껍질, 또는 비즈윙(beeswing), 또는 이들의 조합물을 포함하고;
    b) 종이 제품 또는 폐기물은 종이, 색소지, 적재지, 코팅지, 충전 종이, 잡지, 인쇄물, 프린터 용지, 다중코팅지, 명함 용지, 카드보드, 보드지, 또는 제지용 펄프, 또는 이들의 조합물을 포함하며;
    c) 임산물은 백양나무 목재, 파티클 보드, 목재 칩, 또는 톱밥, 또는 이들의 조합물을 포함하고; 그리고
    d) 일반 폐기물은 거름, 오수, 또는 왕겨, 또는 이들의 조합물을 포함하는, 바이오매스로부터 생성물을 생산하는 방법.
KR1020177010147A 2014-09-26 2015-09-25 가용화된 효소 및 이의 용도 KR20170060056A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462055702P 2014-09-26 2014-09-26
US62/055,702 2014-09-26
PCT/US2015/052200 WO2016049443A1 (en) 2014-09-26 2015-09-25 Solubilized enzyme and uses thereof

Publications (1)

Publication Number Publication Date
KR20170060056A true KR20170060056A (ko) 2017-05-31

Family

ID=55582048

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177010147A KR20170060056A (ko) 2014-09-26 2015-09-25 가용화된 효소 및 이의 용도

Country Status (16)

Country Link
US (2) US10377999B2 (ko)
EP (1) EP3197468A4 (ko)
JP (1) JP2017530702A (ko)
KR (1) KR20170060056A (ko)
CN (1) CN107073052A (ko)
AP (1) AP2017009843A0 (ko)
AU (1) AU2015320446A1 (ko)
BR (1) BR112017005573A2 (ko)
CA (1) CA2960582A1 (ko)
CU (1) CU20170036A7 (ko)
EA (1) EA201790362A1 (ko)
IL (1) IL251284A0 (ko)
MX (1) MX2017003881A (ko)
PH (1) PH12017500430A1 (ko)
SG (1) SG11201701961YA (ko)
WO (1) WO2016049443A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016049443A1 (en) 2014-09-26 2016-03-31 Xyleco, Inc. Solubilized enzyme and uses thereof
CN108707595B (zh) * 2018-07-03 2021-07-27 华东理工大学 一种提高真菌产纤维素酶产量的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6103464A (en) * 1990-12-10 2000-08-15 Genencor International, Inc. Method of detecting DNA encoding a β-glucosidase from a filamentous fungus
US5407810A (en) * 1993-08-20 1995-04-18 Genentech, Inc. Aqueous multiple-phase isolation of polypeptide
ES2538360T3 (es) * 2006-07-21 2015-06-19 Novozymes, Inc. Métodos para aumentar la secreción de polipéptidos que tienen actividad biológica
BRPI0807132A2 (pt) * 2007-01-30 2018-12-04 Syngenta Participations Ag enzimas para o tratamento de lignocelulósicos, ácidos nucléicos que codificam as mesmas, e metodos e uso das mesmas
US20090029812A1 (en) * 2007-07-23 2009-01-29 Jerry Tsai Disc for a hockey game table
DK3296394T3 (da) * 2009-09-23 2020-12-21 Danisco Us Inc Hidtil ukendte glycosylhydrolaseenzymer og anvendelser heraf
WO2016049443A1 (en) 2014-09-26 2016-03-31 Xyleco, Inc. Solubilized enzyme and uses thereof

Also Published As

Publication number Publication date
WO2016049443A1 (en) 2016-03-31
AU2015320446A1 (en) 2017-03-30
CU20170036A7 (es) 2017-09-06
IL251284A0 (en) 2017-05-29
US20160222366A1 (en) 2016-08-04
EP3197468A1 (en) 2017-08-02
BR112017005573A2 (pt) 2018-01-23
CA2960582A1 (en) 2016-03-31
CN107073052A (zh) 2017-08-18
PH12017500430A1 (en) 2017-07-31
EP3197468A4 (en) 2018-03-14
US10377999B2 (en) 2019-08-13
SG11201701961YA (en) 2017-04-27
MX2017003881A (es) 2017-05-12
EA201790362A1 (ru) 2017-07-31
AP2017009843A0 (en) 2017-03-31
JP2017530702A (ja) 2017-10-19
US20190316108A1 (en) 2019-10-17

Similar Documents

Publication Publication Date Title
US9914946B2 (en) Polypeptides having xylanase activity and polynucleotides encoding same
CA2807702C (en) Use of glycoside hydrolase 61 family proteins in processing of cellulose
RU2433140C2 (ru) Слитые белки, включающие ферменты, разрушающие клеточную оболочку растений, и их применения
WO2012048171A2 (en) Variant cbh i polypeptides with reduced product inhibition
WO2018106656A1 (en) Truncated lpmo enzymes and use thereof
US20190316108A1 (en) Solubilized enzyme and uses thereof
US20200190462A1 (en) Compositions for enhanced enzyme production
US10626381B2 (en) Cellulolytic compositions comprising monooxygenase polysaccharide enzymes with improved activity
US20190024068A1 (en) Aglycosylated enzyme and uses thereof
OA18252A (en) Solubilized enzyme and uses thereof.
OA18211A (en) Aglycosylated enzyme and uses thereof.
Chahed et al. Heterologous expression and biochemical