KR20150095726A

KR20150095726A - 셀로바이오하이드롤라제의 변이체

Info

Publication number: KR20150095726A
Application number: KR1020157017684A
Authority: KR
Inventors: 리차드 알 보트; 마리아 포우카라키; 로날두스 홈메스; 티스 카페르; 브래들리 알 켈먼; 슬라브코 크랄리; 이고르 니콜라에프; 마트스 산드그렌; 리스하우트 요한네스 판; 스티흐트 탄스 산더 판
Original assignee: 다니스코 유에스 인크.
Priority date: 2012-12-12
Filing date: 2013-12-10
Publication date: 2015-08-21
Also published as: WO2014093287A1; CA2893053A1; MX2015007225A; US20160272959A1; CN104870643A; EP2931889A1

Abstract

히포크레아 제코리나 (Hypocrea jecorina) Cel7A (원래, 트리코더마 레에세이 (Trichoderma reesei) 셀로바이오하이드롤라제 I 또는 CBH1)의 다수의 상동체 및 변이체, 이를 인코딩하는 핵산 및 이를 생산하는 방법이 개시된다. 상동체 및 변이체 셀룰라제는 하나 이상의 아미노산 잔기가 치환 및/또는 결실된 패밀리 7A의 글리코실 하이드롤라제의 아미노산 서열을 갖는다.

Description

셀로바이오하이드롤라제의 변이체{VARIANTS OF CELLOBIOHYDROLASES}

관련 출원과의 상호 참조

본 출원은 2012년 12월 12에 출원된 미국 가특허 출원 제61/736,344호로부터의 우선권의 이득을 주장하며, 이는 본 명세서에 전체적으로 참고로 포함된다.

본 발명은 대체로 글리코시드 하이드롤라제 (glycoside hydrolase) 효소 변이체, 특히 셀로바이오하이드롤라제 (cellobiohydrolase, CBH)의 변이체에 관한 것이다. CBH 변이체를 인코딩 (encoding)하는 핵산, CBH 변이체를 포함하는 조성물, CBH 변이체의 생산 방법, 및 변이체를 사용하는 방법이 또한 설명된다.

정부 권리

본 발명은 미국 에너지국 (U.S. Department of Energy)에 의해 수여된 과제 번호 DE -FC36-08GO18078 하에서 정부 지원으로 이루어졌다. 정부는 본 발명에 소정 권리를 갖는다.

셀룰로오스 (cellulose) 및 헤미셀룰로오스 (hemicellulose)는 광합성에 의해 생산되는 가장 풍부한 식물 물질이다. 이는 중합성 기질을 단량체 당으로 가수분해할 수 있는 세포외 효소를 생산하는 세균, 효모 및 진균을 포함하는 다수의 미생물에 의해 에너지원으로서 분해되고 사용될 수 있다(문헌[Aro et al., 2001]). 비-재생 가능한 자원의 한계가 가까워짐에 따라, 주요 재생 가능한 에너지 자원이 될 셀룰로오스의 잠재력은 막대하다(문헌[Krishna et al., 2001]). 생물학적 프로세스를 통한 셀룰로오스의 효과적인 활용은 식품, 사료, 및 연료의 부족을 극복하기 위한 하나의 접근법이다(문헌[Ohmiya et al., 1997]).

셀룰라제는 셀룰로오스 (베타-1,4-글루칸 또는 베타 D-글루코시드 결합)를 가수분해하여 글루코스, 셀로바이오스, 셀로올리고당 (cellooligosaccharide) 등을 형성하는 효소이다. 셀룰라제는 전통적으로 세 개의 주요 부류로 나뉘어왔다: 엔도글루카나제 (endoglucanase) (EC 3.2.1.4) ("EG"), 엑소글루카나제 (exoglucanase) 또는 셀로바이오하이드롤라제 (EC 3.2.1.91) ("CBH") 및 베타-글루코시다제 (beta-glucosidase) ([베타]-D-글루코시드 글루코하이드롤라제; EC 3.2.1.21) ("BG"). (문헌[Knowles et al., 1987]; 문헌[Shulein, 1988]). 엔도글루카나제는 셀룰로오스 섬유의 무정형 부분에 주로 작용하는 반면, 셀로바이오하이드롤라제는 또한 결정질 셀룰로오스를 분해할 수 있다(문헌[Nevalainen and Penttila, 1995]). 따라서, 셀룰라제 시스템에서의 셀로바이오하이드롤라제의 존재는 결정질 셀룰로오스의 효율적인 가용화에 요구된다(문헌[Suurnakki, et al. 2000]). 베타-글루코시다제는 셀로바이오스, 셀로-올리고당, 및 다른 글루코시드로부터 D-글루코스 단위를 유리시키는 작용을 한다(문헌[Freer, 1993]).

셀룰라제는 다수의 세균, 효모 및 진균에 의해 생산되는 것으로 공지되어 있다. 소정의 진균은 셀룰로오스의 결정질 형태를 분해할 수 있는 완전한 셀룰라제 시스템을 생산하여, 셀룰라제가 발효를 통해 용이하게 다량으로 생산되게 한다. 다수의 효모, 예를 들어, 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)는 셀룰로오스를 가수분해하는 능력이 없으므로, 사상 진균이 특별한 역할을 한다. (예를 들어, 문헌[Aro et al., 2001]; 문헌[Aubert et al., 1988]; 문헌[Wood et al., 1988], 및 문헌[Coughlan, et al.] 참조.)

CBH, EG 및 BG의 진균성 셀룰라제 분류는 각 분류 내에 다수의 구성요소들을 포함하도록 더 확장될 수 있다. 예를 들어, 다수의 CBH, EG 및 BG는 2가지의 CBH, 즉, CBH I 및 CBH II, 적어도 8가지의 EG, 즉, EG I, EG II, EG III, EGIV, EGV, EGVI, EGVII 및 EGVIII, 및 적어도 5가지의 BG, 즉, BG1, BG2, BG3, BG4 및 BG5에 대한 공지된 유전자들을 함유하는 트리코더마 레에세이 (Trichoderma reesei)를 포함하는 다양한 진균 공급원으로부터 단리되어 왔다.

결정질 셀룰로오스를 글루코스로 효율적으로 전환하기 위해, 결정질 셀룰로오스를 가수분해하는데 덜 효과적인 단리된 구성요소를 갖는, CBH, EG 및 BG 분류들의 각각으로부터의 구성요소를 포함하는 완전한 셀룰라제 시스템이 요구된다(문헌[Filho et al., 1996]). 상이한 분류로부터의 셀룰라제 구성요소들 중에서 상승적인 관계가 관찰되어 왔다. 특히, EG-유형 셀룰라제 및 CBH-유형 셀룰라제는 셀룰로오스를 더 효율적으로 분해하기 위해 상승적으로 상호작용한다. (예를 들어, 문헌[Wood, 1985] 참조.)

셀룰라제는, 세제 조성물의 세정 능력 증진, 유연제로서의 용도, 면 패브릭 (cotton fabric)의 촉감 및 외관 개선 등을 위한 옷감 (textile)의 처리에 유용한 것으로 당업계에 공지되어 있다(문헌[Kumar et al., 1997] 참조).

개선된 세정 성능을 가지며 (미국 특허 제4,435,307호; 영국 출원 제2,095,275호 및 제2,094,826호) 그리고 옷감의 촉감 및 외관을 개선하기 위한 패브릭의 처리에 사용하기 위한 (미국 특허 제5,648,263호, 제5,691,178호, 및 제5,776,757호; 영국 출원 제1,358,599호; 문헌[The Shizuoka Prefectural Hammamatsu Textile Industrial Research Institute Report, Vol. 24, pp. 54-61, 1986]) 셀룰라제-함유 세제 조성물이 설명되어 있다.

셀룰라제는 또한 셀룰로오스 공급원료의 에탄올로의 전환에 유용한 것으로 당업계에 공지되어 있다. 이러한 프로세스는, 그렇지 않다면 폐기 (예를 들어, 공급원료의 소각 또는 매립)될 다량의 공급원료의 용이한 이용성을 포함하는 다수의 이점을 갖는다. 주로 셀룰로오스, 헤미셀룰로오스, 및 리그닌, 예를 들어, 목재, 초본 작물, 및 농업 폐기물 또는 지자체의 폐기물로 구성되는 다른 물질이 에탄올 생산에서 공급원료로서의 용도로 간주되어 왔다.

셀룰로오스 물질을 단당류, 이당류 및 다당류로 전환하기 위한 향상된 성질을 갖는 셀로바이오하이드롤라제 (CBH) 변이체를 제공하는 것은 당업계에 이점일 수 있다. 변이 CBH의 향상된 성질은 다음을 포함하지만, 이로 제한되지는 않는다: 변경된 온도-의존성 활성 프로파일, 열안정성, pH 활성, pH 안정성, 기질 특이성, 생산 특이성, 및 화학적 안정성.

본 발명은 셀룰라제 활성을 갖는 단리된 셀로바이오하이드롤라제 (CBH) 효소, 그러한 CBH 효소를 인코딩하는 핵산, CBH 효소-인코딩 폴리뉴클레오티드를 함유하는 숙주 세포 (예를 들어, CBH 효소를 발현하는 숙주 세포), CBH 효소를 함유하는 조성물, 및 이를 생산 및 사용하는 방법을 설명한다.

이와 같이, 본 발명의 태양은 야생형 CBH 효소를 초과하여 향상성을 갖는 변이 CBH 효소를 제공하고, 변이체는 증가된 융해 온도 (Tm), PASC 가수분해 검정법에서의 성능, 전 가수분해물 PCS (Whole Hydrolysate PCS, whPCS) 검정법에서의 성능, 및 희석 암모니아 옥수수 대 (Dilute Ammonia Corn Stover, daCS) 검정법에서의 성능으로부터 선택되는 하나 이상의 특징에 대해 유의하게 향상된다. 소정의 실시 형태에서, CBH 변이체는 향상된 특징들 중 적어도 2개, 향상된 특징들 중 적어도 3개, 또는 향상된 특징들 중 모두를 갖는다.

본 발명의 태양은 아래에 제시된 모 셀로바이오하이드롤라제 (CBH) 효소의 단리된 변이체를 제공하고, 임의의 표시된 CBH 아미노산 위치는 서열 번호 3에서의 아미노산 서열에 대응한다:

1. 변이체가 셀룰라제 활성을 갖고, 서열 번호 3에 대해 적어도 80%의 서열 동일성을 갖고, 인산 팽윤 셀룰로오스 (Phosphoric Acid Swollen Cellulose, PASC) 검정법에서 유의하게 향상된 성능을 갖는 CBH 변이체.

2. 변이체가 Y247D, N49P, T246V, N200G, 및 이들의 조합으로 이루어진 군으로부터 선택되는 아미노산 치환을 포함하는 상기 1의 CBH 변이체.

3. 변이체가 Y247D 치환을 포함하는 상기 2의 CBH 변이체.

4. 변이체가 N49P 치환을 포함하는 상기 2 또는 3의 CBH 변이체.

5. 변이체가 T246V 치환을 포함하는 상기 2, 3 또는 4의 CBH 변이체.

6. 변이체가 N200G 치환을 포함하는 상기 2, 3, 4 또는 5의 CBH 변이체.

7. 변이체가 F418M, T246S, T255V, 및 이들의 조합으로 이루어진 군으로부터 선택되는 아미노산 치환을 추가로 포함하는 상기 2 내지 6 중 어느 하나의 CBH 변이체.

8. 변이체가 D241N, G234D, P194V, T255I, T255K, T255R, 및 이들의 조합으로 이루어진 군으로부터 선택되는 아미노산 치환을 추가로 포함하는 상기 2 내지 7 중 어느 하나의 CBH 변이체.

9. 변이체가 T356L, T246P, T255D, N200R, 및 이들의 조합으로 이루어진 군으로부터 선택되는 아미노산 치환을 추가로 포함하는 상기 2 내지 8 중 어느 하나의 CBH 변이체.

10. 변이체가 T255P, S92T, T41I, 및 이들의 조합으로 이루어진 군으로부터 선택되는 아미노산 치환을 추가로 포함하는 상기 2 내지 9 중 어느 하나의 CBH 변이체.

11. 상기 변이체가 T246P 치환을 추가로 포함하는 상기 3 또는 4의 CBH 변이체.

12. 상기 변이체가 T246V 치환을 추가로 포함하는 상기 3 또는 4의 CBH 변이체.

13. 상기 변이체가 N200G 치환을 추가로 포함하는 상기 3, 4, 5, 11 또는 12의 CBH 변이체.

14. 상기 변이체가 N200R 치환을 추가로 포함하는 상기 3, 4, 5, 11 또는 12의 CBH 변이체.

15. 상기 변이체가 T255V 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 14 중 어느 하나의 CBH 변이체.

16. 상기 변이체가 T255I 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 14 중 어느 하나의 CBH 변이체.

17. 상기 변이체가 T255K 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 14 중 어느 하나의 CBH 변이체.

18. 상기 변이체가 T255R 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 14 중 어느 하나의 CBH 변이체.

19. 상기 변이체가 T255D 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 14 중 어느 하나의 CBH 변이체.

20. 상기 변이체가 T255P 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 14 중 어느 하나의 CBH 변이체.

21. 상기 변이체가 D241N 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 20 중 어느 하나의 CBH 변이체.

22. 상기 변이체가 G234D 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 21 중 어느 하나의 CBH 변이체.

23. 상기 변이체가 P194V 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 22 중 어느 하나의 CBH 변이체.

24. 상기 변이체가 T356L 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 23 중 어느 하나의 CBH 변이체.

25. 상기 변이체가 S92T 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 24 중 어느 하나의 CBH 변이체.

26. 상기 변이체가 T41I 치환을 추가로 포함하는 상기 3, 4, 5, 6 및 11 내지 25 중 어느 하나의 CBH 변이체.

소정의 실시 형태에서, 모 CBH는 진균성 셀로바이오하이드롤라제 1 (CBH1), 예를 들어, 히포크레아 제코리나 (Hypocrea jecorina), 히포크레아 오리엔탈리스 (Hypocrea orientalis), 히포크레아 슈바이닛찌이 (Hypocrea schweinitzii), 트리코더마 시트리노비리데 (Trichoderma citrinoviride); 트리코더마 슈도코닌기이 (Trichoderma pseudokoningii); 트리코더마 코닐랑브라 (Trichoderma konilangbra), 트리코더마 하자니움 (Trichoderma harzanium), 아스페르길루스 아큘레아투스 (Aspergillus aculeatus), 아스페르길루스 니게르 (Aspergillus niger); 페니실리움 잔티넬룸 (Penicillium janthinellum), 후미콜라 그리세아 (Humicola grisea), 스키탈리디움 써모필룸 (Scytalidium thermophilum), 및 포도스포라 안데리나 (Podospora anderina) (또는 이들 각각의 아나모르프 (anamorph), 텔레오모르프 (teleomorph), 또는 홀로모르프(holomorph) 대응 (counterpart) 형)으로부터의 CBH1, 예를 들어, 서열 번호 3 내지 15 중 어느 하나로부터 선택되는 CBH1이다. 소정의 실시 형태에서, 모 CBH는 서열 번호 3과 적어도 90%의 서열 동일성, 예를 들어, 적어도 95%의 서열 동일성을 갖는다.

본 발명의 태양은 본 명세서에 기재된 바와 같은 모 CBH의 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드를 포함한다. 단리된 폴리뉴클레오티드는 벡터, 예를 들어, 발현 벡터 또는 폴리뉴클레오티드의 증식을 위한 벡터 내에 존재할 수 있다. 벡터는 벡터를 전달하기 위한 그리고/또는 본 명세서에 기재된 바와 같은 인코딩된 CBH 변이체를 발현하는 숙주 세포 내에 존재할 수 있다. 숙주 세포는 CBH 변이체 폴리뉴클레오티드의 증식 및/또는 인코딩된 CBH 변이체의 발현에 사용되는 임의의 세포, 예를 들어, 세균 세포, 진균 세포 등일 수 있다. 사용될 수 있는 적합한 진균 세포 유형의 예는 사상 진균 세포, 예를 들어, 트리코더마 레에세이, 트리코더마 롱기브라키아툼 (Trichoderma longibrachiatum), 트리코더마 비리데 (Trichoderma viride), 트리코더마 코닌기이 (Trichoderma koningii), 트리코더마 하지아눔 (Trichoderma harzianum), 페니실리움, 후미콜라, 후미콜라 인솔렌스 (Humicola insolens), 후미콜라 그리세아, 크리소스포리움 (Chrysosporium), 크리소스포리움 룩크노웬세 (Chrysosporium lucknowense), 마이셀리오프토라 써모필라 (Myceliophthora thermophila), 글리오클라디움 (Gliocladium), 아스페르길루스, 푸사리움 (Fusarium), 뉴로스포라 (Neurospora), 히포크레아, 에메리셀라 (Emericella), 아스페르길루스 니게르, 아스페르길루스 아와모리 (Aspergillus awamori), 아스페르길루스 아큘레아투스, 및 아스페르길루스 니둘란스 (Aspergillus nidulans)의 세포를 포함한다. 대안적으로, 진균 숙주 세포는 효모 세포, 예를 들어, 사카로마이세스 세레비지애, 스키조사카로마이세스 폼베 (Schizzosaccharomyces pombe), 슈반니오마이세스 옥시덴탈리스 (Schwanniomyces occidentalis), 클루베로마이세스 락투스 (Kluveromyces lactus), 칸디다 유틸리스 (Candida utilis), 칸디다 알비칸스 (Candida albicans), 피키아 스티피티스 (Pichia stipitis), 피키아 파스토리스 (Pichia pastoris,), 야로위아 리폴리티카 (Yarrowia lipolytica), 한세눌라 폴리모르파 (Hansenula polymorpha), 파피아 로도지마 (Phaffia rhodozyma), 아르슐라 아데니니보란스 (Arxula adeninivorans), 데바리오마이세스 한세니이 (Debaryomyces hansenii), 또는 데바리오마이세스 폴리모르푸스 (Debaryomyces polymorphus)일 수 있다.

본 발명의 태양은 폴리뉴클레오티드로부터 CBH 변이체를 발현 (또는 생산) 하기에 적합한 조건 하에서, 예를 들어, CBH 변이체를 인코딩하는 폴리뉴클레오티드가 발현 벡터 (즉, CBH 변이체-인코딩 폴리뉴클레오티드가 숙주 세포에서 CBH 변이체의 발현을 추진하는 프로모터에 작동가능하게 연결된 발현 벡터) 내에 존재하는 경우에, CBH 변이체를 인코딩하는 폴리뉴클레오티드를 함유하는 숙주 세포를 적합한 배양 배지에서 배양하는 단계를 포함하는 변이 CBH를 생산하는 방법을 포함한다. 소정의 실시 형태에서, 본 방법은 생산된 CBH 변이체를 단리하는 단계를 추가로 포함한다.

본 발명의 태양은 또한 본 명세서에 기재된 바와 같은 CBH 변이체를 함유하는 조성물을 포함한다. 적합한 조성물의 예는 세제 조성물, 사료 첨가제, 및 셀룰로오스 기질 (예를 들어, 셀룰로오스 함유 옷감, 예컨대, 데님; 셀룰로오스 함유 바이오매스 물질, 예를 들어, 선택적으로 전-가수분해 (pre-hydrolysis) 처리 등의 전-처리된 리그노셀룰로오스 바이오매스 물질의 혼합물)을 처리 (또는 가수분해)하기 위한 조성물을 포함하지만, 이로 제한되지는 않는다. 셀룰로오스 기질 및 본 명세서에 기재된 바와 같은 CBH 변이체를 포함하는 조성물은 본 발명의 추가 태양을 나타낸다. CBH 변이체-함유 세제 조성물은 세탁 세제 및 식기 세제를 포함하고, 그러한 세제는 추가적인 성분, 예를 들어, 계면활성제를 추가로 포함할 수 있다. 적합한 셀룰로오스 기질의 예는 그래스 (grass), 스위치 그래스 (switch grass), 코드 그래스 (cord grass), 라이 그래스 (rye grass), 리드 카나리 그래스 (reed canary grass), 억새, 설탕-가공 잔유물, 사탕수수 찌꺼기, 농업 폐기물, 볏짚, 왕겨, 보리 짚, 옥수수 속대 (cob), 곡물 짚, 밀짚, 유채 짚, 귀리 짚, 귀리 껍질, 옥수수 섬유, 대, 콩 대, 옥수수 대, 임업 폐기물, 목재 펄프, 재활용된 목재 펄프 섬유, 종이 슬러지, 톱밥, 경재 (hardwood), 연재 (softwood), 및 이들의 조합을 포함하지만, 이로 제한되지는 않는다.

본 발명의 태양은 셀룰로오스 기질을 본 명세서에 기재된 바와 같은 변이 CBH와 접촉시키는 단계를 포함하는 셀룰로오스 기질을 가수분해하는 방법을 포함한다. 소정의 실시 형태에서, CBH 변이체는 무세포 조성물로서 제공되는 반면, 다른 실시 형태에서, CBH 변이체는 숙주 세포 조성물로서 제공되고, 여기서 숙주 세포는 CBH 변이체를 발현한다. 따라서, 소정의 실시 형태에서, 셀룰로오스 기질을 가수분해하는 방법은 셀룰로오스 기질을 CBH 변이체 발현 벡터를 함유하는 숙주 세포와 접촉시키는 단계를 포함한다. 소정의 실시 형태에서, 본 방법은 리그노셀룰로오스 바이오매스를 글루코스로 전환하기 위한 것이고, 이러한 실시 형태의 일부에서, 리그노셀룰로오스 바이오매스는 그래스, 스위치 그래스, 코드 그래스, 라이 그래스, 리드 카나리 그래스, 억새, 설탕-가공 잔유물, 사탕수수 찌꺼기, 농업 폐기물, 볏짚, 왕겨, 보리 짚, 옥수수 속대, 곡물 짚, 밀짚, 유채 짚, 귀리 짚, 귀리 껍질, 옥수수 섬유, 대, 콩 대, 옥수수 대, 임업 폐기물, 목재 펄프, 재활용된 목재 펄프 섬유, 종이 슬러지, 톱밥, 경재, 연재, 및 이들의 조합으로부터 제한 없이 선택된다. 소정의 다른 실시 형태에서, 셀룰로오스 기질은 셀룰로오스-함유 옷감, 예를 들어, 데님이고, 이러한 실시 형태의 일부에서 본 방법은 (예를 들어, 스톤워싱 (stonewashing) 프로세스에서) 인디고 염색된 데님을 처리하기 위한 것이다.

본 발명의 태양은 본 명세서에 기재된 바와 같은 CBH 변이체를 함유하는 세포 배양 상청액 조성물을 포함한다. 예를 들어, 세포 배양 상청액은 폴리뉴클레오티드로부터 CBH 변이체를 발현하고 CBH 변이체를 세포 배양 상청액으로 분비하기에 적합한 조건 하에서 적합한 배양 배지에서 CBH 변이체를 인코딩하는 폴리뉴클레오티드를 함유하는 숙주 세포를 배양하여 얻는다. 그러한 세포 배양 상청액은, 내생적으로 (endogenously)- 그리고/또는 외생적으로 (exogenously)-발현된 단백질 및/또는 효소를 포함하여, 숙주 세포에 의해 생산된 다른 단백질 및/또는 효소를 포함할 수 있다. 배양 배지의 그러한 상청액은, 전형적으로 세포 파편 (debris)을 제거하기 위한 여과, 세포-사멸 (cell-kill) 절차, 및/또는 효소를 부화 (enrich)하거나 농축하기 위한 한외여과 또는 다른 단계들을 포함할 수 있는, 생산-후 가공을 최소로 하여 또는 후-생산 가공 없이 그 자체로 사용될 수 있다. 본 명세서에서 그러한 상청액은 "전체 브로쓰 (broth)" 또는 "전체 셀룰라제 브로쓰"로 지칭된다.

CBH 변이체는 하나 이상의 다른 셀룰라제, 및/또는 하나 이상의 헤미셀룰라제와의 공동-발현에 의해 생산될 수 있다. 대안적으로, CBH 변이체는 다른 셀룰라제 또는 헤미셀룰라제 없이 생산될 수 있다. 이후의 경우, CBH 변이체는 선택적으로, 특정 응용, 예를 들어, 리그노셀룰로오스 바이오매스 기질을 가수분해 하는데, 유용한 효소 조성물을 형성하기 위해 하나 이상의 다른 셀룰라제 및/또는 하나 이상의 헤미셀룰라제와 함께 물리적으로 혼합될 수 있다.

원하는 변이체 셀룰라제를 함유하는 다른 조성물, 및 그러한 조성물을 사용하는 방법이 또한 고려된다.

도 1a 및 도 1b는 H. 제코리나로부터의 야생형 Cel7A (CBH1)의 핵산 서열 (상부 라인) (서열 번호 1) 및 아미노산 서열 (하부 라인) (서열 번호 3)을 나타낸다.
도 2a, 도 2b, 도 2c 및 도 2d는 히포크레아 제코리나 (서열 번호 3), 히포크레아 오리엔탈리스 (서열 번호 4), 히포크레아 슈바이닛찌이 (서열 번호 5), 트리코더마 시트리노비리데 (서열 번호 6); 트리코더마 슈도코닌기이 (서열 번호 7); 트리코더마 코닐랑브라 (서열 번호 8), 트리코더마 하자니움 (서열 번호 9), 아스페르길루스 아큘레아투스 (서열 번호 10), 아스페르길루스 니게르 (서열 번호 11); 페니실리움 잔티넬룸 (서열 번호 12), 후미콜라 그리세아 (서열 번호 13), 스키탈리디움 써모필룸 (서열 번호 14), 및 포도스포라 안데리나 (서열 번호 15)로부터 유래한 CBH 효소의 성숙 형태의 아미노산 정렬을 나타낸다. 상부에서의 번호 매김은 히포크레아 제코리나의 성숙 형태의 아미노산 번호를 나타낸다. 동일한, 보존된, 그리고 반-보존된 아미노산은 각각 별표 (*), 콜론 (:), 및 마침표 (.)로 표시된다.
도 3은 발현 벡터 pTTT-pyrG-cbh1의 개략도이다.
도 4는 융해 온도의 유의한 변화 (ΔTm)를 표시하는 CBH 치환 변이체를 나타낸다. ΔTm은 유의한 ΔTm을 갖는 각각의 특정 변이체가 그의 ΔTm 값에 도시된 상태로 X축 상에 있다. 절편 값은 치환이 없는 분자 (즉, 야생형)에 대한 ΔTm의 모델 예측을 나타낸다.
도 5는 whPCS 검정법에서의 성능 지수의 유의한 변화 (ΔPI)를 표시하는 CBH 치환 변이체를 나타낸다. ΔPI는 유의한 ΔPI를 갖는 각각의 특정 변이체가 그의 대략적인 ΔPI 값에 도시된 상태로 ("whPCS PI에 대한 이익"이라고 표시된) X축 상에 있다. 절편 값은 치환이 없는 분자 (즉, 야생형)에 대한 ΔPI의 모델 예측을 나타낸다.
도 6은 daCS 검정법에서의 성능 지수의 유의한 변화 (ΔPI)를 표시하는 CBH 치환 변이체를 나타낸다. ΔPI는 유의한 ΔPI를 갖는 각각의 특정 변이체가 그의 대략적인 ΔPI 값에 도시된 상태로 ("daCS PI에 대한 이익"이라고 표시된) X축 상에 있다. 절편 값은 치환이 없는 분자 (즉, 야생형)에 대한 ΔPI의 모델 예측을 나타낸다.
도 7은 PASC 검정법에서의 성능 지수의 유의한 변화 (ΔPI)를 표시하는 CBH 치환 변이체를 나타낸다. ΔPI는 유의한 ΔPI를 갖는 각각의 특정 변이체가 그의 대략적인 ΔPI 값에 도시된 상태로 ("daCS PI에 대한 이익"이라고 표시된) X축 상에 있다. 절편 값은 치환이 없는 분자 (즉, 야생형)에 대한 ΔPI의 모델 예측을 나타낸다.
도 8a, 도 8b 및 도 8c는 본 명세서에 기재된 아미노산 치환을 함유하는 H. 제코리나로부터의 CBH1 아미노산 서열 (서열 번호 16)을 나타낸다. 명칭 "Xaa"는 하나 초과의 치환이 이루어질 수 있는 아미노산 위치를 나타낸다. 이러한 Xaa 부위들에서의 치환들은 도 8c의 하부에 (위치 200, 246 및 255에) 나타나 있다. 치환된 아미노산 위치는 굵은 밑줄이 그어져있다.

이제 하기 정의 및 예를 오직 참고로 사용하여 본 발명을 상세히 기술할 것이다. 본 명세서에 언급된 모든 특허 및 간행물에 개시된 모든 서열을 비롯한, 모든 특허 및 간행물은 참고로 명시적으로 포함된다.

본 명세서에서 다르게 정의하지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 흔히 이해되는 바와 동일한 의미를 갖는다. 문헌[Singleton, et al., Dictionary of Microbiology and Molecular Biology, 3rd Ed., John Wiley and Sons, Ltd., New York (2007)], 및 문헌[Hale & Marham, The Harper Collins Dictionary of Biology, Harper Perennial, NY (1991)]은 본 발명에서 사용되는 많은 용어의 통상의 사전을 당업자에게 제공한다. 본 명세서에 기재되는 것과 유사 또는 동등한 임의의 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있으나, 바람직한 방법 및 물질이 기재되어 있다. 수치 범위는 범위를 한정하는 수를 포함한다. 달리 표시되지 않는다면, 핵산은 5'에서 3' 배향으로 좌측에서 우측으로 작성하고; 아미노산 서열은 아미노에서 카르복시 배향으로 좌측에서 우측으로 작성한다. 전문가에게는 특히, 당업계의 정의 및 용어에 대해 문헌[Green and Sambrook Molecular Cloning: A Laboratory Manual (Fourth Edition), Cold Spring Harbor Laboratory Press 2012], 및 문헌[Ausubel FM et al., 1993]에 주의를 기울이게 한다. 기재된 특정한 방법, 프로토콜 및 시약은 다양할 수 있으므로 본 발명은 이에 제한되지 않는다는 것이 이해될 것이다.

본 명세서에서 제공된 표제는, 전체로서 명세서에 대한 참고로서 제공될 수 있는 본 발명의 다양한 태양 또는 실시 형태의 제한이 아니다. 따라서, 바로 아래에서 정의된 용어는 전체로서 명세서에 대한 참고로서 더욱 완전히 정의된다.

본 명세서에 인용된 모든 간행물은 본 발명과 관련하여 사용될 수 있는 조성물 및 방법을 기재하고 개시하기 위해 본 명세서에 명백히 참고로서 포함된다.

I. 정의

용어 "아미노산 서열"은 용어 "폴리펩티드", "단백질", 및 "펩티드"와 동의어이고, 호환 가능하게 사용된다. 그러한 아미노산 서열이 활성을 나타내는 경우, 이는 "효소"로 불릴 수 있다. 아미노산 잔기에 대한 종래의 한 자리 또는 세 자리 코드가 사용되는데, 아미노산 서열은 표준 아미노에서 카르복시 말단 배향 (즉, N→C)으로 제시된다.

용어 "핵산"은 DNA, RNA, 이형 이중가닥, 및 폴리펩티드를 인코딩할 수 있는 합성 분자를 포함한다. 핵산은 단일 가닥 또는 이중 가닥일 수 있고, 화학적 변형을 가질 수 있다. 용어 "핵산" 및 "폴리뉴클레오티드"는 호환 가능하게 사용된다. 유전적 코드가 축퇴성이므로, 하나 초과의 코돈이 특정 아미노산을 인코딩하기 위해 사용될 수 있고, 본 조성물 및 방법은 특정 아미노산 서열을 인코딩하는 뉴클레오티드 서열을 포함한다. 이와 같이, 본 발명은, 유전적 코드의 축퇴를 고려해 볼 때 모두가 가능한, CBH 또는 이의 변이체를 인코딩하는 모든 가능한 변이 뉴클레오티드 서열을 고려한다. 달리 표시되지 않는다면, 핵산 서열은 5′ 에서 3′ 배향으로 제시된다.

"셀룰라제" 또는 "셀룰라제 효소"는 세균성 또는 진균성 엑소글루카나제 또는 엑소셀로바이오하이드롤라제, 및/또는 엔도글루카나제, 및/또는 β-글루코시다제를 의미한다. 셀룰라제 효소의 이러한 3가지 상이한 유형들이 셀룰로오스 및 이의 유도체를 당으로 전환하는데 상승적으로 작용하는 것으로 알려져 있다.

본 명세서에서 사용된 바와 같은 "셀로바이오하이드롤라제" 또는 "CBH" 또는 "CBH 효소" 또는 "CBH 폴리펩티드"는 사슬의 비-환원 말단으로부터 셀로바이오스를 방출하는 셀룰로오스, 셀로테트리오스, 또는 중합체를 함유하는 임의의 베타-1,4-결합된 글루코스에서 1,4-베타-D-글루코시드 결합의 가수분해를 촉매하는 1,4-D-글루칸 셀로바이오하이드롤라제 (E.C. 3.2.1.91)로서 정의된다. 셀로바이오하이드롤라제 (CBH) 활성은 문헌[Lever et al., 1972, Anal. Biochem. 47: 273-279]에 기재된 절차 및 이들의 변형 (아래 실시예 섹션 참고), 및/또는 문헌[van Tilbeurgh et al., 1982, FEBS Letters, 149: 152-156]에 기재된 절차에 따라 본 발명을 위하여 결정된다.

본 명세서에 사용된 바와 같은 효소, 단백질, 폴리펩티드, 핵산, 또는 폴리뉴클레오티드의 "변이체"는 모 폴리펩티드 또는 모 핵산 (예를 들어, 천연의, 야생형 또는 다른 정의된 모 폴리펩티드 또는 핵산)으로부터 유도된, 그 부모와 비교하여 적어도 하나의 변형 또는 변경을 포함하는 변이체를 의미한다. 변경/변형은 하나 이상의 부위에서 상이한 아미노산/핵산 잔기에 대한 부모의 아미노산/핵산 잔기의 치환, 하나 이상의 부위에서 부모에서의 아미노산/핵산 잔기 (또는 일련의 아미노산/핵산 잔기)의 결실, 하나 이상의 부위에서 부모 내의 아미노산/핵산 잔기 (또는 일련의 아미노산/핵산 잔기)의 삽입, 아미노- 및/또는 카르복시-말단의 아미노산 서열 또는 5' 및/또는 3' 핵산 서열의 절단, 및 이들의 임의의 조합을 포함할 수 있다. 본 발명의 태양에 따른 (때때로 "CBH 변이체"라고도 불리는) 변이 CBH 효소는 셀룰라제 활성을 보유하지만 일부 특정 태양에서 변경된 특성, 예를 들어, 향상된 특성을 가질 수 있다. 예를 들어, 변이 CBH 효소는 변경된 pH 최적의, 향상된 열안정성 또는 산화 안정성, 또는 이들의 조합을 가질 수 있지만, 이의 특징적인 셀룰라제 활성을 보유할 것이다.

"조합 변이체"는 둘 이상의 돌연변이, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 등의 치환, 결실, 및/또는 삽입을 포함하는 변이체이다.

본 명세서에서 사용되는 바와 같은 "모 CBH1 효소" 또는 "모 CBH 효소" 또는 "모 CBH 폴리펩티드" 또는 이의 동등체는 성숙 형태에서 히포크레아 제코리나로부터의 야생형 CBH1의 성숙 형태의 아미노산 서열을 제공하는 서열 번호 3과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함하는, 서열 번호 3과 적어도 80%의 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 의미한다. 단어 "모 (부모)" 및 "부모의"는 이 문맥에서 호환 가능하게 사용된다는 것이 알려져 있다. 소정의 태양에서, 모 CBH 효소는 서열 번호 2 내지 서열 번호 8 중 어느 하나의 아미노산 서열, 또는 이의 대립 변이체, 또는 셀룰라제 활성을 갖는 이의 단편을 포함한다. 소정의 실시 형태에서, 모 CBH 효소는 진정균 (Eumycota) 또는 난균 (Oomycota) 아문 (subdivision)의 사상 진균으로부터의 것이다. 사상 진균은 균사 신장 (hyphal elongation) 및 절대적으로 호기성인 탄소 이화작용에 의한 영양 생장 (vegetative growth)을 갖는, 키틴, 글루칸, 키토산, 만난, 및 다른 복합 다당류로 구성된 세포벽을 갖는 영양 균사체 (vegetative mycelium)인 것을 특징으로 한다. 사상 진균의 모 세포는 트리코더마, 예를 들어, 트리코더마 롱기브라키아툼, 트리코더마 비리데, 트리코더마 코닌기이, 트리코더마 하지아눔; 페니실리움 종; 후미콜라 인솔렌스 및 후미콜라 그리세아를 포함하는 후미콜라 종; C. 룩크노웬세를 포함하는 크리소스포리움 종; 마이셀리오프토라 종; 글리오클라디움 종; 아스페르길루스 종; 푸사리움 종, 뉴로스포라 종, 히포크레아 종, 예를 들어, 히포크레아 제코리나, 및 에메리셀라 종의 세포일 수 있으나, 이로 제한되지는 않는다. 본 명세서에서 사용되는 바와 같이, 용어 "트리코더마" 또는 "트리코더마 종"은 이전에 트리코더마로 분류되었거나 현재 트리코더마로 분류되는 임의의 진균 계통을 말한다.

용어 "야생형"은 자연적으로 발생한 폴리펩티드 또는 핵산 서열, 즉, 인공 변이를 포함하지 않는 것을 말한다.

핵산의 일부에 관하여 사용될 때, 용어 "이종 (heterologous)"은 핵산이 자연에서 서로 동일한 관계에서 정상적으로 발견되지 않는 둘 이상의 서브시퀀스들을 포함한다는 것을 나타낸다. 예를 들어, 핵산은 전형적으로, 예를 들어, 새로운 기능적 핵산을 만들기 위해 배열된 관계없는 유전자들, 예를 들어, 하나의 공급원으로부터의 프로모터 및 다른 공급원으로부터의 코딩 영역으로부터의, 둘 이상의 서열들을 갖도록, 재조합적으로 생산된다. 유사하게, 이종 폴리펩티드는 종종 자연에서 서로 동일한 관계에서 발견되지 않는 둘 이상의 서브시퀀스들을 의미할 것이다(예를 들어, 융합 폴리펩티드).

예를 들어, 세포, 또는 핵산, 폴리펩티드, 또는 벡터에 관하여 사용될 때, 용어 "재조합"은 세포, 핵산, 폴리펩티드 또는 벡터가 이종 핵산 또는 폴리펩티드의 도입 또는 천연 핵산 또는 폴리펩티드의 변경에 의해 변형되어 온 것을 또는 세포가 그렇게 변형된 세포로부터 유도되는 것을 나타낸다. 따라서, 예를 들어, 재조합 세포는 세포의 천연 (비-재조합) 형태 내에서 발견되지 않는 유전자를 발현하거나, 또는 발현되거나 전혀 발현되지 않는, 다르게는 비정상적으로 발현되는 천연 유전자를 발현한다.

본 명세서에서 사용되는 바와 같이, 용어 "단리된" 또는 "정제된"은 핵산 또는 폴리뉴클레오티드가 자연적으로 생산되는 환경으로부터 제거되는 핵산 또는 폴리뉴클레오티드를 의미한다. 일반적으로, 단리된 또는 정제된 핵산 또는 폴리펩티드 샘플에서, 관심 핵산(들) 또는 폴리펩티드(들)는 그들이 자연적으로 생산되는 환경에 비해 증가된 절대 또는 상대 농도로 존재한다.

조성물 내 성분 또는 물질 (예를 들어, 폴리펩티드 또는 폴리뉴클레오티드)을 설명할 때의 용어 "부화된"은 성분 또는 물질이 부화된 조성물이 생성되는 시작 조성물에 비해 그 조성물에서 상대적으로 증가된 농도로 존재한다는 것을 의미한다. 예를 들어, 부화된 CBH 조성물 (또는 샘플)은 CBH의 상대 또는 절대 농도가 숙주 생물로부터의 초기 발효 산물에 비해 증가된 것이다.

본 명세서에서 사용되는 바와 같이, 용어 "프로모터"는 하류 유전자의 전사를 지시하는 기능을 하는 핵산 서열을 말한다. 프로모터는 일반적으로 표적 유전자가 발현되는 숙주 세포에 적절할 것이다. 프로모터는, 다른 전사 및 번역 조절 핵산 서열 (또한 "제어 서열"로 지칭됨)과 함께, 주어진 유전자를 발현시키는데 필요하다. 일반적으로, 전사 및 번역 조절 서열은 프로모터 서열, 리보솜 결합 부위, 전사 시작 및 중지 서열, 번역 시작 및 중지 서열, 및 인핸서 (enhancer) 또는 활성자 서열을 포함하지만, 이로 제한되지는 않는다. "항시 발현 (constitutive)" 프로모터는 대부분의 환경적 및 발달적 조건 하에서 활성인 프로모터이다. "유도성 (inducible)" 프로모터는 환경적 또는 발달적 제어 하에서 활성인 프로모터이다. 본 발명에 유용한 유도성 프로모터의 예는 젠뱅크 (GenBank)에 등록번호 D86235로 기탁된 T. 레에세이 (H. 제코리나) cbh1 프로모터이다. 다른 태양에서, 프로모터는 H. 제코리나로부터의 cbh II 또는 자일라나제 (xylanase) 프로모터이다. 적합한 프로모터의 예는 A. 아와모리 또는 A. 니게르 글루코아밀라제 유전자 (문헌[Nunberg, J. H. et al. (1984) Mol. Cell. Biol. 4, 2306-2315]; 문헌[Boel, E. et al. (1984) EMBO J. 3, 1581-1585]), 무코르 미에헤이 (Mucor miehei) 카르복실 프로테아제 유전자, 히포크레아 제코리나 셀로바이오하이드롤라제 I 유전자 (슈메이커 (Shoemaker), S. P. 등의 (1984) 유럽 특허 출원 EPO0137280A1호), A. 니둘란스 trpC 유전자 (문헌[Yelton, M. et al. (1984) Proc. Natl. Acad. Sci. USA 81, 1470-1474]; 문헌[Mullaney, E. J. et al. (1985) Mol. Gen. Genet. 199, 37-45]), A. 니둘란스 alcA 유전자 (문헌[Lockington, R. A. et al. (1986) Gene 33, 137-149]), A. 니둘란스 tpiA 유전자 (문헌[McKnight, G. L. et al. (1986) Cell 46, 143-147]), A. 니둘란스 amdS 유전자 (문헌[Hynes, M. J. et al. (1983) Mol. Cell Biol. 3, 1430-1439]), H. 제코리나 xln1 유전자, H. 제코리나 cbh2 유전자, H. 제코리나 eg1 유전자, H. 제코리나 eg2 유전자, H. 제코리나 eg3 유전자로부터의 프로모터, 및 SV40 초기 (early) 프로모터와 같은 고등 진핵생물 프로모터 (문헌[Barclay, S. L. and E. Meller (1983) Molecular and Cellular Biology 3, 2117-2130])를 포함한다.

핵산은 다른 핵산 서열과 기능적 관계에 있는 경우 "작동가능하게 연결된다". 예를 들어, 분비 리더 (leader)를 인코딩하는 DNA, 즉 신호 펩티드는 그가 폴리펩티드의 분비에 참여하는 전단백질 (preprotein)로서 발현되는 경우 폴리펩티드용 DNA에 작동가능하게 연결되거나; 프로모터 또는 인핸서는 그가 서열의 전사에 영향을 주는 경우 코딩 서열에 작동가능하게 연결되거나; 리보솜 결합 부위는 그가 번역을 용이하게 하도록 위치되는 경우 코딩 서열에 작동가능하게 연결된다. 일반적으로, "작동가능하게 연결된"은 연결되는 DNA 서열이 인접하고, 분비 리더의 경우, 인접하며 해독기 (reading phase)에 있음을 의미한다. 그러나, 인핸서는 인접할 필요는 없다. 연결은 편리한 제한 부위에서의 라이게이션 (ligation)에 의해 이루어진다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오티드 어댑터 또는 링커가 종래의 실행에 따라 사용된다. 따라서, 용어 "작동가능하게 연결된"은 핵산 발현 조절 서열 (예를 들어, 전사 인자 결합 부위의 프로모터 또는 어레이) 및 두 번째 핵산 서열 사이의 기능적 연결을 말하고, 핵산 발현 조절 서열은 두 번째 서열에 대응하는 핵산의 전사를 지시한다.

용어 "신호 서열", "신호 펩티드", "분비 서열", "분비 펩티드", "분비 신호 서열", "분비 신호 펩티드" 등은, 큰 폴리펩티드의 구성요소로서, 이것이 합성된 세포의 분비 경로를 통해 큰 폴리펩티드를 이끄는 펩티드 서열 및 그러한 펩티드를 인코딩하는 핵산을 나타낸다. 전반적으로, 큰 폴리펩티드 (또는 단백질)는 보통 분비 경로를 통한 운송 동안 분비/신호 펩티드를 제거하기 위해 절단되고, 폴리펩티드의 절단된 형태 (즉, 신호/분비 펩티드가 없는 형태)는 본 명세서에서 종종 폴리펩티드의 "성숙 형태"로 지칭된다. 예를 들어, 서열 번호 2는 신호 펩티드를 갖는 H. 제코리나로부터의 CBH1의 아미노산 서열을 제공하는 반면, 서열 번호 3은 H. 제코리나로부터의 CBH1의 성숙 형태의, 즉, 신호 펩티드가 없는 아미노산 서열을 제공한다.

본 명세서에서 사용되는 바와 같이, 용어 "벡터"는 상이한 숙주 세포들 사이에서의 이동을 위해 설계된 핵산 작제물(construct)을 말한다. "발현 벡터"는 외래 세포 내에 이종 DNA 단편을 혼입하고 발현시키는 능력을 갖는 벡터를 의미한다. 많은 원핵생물 및 진핵생물 발현 벡터가 시판된다. 적절한 발현 벡터의 선택은 당업자가 알고 있는 범위 내에 있다.

따라서, "발현 카세트" 또는 "발현 벡터"는 표적 세포 내 특정 핵산의 전사를 허용하는 일련의 특이적 핵산 요소로 재조합적으로 또는 합성적으로 생성된 핵산 작제물이다. 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 플라스티드 DNA, 바이러스, 또는 핵산 단편에 통합될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 부분은, 다른 서열 중에서, 전사될 핵산 서열 및 프로모터를 포함한다.

본 명세서에서 사용되는 바와 같이, 용어 "플라스미드"는 많은 세균 및 일부 진핵생물에 존재할 때, 염색체외 자가-복제 유전적 요소를 형성하는 환형 이중-가닥 (ds) DNA 작제물을 말한다. 플라스미드는, 예를 들어, 클로닝 벡터, 증식 벡터 (propagation vector), 발현 벡터 등과 같이 다수의 상이한 목적 중 임의의 것에 사용될 수 있다.

본 명세서에서 사용되는 바와 같이, 용어 "선별가능한 마커"는 세포 내에서 발현 가능한 뉴클레오티드 서열 또는 그에 의해 인코딩되는 폴리펩티드를 말하는데, 세포 내에서 선별가능한 마커의 발현은 선별가능한 마커를 발현하지 않는 세포로부터 구별될 수 있는 능력을 부여한다. 소정의 실시 형태에서, 선별가능한 마커는 그것을 발현하는 세포가 대응하는 선별제 (selective agent)의 존재 하에서, 또는 대응하는 선별 생장 조건 하에서 생장하게 한다. 다른 실시 형태에서, 선별가능한 마커는 그것을 발현하는 세포가 그것을 발현하지 않는 세포로부터 물리적 특징들에 의해, 예를 들어, 형광, 면역-반응성 등의 차이에 의해 식별 및/또는 구분되게 한다.

일반적으로, 변이 CBH1을 인코딩하는 핵산 분자는 본 명세서에서 서열 번호 1로 제공되는 야생형 서열 (천연 H. 제코리나 CBH1)에 대해 중등 내지 고도의 엄격성 (stringency) 조건 하에서 혼성화될 것이다. 그러나, 일부의 경우, 실질적으로 상이한 코돈 사용을 갖는 CBH1-인코딩 뉴클레오티드 서열이 사용되지만, CBH1-인코딩 뉴클레오티드 서열에 의해 인코딩된 효소는 천연 효소와 동일하거나 실질적으로 동일한 아미노산 서열을 갖는다. 예를 들어, 코딩 서열은 특정 원핵생물 또는 진핵생물 발현 시스템에서, 특정 코돈이 숙주에 의해 사용되는 빈도에 따라, CBH1의 더 빠른 발현을 용이하게 하도록 변형될 수 있다(보통 "코돈 최적화"로 지칭됨). 예를 들어, 문헌[Te'o, et al. (2000)]은 사상 진균에서의 발현을 위한 유전자의 최적화를 기재하고 있다. 그러한 핵산 서열은 때때로 "축퇴" 또는 "축퇴된 서열"로 지칭된다.

핵산 서열 및 기준 핵산 서열이 중등 내지 고도의 엄격성 혼성화 및 세척 조건 하에서 서로에게 특이적으로 혼성화되는 경우, 핵산 서열은 기준 핵산 서열에 "선택적으로 혼성화 가능"한 것으로 고려된다. 혼성화 조건은 핵산 결합 복합체 또는 탐침의 융해 온도 (Tm)에 기초한다. 예를 들어, "최대 엄격성"은 전형적으로 약 Tm-5℃ (탐침의 Tm보다 5° 미만)에서 일어나고; "고도의 엄격성"은 Tm보다 약 5-10° 미만에서 일어나며; "중등" 또는 "중간 엄격성"은 탐침의 Tm의 약 10-20° 미만에서 일어나고; "저도의 엄격성"은 Tm보다 약 20-25° 미만에서 일어난다. 기능적으로, 최대 엄격성 조건은 혼성화 탐침과 엄밀한 동일성 또는 거의 엄밀한 동일성을 갖는 서열을 식별하는데 사용될 수 있는 반면; 고도의 엄격성 조건은 탐침과 약 80% 이상의 서열 동일성을 갖는 서열을 식별하는데 사용된다.

중등 및 고도의 엄격성 혼성화 조건은 당업계에 공지되어 있다(예를 들어, 본 명세서에 참고로서 명확하게 포함된 문헌[Sambrook, et al, 1989, Chapters 9 and 11], 및 문헌[Ausubel, F.M., et al., 1993] 참조). 고도의 엄격성 조건의 예는 50% 포름아미드, 5X SSC, 5X 덴하츠(Denhardt) 용액, 0.5% SDS 및 100 ㎍/ml 변성된 담체 DNA 중에서의 약 42℃에서의 혼성화 후, 실온에서 2X SSC 및 0.5% SDS 중에서 2회 세척 및 42℃에서 0.1X SSC 및 0.5% SDS 중에서 2회 추가 세척하는 것을 포함한다.

본 명세서에서 사용되는 바와 같이, 세포와 관련되는 용어 "형질전환된", "안정하게 형질전환된" 또는 "유전자 이식 (transgenic)"은 세포가 그의 게놈 내로 통합되거나 여러 세대를 거쳐 유지되는 에피솜 플라스미드 (episomal plasmid)로서의 비-천연 (이종) 핵산 서열을 갖는 것을 의미한다.

본 명세서에서 사용되는 바와 같이, 용어 "발현"은 유전자의 핵산 서열에 기초하여 폴리펩티드가 생산되는 프로세스를 말한다. 일반적으로 상기 프로세스는 전사 및 번역 둘 모두를 포함한다.

핵산 서열을 세포 내로 삽입하는 상황에서 용어 "도입된 (introduced)"은 "형질감염 (transfection)", 또는 "형질전환 (transformation)" 또는 "형질도입 (transduction)"을 의미하고, 핵산 서열의 진핵 또는 원핵 세포 내로의 통합에 대한 언급을 포함하는데, 핵산 서열은 세포의 게놈 (예를 들어, 염색체, 플라스미드, 플라스티드, 또는 미토콘드리아 DNA) 내로 통합되거나, 자율 레플리콘으로 전환되거나, 일시적으로 발현될 수 있다(예를 들어, 형질감염된 mRNA).

결과적으로, 용어 "원하는 셀룰라제 발현"은 원하는 셀룰라제 유전자의 전사 및 번역을 말하는데, 그의 산물은 전구체 RNA, mRNA, 폴리펩티드, 번역-후 가공된 폴리펩티드를 포함한다. 예를 들어, CBH1 발현에 대한 검정법은 CBH1 효소에 대한 웨스턴 블롯 (Western blot), CBH1 mRNA에 대한 노던 블롯 분석 및 역전사 중합효소 연쇄 반응 (RT-PCR) 검정법, 및 문헌[Shoemaker S.P. and Brown R.D.Jr. (Biochim. Biophys. Acta, 1978, 523:133-146)] 및 문헌[Schulein (1988)]에 기재된 바와 같은 엔도글루카나제 활성 검정법을 포함한다.

용어 "숙주 세포"는 벡터를 함유하고 발현 작제물의 복제, 및/또는 전사 및/또는 전사 및 번역 (발현)을 지원하는 세포를 의미한다. 본 발명에서 사용하기 위한 숙주 세포는 원핵 세포, 예를 들어 대장균(E. coli), 또는 진핵 세포, 예를 들어 효모, 식물, 곤충, 양서류, 또는 포유류 세포일 수 있다. 소정의 실시 형태에서, 숙주 세포는 사상 진균이다.

본 명세서에서 사용되는 바와 같이, 용어 "세제 조성물"은 오염된 셀룰로오스 함유 패브릭의 세탁용 세척 매질에서 사용하기 위해 의도되는 혼합물을 말한다. 본 발명의 상황에서, 그러한 조성물은, 셀룰라제 및 계면활성제에 더하여, 추가적인 가수분해 효소, 증강제 (builder), 표백제, 표백 활성제, 청분제(bluing agent) 및 형광 염료, 케이킹 (caking) 억제제, 마스킹제, 셀룰라제 활성제, 항산화제, 및 가용화제를 포함할 수 있다.

본 명세서에서 사용되는 바와 같이, 용어 "계면활성제"는 표면 활성 특성을 갖는 것으로서 당업계에서 통상적으로 인지되는 임의의 화합물을 말한다. 따라서, 예를 들어, 계면활성제는 세제에서 통상적으로 발견되는 것과 같은 음이온성, 양이온성, 및 비이온성 계면활성제를 포함한다. 음이온성 계면활성제는 선형 또는 분지형 알킬벤젠설포네이트; 선형 또는 분지형 알킬 기 또는 알케닐 기를 갖는 알킬 또는 알케닐 에테르 설페이트; 알킬 또는 알케닐 설페이트; 올레핀설포네이트; 및 알칸설포네이트를 포함한다. 양성 계면활성제는 4차 암모늄염 설포네이트, 및 베타인계 양성 계면활성제를 포함한다. 그러한 양성 계면활성제는 동일한 분자 내에서 양 및 음으로 하전된 기를 둘 모두 갖는다. 비이온성 계면활성제는 폴리옥시알킬렌 에테르뿐 아니라 고급 지방산 알칸올아미드 또는 이의 알킬렌 옥사이드 부가물, 지방산 글리세린 모노에스테르 등을 포함할 수 있다.

본 명세서에서 사용되는 바와 같이, 용어 "셀룰로오스 함유 패브릭"은 천연 셀룰로오스 물질 및 인조 셀룰로오스 물질 (예를 들어, 황마, 아마, 마황, 레이온 및 리오셀)을 포함하는 면 함유 또는 면 비함유 셀룰로오스 또는 면 함유 또는 면 비함유 셀룰로오스 블렌드로 만들어지는 임의의 재봉 또는 비재봉 패브릭, 연사 또는 섬유를 말한다.

본 명세서에서 사용되는 바와 같이, 용어 "면 함유 패브릭"은 면 직포 패브릭(woven fabric), 면 니트, 면 데님, 면 연사, 원면 등을 포함하는 순수 면 또는 면 블렌드로 만들어지는 재봉 또는 비재봉 패브릭, 연사 또는 섬유를 말한다.

본 명세서에서 사용되는 바와 같이, 용어 "스톤워싱 조성물"은 셀룰로오스 함유 패브릭을 스톤워싱하는데 사용하기 위한 제형을 말한다. 스톤워싱 조성물은 판매 전, 즉, 제조 프로세스 동안 셀룰로오스 함유 패브릭을 변형시키는데 사용된다. 반대로, 세제 조성물은 오염된 의류를 세정하기 위해 의도되며 제조 프로세스 동안 사용되지 않는다.

첫 번째 폴리펩티드에서의 아미노산 위치 (또는 잔기)가 관련된 두 번째 폴리펩티드에서의 아미노산 위치에 "동등"한 것으로 언급된 경우, 이는 첫 번째 폴리펩티드의 아미노산 위치가 (i) 1차 서열 정렬 (하기 서열 정렬 및 서열 동일성의 설명 참조); (ii) 구조적 서열 상동성; 또는 (iii) 유사 기능적 특성 중 하나 이상에 의해 관련된 두 번째 폴리펩티드에서 언급된 위치에 대응하는 것을 의미한다. 따라서, 첫 번째 CBH 효소 (또는 이의 변이체)에서의 아미노산 위치는 두 번째 CBH 효소 (또는 심지어 다수의 상이한 CBH 효소들)에서의 아미노산 위치에 대해 "동등한" (또는 "상동인") 것으로 식별될 수 있다.

1차 서열 정렬: 동등한 아미노산 위치는 당업계에 다수가 공지된 1차 아미노산 서열 정렬 방법을 사용하여 결정될 수 있다. 예를 들어, 둘 이상의 상이한 CBH 효소들의 1차 아미노산 서열들을 정렬함으로써, 하나의 CBH 효소로부터의 아미노산 위치 번호를 CBH 효소들 중 다른 하나의 위치 번호에 동등하도록 지정할 수 있다. 이러한 방식으로, 하나의 CBH 효소 (예를 들어, 서열 번호 3에 표시된 CBH1 효소)의 아미노산 서열로부터 비롯된 번호 매김 시스템 (numbering system)은 다른 CBH 효소들 (예를 들어, 서열 번호 4 내지 15에 표시된 CBH1 효소들; 도 2 참조)에서의 동등한 (또는 상동인) 아미노산 잔기들을 식별하는데 사용될 수 있다.

구조적 서열 상동성: 1차 서열 정렬 방법을 사용하여 "동등한" 아미노산 위치를 결정하는 것에 더하여, "동등한" 아미노산 위치는 또한 2차 및/또는 3차 구조의 수준에서 상동성을 결정함으로써 정의될 수 있다. 예를 들어, 3차 구조가 x-선 결정학에 의해 결정된 셀룰라제에 대하여, 동등한 잔기는 셀룰라제의 특정 아미노산 잔기의 주쇄 원자들 중 둘 이상의 원자 좌표가 히포크레아 제코리나 CBH1 (N에서의 N, CA에서의 CA, C에서의 C, 및 O에서의 O)과의 정렬 후 0.13 nm 내에, 바람직하게는 0.1 nm 내에 있는 것으로 정의될 수 있다. 정렬은 H. 제코리나 CBH1에 대한 문제의 셀룰라제의 비-수소 단백질 원자의 원자 좌표의 최대 중복을 부여하도록 최상의 모델이 배향되고 위치된 후 달성된다. 최상의 모델은 이용가능한 최고 분해능에서의 실험적 회절 데이터에 대한 최저 R 인자가 수득되는 결정학적 모델이다.

유사 기능적 특성: 관련된 두 번째 폴리펩티드의 특정 잔기에 기능적으로 유사한 첫 번째 폴리펩티드에서의 동등한 아미노산 잔기 (예를 들어, 첫 번째 셀룰라제 및 H. 제코리나 CBH1)는 관련된 두 번째 폴리펩티드 (예를 들어, H. 제코리나 CBH1)의 특정 잔기에 정의되고 기인하는 방식으로 폴리펩티드 구조, 기질 결합, 또는 촉매 작용을 변경, 변형, 또는 이에 기여하도록 하는 형태를 차용하는 첫 번째 폴리펩티드에서의 그러한 아미노산으로 정의된다. 첫 번째 폴리펩티드에 대한 3차 구조가 x-선 결정학에 의해 수득되는 경우, 두 번째 폴리펩티드와 기능적으로 유사한 첫 번째 폴리펩티드의 아미노산 잔기가, 주어진 잔기의 주쇄 원자가 상동 위치를 점유하는 것을 근거로 하는 등가 기준을 만족시킬 수 없지만, 잔기의 측쇄 원자들 중 둘 이상의 원자 좌표가 두 번째 폴리펩티드 (예를 들어, H. 제코리나 CBH1)의 대응하는 측쇄 원자들의 0.13nm로 놓이는 정도로 유사한 위치를 점유한다.

본 명세서에서 변이체 효소 (예를 들어, CBH 변이체)에 대한 용어 "향상된 특성" 또는 "향상된 성능" 등은 그의 각각의 모 효소와 비교할 때 향상된, 변이체 효소와 관련된 특징 또는 활성으로 정의된다. 향상된 특성은 향상된 열안정성 또는 변경된 온도-의존성 활성 프로파일, 원하는 pH 또는 pH 범위에서 향상된 활성 또는 안정성, 향상된 기질 특이성, 향상된 산물 특이성, 및 셀룰라제 프로세스 단계에서 화학물질 또는 다른 성분의 존재 하에서 향상된 안정성, 등을 포함하지만, 이로 제한되지는 않는다. 향상된 성능은 하기의 것들을 포함하지만, 이로 제한되지는 않는 특정 검정법(들)을 사용하여 결정될 수 있다: (a) 발현 (단백질 함량 결정 검정법), (b) PASC 가수분해 검정법, (c) EG2의 존재 하에서의 PASC 가수분해 검정법, (d) 열 인큐베이션 후의 PASC 가수분해 검정법, (e) 전 가수분해물 PCS (whPCS) 검정법, (f) 희석 암모니아 옥수수 속대 (daCC) 검정법, 및 (g) 희석 암모니아 옥수수 대 (daCS) 검정법.

본 명세서에서 변이체 단백질 (예를 들어, CBH 변이체)에 대한 용어 "향상된 열안정성"은 승온에서의 인큐베이션 기간 후, 모 효소에 대한 효소 활성의 보존을 표시하는 변이체 효소로 정의된다. 그러한 변이체는 부모에 대한 변경된 열적 활성 프로파일을 표시하거나 표시하지 않을 수 있다. 예를 들어, 변이체는 승온에서의 인큐베이션 후, 부모에 대한 재접힘 (refold)에 대해 향상된 능력을 가질 수 있다.

"향상된 산물 특이성"은 모 효소에 비해 변경된 산물 프로파일을 표시하는 변이체 효소를 의미하는데, 변이체의 변경된 산물 프로파일은 주어진 응용에서 부모에 비해 향상된다. 본 명세서에서 "산물 프로파일"은 관심 효소에 의해 생산된 반응 산물의 화학 조성물로서 정의된다.

"향상된 화학 안정성"은 변이체 효소가 동일 조건 하에서 모 효소의 효소적 활성을 감소시키는 화학물질 또는 화학물질들의 존재 하에서의 인큐베이션 기간 후, 효소 활성의 보존을 표시하는 것을 의미한다. 향상된 화학 안정성을 갖는 변이체는 그러한 화학물질의 존재 하에서 모 효소에 비해 반응을 더 잘 촉매할 수 있다.

효소에 관하여, "pH 범위"는 효소가 촉매 활성을 나타내는 pH 값의 범위를 말한다.

효소에 관하여, 용어 "pH 안정" 및 "pH 안정성"은 소정의 기간 (예를 들어, 15 분, 30 분, 1 시간) 동안 pH 값의 넓은 범위에 걸쳐 활성을 보유하는 효소의 능력에 관한 것이다.

"퍼센트 서열 동일성" 또는 문법적 동등체는 특정 서열이 정렬 알고리즘을 사용하여 특정 기준 서열에서 적어도 소정 백분율의 그와 동일한 아미노산 잔기를 갖는다는 것을 의미한다. 서열 유사성을 결정하는데 적합한 알고리즘의 예는 문헌[Altschul, et al., J. Mol . Biol . 215:403-410 (1990)]에 기재된 BLAST 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보센터 (National Center for Biotechnology Information (<www(dot)ncbi(dot)nlm(dot)nih(dot)gov>))를 통해 공식적으로 이용가능하다. 이러한 알고리즘은 먼저, 데이터베이스 서열에서 동일 길이의 단어로 정렬될 때 일부 양 (positive)의 값의 역치 스코어 (score) T에 부합하거나 이를 만족시키는 쿼리 서열 (query sequence) 에서의 길이 W의 짧은 단어들을 동정함으로써 높은 스코어의 서열 쌍 (high scoring sequence pair, HSP)을 동정하는 것을 수반한다. 이러한 초기의 이웃 단어 적중 (word hit)은 이를 포함한 더 긴 HSP를 찾기 위한 출발점으로 작용한다. 단어 적중은 누적 정렬 스코어가 증가될 수 있는 한, 비교되는 두 서열의 각각을 따르는 양 방향으로 확장된다. 단어 적중의 확장은, 누적 정렬 스코어가 최대 성취 값으로부터 X 양만큼 떨어질 경우; 누적 스코어가 0 이하로 되는 경우; 또는 어느 한 서열의 말단에 도달할 경우에 중단된다. BLAST 알고리즘 파라미터 W, T, 및 X는 정렬의 민감도 및 속도를 결정한다. BLAST 프로그램은 디폴트로서 11의 단어 길이 (W), 50의 BLOSUM62 스코어링 매트릭스 (scoring matrix) (문헌[Henikoff & Henikoff, Proc . Natl . Acad . Sci . USA 89:10915 (1989)] 참조) 정렬 (B), 10의 기대치 (E), M'5, N'-4, 및 양 가닥들의 비교를 사용한다.

이어서, BLAST 알고리즘은 두 서열들 사이의 유사성에 대한 통계학적 분석을 수행한다(예를 들어, 문헌[Karlin & Altschul, Proc . Nat'l . Acad . Sci . USA 90:5873-5787 (1993)] 참조). BLAST 알고리즘에 의해 제공되는 유사성의 한 가지 측정은 최소 합 확률 (P(N))인데, 이는 2개의 뉴클레오티드 또는 아미노산 서열들 사이의 매치 (match)가 우연히 일어날 가능성의 지표를 제공한다. 예를 들어, 아미노산 서열은 테스트 아미노산 서열과 프로테아제 아미노산 서열의 비교에서 최소 합 확률이 약 0.1 미만, 더욱 바람직하게는 약 0.01 미만, 그리고 가장 바람직하게는 약 0.001 미만일 경우에 프로테아제와 유사한 것으로 간주된다.

퍼센트 서열 동일성에 대한 의문이 생길 때, 디폴트 파라미터 (default parameter)와 함께 CLUSTAL W 알고리즘을 이용한 정렬이 결정할 것이다. 문헌[Thompson et al. (1994) Nucleic Acids Res. 22:4673-4680] 참조. CLUSTAL W 알고리즘에 대한 디폴트 파라미터는:

갭 개방 페널티 (Gap opening penalty): 10.0

갭 확장 페널티 (Gap extension penalty): 0.05

단백질 중량 매트릭스 (matrix): BLOSUM 시리즈

DNA 중량 매트릭스: IUB

지연 발산 (Delay divergent) 서열 %: 40

갭 분리 거리 (Gap separation distance): 8

DNA 전이 중량: 0.50

친수성 잔기 리스트: GPSNDQEKR

음수 (negative) 매트릭스 사용: 오프 (OFF)

토글 (Toggle) 잔기 특이적 페널티: 온 (ON)

토글 친수성 페널티: 온

토글 말단 갭 분리 페널티 오프.

II. 분자 생물학

본 발명의 실시 형태는 관심 숙주 세포, 예를 들어, 사상 진균에서 기능적인 프로모터의 제어 하에서 셀룰라제-인코딩 핵산으로부터 원하는 셀룰라제 효소 (또는 셀룰라제 효소들의 조합)의 발현을 제공한다. 그러므로, 본 발명은 재조합 유전학 분야에서의 다수의 일상적인 기술들에 의존한다. 적합한 재조합 유전학 방법들의 예를 개시하고 있는 기본 텍스트들은 위에 언급되어 있다.

돌연변이를 모 핵산/폴리펩티드 내로 도입할 수 있는 본 기술 분야에 공지된 임의의 방법이 본 발명에 의해 고려된다.

본 발명은 변이 CBH1 효소의 발현, 정제 및/또는 단리 및 용도에 관한 것이다. 이들 효소는 본 기술 분야에 공지된 다수의 cbh1 유전자들 중 임의의 것 (예를 들어, 예컨대 H. 제코리나로부터의 서열 번호 3 내지 서열 번호 15에서의 cbh1 유전자)을 사용하는 재조합 방법에 의해 제조될 수 있다. 부위 지정 돌연변이법을 포함하는, 돌연변이를 도입하기 위한 임의의 편리한 방법이 사용될 수 있다. 위에 표시된 바와 같이, 돌연변이 (또는 변이(variation))는 발현된 CBH1 변이체에서의 하나 이상의 아미노산 변화에 대응할 치환, 첨가, 결실 또는 절단을 포함한다. 또한, 부위 지정 돌연변이법 및 DNA 수준에서 발현된 폴리펩티드에서 아미노산 변화를 혼입시키는 다른 방법들은 다수의 참고문헌, 예를 들어 문헌[Green and Sambrook, et al. 2012 and Ausubel, et al.]에서 찾을 수 있다.

모 CBH1의 아미노산 서열 변이체를 인코딩하는 DNA는 본 기술 분야에 공지된 다양한 방법에 의해 제조된다. 이러한 방법은 부위-지정 (또는 올리고뉴클레오티드-매개) 돌연변이법, PCR 돌연변이법, 및 모 CBH1 효소를 인코딩하는 초기 제조 DNA의 카세트 돌연변이법에 의한 제조를 포함하지만, 이로 제한되지는 않는다.

부위-지정 돌연변이법은 치환 변이체를 제조하는데 사용될 수 있는 하나의 방법이다. 이러한 기술은 본 기술 분야에 공지되어 있다(예를 들어, 문헌[Carter et al. Nucleic Acids Res. 13:4431-4443 (1985)] 및 문헌[Kunkel et al., Proc. Natl. Acad.Sci.USA 82:488 (1987)] 참조). 간략하게, DNA의 부위-지정 돌연변이법을 실행하는데 있어서, 출발 DNA는 원하는 돌연변이를 인코딩하는 올리고뉴클레오티드를 상기 출발 DNA의 단일 가닥으로 최초 혼성화함으로써 변경된다. 혼성화 후, 혼성화된 올리고뉴클레오티드를 프라이머로서 사용하고, 출발 DNA의 단일 가닥을 주형으로 사용하여, 전체 두 번째 가닥을 합성하는데 DNA 중합효소를 사용한다. 따라서, 원하는 돌연변이를 인코딩하는 올리고뉴클레오티드를 생성된 이중-가닥 DNA에 혼입시킨다.

PCR 돌연변이법은 또한 모 CBH1의 아미노산 서열 변이체를 만드는데 적합하다. 문헌[Higuchi, in PCR Protocols, pp.177-183 (Academic Press, 1990)]; 및 문헌[Vallette et al., Nuc. Acids Res. 17:723-733 (1989)] 참조. 간략하게, 소량의 주형 DNA가 PCR에서 출발 물질로서 사용되는 경우, 주형 DNA에서의 대응하는 부위로부터의 서열과 약간 상이한 프라이머가, 프라이머가 주형과 상이한 위치에서만 주형 서열과 상이한, 비교적 대량의 특이적 DNA 단편을 생성하는데 사용될 수 있다.

변이체를 제조하는 또 다른 방법인, 카세트 돌연변이법은 문헌[Wells et al., Gene 34:315-323 (1985)]에 의해 기재된 기술을 기초로 한다. 출발 물질은 돌연변이화될 출발 폴리펩티드 DNA를 포함하는 플라스미드 (또는 다른 벡터)이다. 돌연변이화될 출발 DNA 내의 코돈(들)이 확인된다. 확인된 돌연변이 부위(들)의 각 면 상에, 고유한 제한 엔도뉴클레아제 부위가 존재해야 한다. 그러한 제한 부위가 존재하지 않는 경우, 그는 출발 폴리펩티드 DNA에서의 적절한 위치에 도입되도록 상기 기재된 올리고뉴클레오티드-매개 돌연변이법을 사용하여 생성될 수 있다. 플라스미드 DNA는 이러한 부위에서 절단되어 선형화된다. 제한 부위들 사이에서 DNA의 서열을 인코딩하지만 원하는 돌연변이(들)를 포함하는 이중 가닥 올리고뉴클레오티드가 표준 절차를 사용하여 합성되는데, 여기서 올리고뉴클레오티드의 두 가닥은 따로 합성된 후 표준 기술을 사용하여 함께 혼성화된다. 이러한 이중 가닥 올리고뉴클레오티드는 카세트라 한다. 이러한 카세트는, 플라스미드로 직접 라이게이션될 수 있도록 선형화된 플라스미드의 말단과 상용성(compatible)인 5' 및 3' 말단을 갖도록 설계된다. 이러한 플라스미드는 이제 돌연변이화된 DNA 서열을 포함한다.

대안적으로, 또한 추가적으로, 원하는 셀룰라제를 인코딩하는 원하는 아미노산 서열이 결정될 수 있고, 그러한 아미노산 서열 변이체를 인코딩하는 핵산 서열은 합성적으로 생성될 수 있다.

이렇게 제조된 원하는 셀룰라제(들)는 종종 셀룰라제의 의도된 용도에 따라 추가적인 변형을 거칠 수 있다. 그러한 변형은 아미노산 서열의 추가적인 변경, 이종 폴리펩티드(들)로의 융합 및/또는 공유결합 변형을 포함할 수 있다.

III. 변이 CBH1 폴리펩티드 및 이를 인코딩하는 핵산

일 태양에서, 변이 CBH 효소가 제공된다. 변이 CBH 효소는 본 명세서에서 제시된 바와 같이, H. 제코리나 CBH1 (서열 번호 3)에 대해 적어도 80% (즉, 80% 이상)의 아미노산 서열 동일성 - 서열 번호 3에 대해 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 그리고 100% 이하의 아미노산 서열 동일성을 포함함 - 을 갖는 모 CBH 효소에 대한 하나 이상의 돌연변이를 갖는다. 소정의 실시 형태에서, 모 CBH는 진균성 셀로바이오하이드롤라제 1 (CBH1), 예를 들어, 히포크레아 제코리나, 히포크레아 슈바이닛찌이, 히포크레아 오리엔탈리스, 트리코더마 슈도코닌기이, 트리코더마 코닐랑브라, 트리코더마 시트리노비리데, 트리코더마 하자니움, 아스페르길루스 아큘레아투스, 아스페르길루스 니게르; 페니실리움 잔티넬룸, 후미콜라 그리세아, 스키탈리디움 써모필룸, 또는 포도스포라 안데리나로부터의 진균성 CBH1 효소이다. 또한, 변이 CBH 효소는 셀룰라제 활성을 갖는데, 소정의 실시 형태에서, (본 명세서에서 상세히 설명된 바와 같이) 변이 CBH는 모 CBH와 비교하여 향상된 특성을 갖는다. H. 제코리나 CBH1의 야생형, 성숙 형태에 대한 아미노산 서열이 도 1에 나타나 있다.

소정의 실시 형태에서, 변이 CBH 효소는 H. 제코리나로부터의 CBH1(서열 번호 3)의 성숙 형태에서의 잔기 F418, T246, T255, D241, G234, P194, N200, N49, Y247, T356, S92, 및 T41에 대응하는 하나 이상의 아미노산 위치에서 아미노산 돌연변이를 포함한다. 본 발명의 태양에 따른 소정의 모 CBH 효소는 H. 제코리나로부터의 야생형 CBH1과 동일한 아미노산을 갖지 않을 수 있으므로, 위에 언급된 잔기에 대응하는 아미노산 위치는 또한 위치 번호에 의해 단독으로 (즉, 418, 246, 255, 241, 234, 194, 200, 49, 247, 356, 92, 및 41로) 또는 접두사 "X"와 함께 (즉, X418, X246, X255, X241, X234, X194, X200, X49, X247, X356, X92, 및 X41로) 지정될 수 있다. H. 제코리나로부터의 CBH1에서 특정 아미노산 잔기에 대응하는 아미노산 위치를 지정하는 세 가지 모든 방법이 호환 가능한 것이 여기서 알려져 있다.

CBH 변이체의 아미노산 서열은 모 아미노산 서열의 하나 이상의 아미노산의 치환, 결실 또는 삽입에 의해 모 CBH 아미노산 서열과 상이하다. 히포크레아 제코리나 CBH1에서의 특정 잔기 또는 그 잔기의 일부와 상동 (즉, 1차 또는 3차 구조에서의 위치에 대응함)이거나 기능적으로 유사 (즉, 화학적 또는 구조적으로 조합, 반응, 또는 상호 작용하도록 동일 또는 유사한 기능적 능력을 가짐)한 경우, CBH 변이체의 잔기 (아미노산)는 히포크레아 제코리나 CBH1의 잔기와 동등하다. 본 명세서에서 사용되는 바와 같이, 번호 매김은 도 1에 도시된 바와 같은 성숙한 CBH1 아미노산 서열의 것에 대응하는 것으로 의도된다.

상동성을 결정하기 위한 아미노산 서열의 정렬은 "서열 비교 알고리즘"을 사용하여 결정될 수 있다. 비교를 위한 서열의 최적 정렬은, 예를 들어, 문헌[Smith & Waterman, Adv . Appl . Math. 2:482 (1981)]의 국소적 상동성 알고리즘, 문헌[Needleman & Wunsch, J. Mol . Biol . 48:443 (1970)]의 상동성 정렬 알고리즘, 문헌[Pearson & Lipman, Proc. Nat'l Acad. Sci. USA 85:2444 (1988)]의 유사성 탐색 방법, 이들 알고리즘의 컴퓨터화된 실행 (미국 위스콘신 주, 매디슨, 575 사이언스 드라이브 소재의, 제네틱스 컴퓨터 그룹 (Genetics Computer Group)의 위스콘신 제네틱스 소프트웨어 팩키지 (Wisconsin Genetics Software Package)에서의 GAP, BESTFIT, FASTA, 및 TFASTA), 또는 캐나다 몬트리올 소재의 케미칼 컴퓨팅 그룹 (Chemical Computing Group)에 의한 MOE 또는 육안 검사에 의해 수행될 수 있다. 상기 정의 섹션에 제공된 "퍼센트 서열 동일성"의 설명을 또한 참조.

소정의 실시 형태에서, 변이 CBH 효소에서 돌연변이(들)는 H. 제코리나로부터의 CBH1(서열 번호 3)에서의 아미노산 위치 F418, T246, T255, D241, G234, P194, N200, N49, Y247, T356, S92, 및 T41에 대응하는 하나 이상의 부위에서의 아미노산 치환이고, 일부 실시 형태에서, 치환은 하기 군으로부터 선택된다: F418M, T246S, T255V, D241N, G234D, P194V, T255I, T255K, T255R, N200G, N49P, T246V, Y247D, N200R, T246P, T255D, T356L, S92T, T255P, T41I. 표시된 부위에서의 전술한 치환의 모든 가능한 조합 (즉, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 치환을 가짐)이 본 발명의 고려되는 실시 형태이고, 이는 하기를 포함하지만, 이로 제한되지는 않는다:

1. F418M, T246S, T255V, D241N, G234D, P194V, T255I, T255K, T255R, N200G, N49P, T246V, Y247D, N200R, T246P, T255D, T356L로부터 선택되는 임의의 단일 아미노산 치환을 갖는 CBH 변이체;

2. F418M 치환을 갖는 상기 1의 CBH 변이체;

3. T246S 치환을 갖는 상기 1 또는 2의 CBH 변이체;

4. T246P 치환을 갖는 상기 1 또는 2의 CBH 변이체;

5. T246V 치환을 갖는 상기 1 또는 2의 CBH 변이체;

6. T255V 치환을 갖는 상기 1, 2, 3, 4 또는 5의 CBH 변이체;

7. T255I 치환을 갖는 상기 1, 2, 3, 4 또는 5의 CBH 변이체;

8. T255K 치환을 갖는 상기 1, 2, 3, 4 또는 5의 CBH 변이체;

9. T255R 치환을 갖는 상기 1, 2, 3, 4 또는 5의 CBH 변이체;

10. T255D 치환을 갖는 상기 1, 2, 3, 4 또는 5의 CBH 변이체;

11. T255P 치환을 추가로 포함하는 상기 1, 2, 3, 4 또는 5의 CBH 변이체;

12. D241N 치환을 갖는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11의 CBH 변이체;

13. G234D 치환을 갖는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12의 CBH 변이체;

14. P194V 치환을 갖는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13의 CBH 변이체;

15. N200G 치환을 갖는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14의 CBH 변이체;

16. N200R 치환을 갖는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14의 CBH 변이체;

17. N49P 치환을 갖는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16의 CBH 변이체;

18. Y247D 치환을 갖는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 17의 CBH 변이체; 및

19. T356L 치환을 갖는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18의 CBH 변이체.

소정의 실시 형태들에서, 상기에서 기재된 바와 같은 변이 CBH 효소는 서열 번호 3의 S92 및 T41에 대응하는 아미노산 위치들 중 하나 또는 둘 모두에 추가적인 아미노산 돌연변이를 추가로 포함하고, 이러한 실시 형태들 중 일부에서 돌연변이(들)는 S92T 및 T41I로부터 선택되는 치환이다.

앞서 기재된 치환을 갖는 이러한 추가적인 돌연변이의 모든 가능한 조합이 본 발명의 고려되는 실시 형태이고, 이는 다음을 포함하지만, 이로 제한되지는 않는다:

20. S92T 치환을 추가로 포함하는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18의 CBH 변이체;

21. T41I 치환을 추가로 포함하는 상기 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 또는 19의 CBH 변이체.

추가 실시 형태에서, 앞서 기재된 바와 같은 CBH1 변이체는 추가적인 것을 포함한다.

다른 태양에서, (예를 들어, 앞서 기재된 바와 같은) 모 CBH 효소에 대해 하나 이상의 돌연변이를 갖는 변이 CBH 효소를 인코딩하는 핵산이 제공된다. 소정의 실시 형태에서, 모 CBH1은 H. 제코리나 CBH1 (서열 번호 3)에 대해 적어도 80% (즉, 80% 이상)의 아미노산 서열 동일성을 갖는다. 소정의 실시 형태에서, 변이 CBH 효소를 인코딩하는 핵산은 서열 번호 1 (신호 서열을 인코딩하는 핵산 부분은 배제)에 대해 40% 이상, 50% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 76% 이상, 77% 이상, 78% 이상, 79% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 심지어 99% 이상의 상동성/동일성을 갖는다. 유전 코드의 축퇴로 인해, 복수의 핵산이 동일한 변이 CBH 효소를 인코딩할 수 있음이 이해될 것이다. 더욱이, 본 명세서에 기재된 바와 같은 변이 CBH 효소를 인코딩하는 핵산은, 예를 들어 관심 숙주 세포에서의 발현을 증가시키기 위해, 최적화된 코돈이 되도록 조작될 수 있다. 소정의 코돈 최적화 기술이 본 기술 분야에 공지되어 있다.

소정의 실시 형태에서, 변이 CBH 효소-인코딩 핵산은 서열 번호 1 (신호 서열을 인코딩하는 핵산 부분은 배제)에 대해 40% 이상, 50% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 76% 이상, 77% 이상, 78% 이상, 79% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 심지어 99% 이상의 상동성/동일성을 갖는 CBH를 인코딩하는 핵산 (또는 인코딩하는 핵산에 상보적인 핵산)에 대한 엄격성 조건 하에서 혼성화된다.

핵산은 신호 서열을 포함하는 "전체 길이 (full-length)" ("fl" 또는 "FL") 변이 CBH 효소, 신호 서열이 없는 변이 CBH 효소의 성숙 형태 단독, 또는 성숙 형태의 N 및/또는 C-말단의 일부가 없는 변이 CBH 효소의 절단된 형태를 인코딩할 수 있다.

아래에 기재되는 바와 같이, 변이 CBH 효소를 인코딩하는 핵산은 관심 숙주 세포(들)에서의 변이 CBH 효소의 발현에 적합한 벡터 내 다양한 프로모터 및 조절자에 작동가능하게 연결될 수 있다.

IV. 재조합 CBH1 변이체의 발현

본 발명의 태양은 CBH 변이체를 인코딩하는 생성 핵산, 그러한 핵산을 함유하는 숙주 세포, 그러한 숙주 세포에 의한 CBH 변이체의 생산, 및 CBH 변이체의 단리, 정제 및/또는 용도에 관련된 방법 및 조성물을 포함한다.

이와 같이, 발명의 실시 형태는 원하는 CBH 변이체-인코딩 핵산 서열을 포함하는 발현 벡터로 형질도입, 형질전환 또는 형질감염된 숙주 세포를 제공한다. 예를 들어, 사상 진균 세포 또는 효모 세포는, 원하는 CBH 변이체가 세포주 내에서 발현되도록, 원하는 CBH 변이체를 인코딩하는 DNA 분절에 작동가능하게 연결된, 숙주 세포주에서 기능하는, 프로모터 또는 생물학적으로 활성인 프로모터 단편 또는 하나 이상의 (예를 들어, 일련의) 인핸서를 갖는 발현 벡터로 형질감염된다.

A. 핵산 작제물/발현 벡터.

원하는 CBH 변이체를 인코딩하는 천연 또는 합성 폴리뉴클레오티드 단편은 관심 숙주 세포 (예를 들어, 사상 진균 또는 효모 세포) 내로 도입되고 그에서 복제될 수 있는 이종 핵산 작제물 또는 벡터에 혼입될 수 있다. 본 명세서에 개시된 벡터 및 방법은 원하는 CBH 변이체의 발현을 위해 숙주 세포에서 사용하기에 적합하다. 임의의 벡터는 이것이 도입된 숙주 세포(들)에서 원하는 복제/발현 특징들을 만족하는 한 사용될 수 있다(그러한 특징들은 일반적으로 사용자에 의해 정의됨). 다수의 적합한 벡터들 및 프로모터들이 당업자에게 공지되어 있으며, 이들 중 일부는 구매가능하다. 클로닝 및 발현 벡터는 또한 각각이 본 명세서에 참고로서 명백히 포함되는 문헌[Sambrook et al., 1989], 문헌[Ausubel FM et al., 1989], 및 문헌[Strathern et al., 1981]에 기재되어 있다. 진균에 대한 적절한 발현 벡터는 문헌[van den Hondel, C.A.M.J.J. et al. (1991) In: Bennett, J.W. and Lasure, L.L. (eds.) More Gene Manipulations in Fungi. Academic Press, pp. 396-428]에 기재되어 있다. 적절한 DNA 서열은 다양한 절차에 의해 플라스미드 또는 벡터 (본 명세서에서 총체적으로 "벡터"로 지칭됨)에 삽입될 수 있다. 일반적으로, DNA 서열은 표준 절차에 의해 적절한 제한 엔도뉴클레아제 부위(들)에 삽입된다. 그러한 절차 및 관련된 서브-클로닝 절차는 당업자의 지식 범주 내에 있는 것으로 간주된다.

원하는 CBH 변이체에 대한 코딩 서열을 포함하는 재조합 숙주 세포는 원하는 CBH 변이체 코딩 서열을 포함하는 이종 핵산 작제물을 (예를 들어, 아래에서 더욱 상세하게 기재된 것과 같은) 원하는 숙주 세포 내로 도입함으로써 생산될 수 있다. 예를 들어, 원하는 CBH 변이체 코딩 서열은 공지된 재조합 기술에 따라 적합한 벡터 내로 삽입될 수 있고, CBH 발현이 가능한 사상 진균을 형질전환시키는데 사용될 수 있다. 위에서 언급된 바와 같이, 유전적 코드의 천연 축퇴로 인해, 실질적으로 동일하거나 기능적으로 동등한 아미노산 서열을 인코딩하는 다른 핵산 서열이 원하는 CBH 변이체를 클로닝하고 발현시키는데 사용될 수 있다. 그러므로, 코딩 영역에서의 그러한 치환이 본 발명에 의해 커버되는 서열 변이체 내에 포함된다는 것이 이해된다.

본 발명은 또한 상기한 바와 같은 원하는 CBH 변이체-인코딩 핵산 서열 중 하나 이상을 포함하는 재조합 핵산 구조물을 포함한다. 작제물은 본 발명의 서열이 정방향 또는 역방향 배향으로 삽입된, 플라스미드 또는 바이러스 벡터와 같은 벡터를 포함한다.

이종 핵산 작제물은 하기와 같이 원하는 CBH 변이체에 대한 코딩 서열을 포함할 수 있다: (i) 단리물 내; (ii) 원하는 CBH 변이체 코딩 서열이 우세한 코딩 서열인 융합 폴리펩티드 또는 신호 펩티드 코딩 서열과 같은 추가적인 코딩 서열과의 조합으로; (iii) 비-코딩 서열, 예컨대 인트론 및 제어 요소, 예컨대 적합한 숙주에서의 코딩 서열의 발현에 효과적인 프로모터 및 터미네이터 요소 또는 5' 및/또는 3' 미번역 영역과의 조합으로; 그리고/또는 (iv) 원하는 CBH 변이체 코딩 서열이 이종 유전자인 벡터 또는 숙주 환경 내.

본 발명의 일 태양에서, 이종 핵산 작제물은 원하는 CBH 변이체-인코딩 핵산 서열을 시험관 내에서 숙주 세포 내로, 예를 들어, 확립된 사상 진균주 및 효모균주 내로 이동시키는데 사용된다. 원하는 CBH 변이체의 장기간 생산은 CBH 변이체가 안정하게 발현되는 숙주 세포를 생성함으로써 달성될 수 있다. 따라서, 결과적으로, 안정한 형질전환체를 생성하기에 효과적인 임의의 방법이 본 발명을 실행하는데 사용될 수 있다.

적절한 벡터에는 전형적으로 선별가능한 마커-인코딩 핵산 서열, 삽입 부위, 및 적합한 제어 요소, 예컨대 프로모터 및 종결 서열이 갖추어진다. 벡터는 예를 들어 비-코딩 서열, 예컨대 인트론 및 숙주 세포에서 (그리고/또는 변형된 가용성 단백질 항원 코딩 서열이 정상적으로 발현되지 않는 벡터 또는 숙주 세포 환경에서) 코딩 서열의 발현에 효과적이고, 코딩 서열에 작동적으로 연결된 제어 요소, 즉 프로모터 및 터미네이터 요소 또는 5' 및/또는 3' 미번역 부위를 포함하는 조절 서열을 포함할 수 있다. 다수의 적합한 벡터 및 프로모터가 당업자에게 공지되어 있으며, 이들 중 다수가 구매가능하고/하거나 문헌[Sambrook, et al.](상기됨)에 기재되어 있다.

적합한 프로모터의 예는 항시 발현 프로모터 및 유도성 프로모터 둘 모두를 포함하며, 그의 예는 CMV 프로모터, SV40 초기 프로모터, RSV 프로모터, EF-1α 프로모터, 기재된 바와 같은 tet-on 또는 tet-off 시스템에서 tet 반응성 요소 (TRE)를 함유하는 프로모터 (클론테크 (ClonTech) 및 바스프 (BASF)), 베타 액틴 프로모터 및 소정 금속 염의 첨가에 의해 상향 조절될 수 있는 메탈로티오닌 프로모터를 포함한다. 프로모터 서열은 발현을 위해 특정 숙주 세포에 의해 인지되는 DNA 서열이다. 이는 변이 CBH1 폴리펩티드를 인코딩하는 DNA 서열에 작동가능하게 연결된다. 그러한 결합은 프로모터가 CBH 변이체-인코딩 서열의 전사/번역을 구동할 수 있도록 발현 벡터 내 변이 CBH1 폴리펩티드를 인코딩하는 DNA 서열의 개시 코돈에 대한 프로모터의 위치설정 (positioning)을 포함한다. 프로모터 서열은 변이 CBH1 폴리펩티드의 발현을 매개하는 전사 및 번역 제어 서열을 함유한다. 예는 아스페르길루스 니게르, A 아와모리 또는 A. 오리재 (oryzae) 글루코아밀라제, 알파-아밀라제, 또는 알파-글루코시다제 인코딩 유전자; A. 니둘란스 gpdA 또는 trpC 유전자; 뉴로스포라 크라사 (crassa) cbh1 또는 trp1 유전자; A. 니게르 또는 리조무코르 (Rhizomucor) 미에헤이 아스파르트 프로테이나제 인코딩 유전자; H. 제코리나 cbh1, cbh2, egl1, egl2, 또는 다른 셀룰라제 인코딩 유전자로부터의 프로모터를 포함한다.

적절한 선별가능한 마커의 선택은 숙주 세포에 의존할 것이며, 상이한 숙주에 대한 적절한 마커가 당업계에 공지되어 있다. 전형적인 선별가능한 마커 유전자는 A. 니둘란스 또는 H. 제코리나로부터의 argB, A. 니둘란스로부터의 amdS, 뉴로스포라 크라사 또는 H. 제코리나로부터의 pyr4, 아스페르길루스 니게르 또는 A. 니둘란스로부터의 pyrG를 포함한다. 적합한 선별가능한 마커의 추가적인 예는 trp-, pyr-, leu- 등과 같은 돌연변이 균주를 형질전환하는데 사용되는 이종 핵산 작제물에 포함되는, trpc, trp1, oliC31, niaD 또는 leu2를 포함하지만, 이로 제한되지는 않는다.

그러한 선별가능한 마커는 사상 진균에 의해 통상적으로 대사되지 않는 대사물을 이용하는 능력을 형질전환체에 부여한다. 예를 들어, H. 제코리나로부터의 amdS 유전자는, 형질전환체 세포가 질소 공급원으로서 아세트아미드 상에서 성장하도록 하는 효소 아세트아미다제를 인코딩한다. 선별가능한 마커 (예를 들어, pyrG)는 선별적 최소 배지 상에서 성장하도록 영양요구성 돌연변이 균주의 능력을 회복시킬 수 있거나, 선별가능한 마커 (예를 들어, olic31)는 저해 약물 또는 항생제의 존재 하에 성장하도록 하는 능력을 형질전환체에 부여할 수 있다.

선별가능한 마커 코딩 서열은 본 기술 분야에서 일반적으로 사용되는 방법을 이용하여 임의의 적합한 플라스미드로 클로닝된다. 적합한 플라스미드의 예는 pUC18, pBR322, pRAX 및 pUC100을 포함한다. pRAX 플라스미드는 A. 니게르에서 복제될 수 있게 하는 A. 니둘란스로부터의 AMA1 서열을 함유한다.

본 발명의 실행은, 달리 표시되지 않는 한, 당업계의 기술 내에 있는 분자 생물학, 미생물학, 재조합 DNA, 및 면역학의 종래 기술을 이용할 것이다. 그러한 기술은 문헌에서 충분히 설명된다. 예를 들어, 문헌[Sambrook et al., 1989]; 문헌[Freshney, 1987]; 문헌[Ausubel, et al., 1993]; 및 문헌[Coligan et al., 1991] 참조.

B. CBH1 및 변이 CBH1 효소 생산을 위한 숙주 세포 및 배양 조건

CBH1 변이체를 인코딩하는 DNA 서열이 DNA 작제물로 클로닝된 후, DNA는 미생물을 형질전환하는데 사용된다. 본 발명에 따른 변이 CBH1을 발현시킬 목적으로 형질전환되는 미생물은 매우 다양한 숙주 세포들로부터 선택될 수 있다. 아래 섹션들은 숙주 세포/미생물의 예로서 제공되지만, 본 발명의 태양을 실행하는데 사용될 수 있는 숙주 세포의 범주를 제한하려는 것은 아니다.

(i) 사상 진균

본 발명의 태양은 대응하는 비-형질전환된 모 사상 진균에 대한 원하는 CBH 변이체 생산 또는 발현을 야기하기에 효과적인 방식으로 변형되고, 선택되고 배양된 사상 진균을 포함한다.

원하는 셀룰라제 발현을 위해 처리 및/또는 변형될 수 있는 모 사상 진균 종의 예는 트리코더마, 페니실리움 종, 후미콜라 인솔렌스를 포함하는 후미콜라 종; 아스페르길루스 니게르를 포함하는 아스페르길루스 종, 크리소스포리움 종, 푸사리움 종, 히포크레아 종, 및 에메리셀라 종을 포함하지만, 이로 제한되지는 않는다.

원하는 CBH 변이체를 발현하는 세포는 모 진균주를 배양하는데 전형적으로 이용되는 조건 하에서 배양된다. 일반적으로, 세포는 문헌[Pourquie, J. et al., Biochemistry and Genetics of Cellulose Degradation, eds. Aubert, J. P. et al., Academic Press, pp. 71-86, 1988] 및 문헌[Ilmen, M. et al., Appl. Environ. Microbiol. 63:1298-1306, 1997]에 기재된 바와 같은, 생리학적 염 및 영양분을 함유하는 표준 배지에서 배양된다. 표준 배양 조건은 본 기술 분야에 공지되어 있으며, 예를 들어, 배양물은 원하는 수준의 원하는 CBH 변이체 발현이 달성될 때까지 진탕기 배양 또는 발효기에서 28℃에서 인큐베이팅된다.

주어진 사상 진균에 대한 배양 조건은, 예를 들어, 과학 문헌에서 그리고/또는 미국 미생물 보존 센터 (ATCC)와 같은 진균의 공급원으로부터 찾을 수 있다. 진균 성장이 확립된 후, 원하는 CBH 변이체의 발현을 야기하거나 허용하기에 효과적인 조건에 세포를 노출시킨다.

원하는 CBH 변이체 코딩 서열이 유도성 프로모터의 제어 하에 있는 경우, 유도제, 예를 들어, 당, 금속 염 또는 항생제가 원하는 CBH 변이체의 발현을 유도하기에 효과적인 농도로 배지에 첨가된다.

일 실시 형태에서, 균주는 과발현된 폴리펩티드를 수득하기에 유용한 균주인 아스페르길루스 니게르 균주이다. 예를 들어, A. 니게르 변이체 아와모리 dgr246은 상승된 양의 분비 셀룰라제를 분비하는 것으로 알려져 있다(문헌[Goedegebuur et al, Curr. Genet (2002) 41: 89-98]). GCDAP3, GCDAP4 및 GAP3-4와 같은 아스페르길루스 니게르 변이체 아와모리의 다른 균주가 알려져 있다(문헌 [Ward et al (Ward, M, Wilson, L.J. and Kodama, K.H., 1993, Appl. Microbiol. Biotechnol. 39:738-743]).

다른 실시 형태에서, 균주는 과발현된 폴리펩티드를 수득하는데 유용한 균주인 트리코더마 레에세이 균주이다. 예를 들어, 문헌[Sheir-Neiss, et al., Appl. Microbiol. Biotechnol . 20:46-53 (1984)]에 기재된 RL-P37은 상승된 양의 셀룰라제 효소를 분비하는 것으로 알려져 있다. RL-P37의 기능적 동등체는 트리코더마 레에세이 균주 RUT-C30 (ATCC 번호 56765) 및 균주 QM9414 (ATCC 번호 26921)를 포함한다. 이러한 균주는 또한 변이 CBH를 과발현시키는데 유용할 것으로 간주된다.

잠재적으로 유해한 천연 셀룰라제 활성의 부재 하에 원하는 CBH 변이체를 수득하는 것이 요구되는 경우, 원하는 CBH 변이체를 인코딩하는 DNA 단편을 함유하는 DNA 작제물 또는 플라스미드의 도입 전에, 결실된 하나 이상의 셀룰라제 유전자를 가졌던 숙주 세포주를 수득하는 것이 유용하다. 그러한 균주는 임의의 편리한 방법으로, 예를 들어 본 명세서에 참고로서 포함되는 개시물인 미국 특허 제5,246,853호 및 WO 92/06209호에 개시된 방법에 의해 제조될 수 있다. 하나 이상의 셀룰라제 유전자 (예를 들어, 숙주 세포의 내재성 CBH1 유전자)가 결실된 숙주 미생물에서 원하는 CBH 변이체를 발현시킴으로써, 필요한 경우, 확인 및 후속적 정제 절차가 단순화된다.

유전자 결실은 결실되거나 분열될 원하는 유전자의 형태를 당업계에 공지된 방법에 의해 플라스미드 내에 삽입함으로써 이루어질 수 있다. 결실 플라스미드는 이후 원하는 유전자 코딩 영역에 대해 내부인 적절한 제한 효소 부위(들)에서 절단되고, 유전자 코딩 서열 또는 이의 일부가 선별가능한 마커로 대체된다. 결실되거나 분열될 유전자의 자리 (locus)로부터의 측면 (flanking) DNA 서열, 예를 들어 약 0.5 내지 약 2.0 kb는 선별가능한 마커 유전자의 어느 일 측에 남을 수 있다. 적절한 결실 플라스미드는 일반적으로, 측면 DNA 서열을 포함하는 결실 유전자 및 선별가능한 마커 유전자를 포함하는 단편이 단일 선형 조각으로서 제거될 수 있도록 그에 존재하는 고유한 제한 효소 부위를 가질 것이다.

소정의 실시 형태에서, 원하는 CBH 변이체를 인코딩하는 DNA의 하나 초과의 카피(copy)가 CBH 변이체의 과발현을 가능하게 하도록 숙주 균주에 존재할 수 있다. 예를 들어, 숙주 세포는 게놈 내로 통합된 원하는 CBH 변이체의 다수의 카피를 가질 수 있거나, 대안적으로, 숙주 생물에서 자율적으로 복제 가능한 플라스미드 벡터를 포함할 수 있다.

(ii) 효모

본 발명은 또한 원하는 CBH 생산을 위한 숙주 세포로서 효모의 사용을 고려한다. 가수분해 효소를 인코딩하는 몇몇 다른 유전자가 효모 S. 세레비지애의 다양한 균주에서 발현되었다. 이들은 2개의 엔도글루카나제 (문헌[Penttila et al., 1987]), 2개의 셀로바이오하이드롤라제 (문헌[Penttila et al., 1988]) 및 트리코더마 레에세이로부터의 1개의 베타-글루코시다제 (문헌[Cummings and Fowler, 1996]), 아우레오바시드리움 플루란스(Aureobasidlium pullulans)로부터의 자일라나제 (문헌[Li and Ljungdahl, 1996]), 밀로부터의 알파-아밀라제 (문헌[Rothstein et al., 1987]) 등에 대해 인코딩하는 서열을 포함한다. 또한, 부티리비브리오 피브리솔벤스 (Butyrivibrio fibrisolvens) 엔도- [베타] -1,4-글루카나제 (END1), 파네로카에테 크리소스포리움 (Phanerochaete chrysosporium) 셀로바이오하이드롤라제 (CBH1), 루미노코쿠스 프라베파시엔스 (Ruminococcus flavefaciens) 셀로덱스트리나제 (cellodextrinase) (CEL1) 및 엔도마이세스 피브릴라이저 (Endomyces fibrilizer) 셀로바이아제 (cellobiase) (Bgl1)를 인코딩하는 셀룰라제 유전자 카세트는 S. 세레비지애의 실험실 균주에서 성공적으로 발현되었다(문헌[Van Rensburg et al., 1998]).

(iii) 기타

일부 실시 형태에서, 사상 진균 세포 또는 효모 세포 이외의 숙주 세포에서의 발현 시스템이 사용될 수 있음이 또한 고려되고, 이는 곤충 세포 또는 세균 세포 발현 시스템을 포함한다. 예를 들어, 세균 숙주 세포의 일부는, 예를 들어 관심 효소(들)/변이체(들)를 발현할 수 있을 뿐 아니라, 소정의 단량체성 및 기타 발효성 당을 대사하여 이를 에탄올로 전환할 수 있는, 조작된 자이모모나스 모빌리스 (Zymomonas mobilis)와 같은 에탄올 생성체 (ethanologen)인 것일 수 있다. 숙주 세포의 선택은 본 명세서에 기재된 CBH 변이체의 사용자의 요구에 의해 결정될 수 있고, 따라서 그러한 점에서 제한을 하려는 것은 아니다.

C. 원하는 CBH -인코딩 핵산 서열의 숙주 세포 내로의 도입.

본 발명은 외생적으로 제공되는 원하는 CBH 변이체-인코딩 핵산 서열을 포함하도록 유전적으로 변형된 세포 및 세포 조성물을 추가로 제공한다. 모 세포 또는 세포주는 클로닝 벡터 또는 발현 벡터로 유전적으로 변형 (예를 들어, 형질도입, 형질전환 또는 형질감염)될 수 있다. 벡터는, 예를 들어 상기에서 추가로 설명된 바와 같이 플라스미드, 바이러스 입자, 파지(phage) 등의 형태일 수 있다.

본 발명의 형질전환 방법은 숙주 세포의 게놈 내로 형질전환 벡터의 일부 또는 전부를 안정적으로 통합시킬 수 있다. 그러나, 자가-복제 염색체외 형질전환 벡터를 유지시키는 형질전환이 또한 고려된다.

외래 (foreign) 뉴클레오티드 서열을 숙주 세포 내로 도입하기 위한 임의의 공지된 절차가 사용될 수 있다. 이는 인산칼슘 형질감염, 폴리브렌(polybrene), 원형질체 융합, 전기천공, 생탄도법 (biolistics), 리포솜, 미세주입, 플라스마 벡터, 바이러스 벡터, 및 클로닝된 게놈 DNA, cDNA, 합성 DNA 또는 기타 외래 유전적 물질을 숙주 세포 내로 도입하기 위한 임의의 다른 공지된 방법 (예를 들어, 상기 문헌[Sambrook et al.] 참조)의 사용을 포함한다. 본질적으로, 사용된 특정 유전 공학적 절차는 원하는 CBH 변이체를 발현할 수 있는 숙주 세포 내로 폴리뉴클레오티드 (예를 들어, 발현 벡터)를 성공적으로 도입시킬 수 있어야 한다.

많은 표준 형질감염 방법이 다량의 이종 폴리펩티드를 발현하는 트리코더마 레에세이 세포주를 생산하는데 사용될 수 있다. DNA 작제물을 트리코더마의 셀룰라제-생산 균주 내로 도입하는 공개된 방법의 일부는 문헌[Lorito, Hayes, DiPietro and Harman, 1993, Curr. Genet. 24: 349-356]; 문헌[Goldman, Van Montagu and Herrera-Estrella, 1990, Curr. Genet. 17:169-174]; 문헌[Penttila, Nevalainen, Ratto, Salminen and Knowles, 1987, Gene 6: 155-164], 아스페르길루스에 대한 문헌[Yelton, Hamer and Timberlake, 1984, Proc. Natl. Acad. Sci. USA 81: 1470-1474], 푸사리움에 대한 문헌[Bajar, Podila and Kolattukudy, 1991, Proc. Natl. Acad. Sci. USA 88: 8202-8212], 스트렙토마이세스에 대한 문헌[Hopwood et al., 1985, The John Innes Foundation, Norwich, UK] 및 바실러스에 대한 문헌[Brigidi, DeRossi, Bertarini, Riccardi and Matteuzzi, 1990, FEMS Microbiol. Lett. 55: 135-138]을 포함한다. 아스페르길루스 종에 대한 적합한 형질전환 프로세스의 예는 문헌[Campbell et al. Improved transformation efficiency of A.niger using homologous niaD gene for nitrate reductase. Curr. Genet. 16:53-56; 1989]에서 찾을 수 있다.

본 발명은 진균성 셀룰라제 조성물을 생산하는데 사용하기 위한 숙주 세포, 예를 들어 H. 제코리나 및 A. 니게르와 같은 사상 진균의 신규하고 유용한 형질전환체를 추가로 포함한다. 따라서, 본 발명의 태양은, 때때로 내재성 cbh 코딩 서열의 결실을 또한 포함하는, 원하는 CBH 변이체 코딩 서열을 포함하는 사상 진균의 형질전환체를 포함한다.

또한, 원하는 셀룰라제-인코딩 핵산 서열을 포함하는 이종 핵산 작제물은 실험실 내에서 전사될 수 있고, 생성된 RNA는 공지된 방법, 예를 들어 주입에 의해 숙주 세포 내로 도입될 수 있다.

D. CBH1 핵산 코딩 서열 및/또는 단백질 발현에 대한 분석.

원하는 CBH 변이체-인코딩 핵산 작제물로 형질전환된 세포주에 의한 원하는 CBH 변이체의 발현을 평가하기 위해, 단백질 수준, RNA 수준에서 또는 셀로바이오하이드롤라제 활성 및/또는 생산에 대해 특별한 기능적 생물검정법을 사용하여 검정법을 수행할 수 있다.

일반적으로, 원하는 CBH 변이체의 발현을 분석하기 위해 사용되는 검정법은 노던 블롯팅 (Northern blotting), 도트 블롯팅 (dot blotting) (DNA 또는 RNA 분석), RT-PCR (역전사 중합효소 연쇄 반응), 또는 (핵산 코딩 서열에 기초한) 적절하게 표지된 탐침을 사용하는 제자리 혼성화 (in situ hybridization) 및 종래의 서던 블롯팅 (Southern blotting) 및 자기방사법 (autoradiography)을 포함하지만, 이로 제한되지는 않는다.

또한, 원하는 CBH 변이체의 생산 및/또는 발현은 샘플에서 직접, 예를 들어, 셀로바이오하이드롤라제 활성, 발현 및/또는 생산에 대한 검정법에 의해, 측정될 수 있다. 그러한 검정법은, 예를 들어 문헌[Becker et al., Biochem J. (2001) 356:19-30] 및 문헌[Mitsuishi et al., FEBS (1990) 275:135-138]에 기재되어 있고, 이들의 각각은 본 명세서에서 참고로 명백히 포함된다. 단리된 용해성 및 불용성 기질을 가수분해하는 CBH1의 능력은 문헌[Srisodsuk et al., J. Biotech. (1997) 57:49-57] 및 문헌[Nidetzky and Claeyssens Biotech. Bioeng. (1994) 44:961-966]에 기재된 검정법을 사용하여 측정될 수 있다. 셀로바이오하이드롤라제, 엔도글루카나제 또는 β-글루코시다제의 활성을 검정법하기에 유용한 기질은 결정질 셀룰로오스, 여과지, 인산 팽윤 셀룰로오스, 셀로올리고당, 메틸움벨리페릴 락토시드, 메틸움벨리페릴 셀로바이오시드, 오르쏘니트로페닐 락토시드, 파라니트로페닐 락토시드, 오르쏘니트로페닐 셀로바이오시드, 파라니트로페닐 셀로바이오시드를 포함한다.

또한, 단백질 발현은 면역학적 방법, 예를 들어 ELISA, 경쟁적 면역검정법, 방사면역검정법, 웨스턴 블롯, 간접 면역형광 검정법 등에 의해 평가될 수 있다. 이러한 검정법 중 일부는 CBH 효소를 검출하도록 설계된 구매가능한 시약 및/또는 키트를 사용하여 수행될 수 있다. 그러한 면역검정법은 원하는 CBH 변이체의 발현을 정성적으로 그리고/또는 정량적으로 평가하는데 사용될 수 있다. 그러한 방법의 상세한 내용은 당업자에게 공지되어 있으며, 그러한 방법을 실시하기 위한 다수의 시약들이 시판되고 있다. 소정의 실시 형태에서, 원하는 변이 CBH 효소에 특이적이지만 그의 모 CHB에는 비특이적인 면역학적 시약, 예를 들어 CBH 치환 또는 CBH 변이체의 융합 파트너 (예를 들어, N 또는 C 말단 태그 (tag) 서열, 예를 들어, 헥사-히스티딘 태그 또는 플래그 (FLAG) 태그)에 특이적인 항체가 사용될 수 있다. 따라서, 본 발명의 태양은 다양한 면역검정법에 사용되는 발현된 폴리펩티드에 특이적인 단클론 또는 다클론 항체를 생산하기 위해 원하는 CBH 변이체의 정제된 형태를 사용하는 것을 포함한다. (예를 들어, 문헌[, Hu et al., 1991] 참조).

V. CBH 변이체 폴리펩티드의 부화, 단리 및/또는 정제 방법

일반적으로, 숙주 세포 배양물에서 생산된 원하는 CBH 변이체 폴리펩티드는 (CBH 변이체를 함유하는 배양 상청액을 생산하는) 배지로 분비되며, 예를 들어 세포 배양 배지로부터의 원치 않는 구성요소를 제거함으로써 부화, 정제 또는 단리될 수 있다. 그러나, 일부 경우에서, 원하는 CBH 변이체 폴리펩티드는 세포 용해물로부터의 회수를 필요로 하는 세포 형태로 생산될 수 있다. 원하는 CBH 변이체 폴리펩티드는 당업자에 의해 일상적으로 이용되는 기술을 사용하여 생산된 세포들 또는 세포 상청액으로부터 수거된다. 예로는 여과 (예를 들어, 한외- 또는 미세-여과), 원심분리, 밀도 구배 분류 (예를 들어, 밀도 구배 초원심분리), 친화 크로마토그래피 (문헌[Tilbeurgh et al., 1984]), 고해상력을 갖는 물질을 사용하는 이온-교환 (문헌[Medve et al., 1998])을 포함하는 이온-교환 크로마토그래피법 (문헌[Goyal et al., 1991]; 문헌[Fliess et al., 1983]; 문헌[Bhikhabhai et al., 1984]; 문헌[Ellouz et al., 1987]), 소수성 상호작용 크로마토그래피 (문헌[Tomaz and Queiroz, 1999]), 및 2상 분배 (two-phase partitioning) (문헌[Brumbauer, et al., 1999])를 포함하지만, 이로 제한되지는 않는다.

부화, 단리 또는 정제된 CBH 변이체 폴리펩티드가 때때로 요구되지만, 일부 실시 형태에서는, 셀로바이오하이드롤라제 활성을 필요로 하는 검정법에서 CBH 변이체 폴리펩티드를 발현하는 숙주 세포가 직접 사용된다. 따라서, 원하는 CBH 변이체 폴리펩티드의 부화, 단리 또는 정제가 셀룰라제 검정법 또는 프로세스에서 사용되는 CBH 변이체 폴리펩티드 조성물을 얻는데 항상 필요한 것은 아니다. 예를 들어, 본 발명의 태양에 따른 셀룰라제 시스템은 본 명세서에 기재된 바와 같이 변이 CBH1을 발현하는 숙주 세포가 셀룰라제 프로세스에서 직접, 즉, CBH1을 관심 검정법에의 그의 사용 전에 숙주 세포로부터 단리하지 않고, 사용될 수 있도록 설계될 수 있다. 그러한 하나의 예에서, CBH1 변이체-발현 효모 세포는 직접 발효 프로세스에 첨가될 수 있어서, 효모 세포가 원하는 산물로 예를 들어 에탄올로 직접 전환하도록 변이 CBH1의 셀룰라제 활성이 비-발효성 기질을 발효성 당으로 전환하는 발효 브로쓰 내로 효모 세포가 직접 변이 CBH1을 발현하게 한다 (예를 들어, 문헌[

., High level secretion of cellobiohydrolases by Saccharomyces cerevisiae Biotechnology for Biofuels 2011, 4:30] 참조).

VI. CBH1 변이체의 유용성

원하는 CBH 변이체-인코딩 핵산, 원하는 CBH 변이체 폴리펩티드 및 이를 포함하는 조성물이 다양한 적용에서 이용되는 것이 이해될 수 있으며, 이들 중 일부가 하기에 기재된다. 본 명세서에 기재된 CBH 변이체의 향상된 특성 또는 특성들이 많은 방면에서 활용될 수 있다. 예를 들어, 열적 스트레스의 조건 하에서 향상된 성능을 갖는 CBH 변이체는 고온 (예를 들어, 모 CBH가 불충분하게 작용할 수 있는 온도)에서 수행되는 검정법에서 셀룰라제 활성을 증가시키는데 사용될 수 있어, 사용자가 사용되는 CBH의 총량을 (모 CBH를 사용하는 것과 비교하여) 줄일 수 있게 한다. CBH 변이체 폴리펩티드의 다른 향상된 특성은 변경된 pH 최적 조건, 계면활성제의 존재 하에서 증가된 안정성 또는 활성, 증가된 기질 특이적 활성, 변경된 기질 절단 패턴, 및/또는 관심 숙주 세포에서의 높은 수준의 발현을 갖는 CBH 변이체를 포함하는 셀룰라제 검정법에 활용될 수 있다.

따라서, 본 명세서에서 기재하는 바와 같이 CBH 변이체 폴리펩티드는 증강된 세정 능력을 나타내고, 유연제로서 작용하고, 그리고/또는 면 패브릭의 감촉을 향상시키는 세제 조성물 (예를 들어, "스톤 워싱" 또는 "바이오폴리싱 (biopolishing)"), 목재 펄프를 당으로 분해하기 위한 조성물 (예를 들어, 바이오-에탄올 생산하기 위함), 및/또는 사료 조성물에 사용된다. CBH 변이체의 단리 및 특성화는 그러한 조성물의 특성 및 활성을 제어하는 능력을 제공한다.

본 명세서에 기재된 바와 같이 원하는 CBH 변이체를 함유하는 셀룰라제 조성물은 에탄올 생산에 사용된다. 이러한 프로세스로부터의 에탄올은 옥탄 증강제로서 또는 가솔린 대신 연료로서 직접 사용될 수 있으며, 이는 연료 공급원으로서의 에탄올이 석유 유래 산물보다 더욱 환경 친화적이기 때문에 더 유리하다. 에탄올의 사용이 대기의 질을 향상시키고 가능하게는 지역적 오존 수준 및 스모그를 감소시킬 것이라는 점은 공지되어 있다. 더욱이, 가솔린 대신 에탄올의 이용은 비-재생가능 에너지 및 석유화학 제품 공급에서의 급작스런 변화의 충격을 완충시키는데 있어서의 전략적 중요점이 될 수 있다.

개별적 당화 및 발효는 바이오매스, 예를 들어, 옥수수 대에 존재하는 셀룰로오스가 글루코스로 전환되고 이어서 효모 균주가 글루코스를 에탄올로 전환하게 하는 프로세스이다. 동시 당화 및 발효는 바이오매스에 존재하는 셀룰로오스가 글루코스로 전환되고 동시에 동일 반응기에서 효모 균주가 글루코스를 에탄올로 전환하게 하는 프로세스이다. 따라서, 본 발명의 CBH 변이체는 바이오매스를 에탄올로 분해하기 위한 이러한 프로세스들 둘 모두에 사용된다. 입수가 용이한 셀룰로오스 공급원으로부터의 에탄올 생산은 안전하고 재생가능한 연료 공급원을 제공한다. 일부 프로세스에서, 그러한 산물이 에탄올 생산과는 별개로 사용되기 때문에 바이오매스는 글루코스로 완전히 분해되지 않는다는 것(예를 들어, 이당류 포함)이 더 알려져 있다.

셀룰로오스계 공급원료는 다양한 형태를 취할 수 있고 농업 폐기물, 그래스 및 목재, 및 기타 저-가치 바이오매스, 예를 들어 지자체의 폐기물 (예를 들어, 재활용 종이, 야드 클리핑 (yard clippings) 등)을 포함할 수 있다. 에탄올은 이러한 셀룰로오스 공급원료 중 임의의 것의 발효로부터 생산될 수 있다. 이와 같이, 매우 다양한 공급원료가 본 발명의 원하는 셀룰라제(들)와 함께 사용될 수 있으며, 사용을 위해 선택되는 것은 전환이 실행되고 있는 지역에 의존적일 수 있다. 예를 들어, 미국 미드웨스턴에서는 밀짚, 옥수수 대 및 찌꺼기와 같은 농업 폐기물이 주를 이루는 반면, 캘리포니아에서는 볏짚이 주를 이룰 수 있다. 그러나, 임의의 입수가능한 셀룰로오스 바이오매스가 임의 지역에서 사용될 수 있다는 것이 이해되어야 한다.

다른 실시 형태에서, 셀룰로오스 공급원료는 전처리될 수 있다. 전처리는 승온, 및 희석 산, 농축 산 또는 희석 알칼리 용액의 첨가에 의한 것일 수 있다. 전처리 용액은 헤미셀룰로오스 성분을 적어도 부분적으로 가수분해하기에 충분한 시간 동안 첨가된 후 중화된다.

바이오매스 전환 이외에도, 본 명세서에 기재된 바와 같은 CBH 변이체 폴리펩티드는 임의의 하나 이상의 세제 성분, 예를 들어, 계면활성제 (음이온성, 비이온성 및 양성 계면활성제 포함), 하이드롤라제, 증강 제제, 표백제, 청분제 및 형광 염료, 케이킹 억제제, 가용화제, 양이온성 계면활성제 등을 포함할 수 있는 세제 조성물에 존재할 수 있다. 모든 이러한 성분들은 세제 분야에 공지되어 있다. CBH 변이체 폴리펩티드-함유 세제 조성물은 액체, 과립, 에멀전, 겔, 페이스트 등을 포함하는 임의의 편리한 형태일 수 있다. 소정의 형태 (예를 들어, 과립)에서, 세제 조성물은 셀룰라제 보호제를 함유하도록 제형화될 수 있다. 보다 완전한 논의를 위해서는, 본 명세서에 참고로서 포함되는 발명의 명칭이 "CBH1 유형 성분에서 결핍된 셀룰라제 조성물을 함유하는 세제 조성물(Detergent compositions containing cellulase compositions deficient in CBH1 type components)"인 미국 특허 제6,162,782호를 참조한다.

소정의 실시 형태에서, CBH 변이체 폴리펩티드는 총 세제 조성물에 대해 0.00005 중량% 내지 5 중량%, 예를 들어 총 세제 조성물에 대해 약 0.0002 중량% 내지 약 2 중량%로 세제 조성물에 존재한다.

감소된 열안정성을 갖는 CBH 변이체는, 예를 들어, 존재할 수 있는 다른 효소가 영향을 받지 않고 남아있을 수 있도록 효소 활성이 더 낮은 온도에서 중화될 필요가 있는 영역에서 사용되는 것이 알려져 있다. 또한, 효소는 셀룰로오스의 제한된 전환, 예를 들어, 결정화도 또는 셀룰로오스 사슬 길이의 정도를 제어하는데 사용될 수 있다. 원하는 정도의 전환에 도달한 후, 당화 온도는 불안정화된 CBH 변이체의 생존 온도보다 높게 승온될 수 있다. CBH 활성은 결정질 셀룰로오스의 가수분해에 필수적이므로, 결정질 셀룰로오스의 전환은 승온에서 중단될 것이다.

위에서 본 바와 같이, 모 CBH 효소에 비해 향상된 특성을 갖는 CBH 변이체 폴리펩티드 (및 이를 인코딩하는 핵산)는 셀로바이오하이드롤라제를 사용하는 다수의 검정법 및 프로세스들 중 임의의 것을 향상시키는데 사용된다.

실시예

청구된 바와 같은 발명의 범주를 어떤 식으로도 제한하려는 것이 아닌 하기의 실시예에서 본 발명을 보다 상세히 설명한다. 첨부된 도면은 본 발명의 명세서 및 설명의 일체인 부분으로서 고려되어야 한다. 인용된 모든 참고문헌들은 본 명세서에 기재된 모두에 대해 본 명세서에서 구체적으로 참고로 포함된다.

실시예 1

I. 검정법

하기의 검정법이 아래에 기재되는 실시예에서 사용되었다. 아래에 제공된 프로토콜로부터의 임의의 변형은 실시예에 나타나 있다. 이러한 실험에서, 분광 광도계를 사용하여 반응 완료 후 형성된 산물의 흡광도를 측정하였다.

A. 성능 지수

성능 지수 (PI)는 변이체의 성능 또는 안정성 (측정된 값)과 표준 효소의 성능 또는 안정성 (이론적 값)을 동일한 폴리펩티드 농도에서 비교한다. 또한, 이론적 값을 표준 효소의 랭뮤어(Langmuir) 방정식의 파라미터를 사용하여 계산할 수 있다. 데이터를 절편을 갖는 랭뮤어 방정식 (y = ((x*a)/(x+b))+c)과 피팅(fitting)하여 야생형 EG4에 대해 용량 반응 곡선을 생성하고, EG4 변이체의 활성을 동일한 플레이트의 야생형 EG4의 계산된 활성으로 나누어 성능 지표를 수득하였다. 1 초과의 성능 지수 (PI) (PI>1)가 표준물 (예를 들어, CBH1 또는 Cel7A로도 알려진 야생형 히포크레아 제코리나 셀로바이오하이드롤라제 1)과 비교할 때, 변이체에 의해 향상된 성능을 나타내는 반면, 1의 PI (PI=1)는 표준물과 동일하게 수행하는 변이체를 식별하고, 1 미만의 PI (PI<1)는 표준물보다 열등하게 수행하는 변이체를 식별한다.

B. 단백질 함량 결정

액퀴티 (Acquity) UPLC BEH200 SEC 1.7μm (4.6×150mm) 컬럼 (워터스(Waters) #186005225)이 장착된 애질런트 (Agilent) 1200 HPLC를 사용하여 풀링(pooling)된 배양 상청액으로부터의 CBH1 변이체 폴리펩티드의 농도를 결정하였다. 샘플 25 마이크로리터를 탈염수 75 μL와 혼합하였다. 4X 희석된 샘플 10 μL를 컬럼 상에 주입하였다. 샘플을 용출하기 위해, 25mM NaH2PO4 pH6.7 + 100mM NaCl을 5.0 분 동안 등용매적으로 (isocratically) 흘려주었다. 정제된 야생형 CBH1 (0-1410ppm)을 사용하여 생성된 보정 곡선으로부터 CBH1 변이체의 단백질 농도를 결정하였다. 성능 지수 (P_i 또는 PI)를 계산하기 위해, 동일 용량에서 변이체에 의해 생산된 (평균) 총 단백질과 야생형에 의해 생산된 (평균) 총 단백질의 비를 평균화하였다.

C. 글루코스 측정을 위한 ABTS 검정법

CBH1 변이체를 발현하는 H. 제코리나 배양 상청액으로부터의 잔류 글루코스를 측정하였다. 추가 연구를 위해 잔류 글루코스를 포함하는 배양 상청액을 풀링으로부터 배제하였다. ABTS 검정법을 사용하여 단량체성 글루코스를 검출하였다. 검정법 완충액은 50 mM 소듐 아세테이트 완충액 pH 5.0 중에 2.74 g/L 2,2'-아지노-비스(3-에틸벤조-티아졸린-6-설폰산) 다이-암모늄 염 (ABTS, 시그마 (Sigma), 카탈로그 번호 A1888), 0.1 U/mL 서양고추냉이 퍼옥시다제 유형 VI-A (시그마, 카탈로그 번호 P8375), 및 1 Unit/mL 식품 등급 글루코스 옥시다제 (제넨코르 (GENENCOR)^® 5989 U/mL)를 함유하였다. (희석된) BGL1 활성 검정법 믹스 10 마이크로리터를 100 μL ABTS 검정법 용액에 첨가하였다. 활성 검정법 믹스를 첨가한 후, 반응을 OD₄₂₀에서 5분 동안 22℃의 주위 온도에서 속도론적으로 수행하였다. 각 검정법 조건에 대한 글루코스의 적절한 보정 곡선을 항상 포함시켰다.

D. 인산 팽윤 셀룰로오스 ( PASC ) 가수분해 검정법

D. 1. 인산 팽윤 셀룰로오스 ( PASC ) 가수분해 검정법

공개된 방법 (문헌[Walseth, Tappi 35:228, 1971]; 및 문헌[Wood, Biochem J, 121:353-362, 1971])에 따라 아비셀 (Avicel)로부터 인산 팽윤 셀룰로오스 (PASC)를 제조하였다. 이 물질을 완충액 및 물로 희석하여 0.5% w/v 혼합물을 수득하여, pH 5.0에서 소듐 아세테이트의 최종 농도가 50 mM이 되도록 하였다. 96-웰 미세적정플레이트 (코스타 플랫 바텀 (Costar Flat Bottom) PS 3641)에서 15 μL의 배양 상청액을 85 μL의 반응 믹스 (0.15% PASC; cbh1, cbh2, eg1, eg2, eg3, 및 bgl1에 대해 결실된 H. 제코리나 균주의 0.42 mg/ml 배양 상청액; 29.4 mM NaOAc (pH5.0))에 첨가하여 CBH1 활성을 결정하였다. 미세적정 플레이트를 밀봉하고 900 rpm에서 3 시간 동안의 연속 진탕 하에서 50℃에서 온도자동조절 인큐베이터에서 인큐베이팅하고, 이어서 얼음 상에서의 5 분 냉각을 수행하였다. 100 μL의 ?치 (quench) 완충액 (100 mM 글리신 완충액 (pH 10); 5 mg/ml 칼코플루오르 (calcofluor) (시그마))을 첨가하여 가수분해 반응을 중단시켰다. 공개된 방법 (문헌[Du et al, Appl Biochem Biotechnol 161(1-8): 313-7])에 따라 활성을 결정하였다. 야생형 CBH1 효소에 대해 용량 반응 곡선을 생성하였다. 검정법은 4번 반복 수행하였다. 성능 지수 (P_i 또는 PI)를 계산하기 위해, 동일 용량에서 변이체에 의해 생산된 (평균) 총 당과 야생형에 의해 생산된 (평균) 총 당의 비를 평균화하였다.

D.2. 인산 팽윤 셀룰로오스 (PASC) 가수분해 검정법

공개된 방법 (문헌[Walseth, Tappi 35:228, 1971]; 및 문헌[Wood, Biochem J, 121:353-362, 1971])에 따라 아비셀로부터 인산 팽윤 셀룰로오스 (PASC)를 제조하였다. 이 물질을 완충액 및 물로 희석하여 0.5% w/v 혼합물을 수득하여, pH 5.0에서 소듐 아세테이트의 최종 농도가 50 mM이 되도록 하였다. 96-웰 미세적정플레이트 (코스타 플랫 바텀 PS 3641)에서 5 μL, 10 μL, 20 μL 및 40 μL의 400 ppm 음이온 정제된 (I.1 참조) CBH1을 140 μL의 반응 믹스 (0.36% PASC; 29.4 mM NaOAc (pH 5.0); 143 mM NaCl)에 첨가하여 CBH1 활성을 결정하였다. 미세적정 플레이트를 밀봉하고 900 rpm에서 2 시간 동안의 연속 진탕 하에서 50℃에서 온도자동조절 인큐베이터에서 인큐베이팅하고, 이어서 얼음 상에서의 5 분 냉각을 수행하였다. 100 μL의 ?치 완충액 (100 mM 글리신 완충액 (pH 10))을 첨가하여 가수분해 반응을 중단시켰다. 하기 변형을 갖고서 문헌[Lever, 1972, Anal Biochem, 47:273-279]에 따라 PAHBAH 검정법으로 가수분해 반응 산물을 분석하였다: PAHBAH 검정법: 150 μL의 PAHBAH 환원 당 시약의 분취액 (시약 100 mL에 대해: 1.5 g p-하이드록시벤조산 하이드라지드 (시그마 # H9882), 2% NaOH에 용해된 5 g 포타슘 소듐 타르트레이트 테트라하이드레이트)을 빈 미세적정 플레이트의 모든 웰에 첨가하였다. 10 마이크로리터의 가수분해 반응 상청액을 PABAH 반응 플레이트에 첨가하였다. 모든 플레이트를 밀봉하고 900 rpm의 연속 진탕 하에서 69℃에서 인큐베이팅하였다. 1시간 후에 플레이트를 5분 동안 얼음 상에 두고 실온에서 720 x g로 5분 동안 원심분리하였다. 분광 광도계에서 410 nm에서 플레이트의 흡광도 (종말점)를 측정하였다. 셀로바이오스 표준물을 대조군 및 적절한 블랭크 샘플로서 포함시켰다. 야생형 CBH1 효소에 대해 용량 반응 곡선을 생성하였다. 성능 지수 (PI)를 계산하기 위해, 동일 용량에서 변이 CBH1 에 의해 생산된 (평균) 총 당을 야생형 CBH1 (예를 들어, 기준 효소)에 의해 생산된 (평균) 총 당으로 나누었다.

D.3. EGII 존재 하에서 인산 팽윤 셀룰로오스 (PASC) 가수분해 검정법

하기 변형을 갖고서 D.2의 검정법 (즉, EGII 없음)에 대해 설명된 바와 같이 2.5 ppm T. 레에세이 EGII의 존재 하에서의 PASC 검정법을 수행하였다: 400 ppm의 음이온 정제된 CBH1 효소를 검정법에 첨가하기 전에 1.6 배 희석하였으며, 반응 첨가는 37.5 ppm EGII 10 μL를 반응 믹스에 첨가하여 총 반응 부피가 150 μL가 되게 한 것을 제외하고는 D.2에서와 동일하였다. PI를 D.2에 기재된 바와 같이 계산하였다.

E. 전 가수분해물 산-전처리 옥수수 대 (whPCS) 검정법

옥수수 대를 기재된 바와 같이 2% w/w H₂SO₄로 전처리하였다 (문헌[Schell et al., J Appl Biochem Biotechnol, 105:69-86, 2003]). 부피 3, 5, 10 및 25 μL의 상청액 (50 mM NaOAc로 2배 희석됨)을 whPCS 반응 혼합물 (6.5% (w/v) whPCS; cbh1 및 cbh2가 결실된 H. 제코리나의 상청액 1.43 mg/ml (WO 2005/001036호에 기재된 바와 같음); 0.22 mg/ml Xyn3; 0.15 mg/ml Fv51A; 0.18 mg/ml Fv3A; 0.15 mg/ml Fv43D; 0.22 mg/ml BGL1, 최종 총 부피 160 μL)에 첨가하였다. (효소 Xyn3, Fv51A, Fv3A, Fv43D, 및 Bgl1을 사용하는 적합한 방법의 예는 PCT 출원 공개 WO2011/0038019호에 기재되어 있다). 미세적정 플레이트를 밀봉하고 900 rpm에서 3 시간 동안의 연속 진탕 하에서 50℃에서 온도자동조절 인큐베이터에서 인큐베이팅하고, 이어서 얼음 상에서의 5 분 냉각을 수행하였다. 100 μL의 ?치 완충액 (100 mM 글리신 완충액, pH 10)을 첨가하여 가수분해 반응을 중단시켰다. 플레이트를 실온에서 3,000 rpm으로 5분 동안 원심분리하고, 샘플 10 μL를 물 190 μL에 첨가하여 샘플을 20배 희석하였다. 반응에서의 유리 글루코스를 검정법 C에 기재된 바와 같이 ABTS 검정법을 사용하여 측정하였다.

F. 희석 암모니아 옥수수 대 (daCS) 검정법

희석 암모니아 전처리된 옥수수 대를 희석 암모니아 옥수수 속대에 대해 기재된 바와 같이 기본적으로 제조하였다 (WO2006/110901호). 전처리된 옥수수 대를 50 mM 소듐 아세테이트 (pH 5.0) 중의 10% 셀룰로오스 현탁액으로서 사용하였다. 부피 3, 5, 10 및 20 μL 상청액을 daCS 반응 혼합물 (5.8% (w/v) 셀룰로오스; 0.052 mg/ml H. 제코리나 CBH2; 0.13 mg/ml H. 제코리나 Xyn3; 0.011mg/ml Fv51A; 0.006 mg/ml Fv3A; 0.011 mg/ml Fv43D; 0.08 mg/ml Fv3C; 0.04 mg/ml EG4; 0.05 mg/ml H. 제코리나 Δ(cbh1, cbh2), 최종 총 부피 120 μL)에 첨가하였다. (상기한 바와 같이, 효소 Xyn3, Fv51A, Fv3A, Fv43D, 및 Fv3C를 사용하는 적합한 방법의 예는 PCT 출원 공개 WO2011/0038019호에 기재되어 있다). 미세적정 플레이트를 밀봉하고 900 rpm에서 24 시간 동안의 연속 진탕 하에서 50℃에서 온도자동조절 인큐베이터에서 인큐베이팅하고, 이어서 얼음 상에서의 5 분 냉각을 수행하였다. 100 μL의 ?치 완충액 (100 mM 글리신 완충액 (pH 10))을 첨가하여 가수분해 반응을 중단시켰다. 플레이트를 실온에서 3,000 rpm으로 5분 동안 원심분리하고, 샘플 10 μL를 물 190 μL에 첨가하여 샘플을 20배 희석하였다. 반응에서의 유리 글루코스를 검정법 C에 기재된 바와 같이 ABTS 검정법을 사용하여 측정하였다.

G. 단백질 정제

마이크로-스케일 정제를 위해, 200 μL의 90% 에탄올을 멀티스크린 딥-웰 솔비너트 소수성 PTFE 필터 플레이트 (Multiscreen deep-well solvinert hydrophobic PTFE filter plate (밀리포어 (MiliPore) #MDRPN0410))로 옮기고, 이어서 50xg에서 1분 동안 원심분리하였다. 400 μL의 DEAE 세파로스 패스트-플로우 레진 (지이-헬스케어 (GE-Healthcare) #17-0709-01)를 필터 플레이트로 옮기고, 이어서 50xg에서 1분 동안 원심분리하였다. 레진을 400 μL 밀리큐(MiliQ) 워터로 3번 세척하고, 400μL의 25mM NaH₂PO₄ (pH6.7)를 사용하여 3번 평형화하였다. 450 μL의 배양 상청액을 25 mM NaH₂PO₄ (pH6.7)를 사용하여 6X 희석하여 2700μL로 하였다. 희석된 샘플을 레진 상에 로딩하였다. 결합하지 않은 단백질을 모두 용출하기 위해, 레진을 25mM NaH₂PO₄ (pH6.7)로 3번 세척하였다. CBH1 변이체를 400μL의 25mM NaAc pH5.0 + 500mM NaCl를 사용하여 용출하였다.

대용량-스케일 정제를 위해, 비바스핀 (Vivaspin)20 10kDMWO 필터 (사르토리우스 (Sartorius) #VS2001)를 사용하여 20 mL의 CBH1 쉐이크 플라스크 샘플을 (3000xg에서 20분 동안 원심분리된) 2.5 mL로 농축하였다. 농축된 샘플을 50 mM NaAc pH5.0을 사용하여 10 mL로 희석하였다. 1 mL 하이트랩 (Hitrap) DEAE FF 컬럼 (지이-헬스케어 #17-5055-01)을 25 mM NaAc pH5.0을 사용하여 평형화하였다. 희석된 샘플을 1.0 mL/min으로 컬럼에 로딩하였다. 샘플 로딩을 완료한 후, 컬럼을 12 컬럼 부피 (CV)의 25mM NaAc pH5.0로 1 mL/min으로 세척하였다. CBH1을 25mM NaAc pH5.0 + 1M NaCl의 0% 내지 50%의 30 CV 구배를 사용하여 컬럼으로부터 용출하였다. 구배 동안, 5 mL 분획을 수집하였다. 분획을 SDS-PAGE로 분석하였다. 가장 많은 CBH1을 함유하는 3개의 분획들을 풀링하였다.

H. 단백질 융해 온도 (Tm)의 측정

CBH1 변이체의 안정성을 형광 염료-결합 열 전이 검정법 (문헌[Lavinder et al, High-throughput thermal scanning: A general, rapid dye-binding thermal shift screen for protein engineering (2009) JACS, 131: 3794-3795])에 의해 결정하였다. 사이프로오렌지 (SyproOrange) (몰레큘라 프로브스 (Molecular Probes))를 MQ 워터로 1:1000으로 희석하였다. 웰에서, 8 μl의 희석된 염료를 50 mM NaOAc (pH5) 중의 25 μl 100 mg/l 효소와 혼합하였다. 밀폐된 플레이트를 ABI 7900HT rtPCR 시스템 (어플라이드 바이오시스템즈 (Applied Biosystems))에서 대략적인 1℃/min의 속도로 25℃ 내지 95℃의 온도 구배를 겪게 하였다. 형광 신호의 1차 도함수의 중간-피크 (mid-peak) 온도를 샘플 내 CBH1 효소의 융해 온도로 취하였다.

실시예 2

히포크레아 제코리나 CBH1 변이체의 생성

본 실시예에는 야생형 히포크레아 제코리나 셀로바이오하이드롤라제 1 (CBH1) 및 그의 변이체를 발현하는 트리코더마 레에세이 균주의 작제가 기재되어 있다. CBH1 (서열 번호 3)을 인코딩하는 서열 번호 1로서 아래 열거된 cDNA 단편 (앞서 미국 특허 제7,452,707호에 기재됨)은 CBH1 및 그의 변이체를 발현하는 트리코더마 레에세이 균주의 작제를 위한 주형 DNA로서 역할을 하였다. (도 3에 나타난 바와 같이) cDNA를 발현 플라스미드 pTTT-pyrG에 삽입하여 pTTT-pyrG-cbh1 를 생성하였다.

서열 번호 1은 CBH1 신호 펩티드를 인코딩하는 서열 (밑줄)에 인접한 H. 제코리나 cbh1의 성숙 형태를 인코딩하는 야생형 뉴클레오티드 서열을 포함한다:

서열 번호 2는 CBH1 신호 펩티드 (밑줄)를 함유하는 H. 제코리나 CBH1의 전체 길이 폴리펩티드의 서열을 나타낸다:

서열 번호 3은 H. 제코리나 CBH1의 성숙 폴리펩티드의 서열을 나타낸다:

히포크레아 제코리나 CBH1 효소 인코딩 서열 (서열 번호 1)을 포함하는 pTTTpyrG-cbh1 플라스미드를 주형으로 사용하여 CBH1 변이체를 생성하였다.

CBH1 변이체 폴리펩티드의 생산

CBH1 변이체 효소를 인코딩하는 유전자를 발현하는 정제된 pTTTpyrG-cbh1 플라스미드 (P _cbh1 , Amp^R, 아세트아미다제; 도 3에 나타낸 플라스미드 개략도 참조)를 RL-P37 (문헌[Sheir-Neiss, G et al. Appl. Microbiol. Biotechnol. 1984, 20:46-53])로부터 유도되었고 PCT 출원 공개 WO2010/141779호에 추가로 기재된 6개의 유전자가 결실된 트리코더마 레에세이 균주 (Δegl1, Δegl2, Δegl3, Δcbh1, Δcbh2 , Δbgl1)에서 발현시켰다. 4개의 유전자가 결실된 T. 레에세이 균주 (Δegl1, Δegl2, Δcbh1 , Δcbh2)를 만들기 위해, PCT 출원 공개 WO2005/001036호에 기재된 방법에 따라 유전자 결실을 생성하였고, 상기 T. 레에세이 균주에서 egl3 및 bgl1을 유사하게 추가로 결실시켜, 6개의 유전자가 결실된 균주를 생성하였다. 앞서 PCT 출원 공개 WO2009/048488호에 기재된 바와 같이 6번 결실된 T. 레에세이의 원형질체를 개별의 pTTT-pyrG-cbh1 작제물로 형질전환하고 (형질전환당 단일 CBH1 변이체), 아세트아미드를 함유하는 선별 한천에서 28℃에서 7일 동안 성장시켰다. T. 레에세이의 형질전환체를 아세트아미드를 함유하는 선별 한천에서 소생시키고 7일 동안 28℃에서 인큐베이팅하였다. 각 웰을 300 μL 식염수 + 0.015% 트윈 (Tween)-80으로 긁어서 포자를 수거하였다. CBH1 변이체 생산을 위해, 10 μL 또는 25 μL 부피의 포자 현탁액을 96-웰 또는 24-웰 플레이트 중의 200 μL의 1 mL 아헨(Aachen) 배지에 각각 첨가하였다. 플레이트를 엔자이스크린 (Enzyscreen) 뚜껑으로 덮고 7일 동안 28℃ 및 80% 습도에서 50 mm의 쓰로우 인포스 (throw Infors) 인큐베이터에서 발효시켰다. 브로쓰를 96-웰 필터플레이트로 옮기고 진공 하에서 여과하였다. 실시예 C에 기재된 바와 같이 ABTS 검정법을 사용하여 잔류 글루코스를 측정하였다. 남은 포자 현탁액을 -80℃에서 50% 글리세롤 중에 저장하였다.

실시예 3

Tm에 대해 유의한 이익을 갖는 CBH1 변이체

다양하게 치환된 변이체를 포함하는 CBH1 변이체에 대한 Tm을 앞서 H에 기재된 바와 같이 결정하고 각각의 특정 치환이 Tm에 어떻게 영향을 미쳤는지를 모델링하기 위해 분석하였다. Tm에 유의한 변화 (0.001 또는 99.9%까지의 유의성)를 나타내는 치환이 도 4의 그래프 및 표 1에서 보여진다. 도 4에서, Tm의 변화는 모델링된 각각의 특정 변이체가 그의 양수 또는 음수일 수 있는 Tm의 변화 값에 도시된 상태로 X축 상에 있다. "절편" 값은 치환이 없는 분자 (즉, 야생형 CBH1)에 대한 Tm의 변화의 모델 예측을 나타낸다. (모델 예측은 항상 0이 아님을 유의하라).

도 4 및 표 1 (도 4에서 각각의 CBH1 변이체에 대한 모델링된 Tm의 변화 값을 나타내고; 괄호 안의 숫자는 음수임)에 나타난 바와 같이, 하기 변이체들은 Tm을 유의하게 증가시켰다 (즉, 유의하게 0 초과): T41I, T255P, T255D, T246P, N200R, T356L, 및 T246V.

도 4 및 표 1에 나타난 바와 같이, 하기 변이체들은 Tm을 유의하게 감소시켰다 (즉, 유의하게 0 미만): V403R, S248V, Y370F, K346T, N324K, S398F, E334A, P258L, S248K, F338E, K346P, E334G, 및 R394V.

소정의 실시 형태에서, 유의하게 증가된 Tm을 갖는 CBH1 변이체가, 예를 들어, 폴리펩티드의 고온 비활성화에 대한 저항이 요구되는 프로세스에서의 사용을 위해 요구되는 한편, 다른 실시 형태에서는, 유의하게 감소된 Tm을 갖는 CBH1 변이체가, 예를 들어, 고온 CBH1 비활성화 단계가 요구되는 프로세스에서의 사용을 위해 요구되는 것이 여기에 알려져 있다. 이와 같이, 도 4 및 표 1에 나타난 CBH1 변이체의 바람직함은 변이체의 의도된 용도에 좌우된다.

[표 1]

실시예 4

whPCS PI 검정법에서 유의한 이익을 갖는 CBH1 변이체

다양하게 치환된 변이체를 포함하는 CBH1 변이체에 대한 성능 지수 (PI)를 앞서 E에 기재된 바와 같이 결정하고 각각의 특정 치환이 PI에 어떻게 유의하게 영향을 미쳤는지를 모델링하기 위해 분석하였다 (0.10 또는 90%까지의 유의성). PI의 유의한 변화를 나타내는 치환이 도 5의 그래프 및 표 2에서 보여진다. 도 5에서, PI의 변화 (또는 ΔPI 값)는 PI의 유의한 변화를 갖는 각각의 특정 변이체가 그의 대략적인 ΔPI 값에 도시된 상태로 ("whPCS PI에 대한 이익"이라고 표시된) X축 상에 있다. "절편" 값은 치환이 없는 분자 (즉, 야생형 CBH1)에 대한 PI의 변화의 모델 예측을 나타낸다. (모델 예측은 항상 0이 아님을 유의하라).

도 5 및 표 2 (도 5에서 각각의 CBH1 변이체에 대한 ΔPI 값을 나타내고; 괄호 안의 숫자는 음수임)에 나타난 바와 같이, 하기 변이체들은 유의하게 증가된 PI를 나타내었다 (즉, 유의하게 0 초과): S92T, F418M, T246S, 및 T255V.

도 5 및 표 2에 나타난 바와 같이, 하기 변이체들은 유의하게 감소된 PI를 나타내었다 (즉, 유의하게 0 미만): Y247D*, N49P*, T246P*, A106S*, T246V*, Y492A*, Y370F*, Y492N*, T255D*, Y247M*, E334A*, N49D*, S248K, R394V, N200G, N49A, N49V, T285K, N200R, P258L, E295K, P227A, P227L, 및 R394Y. *로 표시된 변이체는 유의하게 0 미만이지만 절편 (즉, 야생형)에 대한 모델링된 ΔPI보다는 큰 모델링된 ΔPI를 가졌다.

[표 2]

실시예 5

daCS PI 검정법에서 유의한 이익을 갖는 CBH1 변이체

성능 지수 (PI)를 앞서 F에 기재된 바와 같이 daCS 검정법에서 개별적으로 치환된 CBH1 변이체에 대해 결정하였고, 야생형 CBH1 효소와 비교하여 PI가 유의하게 감소되거나 유의하게 증가되었는지를 판정하기 위해 분석하였다 (0.25 또는 75%까지의 유의성). PI의 유의한 변화를 나타내는 치환이 도 6의 그래프 및 표 3에서 보여진다. 도 6에서, PI의 변화 (또는 ΔPI 값)는 PI의 유의한 변화를 갖는 각각의 특정 변이체가 그의 대략적인 ΔPI 값에 도시된 상태로 ("daCS PI에 대한 이익"이라고 표시된) X축 상에 있다. "절편" 값은 치환이 없는 분자 (즉, 야생형 CBH1)에 대한 PI의 변화의 모델 예측을 나타낸다. (모델 예측은 항상 0이 아님을 유의하라).

도 6 및 표 3 (도 6에서 각각의 CBH1 변이체에 대한 ΔPI 값을 나타내고; 괄호 안의 숫자는 음수임)에 나타난 바와 같이, 하기 변이체들은 유의하게 증가된 PI를 나타내었다 (즉, 유의하게 0 초과): D241N, G234D, F418M, T246S, T255R, T255P, T255I, T255V, Y247D, T255K, P194V, G340T, Y492A, S398F, E334A, Y370F, N49A, 및 S248K.

도 6 및 표 3에 나타난 바와 같이, 하기 변이체들은 유의하게 감소된 PI를 나타내었다 (즉, 유의하게 0 미만): P258L, N200R, N49V, 및 F338E.

[표 3]

실시예 6

PASC PI 검정법에서 유의한 이익을 갖는 CBH1 변이체

성능 지수 (PI)를 앞서 D (D1 내지 D3)에 기재된 바와 같이 PASC 검정법들 중 하나 이상에서 개별적으로 치환된 CBH1 변이체에 대해 결정하였고, 야생형 CBH1 효소와 비교하여 PI가 유의하게 감소되거나 유의하게 증가되었는지를 판정하기 위해 분석하였다 (0.1 또는 90%까지의 유의성). PI의 유의한 변화를 나타내는 치환이 도 7의 그래프 및 표 4에서 보여진다. 도 7에서, PI의 변화 (또는 ΔPI 값)는 PI의 유의한 변화를 갖는 각각의 특정 변이체가 그의 대략적인 ΔPI 값에 도시된 상태로 ("PASC PI에 대한 이익"이라고 표시된) X축 상에 있다. "절편" 값은 치환이 없는 분자 (즉, 야생형 CBH1)에 대한 PI의 변화의 모델 예측을 나타낸다. (이 모델에서, 절편은 0과 유의하게 다르지 않았으므로 그래프 상에 나타나지 않는다.)

도 7 및 표 4 (도 7에서 각각의 CBH1 변이체에 대한 ΔPI 값을 나타내고; 괄호 안의 숫자는 음수임)에 나타난 바와 같이, 하기 변이체들은 유의하게 증가된 PI를 나타내었다 (즉, 유의하게 0 초과): T246V, N200G, Y247D, Y247M 및 N49P.

도 7 및 표 4에 나타난 바와 같이, 하기 변이체들은 유의하게 감소된 PI를 나타내었다 (즉, 유의하게 0 미만): E334A, T255I, T285K, Y492A, N49D, E295K, Y492N, S196T, Y492V, R394Y, 및 R394V.

[표 4]

실시예 7

대표적 데이터의 요약

아래 표 5는 whPCS, daCS, PASC 및 Tm 검정법들 중 적어도 하나의 검정법에서 유익한 효과를 갖는 각각의 CBH1 변이체의 성능을 나타낸다. 숫자의 "+" 또는 "-" 부호는 지정된 검정법에서 CBH1 효소의 성능에 대한 CBH1 변이의 효과의 (위 표 1 내지 4에 나타낸 값들을 기준으로 한) 상대적인 크기를 나타낸다. 또한 변이체는 이의 성능 특징에 따라 4개의 그룹으로 그룹화된다. 그룹 1: whPCS 및 daCS에 대해 이익임; 그룹 2: daCS에 대해 이익임; 그룹 3: PASC에 대해 이익임; 그리고 그룹 4: Tm에 대해 이익임. 그룹 5의 변이체는 적어도 하나의 검정법에서 성능 이익을 보이고 다른 CBH1 변이체와의 조합으로 사용되는 것이다. (본 명세서의 다른 부분에 기재된 바와 같이) 표 5에서 변이체의 임의의 조합이 고려된다는 것이 알려져 있다.

[표 5]

상기한 바와 같이, 표 5의 변이체들의 임의의 조합은 본 발명의 태양에서 사용된다.

본 명세서에 기재된 실시예 및 실시 형태는 단지 예시적인 목적을 위한 것이며, 그를 고려한 다양한 변형 또는 변경이 당업자에게 생각나게 될 것이며 본 출원의 사상 및 범위 그리고 첨부된 특허청구범위의 범주 내에 포함되는 것으로 이해된다. 본 명세서에서 언급된 모든 간행물, 특허 및 특허 출원은 모든 목적을 위해 전체적으로 본 명세서에 참고로 포함된다.

참고문헌

Altschul, S. F., et al., J. Mol. Biol. 215:403-410, 1990.

Altschul, S. F., et al., Nucleic Acids Res. 25:3389-3402, 1997.

Aro, N., et al., J. Biol. Chem., 10.1074/ M003624200, April 13, 2001.

Aubert, et al., Ed., p11 et seq., Academic Press, 1988.

Ausubel G. M., et al. Current Protocols in Molecular Biology, John Wiley & Sons, New York, N.Y., 1993.

Baldwin, D., et al., Curr. Opin. Plant Biol. 2(2):96-103, 1999.

Baulcombe, D., Arch. Virol. Suppl. 15:189-201, 1999.

Bhikhabhai, R. et al., J. Appl. Biochem. 6:336, 1984.

Boer and Koivula, 2003, Eur. J. Biochem. 270: 841-848

Brumbauer, A. et al., Bioseparation 7:287-295, 1999.

Carter et al., Nucl. Acids Res. 13:4331, 1986.

Chen et al., Biochem. Biophys. Acta. 1121:54-60, 1992.

Coligan, J. E. et al., eds., Current Protocols in Immunology, 1991.

Collen, A., et al., Journal of Chromatography A 910:275-284, 2001.

Coughlan, et al., Biochemistry and Genetics of Cellulose Degradation.

Cummings and Fowler, Curr. Genet. 29:227-233, 1996.

Dayhoff et al. in Atlas of Protein Sequence and Structure, Volume 5, Supplement 3, Chapter 22, pp. 345-352, 1978.

Deutscher, M.P., Methods Enzymol. 182:779-80, 1990.

Doolittle, R. F., Of URFs and ORFs, University Science Books, CA, 1986.

Ellouz, S. et al., J. Chromatography 396:307, 1987.

Fields and Song, Nature 340:245-246, 1989.

Filho, et al. Can. J. Microbiol. 42:1-5, 1996.

Fliess, A., et al., Eur. J. Appl. Microbiol. Biotechnol. 17:314, 1983.

Freer, et al. J. Biol. Chem. 268:9337-9342, 1993.

Freshney, R. I., ed., Animal Cell Culture, 1987.

Goyal, A. et al. Bioresource Technol. 36:37, 1991.

Halldorsdottir, S et al., Appl Microbiol Biotechnol. 49(3):277-84, 1998.

Hu et al., Mol Cell Biol. 11:5792-9, 1991.

Hemmpel, W.H. ITB Dyeing/Printing/Finishing 3:5-14, 1991.

Herr et al., Appl. Microbiol. Biotechnol. 5:29-36, 1978.

Jakobovits, A, et al., Ann N Y Acad Sci 764:525-35, 1995.

Jakobovits, A, Curr Opin Biotechnol 6(5):561-6, 1995.

Jones et al., Nature 321:522-525, 1986.

Kawaguchi, T et al., Gene 173(2):287-8, 1996.

Knowles, J. et al., TIBTECH 5, 255-261, 1987.

Kohler and Milstein, Nature 256:495, 1975.

Krishna, S. et al., Bioresource Tech. 77:193-196, 2001.

Kumar, A., et al., Textile Chemist and Colorist 29:37-42, 1997.

Lehtio, J. et al., FEMS Microbiology Letters 195:197-204, 2001.

Li and Ljungdahl Appl. Environ. Microbiol. 62:209-213, 1996.

Linder, M. and Teeri, T.T., Biotechnol. 57:15-28, 1997.

Medve, J. et al., J. Chromatography A 808:153, 1998.

Ohmiya et al., Biotechnol. Gen. Engineer. Rev. 14:365-414, 1997.

Ooi et al., Nucleic Acids Res. 18(19):5884, 1990.

Ortega et al., International Biodeterioration and Biodegradation 47:7-14, 2001.

Penttila et al., Yeast 3:175-185, 1987.

Penttila et al., Gene 63: 103-112, 1988.

Pere, J., et al., In Proc. Tappi Pulping Conf., Nashville, TN, 27-31, pp. 693-696, 1996.

Riechmann et al., Nature 332:323-327, 1988.

Rothstein et al., Gene 55:353-356, 1987.

Saarilahti et al., Gene 90:9-14, 1990.

Sakamoto et al., Curr. Genet. 27:435-439, 1995.

Saloheimo M, et al., Gene 63:11-22, 1988.

Sambrook et al., Molecular Cloning: A Laboratory Manual (Second Edition), Cold Spring Harbor Press, Plainview, N.Y., 1989.

Schulein, Methods Enzymol., 160, 25, pages 234 et seq, 1988.

Scopes, Methods Enzymol. 90 Pt E:479-90, 1982.

Spilliaert R, et al., Eur J Biochem. 224(3):923-30, 1994.

Stahlberg, J. et al., Bio/Technol. 9:286-290, 1991.

Stahlberg et al., 1996, J. Mol. Biol. 264: 337-349

Strathern et al., eds. (1981) The Molecular Biology of the Yeast Saccharomyces.

Suurnakki, A. et al., Cellulose 7:189-209, 2000.

Te'o, J. et al., FEMS Microbiology Letters 190:13-19, 2000.

Tilbeurgh, H. et al., FEBS Lett. 16:215, 1984.

Timberlake et al., Cell 1:29-37, 1981.

Tomaz, C. and Queiroz, J., J. Chromatography A 865:123-128, 1999.

Tomme, P. et al., Eur. J. Biochem. 170:575-581, 1988.

Tormo, J. et al., EMBO J. 15:5739-5751, 1996.

Tyndall, R.M., Textile Chemist and Colorist 24:23-26, 1992.

Van Rensburg et al., Yeast 14:67-76, 1998.

Van Tilbeurgh, H. et al., FEBS Lett. 204:223-227, 1986.

Verhoeyen et al., Science 239:1534-1536, 1988.

Warrington, et al., Genomics 13:803-808, 1992.

Wells et al., Gene 34:315, 1985.

Wells et al., Philos. Trans. R. Soc. London SerA 317:415, 1986.

Wood, Biochem. Soc. Trans., 13, pp. 407-410, 1985.

Wood et al., methods in enzymology, 160, 25, p. 87 et seq., Academic Press, New York, 1988.

Zoller et al., Nucl. Acids Res. 10:6487, 1987.

SEQUENCE LISTING <110> DANISCO US INC. BOTT, Richard R. FOUKARAKI, Maria HOMMES, Ronaldus KAPER, Thijs KELEMEN, Bradley R. KRALJ, Slavko NIKOLAEV, Igor SANDGREN, Mats VAN LIESHOUT, Johannes VAN STIGT THANS, Sander <120> VARIANTS OF CELLOBIOHYDROLASES <130> 40390WO <140> PCT/US13/74020 <141> 2013-12-10 <150> US 61/736,344 <151> 2012-12-12 <160> 16 <170> PatentIn version 3.5 <210> 1 <211> 1542 <212> DNA <213> Hypocrea jecorina <220> <221> misc_feature <223> includes the wild type nucleotide sequence encoding the mature form of H. jecorina cbh1 adjacent to a sequence encoding the CBH1 signal peptide <400> 1 atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60 tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120 acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180 acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240 aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300 gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360 gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420 ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480 ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540 ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600 aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660 ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720 gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780 ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840 aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900 accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960 tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020 aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080 tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140 atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200 aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260 cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320 ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380 ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440 tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500 acaacttgcc aggtcctgaa cccttactac tctcagtgcc tg 1542 <210> 2 <211> 514 <212> PRT <213> Hypocrea jecorina <220> <221> misc_feature <223> sequence of the H. jecorina CBH1 full length polypeptide containing the CBH1 signal peptide <400> 2 Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg 1 5 10 15 Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr 20 25 30 Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser 35 40 45 Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser 50 55 60 Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp 65 70 75 80 Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala 85 90 95 Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe 100 105 110 Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met 115 120 125 Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe 130 135 140 Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala 145 150 155 160 Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro 165 170 175 Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln 180 185 190 Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly 195 200 205 Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly 210 215 220 Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu 225 230 235 240 Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu 245 250 255 Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr 260 265 270 Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr 275 280 285 Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys 290 295 300 Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr 305 310 315 320 Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly 325 330 335 Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu 340 345 350 Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln 355 360 365 Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp 370 375 380 Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr 385 390 395 400 Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr 405 410 415 Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys 420 425 430 Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn 435 440 445 Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr 450 455 460 Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln 465 470 475 480 Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val 485 490 495 Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln 500 505 510 Cys Leu <210> 3 <211> 497 <212> PRT <213> Hypocrea jecorina <220> <221> misc_feature <223> sequence of the H. jecorina CBH1 mature enzyme <400> 3 Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr Trp 1 5 10 15 Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser Thr 35 40 45 Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp Asn 50 55 60 Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala Ser 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe Val 85 90 95 Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met Ala 100 105 110 Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe Ser 115 120 125 Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Thr 145 150 155 160 Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly Trp 180 185 190 Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly Ser 195 200 205 Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala 210 215 220 Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu Gly 225 230 235 240 Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr Cys 245 250 255 Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser 260 265 270 Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys Leu 275 280 285 Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr Tyr 290 295 300 Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly Ser 305 310 315 320 Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu Ala 325 330 335 Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln Phe 340 345 350 Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp Asp 355 360 365 Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn 370 375 380 Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr Ser 385 390 395 400 Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys Val 405 410 415 Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn Pro 420 425 430 Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr Thr 435 440 445 Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln Ser 450 455 460 His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys 465 470 475 480 Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys 485 490 495 Leu <210> 4 <211> 497 <212> PRT <213> Hypocrea orientalis <400> 4 Gln Ser Ala Cys Thr Leu Gln Thr Glu Thr His Pro Ser Leu Thr Trp 1 5 10 15 Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser Thr 35 40 45 Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp Asn 50 55 60 Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala Ser 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Ala Asp Ser Leu Ser Ile Gly Phe Val 85 90 95 Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met Ala 100 105 110 Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe Ser 115 120 125 Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Thr 145 150 155 160 Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly Trp 180 185 190 Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly Ser 195 200 205 Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala 210 215 220 Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Asp Gly 225 230 235 240 Asp Gly Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Gly Gly Thr Cys 245 250 255 Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser 260 265 270 Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys Leu 275 280 285 Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr Tyr 290 295 300 Val Gln Asn Gly Val Thr Tyr Gln Gln Pro Asn Ala Glu Leu Gly Ser 305 310 315 320 Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu Ser 325 330 335 Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln Phe 340 345 350 Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp Asp 355 360 365 Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn 370 375 380 Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr Ser 385 390 395 400 Ser Gly Val Pro Ala Gln Leu Glu Ser Gln Ser Pro Asn Ala Lys Val 405 410 415 Val Tyr Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn Pro 420 425 430 Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr Thr 435 440 445 Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln Thr 450 455 460 His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys 465 470 475 480 Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys 485 490 495 Leu <210> 5 <211> 497 <212> PRT <213> Hypocrea schweinitzii <400> 5 Gln Ser Ala Cys Thr Leu Gln Thr Glu Thr His Pro Ser Leu Thr Trp 1 5 10 15 Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser Thr 35 40 45 Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp Asn 50 55 60 Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala Ser 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Ala Asp Ser Leu Ser Ile Gly Phe Val 85 90 95 Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met Ala 100 105 110 Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe Ser 115 120 125 Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Thr 145 150 155 160 Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly Trp 180 185 190 Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly Ser 195 200 205 Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala 210 215 220 Leu Thr Pro His Pro Cys Thr Asn Val Gly Gln Glu Ile Cys Asp Gly 225 230 235 240 Asp Gly Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Gly Gly Thr Cys 245 250 255 Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser 260 265 270 Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys Leu 275 280 285 Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr Tyr 290 295 300 Val Gln Asn Gly Val Thr Tyr Gln Gln Pro Asn Ala Glu Leu Gly Ser 305 310 315 320 Tyr Ser Gly Asn Glu Leu Asn Asp Ala Tyr Cys Thr Ala Glu Glu Ser 325 330 335 Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln Phe 340 345 350 Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp Asp 355 360 365 Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn 370 375 380 Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr Ser 385 390 395 400 Ser Gly Val Pro Ala Gln Leu Glu Ser Gln Ser Ala Asn Ala Lys Val 405 410 415 Val Tyr Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn Pro 420 425 430 Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr Thr 435 440 445 Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln Thr 450 455 460 His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Ile Cys 465 470 475 480 Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys 485 490 495 Leu <210> 6 <211> 497 <212> PRT <213> Trichoderma citrinoviride <220> <221> misc_feature <222> (217)..(217) <223> Xaa can be any naturally occurring amino acid <400> 6 Gln Ser Ala Cys Thr Leu Gln Thr Glu Thr His Pro Ser Leu Thr Trp 1 5 10 15 Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser Thr 35 40 45 Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp Asn 50 55 60 Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala Ser 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Ala Asp Ser Leu Ser Ile Gly Phe Val 85 90 95 Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met Ala 100 105 110 Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe Ser 115 120 125 Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Thr 145 150 155 160 Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly Trp 180 185 190 Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly Ser 195 200 205 Cys Cys Ser Glu Met Asp Ile Trp Xaa Ala Asn Ser Ile Ser Glu Ala 210 215 220 Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu Gly 225 230 235 240 Asp Gly Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Gly Gly Thr Cys 245 250 255 Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser 260 265 270 Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys Leu 275 280 285 Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr Tyr 290 295 300 Val Gln Asn Gly Val Thr Tyr Lys Gln Pro Asn Ala Glu Leu Gly Ser 305 310 315 320 Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu Ser 325 330 335 Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln Phe 340 345 350 Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp Asp 355 360 365 Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn 370 375 380 Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr Ser 385 390 395 400 Ser Gly Val Pro Ala Gln Leu Glu Ser Gln Ser Pro Asn Ala Lys Val 405 410 415 Val Tyr Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn Pro 420 425 430 Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr Thr 435 440 445 Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln Thr 450 455 460 His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys 465 470 475 480 Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Glu Tyr Tyr Ser Gln Cys 485 490 495 Leu <210> 7 <211> 498 <212> PRT <213> Trichoderma pseudokoningii <400> 7 Gln Ser Ala Cys Thr Leu Gln Thr Glu Thr His Pro Pro Leu Thr Trp 1 5 10 15 Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser Thr 35 40 45 Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp Asn 50 55 60 Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala Ser 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Ala Asp Ser Leu Ser Ile Gly Phe Val 85 90 95 Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met Ala 100 105 110 Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe Ser 115 120 125 Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Thr 145 150 155 160 Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu Gly Trp 180 185 190 Glu Pro Phe Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly Ser 195 200 205 Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala 210 215 220 Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Asp Gly 225 230 235 240 Asp Ser Cys Gly Gly Thr Tyr Ser Gly Asp Arg Tyr Gly Gly Thr Cys 245 250 255 Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser 260 265 270 Phe Tyr Gly Pro Gly Ser Ser Phe Ala Leu Asp Thr Thr Lys Lys Leu 275 280 285 Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr Tyr 290 295 300 Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly Ser 305 310 315 320 Tyr Ser Gly Asn Ser Leu Asp Asp Asp Tyr Cys Ala Ala Glu Glu Ala 325 330 335 Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln Phe 340 345 350 Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp Asp 355 360 365 Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn 370 375 380 Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr Ser 385 390 395 400 Ser Gly Val Pro Ala Gln Leu Glu Ser Gln Ser Ser Asn Ala Lys Val 405 410 415 Val Tyr Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn Ser 420 425 430 Ser Gly Gly Ser Pro Pro Gly Gly Gly Asn Pro Pro Gly Thr Thr Thr 435 440 445 Thr Arg Arg Pro Ala Thr Ser Thr Gly Ser Ser Pro Gly Pro Thr Gln 450 455 460 Thr His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val 465 470 475 480 Cys Ala Ser Gly Ser Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln 485 490 495 Cys Leu <210> 8 <211> 498 <212> PRT <213> Trichoderma konilangbra <220> <221> misc_feature <222> (273)..(273) <223> Xaa can be any naturally occurring amino acid <400> 8 Gln Ser Ala Cys Thr Ile Gln Ala Glu Thr His Pro Pro Leu Thr Trp 1 5 10 15 Gln Lys Cys Ser Ser Gly Gly Ser Cys Thr Ser Gln Thr Gly Ser Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Thr Thr 35 40 45 Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Ser Leu Cys Pro Asp Asn 50 55 60 Glu Ser Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala Ser 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Ala Asp Ser Leu Ser Ile Gly Phe Val 85 90 95 Thr Gln Ser Gln Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met Ala 100 105 110 Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe Ser 115 120 125 Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Ser 145 150 155 160 Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu Gly Trp 180 185 190 Glu Pro Ala Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly Ser 195 200 205 Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala 210 215 220 Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Ala Ile Cys Asp Gly 225 230 235 240 Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asp Arg Tyr Gly Gly Thr Cys 245 250 255 Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser 260 265 270 Xaa Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys Met 275 280 285 Thr Val Val Thr Gln Phe Ala Thr Ser Gly Ala Ile Asn Arg Tyr Tyr 290 295 300 Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly Ser 305 310 315 320 Tyr Ser Gly Asn Thr Leu Asn Asp Ala Tyr Cys Ala Ala Glu Glu Ala 325 330 335 Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln Phe 340 345 350 Lys Gln Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp Asp 355 360 365 Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Ile Tyr Pro Thr Asn 370 375 380 Glu Thr Ser Ser Thr Pro Gly Ala Ala Arg Gly Ser Cys Ser Thr Ser 385 390 395 400 Ser Gly Val Pro Ala Gln Leu Glu Ser Gln Ser Thr Asn Ala Lys Val 405 410 415 Val Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn Ser 420 425 430 Ser Gly Gly Asn Pro Pro Gly Gly Gly Asn Pro Pro Gly Thr Thr Thr 435 440 445 Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln 450 455 460 Thr His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val 465 470 475 480 Cys Ala Ser Gly Ser Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln 485 490 495 Cys Leu <210> 9 <211> 488 <212> PRT <213> Trichoderma harzanium <400> 9 Gln Gln Val Cys Thr Gln Gln Ala Glu Thr His Pro Pro Leu Thr Trp 1 5 10 15 Gln Lys Cys Thr Ala Ser Gly Cys Thr Pro Gln Gln Gly Ser Val Val 20 25 30 Leu Asp Ala Asn Trp Arg Trp Thr His Asp Thr Lys Ser Thr Thr Asn 35 40 45 Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp Asp Ala 50 55 60 Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Asn Tyr Ser Gly Thr 65 70 75 80 Tyr Gly Val Thr Thr Ser Gly Asp Ala Leu Thr Leu Gln Phe Val Thr 85 90 95 Ala Ser Asn Val Gly Ser Arg Leu Tyr Leu Met Ala Asn Asp Ser Thr 100 105 110 Tyr Gln Glu Phe Thr Leu Ser Gly Asn Glu Phe Ser Phe Asp Val Asp 115 120 125 Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ser 130 135 140 Met Asp Ala Asp Gly Gly Gln Ser Lys Tyr Pro Gly Asn Ala Ala Gly 145 150 155 160 Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu 165 170 175 Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Glu Pro Ser Ser 180 185 190 Asn Asn Ala Asn Thr Gly Val Gly Gly His Gly Ser Cys Cys Ser Glu 195 200 205 Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala Leu Thr Pro His 210 215 220 Pro Cys Glu Thr Val Gly Gln Thr Met Cys Ser Gly Asp Ser Cys Gly 225 230 235 240 Gly Thr Tyr Ser Asn Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly 245 250 255 Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser Phe Tyr Gly Pro 260 265 270 Gly Ser Ser Phe Ala Leu Asp Thr Thr Lys Lys Leu Thr Val Val Thr 275 280 285 Gln Phe Ala Thr Asp Gly Ser Ile Ser Arg Tyr Tyr Val Gln Asn Gly 290 295 300 Val Lys Phe Gln Gln Pro Asn Ala Gln Val Gly Ser Tyr Ser Gly Asn 305 310 315 320 Thr Ile Asn Thr Asp Tyr Cys Ala Ala Glu Gln Thr Ala Phe Gly Gly 325 330 335 Thr Ser Phe Thr Asp Lys Gly Gly Leu Ala Gln Ile Asn Lys Ala Phe 340 345 350 Gln Gly Gly Met Val Leu Val Met Ser Leu Trp Asp Asp Tyr Ala Val 355 360 365 Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn Ala Thr Ala Ser 370 375 380 Thr Pro Gly Ala Lys Arg Gly Ser Cys Ser Thr Ser Ser Gly Val Pro 385 390 395 400 Ala Gln Val Glu Ala Gln Ser Pro Asn Ser Lys Val Ile Tyr Ser Asn 405 410 415 Ile Arg Phe Gly Pro Ile Gly Ser Thr Gly Gly Asn Thr Gly Ser Asn 420 425 430 Pro Pro Gly Thr Ser Thr Thr Arg Ala Pro Pro Ser Ser Thr Gly Ser 435 440 445 Ser Pro Thr Ala Thr Gln Thr His Tyr Gly Gln Cys Gly Gly Thr Gly 450 455 460 Trp Thr Gly Pro Thr Arg Cys Ala Ser Gly Tyr Thr Cys Gln Val Leu 465 470 475 480 Asn Pro Phe Tyr Ser Gln Cys Leu 485 <210> 10 <211> 518 <212> PRT <213> Aspergillus aculeatus <400> 10 Gln Gln Val Gly Thr Tyr Thr Ala Glu Thr His Pro Ser Leu Thr Trp 1 5 10 15 Gln Thr Cys Ser Gly Ser Gly Ser Cys Thr Thr Thr Ser Gly Ser Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Val His Glu Val Gly Gly Tyr Thr 35 40 45 Asn Cys Tyr Ser Gly Asn Thr Trp Asp Ser Ser Ile Cys Ser Thr Asp 50 55 60 Thr Thr Cys Ala Ser Glu Cys Ala Leu Glu Gly Ala Thr Tyr Glu Ser 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Gly Ser Ser Leu Arg Leu Asn Phe Val 85 90 95 Thr Thr Ala Ser Gln Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu Ala 100 105 110 Asp Asp Ser Thr Tyr Glu Thr Phe Lys Leu Phe Asn Arg Glu Phe Thr 115 120 125 Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Arg Phe Pro Thr 145 150 155 160 Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asp Gly Gln Ala Asn Ile Glu Gly Trp 180 185 190 Glu Pro Ser Ser Thr Asp Val Asn Ala Gly Thr Gly Asn His Gly Ser 195 200 205 Cys Cys Pro Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Ser Ala 210 215 220 Phe Thr Ala His Pro Cys Asp Ser Val Gln Gln Thr Met Cys Thr Gly 225 230 235 240 Asp Thr Cys Gly Gly Thr Tyr Ser Asp Thr Thr Asp Arg Tyr Ser Gly 245 250 255 Thr Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Phe Gly Asn 260 265 270 Thr Asn Phe Tyr Gly Pro Gly Lys Thr Val Asp Asn Ser Lys Pro Phe 275 280 285 Thr Val Val Thr Gln Phe Ile Thr His Asp Gly Thr Asp Thr Gly Thr 290 295 300 Leu Thr Glu Ile Arg Arg Leu Tyr Val Gln Asn Gly Val Val Ile Gly 305 310 315 320 Asn Gly Pro Ser Thr Tyr Thr Ala Ala Ser Gly Asn Ser Ile Thr Glu 325 330 335 Ser Phe Cys Lys Ala Glu Lys Thr Leu Phe Gly Asp Thr Asn Val Phe 340 345 350 Glu Thr His Gly Gly Leu Ser Ala Met Gly Asp Ala Leu Gly Asp Gly 355 360 365 Met Val Leu Val Leu Ser Leu Trp Asp Asp His Ala Ala Asp Met Leu 370 375 380 Trp Leu Asp Ser Asp Tyr Pro Thr Thr Ser Cys Ala Ser Ser Pro Gly 385 390 395 400 Val Ala Arg Gly Thr Cys Pro Thr Thr Thr Gly Asn Ala Thr Tyr Val 405 410 415 Glu Ala Asn Tyr Pro Asn Ser Tyr Val Thr Tyr Ser Asn Ile Lys Phe 420 425 430 Gly Thr Leu Asn Ser Thr Tyr Ser Gly Thr Ser Ser Gly Gly Ser Ser 435 440 445 Ser Ser Ser Thr Thr Leu Thr Thr Lys Ala Ser Thr Ser Thr Thr Ser 450 455 460 Ser Lys Thr Thr Thr Thr Thr Ser Lys Thr Ser Thr Thr Ser Ser Ser 465 470 475 480 Ser Thr Asn Val Ala Gln Leu Tyr Gly Gln Cys Gly Gly Gln Gly Trp 485 490 495 Thr Gly Pro Thr Thr Cys Ala Ser Gly Thr Cys Thr Lys Gln Asn Asp 500 505 510 Tyr Tyr Ser Gln Cys Leu 515 <210> 11 <211> 515 <212> PRT <213> Aspergillus niger <400> 11 Gln Gln Val Gly Thr Tyr Thr Thr Glu Thr His Pro Ser Leu Thr Trp 1 5 10 15 Gln Thr Cys Thr Ser Ser Gly Ser Cys Thr Thr Asn Asp Gly Ala Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Val His Ser Thr Ser Ser Ser Thr 35 40 45 Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp Asp 50 55 60 Val Thr Cys Ala Ala Asn Cys Ala Leu Asp Gly Ala Thr Tyr Glu Ala 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Gly Asp Glu Leu Arg Leu Asn Phe Val 85 90 95 Thr Gln Gly Ser Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu Met Ser 100 105 110 Asp Asp Ser Thr Tyr Glu Met Phe Lys Leu Leu Gly Gln Glu Phe Thr 115 120 125 Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Thr Ser Glu Tyr Ser Gly 145 150 155 160 Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Cys Asp Gly Trp 180 185 190 Glu Pro Ser Ser Asn Asn Val Asn Thr Gly Val Gly Asp His Gly Ser 195 200 205 Cys Cys Pro Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Asn Ala 210 215 220 Phe Thr Ala His Pro Cys Asp Ser Val Ser Gln Thr Met Cys Asp Gly 225 230 235 240 Asp Ser Cys Gly Gly Thr Tyr Ser Ala Ser Gly Asp Arg Tyr Ser Gly 245 250 255 Thr Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Tyr Arg Leu Gly Asn 260 265 270 Thr Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Asn Ser Pro Phe 275 280 285 Thr Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Ser Ser Gly Thr 290 295 300 Leu Thr Glu Ile Lys Arg Leu Tyr Val Gln Asn Gly Glu Val Ile Ala 305 310 315 320 Asn Gly Ala Ser Thr Tyr Ser Ser Val Asn Gly Ser Ser Ile Thr Ser 325 330 335 Asp Phe Cys Glu Ser Glu Lys Thr Leu Phe Gly Asp Glu Asn Val Phe 340 345 350 Asp Thr His Gly Gly Leu Ala Gly Met Gly Glu Ala Met Ala Asn Gly 355 360 365 Met Val Leu Val Leu Ser Leu Trp Asp Asp Tyr Ala Ala Asn Met Leu 370 375 380 Trp Leu Asp Ser Asp Tyr Pro Val Asn Ser Ser Ala Ser Thr Pro Gly 385 390 395 400 Val Ala Arg Gly Thr Cys Ser Thr Asp Ser Gly Val Pro Ala Thr Val 405 410 415 Glu Ala Asp Ser Pro Asn Ala Tyr Val Thr Tyr Ser Asn Ile Lys Phe 420 425 430 Gly Pro Ile Gly Ser Thr Tyr Ser Ser Gly Ser Ser Ser Gly Ser Gly 435 440 445 Ser Ser Ser Ser Ser Ser Ser Thr Thr Thr Lys Ala Thr Ser Thr Thr 450 455 460 Leu Lys Thr Thr Thr Thr Thr Ser Ser Gly Ser Ser Ser Thr Ser Ala 465 470 475 480 Ala Gln Ala Tyr Gly Gln Cys Gly Gly Gln Ser Trp Thr Gly Pro Thr 485 490 495 Thr Cys Val Ser Gly Tyr Thr Cys Thr Tyr Gln Asn Ala Tyr Tyr Ser 500 505 510 Gln Cys Leu 515 <210> 12 <211> 512 <212> PRT <213> Penicillium janthinellum <220> <221> misc_feature <222> (23)..(23) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (39)..(39) <223> Xaa can be any naturally occurring amino acid <400> 12 Gln Gln Val Gly Thr Leu Thr Ala Glu Thr His Pro Ala Leu Thr Trp 1 5 10 15 Ser Lys Cys Thr Ala Gly Xaa Cys Ser Gln Val Ser Gly Ser Val Val 20 25 30 Ile Asp Ala Asn Trp Pro Xaa Val His Ser Thr Ser Gly Ser Thr Asn 35 40 45 Cys Tyr Thr Gly Asn Thr Trp Asp Ala Thr Leu Cys Pro Asp Asp Val 50 55 60 Thr Cys Ala Ala Asn Cys Ala Val Asp Gly Ala Arg Arg Gln His Leu 65 70 75 80 Arg Val Thr Thr Ser Gly Asn Ser Leu Arg Ile Asn Phe Val Thr Thr 85 90 95 Ala Ser Gln Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu Glu Asn Asp 100 105 110 Thr Thr Tyr Gln Lys Phe Asn Leu Leu Asn Gln Glu Phe Thr Phe Asp 115 120 125 Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe 130 135 140 Val Asp Met Asp Ala Asp Gly Gly Met Ala Lys Tyr Pro Thr Asn Lys 145 150 155 160 Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg 165 170 175 Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Asp Gly Trp Thr Pro 180 185 190 Ser Lys Asn Asp Val Asn Ser Gly Ile Gly Asn His Gly Ser Cys Cys 195 200 205 Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Asn Ala Val Thr 210 215 220 Pro His Pro Cys Asp Thr Pro Ser Gln Thr Met Cys Thr Gly Gln Arg 225 230 235 240 Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Gly Gly Thr Cys Asp Pro 245 250 255 Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Val Thr Asn Phe Tyr 260 265 270 Gly Pro Gly Glu Thr Ile Asp Thr Lys Ser Pro Phe Thr Val Val Thr 275 280 285 Gln Phe Leu Thr Asn Asp Gly Thr Ser Thr Gly Thr Leu Ser Glu Ile 290 295 300 Lys Arg Phe Tyr Val Gln Gly Gly Lys Val Ile Gly Asn Pro Gln Ser 305 310 315 320 Thr Ile Val Gly Val Ser Gly Asn Ser Ile Thr Asp Ser Trp Cys Asn 325 330 335 Ala Gln Lys Ser Ala Phe Gly Asp Thr Asn Glu Phe Ser Lys His Gly 340 345 350 Gly Met Ala Gly Met Gly Ala Gly Leu Ala Asp Gly Met Val Leu Val 355 360 365 Met Ser Leu Trp Asp Asp His Ala Ser Asp Met Leu Trp Leu Asp Ser 370 375 380 Thr Tyr Pro Thr Asn Ala Thr Ser Thr Thr Pro Gly Ala Lys Arg Gly 385 390 395 400 Thr Cys Asp Ile Ser Arg Arg Pro Asn Thr Val Glu Ser Thr Tyr Pro 405 410 415 Asn Ala Tyr Val Ile Tyr Ser Asn Ile Lys Thr Gly Pro Leu Asn Ser 420 425 430 Thr Phe Thr Gly Gly Thr Thr Ser Ser Ser Ser Thr Thr Thr Thr Thr 435 440 445 Ser Lys Ser Thr Ser Thr Ser Ser Ser Ser Lys Thr Thr Thr Thr Val 450 455 460 Thr Thr Thr Thr Thr Ser Ser Gly Ser Ser Gly Thr Gly Ala Arg Asp 465 470 475 480 Trp Ala Gln Cys Gly Gly Asn Gly Trp Thr Gly Pro Thr Thr Cys Val 485 490 495 Ser Pro Tyr Thr Cys Thr Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu 500 505 510 <210> 13 <211> 507 <212> PRT <213> Humicola grisea <400> 13 Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu Ser Trp 1 5 10 15 Lys Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala Ser Ile 20 25 30 Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly Ser Thr 35 40 45 Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr Asp Ala 50 55 60 Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr Thr Ser 65 70 75 80 Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys Phe Val 85 90 95 Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr Leu Met 100 105 110 Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn Glu Phe 115 120 125 Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn Gly Ala 130 135 140 Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg Tyr Pro 145 150 155 160 Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln 165 170 175 Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile Glu Gly 180 185 190 Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg Tyr Gly 195 200 205 Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met Ala Thr 210 215 220 Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg Cys Glu 225 230 235 240 Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala Gly Val 245 250 255 Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn Lys 260 265 270 Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile Thr 275 280 285 Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly Glu Ile 290 295 300 Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser Glu Ser 305 310 315 320 Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys Asp 325 330 335 Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg Lys Gly 340 345 350 Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu Val 355 360 365 Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu Asp Ser 370 375 380 Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg Gly Ala 385 390 395 400 Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala Pro 405 410 415 Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser 420 425 430 Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn Gly Gly 435 440 445 Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala Thr Thr 450 455 460 Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly Arg Trp Gln Gln Cys Gly 465 470 475 480 Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr Thr Cys 485 490 495 Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu 500 505 <210> 14 <211> 515 <212> PRT <213> Scytalidium thermophilum <400> 14 Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu Ser Trp 1 5 10 15 Lys Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala Ser Ile 20 25 30 Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly Ser Thr 35 40 45 Asn Cys Tyr Thr Gly Asn Glu Trp Asp Ser Ser Ile Cys Thr Asp Ala 50 55 60 Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr Thr Ser 65 70 75 80 Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys Phe Val 85 90 95 Thr Lys Gly Gln Tyr Ser Thr Asn Val Gly Ser Arg Thr Tyr Leu Met 100 105 110 Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn Glu Phe 115 120 125 Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn Gly Ala 130 135 140 Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg Tyr Pro 145 150 155 160 Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln 165 170 175 Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile Glu Gly 180 185 190 Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg Tyr Gly 195 200 205 Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met Ala Thr 210 215 220 Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg Cys Glu 225 230 235 240 Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Ala Gly Val 245 250 255 Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly Asn Lys 260 265 270 Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Leu Thr 275 280 285 Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly Glu Ile 290 295 300 Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser Glu Ser 305 310 315 320 Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys Asp 325 330 335 Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg Lys Gly 340 345 350 Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu Val 355 360 365 Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu Asp Ser 370 375 380 Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg Gly Ala 385 390 395 400 Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala Pro 405 410 415 Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser 420 425 430 Thr Val Ala Gly Leu Pro Ser Asp Gly Gly Asn Asn Gly Gly Asn Thr 435 440 445 Thr Val Gln Pro Pro Pro Ser Thr Thr Thr Thr Ser Ala Ser Ser Ser 450 455 460 Thr Thr Ser Ala Pro Ala Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys 465 470 475 480 Ala Gly Arg Trp Gln Gln Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr 485 490 495 Gln Cys Glu Glu Pro Tyr Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser 500 505 510 Gln Cys Leu 515 <210> 15 <211> 509 <212> PRT <213> Podospora anderina <400> 15 Gln Gln Val Cys Ser Leu Thr Pro Glu Ser His Pro Pro Leu Thr Trp 1 5 10 15 Gln Arg Cys Ser Ala Gly Gly Ser Cys Thr Asn Val Ala Gly Ser Val 20 25 30 Thr Leu Asp Ser Asn Trp Arg Trp Thr His Thr Leu Gln Gly Ser Thr 35 40 45 Asn Cys Tyr Ser Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Thr Gly 50 55 60 Thr Lys Cys Ala Gln Asn Cys Cys Val Glu Gly Ala Glu Tyr Ala Ala 65 70 75 80 Thr Tyr Gly Ile Thr Thr Ser Gly Asn Gln Leu Asn Leu Lys Phe Val 85 90 95 Thr Glu Gly Lys Tyr Ser Thr Asn Val Gly Ser Arg Thr Tyr Leu Met 100 105 110 Glu Asn Ala Thr Lys Tyr Gln Gly Phe Asn Leu Leu Gly Asn Glu Phe 115 120 125 Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn Gly Ala 130 135 140 Leu Tyr Phe Val Ser Met Asp Leu Asp Gly Gly Leu Ala Lys Tyr Ser 145 150 155 160 Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln 165 170 175 Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile Glu Gly 180 185 190 Trp Asn Pro Ser Thr Asn Asp Val Asn Ala Gly Ala Gly Arg Tyr Gly 195 200 205 Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met Ala Thr 210 215 220 Ala Tyr Thr Pro His Ser Cys Thr Ile Leu Asp Gln Ser Arg Cys Glu 225 230 235 240 Gly Glu Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Gly Gly Val 245 250 255 Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn Lys 260 265 270 Glu Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Thr Lys Lys Met Thr 275 280 285 Val Val Thr Gln Phe Leu Lys Asn Ala Ala Gly Glu Leu Ser Glu Ile 290 295 300 Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Val Ser 305 310 315 320 Ser Ile Pro Gly Val Pro Asn Gln Asn Ser Ile Thr Gln Asp Trp Cys 325 330 335 Asp Ala Gln Lys Ile Ala Phe Gly Asp Pro Asp Asp Asn Thr Ala Lys 340 345 350 Gly Gly Leu Arg Gln Met Gly Leu Ala Leu Asp Lys Pro Met Val Leu 355 360 365 Val Met Ser Ile Trp Asn Asp His Ala Ala His Met Leu Trp Leu Asp 370 375 380 Ser Thr Tyr Pro Val Asp Ala Ala Gly Arg Pro Gly Ala Glu Arg Gly 385 390 395 400 Ala Cys Pro Thr Thr Ser Gly Val Pro Ser Glu Val Glu Ala Glu Ala 405 410 415 Pro Asn Ser Asn Val Ala Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly 420 425 430 Ser Thr Phe Asn Ser Gly Ser Thr Asn Pro Asn Pro Ile Ser Ser Ser 435 440 445 Thr Ala Thr Thr Pro Thr Ser Thr Arg Val Ser Ser Thr Ser Thr Ala 450 455 460 Ala Gln Thr Pro Thr Ser Ala Pro Gly Gly Thr Val Pro Arg Trp Gly 465 470 475 480 Gln Cys Gly Gly Gln Gly Tyr Thr Gly Pro Thr Gln Cys Val Ala Pro 485 490 495 Tyr Thr Cys Val Val Ser Asn Gln Trp Tyr Ser Gln Cys 500 505 <210> 16 <211> 497 <212> PRT <213> Hypocrea jecorina <220> <221> misc_feature <223> CBH1 amino acid sequence from H. jecorina <220> <221> misc_feature <222> (200)..(200) <223> Xaa is Gly or Arg <220> <221> misc_feature <222> (246)..(246) <223> Xaa is Ser, Val or Pro <220> <221> misc_feature <222> (255)..(255) <223> Xaa is Val, Ile, Lys, Arg, Asp, or Pro <400> 16 Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr Trp 1 5 10 15 Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser Val 20 25 30 Val Ile Asp Ala Asn Trp Arg Trp Ile His Ala Thr Asn Ser Ser Thr 35 40 45 Pro Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp Asn 50 55 60 Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala Ser 65 70 75 80 Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Thr Ile Gly Phe Val 85 90 95 Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met Ala 100 105 110 Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe Ser 115 120 125 Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu 130 135 140 Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Thr 145 150 155 160 Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys 165 170 175 Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly Trp 180 185 190 Glu Val Ser Ser Asn Asn Ala Xaa Thr Gly Ile Gly Gly His Gly Ser 195 200 205 Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala 210 215 220 Leu Thr Pro His Pro Cys Thr Thr Val Asp Gln Glu Ile Cys Glu Gly 225 230 235 240 Asn Gly Cys Gly Gly Xaa Asp Ser Asp Asn Arg Tyr Gly Gly Xaa Cys 245 250 255 Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser 260 265 270 Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys Leu 275 280 285 Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr Tyr 290 295 300 Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly Ser 305 310 315 320 Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu Ala 325 330 335 Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln Phe 340 345 350 Lys Lys Ala Leu Ser Gly Gly Met Val Leu Val Met Ser Leu Trp Asp 355 360 365 Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn 370 375 380 Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr Ser 385 390 395 400 Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys Val 405 410 415 Thr Met Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn Pro 420 425 430 Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr Thr 435 440 445 Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln Ser 450 455 460 His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys 465 470 475 480 Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys 485 490 495 Leu

Claims

모 셀로바이오하이드롤라제 (parent cellobiohydrolase (CBH)) 효소의 단리된 변이체로서, 상기 변이체는 셀룰라제 활성을 갖고, 서열 번호 3에 대해 적어도 80%의 서열 동일성을 갖고, 인산 팽윤 셀룰로오스 (Phosphoric Acid Swollen Cellulose, PASC) 검정법에서 유의하게 향상된 성능을 갖는, 단리된 변이체.
제1항에 있어서, 상기 변이체는 Y247D, N49P, T246V, N200G, 및 이들의 조합으로 이루어진 군으로부터 선택되는 아미노산 치환을 포함하고, 각각의 아미노산 치환의 위치가 서열 번호 3에 대응하는, 단리된 변이체.
제2항에 있어서, 상기 변이체는 Y247D 치환을 포함하는, 단리된 변이체.
제2항 또는 제3항에 있어서, 상기 변이체는 N49P 치환을 포함하는, 단리된 변이체.
제2항, 제3항 또는 제4항에 있어서, 상기 변이체는 T246V 치환을 포함하는, 단리된 변이체.
제2항, 제3항, 제4항 또는 제5항에 있어서, 상기 변이체는 N200G 치환을 포함하는, 단리된 변이체.
제2항, 제3항, 제4항 또는 제6항에 있어서, 상기 변이체는 T246S 및 T246P로 이루어진 군으로부터 선택되는 아미노산 치환을 추가로 포함하는, 단리된 변이체.
제2항, 제3항, 제4항, 제5항 또는 제7항에 있어서, 상기 변이체는 N200R 아미노산 치환을 추가로 포함하는, 단리된 변이체.
제2항 내지 제8항 중 어느 한 항에 있어서, 상기 변이체는 F418M, T255D 또는 T255I 또는 T255K 또는 T255P 또는 T255R 또는 T255V, D241N, G234D, P194V, T356L, S92T, T41I, 및 이들의 조합으로 이루어진 군으로부터 선택되는 아미노산 치환을 추가로 포함하는, 단리된 변이체.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 모 CBH 폴리펩티드는 진균성 셀로바이오하이드롤라제 1 (CBH1)인, 단리된 변이체.
제10항에 있어서, 상기 진균성 CBH1은 히포크레아 제코리나 (Hypocrea jecorina), 히포크레아 슈바이닛찌이 (Hypocrea schweinitzii), 히포크레아 오리엔탈리스 (Hypocrea orientalis), 트리코더마 슈도코닌기이 (Trichoderma pseudokoningii), 트리코더마 코닐랑브라 (Trichoderma konilangbra), 트리코더마 시트리노비리데 (Trichoderma citrinoviride), 트리코더마 하자니움 (Trichoderma harzanium), 아스페르길루스 아큘레아투스 (Aspergillus aculeatus), 아스페르길루스 니게르 (Aspergillus niger), 페니실리움 잔티넬룸 (Penicillium janthinellum), 후미콜라 그리세아 (Humicola grisea), 스키탈리디움 써모필룸 (Scytalidium thermophilum), 또는 포도스포라 안데리나 (Podospora anderina)로부터인, 단리된 변이체.
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 모 CBH 폴리펩티드는 서열 번호 3에 대해 적어도 90%의 서열 동일성을 갖는, 단리된 변이체.
제1항 내지 제12항 중 어느 한 항에 따른 모 CBH 폴리펩티드의 변이체를 인코딩하는 폴리뉴클레오티드 서열을 포함하는, 단리된 폴리뉴클레오티드.
제13항의 단리된 폴리뉴클레오티드를 포함하는 벡터.
제14항에 있어서, 상기 벡터는 발현 벡터인, 벡터.
제13항의 단리된 폴리뉴클레오티드, 제14항의 벡터, 또는 제15항의 발현 벡터를 포함하는, 숙주 세포.
제16항에 있어서, 상기 숙주 세포는 진균 세포 또는 세균 세포인, 숙주 세포.
제17항에 있어서, 상기 숙주 세포는
트리코더마 레에세이 (Trichoderma reesei), 트리코더마 롱기브라키아툼 (Trichoderma longibrachiatum), 트리코더마 비리데 (Trichoderma viride), 트리코더마 코닌기이 (Trichoderma koningii), 트리코더마 하지아눔 (Trichoderma harzianum), 페니실리움 (Penicillium), 후미콜라 (Humicola), 후미콜라 인솔렌스 (Humicola insolens), 후미콜라 그리세아 (Humicola grisea), 크리소스포리움 (Chrysosporium), 크리소스포리움 룩크노웬세 (Chrysosporium lucknowense), 마이셀리오프토라 써모필라 (Myceliophthora thermophila), 글리오클라디움 (Gliocladium), 아스페르길루스 (Aspergillus), 푸사리움 (Fusarium), 뉴로스포라 (Neurospora), 히포크레아 (Hypocrea), 에메리셀라 (Emericella), 아스페르길루스 니게르 (Aspergillus niger), 아스페르길루스 아와모리 (Aspergillus awamori), 아스페르길루스 아큘레아투스 (Aspergillus aculeatus), 및 아스페르길루스 니둘란스 (Aspergillus nidulans)로 이루어진 군으로부터 선택되는 사상 진균 세포;
사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 스키조사카로마이세스 폼베 (Schizzosaccharomyces pombe), 슈반니오마이세스 옥시덴탈리스 (Schwanniomyces occidentalis), 클루베로마이세스 락투스 (Kluveromyces lactus), 칸디다 유틸리스 (Candida utilis), 칸디다 알비칸스 (Candida albicans), 피키아 스티피티스 (Pichia stipitis), 피키아 파스토리스 (Pichia pastoris), 야로위아 리폴리티카 (Yarrowia lipolytica), 한세눌라 폴리모르파 (Hansenula polymorpha), 파피아 로도지마 (Phaffia rhodozyma), 아르슐라 아데니니보란스 (Arxula adeninivorans), 데바리오마이세스 한세니이 (Debaryomyces hansenii), 및 데바리오마이세스 폴리모르푸스 (Debaryomyces polymorphus)로 이루어진 군으로부터 선택되는 효모 세포; 및
자이모모나스 모빌리스 (Zymomonas mobilis) 세균 세포로 이루어진 군으로부터 선택되는, 숙주 세포.
제16항 내지 제18항 중 어느 한 항에 있어서, 상기 숙주 세포는 상기 단리된 폴리뉴클레오티드, 벡터 또는 발현 벡터에 의해 인코딩되는 모 CBH 폴리펩티드의 변이체를 발현하는, 숙주 세포.
적합한 배양 배지에서 제16항의 숙주 세포를 상기 변이체를 생산하기에 적합한 조건 하에서 배양하는 단계를 포함하는 변이 CBH 폴리펩티드를 생산하는, 방법.
제20항에 있어서, 상기 생산된 변이체를 단리하는 단계를 추가로 포함하는, 방법.
제1항 내지 제12항 중 어느 한 항에 따른 변이 CBH 폴리펩티드 및 계면활성제를 포함하는, 세제 조성물.
제1항 내지 제12항 중 어느 한 항에 따른 변이 CBH 폴리펩티드를 포함하는, 사료 첨가제.
셀룰로오스 기질을 가수분해하는 방법으로서,
상기 기질을 제1항 내지 제12항 중 어느 한 항에 따른 단리된 변이 CBH 폴리펩티드와 접촉시키는 단계;
상기 기질을 제19항에 따른 숙주 세포와 접촉시키는 단계;
또는 이 둘의 조합을 포함하는, 방법.
제24항에 있어서, 상기 셀룰로오스 기질이 그래스 (grass), 스위치 그래스 (switch grass), 코드 그래스 (cord grass), 라이 그래스 (rye grass), 리드 카나리 그래스 (reed canary grass), 억새, 설탕-가공 잔유물, 사탕수수 찌꺼기, 농업 폐기물, 볏짚, 왕겨, 보리 짚, 옥수수 속대 (cob), 곡물 짚, 밀짚, 유채 짚, 귀리 짚, 귀리 껍질, 옥수수 섬유, 대 (stover), 콩 대, 옥수수 대, 임업 폐기물, 목재 펄프, 재활용된 목재 펄프 섬유, 종이 슬러지, 톱밥, 경재 (hardwood), 연재 (softwood), 및 이들의 조합으로 이루어진 군으로부터 선택되는 리그노셀룰로오스 바이오매스인, 방법.
제1항 내지 제12항 중 어느 한 항에 따른 CBH 변이체를 포함하는, 세포 배양 상청액.
제26항에 있어서, 상기 세포 배양 상청액은 제19항에 따른 숙주 세포의 배양물로부터 유래된, 세포 배양 상청액.
제26항 또는 제27항에 있어서, 하나 이상의 추가적인 셀룰라제 또는 헤미셀룰라제를 추가로 포함하는, 세포 배양 상청액.
CBH 변이체를 포함하는 세포 배양 상청액을 생산하는 방법으로서,
CBH 변이체를 발현하기에 적합한 조건 하에서 제15항의 숙주 세포를 배양하는 단계; 및
배양물의 세포 배양 상청액을 수집하여 상기 CBH 변이체를 포함하는 세포 배양 상청액을 생산하는 단계를 포함하는, 방법.
제29항에 있어서, 하기 중 하나 이상을 추가로 포함하는, 방법:
상기 배양하는 단계 후에 상기 숙주 세포를 죽이는 단계;
세포 파편을 제거하기 위해 상기 수집된 세포 배양 상청액을 여과하는 단계; 및
상기 세포 배양 상청액을 한외여과하는 단계 또는 CBH 변이체를 부화 (enrich) 또는 농축하는 다른 단계.
제29항 또는 제30항에 있어서, 상기 숙주 세포는 하나 이상의 추가적인 셀룰라제 및/또는 헤미셀룰라제를 추가로 발현하고, 상기 하나 이상의 추가적인 셀룰라제 및/또는 헤미셀룰라제는 상기 세포 배양 상청액에 존재하는, 방법.
제30항에 있어서, 상기 하나 이상의 추가적인 셀룰라제 및/또는 헤미셀룰라제는 상기 숙주 세포에서 외생적으로 (exogenously) 발현되거나, 상기 숙주 세포에서 내생적으로 (endogenously) 발현되거나, 상기 세포 배양 상청액과 혼합되거나, 또는 이들의 조합인, 방법.
제29항 내지 제32항 중 어느 한 항에 있어서, 상기 방법은 상기 세포 배양 상청액을 리그노셀룰로오스 바이오매스 기질과 접촉시키는 단계를 추가로 포함하는, 방법.