KR20130014516A

KR20130014516A - 글루코시다아제의 제조 방법, 효소 조성물 및 바이오매스의 가수 분해 방법

Info

Publication number: KR20130014516A
Application number: KR1020127023914A
Authority: KR
Inventors: 히로유키 쿠리하라; 시오미 와타나베; 카츠시게 야마다; 카즈히코 이시카와; 야스노부 와다; 유지 카도
Original assignee: 도레이 카부시키가이샤
Priority date: 2010-03-01
Filing date: 2011-01-26
Publication date: 2013-02-07
Also published as: CA2791495A1; EP2543723A4; CN102884184A; AU2011222255B2; CN102884184B; DK2543723T3; ES2544710T3; BR112012021230A2; JPWO2011108312A1; JP5831911B2; EP2543723B1; AU2011222255A1; WO2011108312A1; EP2543723A1; MY159439A

Abstract

셀룰로오스 분해 효율을 향상시킨 글루코시다아제를 제조하고, 이것을 이용하는 효율적인 바이오매스의 분해 방법을 제공한다. 본 발명은 호열성 균유래 글루코시다아제를 인코딩하는 DNA에 분비 시그널 서열을 인코딩하는 DNA 및 Asn-X-Ser 또는 Asn-X-Thr를 인코딩하는 DNA를 도입하여 이것을 진핵 미생물에 도입해 분비 단백질로서 발현되게 하는 것을 포함한다, 변이형 글루코시다아제의 제조 방법, 상기 변이형 글루코시다아제를 포함하는 효소 조성물 및 상기 효소 조성물을 사용하는 바이오매스의 가수 분해 방법을 제공한다.

Description

글루코시다아제의 제조 방법, 효소 조성물 및 바이오매스의 가수 분해 방법{METHOD FOR PRODUCING GLUCOSIDASE, ENZYME COMPOSITION, AND BIOMASS HYDROLYSIS METHOD}

본 발명은 당쇄 부가된 호열성 균유래 변이형 글루코시다아제의 제조 방법, 상기 효소를 포함하는 효소 조성물 및 상기 효소 조성물을 사용하는 바이오매스의 가수 분해 방법에 관한 것이다.

셀룰로오스의 당화에는 여러 가지 방법이 있지만 반응 조건이 마일드하며 또한 당 수율이 높은 효소 당화법이 개발의 주류가 되고 있다.

셀룰로오스 분해 효소인 셀룰라아제를 대별하면 셀룰로오스의 결정 영역에 작용하는 셀로비오하이드라아제, 셀룰로오스 분자쇄 내부로부터 작용해서 분자량을 저감시키는 엔도글루카나아제로 나뉜다. 이들 셀룰라아제는 생성물의 하나인 셀로비오스에 의해 저해를 받는 것이 알려져 있다. 또한, β-글루코시다아제는 수용성 올리고당 또는 셀로비오스에 작용하여 그 β-글리코시드 결합을 가수 분해하는 반응을 촉매하는 효소이다. 특히, β-글루코시다아제는 발효 원료로서 유용한 글루코오스를 충분히 얻기 위해서는 필수적인 효소이다. 또한, 셀로비오하이드라아제 또는 엔도글루카나아제는 셀룰로오스 분해에 의해 생성된 셀로비오스의 축적에 의해 반응 저해가 일어나는 것이 알려져 있다. 즉, β-글루코시다아제는 셀룰로오스 분해에 의해 생성되는 셀로비오스의 축적을 대폭 저감할 수 있기 때문에 셀룰로오스 분해 효율을 대폭 향상시킨다는 효과를 갖는다.

셀룰로오스는 초본계 식물, 목본계 식물 중에 많이 포함되고, 이들 식물을 총칭해서 셀룰로오스계 바이오매스라고 부른다. 셀룰로오스계 바이오매스는 셀룰로오스에 추가하여 크실란, 아라비난이라는 헤미셀룰로오스 및 리그닌을 포함하고 있다. 특히, 셀룰로오스계 바이오매스 중에 포함되는 리그닌은 방향족계의 고분자 화합물이기 때문에 사상균유래 셀룰라아제를 사용한 효소 당화에 있어서 저해적으로 작용하는 것이 알려져 있다. 리그닌에 의한 사상균유래 셀룰라아제의 저해 기구에 관해서 모두 해명되어 있는 상황은 아니지만 리그닌에 셀룰라아제가 흡착해서 분해 효율이 저하되는 것이 요인 중 하나라고 말해지고 있다(비특허문헌 1).

내열성 효소는 안정성이 높고, 고온 조건에 있어서도 장기간 활성을 유지하는 점에서 산업용 효소로서의 적용이 검토되고 있다. 이러한 내열성 효소는 호열성 균 또는 초호열성 균이 보유하는 효소 중 보다 많은 그 존재가 확인되어 있다.

내열성의 β-글루코시다아제에 관해서도 수종의 호열성 균 또는 초호열성 균으로부터 동정되어 있고, 구체적으로는 파이로코커스 퓨리오서스(Pyrococcus furiosus), 파이로코커스 호리코시이(Pyrococcus horikoshⅡ), 서모토가 마리티마(Thermotoga maritima), 술포로버스 시바테(Sulfolobus shibatae), 클로스트리듐 써모셀럼(Clostridium thermocellum) 등의 미생물로부터 내열성의 β-글루코시다아제가 동정되어 있다.

사상균유래 셀룰라아제 또는 β-글루코시다아제는 당쇄 수식되어 있는 것이 알려져 있다(비특허문헌 2). 이러한 당쇄가 갖는 일반적인 기능으로서는 단백질의 가용성 향상, 물리적 안정성의 향상, 프로테아제 내성 향상 등의 효과가 알려져 있다(비특허문헌 3). 셀룰라아제 등의 당화 효소의 당쇄를 갖는 기능으로서는 크실라나아제에 N형 당쇄를 부가함으로써 그 발현량이 증대하는 것이 개시되어 있다(특허문헌 1).

WO/2005/093072

Hetti P. 외, Journal of Biotechnology, 107, 65-72(2004) Christian P. 외, Trichoderma and Gliocladium: Basic Biology, Taxonomy and Genetics., vol.1, 121-138(1998) H.Ohba 외, Biosci.Biotech.Biochem., 59, 1581-1583(1995)

본 발명의 목적은 당쇄 부가된 호열성 균유래 변이형 글루코시다아제를 제공하고, 또한 본 글루코시다아제와 셀룰라아제를 혼합함으로써 셀룰로오스, 특히 리그닌을 함유한 리그노셀룰로오스의 가수 분해 공정에 있어서 분해 효율이 높은 효소 조성물을 제공하는 것이다.

본 발명자들은 상기의 목적을 달성하기 위해 예의 연구를 거듭한 결과 당쇄 부가된 호열성 균유래 변이형 글루코시다아제를 셀룰로오스의 분해에 적용할 수 있는 것을 발견했다.

즉, 본 발명은 이하의 기술적 수단으로부터 구성된다.

(1) 선택적으로 당쇄가 부가되어서 이루어지고, 또한 글루코시다아제 활성을 갖는 호열성 균유래 변이형 글루코시다아제의 제조 방법으로서,

(i) 원래 당쇄 부가 서열을 갖지 않는 호열성 균유래 글루코시다아제를 인코딩하는 DNA에 Asn-X-Ser 또는 Asn-X-Thr(X는 프롤린을 제외한 임의의 아미노산)을 인코딩하는 DNA 서열을 도입하여 호열성 균유래 변이형 글루코시다아제를 인코딩하는 DNA를 조제하고, 상기 변이형 글루코시다아제를 인코딩하는 DNA에 분비 시그널 서열을 인코딩하는 DNA 서열을 더 부가하고,

(ⅱ) 상기 분비 시그널 서열을 인코딩하는 DNA 서열이 부가된 상기 변이형 글루코시다아제를 인코딩하는 DNA를 진핵 미생물에 도입하여 상기 변이형 글루코시다아제 DNA에 의해 코딩되는 변이형 글루코시다아제를 분비 단백질로서 발현시키고, 및

(ⅲ) 분비 단백질로서 발현된 변이형 글루코시다아제를 단리·정제하는 것을 포함하는 상기 방법.

(2) (1)에 있어서, 당쇄가 고 만노스형 당쇄인 변이형 글루코시다아제의 제조 방법.

(3) (1) 또는 (2)에 있어서, 호열성 균유래 글루코시다아제가 술포로버스속(Sulfolobus), 서모플라즈마속(Thermoplasma), 칼디비르가속(Caldivirgra), 서모스페라속(Thermosphaera), 파이로코커스속(Pyrococcus), 피크로필러스속(Picrophilus), 칼디비르가속(Caldivirgra), 퍼비도박테리움속(Fervidobacterium)의 군으로부터 선택되는 1종으로부터 유래되는 글루코시다아제인 변이형 글루코시다아제의 제조 방법.

(4) (1) 내지 (3) 중 어느 하나에 있어서, 호열성 균유래 글루코시다아제가

(i) 서열 번호 4, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 또는 서열 번호 20에 기재된 어느 하나의 아미노산 서열과 동일한 아미노산 서열을 포함하거나, 또는

(ⅱ) 서열 번호 4, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 또는 서열 번호 20에 기재된 어느 하나의 아미노산 서열과 85% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 또한 β-글루코시다아제 활성을 갖는 단백질인 글루코시다아제의 제조 방법.

(5) (1) 내지 (4) 중 어느 하나에 있어서, 진핵 미생물이 피키아 파스토리스인 변이형 글루코시다아제의 제조 방법.

(6) (1) 내지 (5) 중 어느 하나에 있어서, 분비 시그널 서열이 α팩터 분비 시그널 서열인 변이형 글루코시다아제의 제조 방법.

(7) (1) 내지 (6) 중 어느 하나에 있어서, 호열성 균유래 변이형 글루코시다아제가 서열 번호 6, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54 또는 서열 번호 56 중 어느 하나로 나타내어지는 아미노산 서열을 포함하는 변이형 글루코시다아제의 제조 방법.

(8) 셀룰라아제 및 (1)～(7) 중 어느 하나의 제조 방법에 의해 얻어진 호열성 균유래 변이형 글루코시다아제를 포함하는 바이오매스 당화용 효소 조성물.

(9) (8)에 있어서, 셀룰라아제가 사상균유래 셀룰라아제 혼합물인 바이오매스 당화용 효소 조성물.

(10) (8) 또는 (9)에 있어서, 사상균유래 셀룰라아제 혼합물이 트리코데르마속유래 셀룰라아제 혼합물인 바이오매스 당화용 효소 조성물.

(11) (8) 내지 (10) 중 어느 하나의 효소 조성물을 사용하는 바이오매스의 가수 분해 방법.

(12) (11)에 있어서, 상기 효소 조성물에 의한 가수 분해물을 한외 여과막을 통해 여과하여 사용 후의 상기 효소 조성물을 분리 회수하는 것을 특징으로 하는 바이오매스의 가수 분해 방법.

본 명세서는 본원의 우선권의 기초인 일본국 특허 출원 2010-044242호의 명세서 및/또는 도면에 기재되는 내용을 포함한다.

(발명의 효과)

본 발명에 의해 얻어지는 당쇄 부가된 호열성 균유래 변이형 글루코시다아제는 셀룰로오스계 바이오매스의 가수 분해에 있어서 셀룰라아제 혼합물에 당쇄 부가가 이루어져 있지 않은 호열성 균유래 글루코시다아제를 사용했을 경우에 비해 높은 셀룰로오스 분해 효율을 얻을 수 있다. 그 효과는 특히 리그노셀룰로오스의 가수 분해에 있어서 현저하다. 또한, 본 발명의 당쇄 부가된 호열성 균유래 변이형 글루코시다아제는 셀룰로오스계 바이오매스, 특히 리그노셀룰로오스 및 한외 여과막에 대한 흡착성이 낮고, 또한 가수 분해물로부터 당액을 분리할 때에 사용하는 한외 여과막에 대한 흡착성이 낮아 가수 분해물로부터의 효소 회수성이 우수하다.

도 1은 실시예 1에 있어서의 서열 번호 4의 파이로코커스 퓨리오서스유래 β-글루코시다아제(PfuBGL)와, 서열 번호 1의 트리코데르마 리세이유래 β-글루코시다아제(TriReBGL) 및 서열 번호 2의 아스페르길루스 니게르유래 β-글루코시다아제(AspNgBGL)의 얼라이먼트를 나타내는 도면이다. 서열 번호 1, 서열 번호 2의 당쇄 부가 서열을 하선으로 나타내고, 또한 서열 번호 4의 당쇄 부가 서열 도입 개소(H60,L61,Y62)에 대해서도 마찬가지로 하선으로 나타냈다.
도 2a는 실시예 2에 있어서의 서열 번호 6의 아미노산 서열(gPfuBGL)과 서열 번호 8(ThAggBGY), 서열 번호 10(CmGHFP), 서열 번호 12(SaBGAL), 서열 번호 14(SsoBGAL), 서열 번호 16(PtBGAL), 서열 번호 18(TvBGAL) 및 서열 번호 20(FnGHFP)의 아미노산 서열의 얼라이먼트 도면이다. 서열 번호 6에 있어서의 도입된 당쇄 부가 서열 Asn-Arg-Thr(N-R-T)을 서열 안의 하선으로 나타냈다. 또한, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 또는 서열 번호 20에 있어서의 서열 번호 6의 당쇄 부가 부위 Asn-Arg-Thr(N-R-T)에 대응하는 개소도 마찬가지로 서열 안의 하선으로 나타냈다.
도 2b는 도 2a의 연속이다.
도 3은 비교예 1에 있어서 조제한 PfuBGL(좌)과 실시예 2에 있어서 조제한 당쇄 부가 변이형 PfuBGL의 EndoH 처리 없음(우) 있음(중앙)에 있어서의 폴리아크릴아미드겔 전기 영동의 밴드패턴을 나타내는 도면이다. 당쇄 부가 변이형 PfuBGL은 EndoH 처리에 의한 분자량의 저하를 확인할 수 있다.
도 4는 실시예 4에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 PfuBGL의 글루코오스 생성량의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 5는 실시예 4에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 당쇄 부가 변이형 PfuBGL의 글루코오스 생성량의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 6은 실시예 5에 있어서의 리그노셀룰로오스 기질에 트리코데르마속유래 셀룰라아제＋당쇄 부가 변이형 PfuBGL 및 트리코데르마속유래 셀룰라아제＋PfuBGL의 효소 조성물을 작용시켰을 경우의 글루코오스 생성량의 변화를 비교한 결과를 나타내는 도면이다. 5wt% 리그노셀룰로오스를 기질로 하고, 반응은 50℃에 있어서 28시간까지 행하고, 적당히 샘플링해서 생성한 글루코오스 농도의 측정을 행했다. 효소 첨가량은 셀룰라아제 0.5㎎/㎖, 글루코시다아제 0.005㎎/㎖(셀룰라아제의 1/100량)이다.
도 7은 N형 당쇄의 기본 구조를 나타내는 도면이다. 호열성 균유래 글루코시다아제의 Asn 측쇄에 대하여 2개의 N-아세틸글루코사민, 3개의 만노스가 더 결합한 구조를 기본 구조로 한다.
도 8은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 AggBGY의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 9는 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 당쇄 부가 변이형 AggBGY의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 10은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 CmGHFP의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 11은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 당쇄 부가 변이형 CmGHFP의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 12는 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 SaBGAL의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 13은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 당쇄 부가 변이형 SaBGAL의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 14는 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 SsoBGAL의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 15는 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 당쇄 부가 변이형 SsoBGAL의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 16은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 PtBGAL의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 17은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 당쇄 부가 변이형 PtBGAL의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 18은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 TvBGAL의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 19는 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 당쇄 부가 변이형 TvBGAL의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 20은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 FnGHFP의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.
도 21은 실시예 12에 있어서의 50～90℃의 보온 시간에 따라 셀로비오스 분해에 있어서의 당쇄 부가 변이형 FnGHFP의 잔존 활성(보온 0시간에 대한 상대값)의 변화를 측정하여 효소의 열안정성을 평가한 결과를 나타내는 도면이다.

이하에 본 발명을 상세하게 설명한다.

본 발명에 있어서의 「글루코시다아제」란 β-글리코시드 결합을 한 2당을 가수 분해하는 활성(즉, β-글루코시다아제 활성)을 갖는 효소이다. EC 번호: EC 3.2.1.21로서 β-글루코시다아제에 귀속되는 효소군이 기재되어 있지만 본 발명에서는 EC 번호에 있어서 β-글루코시다아제에 귀속되지 않지만 상기 β-글루코시다아제 활성을 갖는 단백질도 글루코시다아제에 포함되는 것으로 한다. 예를 들면, 갈락토시다아제, 만노시다아제, 글루코시드 결합 가수 분해 효소 패밀리 단백질 등을 들 수 있다.

본 발명에 있어서의 호열성 균이란 50℃ 이상에서 생육 가능한 미생물군의 총칭이며, 또한 특히 초호열성 균이란 80℃ 이상에서 생육 가능한 미생물군을 나타낸다. 상기 호열성 균으로서는 술포로버스속(Sulofolobus), 서모플라즈마속(Thermoplasma), 칼디비르가속(Caldivirgra), 서모스페라속(Thermosphaera), 파이로코커스속(Pyrococcus), 피크로필러스속(Picrophilus), 칼디비르가속(Caldivirgra), 퍼비도박테리움속(Fervidobacterium) 등을 예시할 수 있다.

호열성 균유래 글루코시다아제는 공지이며, 예를 들면 GenBank 등에 NP_577802로서 등록되어 있고, 본 발명에 있어서는 이들을 이용할 수 있다. 바람직하게는 호열성 균유래 글루코시다아제는 서열 번호 4, 8, 10, 12, 14, 16, 18 및 20으로 나타내어지는 아미노산 서열을 포함한다. 더욱 바람직하게는 호열성 균유래 글루코시다아제는 서열 번호 4, 8, 10, 12, 14, 16, 18 및 20으로 나타내어지는 아미노산 서열로 이루어진다. 본 발명에 있어서 호열성 균유래 글루코시다아제에는 서열 번호 4, 8, 10, 12, 14, 16, 18 및 20으로 나타내어지는 아미노산 서열에 있어서 1 또는 복수개 또는 1 또는 몇 개의 아미노산의 결실, 치환, 부가 또는 삽입을 갖고, 또한 β-글루코시다아제 활성을 갖는 단백질도 포함된다. 여기서 「1 또는 몇 개」의 범위는 특별히 한정되지 않지만, 예를 들면 10개 이내, 더욱 바람직하게는 5개 이내, 특히 바람직하게는 4개 이내 또는 1개 또는 2개이다. 또한, 본 발명에 있어서 호열성 균유래 글루코시다아제에는 서열 번호 4, 8, 10, 12, 14, 16, 18 및 20으로 나타내어지는 아미노산 서열과 BLAST(Basic Local Alig㎚ent Search Tool at the National Center for Biological Information(미국 국립 생물학 정보 센터의 기본 로컬 얼라이먼트 검색 툴)) 등(예를 들면, 디폴트, 즉 초기 설정의 파라미터)을 사용해서 계산했을 때에 85% 이상, 보다 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 바람직하게는 상기 아미노산열로 이루어지고, 또한 β-글루코시다아제 활성을 갖는 단백질도 포함된다. 여기서 「동일성」이란 2개의 아미노산 서열에 갭을 도입하거나 또는 갭을 도입하지 않고 정렬시켰을 경우의 최적인 얼라이먼트에 있어서 오버랩되는 전체 아미노산 잔기에 대한 동일 아미노산 및 유사 아미노산 잔기의 비율(퍼센티지)을 의미한다. 동일성은 당업자에게 주지의 방법, 서열 해석 소프트웨어 등(예를 들면, BLAST, FASTA 등의 공지의 알고리즘)을 사용해서 구할 수 있다. 「β-글루코시다아제 활성」이란 위에 정의한 바와 같으며, 상기 활성의 측정은 예를 들면 50mM 아세트산-아세트산 나트륨 완충액(pH 5.0)에 용해한 셀로비오스의 기질 용액에 효소액을 첨가하고, 30～85℃에서 30분간 반응한 후 필요에 따라 pH를 변화시키는 등 해서 반응을 정지시킨 후 글루코오스 정량 키트를 사용해서 반응액 중의 글루코오스 농도를 정량함으로써 행할 수 있다.

본 발명에 있어서 「호열성 균유래 글루코시다아제」에는 천연에 그 아미노산 서열 중에 당쇄 부가 서열을 갖는 것은 포함되지 않고, 천연에 당쇄 부가 서열을 갖고 있지 않은 것에 한정된다.

본 발명에서 말하는 「당쇄」란 단당이 글리코시드 결합으로 연결한 구조를 갖고, 그 당쇄의 말단은 호열성 균유래 글루코시다아제의 펩티드 서열 중의 아미노산 측쇄와 공유 결합하고 있다. 「당쇄」의 유무는 일반적으로 알려져 있는 과요오드산-시프 염기(periodic acid-Schiff base:PAS) 반응에 의해 SDS 전기 영동 등 분리된 글루코시다아제를 염색함으로써 확인할 수 있다.

당쇄는 주로 아스파라긴의 측쇄와 결합하는 N형 당쇄와, 세린, 트레오닌의 측쇄와 결합하는 O형 당쇄로 분류되지만 N형 당쇄인 것이 바람직하다. N형 당쇄로서는 아스파라긴 측쇄에 대하여 2개의 N-아세틸글루코사민, 3개의 만노스를 기본 골격으로 한 구조를 예시할 수 있다(도 7). 이러한 기본 구조에 대하여 효소 작용에 의해 당분자가 더 결합함으로써 다양한 당쇄 구조를 구성한다. 당쇄 구조는 숙주로 하는 미생물의 종류, 그 숙주의 배양 조건 등에 따라 변화된다. 당쇄 부가된 호열성 균유래 글루코시다아제란 여러 가지 당쇄 구조가 부가된 조성물을 나타낸다.

호열성 균유래 글루코시다아제에 결합한 당쇄가 N형이거나 O형인지의 확인은 예를 들면 글루코시다아제에 대하여 N형 당쇄의 말단 부분을 특이적으로 가수 분해하는 N-글리카나아제와 O형 당쇄의 말단 부분을 특이적으로 가수 분해하는 O-글리카나아제를 각각 작용시키고, 그 후 SDS 전기 영동을 행하여 그 분자량의 변화를 비교함으로써 확인할 수 있다. 여기서 사용하는 N-글리카나아제로서는 플라보박테리움 메닝고셉티쿰(Flavobacterium meningosepticum)유래 N-글루코시다아제F(PNGaseF), 스트렙토마이세스 플리카투스(Streptomyces plicatus)유래 엔드-β-N-아세틸글루코사미니다아제 등을 사용할 수 있다. 또한, O-글리카나아제로서는 스트렙토코커스(Streptococcus)유래 엔드-α-N-아세틸갈락토사미니다아제 등을 사용할 수 있다.

본 발명의 변이형 글루코시다아제에 있어서의 당쇄는 고 만노스형인 것이 바람직하다. 여기서 말하는 고 만노스형은 N형 당쇄 중 당쇄를 구성하는 N-아세틸글루코사민 또는 글루코사민 2개에 대하여 만노스가 4개 이상 연결한 당쇄의 것을 나타낸다. 만노스 이외의 당으로서 글루코오스 등의 다른 단당이 포함되어 있어도 좋다. 글루코오스가 포함될 경우는 통상 고 만노스형의 만노스의 비환원 말단 부분에 결합하고 있다.

고 만노스형 이외의 N형 당쇄로서 복합형 당쇄를 예시할 수 있다. 복합형에서는 만노스, N-아세틸글루코사민 이외의 당으로서 프룩토오스, 시알산 등의 다종의 당을 구성 성분으로서 포함하는 특징을 갖는다. 고 만노스형에 비해 당쇄에 포함되는 N-아세틸글루코사민의 비율이 증가하여 N-아세틸글루코사민 2개에 대한 만노스의 비율은 3개 이하가 된다.

N형 당쇄가 고 만노스형인지 혼합형인지의 확인은 예를 들면 전기 영동한 글루코시다아제를 PVDF막에 전사하고, 당쇄 특이적인 렉틴과 반응시켜 그 발색에 의해 행할 수 있다. 여기서 사용하는 당쇄 특이적인 렉틴으로서는 예를 들면 바이오틴, HRP 표식을 행한 작두콩 렉틴(ConA), 피마자 렉틴(RCA120), 울렉스 유로패우스 렉틴(UEA-1), 피넛 렉틴(PNA) 등을 사용할 수 있다. ConA로 염색할 수 있으면 N형 당쇄 중 고 만노스형으로 확인할 수 있고, RCA120으로 염색되면 N형 당쇄 혼합형으로 확인할 수 있다. 또한, 다른 판정 방법으로서 충분히 정제된 글루코시다아제로부터 당쇄 구성당을 분리하고, 분리된 당을 MALDI-TOF/MS 또는 HPLC로 분석해서 구성하는 단당 성분을 정량함으로써 당쇄 구조를 확인할 수 있다.

「당쇄 부가 서열」이란 진핵 생물에 의해 발현·번역될 때에 당쇄 부가 수식을 받는 부위의 아미노산 서열을 나타낸다.

당쇄 부가 서열은 예를 들면 N결합형 당쇄의 콘센서스 서열인 Asn-X-Ser 또는 Asn-X-Thr(X는 프롤린을 제외한 임의의 아미노산)이나 O결합형 당쇄의 콘센서스 서열인 Cys-X-Ser-X-Pro-Cys(X는 프롤린을 제외한 임의의 아미노산)를 들 수 있지만 그들에 한정되지 않는다. 바람직하게는 N결합형 당쇄의 콘센서스 서열이다. 여기서 프롤린을 제외한 임의의 아미노산 X로서는 Gly, Ala, Val, Leu, Ile, Phe, Tyr, Trp, Met, Cys, Ser, Thr, Asp, Glu, His, Lys, Arg, Asn, Gln을 들 수 있다.

본 발명에 있어서의 당쇄 부가된 호열성 균유래 변이형 글루코시다아제(이하, 「변이형 글루코시다아제」라고 칭한다)란 상기 호열성 균유래 글루코시다아제의 아미노산 서열에 상기 당쇄 부가 서열을 구성하는 아미노산 서열이 도입된 변이형 글루코시다아제로서, 상기 아미노산 서열에 선택적으로 당쇄가 부가된 것이다. 도입되는 당쇄 부가 서열은 1개이어도 2개 이상이어도 좋고, 그 종류는 모두 같아도 복수종의 당쇄 부가 서열이 포함되어 있어도 좋다.

당쇄 부가 서열의 도입 개소는 상기 도입에 의해 본래의 효소 활성이 소실되지 않는 위치를 선택하는 것이 바람직하다. 이러한 당쇄 부가 서열의 도입 개소의 결정 방법으로서는 이하의 순서 1), 순서 2)로 실시할 수 있다.

순서 1) 원래 당쇄 부가 서열을 갖는 사상균유래 글루코시다아제와 원래 당쇄 부가 서열을 갖지 않는 호열성 균유래 글루코시다아제의 아미노산 서열 얼라이먼트 해석을 행하여 사상균유래 글루코시다아제의 당쇄 부가 서열의 호열성 균유래 글루코시다아제에 있어서의 상대적인 위치 관계를 명확히 하고, 당쇄 부가 서열의 도입 개소를 특정한다. 얼라이먼트 툴로서는 ClustalW 등의 다수의 잘 알려진 소프트웨어를 사용할 수 있다. 원래 당쇄 부가 서열을 갖는 사상균유래 글루코시다아제란 바람직하게는 트리코데르마속유래 글루코시다아제 또는 아스페르길루스속유래 글루코시다아제이다. 이들의 사상균유래 글루코시다아제의 아미노산 서열은 공지이며, 바람직하게는 서열 번호 1에 기재된 아미노산 서열을 포함하는 트리코데르마 리세이유래 β-글루코시다아제 또는 서열 번호 2에 기재된 아미노산 서열을 포함하는 아스페르길루스·니게르로유래 β-글루코시다아제를 이용한다.

순서 2) 이어서 상기 얼라이먼트 해석에 의해 특정된 호열성 균유래 글루코시다아제의 당쇄 부가 서열의 도입 개소가 효소 표면에 존재하는지 확인한다. 효소 표면에 있는지의 여부는 목적의 호열성 균유래 글루코시다아제의 결정 구조를 사용해서 알 수 있다. 이러한 결정 구조는 기지의 것이면 단백질 정보 은행(Protein Data Bank) 등의 데이터 베이스로부터 취득하는 것이 가능하다. 또한, 실제로 X선 결정 구조 해석 등을 행하여 결정 구조를 취득해도 좋다.

본 발명에서는 상기 순서 1), 순서 2)에 따라 당쇄 부가 서열의 도입 개소를 선정하는 것이 바람직하지만 다른 방법으로서 하기의 순서 3), 순서 4)에 따라 선정할 수도 있다.

순서 3) ASA(Accessible Surface Area; 용매 노출 표면적) 해석 소프트웨어를 사용해서 아미노산 잔기의 ASA(Å²)를 구하고, 그 값으로부터 호열성 균유래 글루코시다아제의 표면 부근에 노출한 아미노산 잔기를 선정한다. 각 아미노산 잔기의 ASA는 예를 들면 AREAIMOL(ccp4 package)(UK Science and Engineering Research Council의 CCP4(Collaborative Computing Project Number 4), SURFace(Barry Honig's group, the De㎩rtment of Biochemistry and Molecular Biophysics and Center of Computational Biology and Bioinformatics of Columbia), ASAP(Institute for Molecular Bioscience, University of Queensland and the ARC Centre in Bioinformatics) 등의 웹사이트로부터 입수 가능한 ASA 해석 소프트웨어를 사용함으로써 산출할 수 있다. 산출된 ASA가 1Å² 이상인 아미노산 잔기이면 표면에 노출하고 있는 잔기로 여겨지고, 당쇄 부가 서열의 도입 개소로서는 ASA가 2Å² 이상인 아미노산 잔기를 선택하는 것이 바람직하다. 특히, N결합형 당쇄의 콘센서스 서열인 3아미노산 잔기(Asn-X-Ser 또는 Asn-X-Thr: X는 프롤린을 제외한 임의의 아미노산)를 도입하기 위해서는 ASA가 2Å² 이상인 아미노산 잔기가 3잔기 이상 연속하는 부위를 선택하는 것이 보다 바람직하다.

순서 4) 상기 순서 3에서 선택된 호열성 균유래 글루코시다아제의 당쇄 부가 서열 도입 개소 중 호열성 균유래 글루코시다아제의 효소 활성 부위로부터 충분히 거리를 갖고 있고, 당쇄 부가 서열 도입에 의해 효소 활성 저하의 우려가 없는 개소를 선택한다. 효소 활성 부위로부터의 거리는 상기 마찬가지로 목적의 호열성 균유래 글루코시다아제의 결정 구조를 사용해서 알 수 있다. 구체적으로는 효소 활성 부위로부터 3.5Å 이내의 거리에 있는 아미노산 잔기를 제외하고, 이것보다 거리가 떨어져 있는 아미노산 잔기를 선택하는 것이 바람직하다.

예를 들면, 서열 번호 4의 아미노산 서열로 나타내어지는 PfuBGL에 대해서 상기 순서 3), 순서 4)를 적용하면 이하와 같이 된다. 우선 AREAIMOL(ccp4 package)을 사용해서 용매 분자 1.4Å을 전제로 ASA를 산출하고, ASA가 2Å² 이상인 아미노산 잔기를 추출한다(표 1(ⅰ)). 이어서, ASA가 2Å² 이상인 아미노산 잔기가 3잔기 이상 연속하는 부위를 추출한다 (표 1(ⅱ)). 또한, PfuBGL의 결정 구조 정보로부터 효소 활성 부위로부터의 거리가 3.5Å 이하인 아미노산 잔기를 특정해서(S13, R78, N207, I263, I303, G304, V305, N306, Y307, S343, D344, L367, I370, I371, T372, D378, R384, Y387, H391, D404, V405, R406, N407, Y408, L409, H410, W411, F427의 23잔기) 이들을 제외한다. 이상의 결과 당쇄 부가 서열 도입 개소로서 선정할 수 있다(표 1(ⅲ)).

당쇄 부가 서열의 도입 개소는 1개소 또는 2～5개소인 것이 바람직하다.

본 발명에서 말하는 도입이란 상기 당쇄 부가 서열이 폴리펩티드로서 번역되는 것을 나타낸다. 즉, 호열성 균유래 글루코시다아제의 본래의 아미노산 서열에 있어서 상술한 당쇄 부가 서열이 기존의 아미노산 서열과 치환되는 것이어도 좋고, 또한 기존의 아미노산 서열에 삽입된 것이어도 좋다. 즉, 치환의 경우는 변이 전에 대하여 폴리펩티드 길이는 변화되지 않지만 삽입의 경우에는 삽입한 당쇄 부가 서열의 길이만큼 폴리펩티드 길이가 증가한다. 단, 당쇄 부가 서열의 도입은 효소 활성의 유지라는 점에서 기존의 아미노산 서열과의 치환인 것이 바람직하다.

또한, 도입되는 당쇄 부가 서열은 상기 당쇄 부가 서열 중 어느 하나를 채용해도 좋고, X는 프롤린을 제외한 임의의 아미노산이면 모두 사용할 수 있지만 변이 도입에 의한 영향이 작다고 예상되는 당쇄 부가 서열 및 아미노산을 선택해야 한다. 예를 들면, 아미노산의 치환이면 보존적 아미노산 치환이 바람직하다. 보존적 아미노산 치환은 전기적 성질, 구조적 성질, 극성 또는 소수성 등이 유사한 아미노산간의 치환이며 이러한 유사 아미노산에 의한 치환은 단백질의 표현형에 변화를 초래하지 않는 것이 예측된다. 예를 들면, 염기성 아미노산(Lys, Arg, His), 산성 아미노산(Glu, Asp), 방향족 아미노산(Trp, Phe, Tyr, His), 분기쇄 아미노산(Val, Ile, Thr), 극성 아미노산(Ser, Thr, Tyr, Cys, Met, Gln, Asn, Gly), 소수성 아미노산(Ala, Val, Leu, Ile) 등을 들 수 있다.

일형태에 있어서 상기 방법을 사용해서 파이로코커스 퓨리오서스유래 β-글루코시다아제의 아미노산 서열(서열 번호 4)에 있어서의 당쇄 부가 서열의 도입 개소는 H60-L61-Y62로 특정할 수 있다(도 1).

또한, 본 발명에서는 상술한 방법으로 당쇄 부가 서열의 도입 개소를 결정한 호열성 균유래 글루코시다아제의 아미노산 서열을 이용해서 상기 아미노산 서열과 높은 아미노산 서열 동일성을 갖는 다른 호열성 균유래 글루코시다아제에 대해서도 당쇄 부가 서열의 도입 개소를 결정할 수 있다. 예를 들면, 서열 번호 4에 기재된 파이로코커스 퓨리오서스유래 β-글루코시다아제에 관해서 상술한 방법으로 당쇄 부가 서열의 도입 개소를 결정한 후 상기 서열 번호 4에 기재된 β-글루코시다아제와 높은 동일성을 갖는 아미노산 서열을 포함하는 다른 효소와 얼라이먼트 해석을 행하여 다른 효소의 아미노산 서열상 서열 번호 4에 있어서 결정된 도입 개소(예를 들면, H60-L61-Y62)에 대응하는 위치를 당쇄 부가 서열의 도입 개소로서 결정할 수 있다. 서열 번호 4에 기재된 β-글루코시다아제와 높은 동일성을 갖는 아미노산 서열을 포함하는 다른 효소로서 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 및 서열 번호 20에 나타내어지는 아미노산 서열을 포함하는 효소를 예시할 수 있다.

일형태에 있어서 상기 방법을 사용해서 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 및 서열 번호 20에 나타내어지는 아미노산 서열에 있어서의 당쇄 부가 서열의 도입 개소는 각각 N60-L61-N62, D60-L61-Y62, G61-N62-Y63, G61-N62-Y63, D58-L59-Y60, N63-N64-Y65 및 K63-Q64-Y65로 특정할 수 있다(도 2a, 도 2b).

일형태에 있어서 본 발명에 있어서의 변이형 글루코시다아제는 예를 들면 서열 번호 6에 나타내어지는 아미노산 서열을 포함한다. 바람직하게는 본 발명에 있어서의 변이형 글루코시다아제는 예를 들면 서열 번호 6에 나타내어지는 아미노산 서열로 이루어진다.

본 발명에 있어서 글루코시다아제 활성이란 셀로비오스 분해 활성을 말한다. 즉, 셀로비오스를 기질로 했을 때 이것을 가수 분해하여 글루코오스를 생성시키는 반응을 촉매하는 활성이다. 본 발명의 변이형 글루코시다아제는 야생형 글루코시다아제에 있어서의 셀로비오스 분해 활성에 대하여 바람직하게는 40% 이상, 보다 바람직하게는 50% 이상, 더욱 바람직하게는 60% 이상, 특히 바람직하게는 70% 이상의 활성을 보유한다. 셀로비오스 분해 활성은 예를 들면 10mM 셀로비오스/50mM 아세트산 완충액에 대하여 변이형 글루코시다아제 또는 야생형 글루코시다아제를 첨가하고, 50℃에서 효소 반응을 행하여 생성된 글루코오스량을 측정함으로써 야생형에 대한 본 발명의 변이형 글루코시다아제의 활성을 평가할 수 있다. 여기서 생성된 글루코오스는 효소법, HPLC법 등 공지의 방법에 준해서 정량할 수 있다.

본 발명에 있어서의 변이형 글루코시다아제는 어느 방법에 의해 얻어지는 것이어도 좋지만 도입된 당쇄 부가 서열에 선택적으로 당쇄가 부가되기 위해서는 변이형 글루코시다아제를 인코딩하는 DNA를 포함하는 진핵 세포를 배양함으로써 제공되는 것이 바람직하다.

변이형 글루코시다아제를 인코딩하는 DNA는 이하의 방법에 따라 제작할 수 있다. 즉, 호열성 균유래 글루코시다아제의 아미노산 서열에 있어서 상기의 방법에 의해 당쇄 부가 서열의 도입 개소를 결정한 후 상기 글루코시다아제를 인코딩하는 DNA 중 상기 도입 개소에 대응하는 염기 서열 부위에 당쇄 부가 서열을 인코딩하는 DNA를 도입함으로써 행한다. 여기서 「DNA」에는 cDNA, 게놈 DNA, 유전자 등 상기 글루코시다아제 또는 상기 당쇄 부가 서열을 인코딩하는 임의의 핵산이 포함된다.

호열성 균유래 글루코시다아제를 인코딩하는 DNA로서는 상기 호열성 균유래 글루코시다아제를 인코딩하는 DNA, 예를 들면 서열 번호 3, 7, 9, 11, 13, 15, 17 및 19에 나타내어지는 염기 서열을 포함하고, 바람직하게는 상기 염기 서열로 이루어지는 DNA를 들 수 있다. 또한, 호열성 균유래 글루코시다아제를 인코딩하는 DNA에는 서열 번호 3, 7, 9, 11, 13, 15, 17 및 19에 나타내어지는 염기 서열과 상보적인 염기 서열로 이루어지는 DNA와 스트린젠트한 조건 하에서 하이브리다이즈 가능한 염기 서열을 포함하고, 바람직하게는 상기 염기 서열로 이루어지고, 또한 β-글루코시다아제 활성을 갖는 단백질을 인코딩하는 DNA도 포함된다. 스트린젠트 조건은 저스트린젠트 조건, 중스트린젠트 조건 또는 고스트린젠트 조건 중 어느 것이어도 좋다. 이러한 조건은 예를 들면 2～5×SSC, 0.2％ SDS(여기서 1×SSC는 150mM 염화나트륨, 15mM 시트르산 나트륨, pH 7.0을 나타낸다) 중 45～70℃에서의 하이브리다이제이션을 행한 후 0.1～1×SSC, 0.1～0.2％ SDS를 사용해서 45～65℃에서 세정을 행하는 것을 포함한다. 스트린젠트 조건은 예를 들면 Sambrook 외, Molecular Cloning, A Laboratory Manual, 2nd edition, 1989, Cold Spring Harbor Laboratory Press 등에 기재되어 있다. 또한, 호열성 균유래 글루코시다아제를 인코딩하는 DNA에는 서열 번호 3, 7, 9, 11, 13, 15, 17 및 19에 나타내어지는 염기 서열에 있어서 1 또는 복수개 또는 1 또는 몇 개의 염기의 결실, 치환, 부가 또는 삽입을 갖고, 또한 β-글루코시다아제 활성을 갖는 단백질을 인코딩하는 DNA도 포함된다. 여기서 「1 또는 몇 개」의 범위는 특별하게는 한정되지 않지만 예를 들면 10개 이내, 더욱 바람직하게는 5개 이내, 특히 바람직하게는 4개 이내, 또는 1개 또는 2개이다. 또한, 호열성 균유래 글루코시다아제를 인코딩하는 DNA에는 서열 번호 3, 7, 9, 11, 13, 15, 17 및 19에 나타내어지는 염기 서열과 BLAST 등(예를 들면, 디폴트, 즉 초기 설정의 파라미터)을 사용해서 계산했을 때에 85% 이상, 보다 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 동일성을 갖는 염기 서열을 포함하고, 바람직하게는 상기 염기 서열로 이루어지고, 또한 β-글루코시다아제 활성을 갖는 단백질을 인코딩하는 DNA도 포함된다.

당쇄 부가 서열을 인코딩하는 DNA로서는 상기 당쇄 부가 서열을 인코딩하는 DNA를 들 수 있고, 숙주 생물이나 유전 암호의 축중(縮重) 등을 고려해서 적당히 결정할 수 있다.

당쇄 부가 서열을 인코딩하는 DNA는 예를 들면 부위 특이적 돌연변이 유발법, PCR에 의한 특이적 변이 도입법 등의 공지의 방법에 의해 글루코시다아제를 인코딩하는 DNA로 도입할 수 있다(Sambrook 외, 상기).

일형태에 있어서 변이형 글루코시다아제를 인코딩하는 DNA로서는 서열 번호 5에 나타내어지는 염기 서열을 포함하는 DNA를 들 수 있다. 바람직하게는 변이형 글루코시다아제를 인코딩하는 DNA로서는 서열 번호 5에 나타내어지는 염기 서열로 이루어지는 DNA를 들 수 있다. 서열 번호 5에 있어서 당쇄 부가 서열을 인코딩하는 DNA는 178-186 위치에 -aaccgcact-로서 도입되어 있다.

또한, 숙주에 맞는 분비 시그널 서열을 인코딩하는 DNA를 상기 변이형 글루코시다아제에 인코딩하는 DNA에 부가해도 좋다. 분비 시그널 서열은 변이형 글루코시다아제에 인코딩하는 DNA의 5' 말단측, 3' 말단측에 적당히 부가할 수 있지만 바람직하게는 5' 말단측에 부가한다. 분비 시그널 서열을 인코딩하는 DNA는 미리 발현 벡터에 장착되어 있어도 좋다. 예를 들면, 숙주가 효모인 경우 α팩터 시그널 서열, α-아밀라아제 시그널 서열, 글루코아밀라아제 시그널 서열, 혈청 알부민 시그널 서열, 이눌리나아제유래 시그널 서열, 인베르타아제 시그널 서열, 킬러 단백질 시그널 서열, 라이소자임 시그널 서열 등이 사용된다. 특히, 피키아 파스토리스에서는 α팩터 분비 시그널 서열이 바람직하다. α팩터 분비 시그널 서열은 공지이며, 예를 들면 젠뱅크(GenBank) 등에 NP_015137로서 등록되어 있고, 본 발명에 있어서는 이들을 이용할 수 있다.

숙주로서 트리코데르마속을 사용할 경우는 셀룰라아제 관련 시그널 서열을 사용할 수 있다. 트리코데르마속은 셀룰라아제로서 셀로비오하이드라아제, 크실라나아제, 엔도글루카나아제, 자일로시다아제, 크실로글루카나아제 등을 세포 외로 분비하는 특징을 갖고 있고, 이들의 효소는 각각 분비 시그널 서열을 갖고 있다. 이러한 시그널 서열은 공지이며, 이들의 시그널 서열을 포함하는 펩티드 서열을 변이형 글루코시다아제에 대하여 기능적으로 연결해서 사용할 수 있다.

상기와 같이 해서 조제한 진핵 세포에 의한 당쇄 부가를 받을 수 있는 1 이상의 당쇄 부가 서열을 포함하는 변이형 글루코시다아제를 인코딩하는 DNA를 제한 효소 및 DNA 리가아제를 사용해서 적당한 발현 벡터 중의 프로모터 하류에 연결함으로써 상기 DNA를 포함하는 발현 벡터를 제조할 수 있다.

발현 벡터로서는 세균 플러스미드, 효모 플러스미드, 파지 DNA(람다 파지 등), 레트로바이러스, 바큐로바이러스, 백시니아바이러스, 아데노바이러스 등의 바이러스 DNA, SV40의 유도체 등 식물 세포용 벡터로서의 아구로박테리움 등을 들 수 있지만 숙주 세포에 있어서 복제 및 생존 가능하며 또한 당쇄 부가가 가능한 한 다른 어느 벡터를 사용할 수 있다. 예를 들면, 숙주가 효모인 경우 pPink-HC, pPink-LC, pPinkα-HC, pPCIZ, pPCIZα, pPCI6, pPCI6α, pFLD1, pFLD1α, pGAPZ, pGAPZα, pPIC9K, pPIC9 등을 들 수 있다.

프로모터로서는 유전자의 발현에 사용하는 숙주에 대응해서 적절한 프로모터이면 어느 것이어도 좋다. 구성적인 프로모터, 유도적인 프로모터 중 어느 것이어도 좋다. 예를 들면, 숙주가 효모인 경우 AOX1 프로모터, TEF1 프로모터, ADE2 프로모터, CYC1 프로모터, GAL-L1 프로모터, AOX2 프로모터, YPT1 프로모터, GAP 프로모터, FLD 프로모터 등을 들 수 있다.

본 발명에 사용하는 숙주 세포로서는 당쇄 부가 기구를 갖는 것이면 어느 숙주 세포이어도 좋지만, 예를 들면 효모 세포, 진균 세포, 곤충 세포, 식물 세포, 동물 세포 등이 바람직하다. 효모 세포로서는 예를 들면 피키아속(Pichia), 사카로미세스속(Saccharomyces), 스키조사카로마이세스속(Schizosaccharomyces) 등을 들 수 있다. 진균 세포로서는 아스페르길루스속(Aspergillus), 트리코데르마속(Trichoderma) 등을 들 수 있다. 곤충 세포로서는 Sf9 등, 식물 세포로서는 쌍떡잎 식물 등, 동물 세포로서는 CHO, HeLa, HEK293 등을 들 수 있다. 보다 바람직하게는 효모 세포이며, 더욱 바람직하게는 피키아 파스토리스이다.

형질 전환 또는 트랜스펙션은 인산 칼슘법, 전기 천공법 등의 공지의 방법으로 행할 수 있다. 변이형 글루코시다아제는 상기한 바와 같이 형질 전환 또는 트랜스펙트된 숙주 세포에 있어서 프로모터의 제어 하에서 발현시켜서 산생한 변이형 글루코시다아제를 회수해서 얻을 수 있다. 발현에 있어서는 숙주 세포를 적절한 세포 밀도까지 증식 또는 성장시킨 후 온도 시프트 또는 이소프로필-1-티오-β-D-갈락토시드(IPTG) 첨가 등의 화학적 유발 수단에 의해 프로모터를 유발시켜 세포를 일정 기간 더 배양한다.

변이형 글루코시다아제가 세포 외로 배출될 경우에는 배지로부터 직접적으로, 또한 세포 외에 존재할 경우에는 초음파 파쇄나 기계적 파쇄 등의 물리적 수단 또는 세포 용해제 등의 화학적 수단에 의해 세포를 파괴한 후에 변이형 글루코시다아제를 정제한다. 변이형 글루코시다아제는 재조합 세포의 배지로부터 황산 암모늄 또는 에탄올 침전, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 역상 고속 액체 크로마토그래피, 친화성 크로마토그래피, 겔 여과 크로마토그래피, 전기 영동 등의 기술을 조합해서 부분적으로 또는 완전히 정제할 수 있다.

본 발명의 변이형 글루코시다아제는 셀룰로오스계 바이오매스의 가수 분해에 있어서 셀룰라아제 혼합물에 당쇄 부가가 이루어져 있지 않은 호열성 균유래 글루코시다아제를 사용했을 경우에 비해 높은 열안정성을 갖고, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배 또는 그 이상의 높은 셀룰로오스 분해 효율을 얻을 수 있다. 본 발명의 변이형 글루코시다아제는 셀룰로오스계 바이오매스로서 리그닌 성분을 포함하는 셀룰로오스계 바이오매스, 리그닌 성분을 거의 포함하지 않는 아비셀, 솔카플록, 공업용 펄프 등에 적용할 수 있지만 특히 리그닌 성분을 포함하는 셀룰로오스계 바이오매스에 있어서 현저한 셀룰로오스 분해 효율을 얻을 수 있다.

상기와 같이 해서 취득된 변이형 글루코시다아제는 셀룰라아제와 혼합함으로써 바이오매스 당화용 효소 조성물로서 사용할 수 있다. 여기서 말하는 셀룰라아제란 셀룰로오스를 분해하는 활성을 갖는 효소이면 특별히 한정되지 않고, 1종류 이상의 혼합물이어도 좋다. 이러한 효소로서는 예를 들면 셀룰라아제, 헤미셀룰라아제, 셀로비오하이드라아제, 엔도글루카나아제, 엑소글루카나아제, 크실라나아제, 만나나아제 등을 들 수 있다.

본 발명에서 사용하는 셀룰라아제는 바람직하게는 사상균유래 셀룰라아제 혼합물이다. 사상균유래 셀룰라아제 혼합물은 적어도 엔도글루카나아제 및 셀로비오하이드라아제의 쌍방을 포함해서 이루어지는 혼합물이다. 또한, 효율적인 셀룰로오스의 당화를 행하기 위해서는 엔도글루카나아제에 관해서 2종 이상 및/또는 셀로비오하이드라아제에 관해서 2종 이상 포함해서 이루어지는 사상균유래 셀룰라아제 혼합물인 것이 바람직하다. 상기 사상균 셀룰라아제 혼합물을 생산하는 미생물로서 트리코데르마속(Trichoderma), 아스페르길루스속(Aspergillus), 셀룰로모나스속(Cellulomonas), 클로스트리듐속(Clostridium), 스트렙토마이세스속(Streptomyces), 후미콜라속(Humicola), 아크레모늄속(Acremonium), 이르펙스속(Irpex), 무코르속(Mucor), 탈라로마이세스속(Talaromyces) 등의 미생물을 들 수 있다. 이들 미생물은 배양액 중에 셀룰라아제를 산생하기 때문에 그 배양액을 미정제의 사상균 셀룰라아제 혼합물로서 그대로 사용해도 좋고, 또한 배양액을 정제하여 제제화한 것을 사상균 셀룰라아제 혼합물로서 사용해도 좋다. 사상균 셀룰라아제 혼합물로서 동시에 미생물이 산생된 β-글루코시다아제가 포함되는 경우도 있지만 셀룰로오스 분해에 있어서 양적으로 충분량 존재하지 않는 것, 후술의 파이로코커스속유래 β-글루코시다아제와 명확히 구별하는 것이 가능한 점에서 본 발명에서는 셀룰라아제 생산 미생물로부터 유래되는 β-글루코시다아제는 셀룰라아제에 포함되는 것으로 한다. 상기 배양액으로부터 사상균 셀룰라아제 혼합물을 정제하여 제제화한 것으로서 사용할 경우 프로테아제 조해제, 분산제, 용해 촉진제, 안정화제 등 효소 이외의 물질을 첨가한 것을 셀룰라아제 제제로서 사용해도 좋다.

본 발명에서 사용하는 사상균 셀룰라아제 혼합물은 트리코데르마속이 산생하는 셀룰라아제 혼합물인 것이 바람직하다. 트리코데르마속은 적어도 2종 이상의 엔도글루카나아제 및 적어도 2종 이상의 셀로비오하이드라아제를 포함해서 이루어지는 셀룰라아제 혼합물을 배양액 중에 산생하고, 이러한 배양액으로부터 조제된 셀룰라아제 혼합물은 본 발명에 바람직하게 사용할 수 있다. 이러한 트리코데르마속 중 보다 바람직하게는 트리코데르마 리세이(Trichoderma reesei)유래의 셀룰라아제 혼합물이다. 트리코데르마 리세이유래의 셀룰라아제 혼합물로서는 트리코데르마 리세이 QM9414(Trichoderma reesei QM9414), 트리코데르마 리세이 QM9123(Trichoderma reesei QM9123), 트리코데르마 리세이 RutC-30(Trichoderma reesei Rut-30), 트리코데르마 리세이 PC3-7(Trichoderma reesei PC3-7), 트리코데르마 리세이 ATCC66589, 트리코데르마 리세이 CL- 847(Trichoderma reesei CL-847), 트리코데르마 리세이 MCG77(Trichoderma reesei MCG77), 트리코데르마 리세이 MCG80(Trichoderma reesei MCG80), 트리코데르마 비리데 QM9123(Trichoderma viride QM9123)로부터 유래되는 셀룰라아제 혼합물을 들 수 있다. 또한, 상기 트리코데르마속으로부터 유래되고, 변이제 또는 자외선 조사 등에 의해 변이 처리를 실시하여 셀룰라아제 생산성이 향상된 변이주이어도 좋다.

본 발명에서 사용하는 트리코데르마속유래 셀룰라아제 혼합물은 셀로비오하이드라아제, 엔도글루카나아제, 엑소글루카나아제, β글루코시다아제, 크실라나아제, 자일로시다아제 등의 복수의 효소 성분을 포함하는 효소 조성물이다. 트리코데르마속유래 셀룰라아제 혼합물은 셀룰로오스 분해에 있어서 복수의 효소 성분의 협주 효과 또는 보완 효과에 의해 효율적인 셀룰로오스의 가수 분해를 실시할 수 있다.

셀로비오하이드라아제는 셀룰로오스의 말단 부분으로부터 가수 분해해 나가는 것을 특징으로 하는 셀룰라아제의 총칭이며, EC 번호: EC 3.2.1.91로서 셀로비오하이드라아제에 귀속되는 효소군이 기재되어 있다.

엔도글루카나아제는 셀룰로오스 분자쇄의 중앙 부분으로부터 가수 분해하는 것을 특징으로 하는 셀룰라아제의 총칭이며, EC 번호: EC 3.2.1.4, EC 3.2.1.6, EC 3.2.1.39, EC 3.2.1.73으로서 엔도글루카나아제에 귀속되는 효소군이 기재되어 있다.

엑소글루카나아제는 셀룰로오스 분자쇄의 말단으로부터 가수 분해하는 것을 특징으로 하는 셀룰라아제의 총칭이며, EC 번호: EC 3.2.1.74, EC 3.2.1.58로서 엑소글루카나아제에 귀속되는 효소군이 기재되어 있다.

β글루코시다아제는 셀로올리고당 또는 셀로비오스에 작용하는 것을 특징으로 하는 셀룰라아제의 총칭이며, EC 번호: EC 3.2.1.21로서 β글루코시다아제에 귀속되는 효소군이 기재되어 있다.

크실라나아제는 헤미셀룰로오스 또는 특히 크실란에 작용하는 것을 특징으로 하는 셀룰라아제의 총칭이며, EC 번호: EC 3.2.1.8로서 크실라나아제에 귀속되는 효소군이 기재되어 있다.

자일로시다아제는 자일로올리고당에 작용하는 것을 특징으로 하는 셀룰라아제의 총칭이며, EC 번호: EC 3.2.1.37로서 자일로시다아제에 귀속되는 효소군이 기재되어 있다.

본 발명에서는 셀룰로오스 함유 바이오매스를 효소 반응의 기질로 한다. 셀룰로오스 함유 바이오매스란 넓게 식물 바이오매스로부터 유래되는 셀룰로오스이다. 더욱 구체적으로는 바가스, 옥수수대, 옥수수 속대, 스위치그라스, 볏짚, 밀짚, 수목, 목재, 폐건재, 신문지, 헌 종이, 펄프 등이다. 이들 셀룰로오스 함유 바이오매스는 고분자 방향족 화합물 리그닌이나 헤미셀룰로오스 등의 불순물이 포함되어 있지만 전처리로서 산, 알칼리, 가압열수 등을 사용해서 리그닌이나 헤미셀룰로오스를 부분적으로 분해한 셀룰로오스 함유 바이오매스를 셀룰로오스로서 이용해도 좋다. 여기에서는 상기 전처리를 실시한 셀룰로오스 함유 바이오매스를 「리그노셀룰로오스」로 하고, 효소 반응 기질로서 사용할 수 있다.

본 발명에서 사용하는 셀룰로오스 함유 바이오매스로서는 공지의 방법에 따라 암모니아 처리, 희황산 처리, 수열 처리 등 전처리를 행한 것을 사용할 수 있다.

암모니아 처리는 일본 특허 공개 2008-161125호 공보 및 일본 특허 공개 2008-535664호 공보에 기재의 방법을 적용할 수 있다. 구체적으로는 바이오매스에 대하여 0.1～15중량%의 농도의 암모니아를 첨가하고, 4～200℃, 바람직하게는 90～150℃에서 처리한다. 첨가하는 암모니아는 액체 상태 또는 기체 상태 중 어느 쪽이어도 좋다. 액체 상태의 경우에는 액체 암모니아, 암모니아 수용액 중 어느 것이어도 좋다. 처리 횟수는 특별히 한정되지 않고, 1회 이상 행하면 좋다. 처리를 2회 이상 행할 경우는 1회째와 2회째 이후의 처리를 다른 조건에서 실시해도 좋다. 암모니아 처리에 의해 얻어진 처리물은 가수 분해 반응을 행하기 전에 암모니아의 중화 또는 암모니아의 제거를 행할 필요가 있다. 중화는 고형분을 포함한 채의 상태로 행해도 고형분을 분리한 액체 획분에 대해서 행해도 좋다. 중화에 사용하는 산 시약은 특별히 한정되지 않는다. 암모니아 처리물을 감압 상태로 유지함으로써 암모니아를 기체 상태에 휘발시켜서 제거할 수도 있고, 이 경우 제거한 암모니아는 회수 재이용해도 좋다.

수열 처리는 예를 들면 셀룰로오스 함유 바이오매스가 0.1～50중량%가 되도록 물을 첨가한 후 100～400℃의 온도에서 1초～60분 처리한다. 처리 회수는 특별히 한정되지 않고, 1회 이상 행하면 좋다. 처리를 2회 이상 행할 경우에는 1회째와 2회째 이후의 처리를 다른 조건에서 실시해도 좋다.

희황산 처리는 예를 들면 황산의 농도는 0.1～15중량%인 것이 바람직하고, 0.5～5중량%인 것이 보다 바람직하다. 반응 온도는 100～300℃의 범위로 설정할 수 있고, 120～250℃로 설정하는 것이 바람직하다. 반응 시간은 1초～60분의 범위로 설정할 수 있다. 처리 회수는 특별히 한정되지 않고, 처리를 1회 이상 행하면 좋다. 처리를 2회 이상 행할 경우 1회째와 2회째 이후의 처리를 다른 조건에서 실시해도 좋다. 희황산 처리에 의해 얻어진 가수 분해물은 산을 포함하고 있으므로 가수 분해 반응에서 사용하기 전에 중화를 행할 필요가 있다.

본 발명에 있어서의 셀룰로오스 함유 바이오매스의 효소 처리 조건은 사상균유래 셀룰라아제와 본 발명의 변이형 글루코시다아제를 포함하는 바이오매스 당화용 효소 조성물을 사용할 경우 처리 온도 40℃～60℃, 처리 pH 3～7, 셀룰로오스 함유 바이오매스 고형분 농도 0.1～30%가 바람직하다. 상기 범위로 설정함으로써 사상균유래 셀룰라아제 및 호열성 균유래 글루코시다아제의 셀룰로오스 분해 효율을 최대한 발휘할 수 있다. 호열성 균유래 글루코시다아제는 본래 반응 최적 온도는 100℃ 부근의 효소도 있지만 본 발명에서 사용하는 호열성 균유래 글루코시다아제는 40℃～60℃에 있어서도 충분히 높은 비활성을 나타내어 사상균유래 셀룰라아제 공존 하에서 셀룰로오스 함유 바이오매스의 분해를 효율적으로 행하는 것이 가능하다. 이 효소 처리는 배치식으로 행해도 연속식으로 행해도 좋다.

본 발명의 변이형 글루코시다아제를 포함하는 바이오매스 당화용 효소 조성물은 β글루코시다아제 활성이 높기 때문에 이것을 사용해서 셀룰로오스계 바이오매스를 가수 분해해서 얻어진 당액은 셀로비오스 함량이 적고, 글루코오스가 많다는 특징을 갖고 있다. 따라서, 본 발명의 바이오매스 당화용 효소 조성물을 사용해서 얻어진 당액은 미생물이나 배양 세포의 생육 또는 이들을 사용하는 발효 생산의 탄소원으로서 바람직하게 이용할 수 있다. 여기서 사용되는 미생물 또는 배양 세포는 예를 들면 발효 공업에 있어서 사용되는 빵 효모 등의 효모, 대장균, 코리네형 세균 등의 박테리아, 사상균, 방선균, 동물 세포, 곤충 세포 등을 들 수 있다. 사용하는 미생물이나 세포는 자연 환경으로부터 단리된 것이라도 좋고, 돌연변이나 유전자 재조합에 의해 일부 성질이 개변된 것이어도 좋다. 또한, 셀룰로오스 함유 바이오매스로부터 유래되는 당액에는 크실로오스 등의 펜토오스를 포함하기 때문에 펜토오스의 대사 경로를 강화한 미생물을 바람직하게 사용할 수 있다. 또한, 이러한 당액을 발효 원료로서 화학품을 제조할 수 있다. 화학품의 구체예로서는 알코올, 유기산, 아미노산, 핵산 등 발효 공업에 있어서 대량 생산되어 있는 물질을 들 수 있다. 예를 들면, 에탄올, 1,3-프로판디올, 1,4-부탄디올, 글리세롤 등의 알코올, 아세트산, 락트산, 피루브산, 숙신산, 말산, 이타콘산, 시트르산 등의 유기산, 이노신, 구아노신 등의 뉴클레오시드, 이노신산, 구아닐산 등의 뉴클레오티드, 카다베린 등의 아민 화합물을 들 수 있다. 또한, 효소, 항생 물질, 재조합 단백질 등의 생산에 적용하는 것도 가능하다.

본 발명의 바이오매스 당화용 효소 조성물을 사용해서 셀룰로오스계 바이오매스를 가수 분해해서 얻어진 당액은 필요에 따라 미분해의 고형물을 제거한 것을 당액으로서 사용해도 좋고, 고형물을 포함한 채 당액으로서 사용해도 좋다.

본 발명의 바이오매스 당화용 효소 조성물을 사용하는 바이오매스의 가수 분해 방법으로는 셀룰로오스 함유 바이오매스의 효소 처리에 의해 얻어진 당액으로부터 사용한 효소 조성물을 분리해서 회수할 수 있다. 분리 회수하는 방법은 특별히 한정되지 않지만 본 발명의 변이형 글루코시다아제는 당쇄를 갖지 않는 종래의 글루코시다아제에 비해 셀룰로오스 함유 바이오매스, 특히 리그노셀룰로오스에 대한 흡착성, 또한 한외 여과막에 대한 흡착성이 대폭 저하되어 있다는 특징을 갖는다. 따라서, 사용한 효소 조성물의 분리 회수에는 가수 분해물을 필요에 따라 고액 분리하고, 얻어진 당액을 한외 여과막을 통해 여과하고, 비투과액으로서 효소 조성물을 분리 회수하는 방법을 바람직하게 사용할 수 있다.

본 발명의 바이오매스의 가수 분해 방법에 있어서의 고액 분리의 방법으로서는 여과법, 원심 분리법 모두 사용할 수 있다. 이러한 고액 분리를 행하는 장치로서 벨트 필터, 스크루 디캔터, 연속 원심기, 필터 프레스, 드럼 필터 등을 예시할 수 있지만 이들에 한정되는 것은 아니다.

본 발명의 바이오매스의 가수 분해 방법에 있어서 효소 조성물의 분리 회수에 사용하는 한외 여과막으로서는 폴리에테르설폰(PES), 폴리설폰(PS), 폴리 아크릴로니트릴(PAN), 폴리불화 비닐리덴(PVDF), 재생 셀룰로오스, 셀룰로오스, 셀룰로오스에스테르, 술폰화 폴리설폰, 술폰화 폴리에테르설폰, 폴리올레핀, 폴리비닐알코올, 폴리메틸메타크릴레이트, 폴리 4불화 에틸렌 등을 막소재로 하는 것을 사용할 수 있다. 이들 중에서도 셀룰로오스 이외의 합성 고분자를 한외 여과막의 막소재로 하는 것이 장기 사용의 관점에서 바람직하다. 일반적으로 합성 고분자를 막소재로 하는 한외 여과막은 효소(단백질)의 막으로의 흡착성이 높다는 과제를 갖고 있지만 본 발명에 있어서 분리 회수되는 효소 조성물은 당쇄 부가의 효과에 의해 흡착성이 저감되어 있기 때문에 바람직하게 사용할 수 있다. 본 발명에 사용하는 한외 여과막의 분획 분자량은 500Da～100000Da의 한외 여과막을 사용할 수 있다. 이 중 특히 본 발명의 변이형 글루코시다아제 및 사상균유래 셀룰라아제 성분의 쌍방의 분리 회수성이 높은 분획 분자량 10000Da～30000Da 범위의 한외 여과를 가장 바람직하게 사용할 수 있다.

한외 여과막에 의한 여과 방식으로서 데드 엔드 여과, 크로스 플로 여과가 있지만 막 파울링 억제의 관점으로부터 크로스 플로 여과인 것이 바람직하다. 또한, 사용하는 한외 여과막의 막 형태로서는 평막형, 스파이럴형, 관상형, 중공사형 등 적당한 형태의 것을 사용할 수 있다. 구체적으로는 DESAL사의 G-5타입, G-10타입, G-20타입, G-50타입, PW타입, HWS UF타입, KOCH사의 HFM-180, HFM-183, HFM-251, HFM-300, HFM-116, HFM-183, HFM-300, HFK-131, HFK-328, MPT-U20, MPS-U20P, MPS-U20S, Synder사의 SPE1, SPE3, SPE5, SPE10, SPE30, SPV5, SPV50, SOW30, 아사히 카세이사제의 마이크로자(등록상표) UF시리즈 분획 분자량 3000～100000에 상당하는 것, 닛토 덴코 가부시키가이샤제의 NTR7410, NTR7450 등을 들 수 있다.

실시예

이하에 실시예를 들어 본 발명을 구체적으로 설명한다. 단, 본 발명은 이들에 한정되는 것은 아니다.

[비교예 1] 파이로코커스 퓨리오서스유래 β-글루코시다아제의 조제(1)

초호열성 고세균 파이로코커스 퓨리오서스(Pyrococcus furiosus)유래 β-글루코시다아제(이하, 「PfuBGL」이라고 칭한다)는 100℃ 이상에서 활성을 가질 정도의 내열성을 갖고, 여러 가지 셀로올리고당을 가수 분해해서 글루코오스를 생산하기 때문에 셀룰로오스계 바이오매스의 유효 이용에 기대되고 있다.

PfuBGL 유전자는 서열 번호 3에 기재된 유전자를 전체 합성하고, pET-11d의 NcoI 및 BamHI에 Ligation High(토요보)를 사용해서 연결하여 JM109(Takara)로 형질 전환했다. 스크리닝은 암피실린을 항생 물질로서 포함하는 LB한천 배지를 사용해서 행했다. 형질 전환된 JM109주로부터 제작한 벡터 pET-PfuBGL을 미니프렙 키트(퀴아젠)에 의해 단리하고, 염기 서열 해석을 행했다. pET-PfuBGL은 발현용 대장균 BL21(DE3)pLysS주로 형질 전환하여 BL21-PfuBGL주를 제작했다. BL21-PfuBGL주를 암피실린 함유 LB배지 10㎖에 식균하고, 37℃에서 밤새 진동 배양(전배양)을 행했다. 본 배양으로서 암피실린 함유 LB배지 1L에 전배양에서 얻어진 균체를 식균하고, 파장 600㎚에서의 흡광도 OD600이 0.8이 될 때까지 진동 배양을 행했다. 그 후 최종 농도가 0.4mM가 되도록 이소프로필-1-티오-β-D-갈락토시드(IPTG)를 첨가하고, 25℃에서 밤새 더 배양했다. 배양 후 균체를 원심 분리에 의해 회수하고, 50mM 트리스-HCl 완충액(pH 8.0)에 재현탁했다. 이 용액을 빙냉하면서 초음파 파쇄를 행하고, 그 상청액을 무세포 추출액으로서 원심 분리에 의해 회수했다. 얻어진 무세포 추출액을 85℃에서 15분 보온하고, 상기 글루코시다아제 이외의 대장균으로부터 유래되는 단백질을 응집 침전했다. 원심 분리에 의해 침전물을 제거하고, 상청액을 분획 분자량 10000의 재생 셀룰로오스제 투석막(스펙트럼 라보라토리즈)을 사용해서 50mM 아세트산 완충액(pH 5.0)에 투석했다. 얻어진 단백질 용액을 야생형의 PfuBGL로서 사용했다.

[실시예 1] PfuBGL에 있어서의 N형 당쇄 부가 서열의 도입 개소의 결정

우선 PfuBGL의 당쇄 부가 서열의 도입 개소를 검색하기 위한 1차 서열의 결정과 삼차원 구조의 결정을 시험해 보았다.

PfuBGL의 호몰로그에 대한 얼라이먼트를 행하기 위해서 호몰로그 검색 서버 FUGUE를 이용했다. 그 결과 PfuBGL은 Glycosyl hydrolase family 1에 대하여 서열의 유사성을 나타내는 ZSCORE가 71.65로 최고값을 나타냈다(ZSCORE>=6.0에서 99% confidence). 얻어진 Glycosyl hydrolase family 1의 얼라이먼트를 정형하기 위해서 JOY 서버를 이용했다. 그 결과 아스페르길루스·니게르유래 β-글루코시다아제(AspNgBGL) 및 트리코데르마 리세이유래 β-글루코시다아제(TriReBGL)가 갖는 3개소의 N형 당쇄 부가 서열의 위치에 대응하는 PfuBGL의 서열은 N형 당쇄 부가 서열이 아닌 것이 판명되었다(H60,L61,Y62과 N148,L149,Y150과 N374,G375,M376의 3개소).

PfuBGL의 X선 결정 구조는 불완전한 것이 보고되어 있지만(Thijis K. 외 Biochem. vol.39, No.17(2000)) 분해능이 3.3Å으로 낮아 완전한 구조 모델 구축에는 이르지 있지 않다. 또한, 단백질 정보 은행(Protein Data Bank(PDB))으로의 등록도 되어 있지 않다. 그래서 PfuBGL의 삼차원 구조를 결정하기 위해서 새로운 결정 조건으로 상세한 X선 결정 구조 해석을 시험해 보았다. 새로운 결정화 조건을 탐색하고, 인산을 침전제로 해서 결정화에 성공했다. 대형 방사광 실험 시설 SPring-8로 X선 회절 실험을 행하고, 분해능 2.5Å으로 PfuBGL의 구조를 결정하여 PfuBGL의 완전한 모델 구축에 성공했다. 구조 결정은 분자 치환법을 사용하고, 모델 분자에는 서열 번호 8에 기재된 서모스페라 아그레간스(Themosphaera aggregans)유래 β-글루코시다아제(ThAggBGY, PDB ID: 1QVB)를 사용했다.

이렇게 해서 얻어진 PfuBGL의 삼차원 구조로부터 N형 당쇄 부가 서열의 위치에 대응하는 상기 3개소 중 효소 표면에 노출하고, 또한 활성 부위에 근접하고 있지 않은 효소 활성으로의 영향이 작다고 여겨지는 부위는 H60,L61,Y62의 부위뿐이었다. 따라서, 이 부분을 N형 당쇄 부가 서열의 도입 개소로 하고, H60N, L61R, Y62T의 변이를 치환에 의해 도입함으로써 당쇄 부가 변이형 PfuBGL로서 서열 번호 6에 기재된 아미노산 서열을 얻었다.

[실시예 2] PfuBGL과 아미노산 서열이 유사한 글루코시다아제에 있어서의 N형 당쇄 부가 서열의 도입 개소의 결정

실시예 1에서 얻어진 서열 번호 6에 대하여 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 및 서열 번호 20의 얼라이먼트를 행하기 위해서 상기 업자에게 잘 알려진 소프트웨어인 ClustalW 및 BOXSHADE를 사용해서 얼라이먼트를 정형했다(도 2a, 도 2b). 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 또는 서열 번호 20에 대해서 서열 번호 6의 당쇄 부가 서열 Asn-Arg-Thr(N-R-T)에 대응하는 개소를 각 서열로의 당쇄 부가 서열의 도입 개소로서 결정했다.

[실시예 3] 당쇄 부가 변이형 PfuBGL의 조제(1)

서열 번호 6에 기재된 당쇄 부가 변이형 PfuBGL의 조제를 행했다.

우선 실시예 1에서 결정한 당쇄 부가 서열을 서열 번호 4에 기재된 PfuBGL에 도입하기 위한 변이 도입용 프라이머 5'-CCACATATTGGCACCTCTATAAGCAAGATCATG-3'(서열 번호 21) 및 5'-CATGATCTTGCTTAGTGCGGTTCCAATATGCTGG-3'(서열 번호 22)를 사용해서 부위 특이적 변이 도입법에 의해 N형 당쇄 부가 서열 변이의 도입을 행했다. 얻어진 유전자의 시퀀스를 확인한 후 α팩터 분비 시그널 서열을 미리 포함하는 효모 발현용 벡터 pPIC9의 EcoRI와 Not I 사이트 사이에 삽입했다. 변이 도입 후의 유전자는 대장균으로 형질 전환된 후 목적의 변이를 포함하는 유전자를 갖는 콜로니를 시퀀서를 사용해서 확인했다.

일반적인 방법을 사용해서 작성한 효모 수용성 세포에 변이체 플러스미드를 혼합하고, GENE PULSERⅡ(Bio-Rad)를 사용해서 형질 전환을 행했다. 조건은 1.7㎸, 25㎌, 200Ω에서 행했다. 형질 전환 후의 효모는 RDB 플레이트에 스트리크했다. 3일 후에 플레이트 상에 나타난 콜로니로부터 10개를 선택하여 발현 확인을 행했다. 폴리아크릴아미드겔 전기 영동에 의한 목적 단백질의 발현 확인을 할 수 있었던 클론을 선택했다.

시드 배양으로서 플레이트 상의 콜로니로부터 2㎖의 BMGY배지에 효모를 식균하고 2일간 배양했다. 이어서, 본 배양으로서 1L의 BMGY배지에 효모 시드 배양액 2㎖를 첨가하고, 2일간 배양하여 충분히 효모를 증식시켰다. 한번 배양액 1L를 원심에 의해 효모를 침전시키고, BMGY배지를 2% 메탄올 함유 BMMY배지로 교환했다. 그 후 균체를 배지에 재현탁한 후 48시간의 배양을 행했다. 발현 단백질을 포함하는 배지를 원심에 의해 회수하고, 필터 여과 후 70%(w/v) 유안(硫安)에 의한 유안 침전을 행했다. 침전을 원심에 의해 회수한 후 완충액에 용해하고, 그 후 투석해서 목적 단백질을 얻었다.

얻은 효소의 EndoH 처리를 행하고, 폴리아크릴아미드겔 전기 영동을 행했다(도 3). EndoH 처리 전후에서의 밴드 시프트에 의해 N형 당쇄가 부가된 당쇄 부가 변이형 PfuBGL을 제작한 것을 확인했다.

[실시예 4] 당쇄 부가 변이형 PfuBGL의 효소 활성(2)

당쇄 부가 변이형 PfuBGL과, PfuBGL의 β-글루코시다아제 활성을 비교했다. 기질에 10mM 셀로비오스/50mM 아세트산 완충액을 사용하여 각각 실시예 2, 비교예 1에서 조제한 효소를 최종 농도 0.23㎎/㎖로 첨가하고, 50℃에서 효소 반응을 행했다. 생성물의 정량에는 글루코스 테스트 와코Ⅱ(Wako)를 사용했다.

β-글루코시다아제 활성1유닛(U)은 하기의 식에 준해서 산출했다.

β-글루코시다아제 활성1유닛(U)=반응 종료 시에 생성한 글루코오스 농도(g/L)×1000/180/30

또한, β-글루코시다아제 활성을 β-글루코시다아제 양(㎎)당의 비활성을 하기의 식에 의해 산출했다.

β-글루코시다아제 비활성(U/㎎ protein)=β-글루코시다아제 활성(U)/활성 측정에 첨가한 β-글루코시다아제 양(㎎)

반응 후의 각 글루코오스 생성량은 PfuBGL이 1.58g/L, 당쇄 부가 변이형 PfuBGL이 1.34g/L이었다. 또한, PfuBGL의 비활성에 대한 당쇄 부가 변이형 PfuBGL의 비활성은 85%로 실시예 1에서 결정한 개소로의 당쇄 부가 서열 변이의 도입은 효소 활성을 상실시키지 않는 것이 명확하며, PfuBGL의 대체로서 당쇄 부가 변이형 PfuBGL을 이용할 수 있는 것이 확인되었다.

[실시예 5] 당쇄 부가 변이형 PfuBGL의 열안정성

각각 50℃, 60℃, 70℃, 80℃, 90℃에서의 보온 상태에 있어서의 24시간까지의 글루코오스 생성량의 변화를 측정했다.

각각 실시예 2, 비교예 1에서 조제한 효소(단백질 농도 1.0㎎/㎖)를 각각 50℃, 60℃, 70℃, 80℃, 90℃에서 보온했다. 각 보온 시간에 대해서 기질 10mM 셀로비오스/50mM 아세트산 완충액을 첨가하고, 보온 온도에서 30분간의 효소 반응을 행했다. 반응 후의 용액을 회수하고, 글루코스 테스트 와코Ⅱ(Wako)를 사용해서 생성물의 정량을 행했다(도 4, 도 5).

24시간까지의 보온에서는 PfuBGL보다 당쇄 부가 변이형 PfuBGL 쪽이 높은 온도에 있어서의 효소 실활이 저감되어 있었다. 이 점에서 당쇄 부가 변이형 PfuBGL은 PfuBGL보다 높은 내열성을 획득하여 효소의 안정성이 향상된 것이 확인되었다.

[참고예 1] 리그노셀룰로오스의 조제

당쇄 부가한 변이형 글루코시다아제를 포함하는 효소 조성물을 사용한 가수 분해에 사용하는 리그노셀룰로오스 1～3을 다음과 같이 조제했다.

1. 리그노셀룰로오스 1의 조제(암모니아 처리)

셀룰로오스로서 볏짚을 사용했다. 상기 셀룰로오스를 소형 반응기(Taiatsu Techno Corporation제, TVS-N2 30㎖)에 투입하고, 액체 질소로 냉각했다. 이 반응기에 암모니아 가스를 유입하고, 시료를 완전히 액체 암모니아에 침지시켰다. 리액터의 덮개를 닫고, 실온에서 15분 정도 방치했다. 이어서, 150℃의 오일 바스 중에서 1시간 처리했다. 처리 후 반응기를 오일 바스로부터 인출하고, 드래프트 중에서 즉시 암모니아 가스를 누설한 후 진공 펌프로 반응기 내를 10㎩까지 더 진공 드로잉하여 건조시켰다. 이것을 리그노셀룰로오스 1로 해서 이하의 실시예에 사용했다.

2. 리그노셀룰로오스 2의 조제(희황산 처리)

셀룰로오스로서 볏짚을 사용했다. 셀룰로오스를 황산 1% 수용액에 침지하고, 150℃에서 30분 오토클레이브 처리(닛토 코아츠제)했다. 처리 후 고액 분리를 행하여 황산 수용액(이하, 희황산 처리액)과 황산 처리 셀룰로오스로 분리했다. 이어서, 황산 처리 셀룰로오스와 고형분 농도가 10중량%가 되도록 희황산 처리액과 교반 혼합한 후 수산화 나트륨에 의해 pH를 5 부근으로 조제했다. 이것을 리그노셀룰로오스 2로 해서 이하의 실시예에 사용했다.

3. 리그노셀룰로오스 3의 조제(수열 처리)

셀룰로오스로서 볏짚을 사용했다. 상기 셀룰로오스를 물에 침지하고, 교반하면서 180℃에서 20분간 오토클레이브 처리(닛토 코아츠 가부시키가이샤제)했다. 그때의 압력은 10㎫이었다. 처리 후에는 용액 성분(이하, 수열 처리액)과 처리 바이오매스 성분에 원심 분리(3000G)를 사용해서 고액 분리했다. 이 처리 바이오매스 성분을 리그노셀룰로오스 3으로 해서 이하의 실시예에 사용했다.

[실시예 6] 사상균유래 셀룰라아제 혼합물과 당쇄 부가 변이형 PfuBGL로 이루어지는 효소 조성물을 사용한 리그노셀룰로오스의 가수 분해(1)

리그노셀룰로오스 기질에 상기 효소 조성물을 작용시켰을 경우의 글루코오스 생성량의 변화를 비교했다. 50mM 아세트산 완충액(pH 5.0)에 5wt%의 리그노셀룰로오스 1(참고예 1에서 조제)을 현탁한 것을 기질로 했다. 반응은 50℃에 있어서 28시간까지 행하고, 적당히 샘플링해서 생성한 글루코오스 농도의 측정을 행했다(도 6). 사상균유래 셀룰라아제 혼합물로서는 시판된 트리코데르마 리세이유래 셀룰라아제(셀크러스트, 시그마)를 사용했다. 글루코시다아제로서는 실시예 2에서 조제한 당쇄 부가 변이형 PfuBGL과 비교예 1에서 조제한 PfuBGL을 각각 사용했다. 효소 첨가량은 셀룰라아제 0.5㎎/㎖, 글루코시다아제 0.005㎎/㎖(셀룰라아제의 1/100량)이다.

PfuBGL과 당쇄 부가 변이형 PfuBGL을 사용했을 경우를 비교하면 반응 28시간 후에 있어서의 글루코오스 생성량은 당쇄 부가 변이형 PfuBGL은 PfuBGL의 1.6배로 대폭 상승했다. 당쇄 부가 변이형 PfuBGL은 셀룰라아제의 1/100량 첨가하는 것만으로 글루코오스 생성량의 증가에 대하여 엄청난 효과가 있는 것이 명확해졌다.

[참고예 2] 트리코데르마속유래 셀룰라아제의 조제

트리코데르마속유래 셀룰라아제를 이하의 방법으로 조제했다.

1. 전배양

옥수수 침지액 5%(w/vol), 글루코오스 2%(w/vol), 주석산 암모늄 0.37%(w/vol), 황산 암모늄 0.14%(w/vol), 인산 2수소 칼륨 0.2%(w/vol), 염화 칼슘 2수화물 0.03%(w/vol), 황산 마그네슘 7수화물 0.03%(w/vol), 염화 아연 0.02%(w/vol), 염화 철(Ⅲ) 6수화물 0.01%(w/vol), 황산 동(Ⅱ) 5수화물 0.004%(w/vol), 염화 망간 4수화물 0.0008%(w/vol), 붕산 0.0006%(w/vol), 7몰리브덴산 6암모늄 4수화물 0.0026%(w/vol)가 되도록 증류수에 첨가하고, 100㎖를 500㎖ 배플이 부착된 삼각 플라스크에 가득 채워 121℃에서 15분간 오토클레이브 멸균했다. 방냉 후 이것과는 달리 각각 121℃에서 15분간 오토클레이브 멸균한 PE-M과 Tween80을 각각 0.1% 첨가했다. 이 전에 배양 배지에 트리코데르마 리세이 ATCC66589(Tricoderma reesei ATCC66589)를 1×10⁵개/㎖가 되도록 식균하고, 28℃, 72시간, 180rpm으로 진동 배양하여 전배양으로 했다(진동 장치: TAITEC사제 BIO-SHAKER BR-40LF).

2. 본 배양

옥수수 침지액 5%(w/vol), 글루코오스 2%(w/vol), 셀룰로오스(아비셀) 10%(w/vol), 주석산 암모늄 0.37%(w/vol), 황산 암모늄 0.14%(w/vol), 인산 2수소 칼륨 0.2%(w/vol), 염화 칼슘 2수화물 0.03%(w/vol), 황산 마그네슘 7수화물 0.03%(w/vol), 염화 아연 0.02%(w/vol), 염화 철(Ⅲ) 6수화물 0.01%(w/vol), 황산 동(Ⅱ) 5수화물 0.004%(w/vol), 염화 망간 4수화물 0.0008%(w/vol), 붕산 0.0006%(w/vol), 7몰리브덴산 6암모늄 4수화물 0.0026%(w/vol)가 되도록 증류수에 첨가하고, 2.5L를 5L 용해 교반 자(ABLE사제 DPC-2A) 용기에 가득 채워 121℃에서 15분간 오토클레이브 멸균했다. 방냉 후 이와는 별도로 각각 121℃에서 15분간 오토클레이브 멸균한 PE-M과 Tween80을 각각 0.1% 첨가하고, 미리 상기의 방법으로 액체 배지로 전배양한 트리코데르마 리세이 ATCC66589(Tricoderma reesei ATCC66589)를 250㎖ 접종했다. 그 후 28℃, 87시간, 300rpm, 통기량 1vvm으로 배양을 행하고, 원심 분리 후 상청액을 막 여과(밀리포어사제 스테리컵-GV 재질: PVDF)했다.

[실시예 7] 사상균유래 셀룰라아제 혼합물과 당쇄 부가 변이형 PfuBGL로 이루어지는 효소 조성물을 사용한 리그노셀룰로오스의 가수 분해(2)

참고예 1에서 조제한 리그노셀룰로오스 1～3을 기질로 하고, 참고예 2에서 조제한 트리코데르마 리세이 배양액을 사상균유래 셀룰라아제 혼합물로서 사용하고, 효소 첨가량을 셀룰라아제 1.0㎎/㎖, 글루코시다아제 0.005㎎/㎖(셀룰라아제의 1/100량)로 한 것 이외에는 실시예 6과 마찬가지로 해서 리그노셀룰로오스 1～3의 가수 분해를 실시했다.

표 2에 반응 28시간 후에 생성한 글루코오스 농도(g/L)를 비교했다.

PfuBGL과 당쇄 부가 변이형 PfuBGL을 사용했을 경우를 비교하면 반응 28시간 후에 있어서의 글루코오스 생성량은 당쇄 부가 변이형 PfuBGL은 PfuBGL의 1.8배로 대폭 상승했다. 당쇄 부가 변이형 PfuBGL은 셀룰라아제의 1/200량 첨가하는 것만으로 글루코오스 생성량이 대폭 증가하는 효과가 있는 것이 명확해졌다. 실시예 6과 같은 시판된 셀룰라아제뿐만 아니라 트리코데르마 리세이 배양액을 사용해도 당쇄 부가 변이형에 있어서의 효과가 있는 것이 판명되었다.

[실시예 8] 사상균유래 셀룰라아제 혼합물과 당쇄 부가 변이형 PfuBGL로 이루어지는 효소 조성물을 사용한 리그노셀룰로오스의 가수 분해(3)

사상균유래 셀룰라아제와 당쇄 부가 변이형 PfuBGL로 이루어지는 효소 조성물을 사용하고, 가수 분해의 반응 온도 조건을 바꾸어 글루코오스 생성량을 비교 검토했다. 반응 온도를 30℃, 40℃, 50℃(실시예 7), 60℃의 각 온도로 설정하여 실시예 7과 같은 순서로 행하고, 28시간 후의 글루코오스 생성량을 측정했다. 기질은 리그노셀룰로오스 1을 사용했다.

표 3에 나타내는 바와 같이 사상균유래 셀룰라아제, 특히 트리코데르마속유래 셀룰라아제를 사용하는 경우에 있어서는 40℃～50℃의 범위에서 반응 온도를 설정하는 것이 바람직한 것이 판명되었다. 이것은 트리코데르마속유래 셀룰라아제의 반응 최적 온도가 40℃～50℃인 것을 반영하고 있는 결과이다. 즉, 본 발명의 호열성 균유래 글루코시다아제는 50℃ 이상에서도 높은 활성을 나타내지만 사상균유래 셀룰라아제를 포함하는 바이오매스 당화용 효소 조성물로서 사용할 경우에 있어서는 반응 온도를 사상균유래 셀룰라아제의 최적 반응 온도 범위에서 행하는 것이 바람직한 것이 판명되었다.

[실시예 9] 사상균유래 셀룰라아제 혼합물과 당쇄 부가 변이형 PfuBGL로 이루어지는 효소 조성물을 사용한 리그노셀룰로오스의 가수 분해(4)

사상균유래 셀룰라아제와 당쇄 부가 변이형 PfuBGL로 이루어지는 효소 조성물을 사용하고, 가수 분해 반응에 있어서의 pH 조건을 바꾸어 글루코오스 생성량을 비교 검토했다. 희황산을 첨가해서 가수 분해 반응 시의 pH를 1.2, 3.5, 5.0(실시예 7), 7.0, 8.2의 각 pH로 설정하여 실시예 7과 같은 순서로 행하고, 28시간 후의 글루코오스 생성량을 측정했다. 기질은 리그노셀룰로오스 1을 사용했다.

표 4에 나타내는 바와 같이 사상균유래 셀룰라아제, 특히 트리코데르마속유래 셀룰라아제를 사용할 경우에 있어서는 pH 3.5～pH 7의 범위에서 행하는 것이 바람직한 것이 판명되었다.

[비교예 2] PfuBGL 유사 글루코시다아제의 조제(2)

이하와 같이 해서 비교예 1에서 조제한 PfuBGL과 아미노산 서열이 유사한 글루코시다아제 7종을 조제했다.

서열 번호 23, 25, 27, 29, 31, 33, 35의 DNA 서열을 각각 전체 합성에 의해 제작하고, pET-11d의 클로닝 사이트 NcoI와 BamHI 사이에 장착하여 각각의 발현 벡터를 구축했다. 이하 비교예 1과 마찬가지로 해서 서열 번호 24, 26, 28, 30, 32, 34,36의 아미노산 서열로 나타내어지는 야생형의 글루코시다아제(ThAggBGY, CmGHFP, SaBGAL, SsoBGAL, PtBGAL, TvBGAL, FnGHFP)를 얻었다.

[실시예 10] PfuBGL 유사 글루코시다아제의 당쇄 부가 변이형 글루코시다아제의 조제

비교예 2에서 얻어진 야생형 글루코시다아제(ThAggBGY, CmGHFP, SaBGAL, SsoBGAL, PtBGAL, TvBGAL, FnGHFP)에 대해서 실시예 2에 있어서 PfuBGL에서 결정한 당쇄 부가 서열의 삽입 개소의 정보를 기초로 당쇄 도입 개소를 결정하고, 각각 당쇄 부가 변이형 글루코시다아제를 조제했다.

서열 번호 37, 39, 41, 43, 45, 47, 49의 당쇄 부가 변이형 글루코시다아제를 인코딩하는 DNA 서열을 전체 합성에 의해 각각 제작하고, pCU9 벡터의 EcoRI와 NotI 사이에 장착하여 각각의 발현 벡터를 구축했다. 이하 실시예 3과 마찬가지로 해서 서열 번호 38, 40, 42, 44, 46, 48, 50의 아미노산 서열로 나타내어지는 당쇄 부가 변이형 글루코시다아제를 얻었다.

[실시예 11] 당쇄 부가 변이형 글루코시다아제의 효소 활성

실시예 4와 마찬가지로 해서 실시예 10에서 얻어진 당쇄 부가 변이형 글루코시다아제의 효소 활성을 측정해서 비교예 2에서 얻어진 각 야생형 글루코시다아제의 효소 활성과 비교했다. 당쇄 부가 변이형의 효소 활성은 각 야생형의 효소 활성을 100으로 했을 때의 상대 활성(%)으로 해서 표 5에 나타냈다.

표 5의 당쇄 부가 변이형 글루코시다아제는 당쇄 부가 전의 야생형 글루코시다아제와 비교해서 효소 활성을 유지하고 있는 것을 알 수 있었다.

[실시예 12] 당쇄 부가 변이형 글루코시다아제의 열안정성

실시예 5와 마찬가지로 해서 비교예 2에서 얻어진 각 야생형 글루코시다아제와 실시예 10에서 얻어진 각 당쇄 부가 변이형 글루코시다아제의 열안정성 시험을 행했다. 열안정성은 보온 전의 효소 활성을 100으로 했을 경우의 각 보온 시간에 있어서의 잔존 활성을 상대 활성으로 해서 도 8～도 20에 나타냈다. 모든 글루코시다아제에 있어서 당쇄 부가 변이형(도 9, 도 11, 도 13, 도 15, 도 17, 도 19, 도 21)은 야생형(도 8, 도 10, 도 12, 도 14, 도 16, 도 18, 도 20)에 비해 열안정성이 향상되는 것이 판명되었다.

[실시예 13] 사상균유래 셀룰라아제 혼합물과 당쇄 부가 변이형 글루코시다아제로 이루어지는 효소 조성물을 사용한 리그노셀룰로오스의 가수 분해(5)

실시예 6과 마찬가지로 해서 비교예 2에서 얻어진 각 야생형 글루코시다아제와 실시예 10에서 얻어진 각 당쇄 부가 변이형 글루코시다아제를 사용해서 참고예 1에서 조제한 리그노셀룰로오스 1(암모니아 처리)의 가수 분해를 행했다. 반응 28시간 후에 있어서의 각 글루코오스 생성량(g/L)을 표 6에 나타냈다.

표 6에 나타내는 바와 같이 암모니아 처리된 리그노셀룰로오스 1의 가수 분해에 있어서 당쇄 부가 변이형 글루코시다아제는 야생형에 비해 단위 시간당 당 생성량이 대폭 증가하여 셀룰로오스 분해 효율이 좋은 것을 알 수 있었다.

[실시예 14] 사상균유래 셀룰라아제 혼합물과 당쇄 부가 변이형 글루코시다아제로 이루어지는 효소 조성물을 사용한 리그노셀룰로오스의 가수 분해(6)

실시예 6과 마찬가지로 해서 비교예 2에서 얻어진 각 야생형 글루코시다아제와 실시예 10에서 얻어진 각 당쇄 부가 변이형 글루코시다아제를 사용해서 참고예 1에서 조제한 리그노셀룰로오스 2(희황산 처리)의 가수 분해를 행했다. 반응 28시간 후에 있어서의 각 글루코오스 생성량(g/L)을 표 7에 나타냈다.

표 7에 나타내는 바와 같이 희황산 처리된 리그노셀룰로오스 2의 가수 분해에 있어서 당쇄 부가 변이형 글루코시다아제는 야생형에 비해 단위 시간당 당 생성량이 대폭 증가하여 셀룰로오스 분해 효율이 좋은 것을 알 수 있었다.

[실시예 15] 사상균유래 셀룰라아제 혼합물과 당쇄 부가 변이형 글루코시다아제로 이루어지는 효소 조성물을 사용한 리그노셀룰로오스의 가수 분해(7)

실시예 6과 마찬가지로 해서 비교예 1 및 비교예 2에서 얻어진 각 야생형 글루코시다아제와 실시예 1 및 실시예 10에서 얻어진 각 당쇄 부가 변이형 글루코시다아제를 사용해서 참고예 1에서 조제한 리그노셀룰로오스 3(수열처리)의 가수 분해를 행했다. 반응 28시간 후에 있어서의 각 글루코오스 생성량(g/L)을 표 8에 나타냈다.

표 8에 나타내는 바와 같이 수열 처리된 리그노셀룰로오스 3의 가수 분해에 있어서 당쇄 부가 변이형 글루코시다아제는 야생형에 비해 단위 시간당 당 생성량이 대폭 증가하여 셀룰로오스 분해 효율이 좋은 것을 알 수 있었다.

[실시예 16] 사상균유래 셀룰라아제 혼합물과 당쇄 부가 변이형 글루코시다아제로 이루어지는 효소 조성물을 사용한 공업용 펄프의 가수 분해

공업용 펄프에 비교예 1 및 비교예 2에서 얻어진 각 야생형 글루코시다아제와 실시예 1 및 실시예 10에서 얻어진 각 당쇄 부가 변이형 글루코시다아제를 작용시켰을 경우의 글루코오스 생성량을 비교 검토했다. 50mM 아세트산 완충액(pH 5.0)에 5wt%의 공업용 펄프(도아고세이사제)를 현탁한 것을 기질로 한 것 이외에는 실시예 6과 마찬가지로 해서 가수 분해를 행했다. 반응 28시간 후에 있어서의 각 글루코오스 생성량(g/L)을 표 9에 나타냈다.

표 9에 나타내는 바와 같이 당쇄 부가 변이형 글루코시다아제는 공업용 펄프의 가수 분해에 있어서도 야생형에 비해 단위 시간당 당 생성량이 대폭 증가하여 셀룰로오스 분해 효율이 좋은 것을 확인할 수 있었다.

[실시예 17] 당쇄 부가 변이 도입 부위의 선정

실시예 1에서 얻어진 PfuBGL의 삼차원 구조 정보로부터 추가적인 당쇄 수식 부위의 탐색을 행했다. 효소 반응이 행해지는 클레프트의 주위에 당쇄 부가 서열을 도입하여 당쇄의 부가에 의한 촉매 부위의 보호를 시험해 보았다. 우선 PfuBGL의 실시예 1에 기재된 당쇄 변이 도입 부위 이외의 부분에 있어서 효소 표면에 노출되어 있는 부분에 한정했다. 이어서, 당쇄 부가 서열인 Asn-Xaa-Thr(N-X-T)의 변이를 도입해도 입체 장해 및/또는 구조적인 변형이 발생하지 않는 위치를 탐색했다. 또한, 글루코시다아제의 활성 부위를 피한 부위에 있어서 3점 변이 도입 개소를 선정했다.

그 결과 실시예 1에서 선정한 당쇄 수식 부위에 추가해서 H37-D38-K39(변이A), S230-F231-E232(변이C), A364-Y365-E366(변이E)의 3개의 변이 도입 개소를 새롭게 선정했다.

[실시예 18] 당쇄 부가 변이형 PfuBGL의 조제(2)

서열 번호 6에 기재된 당쇄 부가 변이형 PfuBGL에 있어서의 실시예 17에서 결정한 변이 도입 개소에 당쇄 부가 서열을 도입하기 위해서 서열 번호 57 및 서열 번호 58로 나타내는 변이A 도입용 프라이머를 사용해서 부위 특이적 변이 도입법에 의해 N형 당쇄 부가 서열 변이의 도입을 행했다. 그 결과 서열 번호 51의 당쇄 부가 변이형 PfuBGL2A 유전자를 얻었다. 또한, 변이C에 대해서는 서열 번호 59 및 서열 번호 60으로 나타내는 변이C 도입용 프라이머를, 변이E에 대해서는 서열 번호 61 및 서열 번호 62로 나타내는 변이E 도입용 프라이머를 각각 사용해서 마찬가지로 부위 특이적 변이 도입법에 의해 N형 당쇄 부가 서열 변이의 도입을 행하여 서열 번호 53로 나타내는 당쇄 부가 변이형 PfuBGL2C 유전자 및 서열 번호 55로 나타내는 당쇄 부가 변이형 PfuBGL2E 유전자를 각각 얻었다. 이렇게 조제한 당쇄 부가 변이형 유전자를 사용해서 실시예 3과 마찬가지의 순서를 행함으로써 서열 번호 52로 나타내어지는 당쇄 부가 변이형 PfuBGL2A, 서열 번호 54로 나타내어지는 당쇄 부가 변이형 PfuBGL2C, 서열 번호 56으로 나타내어지는 당쇄 부가 변이형 PfuBGL2E를 각각 얻었다.

[실시예 19] 당쇄 부가 변이형 PfuBGL의 효소 활성(2)

실시예 4와 마찬가지로 해서 실시예 18에서 얻은 당쇄 부가 변이형 글루코시다아제 PfuBGL2A(서열 번호 52), 당쇄 부가 변이형 PfuBGL2C(서열 번호 54), 당쇄 부가 변이형 PfuBGL2E(서열 번호 56)의 효소 활성을 야생형 PfuBGL과 비교해서 측정했다. 당쇄 부가 변이형의 효소 활성은 야생형 PfuBGL의 효소 활성을 100으로 했을 때의 상대 활성(%)으로 해서 표 10에 나타냈다.

표 10에 나타내는 바와 같이 2개 이상의 당쇄가 부가된 변이형 글루코시다아제는 당쇄 부가 전의 야생형 글루코시다아제에 비해 효소 활성을 유지하고 있는 것을 알 수 있었다.

[실시예 20] 사상균유래 셀룰라아제 혼합물과 각종 당쇄 부가 변이형 글루코시다아제로 이루어지는 효소 조성물을 사용한 리그노셀룰로오스의 가수 분해(8)

실시예 6과 마찬가지로 해서 실시예 18에서 얻어진 당쇄 부가 변이형 글루코시다아제(PfuBGL2A, PfuBGL2C, PfuBGL2E)를 사용해서 참고예 1에서 조제한 리그노셀룰로오스 2(희황산 처리)의 가수 분해를 행했다. 반응 28시간 후에 있어서의 글루코오스 생성량(g/L)을 표 11에 나타냈다.

표 11에 나타내는 바와 같이 당쇄가 2개 이상 부가된 변이형 글루코시다아제(서열 번호 52, 서열 번호 54, 서열 번호 56)에 있어서도 당쇄 수식이 없는 야생형 글루코시다아제(비교예 1; 글루코오스 생성량: 3g/L)에 비해 리그노셀룰로오스에 대한 분해 효율이 대폭 향상되어 있는 것이 판명되었다.

[실시예 21] 당쇄 부가 변이형 글루코시다아제의 리그노셀룰로오스에 대한 흡착성의 평가

결정 셀룰로오스(아비셀) 및 참고예 1에서 조제한 리그노셀룰로오스 1～3에 대한 당쇄 부가 변이형 글루코시다아제의 흡착성을 평가했다. 글루코시다아제는 실시예 1에서 조제한 당쇄 부가 변이형 PfuBGL 및 비교예 1에서 조제한 야생형 PfuBGL을 사용하여 이들의 효소액은 비활성이 동등해지도록 조정하고, 아세트산 완충액(pH 5)을 첨가해서 최종 농도 100mM가 되도록 준비했다. 이 효소액을 각각 결정 셀룰로오스, 리그노셀룰로오스 1～3에 대하여 최종 농도(고형물 농도) 7.5중량%가 되도록 첨가하고, 이 혼합물을 50℃에서 1시간 보온 및 교반했다. 그 후 반응시킨 혼합물을 15000rpm으로 10분 원심 분리를 행하여 그 상청액의 셀로비오스 분해 활성을 측정했다. 셀로비오스 분해 활성은 결정 셀룰로오스, 리그노셀룰로오스 1～3을 포함하지 않는 효소액의 효소 활성을 100으로 해서 상대 활성(%)으로 평가했다.

표 12에 나타내는 바와 같이 야생형글루코시다아제에 대하여 당화 부가 변이형 글루코시다아제에서는 리그노셀룰로오스 1～3 중 어느 하나의 존재 하에 있어도 상청액 중에 포함되는 셀로비오스 분해 활성이 증가되는 것이 판명되었다. 또한, 결정 셀룰로오스인 아비셀에 있어서도 상청액 중에 포함되는 셀로비오스 분해 활성이 근소하게 증대했다. 본 결과로부터 당화 부가 변이형 글루코시다아제는 특히 리그노셀룰로오스(셀룰로오스 전처리물)에 대한 흡착성이 낮고, 고액 분리 후의 상청액으로부터의 회수성이 높은 것이 판명되었다.

[실시예 22] 당쇄 부가 변이형 글루코시다아제의 한외 여과막에 대한 흡착성의 평가

당쇄 부가 변이형 글루코시다아제의 한외 여과막에 대한 흡착성의 평가를 행했다. 한외 여과막은 VIVASPIN20(사토리우스사, 폴리에테르설폰제, 분획 분자량 10000Da)을 사용했다. 글루코시다아제는 실시예 1에서 조제한 당쇄 부가 변이형 PfuBGL 및 비교예 1에서 조제한 PfuBGL을 사용하고, 이들의 효소액은 비활성이 동등해지도록 조정하고, 아세트산 완충액(pH 5)을 첨가해서 최종 농도 50mM가 되도록 준비했다. 이 효소액 5㎖를 한외 여과막 VIVASPIN20에 옮기고, 4000G에서 10분간 원심 분리를 행했다. 원심 분리 후 한외 여과막의 비투과측에 남은 용액(약 100㎕ 이하)에 50mM 아세트산 완충액 3㎖를 첨가하고, 한외 여과막의 막면 및 용기 내벽의 잔존물을 피펫팅에 의해 회수했다. 회수한 잔존물을 5㎖로 메스실린더로 조정하고, 10㎕를 셀로비오스 분해 활성용에 샘플링했다. 이 일련의 조작을 7회 반복하고, 각 횟수에 있어서의 셀로비오스 분해 활성을 초기 활성을 100(%)으로 해서 상대 활성(%)으로 산출했다. 이 결과를 표 13에 나타낸다.

표 13에 나타내는 바와 같이 당쇄 수식이 없는 야생형 PfuBGL에서는 반복 횟수가 증가함에 따라 활성이 감소하는 것이 판명되었다(4회째 이후는 활성 소실). 한편, 당쇄 부가 변이형 PfuBGL에서는 7회 반복해도 활성을 유지하고 있었다. 즉, 당쇄 부가 변이형 글루코시다아제에서는 한외 여과막에 대한 흡착이 낮고, 그 때문에 가수 분해 반응 후에 한외 여과막을 사용해서 효소를 회수할 때에 회수성이 우수한 것이 판명되었다.

[실시예 23] 가수 분해물에 포함되는 효소 조성물의 한외 여과막에 의한 회수

실시예 7에서 행한 리그노셀룰로오스 1-3의 가수 분해물로부터 다음과 같이 효소 조성물의 회수를 행했다. 우선 가수 분해물 10㎖를 원심 분리하여 5㎖의 상청액을 얻었다. 이어서, 상청액을 평균 좁은 구멍 지름 0.2㎛ 정밀 여과막(밀리포어사제, PVDF막)을 통해 여과하여 여과액을 회수했다. 이 여과액 전량을 한외 여과막VIVASPIN20(폴리에테르설폰제, 분획 분자량 10000Da)에 옮겨 원심 분리를 행했다. 한외 여과막의 비투과측에 남은 잔존물을 회수하고, 셀로비오스 분해 활성을 측정했다. 활성은 투입한 효소 활성을 초기 효소 활성 100%로 해서 잔존물로서 회수한 효소 조성물의 효소 활성을 상대값(%)으로 산출했다.

표 14에 나타내는 바와 같이 당쇄 부가 변이형 글루코시다아제에서는 변이형 글루코시다아제에 비해 회수 효소의 활성이 대폭 증가하는 것이 판명되었다. 이것은 당쇄 부가 변이형 글루코시다아제는 실시예 21에 나타내는 바와 같이 리그노셀룰로오스에 대한 흡착성이 저하되어 있는 것, 실시예 22에 나타내는 바와 같이 한외 여과막에 대한 흡착성이 저하되어 있는 것에 의한 것으로 고려된다.

[실시예 24] 당쇄 부가 변이형 글루코시다아제의 당쇄 성분의 해석

실시예 1에 기재된 당쇄 부가 PfuBGL의 당쇄 구조를 해석했다. 당쇄 부가PfuBGL을 -80℃에서 동결 건조한 샘플 1.33㎎에 정제수 1.33㎖를 첨가하고, 1㎎/㎖ 시료 용액을 조정했다. 이 시료 용액 중의 중성당 및 아미노당의 정량을 각각 이하의 순서로 실시했다.

1. 중성당

1㎎/㎖ 시료 용액 100㎕를 시험관에 옮겨 감압 건고를 행하고, 그 후 2M 트리플루오로아세트산을 200㎕ 첨가했다. 이 시험관을 질소 치환하고, 시험관을 감압 봉관했다. 그 후 100℃에서 6시간 가수 분해를 행하고, 그 후 다시 감압 건고했다. 얻어진 잔사에 정제수 200㎕를 첨가하고, 잔사를 용해시킨 후 0.22㎛의 필터로 여과했다. 여과액을 정제수로 10배 희석한 샘플을 이하의 조건으로 분석했다.

분석 기기는 HPLC 시스템 LC20A 시스템(가부시키가이샤 시마즈 세이사쿠쇼), 분광 형광 광도계 RF-10AXL(가부시키가이샤 시마즈 세이사쿠쇼)을 사용했다.

분석 조건은 TSK-gel Sugar AXG 4.6mmI.D.x 15㎝(토소 가부시키가이샤), 컬럼 온도 70℃, 이동상 0.6M 붕산 칼륨 완충액(pH 8.7), 이동상 유속 0.4㎖/min으로 행했다.

포스트컬럼 표식은 반응 시약으로서 1중량% 아르기닌, 3중량% 붕산을 사용하고, 반응 시약 유속 0.5㎖/min, 반응 온도 150℃에서 행했다. 또한, 검출 파장은 여기 320㎚, 검출 430㎚으로 행했다. 중성당의 정량은 각 중성당 표준품과의 비교에 의해 실시했다.

2. 아미노당

1㎎/㎖ 시료 용액 100㎕를 시험관에 옮겨 감압 건고를 행하고, 그 후 4M 트리 염산을 200㎕ 첨가했다. 이 시험관을 질소 치환하고, 시험관을 감압 봉관했다. 그 후 100℃에서 6시간 가수 분해를 행하고, 그 후 다시 감압 건고했다. 얻어진 잔사에 정제수 200㎕를 첨가하고, 잔사를 용해시킨 후 0.22㎛의 필터로 여과했다.

분석 기기는 HPLC 시스템 LC20A 시스템(가부시키가이샤 시마즈 세이사쿠쇼), 분광 형광광도계 RF-10AXL(가부시키가이샤 시마즈 세이사쿠쇼)을 사용했다.

분석 조건은 TSK-gel SCX 6mmI.D.x 15㎝(토소 가부시키가이샤), 컬럼 온도 60℃, 이동상 0.16M 붕산 칼륨 완충액(pH 7.6), 이동상 유속 0.3㎖/min으로 행했다.

포스트컬럼 표식은 반응 시약으로서 1중량% 아르기닌, 3중량% 붕산을 사용해서 반응 시약 유속 0.5㎖/min, 반응 온도 150℃에서 행했다. 또한, 검출 파장은 여기 320㎚, 검출 430㎚로 행했다. 중성당의 정량은 각 중성당 표준품과의 비교에 의해 실시했다.

표 15에 나타내는 바와 같이 실시예 1에서 얻어진 당쇄 변이형 PfuBGL의 당쇄를 구성하는 중성당의 주성분은 만노스인 것이 판명되었다. 또한, N-글루코사민에 대한 만노스의 구성비로부터 당쇄 변이형 PfuBGL은 고 만노스형 당쇄인 것이 판명되었다.

본 발명에 있어서의 당쇄 부가 호열성 균유래 변이형 글루코시다아제는 셀룰로오스 분해에 의한 당액의 제조에 사용할 수 있다. 셀룰로오스 분해 효율을 대폭 향상시키는 효과에 의해 효소 비용을 대폭 삭감하는 것이 가능하기 때문에 산업상 대단히 유익하다.

본 명세서에서 인용한 모든 간행물, 특허 및 특허출원을 그대로 참고로서 본 명세서에 있어서 넣는 것으로 한다.

SEQUENCE LISTING <110> Toray Industories, Inc. National Institute of Advanced Industrial Science and Technology <120> Glycosylated glucosidase derived from thermophile, Production Method and Cellulase Composition <130> PH-4632-PCT <150> JP 2010-044242 <151> 2010-03-01 <160> 62 <170> PatentIn version 3.1 <210> 1 <211> 466 <212> PRT <213> Trichoderma reesei <400> 1 Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln 1 5 10 15 Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp 20 25 30 Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val 35 40 45 Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu 50 55 60 Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg 65 70 75 80 Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile 85 90 95 Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr 100 105 110 Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln 115 120 125 Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu 130 135 140 Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp 145 150 155 160 Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser 165 170 175 Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val 180 185 190 Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg 195 200 205 Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu 210 215 220 Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys 225 230 235 240 Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp 245 250 255 Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly 260 265 270 Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly 275 280 285 Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg 290 295 300 His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp 305 310 315 320 Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln 325 330 335 Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val 340 345 350 Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn 355 360 365 Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu 370 375 380 Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met 385 390 395 400 Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala 405 410 415 Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg 420 425 430 Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro 435 440 445 Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala 450 455 460 Ala Ala 465 <210> 2 <211> 434 <212> PRT <213> Aspergillus niger <400> 2 Met Leu Pro Lys Asp Leu Gln Trp Gly Phe Ala Lys Ala Ala Tyr Gln 1 5 10 15 Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp 20 25 30 Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val 35 40 45 Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu 50 55 60 Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Ser Arg Ile 65 70 75 80 Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile Asp His 85 90 95 Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr Pro Phe 100 105 110 Ile Thr Leu Phe His Trp Asp Leu Leu His Gln Arg Tyr Gly Gly Leu 115 120 125 Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu Asn Tyr Ala Arg Val 130 135 140 Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp Asn Glu Pro Leu Cys 145 150 155 160 Ser Ala Ile Pro Gly Tyr Gly Ser Gly Ser Phe Ala Pro Gly Arg Gln 165 170 175 Ser Thr Ser Glu Pro Trp Thr Val Gly His Asn Ile Leu Val Ala His 180 185 190 Gly Arg Ala Val Lys Ala Tyr Arg Asp Asp Phe Lys Pro Ala Ser Gly 195 200 205 Asp Gly Gln Ile Gly Ile Val Leu Asn Gly Asp Phe Thr Tyr Pro Trp 210 215 220 Asp Ala Ala Asp Pro Ala Asp Lys Glu Arg Leu Glu Phe Phe Thr Ala 225 230 235 240 Trp Phe Ala Asp Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg 245 250 255 Lys Gln Leu Gly Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala 260 265 270 Leu Val His Gly Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser 275 280 285 Asn Tyr Ile Arg His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val 290 295 300 Gly Asn Val Asp Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly 305 310 315 320 Pro Glu Thr Gln Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg 325 330 335 Asp Phe Leu Val Trp Thr Ser Lys Arg Tyr Gly Ser Pro Pro Ile Tyr 340 345 350 Val Thr Glu Asn Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Asn 355 360 365 Glu Lys Ile Leu Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr 370 375 380 Ile Arg Ala Met Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Arg 385 390 395 400 Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro 405 410 415 Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala 420 425 430 Ala Ala <210> 3 <211> 1419 <212> DNA <213> Pyrococcus furiosus <400> 3 atggcaaagt tcccaaaaaa cttcatgttt ggatattctt ggtctggttt ccagtttgag 60 atgggactgc caggaagtga agtggaaagc gactggtggg tgtgggttca cgacaaggag 120 aacatagcat caggtctagt aagtggagat ctaccagaga acggcccagc atattggcac 180 ctctataagc aagatcatga cattgcagaa aagctaggaa tggattgtat tagaggtggc 240 attgagtggg caagaatttt tccaaagcca acatttgacg ttaaagttga tgtggaaaag 300 gatgaagaag gcaacataat ttccgtagac gttccagaga gtacaataaa agagctagag 360 aaaattgcca acatggaggc ccttgaacat tatcgcaaga tttactcaga ctggaaggag 420 aggggcaaaa ccttcatatt aaacctctac cactggcctc ttccattatg gattcatgac 480 ccaattgcag taaggaaact tggcccggat agggctcctg caggatggtt agatgagaag 540 acagtggtag agtttgtgaa gtttgccgcc ttcgttgctt atcaccttga tgacctcgtt 600 gacatgtgga gcacaatgaa cgaaccaaac gtagtctaca atcaaggtta cattaatcta 660 cgttcaggat ttccaccagg atatctaagc tttgaagcag cagaaaaggc aaaattcaac 720 ttaattcagg ctcacatcgg agcatatgat gccataaaag agtattcaga aaaatccgtg 780 ggagtgatat acgcctttgc ttggcacgat cctctagcgg aggagtataa ggatgaagta 840 gaggaaatca gaaagaaaga ctatgagttt gtaacaattc tacactcaaa aggaaagcta 900 gactggatcg gcgtaaacta ctactccagg ctggtatatg gagccaaaga tggacaccta 960 gttcctttac ctggatatgg atttatgagt gagagaggag gatttgcaaa gtcaggaaga 1020 cctgctagtg actttggatg ggaaatgtac ccagagggcc ttgagaacct tcttaagtat 1080 ttaaacaatg cctacgagct accaatgata attacagaga acggtatggc cgatgcagca 1140 gatagataca ggccacacta tctcgtaagc catctaaagg cagtttacaa tgctatgaaa 1200 gaaggtgctg atgttagagg gtatctccac tggtctctaa cagacaacta cgaatgggcc 1260 caagggttca ggatgagatt tggattggtt tacgtggatt tcgagacaaa gaagagatat 1320 ttaaggccaa gcgccctggt attcagagaa atagccactc aaaaagaaat tccagaagaa 1380 ttagctcacc tcgcagacct caaatttgtt acaagaaag 1419 <210> 4 <211> 473 <212> PRT <213> Pyrococcus furiosus <400> 4 Met Ala Lys Phe Pro Lys Asn Phe Met Phe Gly Tyr Ser Trp Ser Gly 1 5 10 15 Phe Gln Phe Glu Met Gly Leu Pro Gly Ser Glu Val Glu Ser Asp Trp 20 25 30 Trp Val Trp Val His Asp Lys Glu Asn Ile Ala Ser Gly Leu Val Ser 35 40 45 Gly Asp Leu Pro Glu Asn Gly Pro Ala Tyr Trp His Leu Tyr Lys Gln 50 55 60 Asp His Asp Ile Ala Glu Lys Leu Gly Met Asp Cys Ile Arg Gly Gly 65 70 75 80 Ile Glu Trp Ala Arg Ile Phe Pro Lys Pro Thr Phe Asp Val Lys Val 85 90 95 Asp Val Glu Lys Asp Glu Glu Gly Asn Ile Ile Ser Val Asp Val Pro 100 105 110 Glu Ser Thr Ile Lys Glu Leu Glu Lys Ile Ala Asn Met Glu Ala Leu 115 120 125 Glu His Tyr Arg Lys Ile Tyr Ser Asp Trp Lys Glu Arg Gly Lys Thr 130 135 140 Phe Ile Leu Asn Leu Tyr His Trp Pro Leu Pro Leu Trp Ile His Asp 145 150 155 160 Pro Ile Ala Val Arg Lys Leu Gly Pro Asp Arg Ala Pro Ala Gly Trp 165 170 175 Leu Asp Glu Lys Thr Val Val Glu Phe Val Lys Phe Ala Ala Phe Val 180 185 190 Ala Tyr His Leu Asp Asp Leu Val Asp Met Trp Ser Thr Met Asn Glu 195 200 205 Pro Asn Val Val Tyr Asn Gln Gly Tyr Ile Asn Leu Arg Ser Gly Phe 210 215 220 Pro Pro Gly Tyr Leu Ser Phe Glu Ala Ala Glu Lys Ala Lys Phe Asn 225 230 235 240 Leu Ile Gln Ala His Ile Gly Ala Tyr Asp Ala Ile Lys Glu Tyr Ser 245 250 255 Glu Lys Ser Val Gly Val Ile Tyr Ala Phe Ala Trp His Asp Pro Leu 260 265 270 Ala Glu Glu Tyr Lys Asp Glu Val Glu Glu Ile Arg Lys Lys Asp Tyr 275 280 285 Glu Phe Val Thr Ile Leu His Ser Lys Gly Lys Leu Asp Trp Ile Gly 290 295 300 Val Asn Tyr Tyr Ser Arg Leu Val Tyr Gly Ala Lys Asp Gly His Leu 305 310 315 320 Val Pro Leu Pro Gly Tyr Gly Phe Met Ser Glu Arg Gly Gly Phe Ala 325 330 335 Lys Ser Gly Arg Pro Ala Ser Asp Phe Gly Trp Glu Met Tyr Pro Glu 340 345 350 Gly Leu Glu Asn Leu Leu Lys Tyr Leu Asn Asn Ala Tyr Glu Leu Pro 355 360 365 Met Ile Ile Thr Glu Asn Gly Met Ala Asp Ala Ala Asp Arg Tyr Arg 370 375 380 Pro His Tyr Leu Val Ser His Leu Lys Ala Val Tyr Asn Ala Met Lys 385 390 395 400 Glu Gly Ala Asp Val Arg Gly Tyr Leu His Trp Ser Leu Thr Asp Asn 405 410 415 Tyr Glu Trp Ala Gln Gly Phe Arg Met Arg Phe Gly Leu Val Tyr Val 420 425 430 Asp Phe Glu Thr Lys Lys Arg Tyr Leu Arg Pro Ser Ala Leu Val Phe 435 440 445 Arg Glu Ile Ala Thr Gln Lys Glu Ile Pro Glu Glu Leu Ala His Leu 450 455 460 Ala Asp Leu Lys Phe Val Thr Arg Lys 465 470 <210> 5 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> DNA encording mutant beta-glucosidase having glycosylation site. <400> 5 atggcaaagt tcccaaaaaa cttcatgttt ggatattctt ggtctggttt ccagtttgag 60 atgggactgc caggaagtga agtggaaagc gactggtggg tgtgggttca cgacaaggag 120 aacatagcat caggtctagt aagtggagat ctaccagaga acggcccagc atattggaac 180 cgcactaagc aagatcatga cattgcagaa aagctaggaa tggattgtat tagaggtggc 240 attgagtggg caagaatttt tccaaagcca acatttgacg ttaaagttga tgtggaaaag 300 gatgaagaag gcaacataat ttccgtagac gttccagaga gtacaataaa agagctagag 360 aaaattgcca acatggaggc ccttgaacat tatcgcaaga tttactcaga ctggaaggag 420 aggggcaaaa ccttcatatt aaacctctac cactggcctc ttccattatg gattcatgac 480 ccaattgcag taaggaaact tggcccggat agggctcctg caggatggtt agatgagaag 540 acagtggtag agtttgtgaa gtttgccgcc ttcgttgctt atcaccttga tgacctcgtt 600 gacatgtgga gcacaatgaa cgaaccaaac gtagtctaca atcaaggtta cattaatcta 660 cgttcaggat ttccaccagg atatctaagc tttgaagcag cagaaaaggc aaaattcaac 720 ttaattcagg ctcacatcgg agcatatgat gccataaaag agtattcaga aaaatccgtg 780 ggagtgatat acgcctttgc ttggcacgat cctctagcgg aggagtataa ggatgaagta 840 gaggaaatca gaaagaaaga ctatgagttt gtaacaattc tacactcaaa aggaaagcta 900 gactggatcg gcgtaaacta ctactccagg ctggtatatg gagccaaaga tggacaccta 960 gttcctttac ctggatatgg atttatgagt gagagaggag gatttgcaaa gtcaggaaga 1020 cctgctagtg actttggatg ggaaatgtac ccagagggcc ttgagaacct tcttaagtat 1080 ttaaacaatg cctacgagct accaatgata attacagaga acggtatggc cgatgcagca 1140 gatagataca ggccacacta tctcgtaagc catctaaagg cagtttacaa tgctatgaaa 1200 gaaggtgctg atgttagagg gtatctccac tggtctctaa cagacaacta cgaatgggcc 1260 caagggttca ggatgagatt tggattggtt tacgtggatt tcgagacaaa gaagagatat 1320 ttaaggccaa gcgccctggt attcagagaa atagccactc aaaaagaaat tccagaagaa 1380 ttagctcacc tcgcagacct caaatttgtt acaagaaag 1419 <210> 6 <211> 473 <212> PRT <213> Artificial Sequence <220> <223> Mutant beta-glucosidase having glycosylation site. <220> <221> CARBOHYD <222> (60)..(62) <223> <400> 6 Met Ala Lys Phe Pro Lys Asn Phe Met Phe Gly Tyr Ser Trp Ser Gly 1 5 10 15 Phe Gln Phe Glu Met Gly Leu Pro Gly Ser Glu Val Glu Ser Asp Trp 20 25 30 Trp Val Trp Val His Asp Lys Glu Asn Ile Ala Ser Gly Leu Val Ser 35 40 45 Gly Asp Leu Pro Glu Asn Gly Pro Ala Tyr Trp Asn Arg Thr Lys Gln 50 55 60 Asp His Asp Ile Ala Glu Lys Leu Gly Met Asp Cys Ile Arg Gly Gly 65 70 75 80 Ile Glu Trp Ala Arg Ile Phe Pro Lys Pro Thr Phe Asp Val Lys Val 85 90 95 Asp Val Glu Lys Asp Glu Glu Gly Asn Ile Ile Ser Val Asp Val Pro 100 105 110 Glu Ser Thr Ile Lys Glu Leu Glu Lys Ile Ala Asn Met Glu Ala Leu 115 120 125 Glu His Tyr Arg Lys Ile Tyr Ser Asp Trp Lys Glu Arg Gly Lys Thr 130 135 140 Phe Ile Leu Asn Leu Tyr His Trp Pro Leu Pro Leu Trp Ile His Asp 145 150 155 160 Pro Ile Ala Val Arg Lys Leu Gly Pro Asp Arg Ala Pro Ala Gly Trp 165 170 175 Leu Asp Glu Lys Thr Val Val Glu Phe Val Lys Phe Ala Ala Phe Val 180 185 190 Ala Tyr His Leu Asp Asp Leu Val Asp Met Trp Ser Thr Met Asn Glu 195 200 205 Pro Asn Val Val Tyr Asn Gln Gly Tyr Ile Asn Leu Arg Ser Gly Phe 210 215 220 Pro Pro Gly Tyr Leu Ser Phe Glu Ala Ala Glu Lys Ala Lys Phe Asn 225 230 235 240 Leu Ile Gln Ala His Ile Gly Ala Tyr Asp Ala Ile Lys Glu Tyr Ser 245 250 255 Glu Lys Ser Val Gly Val Ile Tyr Ala Phe Ala Trp His Asp Pro Leu 260 265 270 Ala Glu Glu Tyr Lys Asp Glu Val Glu Glu Ile Arg Lys Lys Asp Tyr 275 280 285 Glu Phe Val Thr Ile Leu His Ser Lys Gly Lys Leu Asp Trp Ile Gly 290 295 300 Val Asn Tyr Tyr Ser Arg Leu Val Tyr Gly Ala Lys Asp Gly His Leu 305 310 315 320 Val Pro Leu Pro Gly Tyr Gly Phe Met Ser Glu Arg Gly Gly Phe Ala 325 330 335 Lys Ser Gly Arg Pro Ala Ser Asp Phe Gly Trp Glu Met Tyr Pro Glu 340 345 350 Gly Leu Glu Asn Leu Leu Lys Tyr Leu Asn Asn Ala Tyr Glu Leu Pro 355 360 365 Met Ile Ile Thr Glu Asn Gly Met Ala Asp Ala Ala Asp Arg Tyr Arg 370 375 380 Pro His Tyr Leu Val Ser His Leu Lys Ala Val Tyr Asn Ala Met Lys 385 390 395 400 Glu Gly Ala Asp Val Arg Gly Tyr Leu His Trp Ser Leu Thr Asp Asn 405 410 415 Tyr Glu Trp Ala Gln Gly Phe Arg Met Arg Phe Gly Leu Val Tyr Val 420 425 430 Asp Phe Glu Thr Lys Lys Arg Tyr Leu Arg Pro Ser Ala Leu Val Phe 435 440 445 Arg Glu Ile Ala Thr Gln Lys Glu Ile Pro Glu Glu Leu Ala His Leu 450 455 460 Ala Asp Leu Lys Phe Val Thr Arg Lys 465 470 <210> 7 <211> 1446 <212> DNA <213> Thermosphaera aggregans <400> 7 atgaaattcc ccaaagactt catgataggc tactcatctt caccgtttca atttgaagct 60 ggtattcccg ggtccgagga tccgaatagt gattggtggg tatgggtgca tgatccggag 120 aacacagcag ctggactagt cagcggcgat tttcccgaga acggcccagg ttactggaat 180 ttaaaccaaa atgaccacga cctggctgag aagctggggg ttaacactat tagagtaggc 240 gttgagtgga gtaggatttt tccaaagcca actttcaatg ttaaagtccc tgtagagaga 300 gatgagaacg gcagcattgt tcacgtagat gtcgatgata aagcggttga aagacttgat 360 gaattagcca acaaggaggc cgtaaaccat tacgtagaaa tgtataaaga ctgggttgaa 420 agaggtagaa aacttatact caatttatac cattggcccc tgcctctctg gcttcacaac 480 ccaatcatgg tgagaagaat gggcccggac agagcgccct caggctggct taacgaggag 540 tccgtggtgg agtttgccaa atacgccgca tacattgctt ggaaaatggg cgagctacct 600 gttatgtgga gcaccatgaa cgaacccaac gtcgtttatg agcaaggata catgttcgtt 660 aaagggggtt tcccacccgg ctacttgagt ttggaagctg ctgataaggc caggagaaat 720 atgatccagg ctcatgcacg ggcctatgac aatattaaac gcttcagtaa gaaacctgtt 780 ggactaatat acgctttcca atggttcgaa ctattagagg gtccagcaga agtatttgat 840 aagtttaaga gctctaagtt atactatttc acagacatag tatcgaaggg tagttcaatc 900 atcaatgttg aatacaggag agatcttgcc aataggctag actggttggg cgttaactac 960 tatagccgtt tagtctacaa aatcgtcgat gacaaaccta taatcctgca cgggtatgga 1020 ttcctttgta cacctggggg gatcagcccg gctgaaaatc cttgtagcga ttttgggtgg 1080 gaggtgtatc ctgaaggact ctacctactt ctaaaagaac tttacaaccg atacggggta 1140 gacttgatcg tgaccgagaa cggtgtttca gacagcaggg atgcgttgag accggcatac 1200 ctggtctcgc atgtttacag cgtatggaaa gccgctaacg agggcattcc cgtcaaaggc 1260 tacctccact ggagcttgac agacaattac gagtgggccc agggcttcag gcagaaattc 1320 ggtttagtca tggttgactt caaaactaag aaaaggtatc tccgcccaag cgccctagtg 1380 ttccgggaga tcgcaacgca taacggaata ccggatgagc tacagcatct tacactgatc 1440 cagtaa 1446 <210> 8 <211> 481 <212> PRT <213> Thermosphaera aggregans <400> 8 Met Lys Phe Pro Lys Asp Phe Met Ile Gly Tyr Ser Ser Ser Pro Phe 1 5 10 15 Gln Phe Glu Ala Gly Ile Pro Gly Ser Glu Asp Pro Asn Ser Asp Trp 20 25 30 Trp Val Trp Val His Asp Pro Glu Asn Thr Ala Ala Gly Leu Val Ser 35 40 45 Gly Asp Phe Pro Glu Asn Gly Pro Gly Tyr Trp Asn Leu Asn Gln Asn 50 55 60 Asp His Asp Leu Ala Glu Lys Leu Gly Val Asn Thr Ile Arg Val Gly 65 70 75 80 Val Glu Trp Ser Arg Ile Phe Pro Lys Pro Thr Phe Asn Val Lys Val 85 90 95 Pro Val Glu Arg Asp Glu Asn Gly Ser Ile Val His Val Asp Val Asp 100 105 110 Asp Lys Ala Val Glu Arg Leu Asp Glu Leu Ala Asn Lys Glu Ala Val 115 120 125 Asn His Tyr Val Glu Met Tyr Lys Asp Trp Val Glu Arg Gly Arg Lys 130 135 140 Leu Ile Leu Asn Leu Tyr His Trp Pro Leu Pro Leu Trp Leu His Asn 145 150 155 160 Pro Ile Met Val Arg Arg Met Gly Pro Asp Arg Ala Pro Ser Gly Trp 165 170 175 Leu Asn Glu Glu Ser Val Val Glu Phe Ala Lys Tyr Ala Ala Tyr Ile 180 185 190 Ala Trp Lys Met Gly Glu Leu Pro Val Met Trp Ser Thr Met Asn Glu 195 200 205 Pro Asn Val Val Tyr Glu Gln Gly Tyr Met Phe Val Lys Gly Gly Phe 210 215 220 Pro Pro Gly Tyr Leu Ser Leu Glu Ala Ala Asp Lys Ala Arg Arg Asn 225 230 235 240 Met Ile Gln Ala His Ala Arg Ala Tyr Asp Asn Ile Lys Arg Phe Ser 245 250 255 Lys Lys Pro Val Gly Leu Ile Tyr Ala Phe Gln Trp Phe Glu Leu Leu 260 265 270 Glu Gly Pro Ala Glu Val Phe Asp Lys Phe Lys Ser Ser Lys Leu Tyr 275 280 285 Tyr Phe Thr Asp Ile Val Ser Lys Gly Ser Ser Ile Ile Asn Val Glu 290 295 300 Tyr Arg Arg Asp Leu Ala Asn Arg Leu Asp Trp Leu Gly Val Asn Tyr 305 310 315 320 Tyr Ser Arg Leu Val Tyr Lys Ile Val Asp Asp Lys Pro Ile Ile Leu 325 330 335 His Gly Tyr Gly Phe Leu Cys Thr Pro Gly Gly Ile Ser Pro Ala Glu 340 345 350 Asn Pro Cys Ser Asp Phe Gly Trp Glu Val Tyr Pro Glu Gly Leu Tyr 355 360 365 Leu Leu Leu Lys Glu Leu Tyr Asn Arg Tyr Gly Val Asp Leu Ile Val 370 375 380 Thr Glu Asn Gly Val Ser Asp Ser Arg Asp Ala Leu Arg Pro Ala Tyr 385 390 395 400 Leu Val Ser His Val Tyr Ser Val Trp Lys Ala Ala Asn Glu Gly Ile 405 410 415 Pro Val Lys Gly Tyr Leu His Trp Ser Leu Thr Asp Asn Tyr Glu Trp 420 425 430 Ala Gln Gly Phe Arg Gln Lys Phe Gly Leu Val Met Val Asp Phe Lys 435 440 445 Thr Lys Lys Arg Tyr Leu Arg Pro Ser Ala Leu Val Phe Arg Glu Ile 450 455 460 Ala Thr His Asn Gly Ile Pro Asp Glu Leu Gln His Leu Thr Leu Ile 465 470 475 480 Gln <210> 9 <211> 1461 <212> DNA <213> Caldivirga maquilingensis <400> 9 atgattaagt tcccaagcga cttcagattc ggcttctcca cagtgggtac tcagcatgag 60 atgggtaccc ctggttctga attcgtaagt gactggtatg tgtggcttca tgaccctgag 120 aacattgctt cgggcttagt tagcggtgat ttacctgaac atgggccagg ttactgggac 180 ttgtataagc aggaccactc aatagctagg gatcttgggc ttgatgcagc atggataact 240 attgagtggg ctagggtgtt ccctaagccg acctttgacg ttaaggttaa ggttgatgag 300 gatgatggag gtaacgtggt tgacgttgag gttaatgaat cagcattaga ggagttacgc 360 aggctagctg acttaaatgc tgttaatcac tataggggga ttttaagtga ttggaaggag 420 aggggtggtt tactggtgat taacctttac cactgggcta tgcctacgtg gcttcatgac 480 ccaatagccg ttaggaagaa tggacctgat agagccccct ccggttggct tgataagaga 540 tccgttattg agttcactaa gttcgcagcc ttcatagccc atgagttagg tgacttagct 600 gacatgtggt atacgatgaa tgaacctggg gtagtgataa ctgagggtta cctttacgtt 660 aagtcaggct tcccaccagg ttacctggac ttaaactccc tagccactgc gggtaagcat 720 ttaattgagg ctcatgccag agcctacgac gccattaaag cctactcaag gaaaccagtg 780 ggcctagtct actccttcgc agactatcag ccgcttaggc agggtgatga ggaggctgtt 840 aaggaggcta agggacttga ctactcattc ttcgacgctc caattaaggg tgaattaatg 900 ggggttacta gggatgactt gaagggtagg cttgactgga ttggggtaaa ctactacact 960 agggccgtat tgaggaggag gcaggatgct ggtcgggcat cagtagccgt ggtggatgga 1020 ttcggctact cctgtgaacc tggaggcgta tctaatgata ggagaccatg cagtgacttc 1080 ggctgggaaa tataccctga gggtgtttac aatgtcttaa tggacctatg gaggaggtat 1140 aggatgccca tgtacatcac tgagaacggt atagctgatg agcatgataa gtggaggtca 1200 tggttcatag tatcgcacct gtatcaaatt cacagggcca tggaggaggg ggtggatgtt 1260 agagggtact tccactggaa cctaatagat aacttggagt gggctgcagg atataggatg 1320 aggttcggcc tagtttacgt tgactatgca accaagagga ggtattttag gccaagcgcc 1380 ctggttatga gggaggtggc taaacagaag gctataccgg attacttaga gcattacatt 1440 aaaccaccta gaattgaatg a 1461 <210> 10 <211> 486 <212> PRT <213> Caldivirga maquilingensis <400> 10 Met Ile Lys Phe Pro Ser Asp Phe Arg Phe Gly Phe Ser Thr Val Gly 1 5 10 15 Thr Gln His Glu Met Gly Thr Pro Gly Ser Glu Phe Val Ser Asp Trp 20 25 30 Tyr Val Trp Leu His Asp Pro Glu Asn Ile Ala Ser Gly Leu Val Ser 35 40 45 Gly Asp Leu Pro Glu His Gly Pro Gly Tyr Trp Asp Leu Tyr Lys Gln 50 55 60 Asp His Ser Ile Ala Arg Asp Leu Gly Leu Asp Ala Ala Trp Ile Thr 65 70 75 80 Ile Glu Trp Ala Arg Val Phe Pro Lys Pro Thr Phe Asp Val Lys Val 85 90 95 Lys Val Asp Glu Asp Asp Gly Gly Asn Val Val Asp Val Glu Val Asn 100 105 110 Glu Ser Ala Leu Glu Glu Leu Arg Arg Leu Ala Asp Leu Asn Ala Val 115 120 125 Asn His Tyr Arg Gly Ile Leu Ser Asp Trp Lys Glu Arg Gly Gly Leu 130 135 140 Leu Val Ile Asn Leu Tyr His Trp Ala Met Pro Thr Trp Leu His Asp 145 150 155 160 Pro Ile Ala Val Arg Lys Asn Gly Pro Asp Arg Ala Pro Ser Gly Trp 165 170 175 Leu Asp Lys Arg Ser Val Ile Glu Phe Thr Lys Phe Ala Ala Phe Ile 180 185 190 Ala His Glu Leu Gly Asp Leu Ala Asp Met Trp Tyr Thr Met Asn Glu 195 200 205 Pro Gly Val Val Ile Thr Glu Gly Tyr Leu Tyr Val Lys Ser Gly Phe 210 215 220 Pro Pro Gly Tyr Leu Asp Leu Asn Ser Leu Ala Thr Ala Gly Lys His 225 230 235 240 Leu Ile Glu Ala His Ala Arg Ala Tyr Asp Ala Ile Lys Ala Tyr Ser 245 250 255 Arg Lys Pro Val Gly Leu Val Tyr Ser Phe Ala Asp Tyr Gln Pro Leu 260 265 270 Arg Gln Gly Asp Glu Glu Ala Val Lys Glu Ala Lys Gly Leu Asp Tyr 275 280 285 Ser Phe Phe Asp Ala Pro Ile Lys Gly Glu Leu Met Gly Val Thr Arg 290 295 300 Asp Asp Leu Lys Gly Arg Leu Asp Trp Ile Gly Val Asn Tyr Tyr Thr 305 310 315 320 Arg Ala Val Leu Arg Arg Arg Gln Asp Ala Gly Arg Ala Ser Val Ala 325 330 335 Val Val Asp Gly Phe Gly Tyr Ser Cys Glu Pro Gly Gly Val Ser Asn 340 345 350 Asp Arg Arg Pro Cys Ser Asp Phe Gly Trp Glu Ile Tyr Pro Glu Gly 355 360 365 Val Tyr Asn Val Leu Met Asp Leu Trp Arg Arg Tyr Arg Met Pro Met 370 375 380 Tyr Ile Thr Glu Asn Gly Ile Ala Asp Glu His Asp Lys Trp Arg Ser 385 390 395 400 Trp Phe Ile Val Ser His Leu Tyr Gln Ile His Arg Ala Met Glu Glu 405 410 415 Gly Val Asp Val Arg Gly Tyr Phe His Trp Asn Leu Ile Asp Asn Leu 420 425 430 Glu Trp Ala Ala Gly Tyr Arg Met Arg Phe Gly Leu Val Tyr Val Asp 435 440 445 Tyr Ala Thr Lys Arg Arg Tyr Phe Arg Pro Ser Ala Leu Val Met Arg 450 455 460 Glu Val Ala Lys Gln Lys Ala Ile Pro Asp Tyr Leu Glu His Tyr Ile 465 470 475 480 Lys Pro Pro Arg Ile Glu 485 <210> 11 <211> 1476 <212> DNA <213> Sulfolobus acidocaldarius <400> 11 atgttatcat tcccaaaggg tttcaaattt ggctggtctc agtcgggatt ccagtctgaa 60 atgggaactc caggtagcga ggatccgaac agcgattggc acgtctgggt tcatgacagg 120 gagaacatag tctcacaggt tgtcagtgga gatttacccg aaaatggtcc agggtactgg 180 gggaactata agagatttca tgacgaagca gagaaaatag gactaaatgc agtgagaatt 240 aacgtagagt ggagtagaat atttcccaga ccactaccca agcctgaaat gcaaacaggg 300 actgataaag agaacagtcc tgtcattagc gtagacttaa atgagtctaa gctgagagaa 360 atggacaact acgctaatca tgaagcgtta tcacattaca ggcaaatact ggaggatcta 420 agaaacagag gatttcacat agtactgaac atgtatcatt ggactttgcc catatggttg 480 cacgacccta tcagagtgag gagaggagac tttacaggac caacaggttg gttaaactcc 540 aggacagttt atgagttcgc taggttctcg gcttacgtag cctggaaatt agatgatttg 600 gcgagtgaat atgcaacaat gaatgaacct aacgtggttt ggggagcagg ttacgctttt 660 cctagagcag gctttccacc taattacctt agcttcaggc tttcagaaat agctaaatgg 720 aatataattc aggctcatgc gagggcttat gacgccatca agagcgtatc aaaaaagagt 780 gtaggtataa tatatgcaaa cacatcatat tacccactca gaccacaaga taacgaagct 840 gtggaaatag cagagagatt gaacagatgg agtttctttg actccattat aaagggagag 900 ataactagtg agggacaaaa tgtcagagag gacttaagga acaggttaga ctggattggc 960 gtaaactatt acacgaggac tgtggtaaca aaagctgaga gtggttattt aacccttccg 1020 ggttatggag atcgttgtga aaggaactca ttgagtttag ctaacctccc taccagtgat 1080 ttcggttggg agttctttcc tgagggtcta tatgatgtac ttttgaagta ttggaatagg 1140 tatgggttac cattatacgt aatggagaac ggtatcgctg atgacgctga ctaccaaaga 1200 ccgtattact tagtatcaca tatctaccag gtgcacaggg ctttaaacga gggagtagat 1260 gtaagaggtt atcttcattg gtctttggca gataattatg agtggtcgtc aggtttttca 1320 atgaggttcg gtctacttaa ggtagattat ctaacaaaga gattgtactg gagaccttct 1380 gcattagttt acagggagat tactaggagt aacggtattc ctgaggagct ggaacatcta 1440 aacagagtac caccaataaa acctttgaga cattaa 1476 <210> 12 <211> 491 <212> PRT <213> Sulfolobus acidocaldarius <400> 12 Met Leu Ser Phe Pro Lys Gly Phe Lys Phe Gly Trp Ser Gln Ser Gly 1 5 10 15 Phe Gln Ser Glu Met Gly Thr Pro Gly Ser Glu Asp Pro Asn Ser Asp 20 25 30 Trp His Val Trp Val His Asp Arg Glu Asn Ile Val Ser Gln Val Val 35 40 45 Ser Gly Asp Leu Pro Glu Asn Gly Pro Gly Tyr Trp Gly Asn Tyr Lys 50 55 60 Arg Phe His Asp Glu Ala Glu Lys Ile Gly Leu Asn Ala Val Arg Ile 65 70 75 80 Asn Val Glu Trp Ser Arg Ile Phe Pro Arg Pro Leu Pro Lys Pro Glu 85 90 95 Met Gln Thr Gly Thr Asp Lys Glu Asn Ser Pro Val Ile Ser Val Asp 100 105 110 Leu Asn Glu Ser Lys Leu Arg Glu Met Asp Asn Tyr Ala Asn His Glu 115 120 125 Ala Leu Ser His Tyr Arg Gln Ile Leu Glu Asp Leu Arg Asn Arg Gly 130 135 140 Phe His Ile Val Leu Asn Met Tyr His Trp Thr Leu Pro Ile Trp Leu 145 150 155 160 His Asp Pro Ile Arg Val Arg Arg Gly Asp Phe Thr Gly Pro Thr Gly 165 170 175 Trp Leu Asn Ser Arg Thr Val Tyr Glu Phe Ala Arg Phe Ser Ala Tyr 180 185 190 Val Ala Trp Lys Leu Asp Asp Leu Ala Ser Glu Tyr Ala Thr Met Asn 195 200 205 Glu Pro Asn Val Val Trp Gly Ala Gly Tyr Ala Phe Pro Arg Ala Gly 210 215 220 Phe Pro Pro Asn Tyr Leu Ser Phe Arg Leu Ser Glu Ile Ala Lys Trp 225 230 235 240 Asn Ile Ile Gln Ala His Ala Arg Ala Tyr Asp Ala Ile Lys Ser Val 245 250 255 Ser Lys Lys Ser Val Gly Ile Ile Tyr Ala Asn Thr Ser Tyr Tyr Pro 260 265 270 Leu Arg Pro Gln Asp Asn Glu Ala Val Glu Ile Ala Glu Arg Leu Asn 275 280 285 Arg Trp Ser Phe Phe Asp Ser Ile Ile Lys Gly Glu Ile Thr Ser Glu 290 295 300 Gly Gln Asn Val Arg Glu Asp Leu Arg Asn Arg Leu Asp Trp Ile Gly 305 310 315 320 Val Asn Tyr Tyr Thr Arg Thr Val Val Thr Lys Ala Glu Ser Gly Tyr 325 330 335 Leu Thr Leu Pro Gly Tyr Gly Asp Arg Cys Glu Arg Asn Ser Leu Ser 340 345 350 Leu Ala Asn Leu Pro Thr Ser Asp Phe Gly Trp Glu Phe Phe Pro Glu 355 360 365 Gly Leu Tyr Asp Val Leu Leu Lys Tyr Trp Asn Arg Tyr Gly Leu Pro 370 375 380 Leu Tyr Val Met Glu Asn Gly Ile Ala Asp Asp Ala Asp Tyr Gln Arg 385 390 395 400 Pro Tyr Tyr Leu Val Ser His Ile Tyr Gln Val His Arg Ala Leu Asn 405 410 415 Glu Gly Val Asp Val Arg Gly Tyr Leu His Trp Ser Leu Ala Asp Asn 420 425 430 Tyr Glu Trp Ser Ser Gly Phe Ser Met Arg Phe Gly Leu Leu Lys Val 435 440 445 Asp Tyr Leu Thr Lys Arg Leu Tyr Trp Arg Pro Ser Ala Leu Val Tyr 450 455 460 Arg Glu Ile Thr Arg Ser Asn Gly Ile Pro Glu Glu Leu Glu His Leu 465 470 475 480 Asn Arg Val Pro Pro Ile Lys Pro Leu Arg His 485 490 <210> 13 <211> 1470 <212> DNA <213> Sulfolobus solfataricus <400> 13 atgtactcat ttccaaatag ctttaggttt ggttggtccc aggccggatt tcaatcagaa 60 atgggaacac cagggtcaga agatccaaat actgactggt ataaatgggt tcatgatcca 120 gaaaacatgg cagcgggatt agtaagtgga gatctaccag aaaatgggcc aggctactgg 180 ggaaactata agacatttca cgataatgca caaaaaatgg gattaaaaat agctagacta 240 aatgtggaat ggtctaggat atttcctaat ccattaccaa ggccacaaaa ctttgatgaa 300 tcaaaacaag atgtgacaga ggttgagata aacgaaaacg agttaaagag acttgacgag 360 tacgctaata aagacgcatt aaaccattac agggaaatat tcaaggatct taaaagtaga 420 ggactttact ttatactaaa catgtatcat tggccattac ctctatggtt acacgaccca 480 ataagagtaa gaagaggaga ttttactgga ccaagtggtt ggctaagtac tagaacagtt 540 tacgaattcg ctagattctc agcttatata gcttggaaat tcgatgatct agtggatgag 600 tactcaacaa tgaatgaacc taacgttgtt ggaggtttag gatacgttgg tgttaagtcc 660 ggttttcccc caggatacct aagctttgaa ctttcccgta gggcaatgta taacatcatt 720 caagctcacg caagagcgta tgatgggata aagagtgttt ctaaaaaacc agttggaatt 780 atttacgcta atagctcatt ccagccgtta acggataaag atatggaagc ggtagagatg 840 gctgaaaatg ataatagatg gtggttcttt gatgctataa taagaggtga gatcaccaga 900 ggaaacgaga agattgtaag agatgaccta aagggtagat tggattggat tggagttaat 960 tattacacta ggactgttgt gaagaggact gaaaagggat acgttagctt aggaggttac 1020 ggtcacggat gtgagaggaa ttctgtaagt ttagcgggat taccaaccag cgacttcggc 1080 tgggagttct tcccagaagg tttatatgac gttttgacga aatactggaa tagatatcat 1140 ctctatatgt acgttactga aaatggtatt gcggatgatg ccgattatca aaggccctat 1200 tatttagtat ctcacgttta tcaagttcat agagcaataa atagtggtgc agatgttaga 1260 gggtatttac attggtctct agctgataat tacgaatggg cttcaggatt ctctatgagg 1320 tttggtctgt taaaggtcga ttacaacact aagagactat actggagacc ctcagcacta 1380 gtatataggg aaatcgccac aaatggcgca ataactgatg aaatagagca cttaaatagc 1440 gtacctccag taaagccatt aaggcactaa 1470 <210> 14 <211> 489 <212> PRT <213> Sulfolobus solfataricus <400> 14 Met Tyr Ser Phe Pro Asn Ser Phe Arg Phe Gly Trp Ser Gln Ala Gly 1 5 10 15 Phe Gln Ser Glu Met Gly Thr Pro Gly Ser Glu Asp Pro Asn Thr Asp 20 25 30 Trp Tyr Lys Trp Val His Asp Pro Glu Asn Met Ala Ala Gly Leu Val 35 40 45 Ser Gly Asp Leu Pro Glu Asn Gly Pro Gly Tyr Trp Gly Asn Tyr Lys 50 55 60 Thr Phe His Asp Asn Ala Gln Lys Met Gly Leu Lys Ile Ala Arg Leu 65 70 75 80 Asn Val Glu Trp Ser Arg Ile Phe Pro Asn Pro Leu Pro Arg Pro Gln 85 90 95 Asn Phe Asp Glu Ser Lys Gln Asp Val Thr Glu Val Glu Ile Asn Glu 100 105 110 Asn Glu Leu Lys Arg Leu Asp Glu Tyr Ala Asn Lys Asp Ala Leu Asn 115 120 125 His Tyr Arg Glu Ile Phe Lys Asp Leu Lys Ser Arg Gly Leu Tyr Phe 130 135 140 Ile Leu Asn Met Tyr His Trp Pro Leu Pro Leu Trp Leu His Asp Pro 145 150 155 160 Ile Arg Val Arg Arg Gly Asp Phe Thr Gly Pro Ser Gly Trp Leu Ser 165 170 175 Thr Arg Thr Val Tyr Glu Phe Ala Arg Phe Ser Ala Tyr Ile Ala Trp 180 185 190 Lys Phe Asp Asp Leu Val Asp Glu Tyr Ser Thr Met Asn Glu Pro Asn 195 200 205 Val Val Gly Gly Leu Gly Tyr Val Gly Val Lys Ser Gly Phe Pro Pro 210 215 220 Gly Tyr Leu Ser Phe Glu Leu Ser Arg Arg Ala Met Tyr Asn Ile Ile 225 230 235 240 Gln Ala His Ala Arg Ala Tyr Asp Gly Ile Lys Ser Val Ser Lys Lys 245 250 255 Pro Val Gly Ile Ile Tyr Ala Asn Ser Ser Phe Gln Pro Leu Thr Asp 260 265 270 Lys Asp Met Glu Ala Val Glu Met Ala Glu Asn Asp Asn Arg Trp Trp 275 280 285 Phe Phe Asp Ala Ile Ile Arg Gly Glu Ile Thr Arg Gly Asn Glu Lys 290 295 300 Ile Val Arg Asp Asp Leu Lys Gly Arg Leu Asp Trp Ile Gly Val Asn 305 310 315 320 Tyr Tyr Thr Arg Thr Val Val Lys Arg Thr Glu Lys Gly Tyr Val Ser 325 330 335 Leu Gly Gly Tyr Gly His Gly Cys Glu Arg Asn Ser Val Ser Leu Ala 340 345 350 Gly Leu Pro Thr Ser Asp Phe Gly Trp Glu Phe Phe Pro Glu Gly Leu 355 360 365 Tyr Asp Val Leu Thr Lys Tyr Trp Asn Arg Tyr His Leu Tyr Met Tyr 370 375 380 Val Thr Glu Asn Gly Ile Ala Asp Asp Ala Asp Tyr Gln Arg Pro Tyr 385 390 395 400 Tyr Leu Val Ser His Val Tyr Gln Val His Arg Ala Ile Asn Ser Gly 405 410 415 Ala Asp Val Arg Gly Tyr Leu His Trp Ser Leu Ala Asp Asn Tyr Glu 420 425 430 Trp Ala Ser Gly Phe Ser Met Arg Phe Gly Leu Leu Lys Val Asp Tyr 435 440 445 Asn Thr Lys Arg Leu Tyr Trp Arg Pro Ser Ala Leu Val Tyr Arg Glu 450 455 460 Ile Ala Thr Asn Gly Ala Ile Thr Asp Glu Ile Glu His Leu Asn Ser 465 470 475 480 Val Pro Pro Val Lys Pro Leu Arg His 485 <210> 15 <211> 1488 <212> DNA <213> Picrophilus torridus <400> 15 atgttaccca agaacttttt acttggcttt tctctggctg gctttcagtc tgaaatgggc 60 atatcagatc ctgatagcaa ttcagattgg tggttatggg tacatgaccc ggtgaatata 120 aggactggac ttgtatctgg tgacttacct gaaaatggaa taggatactg ggatctttac 180 aaaaaatata atggtctggc tgttcaaaca ggaatgaatg ctgcaaggct tggagttgaa 240 tggagcagga tatttccaaa aagtactgaa gaagtaaagg tgatggaaga ttacaaagat 300 gatgatttaa tttccgtgga tgttaatgag ggaagtcttg aaaaacttga cagactggca 360 aatcaaaagg caattaatag atatatggaa atcttcaata atatcaagga aaataatatg 420 acgctaatag tgaatgttta ccattggcca ataccaatat atcttcacga tccaatagaa 480 gctaggaata gtggactttc aaataaaaga aatggctggc ttaatcataa aaccgttgtg 540 gaatttgtaa aatatgcaaa atatctggca tggaaattta gcgatgtggc agatatgttt 600 tctataatga atgagccaaa cgttgtattt ggtaatggat attttaatgt taaatcaggg 660 ttcccaccag catttccaag tgtgcatggc ggtttgcttg caaaaaaaca tgaaattgag 720 gctatagcaa gatcatacga cgccatgaag gagattacaa aaaaaccagt tggtctaatt 780 atggcaaatt cagatgtaca accactaaca gatgaggata aagaagcagc agaaatggct 840 acttacaatg atcgctattc attcatagat ccgctaagag ttggtgagat gaaatgggct 900 gatgaggtta ctgcaggtaa tccaattggt gaaaagagca acatcgatag atctgatcta 960 aaaaataagc tagactggat aggtgttaac tattatacaa gggccgttgt aaaaaaatct 1020 ggaaacggat atacaacatt aaaaggatat ggacactctg caaccgctgg catgccaagt 1080 agggccggaa gggatgtaag tgactttggc tgggaattct atccagaagg tcttgtaaac 1140 gtcttatcat catactggaa aagatatcac attccaatga ttgtgactga aaatggtgtt 1200 gctgactcta ttgatagact tagaccaagg taccttgtgt cacatataaa gtctgttgaa 1260 aaggctttat ctatgggtat ggatattagg ggatatcttc actggtctct gattgataac 1320 tatgaatggg catcaggttt ttcaatgaaa tttgggcttt atggtattga tttgaacaat 1380 aaaaagattc aacacagacc aagtgcactg gtatttaaag aaattgcaaa tgccaacgga 1440 gtcccggagg aatttgaatg gatggcagac cagcatcaga attcatga 1488 <210> 16 <211> 495 <212> PRT <213> Picrophilus torridus <400> 16 Met Leu Pro Lys Asn Phe Leu Leu Gly Phe Ser Leu Ala Gly Phe Gln 1 5 10 15 Ser Glu Met Gly Ile Ser Asp Pro Asp Ser Asn Ser Asp Trp Trp Leu 20 25 30 Trp Val His Asp Pro Val Asn Ile Arg Thr Gly Leu Val Ser Gly Asp 35 40 45 Leu Pro Glu Asn Gly Ile Gly Tyr Trp Asp Leu Tyr Lys Lys Tyr Asn 50 55 60 Gly Leu Ala Val Gln Thr Gly Met Asn Ala Ala Arg Leu Gly Val Glu 65 70 75 80 Trp Ser Arg Ile Phe Pro Lys Ser Thr Glu Glu Val Lys Val Met Glu 85 90 95 Asp Tyr Lys Asp Asp Asp Leu Ile Ser Val Asp Val Asn Glu Gly Ser 100 105 110 Leu Glu Lys Leu Asp Arg Leu Ala Asn Gln Lys Ala Ile Asn Arg Tyr 115 120 125 Met Glu Ile Phe Asn Asn Ile Lys Glu Asn Asn Met Thr Leu Ile Val 130 135 140 Asn Val Tyr His Trp Pro Ile Pro Ile Tyr Leu His Asp Pro Ile Glu 145 150 155 160 Ala Arg Asn Ser Gly Leu Ser Asn Lys Arg Asn Gly Trp Leu Asn His 165 170 175 Lys Thr Val Val Glu Phe Val Lys Tyr Ala Lys Tyr Leu Ala Trp Lys 180 185 190 Phe Ser Asp Val Ala Asp Met Phe Ser Ile Met Asn Glu Pro Asn Val 195 200 205 Val Phe Gly Asn Gly Tyr Phe Asn Val Lys Ser Gly Phe Pro Pro Ala 210 215 220 Phe Pro Ser Val His Gly Gly Leu Leu Ala Lys Lys His Glu Ile Glu 225 230 235 240 Ala Ile Ala Arg Ser Tyr Asp Ala Met Lys Glu Ile Thr Lys Lys Pro 245 250 255 Val Gly Leu Ile Met Ala Asn Ser Asp Val Gln Pro Leu Thr Asp Glu 260 265 270 Asp Lys Glu Ala Ala Glu Met Ala Thr Tyr Asn Asp Arg Tyr Ser Phe 275 280 285 Ile Asp Pro Leu Arg Val Gly Glu Met Lys Trp Ala Asp Glu Val Thr 290 295 300 Ala Gly Asn Pro Ile Gly Glu Lys Ser Asn Ile Asp Arg Ser Asp Leu 305 310 315 320 Lys Asn Lys Leu Asp Trp Ile Gly Val Asn Tyr Tyr Thr Arg Ala Val 325 330 335 Val Lys Lys Ser Gly Asn Gly Tyr Thr Thr Leu Lys Gly Tyr Gly His 340 345 350 Ser Ala Thr Ala Gly Met Pro Ser Arg Ala Gly Arg Asp Val Ser Asp 355 360 365 Phe Gly Trp Glu Phe Tyr Pro Glu Gly Leu Val Asn Val Leu Ser Ser 370 375 380 Tyr Trp Lys Arg Tyr His Ile Pro Met Ile Val Thr Glu Asn Gly Val 385 390 395 400 Ala Asp Ser Ile Asp Arg Leu Arg Pro Arg Tyr Leu Val Ser His Ile 405 410 415 Lys Ser Val Glu Lys Ala Leu Ser Met Gly Met Asp Ile Arg Gly Tyr 420 425 430 Leu His Trp Ser Leu Ile Asp Asn Tyr Glu Trp Ala Ser Gly Phe Ser 435 440 445 Met Lys Phe Gly Leu Tyr Gly Ile Asp Leu Asn Asn Lys Lys Ile Gln 450 455 460 His Arg Pro Ser Ala Leu Val Phe Lys Glu Ile Ala Asn Ala Asn Gly 465 470 475 480 Val Pro Glu Glu Phe Glu Trp Met Ala Asp Gln His Gln Asn Ser 485 490 495 <210> 17 <211> 1446 <212> DNA <213> Thermoplasma volcanium <400> 17 atggtagaaa acaattttcc agaggatttc aaatttggtt ggtcacagtc aggttttcaa 60 tcggagatgg gctatgataa cgcaatggac gataaaagtg actggtatgt ctgggttcat 120 gataaagaaa acatccaatc agggcttgta agcggagaca tgcccgaaaa tggtccgggt 180 tactggaata actataaatc attccatgaa gctgcacaga atatgggatt aaaaatggca 240 agaatcggag ttgaatggtc aagattattc ccggaacctt tcccggaaaa aataatggca 300 gatgcaaaaa ataattcctt agaaataaac aataacattc tttcagaact tgataaatat 360 gtcaataaag atgcactcaa ccattacatt gagatattta atgatatcaa aaatagaaat 420 atagatttaa taattaatat gtaccactgg ccacttcctg tatggctaag cgatcctgta 480 tctgttagaa aaggaataaa aacagaaaga tcaggctggc tgaatgacag gatagttcaa 540 ttgtttgctt tattctcctc gtatatagta tataaaatgg aagatctggc agttgcattt 600 tcaaccatga atgaacctaa tgttgtttat ggaaatggtt ttataaatat caaatcaggt 660 tttccgcctt cctatctcag ttcagaattt gcatctaaag ttaagaacaa tatattaaaa 720 gcacattctc ttgcatacga ttctatgaaa aaaattacgg ataaacctgt gggaataatt 780 tatgcaaaca catattttac gcctttggat ccggaaaaag ataatgatgc tattgctaaa 840 gcagacagtg atgcgaaatg gtcatttttt gatccattaa taaaaggaga taaatcactt 900 ggaattaatg gcaataaact agattggatc ggaattaatt attatacaag gacaatgtta 960 aggaaagacg gagatggcta tatttcatta aaaggctatg gtcattcagg ttctcctaat 1020 actgtaacaa acgataaaag accaacaagt gatataggat gggaattcta tccggaggga 1080 ttggaatatg taattatgaa ttactggaac aggtataaat tgcctatgta cgtaacagaa 1140 aatggcatag ccgataatgg ggattatcag aggccttatt atttagtttc acacattgca 1200 agtgtactga gggcaataaa taaaggagcc aatgtaaagg gttatttgca ctggtcctta 1260 gttgataatt atgaatgggc attgggattt agcccgaaat ttggtttaat aggatacgat 1320 gaaaataaaa aactatactg gaggccaagt gctcttgttt ataaggaaat agcaacaaaa 1380 aattgcatat ccccagaatt aaagcacctc gattcaatac cgcctataaa tggtttaaga 1440 aaataa 1446 <210> 18 <211> 481 <212> PRT <213> Thermoplasma volcanium <400> 18 Met Val Glu Asn Asn Phe Pro Glu Asp Phe Lys Phe Gly Trp Ser Gln 1 5 10 15 Ser Gly Phe Gln Ser Glu Met Gly Tyr Asp Asn Ala Met Asp Asp Lys 20 25 30 Ser Asp Trp Tyr Val Trp Val His Asp Lys Glu Asn Ile Gln Ser Gly 35 40 45 Leu Val Ser Gly Asp Met Pro Glu Asn Gly Pro Gly Tyr Trp Asn Asn 50 55 60 Tyr Lys Ser Phe His Glu Ala Ala Gln Asn Met Gly Leu Lys Met Ala 65 70 75 80 Arg Ile Gly Val Glu Trp Ser Arg Leu Phe Pro Glu Pro Phe Pro Glu 85 90 95 Lys Ile Met Ala Asp Ala Lys Asn Asn Ser Leu Glu Ile Asn Asn Asn 100 105 110 Ile Leu Ser Glu Leu Asp Lys Tyr Val Asn Lys Asp Ala Leu Asn His 115 120 125 Tyr Ile Glu Ile Phe Asn Asp Ile Lys Asn Arg Asn Ile Asp Leu Ile 130 135 140 Ile Asn Met Tyr His Trp Pro Leu Pro Val Trp Leu Ser Asp Pro Val 145 150 155 160 Ser Val Arg Lys Gly Ile Lys Thr Glu Arg Ser Gly Trp Leu Asn Asp 165 170 175 Arg Ile Val Gln Leu Phe Ala Leu Phe Ser Ser Tyr Ile Val Tyr Lys 180 185 190 Met Glu Asp Leu Ala Val Ala Phe Ser Thr Met Asn Glu Pro Asn Val 195 200 205 Val Tyr Gly Asn Gly Phe Ile Asn Ile Lys Ser Gly Phe Pro Pro Ser 210 215 220 Tyr Leu Ser Ser Glu Phe Ala Ser Lys Val Lys Asn Asn Ile Leu Lys 225 230 235 240 Ala His Ser Leu Ala Tyr Asp Ser Met Lys Lys Ile Thr Asp Lys Pro 245 250 255 Val Gly Ile Ile Tyr Ala Asn Thr Tyr Phe Thr Pro Leu Asp Pro Glu 260 265 270 Lys Asp Asn Asp Ala Ile Ala Lys Ala Asp Ser Asp Ala Lys Trp Ser 275 280 285 Phe Phe Asp Pro Leu Ile Lys Gly Asp Lys Ser Leu Gly Ile Asn Gly 290 295 300 Asn Lys Leu Asp Trp Ile Gly Ile Asn Tyr Tyr Thr Arg Thr Met Leu 305 310 315 320 Arg Lys Asp Gly Asp Gly Tyr Ile Ser Leu Lys Gly Tyr Gly His Ser 325 330 335 Gly Ser Pro Asn Thr Val Thr Asn Asp Lys Arg Pro Thr Ser Asp Ile 340 345 350 Gly Trp Glu Phe Tyr Pro Glu Gly Leu Glu Tyr Val Ile Met Asn Tyr 355 360 365 Trp Asn Arg Tyr Lys Leu Pro Met Tyr Val Thr Glu Asn Gly Ile Ala 370 375 380 Asp Asn Gly Asp Tyr Gln Arg Pro Tyr Tyr Leu Val Ser His Ile Ala 385 390 395 400 Ser Val Leu Arg Ala Ile Asn Lys Gly Ala Asn Val Lys Gly Tyr Leu 405 410 415 His Trp Ser Leu Val Asp Asn Tyr Glu Trp Ala Leu Gly Phe Ser Pro 420 425 430 Lys Phe Gly Leu Ile Gly Tyr Asp Glu Asn Lys Lys Leu Tyr Trp Arg 435 440 445 Pro Ser Ala Leu Val Tyr Lys Glu Ile Ala Thr Lys Asn Cys Ile Ser 450 455 460 Pro Glu Leu Lys His Leu Asp Ser Ile Pro Pro Ile Asn Gly Leu Arg 465 470 475 480 Lys <210> 19 <211> 1404 <212> DNA <213> Fervidobacterium nodosum <400> 19 atgatgtttc cgaaagattt tttatttggt gtttcgatgt ctgggtttca gtttgagatg 60 ggaaatcctc aagatgcaga agaggttgat ctaaatacag attggtatgt atgggttagg 120 gatattggaa atattgtaaa tggagtcgta agtggggact tgcctgaaaa tggttcatgg 180 tactggaagc agtacggcaa agtccaccaa ttagctgccg attttgggat ggatgtaata 240 cgaattggaa ccgaatggtc taggattttc ccagttagta cgcaaagtgt tgagtacggc 300 tcaccggata tgctcgaaaa attggataaa ttagcaaacc aaaaagcggt aagtcattac 360 aggaaaataa tggaggatat aaaagcaaag gggttaaaat tgttcgttaa cctttaccac 420 tttactttac ctatttggtt gcacgaccct atagctgttc acaaaggtga gaagacagat 480 aaaattggtt ggatttctga tgctacacct attgagtttg cgaagtatgc agagtacatg 540 gcgtggaaat ttgccgatat agttgatatg tgggcttcta tgaacgaacc acacgttgta 600 agtcagcttg gatattttgc aataaatgcg ggatttccac caagttattt taatccttca 660 tggtatatca aaagtttaga aaacgaagcg aaagcacata acttatctta tgatgctata 720 aaaaagtata caaataatcc tgttggagtt atatactctt ttacatggta cgatactgtt 780 aataaagatg acaaggaatc ttttgaaaat gctatggatc tcacaaattg gcgatttata 840 gatatggtaa aagataaaac tgattacata ggtgtaaatt attacacaag agcggttatc 900 gatagacttc ccaccactat tgactttggc gaatttaaaa tgaattggta tactttgaga 960 ggttacggtt attcttgcga agaaggagga ttctcactct ccggaaggcc ggcaagcgaa 1020 tttggatggg aaatataccc tgaagggctg tacaatattt tgatacatgt ttataataga 1080 tacaaaaaag atatttatgt tacggagaac ggtatagctg attcgaagga taaatacaga 1140 agtcttttta tcatatcgca tctttatgct atagaaaaag cattaaacga aggaatacca 1200 ataaaaggtt atttgcactg gtcgattata gacaatttcg aatgggcgaa gggctacagt 1260 aaaagatttg gacttgctta cacagatttg tcaaccaaaa aatatatacc tagaccttct 1320 atgtacattt ttagagagat aataaaggat aaatcaatcg acaaattcaa aggttacgat 1380 ccatataact tgatgaaatt ctga 1404 <210> 20 <211> 467 <212> PRT <213> Fervidobacterium nodosum <400> 20 Met Met Phe Pro Lys Asp Phe Leu Phe Gly Val Ser Met Ser Gly Phe 1 5 10 15 Gln Phe Glu Met Gly Asn Pro Gln Asp Ala Glu Glu Val Asp Leu Asn 20 25 30 Thr Asp Trp Tyr Val Trp Val Arg Asp Ile Gly Asn Ile Val Asn Gly 35 40 45 Val Val Ser Gly Asp Leu Pro Glu Asn Gly Ser Trp Tyr Trp Lys Gln 50 55 60 Tyr Gly Lys Val His Gln Leu Ala Ala Asp Phe Gly Met Asp Val Ile 65 70 75 80 Arg Ile Gly Thr Glu Trp Ser Arg Ile Phe Pro Val Ser Thr Gln Ser 85 90 95 Val Glu Tyr Gly Ser Pro Asp Met Leu Glu Lys Leu Asp Lys Leu Ala 100 105 110 Asn Gln Lys Ala Val Ser His Tyr Arg Lys Ile Met Glu Asp Ile Lys 115 120 125 Ala Lys Gly Leu Lys Leu Phe Val Asn Leu Tyr His Phe Thr Leu Pro 130 135 140 Ile Trp Leu His Asp Pro Ile Ala Val His Lys Gly Glu Lys Thr Asp 145 150 155 160 Lys Ile Gly Trp Ile Ser Asp Ala Thr Pro Ile Glu Phe Ala Lys Tyr 165 170 175 Ala Glu Tyr Met Ala Trp Lys Phe Ala Asp Ile Val Asp Met Trp Ala 180 185 190 Ser Met Asn Glu Pro His Val Val Ser Gln Leu Gly Tyr Phe Ala Ile 195 200 205 Asn Ala Gly Phe Pro Pro Ser Tyr Phe Asn Pro Ser Trp Tyr Ile Lys 210 215 220 Ser Leu Glu Asn Glu Ala Lys Ala His Asn Leu Ser Tyr Asp Ala Ile 225 230 235 240 Lys Lys Tyr Thr Asn Asn Pro Val Gly Val Ile Tyr Ser Phe Thr Trp 245 250 255 Tyr Asp Thr Val Asn Lys Asp Asp Lys Glu Ser Phe Glu Asn Ala Met 260 265 270 Asp Leu Thr Asn Trp Arg Phe Ile Asp Met Val Lys Asp Lys Thr Asp 275 280 285 Tyr Ile Gly Val Asn Tyr Tyr Thr Arg Ala Val Ile Asp Arg Leu Pro 290 295 300 Thr Thr Ile Asp Phe Gly Glu Phe Lys Met Asn Trp Tyr Thr Leu Arg 305 310 315 320 Gly Tyr Gly Tyr Ser Cys Glu Glu Gly Gly Phe Ser Leu Ser Gly Arg 325 330 335 Pro Ala Ser Glu Phe Gly Trp Glu Ile Tyr Pro Glu Gly Leu Tyr Asn 340 345 350 Ile Leu Ile His Val Tyr Asn Arg Tyr Lys Lys Asp Ile Tyr Val Thr 355 360 365 Glu Asn Gly Ile Ala Asp Ser Lys Asp Lys Tyr Arg Ser Leu Phe Ile 370 375 380 Ile Ser His Leu Tyr Ala Ile Glu Lys Ala Leu Asn Glu Gly Ile Pro 385 390 395 400 Ile Lys Gly Tyr Leu His Trp Ser Ile Ile Asp Asn Phe Glu Trp Ala 405 410 415 Lys Gly Tyr Ser Lys Arg Phe Gly Leu Ala Tyr Thr Asp Leu Ser Thr 420 425 430 Lys Lys Tyr Ile Pro Arg Pro Ser Met Tyr Ile Phe Arg Glu Ile Ile 435 440 445 Lys Asp Lys Ser Ile Asp Lys Phe Lys Gly Tyr Asp Pro Tyr Asn Leu 450 455 460 Met Lys Phe 465 <210> 21 <211> 33 <212> DNA <213> Artificial <220> <223> primer <400> 21 ccacatattg gcacctctat aagcaagatc atg 33 <210> 22 <211> 34 <212> DNA <213> Artificial <220> <223> primer <400> 22 catgatcttg cttagtgcgg ttccaatatg ctgg 34 <210> 23 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> Thermosphaera aggregans <400> 23 atgggtaaat tccccaaaga cttcatgata ggctactcat cttcaccgtt tcaatttgaa 60 gctggtattc ccgggtccga agatccgaat agtgattggt gggtatgggt gcatgatccg 120 gagaacacag cagctggact agtcagcggc gattttcccg agaacggccc aggttactgg 180 aatttaaacc aaaatgacca cgacctggct gagaagctgg gggttaacac tattagagta 240 ggcgttgagt ggagtaggat ttttccaaag ccaactttca atgttaaagt ccctgtagag 300 agagatgaga acggcagcat tgttcacgta gatgtcgatg ataaagcggt tgaaagactt 360 gatgaattag ccaacaagga ggccgtaaac cattacgtag aaatgtataa agactgggtt 420 gaaagaggta gaaaacttat actcaattta taccattggc ccctgcctct ctggcttcac 480 aacccaatca tggtgagaag aatgggcccg gacagagcgc cctcaggctg gcttaacgag 540 gagtccgtgg tggagtttgc caaatacgcc gcatacattg cttggaaaat gggcgagcta 600 cctgttatgt ggagcaccat gaacgaaccc aacgtcgttt atgagcaagg atacatgttc 660 gttaaagggg gtttcccacc cggctacttg agtttggaag ctgctgataa ggccaggaga 720 aatatgatcc aggctcatgc acgggcctat gacaatatta aacgcttcag taagaaacct 780 gttggactaa tatacgcttt ccaatggttc gaactattag agggtccagc agaagtattt 840 gataagttta agagctctaa gttatactat ttcacagaca tagtatcgaa gggtagttca 900 atcatcaatg ttgaatacag gagagatctt gccaataggc tagactggtt gggcgttaac 960 tactatagcc gtttagtcta caaaatcgtc gatgacaaac ctataatcct gcacgggtat 1020 ggattccttt gtacacctgg ggggatcagc ccggctgaaa atccttgtag cgattttggg 1080 tgggaggtgt atcctgaagg actctaccta cttctaaaag aactttacaa ccgatacggg 1140 gtagacttga tcgtgaccga gaacggtgtt tcagacagca gggatgcgtt gagaccggca 1200 tacctggtct cgcatgttta cagcgtatgg aaagccgcta acgagggcat tcccgtcaaa 1260 ggctacctcc actggagctt gacagacaat tacgagtggg cccagggctt caggcagaaa 1320 ttcggtttag tcatggttga cttcaaaact aagaaaaggt atctccgccc aagcgcccta 1380 gtgttccggg agatcgcaac gcataacgga ataccggatg agctacagca tcttacactg 1440 atccag 1446 <210> 24 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Thermosphaera aggregans <400> 24 Met Gly Lys Phe Pro Lys Asp Phe Met Ile Gly Tyr Ser Ser Ser Pro 1 5 10 15 Phe Gln Phe Glu Ala Gly Ile Pro Gly Ser Glu Asp Pro Asn Ser Asp 20 25 30 Trp Trp Val Trp Val His Asp Pro Glu Asn Thr Ala Ala Gly Leu Val 35 40 45 Ser Gly Asp Phe Pro Glu Asn Gly Pro Gly Tyr Trp Asn Leu Asn Gln 50 55 60 Asn Asp His Asp Leu Ala Glu Lys Leu Gly Val Asn Thr Ile Arg Val 65 70 75 80 Gly Val Glu Trp Ser Arg Ile Phe Pro Lys Pro Thr Phe Asn Val Lys 85 90 95 Val Pro Val Glu Arg Asp Glu Asn Gly Ser Ile Val His Val Asp Val 100 105 110 Asp Asp Lys Ala Val Glu Arg Leu Asp Glu Leu Ala Asn Lys Glu Ala 115 120 125 Val Asn His Tyr Val Glu Met Tyr Lys Asp Trp Val Glu Arg Gly Arg 130 135 140 Lys Leu Ile Leu Asn Leu Tyr His Trp Pro Leu Pro Leu Trp Leu His 145 150 155 160 Asn Pro Ile Met Val Arg Arg Met Gly Pro Asp Arg Ala Pro Ser Gly 165 170 175 Trp Leu Asn Glu Glu Ser Val Val Glu Phe Ala Lys Tyr Ala Ala Tyr 180 185 190 Ile Ala Trp Lys Met Gly Glu Leu Pro Val Met Trp Ser Thr Met Asn 195 200 205 Glu Pro Asn Val Val Tyr Glu Gln Gly Tyr Met Phe Val Lys Gly Gly 210 215 220 Phe Pro Pro Gly Tyr Leu Ser Leu Glu Ala Ala Asp Lys Ala Arg Arg 225 230 235 240 Asn Met Ile Gln Ala His Ala Arg Ala Tyr Asp Asn Ile Lys Arg Phe 245 250 255 Ser Lys Lys Pro Val Gly Leu Ile Tyr Ala Phe Gln Trp Phe Glu Leu 260 265 270 Leu Glu Gly Pro Ala Glu Val Phe Asp Lys Phe Lys Ser Ser Lys Leu 275 280 285 Tyr Tyr Phe Thr Asp Ile Val Ser Lys Gly Ser Ser Ile Ile Asn Val 290 295 300 Glu Tyr Arg Arg Asp Leu Ala Asn Arg Leu Asp Trp Leu Gly Val Asn 305 310 315 320 Tyr Tyr Ser Arg Leu Val Tyr Lys Ile Val Asp Asp Lys Pro Ile Ile 325 330 335 Leu His Gly Tyr Gly Phe Leu Cys Thr Pro Gly Gly Ile Ser Pro Ala 340 345 350 Glu Asn Pro Cys Ser Asp Phe Gly Trp Glu Val Tyr Pro Glu Gly Leu 355 360 365 Tyr Leu Leu Leu Lys Glu Leu Tyr Asn Arg Tyr Gly Val Asp Leu Ile 370 375 380 Val Thr Glu Asn Gly Val Ser Asp Ser Arg Asp Ala Leu Arg Pro Ala 385 390 395 400 Tyr Leu Val Ser His Val Tyr Ser Val Trp Lys Ala Ala Asn Glu Gly 405 410 415 Ile Pro Val Lys Gly Tyr Leu His Trp Ser Leu Thr Asp Asn Tyr Glu 420 425 430 Trp Ala Gln Gly Phe Arg Gln Lys Phe Gly Leu Val Met Val Asp Phe 435 440 445 Lys Thr Lys Lys Arg Tyr Leu Arg Pro Ser Ala Leu Val Phe Arg Glu 450 455 460 Ile Ala Thr His Asn Gly Ile Pro Asp Glu Leu Gln His Leu Thr Leu 465 470 475 480 Ile Gln <210> 25 <211> 1461 <212> DNA <213> Artificial Sequence <220> <223> Caldivirga maquilingensis <400> 25 atgggtatta agttcccaag cgacttcaga ttcggcttct ccacagtggg tactcagcat 60 gagatgggta cccctggttc tgaatttgta agtgactggt atgtgtggct tcatgaccct 120 gagaacattg cttcgggctt agttagcggt gatttacctg aacatgggcc aggttactgg 180 gacttgtata agcaggacca ctcaatagct agggatcttg ggcttgatgc agcatggata 240 actattgagt gggctagggt gttccctaag ccgacctttg acgttaaggt taaggttgat 300 gaggatgatg gaggtaacgt ggttgacgtt gaggttaatg aatcagcatt agaggagtta 360 cgcaggctag ctgacttaaa tgctgttaat cactataggg ggattttaag tgattggaag 420 gagaggggtg gtttactggt gattaacctt taccactggg ctatgcctac gtggcttcat 480 gacccaatag ccgttaggaa gaatggacct gatagagccc cctccggttg gcttgataag 540 agatccgtta ttgagttcac taagttcgca gccttcatag cccatgagtt aggtgactta 600 gctgacatgt ggtatacgat gaatgaacct ggggtagtga taactgaggg ttacctttac 660 gttaagtcag gcttcccacc aggttacctg gacttaaact ccctagccac tgcgggtaag 720 catttaattg aggctcatgc cagagcctac gacgccatta aagcctactc aaggaaacca 780 gtgggcctag tctactcctt cgcagactat cagccgctta ggcagggtga tgaggaggct 840 gttaaggagg ctaagggact tgactactca ttcttcgacg ctccaattaa gggtgaatta 900 atgggggtta ctagggatga cttgaagggt aggcttgact ggattggggt aaactactac 960 actagggccg tattgaggag gaggcaggat gctggtcggg catcagtagc cgtggtggat 1020 ggattcggct actcctgtga acctggaggc gtatctaatg ataggagacc atgcagtgac 1080 ttcggctggg aaatataccc tgagggtgtt tacaatgtct taatggacct atggaggagg 1140 tataggatgc ccatgtacat cactgagaac ggtatagctg atgagcatga taagtggagg 1200 tcatggttca tagtatcgca cctgtatcaa attcacaggg caatggagga gggggtggat 1260 gttagagggt acttccactg gaacctaata gataacttgg agtgggctgc aggatatagg 1320 atgaggttcg gcctagttta cgttgactat gcaaccaaga ggaggtattt taggccaagc 1380 gccctggtta tgagggaggt ggctaaacag aaggctatac cggattactt agagcattac 1440 attaaaccac ctagaattga a 1461 <210> 26 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Caldivirga maquilingensis <400> 26 Met Gly Ile Lys Phe Pro Ser Asp Phe Arg Phe Gly Phe Ser Thr Val 1 5 10 15 Gly Thr Gln His Glu Met Gly Thr Pro Gly Ser Glu Phe Val Ser Asp 20 25 30 Trp Tyr Val Trp Leu His Asp Pro Glu Asn Ile Ala Ser Gly Leu Val 35 40 45 Ser Gly Asp Leu Pro Glu His Gly Pro Gly Tyr Trp Asp Leu Tyr Lys 50 55 60 Gln Asp His Ser Ile Ala Arg Asp Leu Gly Leu Asp Ala Ala Trp Ile 65 70 75 80 Thr Ile Glu Trp Ala Arg Val Phe Pro Lys Pro Thr Phe Asp Val Lys 85 90 95 Val Lys Val Asp Glu Asp Asp Gly Gly Asn Val Val Asp Val Glu Val 100 105 110 Asn Glu Ser Ala Leu Glu Glu Leu Arg Arg Leu Ala Asp Leu Asn Ala 115 120 125 Val Asn His Tyr Arg Gly Ile Leu Ser Asp Trp Lys Glu Arg Gly Gly 130 135 140 Leu Leu Val Ile Asn Leu Tyr His Trp Ala Met Pro Thr Trp Leu His 145 150 155 160 Asp Pro Ile Ala Val Arg Lys Asn Gly Pro Asp Arg Ala Pro Ser Gly 165 170 175 Trp Leu Asp Lys Arg Ser Val Ile Glu Phe Thr Lys Phe Ala Ala Phe 180 185 190 Ile Ala His Glu Leu Gly Asp Leu Ala Asp Met Trp Tyr Thr Met Asn 195 200 205 Glu Pro Gly Val Val Ile Thr Glu Gly Tyr Leu Tyr Val Lys Ser Gly 210 215 220 Phe Pro Pro Gly Tyr Leu Asp Leu Asn Ser Leu Ala Thr Ala Gly Lys 225 230 235 240 His Leu Ile Glu Ala His Ala Arg Ala Tyr Asp Ala Ile Lys Ala Tyr 245 250 255 Ser Arg Lys Pro Val Gly Leu Val Tyr Ser Phe Ala Asp Tyr Gln Pro 260 265 270 Leu Arg Gln Gly Asp Glu Glu Ala Val Lys Glu Ala Lys Gly Leu Asp 275 280 285 Tyr Ser Phe Phe Asp Ala Pro Ile Lys Gly Glu Leu Met Gly Val Thr 290 295 300 Arg Asp Asp Leu Lys Gly Arg Leu Asp Trp Ile Gly Val Asn Tyr Tyr 305 310 315 320 Thr Arg Ala Val Leu Arg Arg Arg Gln Asp Ala Gly Arg Ala Ser Val 325 330 335 Ala Val Val Asp Gly Phe Gly Tyr Ser Cys Glu Pro Gly Gly Val Ser 340 345 350 Asn Asp Arg Arg Pro Cys Ser Asp Phe Gly Trp Glu Ile Tyr Pro Glu 355 360 365 Gly Val Tyr Asn Val Leu Met Asp Leu Trp Arg Arg Tyr Arg Met Pro 370 375 380 Met Tyr Ile Thr Glu Asn Gly Ile Ala Asp Glu His Asp Lys Trp Arg 385 390 395 400 Ser Trp Phe Ile Val Ser His Leu Tyr Gln Ile His Arg Ala Met Glu 405 410 415 Glu Gly Val Asp Val Arg Gly Tyr Phe His Trp Asn Leu Ile Asp Asn 420 425 430 Leu Glu Trp Ala Ala Gly Tyr Arg Met Arg Phe Gly Leu Val Tyr Val 435 440 445 Asp Tyr Ala Thr Lys Arg Arg Tyr Phe Arg Pro Ser Ala Leu Val Met 450 455 460 Arg Glu Val Ala Lys Gln Lys Ala Ile Pro Asp Tyr Leu Glu His Tyr 465 470 475 480 Ile Lys Pro Pro Arg Ile Glu 485 <210> 27 <211> 1476 <212> DNA <213> Artificial Sequence <220> <223> Sulfolobus acidocaldarius <400> 27 atgggtttat cattcccaaa gggtttcaaa tttggctggt ctcagtcggg attccagtct 60 gaaatgggaa ctccaggtag cgaagatccg aacagcgatt ggcacgtctg ggttcatgac 120 agggagaaca tagtctcaca ggttgtcagt ggagatttac ccgaaaatgg tccagggtac 180 tgggggaact ataagagatt tcatgacgaa gcagagaaaa taggactaaa tgcagtgaga 240 attaacgtag agtggagtag aatatttccc agaccactac ccaagcctga aatgcaaaca 300 gggactgata aagagaacag tcctgtcatt agcgtagact taaatgagtc taagctgaga 360 gaaatggaca actacgctaa tcatgaagcg ttatcacatt acaggcaaat actggaggat 420 ctaagaaaca gaggatttca catagtactg aacatgtatc attggacttt gcccatatgg 480 ttgcacgacc ctatcagagt gaggagagga gactttacag gaccaacagg ttggttaaac 540 tccaggacag tttatgagtt cgctaggttc tcggcttacg tagcctggaa attagatgat 600 ttggcgagtg aatatgcaac aatgaatgaa cctaacgtgg tttggggagc aggttacgct 660 tttcctagag caggctttcc acctaattac cttagcttca ggctttcaga aatagctaaa 720 tggaatataa ttcaggctca tgcgagggct tatgacgcca tcaagagcgt atcaaaaaag 780 agtgtaggta taatatatgc aaacacatca tattacccac tcagaccaca agataacgaa 840 gctgtggaaa tagcagagag attgaacaga tggagtttct ttgactccat tataaaggga 900 gagataacta gtgagggaca aaatgtcaga gaggacttaa ggaacaggtt agactggatt 960 ggcgtaaact attacacgag gactgtggta acaaaagctg agagtggtta tttaaccctt 1020 ccgggttatg gagatcgttg tgaaaggaac tcattgagtt tagctaacct ccctaccagt 1080 gatttcggtt gggagttctt tcctgagggt ctatatgatg tacttttgaa gtattggaat 1140 aggtatgggt taccattata cgtaatggag aacggtatcg ctgatgacgc tgactaccaa 1200 agaccgtatt acttagtatc acatatctac caggtgcaca gggctttaaa cgagggagta 1260 gatgtaagag gttatcttca ttggtctttg gcagataatt atgagtggtc gtcaggtttt 1320 tcaatgaggt tcggtctact taaggtagat tatctaacaa agagattgta ctggagacct 1380 tctgcattag tttacaggga gattactagg agtaacggta ttcctgagga gctggaacat 1440 ctaaacagag taccaccaat aaaacctttg agacat 1476 <210> 28 <211> 492 <212> PRT <213> Artificial Sequence <220> <223> Sulfolobus acidocaldarius <400> 28 Met Gly Leu Ser Phe Pro Lys Gly Phe Lys Phe Gly Trp Ser Gln Ser 1 5 10 15 Gly Phe Gln Ser Glu Met Gly Thr Pro Gly Ser Glu Asp Pro Asn Ser 20 25 30 Asp Trp His Val Trp Val His Asp Arg Glu Asn Ile Val Ser Gln Val 35 40 45 Val Ser Gly Asp Leu Pro Glu Asn Gly Pro Gly Tyr Trp Gly Asn Tyr 50 55 60 Lys Arg Phe His Asp Glu Ala Glu Lys Ile Gly Leu Asn Ala Val Arg 65 70 75 80 Ile Asn Val Glu Trp Ser Arg Ile Phe Pro Arg Pro Leu Pro Lys Pro 85 90 95 Glu Met Gln Thr Gly Thr Asp Lys Glu Asn Ser Pro Val Ile Ser Val 100 105 110 Asp Leu Asn Glu Ser Lys Leu Arg Glu Met Asp Asn Tyr Ala Asn His 115 120 125 Glu Ala Leu Ser His Tyr Arg Gln Ile Leu Glu Asp Leu Arg Asn Arg 130 135 140 Gly Phe His Ile Val Leu Asn Met Tyr His Trp Thr Leu Pro Ile Trp 145 150 155 160 Leu His Asp Pro Ile Arg Val Arg Arg Gly Asp Phe Thr Gly Pro Thr 165 170 175 Gly Trp Leu Asn Ser Arg Thr Val Tyr Glu Phe Ala Arg Phe Ser Ala 180 185 190 Tyr Val Ala Trp Lys Leu Asp Asp Leu Ala Ser Glu Tyr Ala Thr Met 195 200 205 Asn Glu Pro Asn Val Val Trp Gly Ala Gly Tyr Ala Phe Pro Arg Ala 210 215 220 Gly Phe Pro Pro Asn Tyr Leu Ser Phe Arg Leu Ser Glu Ile Ala Lys 225 230 235 240 Trp Asn Ile Ile Gln Ala His Ala Arg Ala Tyr Asp Ala Ile Lys Ser 245 250 255 Val Ser Lys Lys Ser Val Gly Ile Ile Tyr Ala Asn Thr Ser Tyr Tyr 260 265 270 Pro Leu Arg Pro Gln Asp Asn Glu Ala Val Glu Ile Ala Glu Arg Leu 275 280 285 Asn Arg Trp Ser Phe Phe Asp Ser Ile Ile Lys Gly Glu Ile Thr Ser 290 295 300 Glu Gly Gln Asn Val Arg Glu Asp Leu Arg Asn Arg Leu Asp Trp Ile 305 310 315 320 Gly Val Asn Tyr Tyr Thr Arg Thr Val Val Thr Lys Ala Glu Ser Gly 325 330 335 Tyr Leu Thr Leu Pro Gly Tyr Gly Asp Arg Cys Glu Arg Asn Ser Leu 340 345 350 Ser Leu Ala Asn Leu Pro Thr Ser Asp Phe Gly Trp Glu Phe Phe Pro 355 360 365 Glu Gly Leu Tyr Asp Val Leu Leu Lys Tyr Trp Asn Arg Tyr Gly Leu 370 375 380 Pro Leu Tyr Val Met Glu Asn Gly Ile Ala Asp Asp Ala Asp Tyr Gln 385 390 395 400 Arg Pro Tyr Tyr Leu Val Ser His Ile Tyr Gln Val His Arg Ala Leu 405 410 415 Asn Glu Gly Val Asp Val Arg Gly Tyr Leu His Trp Ser Leu Ala Asp 420 425 430 Asn Tyr Glu Trp Ser Ser Gly Phe Ser Met Arg Phe Gly Leu Leu Lys 435 440 445 Val Asp Tyr Leu Thr Lys Arg Leu Tyr Trp Arg Pro Ser Ala Leu Val 450 455 460 Tyr Arg Glu Ile Thr Arg Ser Asn Gly Ile Pro Glu Glu Leu Glu His 465 470 475 480 Leu Asn Arg Val Pro Pro Ile Lys Pro Leu Arg His 485 490 <210> 29 <211> 1470 <212> DNA <213> Artificial Sequence <220> <223> Sulfolobus solfataricus <400> 29 atgggttact catttccaaa tagctttagg tttggttggt cccaggccgg atttcaatca 60 gaaatgggaa caccagggtc agaagatcca aatactgact ggtataaatg ggttcatgat 120 ccagaaaaca tggcagcggg attagtaagt ggagatctac cagaaaatgg gccaggctac 180 tggggaaact ataagacatt tcacgataat gcacaaaaaa tgggattaaa aatagctaga 240 ctaaatgtgg aatggtctag gatatttcct aatccattac caaggccaca aaactttgat 300 gaatcaaaac aagatgtgac agaggttgag ataaacgaaa acgagttaaa gagacttgac 360 gagtacgcta ataaagacgc attaaaccat tacagggaaa tattcaagga tcttaaaagt 420 agaggacttt actttatact aaacatgtat cattggccat tacctctatg gttacacgac 480 ccaataagag taagaagagg agattttact ggaccaagtg gttggctaag tactagaaca 540 gtttacgagt tcgctagatt ctcagcttat atagcttgga aattcgatga tctagtggat 600 gagtactcaa caatgaatga acctaacgtt gttggaggtt taggatacgt tggtgttaag 660 tccggttttc ccccaggata cctaagcttt gaactttccc gtagggcaat gtataacatc 720 attcaagctc acgcaagagc gtatgatggg ataaagagtg tttctaaaaa accagttgga 780 attatttacg ctaatagctc attccagccg ttaacggata aagatatgga agcggtagag 840 atggctgaaa atgataatag atggtggttc tttgatgcta taataagagg tgagatcacc 900 agaggaaacg agaagattgt aagagatgac ctaaagggta gattggattg gattggagtt 960 aattattaca ctaggactgt tgtgaagagg actgaaaagg gatacgttag cttaggaggt 1020 tacggtcacg gatgtgagag gaactctgta agtttagcgg gattaccaac cagcgacttc 1080 ggctgggagt tcttcccaga aggtttatat gacgttttga cgaaatactg gaatagatat 1140 catctctata tgtacgttac tgaaaatggt attgcggatg atgccgatta tcaaaggccc 1200 tattatttag tatctcacgt ttatcaagtt catagagcaa taaatagtgg tgcagatgtt 1260 agagggtatt tacattggtc tctagctgat aattacgaat gggcttcagg attctctatg 1320 aggtttggtc tgttaaaggt cgattacaac actaagagac tatactggag accctcagca 1380 ctagtatata gggaaatcgc cacaaatggc gcaataactg atgaaataga gcacttaaat 1440 agcgtacctc cagtaaagcc attaaggcac 1470 <210> 30 <211> 490 <212> PRT <213> Artificial Sequence <220> <223> Sulfolobus solfataricus <400> 30 Met Gly Tyr Ser Phe Pro Asn Ser Phe Arg Phe Gly Trp Ser Gln Ala 1 5 10 15 Gly Phe Gln Ser Glu Met Gly Thr Pro Gly Ser Glu Asp Pro Asn Thr 20 25 30 Asp Trp Tyr Lys Trp Val His Asp Pro Glu Asn Met Ala Ala Gly Leu 35 40 45 Val Ser Gly Asp Leu Pro Glu Asn Gly Pro Gly Tyr Trp Gly Asn Tyr 50 55 60 Lys Thr Phe His Asp Asn Ala Gln Lys Met Gly Leu Lys Ile Ala Arg 65 70 75 80 Leu Asn Val Glu Trp Ser Arg Ile Phe Pro Asn Pro Leu Pro Arg Pro 85 90 95 Gln Asn Phe Asp Glu Ser Lys Gln Asp Val Thr Glu Val Glu Ile Asn 100 105 110 Glu Asn Glu Leu Lys Arg Leu Asp Glu Tyr Ala Asn Lys Asp Ala Leu 115 120 125 Asn His Tyr Arg Glu Ile Phe Lys Asp Leu Lys Ser Arg Gly Leu Tyr 130 135 140 Phe Ile Leu Asn Met Tyr His Trp Pro Leu Pro Leu Trp Leu His Asp 145 150 155 160 Pro Ile Arg Val Arg Arg Gly Asp Phe Thr Gly Pro Ser Gly Trp Leu 165 170 175 Ser Thr Arg Thr Val Tyr Glu Phe Ala Arg Phe Ser Ala Tyr Ile Ala 180 185 190 Trp Lys Phe Asp Asp Leu Val Asp Glu Tyr Ser Thr Met Asn Glu Pro 195 200 205 Asn Val Val Gly Gly Leu Gly Tyr Val Gly Val Lys Ser Gly Phe Pro 210 215 220 Pro Gly Tyr Leu Ser Phe Glu Leu Ser Arg Arg Ala Met Tyr Asn Ile 225 230 235 240 Ile Gln Ala His Ala Arg Ala Tyr Asp Gly Ile Lys Ser Val Ser Lys 245 250 255 Lys Pro Val Gly Ile Ile Tyr Ala Asn Ser Ser Phe Gln Pro Leu Thr 260 265 270 Asp Lys Asp Met Glu Ala Val Glu Met Ala Glu Asn Asp Asn Arg Trp 275 280 285 Trp Phe Phe Asp Ala Ile Ile Arg Gly Glu Ile Thr Arg Gly Asn Glu 290 295 300 Lys Ile Val Arg Asp Asp Leu Lys Gly Arg Leu Asp Trp Ile Gly Val 305 310 315 320 Asn Tyr Tyr Thr Arg Thr Val Val Lys Arg Thr Glu Lys Gly Tyr Val 325 330 335 Ser Leu Gly Gly Tyr Gly His Gly Cys Glu Arg Asn Ser Val Ser Leu 340 345 350 Ala Gly Leu Pro Thr Ser Asp Phe Gly Trp Glu Phe Phe Pro Glu Gly 355 360 365 Leu Tyr Asp Val Leu Thr Lys Tyr Trp Asn Arg Tyr His Leu Tyr Met 370 375 380 Tyr Val Thr Glu Asn Gly Ile Ala Asp Asp Ala Asp Tyr Gln Arg Pro 385 390 395 400 Tyr Tyr Leu Val Ser His Val Tyr Gln Val His Arg Ala Ile Asn Ser 405 410 415 Gly Ala Asp Val Arg Gly Tyr Leu His Trp Ser Leu Ala Asp Asn Tyr 420 425 430 Glu Trp Ala Ser Gly Phe Ser Met Arg Phe Gly Leu Leu Lys Val Asp 435 440 445 Tyr Asn Thr Lys Arg Leu Tyr Trp Arg Pro Ser Ala Leu Val Tyr Arg 450 455 460 Glu Ile Ala Thr Asn Gly Ala Ile Thr Asp Glu Ile Glu His Leu Asn 465 470 475 480 Ser Val Pro Pro Val Lys Pro Leu Arg His 485 490 <210> 31 <211> 1488 <212> DNA <213> Artificial Sequence <220> <223> Picrophilus torridus <400> 31 atgggtttac ccaagaactt tttacttggc ttttctctgg ctggctttca gtctgaaatg 60 ggcatatcag atcctgatag caattcagat tggtggttat gggtacatga cccggtgaat 120 ataaggactg gacttgtatc tggtgactta cctgaaaatg gaataggata ctgggatctt 180 tacaaaaaat ataatggtct ggctgttcaa acaggaatga atgctgcaag gcttggagtt 240 gaatggagca ggatatttcc aaaaagtact gaagaagtaa aggtgatgga agattacaaa 300 gatgatgatt taatttccgt ggatgttaat gagggaagtc ttgaaaaact tgacagactg 360 gcaaatcaaa aggcaattaa tagatatatg gaaatcttca ataatatcaa ggaaaataat 420 atgacgctaa tagtgaatgt ttaccattgg ccaataccaa tatatcttca cgatccaata 480 gaagctagga atagtggact ttcaaataaa agaaatggct ggcttaatca taaaaccgtt 540 gtggaatttg taaaatatgc aaaatatctg gcatggaaat ttagcgatgt ggcagatatg 600 ttttctataa tgaatgagcc aaacgttgta tttggtaatg gatattttaa tgttaaatca 660 gggttcccac cagcatttcc aagtgtgcat ggcggtttgc ttgcaaaaaa acatgaaatt 720 gaggctatag caagatcata cgacgccatg aaggagatta caaaaaaacc agttggtcta 780 attatggcaa attcagatgt acaaccacta acagatgagg ataaagaagc agcagaaatg 840 gctacttaca atgatcgcta ttcattcata gatccgctaa gagttggtga gatgaaatgg 900 gctgatgagg ttactgcagg taatccaatt ggtgaaaaga gcaacatcga tagatctgat 960 ctaaaaaata agctagactg gataggtgtt aactattata caagggccgt tgtaaaaaaa 1020 tctggaaacg gatatacaac attaaaagga tatggacact ctgcaaccgc tggcatgcca 1080 agtagggccg gaagggatgt aagtgacttt ggctgggaat tttatccaga aggtcttgta 1140 aacgtcttat catcatactg gaaaagatat cacattccaa tgattgtgac tgaaaatggt 1200 gttgctgact ctattgatag acttagacca aggtaccttg tgtcacatat aaagtctgtt 1260 gaaaaggctt tatctatggg tatggatatt aggggatatc ttcactggtc tctgattgat 1320 aactatgaat gggcatcagg tttttcaatg aaatttgggc tttatggtat tgatttgaac 1380 aataaaaaga ttcaacacag accaagtgca ctggtattta aagaaattgc aaatgccaac 1440 ggagtcccgg aggaatttga atggatggca gaccagcatc agaactca 1488 <210> 32 <211> 496 <212> PRT <213> Artificial Sequence <220> <223> Picrophilus torridus <400> 32 Met Gly Leu Pro Lys Asn Phe Leu Leu Gly Phe Ser Leu Ala Gly Phe 1 5 10 15 Gln Ser Glu Met Gly Ile Ser Asp Pro Asp Ser Asn Ser Asp Trp Trp 20 25 30 Leu Trp Val His Asp Pro Val Asn Ile Arg Thr Gly Leu Val Ser Gly 35 40 45 Asp Leu Pro Glu Asn Gly Ile Gly Tyr Trp Asp Leu Tyr Lys Lys Tyr 50 55 60 Asn Gly Leu Ala Val Gln Thr Gly Met Asn Ala Ala Arg Leu Gly Val 65 70 75 80 Glu Trp Ser Arg Ile Phe Pro Lys Ser Thr Glu Glu Val Lys Val Met 85 90 95 Glu Asp Tyr Lys Asp Asp Asp Leu Ile Ser Val Asp Val Asn Glu Gly 100 105 110 Ser Leu Glu Lys Leu Asp Arg Leu Ala Asn Gln Lys Ala Ile Asn Arg 115 120 125 Tyr Met Glu Ile Phe Asn Asn Ile Lys Glu Asn Asn Met Thr Leu Ile 130 135 140 Val Asn Val Tyr His Trp Pro Ile Pro Ile Tyr Leu His Asp Pro Ile 145 150 155 160 Glu Ala Arg Asn Ser Gly Leu Ser Asn Lys Arg Asn Gly Trp Leu Asn 165 170 175 His Lys Thr Val Val Glu Phe Val Lys Tyr Ala Lys Tyr Leu Ala Trp 180 185 190 Lys Phe Ser Asp Val Ala Asp Met Phe Ser Ile Met Asn Glu Pro Asn 195 200 205 Val Val Phe Gly Asn Gly Tyr Phe Asn Val Lys Ser Gly Phe Pro Pro 210 215 220 Ala Phe Pro Ser Val His Gly Gly Leu Leu Ala Lys Lys His Glu Ile 225 230 235 240 Glu Ala Ile Ala Arg Ser Tyr Asp Ala Met Lys Glu Ile Thr Lys Lys 245 250 255 Pro Val Gly Leu Ile Met Ala Asn Ser Asp Val Gln Pro Leu Thr Asp 260 265 270 Glu Asp Lys Glu Ala Ala Glu Met Ala Thr Tyr Asn Asp Arg Tyr Ser 275 280 285 Phe Ile Asp Pro Leu Arg Val Gly Glu Met Lys Trp Ala Asp Glu Val 290 295 300 Thr Ala Gly Asn Pro Ile Gly Glu Lys Ser Asn Ile Asp Arg Ser Asp 305 310 315 320 Leu Lys Asn Lys Leu Asp Trp Ile Gly Val Asn Tyr Tyr Thr Arg Ala 325 330 335 Val Val Lys Lys Ser Gly Asn Gly Tyr Thr Thr Leu Lys Gly Tyr Gly 340 345 350 His Ser Ala Thr Ala Gly Met Pro Ser Arg Ala Gly Arg Asp Val Ser 355 360 365 Asp Phe Gly Trp Glu Phe Tyr Pro Glu Gly Leu Val Asn Val Leu Ser 370 375 380 Ser Tyr Trp Lys Arg Tyr His Ile Pro Met Ile Val Thr Glu Asn Gly 385 390 395 400 Val Ala Asp Ser Ile Asp Arg Leu Arg Pro Arg Tyr Leu Val Ser His 405 410 415 Ile Lys Ser Val Glu Lys Ala Leu Ser Met Gly Met Asp Ile Arg Gly 420 425 430 Tyr Leu His Trp Ser Leu Ile Asp Asn Tyr Glu Trp Ala Ser Gly Phe 435 440 445 Ser Met Lys Phe Gly Leu Tyr Gly Ile Asp Leu Asn Asn Lys Lys Ile 450 455 460 Gln His Arg Pro Ser Ala Leu Val Phe Lys Glu Ile Ala Asn Ala Asn 465 470 475 480 Gly Val Pro Glu Glu Phe Glu Trp Met Ala Asp Gln His Gln Asn Ser 485 490 495 <210> 33 <211> 1443 <212> DNA <213> Artificial Sequence <220> <223> Thermoplasma volcanium <400> 33 atggtagaaa acaattttcc agaggatttc aaatttggtt ggtcacagtc aggttttcaa 60 tcggagatgg gctatgataa cgcaatggac gataaaagtg actggtatgt ctgggttcat 120 gataaagaaa acatccaatc agggcttgta agcggagaca tgcccgaaaa tggtccgggt 180 tactggaata actataaatc attccatgaa gctgcacaga atatgggatt aaaaatggca 240 agaatcggag ttgaatggtc aagattattc ccggaacctt tcccggaaaa aataatggca 300 gatgcaaaaa ataattcctt agaaataaac aataacattc tttcagaact tgataaatat 360 gtcaataaag atgcactcaa ccattacatt gagatattta atgatatcaa aaatagaaat 420 atagatttaa taattaatat gtaccactgg ccacttcctg tatggctaag cgatcctgta 480 tctgttagaa aaggaataaa aacagaaaga tcaggctggc tgaatgacag gatagttcaa 540 ttgtttgctt tattctcctc gtatatagta tataaaatgg aagatctggc agttgcattt 600 tcaaccatga atgaacctaa tgttgtttat ggaaatggtt ttataaatat caaatcaggt 660 tttccgcctt cctatctcag ttcagaattt gcatctaaag ttaagaacaa tatattaaaa 720 gcacattctc ttgcatacga ttctatgaaa aaaattacgg ataaacctgt gggaataatt 780 tatgcaaaca catattttac gcctttggac ccggaaaaag ataatgatgc tattgctaaa 840 gcagacagtg atgcgaaatg gtcatttttt gatccattaa taaaaggaga taaatcactt 900 ggaattaatg gcaataaact agattggatc ggaattaatt attatacaag gacaatgtta 960 aggaaagacg gagatggcta tatttcatta aaaggctatg gtcattcagg ttctcctaat 1020 actgtaacaa acgataaaag accaacaagt gatataggat gggaatttta tccggaggga 1080 ttggaatatg taattatgaa ttactggaac aggtataaat tgcctatgta cgtaacagaa 1140 aatggcatag ccgataatgg ggattatcag aggccttatt atttagtttc acacattgca 1200 agtgtactga gggcaataaa taaaggagcc aatgtaaagg gttatttgca ctggtcctta 1260 gttgataatt atgaatgggc attgggattt agcccgaaat ttggtttaat aggatacgat 1320 gaaaataaaa aactatactg gaggccaagt gctcttgttt ataaggaaat agcaacaaaa 1380 aattgcatat ccccagaatt aaagcacctc gattcaatac cgcctataaa tggtttaaga 1440 aaa 1443 <210> 34 <211> 481 <212> PRT <213> Artificial Sequence <220> <223> Thermoplasma volcanium <400> 34 Met Val Glu Asn Asn Phe Pro Glu Asp Phe Lys Phe Gly Trp Ser Gln 1 5 10 15 Ser Gly Phe Gln Ser Glu Met Gly Tyr Asp Asn Ala Met Asp Asp Lys 20 25 30 Ser Asp Trp Tyr Val Trp Val His Asp Lys Glu Asn Ile Gln Ser Gly 35 40 45 Leu Val Ser Gly Asp Met Pro Glu Asn Gly Pro Gly Tyr Trp Asn Asn 50 55 60 Tyr Lys Ser Phe His Glu Ala Ala Gln Asn Met Gly Leu Lys Met Ala 65 70 75 80 Arg Ile Gly Val Glu Trp Ser Arg Leu Phe Pro Glu Pro Phe Pro Glu 85 90 95 Lys Ile Met Ala Asp Ala Lys Asn Asn Ser Leu Glu Ile Asn Asn Asn 100 105 110 Ile Leu Ser Glu Leu Asp Lys Tyr Val Asn Lys Asp Ala Leu Asn His 115 120 125 Tyr Ile Glu Ile Phe Asn Asp Ile Lys Asn Arg Asn Ile Asp Leu Ile 130 135 140 Ile Asn Met Tyr His Trp Pro Leu Pro Val Trp Leu Ser Asp Pro Val 145 150 155 160 Ser Val Arg Lys Gly Ile Lys Thr Glu Arg Ser Gly Trp Leu Asn Asp 165 170 175 Arg Ile Val Gln Leu Phe Ala Leu Phe Ser Ser Tyr Ile Val Tyr Lys 180 185 190 Met Glu Asp Leu Ala Val Ala Phe Ser Thr Met Asn Glu Pro Asn Val 195 200 205 Val Tyr Gly Asn Gly Phe Ile Asn Ile Lys Ser Gly Phe Pro Pro Ser 210 215 220 Tyr Leu Ser Ser Glu Phe Ala Ser Lys Val Lys Asn Asn Ile Leu Lys 225 230 235 240 Ala His Ser Leu Ala Tyr Asp Ser Met Lys Lys Ile Thr Asp Lys Pro 245 250 255 Val Gly Ile Ile Tyr Ala Asn Thr Tyr Phe Thr Pro Leu Asp Pro Glu 260 265 270 Lys Asp Asn Asp Ala Ile Ala Lys Ala Asp Ser Asp Ala Lys Trp Ser 275 280 285 Phe Phe Asp Pro Leu Ile Lys Gly Asp Lys Ser Leu Gly Ile Asn Gly 290 295 300 Asn Lys Leu Asp Trp Ile Gly Ile Asn Tyr Tyr Thr Arg Thr Met Leu 305 310 315 320 Arg Lys Asp Gly Asp Gly Tyr Ile Ser Leu Lys Gly Tyr Gly His Ser 325 330 335 Gly Ser Pro Asn Thr Val Thr Asn Asp Lys Arg Pro Thr Ser Asp Ile 340 345 350 Gly Trp Glu Phe Tyr Pro Glu Gly Leu Glu Tyr Val Ile Met Asn Tyr 355 360 365 Trp Asn Arg Tyr Lys Leu Pro Met Tyr Val Thr Glu Asn Gly Ile Ala 370 375 380 Asp Asn Gly Asp Tyr Gln Arg Pro Tyr Tyr Leu Val Ser His Ile Ala 385 390 395 400 Ser Val Leu Arg Ala Ile Asn Lys Gly Ala Asn Val Lys Gly Tyr Leu 405 410 415 His Trp Ser Leu Val Asp Asn Tyr Glu Trp Ala Leu Gly Phe Ser Pro 420 425 430 Lys Phe Gly Leu Ile Gly Tyr Asp Glu Asn Lys Lys Leu Tyr Trp Arg 435 440 445 Pro Ser Ala Leu Val Tyr Lys Glu Ile Ala Thr Lys Asn Cys Ile Ser 450 455 460 Pro Glu Leu Lys His Leu Asp Ser Ile Pro Pro Ile Asn Gly Leu Arg 465 470 475 480 Lys <210> 35 <211> 1404 <212> DNA <213> Artificial Sequence <220> <223> Fervidobacterium nodosum <400> 35 atgggtatgt ttccgaaaga ttttttattt ggtgtttcga tgtctgggtt tcagtttgag 60 atgggaaatc ctcaagatgc agaagaggtt gatctaaata cagattggta tgtatgggtt 120 agggatattg gaaatattgt aaatggagtc gtaagtgggg acttgcctga aaatggttca 180 tggtactgga agcagtacgg caaagtccac caattagctg ccgattttgg gatggatgta 240 atacgaattg gaaccgaatg gtctaggatt ttcccagtta gtacgcaaag tgttgagtac 300 ggctcaccgg atatgctcga aaaattggat aaattagcaa accaaaaagc ggtaagtcat 360 tacaggaaaa taatggagga tataaaagca aaggggttaa aattgttcgt taacctttac 420 cactttactt tacctatttg gttgcacgac cctatagctg ttcacaaagg tgagaagaca 480 gataaaattg gttggatttc tgatgctaca cctattgagt ttgcgaagta tgcagagtac 540 atggcgtgga aatttgccga tatagttgat atgtgggctt ctatgaacga accacacgtt 600 gtaagtcagc ttggatattt tgcaataaat gcgggatttc caccaagtta ttttaatcct 660 tcatggtata tcaaaagttt agaaaacgaa gcgaaagcac ataacttatc ttatgatgct 720 ataaaaaagt atacaaataa tcctgttgga gttatatact cttttacatg gtacgatact 780 gttaataaag atgacaagga atcttttgaa aatgctatgg atctcacaaa ttggcgattt 840 atagatatgg taaaagataa aactgattac ataggtgtaa attattacac aagagcggtt 900 atcgatagac ttcccaccac tattgacttt ggcgaattta aaatgaattg gtatactttg 960 agaggttacg gttattcttg cgaagaagga ggattctcac tctccggaag gccggcaagc 1020 gaatttggat gggaaatata ccctgaaggg ctgtacaata ttttgataca tgtttataat 1080 agatacaaaa aagatattta tgttacggag aacggtatag ctgattcgaa ggataaatac 1140 agaagtcttt ttatcatatc gcatctttat gctatagaaa aagcattaaa cgaaggaata 1200 ccaataaaag gttatttgca ctggtcgatt atagacaatt tcgaatgggc gaagggctac 1260 agtaaaagat ttggacttgc ttacacagat ttgtcaacca aaaaatatat acctagacct 1320 tctatgtaca tttttagaga gataataaag gataaatcaa tcgacaaatt caaaggttac 1380 gatccatata acttgatgaa attc 1404 <210> 36 <211> 468 <212> PRT <213> Artificial Sequence <220> <223> Fervidobacterium nodosum <400> 36 Met Gly Met Phe Pro Lys Asp Phe Leu Phe Gly Val Ser Met Ser Gly 1 5 10 15 Phe Gln Phe Glu Met Gly Asn Pro Gln Asp Ala Glu Glu Val Asp Leu 20 25 30 Asn Thr Asp Trp Tyr Val Trp Val Arg Asp Ile Gly Asn Ile Val Asn 35 40 45 Gly Val Val Ser Gly Asp Leu Pro Glu Asn Gly Ser Trp Tyr Trp Lys 50 55 60 Gln Tyr Gly Lys Val His Gln Leu Ala Ala Asp Phe Gly Met Asp Val 65 70 75 80 Ile Arg Ile Gly Thr Glu Trp Ser Arg Ile Phe Pro Val Ser Thr Gln 85 90 95 Ser Val Glu Tyr Gly Ser Pro Asp Met Leu Glu Lys Leu Asp Lys Leu 100 105 110 Ala Asn Gln Lys Ala Val Ser His Tyr Arg Lys Ile Met Glu Asp Ile 115 120 125 Lys Ala Lys Gly Leu Lys Leu Phe Val Asn Leu Tyr His Phe Thr Leu 130 135 140 Pro Ile Trp Leu His Asp Pro Ile Ala Val His Lys Gly Glu Lys Thr 145 150 155 160 Asp Lys Ile Gly Trp Ile Ser Asp Ala Thr Pro Ile Glu Phe Ala Lys 165 170 175 Tyr Ala Glu Tyr Met Ala Trp Lys Phe Ala Asp Ile Val Asp Met Trp 180 185 190 Ala Ser Met Asn Glu Pro His Val Val Ser Gln Leu Gly Tyr Phe Ala 195 200 205 Ile Asn Ala Gly Phe Pro Pro Ser Tyr Phe Asn Pro Ser Trp Tyr Ile 210 215 220 Lys Ser Leu Glu Asn Glu Ala Lys Ala His Asn Leu Ser Tyr Asp Ala 225 230 235 240 Ile Lys Lys Tyr Thr Asn Asn Pro Val Gly Val Ile Tyr Ser Phe Thr 245 250 255 Trp Tyr Asp Thr Val Asn Lys Asp Asp Lys Glu Ser Phe Glu Asn Ala 260 265 270 Met Asp Leu Thr Asn Trp Arg Phe Ile Asp Met Val Lys Asp Lys Thr 275 280 285 Asp Tyr Ile Gly Val Asn Tyr Tyr Thr Arg Ala Val Ile Asp Arg Leu 290 295 300 Pro Thr Thr Ile Asp Phe Gly Glu Phe Lys Met Asn Trp Tyr Thr Leu 305 310 315 320 Arg Gly Tyr Gly Tyr Ser Cys Glu Glu Gly Gly Phe Ser Leu Ser Gly 325 330 335 Arg Pro Ala Ser Glu Phe Gly Trp Glu Ile Tyr Pro Glu Gly Leu Tyr 340 345 350 Asn Ile Leu Ile His Val Tyr Asn Arg Tyr Lys Lys Asp Ile Tyr Val 355 360 365 Thr Glu Asn Gly Ile Ala Asp Ser Lys Asp Lys Tyr Arg Ser Leu Phe 370 375 380 Ile Ile Ser His Leu Tyr Ala Ile Glu Lys Ala Leu Asn Glu Gly Ile 385 390 395 400 Pro Ile Lys Gly Tyr Leu His Trp Ser Ile Ile Asp Asn Phe Glu Trp 405 410 415 Ala Lys Gly Tyr Ser Lys Arg Phe Gly Leu Ala Tyr Thr Asp Leu Ser 420 425 430 Thr Lys Lys Tyr Ile Pro Arg Pro Ser Met Tyr Ile Phe Arg Glu Ile 435 440 445 Ile Lys Asp Lys Ser Ile Asp Lys Phe Lys Gly Tyr Asp Pro Tyr Asn 450 455 460 Leu Met Lys Phe 465 <210> 37 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> DNA encording mutant beta-glycosidase of Thermosphaera aggregans having glycosylation site. <400> 37 atgggtaaat tccccaaaga cttcatgata ggctactcat cttcaccgtt tcaatttgaa 60 gctggtattc ccgggtccga agatccgaat agtgattggt gggtatgggt gcatgatccg 120 gagaacacag cagctggact agtcagcggc gattttcccg agaacggccc aggttactgg 180 aaccgcactc aaaatgacca cgacctggct gagaagctgg gggttaacac tattagagta 240 ggcgttgagt ggagtaggat ttttccaaag ccaactttca atgttaaagt ccctgtagag 300 agagatgaga acggcagcat tgttcacgta gatgtcgatg ataaagcggt tgaaagactt 360 gatgaattag ccaacaagga ggccgtaaac cattacgtag aaatgtataa agactgggtt 420 gaaagaggta gaaaacttat actcaattta taccattggc ccctgcctct ctggcttcac 480 aacccaatca tggtgagaag aatgggcccg gacagagcgc cctcaggctg gcttaacgag 540 gagtccgtgg tggagtttgc caaatacgcc gcatacattg cttggaaaat gggcgagcta 600 cctgttatgt ggagcaccat gaacgaaccc aacgtcgttt atgagcaagg atacatgttc 660 gttaaagggg gtttcccacc cggctacttg agtttggaag ctgctgataa ggccaggaga 720 aatatgatcc aggctcatgc acgggcctat gacaatatta aacgcttcag taagaaacct 780 gttggactaa tatacgcttt ccaatggttc gaactattag agggtccagc agaagtattt 840 gataagttta agagctctaa gttatactat ttcacagaca tagtatcgaa gggtagttca 900 atcatcaatg ttgaatacag gagagatctt gccaataggc tagactggtt gggcgttaac 960 tactatagcc gtttagtcta caaaatcgtc gatgacaaac ctataatcct gcacgggtat 1020 ggattccttt gtacacctgg ggggatcagc ccggctgaaa atccttgtag cgattttggg 1080 tgggaggtgt atcctgaagg actctaccta cttctaaaag aactttacaa ccgatacggg 1140 gtagacttga tcgtgaccga gaacggtgtt tcagacagca gggatgcgtt gagaccggca 1200 tacctggtct cgcatgttta cagcgtatgg aaagccgcta acgagggcat tcccgtcaaa 1260 ggctacctcc actggagctt gacagacaat tacgagtggg cccagggctt caggcagaaa 1320 ttcggtttag tcatggttga cttcaaaact aagaaaaggt atctccgccc aagcgcccta 1380 gtgttccggg agatcgcaac gcataacgga ataccggatg agctacagca tcttacactg 1440 atccag 1446 <210> 38 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Mutant beta-glycosidase of Thermosphaera aggregans having glycosy lation site. <220> <221> CARBOHYD <222> (61)..(63) <223> <400> 38 Met Gly Lys Phe Pro Lys Asp Phe Met Ile Gly Tyr Ser Ser Ser Pro 1 5 10 15 Phe Gln Phe Glu Ala Gly Ile Pro Gly Ser Glu Asp Pro Asn Ser Asp 20 25 30 Trp Trp Val Trp Val His Asp Pro Glu Asn Thr Ala Ala Gly Leu Val 35 40 45 Ser Gly Asp Phe Pro Glu Asn Gly Pro Gly Tyr Trp Asn Arg Thr Gln 50 55 60 Asn Asp His Asp Leu Ala Glu Lys Leu Gly Val Asn Thr Ile Arg Val 65 70 75 80 Gly Val Glu Trp Ser Arg Ile Phe Pro Lys Pro Thr Phe Asn Val Lys 85 90 95 Val Pro Val Glu Arg Asp Glu Asn Gly Ser Ile Val His Val Asp Val 100 105 110 Asp Asp Lys Ala Val Glu Arg Leu Asp Glu Leu Ala Asn Lys Glu Ala 115 120 125 Val Asn His Tyr Val Glu Met Tyr Lys Asp Trp Val Glu Arg Gly Arg 130 135 140 Lys Leu Ile Leu Asn Leu Tyr His Trp Pro Leu Pro Leu Trp Leu His 145 150 155 160 Asn Pro Ile Met Val Arg Arg Met Gly Pro Asp Arg Ala Pro Ser Gly 165 170 175 Trp Leu Asn Glu Glu Ser Val Val Glu Phe Ala Lys Tyr Ala Ala Tyr 180 185 190 Ile Ala Trp Lys Met Gly Glu Leu Pro Val Met Trp Ser Thr Met Asn 195 200 205 Glu Pro Asn Val Val Tyr Glu Gln Gly Tyr Met Phe Val Lys Gly Gly 210 215 220 Phe Pro Pro Gly Tyr Leu Ser Leu Glu Ala Ala Asp Lys Ala Arg Arg 225 230 235 240 Asn Met Ile Gln Ala His Ala Arg Ala Tyr Asp Asn Ile Lys Arg Phe 245 250 255 Ser Lys Lys Pro Val Gly Leu Ile Tyr Ala Phe Gln Trp Phe Glu Leu 260 265 270 Leu Glu Gly Pro Ala Glu Val Phe Asp Lys Phe Lys Ser Ser Lys Leu 275 280 285 Tyr Tyr Phe Thr Asp Ile Val Ser Lys Gly Ser Ser Ile Ile Asn Val 290 295 300 Glu Tyr Arg Arg Asp Leu Ala Asn Arg Leu Asp Trp Leu Gly Val Asn 305 310 315 320 Tyr Tyr Ser Arg Leu Val Tyr Lys Ile Val Asp Asp Lys Pro Ile Ile 325 330 335 Leu His Gly Tyr Gly Phe Leu Cys Thr Pro Gly Gly Ile Ser Pro Ala 340 345 350 Glu Asn Pro Cys Ser Asp Phe Gly Trp Glu Val Tyr Pro Glu Gly Leu 355 360 365 Tyr Leu Leu Leu Lys Glu Leu Tyr Asn Arg Tyr Gly Val Asp Leu Ile 370 375 380 Val Thr Glu Asn Gly Val Ser Asp Ser Arg Asp Ala Leu Arg Pro Ala 385 390 395 400 Tyr Leu Val Ser His Val Tyr Ser Val Trp Lys Ala Ala Asn Glu Gly 405 410 415 Ile Pro Val Lys Gly Tyr Leu His Trp Ser Leu Thr Asp Asn Tyr Glu 420 425 430 Trp Ala Gln Gly Phe Arg Gln Lys Phe Gly Leu Val Met Val Asp Phe 435 440 445 Lys Thr Lys Lys Arg Tyr Leu Arg Pro Ser Ala Leu Val Phe Arg Glu 450 455 460 Ile Ala Thr His Asn Gly Ile Pro Asp Glu Leu Gln His Leu Thr Leu 465 470 475 480 Ile Gln <210> 39 <211> 1461 <212> DNA <213> Artificial Sequence <220> <223> DNA encording mutant glycoside hydrolase family protein of Caldiv irga maquilingensis having glycosylation site. <400> 39 atgggtatta agttcccaag cgacttcaga ttcggcttct ccacagtggg tactcagcat 60 gagatgggta cccctggttc tgaatttgta agtgactggt atgtgtggct tcatgaccct 120 gagaacattg cttcgggctt agttagcggt gatttacctg aacatgggcc aggttactgg 180 aaccgcacta agcaggacca ctcaatagct agggatcttg ggcttgatgc agcatggata 240 actattgagt gggctagggt gttccctaag ccgacctttg acgttaaggt taaggttgat 300 gaggatgatg gaggtaacgt ggttgacgtt gaggttaatg aatcagcatt agaggagtta 360 cgcaggctag ctgacttaaa tgctgttaat cactataggg ggattttaag tgattggaag 420 gagaggggtg gtttactggt gattaacctt taccactggg ctatgcctac gtggcttcat 480 gacccaatag ccgttaggaa gaatggacct gatagagccc cctccggttg gcttgataag 540 agatccgtta ttgagttcac taagttcgca gccttcatag cccatgagtt aggtgactta 600 gctgacatgt ggtatacgat gaatgaacct ggggtagtga taactgaggg ttacctttac 660 gttaagtcag gcttcccacc aggttacctg gacttaaact ccctagccac tgcgggtaag 720 catttaattg aggctcatgc cagagcctac gacgccatta aagcctactc aaggaaacca 780 gtgggcctag tctactcctt cgcagactat cagccgctta ggcagggtga tgaggaggct 840 gttaaggagg ctaagggact tgactactca ttcttcgacg ctccaattaa gggtgaatta 900 atgggggtta ctagggatga cttgaagggt aggcttgact ggattggggt aaactactac 960 actagggccg tattgaggag gaggcaggat gctggtcggg catcagtagc cgtggtggat 1020 ggattcggct actcctgtga acctggaggc gtatctaatg ataggagacc atgcagtgac 1080 ttcggctggg aaatataccc tgagggtgtt tacaatgtct taatggacct atggaggagg 1140 tataggatgc ccatgtacat cactgagaac ggtatagctg atgagcatga taagtggagg 1200 tcatggttca tagtatcgca cctgtatcaa attcacaggg caatggagga gggggtggat 1260 gttagagggt acttccactg gaacctaata gataacttgg agtgggctgc aggatatagg 1320 atgaggttcg gcctagttta cgttgactat gcaaccaaga ggaggtattt taggccaagc 1380 gccctggtta tgagggaggt ggctaaacag aaggctatac cggattactt agagcattac 1440 attaaaccac ctagaattga a 1461 <210> 40 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant glycoside hydrolase family protein of Caldivirga maquiling ensis having glycosylation site. <220> <221> CARBOHYD <222> (61)..(63) <223> <400> 40 Met Gly Ile Lys Phe Pro Ser Asp Phe Arg Phe Gly Phe Ser Thr Val 1 5 10 15 Gly Thr Gln His Glu Met Gly Thr Pro Gly Ser Glu Phe Val Ser Asp 20 25 30 Trp Tyr Val Trp Leu His Asp Pro Glu Asn Ile Ala Ser Gly Leu Val 35 40 45 Ser Gly Asp Leu Pro Glu His Gly Pro Gly Tyr Trp Asn Arg Thr Lys 50 55 60 Gln Asp His Ser Ile Ala Arg Asp Leu Gly Leu Asp Ala Ala Trp Ile 65 70 75 80 Thr Ile Glu Trp Ala Arg Val Phe Pro Lys Pro Thr Phe Asp Val Lys 85 90 95 Val Lys Val Asp Glu Asp Asp Gly Gly Asn Val Val Asp Val Glu Val 100 105 110 Asn Glu Ser Ala Leu Glu Glu Leu Arg Arg Leu Ala Asp Leu Asn Ala 115 120 125 Val Asn His Tyr Arg Gly Ile Leu Ser Asp Trp Lys Glu Arg Gly Gly 130 135 140 Leu Leu Val Ile Asn Leu Tyr His Trp Ala Met Pro Thr Trp Leu His 145 150 155 160 Asp Pro Ile Ala Val Arg Lys Asn Gly Pro Asp Arg Ala Pro Ser Gly 165 170 175 Trp Leu Asp Lys Arg Ser Val Ile Glu Phe Thr Lys Phe Ala Ala Phe 180 185 190 Ile Ala His Glu Leu Gly Asp Leu Ala Asp Met Trp Tyr Thr Met Asn 195 200 205 Glu Pro Gly Val Val Ile Thr Glu Gly Tyr Leu Tyr Val Lys Ser Gly 210 215 220 Phe Pro Pro Gly Tyr Leu Asp Leu Asn Ser Leu Ala Thr Ala Gly Lys 225 230 235 240 His Leu Ile Glu Ala His Ala Arg Ala Tyr Asp Ala Ile Lys Ala Tyr 245 250 255 Ser Arg Lys Pro Val Gly Leu Val Tyr Ser Phe Ala Asp Tyr Gln Pro 260 265 270 Leu Arg Gln Gly Asp Glu Glu Ala Val Lys Glu Ala Lys Gly Leu Asp 275 280 285 Tyr Ser Phe Phe Asp Ala Pro Ile Lys Gly Glu Leu Met Gly Val Thr 290 295 300 Arg Asp Asp Leu Lys Gly Arg Leu Asp Trp Ile Gly Val Asn Tyr Tyr 305 310 315 320 Thr Arg Ala Val Leu Arg Arg Arg Gln Asp Ala Gly Arg Ala Ser Val 325 330 335 Ala Val Val Asp Gly Phe Gly Tyr Ser Cys Glu Pro Gly Gly Val Ser 340 345 350 Asn Asp Arg Arg Pro Cys Ser Asp Phe Gly Trp Glu Ile Tyr Pro Glu 355 360 365 Gly Val Tyr Asn Val Leu Met Asp Leu Trp Arg Arg Tyr Arg Met Pro 370 375 380 Met Tyr Ile Thr Glu Asn Gly Ile Ala Asp Glu His Asp Lys Trp Arg 385 390 395 400 Ser Trp Phe Ile Val Ser His Leu Tyr Gln Ile His Arg Ala Met Glu 405 410 415 Glu Gly Val Asp Val Arg Gly Tyr Phe His Trp Asn Leu Ile Asp Asn 420 425 430 Leu Glu Trp Ala Ala Gly Tyr Arg Met Arg Phe Gly Leu Val Tyr Val 435 440 445 Asp Tyr Ala Thr Lys Arg Arg Tyr Phe Arg Pro Ser Ala Leu Val Met 450 455 460 Arg Glu Val Ala Lys Gln Lys Ala Ile Pro Asp Tyr Leu Glu His Tyr 465 470 475 480 Ile Lys Pro Pro Arg Ile Glu 485 <210> 41 <211> 1476 <212> DNA <213> Artificial Sequence <220> <223> DNA encording mutant beta-galactosidase of Sulfolobus acidocaldar ius having glycosylation site. <400> 41 atgggtttat cattcccaaa gggtttcaaa tttggctggt ctcagtcggg attccagtct 60 gaaatgggaa ctccaggtag cgaagatccg aacagcgatt ggcacgtctg ggttcatgac 120 agggagaaca tagtctcaca ggttgtcagt ggagatttac ccgaaaatgg tccagggtac 180 tggaaccgca ctaagagatt tcatgacgaa gcagagaaaa taggactaaa tgcagtgaga 240 attaacgtag agtggagtag aatatttccc agaccactac ccaagcctga aatgcaaaca 300 gggactgata aagagaacag tcctgtcatt agcgtagact taaatgagtc taagctgaga 360 gaaatggaca actacgctaa tcatgaagcg ttatcacatt acaggcaaat actggaggat 420 ctaagaaaca gaggatttca catagtactg aacatgtatc attggacttt gcccatatgg 480 ttgcacgacc ctatcagagt gaggagagga gactttacag gaccaacagg ttggttaaac 540 tccaggacag tttatgagtt cgctaggttc tcggcttacg tagcctggaa attagatgat 600 ttggcgagtg aatatgcaac aatgaatgaa cctaacgtgg tttggggagc aggttacgct 660 tttcctagag caggctttcc acctaattac cttagcttca ggctttcaga aatagctaaa 720 tggaatataa ttcaggctca tgcgagggct tatgacgcca tcaagagcgt atcaaaaaag 780 agtgtaggta taatatatgc aaacacatca tattacccac tcagaccaca agataacgaa 840 gctgtggaaa tagcagagag attgaacaga tggagtttct ttgactccat tataaaggga 900 gagataacta gtgagggaca aaatgtcaga gaggacttaa ggaacaggtt agactggatt 960 ggcgtaaact attacacgag gactgtggta acaaaagctg agagtggtta tttaaccctt 1020 ccgggttatg gagatcgttg tgaaaggaac tcattgagtt tagctaacct ccctaccagt 1080 gatttcggtt gggagttctt tcctgagggt ctatatgatg tacttttgaa gtattggaat 1140 aggtatgggt taccattata cgtaatggag aacggtatcg ctgatgacgc tgactaccaa 1200 agaccgtatt acttagtatc acatatctac caggtgcaca gggctttaaa cgagggagta 1260 gatgtaagag gttatcttca ttggtctttg gcagataatt atgagtggtc gtcaggtttt 1320 tcaatgaggt tcggtctact taaggtagat tatctaacaa agagattgta ctggagacct 1380 tctgcattag tttacaggga gattactagg agtaacggta ttcctgagga gctggaacat 1440 ctaaacagag taccaccaat aaaacctttg agacat 1476 <210> 42 <211> 492 <212> PRT <213> Artificial Sequence <220> <223> Mutant beta-galactosidase of Sulfolobus acidocaldarius having gly cosylation site. <220> <221> CARBOHYD <222> (62)..(64) <223> <400> 42 Met Gly Leu Ser Phe Pro Lys Gly Phe Lys Phe Gly Trp Ser Gln Ser 1 5 10 15 Gly Phe Gln Ser Glu Met Gly Thr Pro Gly Ser Glu Asp Pro Asn Ser 20 25 30 Asp Trp His Val Trp Val His Asp Arg Glu Asn Ile Val Ser Gln Val 35 40 45 Val Ser Gly Asp Leu Pro Glu Asn Gly Pro Gly Tyr Trp Asn Arg Thr 50 55 60 Lys Arg Phe His Asp Glu Ala Glu Lys Ile Gly Leu Asn Ala Val Arg 65 70 75 80 Ile Asn Val Glu Trp Ser Arg Ile Phe Pro Arg Pro Leu Pro Lys Pro 85 90 95 Glu Met Gln Thr Gly Thr Asp Lys Glu Asn Ser Pro Val Ile Ser Val 100 105 110 Asp Leu Asn Glu Ser Lys Leu Arg Glu Met Asp Asn Tyr Ala Asn His 115 120 125 Glu Ala Leu Ser His Tyr Arg Gln Ile Leu Glu Asp Leu Arg Asn Arg 130 135 140 Gly Phe His Ile Val Leu Asn Met Tyr His Trp Thr Leu Pro Ile Trp 145 150 155 160 Leu His Asp Pro Ile Arg Val Arg Arg Gly Asp Phe Thr Gly Pro Thr 165 170 175 Gly Trp Leu Asn Ser Arg Thr Val Tyr Glu Phe Ala Arg Phe Ser Ala 180 185 190 Tyr Val Ala Trp Lys Leu Asp Asp Leu Ala Ser Glu Tyr Ala Thr Met 195 200 205 Asn Glu Pro Asn Val Val Trp Gly Ala Gly Tyr Ala Phe Pro Arg Ala 210 215 220 Gly Phe Pro Pro Asn Tyr Leu Ser Phe Arg Leu Ser Glu Ile Ala Lys 225 230 235 240 Trp Asn Ile Ile Gln Ala His Ala Arg Ala Tyr Asp Ala Ile Lys Ser 245 250 255 Val Ser Lys Lys Ser Val Gly Ile Ile Tyr Ala Asn Thr Ser Tyr Tyr 260 265 270 Pro Leu Arg Pro Gln Asp Asn Glu Ala Val Glu Ile Ala Glu Arg Leu 275 280 285 Asn Arg Trp Ser Phe Phe Asp Ser Ile Ile Lys Gly Glu Ile Thr Ser 290 295 300 Glu Gly Gln Asn Val Arg Glu Asp Leu Arg Asn Arg Leu Asp Trp Ile 305 310 315 320 Gly Val Asn Tyr Tyr Thr Arg Thr Val Val Thr Lys Ala Glu Ser Gly 325 330 335 Tyr Leu Thr Leu Pro Gly Tyr Gly Asp Arg Cys Glu Arg Asn Ser Leu 340 345 350 Ser Leu Ala Asn Leu Pro Thr Ser Asp Phe Gly Trp Glu Phe Phe Pro 355 360 365 Glu Gly Leu Tyr Asp Val Leu Leu Lys Tyr Trp Asn Arg Tyr Gly Leu 370 375 380 Pro Leu Tyr Val Met Glu Asn Gly Ile Ala Asp Asp Ala Asp Tyr Gln 385 390 395 400 Arg Pro Tyr Tyr Leu Val Ser His Ile Tyr Gln Val His Arg Ala Leu 405 410 415 Asn Glu Gly Val Asp Val Arg Gly Tyr Leu His Trp Ser Leu Ala Asp 420 425 430 Asn Tyr Glu Trp Ser Ser Gly Phe Ser Met Arg Phe Gly Leu Leu Lys 435 440 445 Val Asp Tyr Leu Thr Lys Arg Leu Tyr Trp Arg Pro Ser Ala Leu Val 450 455 460 Tyr Arg Glu Ile Thr Arg Ser Asn Gly Ile Pro Glu Glu Leu Glu His 465 470 475 480 Leu Asn Arg Val Pro Pro Ile Lys Pro Leu Arg His 485 490 <210> 43 <211> 1470 <212> DNA <213> Artificial Sequence <220> <223> DNA encording mutant beta-galactosidase of Sulfolobus solfataricu s having glycosylation site. <400> 43 atgggttact catttccaaa tagctttagg tttggttggt cccaggccgg atttcaatca 60 gaaatgggaa caccagggtc agaagatcca aatactgact ggtataaatg ggttcatgat 120 ccagaaaaca tggcagcggg attagtaagt ggagatctac cagaaaatgg gccaggctac 180 tggaaccgca ctaagacatt tcacgataat gcacaaaaaa tgggattaaa aatagctaga 240 ctaaatgtgg aatggtctag gatatttcct aatccattac caaggccaca aaactttgat 300 gaatcaaaac aagatgtgac agaggttgag ataaacgaaa acgagttaaa gagacttgac 360 gagtacgcta ataaagacgc attaaaccat tacagggaaa tattcaagga tcttaaaagt 420 agaggacttt actttatact aaacatgtat cattggccat tacctctatg gttacacgac 480 ccaataagag taagaagagg agattttact ggaccaagtg gttggctaag tactagaaca 540 gtttacgagt tcgctagatt ctcagcttat atagcttgga aattcgatga tctagtggat 600 gagtactcaa caatgaatga acctaacgtt gttggaggtt taggatacgt tggtgttaag 660 tccggttttc ccccaggata cctaagcttt gaactttccc gtagggcaat gtataacatc 720 attcaagctc acgcaagagc gtatgatggg ataaagagtg tttctaaaaa accagttgga 780 attatttacg ctaatagctc attccagccg ttaacggata aagatatgga agcggtagag 840 atggctgaaa atgataatag atggtggttc tttgatgcta taataagagg tgagatcacc 900 agaggaaacg agaagattgt aagagatgac ctaaagggta gattggattg gattggagtt 960 aattattaca ctaggactgt tgtgaagagg actgaaaagg gatacgttag cttaggaggt 1020 tacggtcacg gatgtgagag gaactctgta agtttagcgg gattaccaac cagcgacttc 1080 ggctgggagt tcttcccaga aggtttatat gacgttttga cgaaatactg gaatagatat 1140 catctctata tgtacgttac tgaaaatggt attgcggatg atgccgatta tcaaaggccc 1200 tattatttag tatctcacgt ttatcaagtt catagagcaa taaatagtgg tgcagatgtt 1260 agagggtatt tacattggtc tctagctgat aattacgaat gggcttcagg attctctatg 1320 aggtttggtc tgttaaaggt cgattacaac actaagagac tatactggag accctcagca 1380 ctagtatata gggaaatcgc cacaaatggc gcaataactg atgaaataga gcacttaaat 1440 agcgtacctc cagtaaagcc attaaggcac 1470 <210> 44 <211> 490 <212> PRT <213> Artificial Sequence <220> <223> Mutant beta-galactosidase of Sulfolobus solfataricus having glyco sylation site. <220> <221> CARBOHYD <222> (62)..(64) <223> <400> 44 Met Gly Tyr Ser Phe Pro Asn Ser Phe Arg Phe Gly Trp Ser Gln Ala 1 5 10 15 Gly Phe Gln Ser Glu Met Gly Thr Pro Gly Ser Glu Asp Pro Asn Thr 20 25 30 Asp Trp Tyr Lys Trp Val His Asp Pro Glu Asn Met Ala Ala Gly Leu 35 40 45 Val Ser Gly Asp Leu Pro Glu Asn Gly Pro Gly Tyr Trp Asn Arg Thr 50 55 60 Lys Thr Phe His Asp Asn Ala Gln Lys Met Gly Leu Lys Ile Ala Arg 65 70 75 80 Leu Asn Val Glu Trp Ser Arg Ile Phe Pro Asn Pro Leu Pro Arg Pro 85 90 95 Gln Asn Phe Asp Glu Ser Lys Gln Asp Val Thr Glu Val Glu Ile Asn 100 105 110 Glu Asn Glu Leu Lys Arg Leu Asp Glu Tyr Ala Asn Lys Asp Ala Leu 115 120 125 Asn His Tyr Arg Glu Ile Phe Lys Asp Leu Lys Ser Arg Gly Leu Tyr 130 135 140 Phe Ile Leu Asn Met Tyr His Trp Pro Leu Pro Leu Trp Leu His Asp 145 150 155 160 Pro Ile Arg Val Arg Arg Gly Asp Phe Thr Gly Pro Ser Gly Trp Leu 165 170 175 Ser Thr Arg Thr Val Tyr Glu Phe Ala Arg Phe Ser Ala Tyr Ile Ala 180 185 190 Trp Lys Phe Asp Asp Leu Val Asp Glu Tyr Ser Thr Met Asn Glu Pro 195 200 205 Asn Val Val Gly Gly Leu Gly Tyr Val Gly Val Lys Ser Gly Phe Pro 210 215 220 Pro Gly Tyr Leu Ser Phe Glu Leu Ser Arg Arg Ala Met Tyr Asn Ile 225 230 235 240 Ile Gln Ala His Ala Arg Ala Tyr Asp Gly Ile Lys Ser Val Ser Lys 245 250 255 Lys Pro Val Gly Ile Ile Tyr Ala Asn Ser Ser Phe Gln Pro Leu Thr 260 265 270 Asp Lys Asp Met Glu Ala Val Glu Met Ala Glu Asn Asp Asn Arg Trp 275 280 285 Trp Phe Phe Asp Ala Ile Ile Arg Gly Glu Ile Thr Arg Gly Asn Glu 290 295 300 Lys Ile Val Arg Asp Asp Leu Lys Gly Arg Leu Asp Trp Ile Gly Val 305 310 315 320 Asn Tyr Tyr Thr Arg Thr Val Val Lys Arg Thr Glu Lys Gly Tyr Val 325 330 335 Ser Leu Gly Gly Tyr Gly His Gly Cys Glu Arg Asn Ser Val Ser Leu 340 345 350 Ala Gly Leu Pro Thr Ser Asp Phe Gly Trp Glu Phe Phe Pro Glu Gly 355 360 365 Leu Tyr Asp Val Leu Thr Lys Tyr Trp Asn Arg Tyr His Leu Tyr Met 370 375 380 Tyr Val Thr Glu Asn Gly Ile Ala Asp Asp Ala Asp Tyr Gln Arg Pro 385 390 395 400 Tyr Tyr Leu Val Ser His Val Tyr Gln Val His Arg Ala Ile Asn Ser 405 410 415 Gly Ala Asp Val Arg Gly Tyr Leu His Trp Ser Leu Ala Asp Asn Tyr 420 425 430 Glu Trp Ala Ser Gly Phe Ser Met Arg Phe Gly Leu Leu Lys Val Asp 435 440 445 Tyr Asn Thr Lys Arg Leu Tyr Trp Arg Pro Ser Ala Leu Val Tyr Arg 450 455 460 Glu Ile Ala Thr Asn Gly Ala Ile Thr Asp Glu Ile Glu His Leu Asn 465 470 475 480 Ser Val Pro Pro Val Lys Pro Leu Arg His 485 490 <210> 45 <211> 1488 <212> DNA <213> Artificial Sequence <220> <223> DNA encording mutant beta-galactosidase of Picrophilus torridus h aving glycosylation site. <400> 45 atgggtttac ccaagaactt tttacttggc ttttctctgg ctggctttca gtctgaaatg 60 ggcatatcag atcctgatag caattcagat tggtggttat gggtacatga cccggtgaat 120 ataaggactg gacttgtatc tggtgactta cctgaaaatg gaataggata ctggaaccgc 180 actaaaaaat ataatggtct ggctgttcaa acaggaatga atgctgcaag gcttggagtt 240 gaatggagca ggatatttcc aaaaagtact gaagaagtaa aggtgatgga agattacaaa 300 gatgatgatt taatttccgt ggatgttaat gagggaagtc ttgaaaaact tgacagactg 360 gcaaatcaaa aggcaattaa tagatatatg gaaatcttca ataatatcaa ggaaaataat 420 atgacgctaa tagtgaatgt ttaccattgg ccaataccaa tatatcttca cgatccaata 480 gaagctagga atagtggact ttcaaataaa agaaatggct ggcttaatca taaaaccgtt 540 gtggaatttg taaaatatgc aaaatatctg gcatggaaat ttagcgatgt ggcagatatg 600 ttttctataa tgaatgagcc aaacgttgta tttggtaatg gatattttaa tgttaaatca 660 gggttcccac cagcatttcc aagtgtgcat ggcggtttgc ttgcaaaaaa acatgaaatt 720 gaggctatag caagatcata cgacgccatg aaggagatta caaaaaaacc agttggtcta 780 attatggcaa attcagatgt acaaccacta acagatgagg ataaagaagc agcagaaatg 840 gctacttaca atgatcgcta ttcattcata gatccgctaa gagttggtga gatgaaatgg 900 gctgatgagg ttactgcagg taatccaatt ggtgaaaaga gcaacatcga tagatctgat 960 ctaaaaaata agctagactg gataggtgtt aactattata caagggccgt tgtaaaaaaa 1020 tctggaaacg gatatacaac attaaaagga tatggacact ctgcaaccgc tggcatgcca 1080 agtagggccg gaagggatgt aagtgacttt ggctgggaat tttatccaga aggtcttgta 1140 aacgtcttat catcatactg gaaaagatat cacattccaa tgattgtgac tgaaaatggt 1200 gttgctgact ctattgatag acttagacca aggtaccttg tgtcacatat aaagtctgtt 1260 gaaaaggctt tatctatggg tatggatatt aggggatatc ttcactggtc tctgattgat 1320 aactatgaat gggcatcagg tttttcaatg aaatttgggc tttatggtat tgatttgaac 1380 aataaaaaga ttcaacacag accaagtgca ctggtattta aagaaattgc aaatgccaac 1440 ggagtcccgg aggaatttga atggatggca gaccagcatc agaactca 1488 <210> 46 <211> 496 <212> PRT <213> Artificial Sequence <220> <223> Mutant beta-galactosidase of Picrophilus torridus having glycosyl ation site. <220> <221> CARBOHYD <222> (59)..(61) <223> <400> 46 Met Gly Leu Pro Lys Asn Phe Leu Leu Gly Phe Ser Leu Ala Gly Phe 1 5 10 15 Gln Ser Glu Met Gly Ile Ser Asp Pro Asp Ser Asn Ser Asp Trp Trp 20 25 30 Leu Trp Val His Asp Pro Val Asn Ile Arg Thr Gly Leu Val Ser Gly 35 40 45 Asp Leu Pro Glu Asn Gly Ile Gly Tyr Trp Asn Arg Thr Lys Lys Tyr 50 55 60 Asn Gly Leu Ala Val Gln Thr Gly Met Asn Ala Ala Arg Leu Gly Val 65 70 75 80 Glu Trp Ser Arg Ile Phe Pro Lys Ser Thr Glu Glu Val Lys Val Met 85 90 95 Glu Asp Tyr Lys Asp Asp Asp Leu Ile Ser Val Asp Val Asn Glu Gly 100 105 110 Ser Leu Glu Lys Leu Asp Arg Leu Ala Asn Gln Lys Ala Ile Asn Arg 115 120 125 Tyr Met Glu Ile Phe Asn Asn Ile Lys Glu Asn Asn Met Thr Leu Ile 130 135 140 Val Asn Val Tyr His Trp Pro Ile Pro Ile Tyr Leu His Asp Pro Ile 145 150 155 160 Glu Ala Arg Asn Ser Gly Leu Ser Asn Lys Arg Asn Gly Trp Leu Asn 165 170 175 His Lys Thr Val Val Glu Phe Val Lys Tyr Ala Lys Tyr Leu Ala Trp 180 185 190 Lys Phe Ser Asp Val Ala Asp Met Phe Ser Ile Met Asn Glu Pro Asn 195 200 205 Val Val Phe Gly Asn Gly Tyr Phe Asn Val Lys Ser Gly Phe Pro Pro 210 215 220 Ala Phe Pro Ser Val His Gly Gly Leu Leu Ala Lys Lys His Glu Ile 225 230 235 240 Glu Ala Ile Ala Arg Ser Tyr Asp Ala Met Lys Glu Ile Thr Lys Lys 245 250 255 Pro Val Gly Leu Ile Met Ala Asn Ser Asp Val Gln Pro Leu Thr Asp 260 265 270 Glu Asp Lys Glu Ala Ala Glu Met Ala Thr Tyr Asn Asp Arg Tyr Ser 275 280 285 Phe Ile Asp Pro Leu Arg Val Gly Glu Met Lys Trp Ala Asp Glu Val 290 295 300 Thr Ala Gly Asn Pro Ile Gly Glu Lys Ser Asn Ile Asp Arg Ser Asp 305 310 315 320 Leu Lys Asn Lys Leu Asp Trp Ile Gly Val Asn Tyr Tyr Thr Arg Ala 325 330 335 Val Val Lys Lys Ser Gly Asn Gly Tyr Thr Thr Leu Lys Gly Tyr Gly 340 345 350 His Ser Ala Thr Ala Gly Met Pro Ser Arg Ala Gly Arg Asp Val Ser 355 360 365 Asp Phe Gly Trp Glu Phe Tyr Pro Glu Gly Leu Val Asn Val Leu Ser 370 375 380 Ser Tyr Trp Lys Arg Tyr His Ile Pro Met Ile Val Thr Glu Asn Gly 385 390 395 400 Val Ala Asp Ser Ile Asp Arg Leu Arg Pro Arg Tyr Leu Val Ser His 405 410 415 Ile Lys Ser Val Glu Lys Ala Leu Ser Met Gly Met Asp Ile Arg Gly 420 425 430 Tyr Leu His Trp Ser Leu Ile Asp Asn Tyr Glu Trp Ala Ser Gly Phe 435 440 445 Ser Met Lys Phe Gly Leu Tyr Gly Ile Asp Leu Asn Asn Lys Lys Ile 450 455 460 Gln His Arg Pro Ser Ala Leu Val Phe Lys Glu Ile Ala Asn Ala Asn 465 470 475 480 Gly Val Pro Glu Glu Phe Glu Trp Met Ala Asp Gln His Gln Asn Ser 485 490 495 <210> 47 <211> 1443 <212> DNA <213> Artificial Sequence <220> <223> DNA encording mutant beta-galactosidase of Thermoplasma volcanium having glycosylation site. <400> 47 atggtagaaa acaattttcc agaggatttc aaatttggtt ggtcacagtc aggttttcaa 60 tcggagatgg gctatgataa cgcaatggac gataaaagtg actggtatgt ctgggttcat 120 gataaagaaa acatccaatc agggcttgta agcggagaca tgcccgaaaa tggtccgggt 180 tactggaacc gcactaaatc attccatgaa gctgcacaga atatgggatt aaaaatggca 240 agaatcggag ttgaatggtc aagattattc ccggaacctt tcccggaaaa aataatggca 300 gatgcaaaaa ataattcctt agaaataaac aataacattc tttcagaact tgataaatat 360 gtcaataaag atgcactcaa ccattacatt gagatattta atgatatcaa aaatagaaat 420 atagatttaa taattaatat gtaccactgg ccacttcctg tatggctaag cgatcctgta 480 tctgttagaa aaggaataaa aacagaaaga tcaggctggc tgaatgacag gatagttcaa 540 ttgtttgctt tattctcctc gtatatagta tataaaatgg aagatctggc agttgcattt 600 tcaaccatga atgaacctaa tgttgtttat ggaaatggtt ttataaatat caaatcaggt 660 tttccgcctt cctatctcag ttcagaattt gcatctaaag ttaagaacaa tatattaaaa 720 gcacattctc ttgcatacga ttctatgaaa aaaattacgg ataaacctgt gggaataatt 780 tatgcaaaca catattttac gcctttggac ccggaaaaag ataatgatgc tattgctaaa 840 gcagacagtg atgcgaaatg gtcatttttt gatccattaa taaaaggaga taaatcactt 900 ggaattaatg gcaataaact agattggatc ggaattaatt attatacaag gacaatgtta 960 aggaaagacg gagatggcta tatttcatta aaaggctatg gtcattcagg ttctcctaat 1020 actgtaacaa acgataaaag accaacaagt gatataggat gggaatttta tccggaggga 1080 ttggaatatg taattatgaa ttactggaac aggtataaat tgcctatgta cgtaacagaa 1140 aatggcatag ccgataatgg ggattatcag aggccttatt atttagtttc acacattgca 1200 agtgtactga gggcaataaa taaaggagcc aatgtaaagg gttatttgca ctggtcctta 1260 gttgataatt atgaatgggc attgggattt agcccgaaat ttggtttaat aggatacgat 1320 gaaaataaaa aactatactg gaggccaagt gctcttgttt ataaggaaat agcaacaaaa 1380 aattgcatat ccccagaatt aaagcacctc gattcaatac cgcctataaa tggtttaaga 1440 aaa 1443 <210> 48 <211> 481 <212> PRT <213> Artificial Sequence <220> <223> Mutant beta-galactosidase of Thermoplasma volcanium aggregans hav ing glycosylation site. <220> <221> CARBOHYD <222> (63)..(65) <223> <400> 48 Met Val Glu Asn Asn Phe Pro Glu Asp Phe Lys Phe Gly Trp Ser Gln 1 5 10 15 Ser Gly Phe Gln Ser Glu Met Gly Tyr Asp Asn Ala Met Asp Asp Lys 20 25 30 Ser Asp Trp Tyr Val Trp Val His Asp Lys Glu Asn Ile Gln Ser Gly 35 40 45 Leu Val Ser Gly Asp Met Pro Glu Asn Gly Pro Gly Tyr Trp Asn Arg 50 55 60 Thr Lys Ser Phe His Glu Ala Ala Gln Asn Met Gly Leu Lys Met Ala 65 70 75 80 Arg Ile Gly Val Glu Trp Ser Arg Leu Phe Pro Glu Pro Phe Pro Glu 85 90 95 Lys Ile Met Ala Asp Ala Lys Asn Asn Ser Leu Glu Ile Asn Asn Asn 100 105 110 Ile Leu Ser Glu Leu Asp Lys Tyr Val Asn Lys Asp Ala Leu Asn His 115 120 125 Tyr Ile Glu Ile Phe Asn Asp Ile Lys Asn Arg Asn Ile Asp Leu Ile 130 135 140 Ile Asn Met Tyr His Trp Pro Leu Pro Val Trp Leu Ser Asp Pro Val 145 150 155 160 Ser Val Arg Lys Gly Ile Lys Thr Glu Arg Ser Gly Trp Leu Asn Asp 165 170 175 Arg Ile Val Gln Leu Phe Ala Leu Phe Ser Ser Tyr Ile Val Tyr Lys 180 185 190 Met Glu Asp Leu Ala Val Ala Phe Ser Thr Met Asn Glu Pro Asn Val 195 200 205 Val Tyr Gly Asn Gly Phe Ile Asn Ile Lys Ser Gly Phe Pro Pro Ser 210 215 220 Tyr Leu Ser Ser Glu Phe Ala Ser Lys Val Lys Asn Asn Ile Leu Lys 225 230 235 240 Ala His Ser Leu Ala Tyr Asp Ser Met Lys Lys Ile Thr Asp Lys Pro 245 250 255 Val Gly Ile Ile Tyr Ala Asn Thr Tyr Phe Thr Pro Leu Asp Pro Glu 260 265 270 Lys Asp Asn Asp Ala Ile Ala Lys Ala Asp Ser Asp Ala Lys Trp Ser 275 280 285 Phe Phe Asp Pro Leu Ile Lys Gly Asp Lys Ser Leu Gly Ile Asn Gly 290 295 300 Asn Lys Leu Asp Trp Ile Gly Ile Asn Tyr Tyr Thr Arg Thr Met Leu 305 310 315 320 Arg Lys Asp Gly Asp Gly Tyr Ile Ser Leu Lys Gly Tyr Gly His Ser 325 330 335 Gly Ser Pro Asn Thr Val Thr Asn Asp Lys Arg Pro Thr Ser Asp Ile 340 345 350 Gly Trp Glu Phe Tyr Pro Glu Gly Leu Glu Tyr Val Ile Met Asn Tyr 355 360 365 Trp Asn Arg Tyr Lys Leu Pro Met Tyr Val Thr Glu Asn Gly Ile Ala 370 375 380 Asp Asn Gly Asp Tyr Gln Arg Pro Tyr Tyr Leu Val Ser His Ile Ala 385 390 395 400 Ser Val Leu Arg Ala Ile Asn Lys Gly Ala Asn Val Lys Gly Tyr Leu 405 410 415 His Trp Ser Leu Val Asp Asn Tyr Glu Trp Ala Leu Gly Phe Ser Pro 420 425 430 Lys Phe Gly Leu Ile Gly Tyr Asp Glu Asn Lys Lys Leu Tyr Trp Arg 435 440 445 Pro Ser Ala Leu Val Tyr Lys Glu Ile Ala Thr Lys Asn Cys Ile Ser 450 455 460 Pro Glu Leu Lys His Leu Asp Ser Ile Pro Pro Ile Asn Gly Leu Arg 465 470 475 480 Lys <210> 49 <211> 1404 <212> DNA <213> Artificial Sequence <220> <223> DNA encording mutant glycoside hydrolase family protein of Fervid obacterium nodosum having glycosylation site. <400> 49 atgggtatgt ttccgaaaga ttttttattt ggtgtttcga tgtctgggtt tcagtttgag 60 atgggaaatc ctcaagatgc agaagaggtt gatctaaata cagattggta tgtatgggtt 120 agggatattg gaaatattgt aaatggagtc gtaagtgggg acttgcctga aaatggttca 180 tggtactgga accgcactgg caaagtccac caattagctg ccgattttgg gatggatgta 240 atacgaattg gaaccgaatg gtctaggatt ttcccagtta gtacgcaaag tgttgagtac 300 ggctcaccgg atatgctcga aaaattggat aaattagcaa accaaaaagc ggtaagtcat 360 tacaggaaaa taatggagga tataaaagca aaggggttaa aattgttcgt taacctttac 420 cactttactt tacctatttg gttgcacgac cctatagctg ttcacaaagg tgagaagaca 480 gataaaattg gttggatttc tgatgctaca cctattgagt ttgcgaagta tgcagagtac 540 atggcgtgga aatttgccga tatagttgat atgtgggctt ctatgaacga accacacgtt 600 gtaagtcagc ttggatattt tgcaataaat gcgggatttc caccaagtta ttttaatcct 660 tcatggtata tcaaaagttt agaaaacgaa gcgaaagcac ataacttatc ttatgatgct 720 ataaaaaagt atacaaataa tcctgttgga gttatatact cttttacatg gtacgatact 780 gttaataaag atgacaagga atcttttgaa aatgctatgg atctcacaaa ttggcgattt 840 atagatatgg taaaagataa aactgattac ataggtgtaa attattacac aagagcggtt 900 atcgatagac ttcccaccac tattgacttt ggcgaattta aaatgaattg gtatactttg 960 agaggttacg gttattcttg cgaagaagga ggattctcac tctccggaag gccggcaagc 1020 gaatttggat gggaaatata ccctgaaggg ctgtacaata ttttgataca tgtttataat 1080 agatacaaaa aagatattta tgttacggag aacggtatag ctgattcgaa ggataaatac 1140 agaagtcttt ttatcatatc gcatctttat gctatagaaa aagcattaaa cgaaggaata 1200 ccaataaaag gttatttgca ctggtcgatt atagacaatt tcgaatgggc gaagggctac 1260 agtaaaagat ttggacttgc ttacacagat ttgtcaacca aaaaatatat acctagacct 1320 tctatgtaca tttttagaga gataataaag gataaatcaa tcgacaaatt caaaggttac 1380 gatccatata acttgatgaa attc 1404 <210> 50 <211> 468 <212> PRT <213> Artificial Sequence <220> <223> Mutant glycoside hydrolase family protein of Fervidobacterium nod osum having glycosylation site. <220> <221> CARBOHYD <222> (64)..(66) <223> <400> 50 Met Gly Met Phe Pro Lys Asp Phe Leu Phe Gly Val Ser Met Ser Gly 1 5 10 15 Phe Gln Phe Glu Met Gly Asn Pro Gln Asp Ala Glu Glu Val Asp Leu 20 25 30 Asn Thr Asp Trp Tyr Val Trp Val Arg Asp Ile Gly Asn Ile Val Asn 35 40 45 Gly Val Val Ser Gly Asp Leu Pro Glu Asn Gly Ser Trp Tyr Trp Asn 50 55 60 Arg Thr Gly Lys Val His Gln Leu Ala Ala Asp Phe Gly Met Asp Val 65 70 75 80 Ile Arg Ile Gly Thr Glu Trp Ser Arg Ile Phe Pro Val Ser Thr Gln 85 90 95 Ser Val Glu Tyr Gly Ser Pro Asp Met Leu Glu Lys Leu Asp Lys Leu 100 105 110 Ala Asn Gln Lys Ala Val Ser His Tyr Arg Lys Ile Met Glu Asp Ile 115 120 125 Lys Ala Lys Gly Leu Lys Leu Phe Val Asn Leu Tyr His Phe Thr Leu 130 135 140 Pro Ile Trp Leu His Asp Pro Ile Ala Val His Lys Gly Glu Lys Thr 145 150 155 160 Asp Lys Ile Gly Trp Ile Ser Asp Ala Thr Pro Ile Glu Phe Ala Lys 165 170 175 Tyr Ala Glu Tyr Met Ala Trp Lys Phe Ala Asp Ile Val Asp Met Trp 180 185 190 Ala Ser Met Asn Glu Pro His Val Val Ser Gln Leu Gly Tyr Phe Ala 195 200 205 Ile Asn Ala Gly Phe Pro Pro Ser Tyr Phe Asn Pro Ser Trp Tyr Ile 210 215 220 Lys Ser Leu Glu Asn Glu Ala Lys Ala His Asn Leu Ser Tyr Asp Ala 225 230 235 240 Ile Lys Lys Tyr Thr Asn Asn Pro Val Gly Val Ile Tyr Ser Phe Thr 245 250 255 Trp Tyr Asp Thr Val Asn Lys Asp Asp Lys Glu Ser Phe Glu Asn Ala 260 265 270 Met Asp Leu Thr Asn Trp Arg Phe Ile Asp Met Val Lys Asp Lys Thr 275 280 285 Asp Tyr Ile Gly Val Asn Tyr Tyr Thr Arg Ala Val Ile Asp Arg Leu 290 295 300 Pro Thr Thr Ile Asp Phe Gly Glu Phe Lys Met Asn Trp Tyr Thr Leu 305 310 315 320 Arg Gly Tyr Gly Tyr Ser Cys Glu Glu Gly Gly Phe Ser Leu Ser Gly 325 330 335 Arg Pro Ala Ser Glu Phe Gly Trp Glu Ile Tyr Pro Glu Gly Leu Tyr 340 345 350 Asn Ile Leu Ile His Val Tyr Asn Arg Tyr Lys Lys Asp Ile Tyr Val 355 360 365 Thr Glu Asn Gly Ile Ala Asp Ser Lys Asp Lys Tyr Arg Ser Leu Phe 370 375 380 Ile Ile Ser His Leu Tyr Ala Ile Glu Lys Ala Leu Asn Glu Gly Ile 385 390 395 400 Pro Ile Lys Gly Tyr Leu His Trp Ser Ile Ile Asp Asn Phe Glu Trp 405 410 415 Ala Lys Gly Tyr Ser Lys Arg Phe Gly Leu Ala Tyr Thr Asp Leu Ser 420 425 430 Thr Lys Lys Tyr Ile Pro Arg Pro Ser Met Tyr Ile Phe Arg Glu Ile 435 440 445 Ile Lys Asp Lys Ser Ile Asp Lys Phe Lys Gly Tyr Asp Pro Tyr Asn 450 455 460 Leu Met Lys Phe 465 <210> 51 <211> 1419 <212> DNA <213> Artificial <220> <223> DNA encording mutant beta-glucosidase having glycosylation site. <400> 51 atggcaaagt tcccaaaaaa cttcatgttt ggatattctt ggtctggttt ccagtttgag 60 atgggactgc caggaagtga agtggaaagc gactggtggg tgtgggttaa cgacacggag 120 aacatagcat caggtctagt aagtggagat ctaccagaga acggcccagc atattggaac 180 cgcactaagc aagatcatga cattgcagaa aagctaggaa tggattgtat tagaggtggc 240 attgagtggg caagaatttt tccaaagcca acatttgacg ttaaagttga tgtggaaaag 300 gatgaagaag gcaacataat ttccgtagac gttccagaga gtacaataaa agagctagag 360 aaaattgcca acatggaggc ccttgaacat tatcgcaaga tttactcaga ctggaaggag 420 aggggcaaaa ccttcatatt aaacctctac cactggcctc ttccattatg gattcatgac 480 ccaattgcag taaggaaact tggcccggat agggctcctg caggatggtt agatgagaag 540 acagtggtag agtttgtgaa gtttgccgcc ttcgttgctt atcaccttga tgacctcgtt 600 gacatgtgga gcacaatgaa cgaaccaaac gtagtctaca atcaaggtta cattaatcta 660 cgttcaggat ttccaccagg atatctaagc tttgaagcag cagaaaaggc aaaattcaac 720 ttaattcagg ctcacatcgg agcatatgat gccataaaag agtattcaga aaaatccgtg 780 ggagtgatat acgcctttgc ttggcacgat cctctagcgg aggagtataa ggatgaagta 840 gaggaaatca gaaagaaaga ctatgagttt gtaacaattc tacactcaaa aggaaagcta 900 gactggatcg gcgtaaacta ctactccagg ctggtatatg gagccaaaga tggacaccta 960 gttcctttac ctggatatgg atttatgagt gagagaggag gatttgcaaa gtcaggaaga 1020 cctgctagtg actttggatg ggaaatgtac ccagagggcc ttgagaacct tcttaagtat 1080 ttaaacaatg cctacgagct accaatgata attacagaga acggtatggc cgatgcagca 1140 gatagataca ggccacacta tctcgtaagc catctaaagg cagtttacaa tgctatgaaa 1200 gaaggtgctg atgttagagg gtatctccac tggtctctaa cagacaacta cgaatgggcc 1260 caagggttca ggatgagatt tggattggtt tacgtggatt tcgagacaaa gaagagatat 1320 ttaaggccaa gcgccctggt attcagagaa atagccactc aaaaagaaat tccagaagaa 1380 ttagctcacc tcgcagacct caaatttgtt acaagaaag 1419 <210> 52 <211> 473 <212> PRT <213> Artificial <220> <223> Mutant beta-glucosidase having glycosylation site. <220> <221> CARBOHYD <222> (37)..(39) <223> <220> <221> CARBOHYD <222> (60)..(62) <223> <400> 52 Met Ala Lys Phe Pro Lys Asn Phe Met Phe Gly Tyr Ser Trp Ser Gly 1 5 10 15 Phe Gln Phe Glu Met Gly Leu Pro Gly Ser Glu Val Glu Ser Asp Trp 20 25 30 Trp Val Trp Val Asn Asp Thr Glu Asn Ile Ala Ser Gly Leu Val Ser 35 40 45 Gly Asp Leu Pro Glu Asn Gly Pro Ala Tyr Trp Asn Arg Thr Lys Gln 50 55 60 Asp His Asp Ile Ala Glu Lys Leu Gly Met Asp Cys Ile Arg Gly Gly 65 70 75 80 Ile Glu Trp Ala Arg Ile Phe Pro Lys Pro Thr Phe Asp Val Lys Val 85 90 95 Asp Val Glu Lys Asp Glu Glu Gly Asn Ile Ile Ser Val Asp Val Pro 100 105 110 Glu Ser Thr Ile Lys Glu Leu Glu Lys Ile Ala Asn Met Glu Ala Leu 115 120 125 Glu His Tyr Arg Lys Ile Tyr Ser Asp Trp Lys Glu Arg Gly Lys Thr 130 135 140 Phe Ile Leu Asn Leu Tyr His Trp Pro Leu Pro Leu Trp Ile His Asp 145 150 155 160 Pro Ile Ala Val Arg Lys Leu Gly Pro Asp Arg Ala Pro Ala Gly Trp 165 170 175 Leu Asp Glu Lys Thr Val Val Glu Phe Val Lys Phe Ala Ala Phe Val 180 185 190 Ala Tyr His Leu Asp Asp Leu Val Asp Met Trp Ser Thr Met Asn Glu 195 200 205 Pro Asn Val Val Tyr Asn Gln Gly Tyr Ile Asn Leu Arg Ser Gly Phe 210 215 220 Pro Pro Gly Tyr Leu Ser Phe Glu Ala Ala Glu Lys Ala Lys Phe Asn 225 230 235 240 Leu Ile Gln Ala His Ile Gly Ala Tyr Asp Ala Ile Lys Glu Tyr Ser 245 250 255 Glu Lys Ser Val Gly Val Ile Tyr Ala Phe Ala Trp His Asp Pro Leu 260 265 270 Ala Glu Glu Tyr Lys Asp Glu Val Glu Glu Ile Arg Lys Lys Asp Tyr 275 280 285 Glu Phe Val Thr Ile Leu His Ser Lys Gly Lys Leu Asp Trp Ile Gly 290 295 300 Val Asn Tyr Tyr Ser Arg Leu Val Tyr Gly Ala Lys Asp Gly His Leu 305 310 315 320 Val Pro Leu Pro Gly Tyr Gly Phe Met Ser Glu Arg Gly Gly Phe Ala 325 330 335 Lys Ser Gly Arg Pro Ala Ser Asp Phe Gly Trp Glu Met Tyr Pro Glu 340 345 350 Gly Leu Glu Asn Leu Leu Lys Tyr Leu Asn Asn Ala Tyr Glu Leu Pro 355 360 365 Met Ile Ile Thr Glu Asn Gly Met Ala Asp Ala Ala Asp Arg Tyr Arg 370 375 380 Pro His Tyr Leu Val Ser His Leu Lys Ala Val Tyr Asn Ala Met Lys 385 390 395 400 Glu Gly Ala Asp Val Arg Gly Tyr Leu His Trp Ser Leu Thr Asp Asn 405 410 415 Tyr Glu Trp Ala Gln Gly Phe Arg Met Arg Phe Gly Leu Val Tyr Val 420 425 430 Asp Phe Glu Thr Lys Lys Arg Tyr Leu Arg Pro Ser Ala Leu Val Phe 435 440 445 Arg Glu Ile Ala Thr Gln Lys Glu Ile Pro Glu Glu Leu Ala His Leu 450 455 460 Ala Asp Leu Lys Phe Val Thr Arg Lys 465 470 <210> 53 <211> 1419 <212> DNA <213> Artificial <220> <223> DNA encording mutant beta-glucosidase having glycosylation site. <400> 53 atggcaaagt tcccaaaaaa cttcatgttt ggatattctt ggtctggttt ccagtttgag 60 atgggactgc caggaagtga agtggaaagc gactggtggg tgtgggttca cgacaaggag 120 aacatagcat caggtctagt aagtggagat ctaccagaga acggcccagc atattggaac 180 cgcactaagc aagatcatga cattgcagaa aagctaggaa tggattgtat tagaggtggc 240 attgagtggg caagaatttt tccaaagcca acatttgacg ttaaagttga tgtggaaaag 300 gatgaagaag gcaacataat ttccgtagac gttccagaga gtacaataaa agagctagag 360 aaaattgcca acatggaggc ccttgaacat tatcgcaaga tttactcaga ctggaaggag 420 aggggcaaaa ccttcatatt aaacctctac cactggcctc ttccattatg gattcatgac 480 ccaattgcag taaggaaact tggcccggat agggctcctg caggatggtt agatgagaag 540 acagtggtag agtttgtgaa gtttgccgcc ttcgttgctt atcaccttga tgacctcgtt 600 gacatgtgga gcacaatgaa cgaaccaaac gtagtctaca atcaaggtta cattaatcta 660 cgttcaggat ttccaccagg atatctaaac tttacagcag cagaaaaggc aaaattcaac 720 ttaattcagg ctcacatcgg agcatatgat gccataaaag agtattcaga aaaatccgtg 780 ggagtgatat acgcctttgc ttggcacgat cctctagcgg aggagtataa ggatgaagta 840 gaggaaatca gaaagaaaga ctatgagttt gtaacaattc tacactcaaa aggaaagcta 900 gactggatcg gcgtaaacta ctactccagg ctggtatatg gagccaaaga tggacaccta 960 gttcctttac ctggatatgg atttatgagt gagagaggag gatttgcaaa gtcaggaaga 1020 cctgctagtg actttggatg ggaaatgtac ccagagggcc ttgagaacct tcttaagtat 1080 ttaaacaatg cctacgagct accaatgata attacagaga acggtatggc cgatgcagca 1140 gatagataca ggccacacta tctcgtaagc catctaaagg cagtttacaa tgctatgaaa 1200 gaaggtgctg atgttagagg gtatctccac tggtctctaa cagacaacta cgaatgggcc 1260 caagggttca ggatgagatt tggattggtt tacgtggatt tcgagacaaa gaagagatat 1320 ttaaggccaa gcgccctggt attcagagaa atagccactc aaaaagaaat tccagaagaa 1380 ttagctcacc tcgcagacct caaatttgtt acaagaaag 1419 <210> 54 <211> 473 <212> PRT <213> Artificial <220> <223> Mutant beta-glucosidase having glycosylation site. <220> <221> CARBOHYD <222> (60)..(62) <223> <220> <221> CARBOHYD <222> (230)..(232) <223> <400> 54 Met Ala Lys Phe Pro Lys Asn Phe Met Phe Gly Tyr Ser Trp Ser Gly 1 5 10 15 Phe Gln Phe Glu Met Gly Leu Pro Gly Ser Glu Val Glu Ser Asp Trp 20 25 30 Trp Val Trp Val His Asp Lys Glu Asn Ile Ala Ser Gly Leu Val Ser 35 40 45 Gly Asp Leu Pro Glu Asn Gly Pro Ala Tyr Trp Asn Arg Thr Lys Gln 50 55 60 Asp His Asp Ile Ala Glu Lys Leu Gly Met Asp Cys Ile Arg Gly Gly 65 70 75 80 Ile Glu Trp Ala Arg Ile Phe Pro Lys Pro Thr Phe Asp Val Lys Val 85 90 95 Asp Val Glu Lys Asp Glu Glu Gly Asn Ile Ile Ser Val Asp Val Pro 100 105 110 Glu Ser Thr Ile Lys Glu Leu Glu Lys Ile Ala Asn Met Glu Ala Leu 115 120 125 Glu His Tyr Arg Lys Ile Tyr Ser Asp Trp Lys Glu Arg Gly Lys Thr 130 135 140 Phe Ile Leu Asn Leu Tyr His Trp Pro Leu Pro Leu Trp Ile His Asp 145 150 155 160 Pro Ile Ala Val Arg Lys Leu Gly Pro Asp Arg Ala Pro Ala Gly Trp 165 170 175 Leu Asp Glu Lys Thr Val Val Glu Phe Val Lys Phe Ala Ala Phe Val 180 185 190 Ala Tyr His Leu Asp Asp Leu Val Asp Met Trp Ser Thr Met Asn Glu 195 200 205 Pro Asn Val Val Tyr Asn Gln Gly Tyr Ile Asn Leu Arg Ser Gly Phe 210 215 220 Pro Pro Gly Tyr Leu Asn Phe Thr Ala Ala Glu Lys Ala Lys Phe Asn 225 230 235 240 Leu Ile Gln Ala His Ile Gly Ala Tyr Asp Ala Ile Lys Glu Tyr Ser 245 250 255 Glu Lys Ser Val Gly Val Ile Tyr Ala Phe Ala Trp His Asp Pro Leu 260 265 270 Ala Glu Glu Tyr Lys Asp Glu Val Glu Glu Ile Arg Lys Lys Asp Tyr 275 280 285 Glu Phe Val Thr Ile Leu His Ser Lys Gly Lys Leu Asp Trp Ile Gly 290 295 300 Val Asn Tyr Tyr Ser Arg Leu Val Tyr Gly Ala Lys Asp Gly His Leu 305 310 315 320 Val Pro Leu Pro Gly Tyr Gly Phe Met Ser Glu Arg Gly Gly Phe Ala 325 330 335 Lys Ser Gly Arg Pro Ala Ser Asp Phe Gly Trp Glu Met Tyr Pro Glu 340 345 350 Gly Leu Glu Asn Leu Leu Lys Tyr Leu Asn Asn Ala Tyr Glu Leu Pro 355 360 365 Met Ile Ile Thr Glu Asn Gly Met Ala Asp Ala Ala Asp Arg Tyr Arg 370 375 380 Pro His Tyr Leu Val Ser His Leu Lys Ala Val Tyr Asn Ala Met Lys 385 390 395 400 Glu Gly Ala Asp Val Arg Gly Tyr Leu His Trp Ser Leu Thr Asp Asn 405 410 415 Tyr Glu Trp Ala Gln Gly Phe Arg Met Arg Phe Gly Leu Val Tyr Val 420 425 430 Asp Phe Glu Thr Lys Lys Arg Tyr Leu Arg Pro Ser Ala Leu Val Phe 435 440 445 Arg Glu Ile Ala Thr Gln Lys Glu Ile Pro Glu Glu Leu Ala His Leu 450 455 460 Ala Asp Leu Lys Phe Val Thr Arg Lys 465 470 <210> 55 <211> 1419 <212> DNA <213> Artificial <220> <223> DNA encording mutant beta-glucosidase having glycosylation site. <400> 55 atggcaaagt tcccaaaaaa cttcatgttt ggatattctt ggtctggttt ccagtttgag 60 atgggactgc caggaagtga agtggaaagc gactggtggg tgtgggttca cgacaaggag 120 aacatagcat caggtctagt aagtggagat ctaccagaga acggcccagc atattggaac 180 cgcactaagc aagatcatga cattgcagaa aagctaggaa tggattgtat tagaggtggc 240 attgagtggg caagaatttt tccaaagcca acatttgacg ttaaagttga tgtggaaaag 300 gatgaagaag gcaacataat ttccgtagac gttccagaga gtacaataaa agagctagag 360 aaaattgcca acatggaggc ccttgaacat tatcgcaaga tttactcaga ctggaaggag 420 aggggcaaaa ccttcatatt aaacctctac cactggcctc ttccattatg gattcatgac 480 ccaattgcag taaggaaact tggcccggat agggctcctg caggatggtt agatgagaag 540 acagtggtag agtttgtgaa gtttgccgcc ttcgttgctt atcaccttga tgacctcgtt 600 gacatgtgga gcacaatgaa cgaaccaaac gtagtctaca atcaaggtta cattaatcta 660 cgttcaggat ttccaccagg atatctaagc tttgaagcag cagaaaaggc aaaattcaac 720 ttaattcagg ctcacatcgg agcatatgat gccataaaag agtattcaga aaaatccgtg 780 ggagtgatat acgcctttgc ttggcacgat cctctagcgg aggagtataa ggatgaagta 840 gaggaaatca gaaagaaaga ctatgagttt gtaacaattc tacactcaaa aggaaagcta 900 gactggatcg gcgtaaacta ctactccagg ctggtatatg gagccaaaga tggacaccta 960 gttcctttac ctggatatgg atttatgagt gagagaggag gatttgcaaa gtcaggaaga 1020 cctgctagtg actttggatg ggaaatgtac ccagagggcc ttgagaacct tcttaagtat 1080 ttaaacaata actacacgct accaatgata attacagaga acggtatggc cgatgcagca 1140 gatagataca ggccacacta tctcgtaagc catctaaagg cagtttacaa tgctatgaaa 1200 gaaggtgctg atgttagagg gtatctccac tggtctctaa cagacaacta cgaatgggcc 1260 caagggttca ggatgagatt tggattggtt tacgtggatt tcgagacaaa gaagagatat 1320 ttaaggccaa gcgccctggt attcagagaa atagccactc aaaaagaaat tccagaagaa 1380 ttagctcacc tcgcagacct caaatttgtt acaagaaag 1419 <210> 56 <211> 473 <212> PRT <213> Artificial <220> <223> Mutant beta-glucosidase having glycosylation site. <220> <221> CARBOHYD <222> (60)..(62) <223> <220> <221> CARBOHYD <222> (364)..(366) <223> <400> 56 Met Ala Lys Phe Pro Lys Asn Phe Met Phe Gly Tyr Ser Trp Ser Gly 1 5 10 15 Phe Gln Phe Glu Met Gly Leu Pro Gly Ser Glu Val Glu Ser Asp Trp 20 25 30 Trp Val Trp Val His Asp Lys Glu Asn Ile Ala Ser Gly Leu Val Ser 35 40 45 Gly Asp Leu Pro Glu Asn Gly Pro Ala Tyr Trp Asn Arg Thr Lys Gln 50 55 60 Asp His Asp Ile Ala Glu Lys Leu Gly Met Asp Cys Ile Arg Gly Gly 65 70 75 80 Ile Glu Trp Ala Arg Ile Phe Pro Lys Pro Thr Phe Asp Val Lys Val 85 90 95 Asp Val Glu Lys Asp Glu Glu Gly Asn Ile Ile Ser Val Asp Val Pro 100 105 110 Glu Ser Thr Ile Lys Glu Leu Glu Lys Ile Ala Asn Met Glu Ala Leu 115 120 125 Glu His Tyr Arg Lys Ile Tyr Ser Asp Trp Lys Glu Arg Gly Lys Thr 130 135 140 Phe Ile Leu Asn Leu Tyr His Trp Pro Leu Pro Leu Trp Ile His Asp 145 150 155 160 Pro Ile Ala Val Arg Lys Leu Gly Pro Asp Arg Ala Pro Ala Gly Trp 165 170 175 Leu Asp Glu Lys Thr Val Val Glu Phe Val Lys Phe Ala Ala Phe Val 180 185 190 Ala Tyr His Leu Asp Asp Leu Val Asp Met Trp Ser Thr Met Asn Glu 195 200 205 Pro Asn Val Val Tyr Asn Gln Gly Tyr Ile Asn Leu Arg Ser Gly Phe 210 215 220 Pro Pro Gly Tyr Leu Ser Phe Glu Ala Ala Glu Lys Ala Lys Phe Asn 225 230 235 240 Leu Ile Gln Ala His Ile Gly Ala Tyr Asp Ala Ile Lys Glu Tyr Ser 245 250 255 Glu Lys Ser Val Gly Val Ile Tyr Ala Phe Ala Trp His Asp Pro Leu 260 265 270 Ala Glu Glu Tyr Lys Asp Glu Val Glu Glu Ile Arg Lys Lys Asp Tyr 275 280 285 Glu Phe Val Thr Ile Leu His Ser Lys Gly Lys Leu Asp Trp Ile Gly 290 295 300 Val Asn Tyr Tyr Ser Arg Leu Val Tyr Gly Ala Lys Asp Gly His Leu 305 310 315 320 Val Pro Leu Pro Gly Tyr Gly Phe Met Ser Glu Arg Gly Gly Phe Ala 325 330 335 Lys Ser Gly Arg Pro Ala Ser Asp Phe Gly Trp Glu Met Tyr Pro Glu 340 345 350 Gly Leu Glu Asn Leu Leu Lys Tyr Leu Asn Asn Asn Tyr Thr Leu Pro 355 360 365 Met Ile Ile Thr Glu Asn Gly Met Ala Asp Ala Ala Asp Arg Tyr Arg 370 375 380 Pro His Tyr Leu Val Ser His Leu Lys Ala Val Tyr Asn Ala Met Lys 385 390 395 400 Glu Gly Ala Asp Val Arg Gly Tyr Leu His Trp Ser Leu Thr Asp Asn 405 410 415 Tyr Glu Trp Ala Gln Gly Phe Arg Met Arg Phe Gly Leu Val Tyr Val 420 425 430 Asp Phe Glu Thr Lys Lys Arg Tyr Leu Arg Pro Ser Ala Leu Val Phe 435 440 445 Arg Glu Ile Ala Thr Gln Lys Glu Ile Pro Glu Glu Leu Ala His Leu 450 455 460 Ala Asp Leu Lys Phe Val Thr Arg Lys 465 470 <210> 57 <211> 36 <212> DNA <213> Artificial <220> <223> primer <400> 57 gtgggtgtgg gttaacgaca cggagaacat agcatc 36 <210> 58 <211> 36 <212> DNA <213> Artificial <220> <223> primer <400> 58 cacccacacc caattgctgt gcctcttgta tcgtag 36 <210> 59 <211> 36 <212> DNA <213> Artificial <220> <223> primer <400> 59 ccaggatatc taaactttac agcagcagaa aaggca 36 <210> 60 <211> 36 <212> DNA <213> Artificial <220> <223> primer <400> 60 ggtcctatag atttgaaatg tcgtcgtctt ttccgt 36 <210> 61 <211> 35 <212> DNA <213> Artificial <220> <223> primer <400> 61 agtatttaaa caataactac acgctaccaa tgata 35 <210> 62 <211> 35 <212> DNA <213> Artificial <220> <223> primer <400> 62 tcataaattt gttattgatg tgcgatggtt actat 35

Claims

선택적으로 당쇄가 부가되어서 이루어지고, 또한 글루코시다아제 활성을 갖는 호열성 균유래 변이형 글루코시다아제의 제조 방법으로서:
(i) 원래 당쇄 부가 서열을 갖지 않는 호열성 균유래 글루코시다아제를 인코딩하는 DNA에 Asn-X-Ser 또는 Asn-X-Thr(X는 프롤린을 제외한 임의의 아미노산)을 인코딩하는 DNA 서열을 도입하여 호열성 균유래 변이형 글루코시다아제를 인코딩하는 DNA를 조제하고, 상기 변이형 글루코시다아제를 인코딩하는 DNA에 분비 시그널 서열을 인코딩하는 DNA 서열을 더 부가하고,
(ⅱ) 상기 분비 시그널 서열을 인코딩하는 DNA 서열이 부가된 상기 변이형 글루코시다아제를 인코딩하는 DNA를 진핵 미생물에 도입하여 상기 변이형 글루코시다아제 DNA에 의해 코딩되는 변이형 글루코시다아제를 분비 단백질로서 발현시키고, 및
(ⅲ) 분비 단백질로서 발현된 변이형 글루코시다아제를 단리·정제하는 것을 포함하는 것을 특징으로 하는 것을 변이형 글루코시다아제의 제조 방법.
제 1 항에 있어서,
상기 당쇄는 고 만노스형 당쇄인 것을 특징으로 하는 변이형 글루코시다아제의 제조 방법.
제 1 항 또는 제 2 항에 있어서,
상기 호열성 균유래 글루코시다아제는 술포로버스속(Sulofolobus), 서모플라즈마속(Thermoplasma), 칼디비르가속(Caldivirgra), 서모스페라속(Thermosphaera), 파이로코커스속(Pyrococcus), 피크로필러스속(Picrophilus), 칼디비르가속(Caldivirgra), 퍼비도박테리움속(Fervidobacterium)의 군으로부터 선택되는 1종으로부터 유래되는 글루코시다아제인 것을 특징으로 하는 변이형 글루코시다아제의 제조 방법.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
상기 호열성 균유래 글루코시다아제는
(i) 서열 번호 4, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 또는 서열 번호 20에 기재된 어느 하나의 아미노산 서열과 동일한 아미노산 서열을 포함하거나, 또는
(ⅱ) 서열 번호 4, 서열 번호 8, 서열 번호 10, 서열 번호 12, 서열 번호 14, 서열 번호 16, 서열 번호 18 또는 서열 번호 20에 기재된 어느 하나의 아미노산 서열과 85% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 또한 β-글루코시다아제 활성을 갖는 단백질인 것을 특징으로 하는 변이형 글루코시다아제의 제조 방법.
제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 진핵 미생물은 피키아 파스토리스인 것을 특징으로 하는 변이형 글루코시다아제의 제조 방법.
제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
상기 분비 시그널 서열은 α팩터 분비 시그널 서열인 것을 특징으로 하는 변이형 글루코시다아제의 제조 방법.
제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
상기 호열성 균유래 변이형 글루코시다아제는 서열 번호 6, 서열 번호 38, 서열 번호 40, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54 또는 서열 번호 56 중 어느 하나로 나타내어지는 아미노산 서열을 포함하는 것을 특징으로 하는 변이형 글루코시다아제의 제조 방법.
셀룰라아제 및 제 1 항 내지 제 7 항 중 어느 한 항에 기재된 변이형 글루코시다아제의 제조 방법에 의해 얻어진 호열성 균유래 변이형 글루코시다아제를 포함하는 것을 특징으로 하는 바이오매스 당화용 효소 조성물.
제 8 항에 있어서,
상기 셀룰라아제는 사상균유래 셀룰라아제 혼합물인 것을 특징으로 하는 바이오매스 당화용 효소 조성물.
제 8 항 또는 제 9 항에 있어서,
상기 사상균유래 셀룰라아제 혼합물은 트리코데르마속유래 셀룰라아제 혼합물인 것을 특징으로 하는 바이오매스 당화용 효소 조성물.
제 8 항 내지 제 10 항 중 어느 한 항에 기재된 바이오매스 당화용 효소 조성물을 사용하는 것을 특징으로 하는 바이오매스의 가수 분해 방법.
제 11 항에 있어서,
상기 효소 조성물에 의한 가수 분해물을 한외 여과막을 통해 여과하여 사용후의 상기 효소 조성물을 분리 회수하는 것을 특징으로 하는 바이오매스의 가수 분해 방법.