CN1620501A

CN1620501A - 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸

Info

Publication number: CN1620501A
Application number: CNA028127684A
Authority: CN
Inventors: 莱尼·兰格; 吴文平; 多米尼克·奥伯特; 萨拉·兰德维克; 柯克·M·施努尔; 伊布·G·克劳森
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2001-06-26
Filing date: 2002-06-26
Publication date: 2005-05-25
Also published as: US20130078679A1; DK2298868T3; US8603793B2; US9309504B2; EP2298868B1; AU2002316809A1; US8993299B2; EP2277997A2; DK1421224T3; WO2003000941A3; US20130034890A1; EP2298868A3; US20150218542A1; US20040197890A1; US20120237993A1; EP1421224B1; ES2533923T3; EP2295544A2; US20140051142A1; ES2397267T3

Abstract

本发明涉及具有纤维二糖水解酶I(也被称为CBH I或CBH 1)活性的多肽和含有编码该多肽的核苷酸序列的多核苷酸。本发明还涉及含有该核苷酸构建体的核酸构建体、载体和宿主细胞，以及制备和使用该多肽的方法。

Description

具有纤维二糖水解酶I活性的多肽和编码多肽的多核苷酸

发明领域

本发明涉及具有纤维二糖水解酶(cellobiohydrolase)I(也被称为CBHI或CBH 1)活性的多肽和含有编码该多肽的核苷酸序列的多核苷酸。本发明还涉及含有核酸构建体、载体和该核酸构建体的宿主细胞，以及制备和使用该多肽的方法。

发明背景

纤维素是一种重要的工业原材料和一种可再生能源的来源。天然纤维素的物理结构和形态学很复杂，并且它的细微结构很难通过实验方法确定。然而，纤维素的化学结构很简单，它是由D-葡萄糖残基通过β-1，4-糖苷键连接形成的线性聚合体，链长超过10.000个糖苷残基。

为了有效地消化纤维素，需要几种酶的共同作用。其中至少有三类酶是必需的，它们将纤维素转化为葡萄糖：随机切断纤维素链的内切-(1，4)-β-D-葡聚糖酶(EC 3.2.1.4)，从显微素链末端剪切纤维二糖单位的纤维二糖水解酶(EC 3.2.1.91)，和将纤维二糖和可溶性纤维糊精转化为葡萄糖的β-葡萄糖苷酶(EC 3.2.1.21)。在这三类与纤维素降解有关的酶中，纤维二糖水解酶是降解天然晶态纤维素的关键性酶。

外切-纤维二糖水解酶(纤维二糖水解酶I，或CBH I)指通过从纤维素聚合体链的非还原末端水解纤维二糖降解纤维素的纤维二糖水解酶。

本发明的一个目的是提供具有纤维二糖水解酶I活性的改良多肽和编码该多肽的多核苷酸。改良多肽具有改善的特定活性和/或改善的稳定性特别是热稳定性。该多肽还具有改善的通过纤维二糖抵抗抑制的能力。

发明概述

本发明的第一个方面涉及选自下组所示的具有纤维二糖水解酶I活性的多肽：

(a)包含选自下组所示氨基酸序列的多肽：

与SEQ ID NO：2中第1-526位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：4中第1-529位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：6中第1-451位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：8中第1-457位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：10中第1-538位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：12中第1-415位氨基酸具有至少70％同一性的氨基酸序列，

与SEQ ID NO：14中第1-447位氨基酸具有至少70％同一性的氨基酸序列，

与SEQ ID NO：16中第1-452位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：38中第1-454位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：40中第1-458位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：42中第1-450位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：44中第1-446位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：46中第1-527位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：48中第1-455位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：50中第1-464位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：52中第1-460位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：54中第1-450位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：56中第1-532位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：58中第1-460位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：60中第1-525位氨基酸具有至少80％同一性的氨基酸序列，

与SEQ ID NO：66中第1-456位氨基酸具有至少80％同一性的氨基酸序列。

(b)包含选自下组所示氨基酸序列的多肽：

与存在于嗜热支顶孢(Acremonium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于嗜热毛壳霉(Chaetomium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于小柱孢菌(Scytalidium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于嗜热小柱孢菌(Scytalidium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于橙黄色热子囊菌(Thermoascus aurantiacus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于Thielavia australiensis中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于幼嫩轮枝孢(Verticillium tenerum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70％同一性的氨基酸序列，

与存在于栗色新螱(Neotermes castaneus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70％同一性的氨基酸序列，

与存在于黑素白丝菌(Melanocarpus albomyces)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于支顶孢(Acremonium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于Chaetomidium pingtungium中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于Sporotrichum pruinosum中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于棉色二孢(Diplodia gossypina)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于囊状长毛盘菌(Trichophaea saccata)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于嗜热毁丝霉(Myceliophthora thermophila)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于Exidia glandulosa中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于块团炭角菌(Xylaria hypoxylon)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于poitrasia circinans中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于灰色鬼伞(Coprinus cinereus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于淡黑假黑盘菌(Pseudoplectania nigrella)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

存在于玫瑰单瑞孢(Trichothecium roseum)IFO 5372中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于产黑色腐质霉(Humicola nigrescens)CBS 819.73中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于Cladorrhinum foecundissimum CBS 427.97中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于棉色二孢(Diplodia gossypina)CBS 247.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于嗜热毁丝霉(Myceliophthora thermophila)CBS117.65中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于微小根毛霉(Rhizomucor pusillus)CBS109471中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于Meripilus giganteus CBS 521.95中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于黑耳(Exidia glandulosa)CBS 2377.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于块团炭角菌(Xylaria hypoxylon)CBS 284.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于长毛盘菌(Trichophaea saccata)CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于毛壳霉(Chaetomium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于肉桂色毁丝霉(Myceliophthora hinnulea)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于有小孢子囊的草根霉(Thielavia cf.microspora)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于曲霉(Aspergillus sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于帚霉(Scopulariopsis sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于镰孢(Fusarium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，

存在于轮枝孢(Verticillium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列，和

存在于蔓延疫霉(Phytophthora infestans)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列。

(c)包含选自下组所示氨基酸序列的多肽：

与SEQ ID NO：1中第1-1578位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：3中第1-1587位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：5中第1-1353位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：7中第1-1371位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：9中第1-1614位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：11中第1-1245位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：13中第1-1341位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：15中第1-1356位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：37中第1-1365位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：39中第1-1377位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：41中第1-1353位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：43中第1-1341位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：45中第1-1584位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：47中第1-1368位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：49中第1-1395位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：51中第1-1383位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：53中第1-1353位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：55中第1-1599位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：57中第1-1383位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：59中第1-1578位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

与SEQ ID NO：65中第1-1371位核苷酸编码的多肽具有至少80％同一性的氨基酸序列，

(d)由在高严谨条件下与下组所示的多核苷酸探针杂交的核苷酸序列编码的多肽：

(i)选自下组所示核苷酸的互补链：

SEQ ID NO：1中第1-1578位核苷酸，

SEQ ID NO：3中第1-1587位核苷酸，

SEQ ID NO：5中第1-1353位核苷酸，

SEQ ID NO：7中第1-1371位核苷酸，

SEQ ID NO：9中第1-1614位核苷酸，

SEQ ID NO：11中第1-1245位核苷酸，

SEQ ID NO：13中第1-1341位核苷酸，

SEQ ID NO：15中第1-1356位核苷酸，

SEQ ID NO：37中第1-1365位核苷酸，

SEQ ID NO：39中第1-1377位核苷酸，

SEQ ID NO：41中第1-1353位核苷酸，

SEQ ID NO：43中第1-1341位核苷酸，

SEQ ID NO：45中第1-1584位核苷酸，

SEQ ID NO：47中第1-1368位核苷酸，

SEQ ID NO：49中第1-1395位核苷酸，

SEQ ID NO：51中第1-1383位核苷酸，

SEQ ID NO：53中第1-1353位核苷酸，

SEQ ID NO：55中第1-1599位核苷酸，

SEQ ID NO：57中第1-1383位核苷酸，

SEQ ID NO：59中第1-1578位核苷酸，

SEQ ID NO：65中第1-1371位核苷酸，

(ii)选自下组所示核苷酸的互补链：

SEQ ID NO：1中第1-500位核苷酸，

SEQ ID NO：3中第1-500位核苷酸，

SEQ ID NO：5中第1-500位核苷酸，

SEQ ID NO：7中第1-500位核苷酸，

SEQ ID NO：9中第1-500位核苷酸，

SEQ ID NO：11中第1-500位核苷酸，

SEQ ID NO：13中第1-500位核苷酸，

SEQ ID NO：15中第1-500位核苷酸，

SEQ ID NO：37中第1-500位核苷酸，

SEQ ID NO：39中第1-500位核苷酸，

SEQ ID NO：41中第1-500位核苷酸，

SEQ ID NO：43中第1-500位核苷酸，

SEQ ID NO：45中第1-500位核苷酸，

SEQ ID NO：47中第1-500位核苷酸，

SEQ ID NO：49中第1-500位核苷酸，

SEQ ID NO：51第1-500位核苷酸，

SEQ ID NO：53第1-500位核苷酸，

SEQ ID NO：55中第1-500位核苷酸，

SEQ ID NO：57中第1-500位核苷酸，

SEQ ID NO：59中第1-500位核苷酸，

SEQ ID NO：65中第1-500位核苷酸，

SEQ ID NO：17中第1-221位核苷酸，

SEQ ID NO：18中第1-239位核苷酸，

SEQ ID NO：19中第1-199位核苷酸，

SEQ ID NO：20中第1-191位核苷酸，

SEQ ID NO：21中第1-232位核苷酸，

SEQ ID NO：22中第1-467位核苷酸，

SEQ ID NO：23中第1-534位核苷酸，

SEQ ID NO：24中第1-563位核苷酸，

SEQ ID NO：25中第1-218位核苷酸，

SEQ ID NO：26中第1-492位核苷酸，

SEQ ID NO：27中第1-481位核苷酸，

SEQ ID NO：28中第1-463位核苷酸，

SEQ ID NO：29中第1-513位核苷酸，

SEQ ID NO：30中第1-579位核苷酸，

SEQ ID NO：31中第1-514位核苷酸，

SEQ ID NO：32中第1-477位核苷酸，

SEQ ID NO：33中第1-500位核苷酸，

SEQ ID NO：34中第1-470位核苷酸，

SEQ ID NO：35中第1-491位核苷酸，

SEQ ID NO：36中第1-221位核苷酸，

SEQ ID NO：61中第1-519位核苷酸，

SEQ ID NO：62中第1-497位核苷酸，

SEQ ID NO：63中第1-498位核苷酸，

SEQ ID NO：64中第1-525位核苷酸，和

SEQ ID NO：67中第1-951位核苷酸，和

(iii)选自下组所示核苷酸的互补链：

SEQ ID NO：1中第1-200位核苷酸，

SEQ ID NO：3中第1-200位核苷酸，

SEQ ID NO：5中第1-200位核苷酸，

SEQ ID NO：7中第1-200位核苷酸，

SEQ ID NO：9中第1-200位核苷酸，

SEQ ID NO：11中第1-200位核苷酸，

SEQ ID NO：13中第1-200位核苷酸，

SEQ ID NO：15中第1-200位核苷酸，

SEQ ID NO：37中第1-200位核苷酸，

SEQ ID NO：39中第1-200位核苷酸，

SEQ ID NO：41中第1-200位核苷酸，

SEQ ID NO：43中第1-200位核苷酸，

SEQ ID NO：45中第1-200位核苷酸，

SEQ ID NO：47中第1-200位核苷酸，

SEQ ID NO：49中第1-200位核苷酸，

SEQ ID NO：51中第1-200位核苷酸，

SEQ ID NO：53中第1-200位核苷酸，

SEQ ID NO：55中第1-200位核苷酸，

SEQ ID NO：57中第1-200位核苷酸，

SEQ ID NO：59中第1-200位核苷酸，和

SEQ ID NO：65中第1-200位核苷酸，和

(e)具有纤维二糖水解酶I活性的(a)、(b)或(c)的片段。

本发明的第二个方面涉及一种含有编码本发明多肽的核苷酸序列的多核苷酸。

本发明的第三个方面涉及一种含有编码本发明多肽的核苷酸序列的核酸构建体，其中该核苷酸与一种或多种能引导多肽在适宜宿主中生产的调控序列可操作地连接。

本发明的第四个方面涉及含有本发明核酸构建体的重组表达载体。

本发明的第五个方面涉及含有本发明核酸构建体的重组宿主细胞。

本发明的第六个方面涉及一种生产本发明多肽的方法，该方法包括：

(a)培养菌株来生产多肽，该菌株野生型能生产多肽；和

(b)回收多肽。

本发明的第七个方面涉及一种生产本发明多肽的方法，该方法包括：

(a)在适宜于生产多肽的条件下培养本发明的重组宿主细胞，和

(b)回收多肽。

本发明的第八个方面涉及一种原位生产本发明多肽的方法，该方法包括：

(b)没有前面多肽的回收，而是将多肽与一种所要的底物接触。

本发明涉及的其它方面可以从以下的说明书和附的权利要求书中明显得出。

在进一步详细地讨论本发明之前，首先对下列术语和发明作出定义。

大致纯的多肽：在本文中，术语“大致(substantially)纯的多肽”指一种多肽制品，其中含有与其天然结合的至多10％重量的其它多肽物质(低百分比的其它多肽物质是优选的，如至多8％的重量，如至多6％的重量，如至多5％的重量，如至多4％的重量，如至多3％的重量，如至多2％的重量，如至多1％的重量，如至多1/2％的重量)。因此，优选大致纯的多肽为92％纯，即所述多肽至少占制品中总的多肽物质重量的92％，和优选高百分比纯度如至少94％纯，至少95％纯，至少96％纯，至少97％纯，至少98％纯，至少99％纯，至少99.5％纯。这里公开的多肽优选为大致纯的形式，尤其优选“基本纯的形式”，如多肽制品实质上不含有与其天然结合的其它多肽物质。这些可以通过如采用已知的重组方法来制备完成。这里，术语“大致纯的多肽”与术语“分离的多肽”及“分离形式的多肽”同义。

纤维二糖水解酶I活性：这里定义的术语“纤维二糖水解酶I活性”指作为一种纤维素1，4-β-纤维二糖酶(也称为外-葡聚糖酶，外-纤维二糖水解酶或1，4-β-纤维二糖水解酶)所具有的活性，如在酶的类别EC3.2.1.91中所定义的，能够催化纤维素和纤维四糖中的1，4-β-糖苷键水解并从链的非还原末端释放出纤维二糖。

与本发明的目的相适应，纤维二糖水解酶I的活性可以通过实施例2中描述的方法确定。

在一个方案中，纤维二糖水解酶I的活性可以根据Deshpande MV等(Methods in Enzymology，pp.126-130，“Selective Assay for Exo-1，4-β-glucanases”，1998)描述的方法测定。根据该方法，一个单位的纤维二糖水解酶I活性(糖苷键剪切活性)定义为在50℃、PH5.0时每分钟产生1.0μmol的p-硝基酚。

本发明的多肽应优选具有至少20％的选自下组所示氨基酸序列组成多肽的纤维二糖水解酶I活性：SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60和SEQ ID NO：66。在一个优选方案中，由一种选自下组所示的氨基酸序列组成的多肽必须具有至少40％，如至少50％，优选至少60％，如至少70％，更优选至少80％，如至少90％，最好优选至少95％，如约或至少100％的纤维二糖水解酶I活性，该组包括SEQ IDNO：2中1-526位氨基酸、SEQ ID NO：4中1-529位氨基酸、SEQ ID NO：6中1-451位氨基酸、SEQ ID NO：8中1-457位氨基酸、SEQ ID NO：10中1-538位氨基酸、SEQ ID NO：12中1-415位氨基酸、SEQ ID NO：14中1-447位氨基酸、SEQ ID NO：16中1-452位氨基酸、SEQ ID NO：38中1-454位氨基酸、SEQ ID NO：40中1-458位氨基酸、SEQ ID NO：42中1-450位氨基酸、SEQ IDNO：44中1-446位氨基酸、SEQ ID NO：46中1-527位氨基酸、SEQ ID NO：48中1-455位氨基酸、SEQ ID NO：50中1-464位氨基酸、SEQ ID NO：52中1-460位氨基酸、SEQ ID NO：54中1-450位氨基酸、SEQ ID NO：56中1-532位氨基酸、SEQ ID NO：58中1-460位氨基酸、SEQ ID NO：60中1-525位氨基酸和SEQ ID NO：66中1-456位氨基酸。

同一性：在本文中，两个氨基酸序列或两个核苷酸序列之间的同源性通过参数同一性来描述。

适合于本发明的目标，两个氨基酸序列之间的同一性通过使用FASTA程序包2.0x版中的FASTA软件(参见W.R.Pearson和D.J.Lipman，1998，“Improved tools for biological sequence analysis”，PANS85：2444-2448；和W.R.Pearson，1990，“Rapid and Senstive SequenceComparison with FASTP and FASTA”，methods in enzymology 183：63-98)确定。使用的评分矩阵是BIOSUM50，间隙罚分(gap penalty)为12，间隙扩大罚分(gap extension penalty)为2。

两个核苷酸之间的同一性程度通过使用运算法则和上述的软件包确定，使用的矩阵为同一性矩阵，间隙罚分为16，间隙罚分为4。

片段：当在这里使用时，序列选自下组所示序列：SEQ ID NO：2，SEQ IDNO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ IDNO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66，该序列片段为该氨基酸序列的氨基和/或羧基末端缺失了一或多个氨基酸的多肽。片段优选为具有缺失了相应于SWISS-PROT受理号P00725中描述的Trichoderma reesei纤维二糖水解酶I的“纤维素结合域”和/或“连接结构域”的氨基酸序列。片段更优选含有相应于SWISS-PROT受理号P00725中描述的Trichoderma reesei纤维二糖水解酶I的“催化域”的氨基酸序列。片段最优选是含有至少434个氨基酸残基，如选自下组所示的氨基酸残基：SEQ ID NO：2的第1-434位氨基酸，SEQ ID NO：4的第1-434位氨基酸，SEQ ID NO：6的第1-434位氨基酸，SEQ ID NO：8的第1-434位氨基酸，SEQ ID NO：10的第1-434位氨基酸，SEQ ID NO：12的第1-434位氨基酸，SEQ ID NO：14的第1-434位氨基酸，SEQ ID NO：16的第1-434位氨基酸，SEQ ID NO：38的第1-434位氨基酸，SEQ ID NO：40的第1-434位氨基酸，SEQ ID NO：42的第1-434位氨基酸，SEQ ID NO：44的第1-434位氨基酸，SEQ ID NO：46的第1-434位氨基酸，SEQ ID NO：48的第1-434位氨基酸，SEQ ID NO：50的第1-434位氨基酸，SEQ ID NO：52的第1-434位氨基酸，SEQ ID NO：54的第1-434位氨基酸，SEQ ID NO：56的第1-434位氨基酸，SEQ ID NO：58的第1-434位氨基酸，SEQ ID NO：60的第1-434位氨基酸和SEQ ID NO：66的第1-434位氨基酸。尤其是片段含有至少215个氨基酸残基，如选自下组所示的氨基酸残基：SEQ ID NO：2的第200-434位氨基酸，SEQ ID NO：4的第200-434位氨基酸，SEQ ID NO：6的第200-434位氨基酸，SEQ ID NO：8的第200-434位氨基酸，SEQ ID NO：10的第200-434位氨基酸，SEQ ID NO：12的第200-434位氨基酸，SEQ IDNO：14的第200-434位氨基酸，SEQ ID NO：16的第200-434位氨基酸，SEQ ID NO：38的第200-434位氨基酸，SEQ ID NO：40的第200-434位氨基酸，SEQ ID NO：42的第200-434位氨基酸，SEQ ID NO：44的第200-434位氨基酸，SEQ ID NO：46的第200-434位氨基酸，SEQ ID NO：48的第200-434位氨基酸，SEQ ID NO：50的第200-434位氨基酸，SEQ ID NO：52的第200-434位氨基酸，SEQ ID NO：54的第200-434位氨基酸，SEQ IDNO：56的第200-434位氨基酸，SEQ ID NO：58的第200-434位氨基酸，SEQ ID NO：60的第200-434位氨基酸和SEQ ID NO：66的第200-434位氨基酸。

等位基因变异体：在本文中，术语“等位基因变异体”指位于相同染色体位点基因的两个或多个可选择形式中的任何一种。等位基因变异体是由于突变天然产生的，并且可以导致群体内的多态性。基因突变可以是沉默的(编码的多肽没有变化)或可以编码具有相异氨基酸序列的多肽。一种多肽的一个等位基因变异体是由基因的一个等位基因变异体编码的多肽。

大致纯的多核苷酸：这里使用的术语“大致纯的多核苷酸”指一种多核苷酸制品，其中该多核苷酸已经远离它的自然遗传环境，因而不含有其它外源或不想要的编码序列，并以适于在遗传工程蛋白质生产体系中使用的形式存在。因此，一种大致纯的多核苷酸含有至多10％重量的其它与之天然关联的多核苷酸物质(低百分比的其它多核苷酸物质是优选的，如占至多8％的重量，6％的重量，5％的重量，4％的重量，3％的重量，2％的重量，1％的重量和1/2％的重量)。然而，一种大致纯的多核苷酸也可以含有天然存在的5′和3′非翻译区域，如作为启动子和终止子。优选大致纯的多核苷酸纯度至少为92％，如多核苷酸至少占制品中总的多核苷酸物质重量的92％，较高百分数优选如至少94％纯，至少95％纯，至少96％纯，至少97％纯，至少98％纯，至少99％纯，至少99.5％纯。这里公开的多核苷酸优选是一种大致纯的形式，特别优选这里公开的多核苷酸是一种基本纯的形式，如多核苷酸基本上不含有其它与之天然关联的多核苷酸物质。这里，术语“大致纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”同义。

修饰：本发明文中的术语“修饰”意指对选自下组所示的氨基酸序列的多肽进行任何一种化学修饰：SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66，以及对编码该多肽的DNA进行基因操作。修饰可以是氨基酸侧链的取代，在感兴趣的氨基酸上进行的替换、缺失和/或插入。

人工变异体：当在这里使用时，术语“人工变异体”指具有纤维二糖水解酶I活性的多肽，该多肽可通过微生物表达一种相应于下列序列修饰过的基因而生产：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59或SEQ ID NO：65。编码在适宜宿主中表达产生的所述变异体的修饰过的基因，可以通过修饰选自下组所示的多核苷酸序列进行人为干预获得：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ IDNO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：37，SEQID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59或SEQ ID NO：65。

cDNA：在本文中使用的术语“cDNA”包括通过从来源于真核细胞的天然的、成熟的、剪切过的mRNA分子反转录制备出的DNA分子。cDNA缺少了通常存在于相应基因组DNA中的内含子序列。初始的基本的RNA转录本是mRNA的前体，在成为成熟的剪切过的mRNA前它需经历一系列的加工事件，包括通过所谓的剪切过程剪切掉内含子序列。所以当cDNA来源于mRNA时，它就缺少了内含子序列。

核酸构建体：当在这里使用时，核酸构建体指一种核酸分子，不管是单链还是双链的，它是从天然存在的基因中分离出的或是已经被修饰过的，其中含有的核酸片段是不可能天然存在的。当核酸构建体含有表达本发明编码序列必需的调控序列时，术语核酸构建体与术语“表达框”同义。

调控序列：这里定义的术语“调控序列”包括了所有必需的或利于本发明多肽表达的组件。每一调控序列对于编码多肽的核酸序列可以是天然的或是外源的。这种调控序列包括但不局限于前导序列、多聚腺苷酸序列、前肽序列、启动子、信号肽序列和转录终止子。调控序列最低程度应包括一个启动子、转录和转录终止信号。为了引入能促进调控序列与编码多肽核苷酸序列的编码区连接的特异的限制性位点，可以在调控序列中加入接头。

可操作的连接：这里定义的“可操作的连接”作为一种构造，其中调控序列被适当地置于与DNA序列中编码序列相关联的位置，从而该调控序列能指导多肽的表达。

编码序列：当在这里使用时，术语“编码序列”包括直接特异于蛋白产物氨基酸序列的核酸序列。编码序列的界限通常由一个普遍起始于ATG启始密码子的开放式阅读框来确定。典型的编码序列包括DNA、cDNA和重组核苷酸序列。

表达：本文中的术语“表达”包括生产多肽中的任一步骤，包括但不局限于转录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体：本文中的术语“表达载体”包括线性或环状的DNA分子，该DNA分子含有可操作地与其它用于其转录的片段相连的编码本发明多肽的片段。

宿主细胞：这里使用的术语“宿主细胞”包括可耐受核酸构建体转化的任一细胞类型。

术语“多核苷酸探针”、“杂交”和各种严谨条件在题为“具有纤维二糖水解酶I活性的多肽”的章节中定义了。

热稳定性：这里使用的术语“热稳定性”按照实施例2中描述的方法测定。

发明详述

具有纤维二糖水解酶I活性的多肽

在第一个方案中，本发明涉及具有纤维二糖水解酶I活性的多肽，该多肽优选含有与选自下组所示的氨基酸序列有一定同一性的氨基酸序列：SEQID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66，其中同一性为至少65％(如成熟的多肽)，优选至少70％，如至少75％，更优选至少80％，如至少85％，甚至更优选90％，最优选至少95％，如至少96％，至少97％，和甚至最优选至少98％，如至少99％(其后的“同源多肽”)。在一个优选的方案中，氨基酸序列为与选自下组的氨基酸序列至多有10个氨基酸的差别(如10个氨基酸)的序列，其中特别是至多5个氨基酸的差别(如5个氨基酸)，例如至多4个氨基酸的差别(如4个氨基酸)，如至多3个氨基酸的差别(如3个氨基酸)，该组包括SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。在一个最优选的方案中，氨基酸序列的差别至多为两个氨基酸(如两个氨基酸)，例如选自下组所示的氨基酸序列中发生了一个氨基酸的改变：SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。

优选地，本发明的多肽包括选自下组所示的氨基酸序列：SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66；其中的等位基因变异体；或是其中具有纤维二糖水解酶I活性的片段。在另一个优选的方案中，本发明的多肽包括选自下组所示的氨基酸序列：SEQID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。

本发明的多肽可以是鉴定的野生型纤维二糖水解酶I，是天然来源分离的。这种野生型纤维二糖水解酶I可通过本领域已知标准技术特异地筛选出，如在实施例1中描述的分子筛选方法。而且，本发明的多肽可以通过DNA改组(shuffling)技术制备，如J.E.Ness等(Nature biotechnology，1999，17，893-896)所描述的。另外，本发明的多肽可以是一种人工变异体，其中包括在相应于选自下组所示的氨基酸序列中含有至少一个氨基酸发生替代、缺失和/或插入的氨基酸序列：SEQ ID NO：2，SEQ ID NO：4，SEQID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。这样的人工变体可通过本领域已知技术构建，如多肽的定点/随机诱变，所述多肽包含选自下组的氨基酸序列：SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。在本发明的另一个方案中，氨基酸的变化(人工变异体和野生型多肽)是一种次要的状态，即可以是一种保守的氨基酸取代，故不会显著地影响折叠和/或蛋白的活性；少量的缺失，典型的有1至约30个氨基酸；少量的氨基或羧基端延伸，如氨基末端的甲硫氨酸残基；至多约20-25个残基的少量的连接肽；或通过改变净电荷或其它功能促进纯化的少量延伸，例如一种聚组氨酸区(tract)、抗原表位或结合域。

保守取代的例子在下组所述的氨基酸范围内，包括碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、中性氨基酸(谷氨酸和天冬酰胺酸)、疏水氨基酸(亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)，和小氨基酸(氨基乙酸、丙氨酸、丝氨酸和苏氨酸)。通常不改变特定活性的氨基酸取代是已知的并已经在现有技术中公开，如参见H.Neurath和R.L.Hill等的文献(1997，Theproteins，Academic Press，纽约)。最常进行的交换有Ala/Ser，Val/lle，Asp/Glu，Thr/Ser，Ala/Gly，Ala/Thr，Ser/Asn，Ala/Val，Ser/Gly，Tyr/Phe，Ala/Pro，Lys/Arg，Asp/Asn，Leu/Ile，Leu/Val，Ala/Glu和Asp/Gly，或是它们的反向交换。

在感兴趣的本发明的一个方案中，氨基酸的变化能改变多肽的物理化学特性，例如通过氨基酸的改变改善多肽的热稳定性，改变底物的特异性，或是改变最适PH值与其它。

这种取代、缺失和/或插入优选的氨基酸残基的数目与选自下组的氨基酸序列相比至多为10个，例如至多9个，如至多8个，更优选至多7个，如至多6个，例如至多5个，最优选至多4个，如至多3个，例如至多2个，尤其是至多1个，该组氨基酸有SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。

发明人已经分离出了编码具有纤维二糖水解酶I活性的多肽的核苷酸序列，这些酶来自于选自下组所述的微生物：嗜热支顶孢、嗜热毛壳霉、小柱孢菌属、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉；和来自白蚁幼虫内脏的栗色新螱。因此，在一个次要的方案中，本发明涉及含有同源氨基酸序列的多肽，该氨基酸序列与由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少65％同一性，其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。在本发明一个感兴趣的方案中，多肽含有的氨基酸序列与存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的同一性为至少70％的，如至少75％，优选至少80％，例如至少85％，更优选至少90％，最优选至少95％，如至少96％，例如97％，甚至最优选至少98％，例如99％，其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉，其后称它们为“同源多肽”。在一个感兴趣的方案中，氨基酸序列相应于由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的差别至多为10个氨基酸(如10个氨基酸)，优选至多5个氨基酸的差别(如5个氨基酸)，例如至多4个氨基酸的差别(如4个氨基酸)，如至多3个氨基酸的差别(如3个氨基酸)，其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinum foecundissimum CBS 427.97、棉色二孢CBS247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilusgiganteus CBS 521.95、黑耳CBS 2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。在一个特别优选的方案中，氨基酸序列相应于由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的差别至多为2个氨基酸(如2个氨基酸)，例如仅有1个氨基酸的差别，其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。

优选地，本发明的多肽含有存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列，其中所述保藏微生物为CGMCC NO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCC NO.0747，CGMCCNO.0748，CGMCC NO.0749，CGMCC NO.0750。在另一个优选方案中，本发明的多肽由存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列组成，其中所述保藏微生物为CGMCC NO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCC NO.0747，CGMCC NO.0748，CGMCCNO.0749，CGMCC NO.0750。

在与上面所述相似的一个方案中，本发明的多肽可以是一种人工变异体，与存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列相比，该变异体包括优选由具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列组成，其中所述保藏微生物为CGMCC NO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCC NO.0747，CGMCC NO.0748，CGMCCNO.0749，CGMCC NO.0750。

在第三个方案中，本发明涉及由在极低严谨条件下杂交的核苷酸序列编码的具有纤维二糖水解酶I活性的多肽，优选在低严谨条件、更优选中等严谨条件、更优选中等偏上的严谨条件、甚至更优选高严谨条件和更优选极高严谨条件下与核苷酸探针进行杂交，其中探针选自下组所述的核苷酸序列：

(i)选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中1-1578位核苷酸，

SEQ ID NO：3中1-1587位核苷酸，

SEQ ID NO：5中1-1353位核苷酸，

SEQ ID NO：7中1-1371位核苷酸，

SEQ ID NO：9中1-1614位核苷酸，

SEQ ID NO：11中1-1245位核苷酸，

SEQ ID NO：13中1-1341位核苷酸，

SEQ ID NO：15中1-1356位核苷酸，

SEQ ID NO：37中1-1365位核苷酸，

SEQ ID NO：39中1-1377位核苷酸，

SEQ ID NO：41中1-1353位核苷酸，

SEQ ID NO：43中1-1341位核苷酸，

SEQ ID NO：45中1-1584位核苷酸，

SEQ ID NO：47中1-1368位核苷酸，

SEQ ID NO：49中1-1395位核苷酸，

SEQ ID NO：51中1-1383位核苷酸，

SEQ ID NO：53中1-1353位核苷酸，

SEQ ID NO：55中1-1599位核苷酸，

SEQ ID NO：57中1-1383位核苷酸，

SEQ ID NO：59中1-1578位核苷酸，和

SEQ ID NO：65中1-1371位核苷酸；

(ii)选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中1-500位核苷酸，

SEQ ID NO：3中1-500位核苷酸，

SEQ ID NO：5中1-500位核苷酸，

SEQ ID NO：7中1-500位核苷酸，

SEQ ID NO：9中1-500位核苷酸，

SEQ ID NO：11中1-500位核苷酸，

SEQ ID NO：13中1-500位核苷酸，

SEQ ID NO：15中1-500位核苷酸，

SEQ ID NO：37中1-500位核苷酸，

SEQ ID NO：39中1-500位核苷酸，

SEQ ID NO：41中1-500位核苷酸，

SEQ ID NO：43中1-500位核苷酸，

SEQ ID NO：45中1-500位核苷酸，

SEQ ID NO：47中1-500位核苷酸，

SEQ ID NO：49中1-500位核苷酸，

SEQ ID NO：51中1-500位核苷酸，

SEQ ID NO：53中1-500位核苷酸，

SEQ ID NO：55中1-500位核苷酸，

SEQ ID NO：57中1-500位核苷酸，

SEQ ID NO：59中1-500位核苷酸，

SEQ ID NO：65中1-500位核苷酸，

SEQ ID NO：17中第1-221位核苷酸，

SEQ ID NO：18中第1-239位核苷酸，

SEQ ID NO：19中第1-199位核苷酸，

SEQ ID NO：20中第1-191位核苷酸，

SEQ ID NO：21中第1-232位核苷酸，

SEQ ID NO：22中第1-467位核苷酸，

SEQ ID NO：23中第1-534位核苷酸，

SEQ ID NO：24中第1-563位核苷酸，

SEQ ID NO：25中第1-218位核苷酸，

SEQ ID NO：26中第1-492位核苷酸，

SEQ ID NO：27中第1-481位核苷酸，

SEQ ID NO：28中第1-463位核苷酸，

SEQ ID NO：29中第1-513位核苷酸，

SEQ ID NO：30中第1-579位核苷酸，

SEQ ID NO：31中第1-514位核苷酸，

SEQ ID NO：32中第1-477位核苷酸，

SEQ ID NO：33中第1-500位核苷酸，

SEQ ID NO：34中第1-470位核苷酸，

SEQ ID NO：35中第1-491位核苷酸，

SEQ ID NO：36中第1-221位核苷酸，

SEQ ID NO：61中第1-519位核苷酸，

SEQ ID NO：62中第1-497位核苷酸，

SEQ ID NO：63中第1-498位核苷酸，

SEQ ID NO：64中第1-525位核苷酸，和

SEQ ID NO：67中第1-951位核苷酸，和

(iii)选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中第1-200位核苷酸，

SEQ ID NO：3中第1-200位核苷酸，

SEQ ID NO：5中第1-200位核苷酸，

SEQ ID NO：7中第1-200位核苷酸，

SEQ ID NO：9中第1-200位核苷酸，

SEQ ID NO：11中第1-200位核苷酸，

SEQ ID NO：13中第1-200位核苷酸，

SEQ ID NO：15中第1-200位核苷酸，

SEQ ID NO：37中第1-200位核苷酸，

SEQ ID NO：39中第1-200位核苷酸，

SEQ ID NO：41中第1-200位核苷酸，

SEQ ID NO：43中第1-200位核苷酸，

SEQ ID NO：45中第1-200位核苷酸，

SEQ ID NO：47中第1-200位核苷酸，

SEQ ID NO：49中第1-200位核苷酸，

SEQ ID NO：51中第1-200位核苷酸，

SEQ ID NO：53中第1-200位核苷酸，

SEQ ID NO：55中第1-200位核苷酸，

SEQ ID NO：57中第1-200位核苷酸，

SEQ ID NO：59中第1-200位核苷酸，和

SEQ ID NO：65中第1-200位核苷酸

(J.Sambrook，E.F.Fritsch和T.Maniatus，1989，分子克隆实验室手册，第二版，冷泉巷，纽约)。

在另一个方案中，本发明涉及由存在于下组所述的微生物中的纤维二糖水解酶I编码部分核苷酸序列编码的具有纤维二糖水解酶I活性的多肽：

一种微生物，该微生物属于接合菌门(zygomycota)，优选属于毛霉菌属(Mucorales)，更优选属于毛霉菌科(Mucoraceae)，最优选属于根毛霉属(Rhizomucor)，如微小根毛霉(Rhizomucor pusillus)，或是笄霉科(choanephoraceae)，最优选属于poitrasia属，如poitrasia circinans。

一种微生物，该微生物属于卵菌纲(Oomycetes)，优选腐霉目(Pythiales)，更优选腐霉科(Pythiaceae)，最优选疫霉属(Phytophthora)，如蔓延疫霉(Phytophthora infestans)。

一种微生物，该微生物属于Auriculariales，担子菌目(Basidiomycota)，层菌纲(Hymenomycetes)，更优选属于Exidiaceae科，最优选属于Exidia属(如黑耳(Exidia glandulosa))。

一种微生物，该微生物属于Xylariales，(子囊菌门(Ascomycota)，Sordariomycetes目)，更优选属于炭角菌科(Xylariaceae)，最优选属于炭角菌属(Xylaria)，如块团炭角菌(Xylaria hypoxylon)。

一种微生物，该微生物属于Dothideales，子囊菌门，Dothideomycetes目，更优选属于Dothideaceae科，最优选属于色二孢属(Diplodia)，如棉色二孢(Diplodia gossypina)。

一种微生物，该微生物属于盘菌目(Pezizales，子囊菌门)，优选属于Pyronemataceae科，更优选属于长毛盘菌属(Trichophaea)，如囊状长毛盘菌(Trichophaea saccata)；或是Sarcosomataceae科，更优选属于假黑盘菌属(Pseudoplectania)，如淡黑假黑盘菌(Pseudoplectanianigrella)。

一种微生物，该微生物属于Rigidiporaceae科(在担子菌门，Hymenomycetes，Hymenomycetales之下)，更优选属于Meripilus属，如Meripilus giganteus。

一种微生物，该微生物属于皱孔菌科(Meruliaceae，在担子菌门，Hymenomycetes，Sterealesales之下)，更优选属于孢子丝菌属(Sporothrichum)，如孢子丝菌。

一种微生物，该微生物属于蘑菇科(Agaricaceae，在担子菌门，Hymenomycetes，伞菌目之下)，更优选属于鬼伞属，如灰色鬼伞(Coprinuscinereus)。

一种微生物，该微生物属于肉座菌科(Hypocreceae，在子囊菌门，Sordariomycetes，肉座菌目之下)，更优选属于支顶孢属(Acremonium，如嗜热支顶孢(Acremonium thermophilum)，支顶孢；或有有丝分裂孢子的轮枝孢属(Verticillium)，如幼嫩轮枝孢(Verticillium tenerum)。

一种微生物，该微生物属Cladorrhinum属(在子囊菌门，Sordariomycetes，Sordariales，Sordariaceae之下)，如Cladorrhinumfoecundissimum。

一种微生物，该微生物属于毁丝霉属(在子囊菌门，Sordariomycetes，Sordariales，Sordariaceae之下)，如嗜热毁丝霉(Myceliophthorathermophila)或肉桂色毁丝霉(Myceliophthora hinnulae)。

一种微生物，该微生物属于毛壳霉属(在子囊菌门，Sordariomycetes，Sordariales，Chaetomiaceae之下)，如嗜热毛壳霉(Chaetomiumthermophilum)。

一种微生物，该微生物属于Chaetomidium属(在子囊菌门，Sordariomycetes，Sordariales，Chaetomiaceae之下)，如Chaetomidiumpingtungium。

一种微生物，该微生物属于草根霉属(在子囊菌门，Sordariomycetes，Sordariales，Chaetomiaceae之下)，如Thielavia australiensis或有孢子囊的草根霉(Thielavia microspora)。

一种微生物，该微生物属于热子囊菌属(在子囊菌门，之下)，如橙黄色热子囊菌(Thermoascus aurantiacus)。

一种微生物，该微生物属于单瑞孢属(有丝分裂孢子的子囊菌门)，如玫瑰单瑞孢(Trichothecium roseum)，和

一种属于产黑色腐质霉种(Humicola nigrescens)的微生物。

一种选自下组所示序列的核苷酸序列或其亚序列：SEQ ID NO：1，SEQ IDNO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ IDNO：13，SEQ ID NO：15，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59，SEQ ID NO：65，SEQ ID NO：17，SEQ ID NO：18，SEQ ID NO：19，SEQ ID NO：20，SEQ IDNO：21，SEQ ID NO：22，SEQ ID NO：23，SEQ ID NO：24，SEQ ID NO：25，SEQ ID NO：26，SEQ ID NO：27，SEQ ID NO：28，SEQ ID NO：29，SEQ IDNO：30，SEQ ID NO：31，SEQ ID NO：32，SEQ ID NO：33，SEQ ID NO：34，SEQ ID NO：35，SEQ ID NO：36，SEQ ID NO：61，SEQ ID NO：62，SEQ IDNO：63，SEQ ID NO：64和SEQ ID NO：67，以及是一种选自下组所示的氨基酸序列：SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66，或是其片段，它们可以用于设计多核苷酸探针来鉴别和克隆出编码具有纤维二糖水解酶I活性的多肽的DNA，可以根据本领域公知的技术从不同的属或种的菌株中获得该DNA。这种探针尤其可用于与感兴趣的属或种的基因组或cDNA杂交，随后进行标准的DNA印迹过程，从而鉴别和分离出其中相应的基因。这种探针可以比全序列短，但必须至少有15个核苷酸，优选至少25个，更优选至少35个核苷酸的长度，例如长度为至少70个核苷酸。然而优选核苷酸探针长至少为100个核苷酸。例如，多核苷酸探针可以为至少200个核苷酸长度，至少300个核苷酸长度，至少400个核苷酸长度或至少为500个核苷酸长度。甚至可以使用更长的探针，如多核苷酸探针的长度至少为600个核苷酸，至少为700个核苷酸，至少为800个核苷酸，或至少为900个核苷酸。DNA和RNA探针都可以使用，探针通常被标记后用来检测相应的基因(例如，用³²P，³H，³⁵S，生物素或抗生物素蛋白来标记)。

因此，通过建立其它微生物的DNA和cDNA文库，从中可以筛选出与上述探针杂交的DNA，该DNA编码具有纤维二糖水解酶I活性的多肽。来自于这些其它微生物的基因组或其它DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳分离，或是采用其它的分离技术。来自于文库的DNA或分离的DNA可以被转移或固定在硝化纤维或其它适合的载体物质上。为了鉴别出克隆或与SEQ ID NO：1同源的DNA，含有固定DNA的载体物质用于DNA印迹中。

为了达到本发明的目的，杂交显示了与标记的多核苷酸探针杂交的核苷酸序列，其中探针与SEQ ID NO：1所示序列能在极低至极高严谨条件下杂交。在这些条件下由多核苷酸探针杂交上的分子可以通过X光片或任何其它本领域已知技术测定。无论何时在本文中使用的术语“多核苷酸探针”都可以被理解成含有至少15个核苷酸的探针。

在一个感兴趣的方案中，多核苷酸探针是选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中第1-1578位核苷酸，

SEQ ID NO：1中第1-1302位核苷酸，

SEQ ID NO：3中第1-1587位核苷酸，

SEQ ID NO：3中第1-1302位核苷酸，

SEQ ID NO：5中第1-1353位核苷酸，

SEQ ID NO：5中第1-1302位核苷酸，

SEQ ID NO：7中第1-1371位核苷酸，

SEQ ID NO：7中第1-1302位核苷酸，

SEQ ID NO：9中第1-1614位核苷酸，

SEQ ID NO：9中第1-1302位核苷酸，

SEQ ID NO：11中第1-1245位核苷酸，

SEQ ID NO：13中第1-1341位核苷酸，

SEQ ID NO：13中第1-1302位核苷酸，

SEQ ID NO：15中第1-1356位核苷酸，

SEQ ID NO：15中第1-1302位核苷酸，

SEQ ID NO：37中第1-1365位核苷酸，

SEQ ID NO：37中第1-1302位核苷酸，

SEQ ID NO：39中第1-1377位核苷酸，

SEQ ID NO：39中第1-1302位核苷酸，

SEQ ID NO：41中第1-1353位核苷酸，

SEQ ID NO：41中第1-1302位核苷酸，

SEQ ID NO：43中第1-1341位核苷酸，

SEQ ID NO：43中第1-1302位核苷酸，

SEQ ID NO：45中第1-1584位核苷酸，

SEQ ID NO：45中第1-1302位核苷酸，

SEQ ID NO：47中第1-1368位核苷酸，

SEQ ID NO：47中第1-1302位核苷酸，

SEQ ID NO：49中第1-1395位核苷酸，

SEQ ID NO：49中第1-1302位核苷酸，

SEQ ID NO：51中第1-1383位核苷酸，

SEQ ID NO：51中第1-1302位核苷酸，

SEQ ID NO：53中第1-1353位核苷酸，

SEQ ID NO：53中第1-1302位核苷酸，

SEQ ID NO：55中第1-1599位核苷酸，

SEQ ID NO：55中第1-1302位核苷酸，

SEQ ID NO：57中第1-1383位核苷酸，

SEQ ID NO：57中第1-1302位核苷酸，

SEQ ID NO：59中第1-1578位核苷酸，

SEQ ID NO：59中第1-1302位核苷酸，

SEQ ID NO：65中第1-1371位核苷酸，和

SEQ ID NO：65中第1-1302位核苷酸，

或是选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中第1-500位核苷酸，

SEQ ID NO：3中第1-500位核苷酸，

SEQ ID NO：5中第1-500位核苷酸，

SEQ ID NO：7中第1-500位核苷酸，

SEQ ID NO：9中第1-500位核苷酸，

SEQ ID NO：11中第1-500位核苷酸，

SEQ ID NO：13中第1-500位核苷酸，

SEQ ID NO：15中第1-500位核苷酸，

SEQ ID NO：37中第1-500位核苷酸，

SEQ ID NO：39中第1-500位核苷酸，

SEQ ID NO：41中第1-500位核苷酸，

SEQ ID NO：43中第1-500位核苷酸，

SEQ ID NO：45中第1-500位核苷酸，

SEQ ID NO：47中第1-500位核苷酸，

SEQ ID NO：49中第1-500位核苷酸，

SEQ ID NO：51中第1-500位核苷酸，

SEQ ID NO：53中第1-500位核苷酸，

SEQ ID NO：55中第1-500位核苷酸，

SEQ ID NO：57中第1-500位核苷酸，

SEQ ID NO：59中第1-500位核苷酸，

SEQ ID NO：65中第1-500位核苷酸，

SEQ ID NO：17中第1-221位核苷酸，

SEQ ID NO：18中第1-239位核苷酸，

SEQ ID NO：19中第1-199位核苷酸，

SEQ ID NO：20中第1-191位核苷酸，

SEQ ID NO：21中第1-232位核苷酸，

SEQ ID NO：22中第1-467位核苷酸，

SEQ ID NO：23中第1-534位核苷酸，

SEQ ID NO：24中第1-563位核苷酸，

SEQ ID NO：25中第1-218位核苷酸，

SEQ ID NO：26中第1-492位核苷酸，

SEQ ID NO：27中第1-481位核苷酸，

SEQ ID NO：28中第1-463位核苷酸，

SEQ ID NO：29中第1-513位核苷酸，

SEQ ID NO：30中第1-579位核苷酸，

SEQ ID NO：31中第1-514位核苷酸，

SEQ ID NO：32中第1-477位核苷酸，

SEQ ID NO：33中第1-500位核苷酸，

SEQ ID NO：34中第1-470位核苷酸，

SEQ ID NO：35中第1-491位核苷酸，

SEQ ID NO：36中第1-221位核苷酸，

SEQ ID NO：61中第1-519位核苷酸，

SEQ ID NO：62中第1-497位核苷酸，

SEQ ID NO：63中第1-498位核苷酸，

SEQ ID NO：64中第1-525位核苷酸，和

SEQ ID NO：67中第1-951位核苷酸，和

或是选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中第1-200位核苷酸，

SEQ ID NO：3中第1-200位核苷酸，

SEQ ID NO：5中第1-200位核苷酸，

SEQ ID NO：7中第1-200位核苷酸，

SEQ ID NO：9中第1-200位核苷酸，

SEQ ID NO：11中第1-200位核苷酸，

SEQ ID NO：13中第1-200位核苷酸，

SEQ ID NO：15中第1-200位核苷酸，

SEQ ID NO：37中第1-200位核苷酸，

SEQ ID NO：39中第1-200位核苷酸，

SEQ ID NO：41中第1-200位核苷酸，

SEQ ID NO：43中第1-200位核苷酸，

SEQ ID NO：45中第1-200位核苷酸，

SEQ ID NO：47中第1-200位核苷酸，

SEQ ID NO：49中第1-200位核苷酸，

SEQ ID NO：51中第1-200位核苷酸，

SEQ ID NO：53中第1-200位核苷酸，

SEQ ID NO：55中第1-200位核苷酸，

SEQ ID NO：57中第1-200位核苷酸，

SEQ ID NO：59中第1-200位核苷酸，

SEQ ID NO：65中第1-200位核苷酸，

SEQ ID NO：22中第1-200位核苷酸，

SEQ ID NO：23中第1-200位核苷酸，

SEQ ID NO：24中第1-200位核苷酸，

SEQ ID NO：25中第1-200位核苷酸，

SEQ ID NO：26中第1-200位核苷酸，

SEQ ID NO：27中第1-200位核苷酸，

SEQ ID NO：28中第1-200位核苷酸，

SEQ ID NO：29中第1-200位核苷酸，

SEQ ID NO：30中第1-200位核苷酸，

SEQ ID NO：31中第1-200位核苷酸，

SEQ ID NO：32中第1-200位核苷酸，

SEQ ID NO：33中第1-200位核苷酸，

SEQ ID NO：34中第1-200位核苷酸，

SEQ ID NO：35中第1-200位核苷酸，

SEQ ID NO：61中第1-200位核苷酸，

SEQ ID NO：62中第1-200位核苷酸，

SEQ ID NO：63中第1-200位核苷酸，

SEQ ID NO：64中第1-200位核苷酸，和

SEQ ID NO：67中第1-200位核苷酸。

在另一个感兴趣的方案中，多核苷酸探针是编码选自下组所示多肽的核苷酸序列的互补链：SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ IDNO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60和SEQ ID NO：66。在更优选的方案中，多核苷酸探针是选自下组所示核苷酸序列的互补链：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59或SEQ ID NO：65。在另一个优选的方案中，多核苷酸探针是包含在质粒中的核苷酸序列的互补链，其中质粒存在于选自于下组的保藏微生物中：CGMCC NO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCCNO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCC NO.0750。

对于至少100个核苷酸长度的探针来说，极低至极高的严谨条件定义为在42℃、5×SSPE、1.0％ SDS、5×分子杂交封闭剂(Denhardt’ssolution)、100μg/ml剪切和变性鲑精DNA条件下预杂交和杂交，随后进入标准的DNA印迹程序。优选地，至少100个核苷酸的长探针不含有1000个以上的核苷酸。对于至少100个核苷酸长度的探针，最后在42℃用2×SSC、0.1％ SDS洗涤载体材料三次，每次15分钟(极低严谨条件)；优选在42℃使用0.5×SSC、0.1％ SDS洗涤载体材料三次，每次15分钟(低严谨条件)；更优选在42℃使用0.2×SSC、0.1％ SDS洗涤载体材料三次，每次15分钟(中等严谨条件)；甚至更优选在55℃使用0.2×SSC、0.1％ SDS洗涤载体材料三次，每次15分钟(中等偏上严谨条件)；最优选在60℃使用0.2×SSC、0.1％ SDS洗涤载体材料三次，每次15分钟(高严谨条件)；尤其是在68℃使用0.2×SSC、0.1％ SDS洗涤载体材料三次，每次15分钟(极高严谨条件)。

虽然没有被特别地选定，但也预期了可以使用短的探针，如约15至99个核苷酸长度的探针，例如从约15至约70个核苷酸长度的探针。对于这种短的探针来说，严谨条件定义为在低于T_m值下5-10℃时进行预杂交、杂交和杂交后洗涤，T_m值根据Bolton和McCaethy所述方法计算(1962，Proceedings of the National Academy of Sciences USA 48：1390)，其中每毫升杂交液含有0.9M NaCl，0.09M PH7.6 Tris-HCl，6mM EDYA，0.5％NP-40，1×分子杂交封闭剂，1mM焦磷酸盐，1mM磷酸单碱钠，0.1mM ATP，和0.2mg酵母RNA条件下预杂交和杂交，随后进入标准的DNA印迹程序。

对于约15至99个核苷酸长度的短探针来说，第一次在6×SSC加上0.1％SDS中洗涤载体材料15分钟，在低于计算的T_m值5-10℃时使用6×SSC再洗涤两次，每次15分钟。

具有纤维二糖水解酶I活性的多肽的来源

本发明的多肽可以从任何一种微生物获得。适应于本发明目的，这里使用的“获自”指由核苷酸编码的多肽由细胞生产，该核苷酸序列天然存在于或该核苷酸序列已经被插入细胞中。在一个优选的方案中，多肽被分泌到细胞外。

本发明的多肽可以是一种细菌多肽。例如，多肽可以是一种革兰氏阳性菌，例如是一种芽孢杆菌多肽，如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂类芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽；或一种链霉菌多肽，如变青链霉菌或鼠灰链霉菌多肽；或是一种革兰氏阴性菌，如大肠杆菌或一种假单孢菌多肽。

本发明的多肽可以是一种真菌多肽，和更优选一种酵母多肽，例如假丝酵母属、克鲁维氏酵母属、Neocallimastix、毕赤氏酵母属、Piromyces、糖酵母属、裂殖糖酵母属或Yarrowia多肽；或更优选一种细丝状真菌多肽如支顶孢属、曲霉属、短柄酶属Cryptococcus、Filibasidium、镰孢属、腐质霉属、Magnaporthe、毛霉属、毁丝霉属、链孢霉属、拟青霉属、青霉属、裂褶菌属、踝节菌属、热子囊菌属、草根霉属、Tolypocladium或木霉属多肽。

在一个感兴趣的方案中，多肽是一种卡尔斯伯糖酵母、啤酒糖酵母、糖化糖酵母、Saccaromyces douglasii、Saccaromyces kluyveri、Saccaromyces norbensis或卵形糖酵母多肽。

在另一个感兴趣的方案中，多肽是一种棘孢曲霉、泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑色曲霉、米曲霉、杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、玫瑰色镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、Fusarium torulosum、Fusariumtrichothecioides、Fusarium venenatum、Humicola insolens、Humicolalanuginosa、米赫毛霉、嗜热毁丝霉、粗糙链孢霉、产紫青霉、Trichodermaharzianum、康宁氏木霉、Trichoderma longibrachiatum、Trichodermareesei或绿色木霉多肽。

在一个优选的方案中，多肽是一种嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌或蔓延疫霉多肽。

在一个更优选的方案中，多肽是一种嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、Poitrasia circinans或Coprinus cinereus多肽。如该多肽由选自所示的氨基酸序列组成：SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60和SEQ ID NO：66。

可以理解上述微生物包括了完全和不完全的形态，和其它分类学等价物，如变异体，而不管它们已知的品种名称。本领域的技术人员将容易地识别和鉴别适合的等价物。

公众可以从一些保藏单位容易获得这些菌株，例如美国典型培养物保藏中心(ATCC)，德意志微生物保藏中心(DSMZ)，中国普通微生物保藏中心(CGMCC)，荷兰真菌菌种保藏中心(CBS)，美国农业机构保藏中心(NRRL)。

而且，通过前述探针可以从自然界(如土壤、水、植物、动物等)中分离出的微生物等其它来源鉴别出和获得这种多肽。从自然环境中分离微生物的技术是本领域公知的。然后可以通过对其它微生物的基因组或cDNA文库进行相似筛选得到核苷酸序列。一旦编码多肽的核苷酸序列被探针检测出来，使用本领域普通技术人员已知的技术可以将该序列分离或克隆(参见Sambrook等，1989，supra)。

由本发明核苷酸序列编码的多肽还包括融合多肽或可剪切多肽，其中其它的多肽在该多肽或其片段的N-末端或C-末端融合。融合多肽可以通过一种编码其它多肽的核苷酸序列(或其部分)与本发明的核苷酸序列(或其部分)融合产生。融合多肽的生产技术是本领域公知的，并且包括了连接编码多肽的编码序列，这样它们处于表达框中并且融合多肽的表达处于相同启动子和终止子的调控之下。

多核苷酸和核苷酸序列

本发明还涉及含有编码本发明多肽的核苷酸序列的多核苷酸，本发明尤其涉及由编码本发明多肽的核苷酸序列组成的多核苷酸。在一个优选的方案中，核苷酸序列选自下组所示的序列：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59和SEQ ID NO：65。在一个更优选的方案中，核苷酸序列为成熟多肽编码区，它包含在质粒中，所述质例包含在选自下组的保藏微生物中：CGMCC NO.0584，CGMCC NO.0581，CGMCCNO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCCNO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCC NO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCC NO.0750。本发明还包括一种多核苷酸，它含有、优选具有编码与选自下组的一种氨基酸序列一致的多肽的核苷酸序列：SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66，该核苷酸序列的遗传密码与选自下组的核苷酸序列的简并性不同：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ IDNO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ IDNO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59和SEQ ID NO：65。

本发明还涉及含有，优选由下列组成，选自下组的核苷酸序列的亚序列的多核苷酸：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59，和SEQ ID NO：65，该核苷酸序列编码一种选自下组的氨基酸序列的片段，该片段具有纤维二糖水解酶I的活性：SEQ ID NO：2，SEQ IDNO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ IDNO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。一种选自下组的核苷酸序列的亚序列：SEQ ID NO：1，SEQ ID NO：3，SEQ IDNO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ IDNO：15，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59和SEQ ID NO：65，该核苷酸序列包含在选自下组的核苷酸序列中，除了5’和/或3’端缺失了一个或多个核苷酸以外：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59和SEQ ID NO：65，

本发明还涉及具有选自下组的，优选由其组成，成熟多肽编码序列中含有至少一种修饰的核苷酸序列的多核苷酸：SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59和SEQ ID NO：65，而且其中修饰的核苷酸序列编码一种具有选自下组氨基酸序列的多肽：SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQ ID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。

分离或克隆编码一种多肽的核苷酸序列的方法是本领域已知的，并且包括了从基因组DNA中的分离技术、来自cDNA的制备方法或它们的组合。从这种基因组DNA中克隆出本发明的核苷酸序列是可以实现的，如使用公知的聚合酶链反应(PCR)或利用共同的结构特征经抗体筛选表达文库来检测克隆的DNA片段(参见如Innis等，1990，PCR：A Guide to Methods andApplication，Academic Press，New York)。其它扩增程序例如连接酶链反应(LCR)、连接激活转录(LAT)和基于核苷酸序列的扩增(NASBA)可以被使用。核苷酸序列可以从一种选自下组的菌株中克隆：支顶孢、小柱孢菌、热子囊菌、草根霉、轮枝孢、新螱、白丝菌、poitrasia、鬼伞、单瑞孢、产腐质霉、Cladorrhinum、二孢、毁丝霉、根毛霉、Meripilus、黑耳、炭角菌、盘菌、毛壳霉、Chaetomidium、毁丝霉、Sporotrichum、草根霉、曲霉、帚霉、镰孢、假黑盘菌和疫霉，或其它相关的微生物，这样，该序列可以是如多肽编码区核苷酸序列的一种等位基因或变异体。

在遗传工程中使用标准的克隆技术可以获得核苷酸序列，将它从天然位点重新定位到它将被复制的不同位点。克隆方法可以包括对感兴趣的含有编码多肽的核苷酸序列的片段进行切除和分离，将片段插入载体分子中和将重组载体转化进宿主细胞，宿主细胞中的核苷酸序列的多拷贝或克隆将被复制。核苷酸序列可以是基因组、cDNA、RNA、半合成、合成来源或它们的组合。

本发明还涉及包含，优选具有与选自下组的核苷酸序列具有一定同一性的核苷酸序列的多核苷酸：

SEQ ID NO：1中第1-1578位核苷酸，

SEQ ID NO：3中第1-1587位核苷酸，

SEQ ID NO：5中第1-1353位核苷酸，

SEQ ID NO：7中第1-1371位核苷酸，

SEQ ID NO：9中第1-1614位核苷酸，

SEQ ID NO：11中第1-1245位核苷酸，

SEQ ID NO：13中第1-1341位核苷酸，

SEQ ID NO：15中第1-1356位核苷酸，

SEQ ID NO：37中第1-1365位核苷酸，

SEQ ID NO：39中第1-1377位核苷酸，

SEQ ID NO：41中第1-1353位核苷酸，

SEQ ID NO：43中第1-1341位核苷酸，

SEQ ID NO：45中第1-1584位核苷酸，

SEQ ID NO：47中第1-1368位核苷酸，

SEQ ID NO：49中第1-1395位核苷酸，

SEQ ID NO：51中第1-1383位核苷酸，

SEQ ID NO：53中第1-1353位核苷酸，

SEQ ID NO：55中第1-1599位核苷酸，

SEQ ID NO：57中第1-1383位核苷酸，

SEQ ID NO：59中第1-1578位核苷酸，

SEQ ID NO：65中第1-1371位核苷酸，

SEQ ID NO：1中第1-500位核苷酸，

SEQ ID NO：3中第1-500位核苷酸，

SEQ ID NO：5中第1-500位核苷酸，

SEQ ID NO：7中第1-500位核苷酸，

SEQ ID NO：9中第1-500位核苷酸，

SEQ ID NO：11中第1-500位核苷酸，

SEQ ID NO：13中第1-500位核苷酸，

SEQ ID NO：15中第1-500位核苷酸，

SEQ ID NO：37中第1-500位核苷酸，

SEQ ID NO：39中第1-500位核苷酸，

SEQ ID NO：41中第1-500位核苷酸，

SEQ ID NO：43中第1-500位核苷酸，

SEQ ID NO：45中第1-500位核苷酸，

SEQ ID NO：47中第1-500位核苷酸，

SEQ ID NO：49中第1-500位核苷酸，

SEQ ID NO：51中第1-500位核苷酸，

SEQ ID NO：53中第1-500位核苷酸，

SEQ ID NO：55中第1-500位核苷酸，

SEQ ID NO：57中第1-500位核苷酸，

SEQ ID NO：59中第1-500位核苷酸，

SEQ ID NO：65中第1-500位核苷酸，

SEQ ID NO：17中第1-221位核苷酸，

SEQ ID NO：18中第1-239位核苷酸，

SEQ ID NO：19中第1-199位核苷酸，

SEQ ID NO：20中第1-191位核苷酸，

SEQ ID NO：21中第1-232位核苷酸，

SEQ ID NO：22中第1-467位核苷酸，

SEQ ID NO：23中第1-534位核苷酸，

SEQ ID NO：24中第1-563位核苷酸，

SEQ ID NO：25中第1-218位核苷酸，

SEQ ID NO：26中第1-492位核苷酸，

SEQ ID NO：27中第1-481位核苷酸，

SEQ ID NO：28中第1-463位核苷酸，

SEQ ID NO：29中第1-513位核苷酸，

SEQ ID NO：30中第1-579位核苷酸，

SEQ ID NO：31中第1-514位核苷酸，

SEQ ID NO：32中第1-477位核苷酸，

SEQ ID NO：33中第1-500位核苷酸，

SEQ ID NO：34中第1-470位核苷酸，

SEQ ID NO：35中第1-491位核苷酸，

SEQ ID NO：36中第1-221位核苷酸，

SEQ ID NO：61中第1-519位核苷酸，

SEQ ID NO：62中第1-497位核苷酸，

SEQ ID NO：63中第1-498位核苷酸，

SEQ ID NO：64中第1-525位核苷酸，和

SEQ ID NO：67中第1-951位核苷酸

其中同一性为至少70％，例如至少75％；优选序列具有至少80％的同一性，如85％的同一性，例如至少90％的同一性，更优选至少95％的同一性，例如至少96％的同一性，如至少97％的同一性，甚至更优选至少98％的同一性，例如99％。优选核苷酸序列编码具有纤维二糖水解酶I活性的多肽。两种核苷酸序列之间的同一性可根据前述方法确定(参见题为“定义”的章节)。

在感兴趣的另一个方面，本发明涉及包含，优选具有，与存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少65％同一性的核苷酸序列的多核苷酸：CGMCC NO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCC NO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCC NO.0750。在另一个优选的方案中，核苷酸序列与存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列的同一性至少为70％：CGMCC NO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCCNO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCC NO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCC NO.0750，例如至少75％；优选序列具有至少80％的同一性，如85％的同一性，例如至少90％的同一性，更优选至少95％的同一性，例如至少96％的同一性，如至少97％的同一性，甚至更优选至少98％的同一性，例如99％。优选核苷酸序列含有存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列：CGMCC NO.0584，CGMCCNO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCC NO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCC NO.0750。在一个更优选的方案中，核苷酸序列具有存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列：CGMCC NO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，DSM 15064，DSM 15065，DSM 15066，DSM 15067，CGMCC NO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCC NO.0750。

编码本发明多肽的核苷酸序列的修饰对于多肽的合成可以是必需的，其中包括相应于选自下组的氨基酸序列具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列：SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ IDNO：8，SEQ ID NO：10，SEQ ID NO：12，SEQ ID NO：14，SEQ ID NO：16，SEQID NO：38，SEQ ID NO：40，SEQ ID NO：42，SEQ ID NO：44，SEQ ID NO：46，SEQ ID NO：48，SEQ ID NO：50，SEQ ID NO：52，SEQ ID NO：54，SEQ ID NO：56，SEQ ID NO：58，SEQ ID NO：60和SEQ ID NO：66。根据某些工程方法，这些人工变异体不同于从天然来源分离的多肽，如它们之间的区别在于特定的活性、热稳定性、最适PH值等。

对于本领域的技术人员来说，很显然这些修饰可以在与分子功能密切相关的区域以外进行，从而获得具有活性的多肽。对于由本发明核苷酸序列编码的多肽的活性所必需的氨基酸残基自然是优选不被进行取代等修饰的，可以根据本领域公知的技术如位点直接突变或丙氨酸筛选突变等方法确定这些残基(参见如Cunningham和Wells，1989，Science244：1081-1085)。在后一种方法中，对分子中的每一个正电荷残基进行突变，然后通过对生成的突变分子进行纤维二糖水解酶I活性检测，从而鉴定出发生突变的氨基酸残基对于分子活性是否必需。还可以通过分析由核磁共振、晶体衍射技术或光亲和标记等技术测定的三维结构来确定底物-酶互作位点(参见如Vos等，1992，Science 255：306-312；Smith等，1992，Journal of moleucar biology 224：899-904；Wlodaver等，1992，FEBSLetters 309：59-64)。

而且，编码本发明多肽的核苷酸序列可以经引入一个核苷酸替代进行修饰，该修饰不会导致生成另一种由核苷酸序列编码多肽的氨基酸序列，但是需与宿主微生物生产酶时使用密码子的习惯相一致。

可以通过使用本领域已知的任何方法进行位点定向诱变，从而在核苷酸序列中引入突变，使一个核苷酸变成另一个核苷酸。在这些方法中，尤其实用的方法是使用一种超螺旋双链DNA载体，将感兴趣的基因和所需突变的两条合成引物插入该载体中，其中每条寡核苷酸引物与载体的相反链互补并且能在温度循环中依靠Pfu DNA聚合酶进行延伸。在引物结合上之后生成了含有交错缺口的突变质粒。温度循环后，用特异于甲基化和半甲基化DNA的Dpnl处理产物，消化亲代DNA模板并挑选出含有突变的合成DNA。本领域已知的其它方法也可以使用。对于核苷酸替代的综合描述参见如Ford等的文献(1991，Protein Expression and Purification 2：95-107)。

本发明还涉及包含，优选具有，一种编码具有纤维二糖水解酶I活性的多肽的核苷酸序列，并且该核苷酸序列在极低严谨条件、优选低严谨条件、更优选中等严谨条件、更优选中等偏上严谨条件、甚至更优选高严谨条件和最优选极高严谨条件下与选自下组所述的核苷酸探针杂交：

(i)选自下组所示核苷酸的互补链：

SEQ ID NO：1中第1-1578位核苷酸，

SEQ ID NO：1中第1-1302位核苷酸，

SEQ ID NO：3中第1-1587位核苷酸，

SEQ ID NO：3中第1-1302位核苷酸，

SEQ ID NO：5中第1-1353位核苷酸，

SEQ ID NO：5中第1-1302位核苷酸，

SEQ ID NO：7中第1-1371位核苷酸，

SEQ ID NO：7中第1-1302位核苷酸，

SEQ ID NO：9中第1-1614位核苷酸，

SEQ ID NO：9中第1-1302位核苷酸，

SEQ ID NO：11中第1-1245位核苷酸，

SEQ ID NO：13中第1-1341位核苷酸，

SEQ ID NO：13中第1-1302位核苷酸，

SEQ ID NO：15中第1-1356位核苷酸，

SEQ ID NO：15中第1-1302位核苷酸，

SEQ ID NO：37中第1-1365位核苷酸，

SEQ ID NO：37中第1-1302位核苷酸，

SEQ ID NO：39中第1-1377位核苷酸，

SEQ ID NO：39中第1-1302位核苷酸，

SEQ ID NO：41中第1-1353位核苷酸，

SEQ ID NO：41中第1-1302位核苷酸，

SEQ ID NO：43中第1-1341位核苷酸，

SEQ ID NO：43中第1-1302位核苷酸，

SEQ ID NO：45中第1-1584位核苷酸，

SEQ ID NO：45中第1-1302位核苷酸，

SEQ ID NO：47中第1-1368位核苷酸，

SEQ ID NO：47中第1-1302位核苷酸，

SEQ ID NO：49中第1-1395位核苷酸，

SEQ ID NO：49中第1-1302位核苷酸，

SEQ ID NO：51中第1-1383位核苷酸，

SEQ ID NO：51中第1-1302位核苷酸，

SEQ ID NO：53中第1-1353位核苷酸，

SEQ ID NO：53中第1-1302位核苷酸，

SEQ ID NO：55中第1-1599位核苷酸，

SEQ ID NO：55中第1-1302位核苷酸，

SEQ ID NO：57中第1-1383位核苷酸，

SEQ ID NO：57中第1-1302位核苷酸，

SEQ ID NO：59中第1-1578位核苷酸，

SEQ ID NO：59中第1-1302位核苷酸，

SEQ ID NO：65中第1-1371位核苷酸，和

SEQ ID NO：65中第1-1302位核苷酸，

(ii)或是选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中第1-500位核苷酸，

SEQ ID NO：3中第1-500位核苷酸，

SEQ ID NO：5中第1-500位核苷酸，

SEQ ID NO：7中第1-500位核苷酸，

SEQ ID NO：9中第1-500位核苷酸，

SEQ ID NO：11中第1-500位核苷酸，

SEQ ID NO：13中第1-500位核苷酸，

SEQ ID NO：15中第1-500位核苷酸，

SEQ ID NO：37中第1-500位核苷酸，

SEQ ID NO：39中第1-500位核苷酸，

SEQ ID NO：41中第1-500位核苷酸，

SEQ ID NO：43中第1-500位核苷酸，

SEQ ID NO：45中第1-500位核苷酸，

SEQ ID NO：47中第1-500位核苷酸，

SEQ ID NO：49中第1-500位核苷酸，

SEQ ID NO：51中第1-500位核苷酸，

SEQ ID NO：53中第1-500位核苷酸，

SEQ ID NO：55中第1-500位核苷酸，

SEQ ID NO：57中第1-500位核苷酸，

SEQ ID NO：59中第1-500位核苷酸，

SEQ ID NO：65中第1-500位核苷酸，

SEQ ID NO：17中第1-221位核苷酸，

SEQ ID NO：18中第1-239位核苷酸，

SEQ ID NO：19中第1-199位核苷酸，

SEQ ID NO：20中第1-191位核苷酸，

SEQ ID NO：21中第1-232位核苷酸，

SEQ ID NO：22中第1-467位核苷酸，

SEQ ID NO：23中第1-534位核苷酸，

SEQ ID NO：24中第1-563位核苷酸，

SEQ ID NO：25中第1-218位核苷酸，

SEQ ID NO：26中第1-492位核苷酸，

SEQ ID NO：27中第1-481位核苷酸，

SEQ ID NO：28中第1-463位核苷酸，

SEQ ID NO：29中第1-513位核苷酸，

SEQ ID NO：30中第1-579位核苷酸，

SEQ ID NO：31中第1-514位核苷酸，

SEQ ID NO：32中第1-477位核苷酸，

SEQ ID NO：33中第1-500位核苷酸，

SEQ ID NO：34中第1-470位核苷酸，

SEQ ID NO：35中第1-491位核苷酸，

SEQ ID NO：36中第1-221位核苷酸，

SEQ ID NO：61中第1-519位核苷酸，

SEQ ID NO：62中第1-497位核苷酸，

SEQ ID NO：63中第1-498位核苷酸，

SEQ ID NO：64中第1-525位核苷酸，和

SEQ ID NO：67中第1-951位核苷酸，

(iii)或是选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中第1-200位核苷酸，

SEQ ID NO：3中第1-200位核苷酸，

SEQ ID NO：5中第1-200位核苷酸，

SEQ ID NO：7中第1-200位核苷酸，

SEQ ID NO：9中第1-200位核苷酸，

SEQ ID NO：11中第1-200位核苷酸，

SEQ ID NO：13中第1-200位核苷酸，

SEQ ID NO：15中第1-200位核苷酸，

SEQ ID NO：37中第1-200位核苷酸，

SEQ ID NO：39中第1-200位核苷酸，

SEQ ID NO：41中第1-200位核苷酸，

SEQ ID NO：43中第1-200位核苷酸，

SEQ ID NO：45中第1-200位核苷酸，

SEQ ID NO：47中第1-200位核苷酸，

SEQ ID NO：49中第1-200位核苷酸，

SEQ ID NO：51中第1-200位核苷酸，

SEQ ID NO：53中第1-200位核苷酸，

SEQ ID NO：55中第1-200位核苷酸，

SEQ ID NO：57中第1-200位核苷酸，

SEQ ID NO：59中第1-200位核苷酸，

SEQ ID NO：65中第1-200位核苷酸，

SEQ ID NO：22中第1-200位核苷酸，

SEQ ID NO：23中第1-200位核苷酸，

SEQ ID NO：24中第1-200位核苷酸，

SEQ ID NO：25中第1-200位核苷酸，

SEQ ID NO：26中第1-200位核苷酸，

SEQ ID NO：27中第1-200位核苷酸，

SEQ ID NO：28中第1-200位核苷酸，

SEQ ID NO：29中第1-200位核苷酸，

SEQ ID NO：30中第1-200位核苷酸，

SEQ ID NO：31中第1-200位核苷酸，

SEQ ID NO：32中第1-200位核苷酸，

SEQ ID NO：33中第1-200位核苷酸，

SEQ ID NO：34中第1-200位核苷酸，

SEQ ID NO：35中第1-200位核苷酸，

SEQ ID NO：61中第1-200位核苷酸，

SEQ ID NO：62中第1-200位核苷酸，

SEQ ID NO：63中第1-200位核苷酸，

SEQ ID NO：64中第1-200位核苷酸，和

SEQ ID NO：67中第1-200位核苷酸。

可以理解，有关核苷酸序列杂交的细节和特例与在名为“具有纤维二糖水解酶I活性的多肽”的章节中讨论的相同或类似。

核苷酸构建体

本发明还涉及一种核苷酸构建体，其中本发明的核苷酸序列可操作地与一个或多个调控序列相连，这些调控序列能在适合的宿主细胞内在调控序列适应的条件下指导编码序列的表达。

编码本发明多肽的核苷酸序列可以经各种操作处理后用于多肽的表达。在核苷酸序列插入载体之前可以对它们进行处理或这种处理是必须的，这取决于表达载体本身。通过重组DNA技术修饰核苷酸序列的方法是本领域公知的。

调控序列可以是一种适合的启动子序列，该序列可以被表达核苷酸序列的宿主细胞识别。启动子序列含有介导多肽表达的转录调控序列。启动子可以是任何一种在所选宿主细胞中具有转录活性的核苷酸序列，包括发生突变的、截短的和杂合的启动子，并且可以获自那些对于宿主细胞同源或异源的编码胞外或胞内多肽的基因。

特异于大肠杆菌的用于指导本发明核苷酸构建体转录的适合的启动子有：获自大肠杆菌lac操纵子的启动子，天蓝色链霉菌乳糖基因(dagA)，模式种果聚糖蔗糖酶基因(SacB)，地衣芽孢杆菌α-淀粉酶基因(amyL)，嗜热脂肪芽孢杆菌麦芽糖淀粉酶(amyM)，解淀粉芽孢杆菌α-淀粉酶基因(amyQ)，地衣芽孢杆菌青霉素酶基因(penP)，模式种xylA和xylB基因，和原核β-内酰胺酶基因(Villa-Kamaroff等，1978，Proceeding of thenational academy of sciences USA 75：3727-3731)，以及tac启动子(DeBoer等，1983，Proceeding of the national academy of sciences USA80：21-25)。更多的有关启动子的描述参见“Useful proteins fromrecombinant bacteria”(Scientific American，198O，242：74-94)和Sambrook等(1989，supra)。

用于在细丝状真菌宿主细胞中指导本发明核苷酸构建体转录的适合的启动子如获自以下基因的启动子：米曲霉TAKA淀粉酶基因，Rhizomucormiehei天冬氨酸蛋白酶，黑色曲霉中性α-淀粉酶，黑色曲霉稳定的α-淀粉酶，黑色曲霉或泡盛曲霉葡糖淀粉酶(glaA)，Rhizomucor miehei脂肪酶，米曲霉碱性蛋白酶，米曲霉丙糖磷酸盐异构酶，构巢曲霉乙酰胺酶，和尖孢镰孢类胰岛素蛋白酶(WO96/00787)，以及NA2-tpi启动子(来自于黑色曲霉中性α-淀粉酶和米曲霉丙糖磷酸盐异构酶的杂合的启动子)，和它们的变异体，截短的和杂合的形式。

在酵母宿主中，有用的启动子获自啤酒糖酵母烯醇酶(ENO-1)、啤酒糖酵母半乳糖激酶(GAL1)、啤酒糖酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和啤酒糖酵母3-磷酸甘油酸盐激酶基因。更多用于酵母宿主细胞的有用的启动子由Romanos等描述了(1992，Yeast，8：423-488)。

调控序列还可以是适合的转录终止序列，该序列可以被宿主细胞识别而终止转录。终止序列可操作地连接于编码多肽的核苷酸序列的3′端。任何一种在所选宿主细胞内具有功能的终止子均可用于本发明。

优选适用于细丝状真菌宿主细胞的终止子获自米曲霉TAKA淀粉酶基因、黑色曲霉葡糖淀粉酶基因、构巢曲霉邻基苯甲酸盐合成酶基因、黑色曲霉α-淀粉酶基因和类胰岛素蛋白酶基因。

优选适用于酵母宿主细胞的终止子获自啤酒糖酵母烯醇酶基因、啤酒糖酵母细胞色素C(CYC1)基因和啤酒糖酵母甘油醛-3-磷酸脱氢酶基因。其它用于酵母宿主细胞的有用的终止子由Romanos等描述了(1992，Supra)。

调控序列还可以是一种适合的前导序列，一种对于宿主细胞非常重要的mRNA的非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5′端。任何一种在所选宿主细胞内具有功能的前导序列均可用于本发明。

优选用于细丝状真菌宿主细胞的前导序列获自米曲霉TAKA淀粉酶基因和米曲霉丙糖磷酸盐异构酶基因。

适用于酵母宿主细胞启动子获自啤酒糖酵母烯醇酶(ENO-1)基因、啤酒糖酵母3-磷酸甘油酸盐激酶基因、啤酒糖酵母α-因子和啤酒糖酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因。

调控序列还可以是一种聚腺苷酸化序列，该序列可操作地连接于编码多肽的核苷酸序列的3′端，当转录时作为一种在转录的mRNA上添加多聚腺苷酸残基的信号被宿主细胞识别。任何一种在所选宿主细胞内具有功能的聚腺苷酸化序列均可用于本发明。

优选适用于细丝状真菌宿主细胞的聚腺苷酸化序列获自米曲霉TAKA淀粉酶基因、黑色曲霉葡糖淀粉酶基因、构巢曲霉邻基苯甲酸盐合成酶基因、尖孢镰孢类胰岛素蛋白酶基因和黑色曲霉α-糖苷酶。

适用于酵母宿主细胞的聚腺苷酸化序列由Guo和Sherman公开了(1995，Molecular cellular biology 15：5983-5990)。

调控序列还可以是一种信号肽编码区，它编码一种连接于多肽的氨基端的氨基酸序列并指导编码的多肽进入细胞的分泌途径。编码序列5′端的核苷酸序列可以原本就含有信号肽编码区，在翻译阅读框中它与编码分泌多肽的编码区片段天然相连。或者，编码序列的5′端可以含有一种与编码序列异源的信号肽编码区。当编码序列不天然含有信号肽编码区时，外源信号肽编码区有可能需要。或者，为了促进多肽的分泌，可以只是用外源信号肽编码区替换天然的信号肽编码区。然而，任何一种能指导表达的多肽进入所选宿主细胞的分泌途径的信号肽编码区都可以用于本发明。

适合于细菌宿主细胞的有效的信号肽编码区是获自芽孢杆菌NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的信号肽编码区。Simonen和Palva描述了更多的信号肽(1993，Microbiological Reviews 57：109-137)。

用于细丝状真菌宿主细胞的有效的信号肽编码区获自米曲霉TAKA淀粉酶基因、黑色曲霉中性淀粉酶基因、黑色曲霉葡糖淀粉酶基因、Rhizomucormiehei天冬氨酸蛋白酶基因、Humicola insolens纤维素酶和Humicolalanuginosa脂肪酶基因。

适用于酵母宿主细胞的信号肽编码区获自啤酒糖酵母α-因子基因和啤酒糖酵母转化酵素基因。Romanos等描述了其它有用的信号肽编码区(1992，supra)。

调控序列还可以是一种编码位于多肽氨基端氨基酸序列的前肽编码区。这种生成的多肽称之为酶原或多肽原(或在某些情形时被称为酵素原)。多肽原通常没有活性，经由催化或多肽的自发催化剪切作用从多肽原转化成成熟的活性多肽。多肽原编码区可以获自模式种碱性蛋白酶(aprE)基因、模式种中性蛋白酶(nprT)基因、啤酒糖酵母α-因子基因、Rhizomucormiehei天冬氨酸蛋白酶基因和嗜热性毁丝霉漆酶基因(WO95/33836)。

其中信号肽和前肽区存在于多肽的氨基端，前肽区相邻于多肽的氨基端，信号肽区相邻于前肽的氨基端。

还可以添加其它的调节序列来调节与宿主细胞生长相关的多肽的表达。如当收到一种化学或物理刺激包括存在一种调节化合物时，调节系统发生反应开始或停止基因的表达。原核系统中的调节体系包括lac、tac和trp操纵子系统。在酵母中，可以使用ADH2和GAL1系统。在细丝状真菌中，TAKA淀粉酶启动子、黑色曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可以用作调节序列。其它调节序列如那些允许基因扩增的序列，在真核系统中，这些序列包括二氢叶酸还原酶基因和金属硫因基因，前者在存在氨甲蝶呤时被扩增，后者扩增时需要重金属。在这些例子里，编码多肽的核苷酸序列被可操作地与调节序列连接。

表达载体

本发明还涉及含有本发明核酸构建体的重组表达载体。上述各种核苷酸和调控序列可以被连接起来产生一种重组表达载体，该载体可以包括一或多个适宜的限制性位点用于编码多肽的核苷酸序列在这些位点插入或替代。或者，本发明的核苷酸序列可以通过将核苷酸序列或含有该序列的核酸构建体插入一种适合于表达的载体而进行表达。构建表达载体时，编码序列插入载体中这样编码序列可以与适于表达的调控序列可操作地连接起来。

重组表达载体可以是任何一种能方便地用于重组DNA技术和能使核苷酸序列表达的载体(如质粒或病毒)。载体的选择主要根据载体与载体转化的宿主细胞之间的相容性。载体可以是线性的或闭合的环状质粒。

载体可以是一种能自我复制的载体，如作为一种染色体外实体存在的载体，它的复制依赖于染色体的复制，如质粒，一种染色体外元件，微型染色体，或一种人工染色体。

载体可以通过任何一种方式来确保自我复制。或者，当转化入宿主细胞时，载体可以整合进基因组并与其整合进的染色体一起复制。而且，可以使用引入宿主细胞基因组的单个载体或质粒或一起包含总DNA的两个或多个载体或质粒，或者一种转座子。

本发明的载体优选含有一或多个可选择的标记，从而能容易地挑选出转化的细胞。可选择的标记是一种基因，其产物能提供杀虫或病毒抗性、重金属耐受性、原养型或营养缺陷型，等等。

细菌的可选标记如来自模式种或地衣芽孢杆菌，或具有抗生素如氨苄西林、卡那徽素、氯霉素或四环素抗性的标记。适用于酵母宿主细胞的可选择标记有ADE1、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于细丝状真菌宿主细胞的可选择标记包括但不局限于amdS(乙酰胺酶)、argA(鸟氨酸氨基甲酰转移酶)、bar(瞵丝菌素乙酰基转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺嘌呤转移酶)和trpC(氨基苯甲酸盐合成酶)，以及它们的等价物。

优选用于曲霉细胞的可选择标记有米曲霉或构巢曲霉的amdS和pyrG基因和吸水链霉菌的bar基因。

本发明的载体优选含有允许载体稳定地整合进宿主细胞基因组或载体在细胞中不依赖于基因组进行自发复制的元件。

为了整合进宿主细胞基因组，载体可以依靠编码多肽的核苷酸序列或载体的其它元件，通过同源或非同源重组稳定地整合进基因组。或者，载体可以含有额外的核苷酸序列用于指导通过同源重组整合进宿主细胞基因组。额外的核苷酸序列使得载体能在染色体上的一个精确的位点被整合进宿主细胞基因组。为了提高在准确位点整合的可能性，整合元件必须优选含有足够数量的核苷酸，例如100至1500个碱基对，优选400至1500个碱基对，和更优选800至1500个碱基对，并且核苷酸序列与相应的靶序列具有很高的同一性能增强同源重组的可能性。整合的元件可以是任一种与宿主细胞内基因组上的靶序列同源的序列。而且，整合的元件可以是非编码或编码核苷酸序列。在另一方面，通过非同源重组可以将载体整合进宿主细胞的基因组中。

为了能自发复制，载体进一步包含一种复制起点使得载体能在所讨论的宿主细胞内自发复制。在细菌中的复制起始点的离子有能在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起始点，以及能在芽孢杆菌中复制的pUB110、PE194、pTA1060和pAMβ1的复制起始点。用于酵母宿主细胞中的复制起始点是2微米的复制起始点ARS1、ARS4、ARS1与CEN3的组合、ARS4与CEN6的组合。复制起始点可以包含一种突变使得它在宿主细胞中具有温度敏感性(参见如Ehrlich，1978，proceedings ofthe national academy of sciences USA 75：1433)。

多于一拷贝的本发明的核苷酸序列可以插入宿主细胞中以提高基因产物的产量。核苷酸序列的拷贝数量的提高可以通过将至少一个额外拷贝的序列整合进宿主细胞基因组来获得，或者额外拷贝的核苷酸序列包括一种可进行扩增选择的标记基因，当细胞含有扩增的可选择标记基因的拷贝时，因此在存在适合的可选择剂时培养细胞可以被挑选出额外拷贝的核苷酸序列。

用于连接上述元件来构建本发明重组表达载体的方法是本领域技术人员所公知的(参见如Sambrook等，1989，supra).

宿主细胞

本发明还涉及含有本发明核酸构建体的重组宿主细胞，可以适用于重组产生多肽。含有本发明核苷酸序列的载体被转化进宿主细胞，这样载体被保持作为一种染色体的整合部分或如前所述的作为一种染色体外自我复制的载体。

宿主细胞可以是一种单细胞微生物，如原核微生物，或是一种非单细胞微生物如真核微生物。

适用的单细胞微生物有细菌细胞如革兰氏阳性细菌包括但不局限于，一种芽孢杆菌细胞，如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂类芽孢杆菌、迟缓芽孢杆菌、地衣形芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌；或一种链霉菌多肽，如变青链霉菌或鼠灰链霉菌；或是一种革兰氏阴性菌，如大肠杆菌或一种假单孢菌。在一个优选方案中，细菌宿主细胞是迟缓芽孢杆菌、地衣形芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌。在另一个优选方案中，细菌宿主细胞是嗜碱芽孢杆菌。

载体导入细菌宿主细胞可以受到原生质体转化的影响(参见如Chang和Cohen，1979，molecular general genetics 168：111-115)，使用全细胞(参见Young和Spizizin，journal of bacteriology 81：823-829；或Dubnau和Davidoff-Abelson，journal of molecular biology 56：209-221)，电穿孔(参见如Shigekawa和Dower，1988，Biortechniques 6：742-751)，或接合作用(参见如Koehler和Thorne，1987，journal ofbacteriology 169：5771-5278)。

宿主细胞可以是真核细胞，例如哺乳动物、昆虫、植物或真菌细胞。

在一个优选方案中，宿主细胞是真菌细胞。这里使用的“真菌”包括Phyla Ascomycota、Basidiomycota、Chytridiomycota和Zygomycota(定义参见Hawksworth等，Ainsworth and Bisby’s dictionary of the fungi，第八版，1995，CAB international，University Press，Cambridge，UK)以及Oomycota(引用于Hawksworth等，1995，supra，171)和所有的有丝分裂孢子真菌(Hawksworth等，1995，supra)。

在一个更优选的方案中，真菌宿主细胞是酵母细胞。这里使用的“酵母”包括ascosporogenous yeast(Endomycetales)，basidiosporogenousyeast，和属于fundi Impefecti(Blastomycetes)的酵母。由于酵母的分类可能在将来发生变化，为了达到本发明的目的，酵母的定义如在Biologyand Activities of Yeast中所描述的(Skinner，F.A.Passmore，S.M.Davenport，R.R.，eds，Soc.App.Bacteriol.Symposium SeriesNo.91980)。

在一个更优选的方案中，酵母宿主细胞是假丝酵母、Aschbyii、Hansenula、克鲁维氏酵母属、毕赤氏酵母属、糖酵母属、裂殖糖酵母属或Yarrowia细胞。

在一个更优选的方案中，酵母细胞是卡尔斯伯糖酵母、啤酒糖酵母、糖化糖酵母、Saccaromyces douglasii、Saccaromyces kluyveri、Saccaromyces norbensis或卵形糖酵母细胞。在另一个更优选的方案中，酵母细胞是乳克鲁维氏酵母细胞。在另一个更优选的方案中，酵母宿主细胞是Yarrowia lipolytica细胞。

在另一个更优选的方案中，真菌细胞是一种细丝状真菌细胞。“细丝状真菌”包括细丝形式的子目Eumycota和Oomycota(定义按Hawksworth等，1995，supra)。细丝状真菌的特征在于由角素、纤维素、葡聚糖、几丁质、甘露聚糖和其它复合多肽组成的菌丝体壁。通过菌丝延长和碳的分解作用的植物生长依赖于氧。相反，通过酵母如啤酒糖酵母的植物生长是通过发出单细胞叶状体芽，其碳的分解是一种发酵。

在一个更优选的方案中，细丝状真菌宿主细胞是一种类的细胞，但不仅仅局限于支顶孢、曲霉、镰孢、毛霉、毁丝霉、链孢霉、青霉或木霉。

在一个最优选的方案中，细丝状真菌宿主细胞是棘孢曲霉、泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑色曲霉或米曲霉细胞。在另一个最优选的方案中，细丝状真菌宿主细胞是杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、玫瑰色镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、Fusarium torulosum、Fusariumtrichothecioides、Fusarium venenatum细胞。在一个甚至最优选的方案中，细丝状真菌宿主细胞是Fusarium venenatum(Nirenberg sp.Nov.)细胞。在另一个最优选的方案中，细丝状真菌宿主细胞是Humicolainsolens、Humicola lanuginosa、米赫毛霉、嗜热毁丝霉、粗糙链孢霉、产紫青霉、Trichoderma harzianum、康宁氏木霉、Trichodermalongibrachiatum、Trichoderma reesei或绿色木霉多肽。

真菌细胞可以通过已知的方法进行转化，包括原生质体形成、原生质体转化和细胞壁的再生。用于曲霉宿主细胞的转化的适合的方法参见EP238023和Yelton等(1984，proceedings of the national academy ofsciences USA 81：1470-1474)。适合于镰孢属转化的方法参见Malardier等，1989，Gene 78：147-156和WO9600787。可以使用Becker和Grarente描述的方法转化酵母(in Abelson，J.N.和Simon，M.l.，editors，Guideto Yeast genetics and molecular biology，methods in enzymology，Volume 194，pp182-187，academic press inc.，New York；Ito等，1983，journal of bacteriology 153：163；和Hinnen等，1978，Proceedingsof the national academy of sciences USA 75：1920)。

生产方法

本发明还涉及生产本发明多肽的方法，包括(a)培养野生型菌株，该菌株适于生产多肽；和(b)回收多肽。优选菌株选自下组所示真菌：支顶孢、小柱孢菌、热子囊菌、草根霉、轮枝孢、新螱、白丝菌、poitrasia、鬼伞、单瑞孢、腐质霉、Cladorrhinum、二孢、毁丝霉、根毛霉、Meripilus、黑耳、炭角菌、长毛盘菌、毛壳霉、Chaetomidium、Sporotrichum、草根霉、曲霉、帚霉、镰孢、假黑盘菌或疫霉；更优选菌株选自下组所示真菌：嗜热支顶孢、嗜热毛壳霉、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、淡黑假黑盘菌或蔓延疫霉。

本发明还涉及生产本发明多肽的方法，包括(a)在适于生产多肽的条件下培养野生型菌株，和(b)将多肽与一种嗜好的底物如有纤维质的底物接触，没有前面多肽的回收。术语“原位产物”意指多肽在在其将要被使用的位置处直接产生，例如在一个用于生产乙醇的发酵过程中。

在本发明的生产方法中，细胞使用本领域已知的方法在适合于生产多肽的营养培养基上培养细胞。例如，细胞可以通过振荡烧瓶培养，实验室里的小范围或大范围发酵(包括连续的、一批、同批或固体阶段发酵)培养或在适宜的培养基中和允许多肽被表达和/或分离的条件下进行工业发酵培养。根据本领域已知方法在适宜的包括碳、氮源和无机盐的营养培养基中进行细胞培养。适合的培养基获自商家或可以根据发表的组合无进行制备(如，in catalogues of the American Type Culture Collection)。如果多肽被分泌进营养培养基，就可以直接从培养基中回收多肽。如果多肽没有分泌，可以从细胞溶解产物中回收多肽。

可以使用本领域已知的特异于多肽的技术来检测多肽。这些检测方法包括使用特异性抗体，形成一种酶产物，或一种酶底物的消失。例如，酶检测可以用于确定上述多肽的活性。

生产的多肽可以通过本领域已知方法来回收。例如，通过但不局限于离心、过滤、提取、喷雾干燥、真空抽干或沉淀这些常规方法可以将多肽从营养培养基中回收。

本发明的多肽可以经过进一步的纯化处理，其中可以使用各种本领域已知的方法包括但不局限于层析(如离子交换，亲和，疏水，层析聚焦，和顺序排除)，电泳方法(如预备等电子聚焦)，差示溶解度(如硫酸铵沉淀)，SDS-PAGE，或抽提(参见如，Protein Purification，J.-C.Janson和Las Ryden，editors，VCH Publishers，New York，1989)。

植物

本发明还涉及转化有编码具有本发明纤维二糖水解酶I活性的多肽的核苷酸序列的转基因植物、植物部分或植物细胞，这样能表达和产生可回收量的的多肽。多肽可以从植物或植物部分中回收。或者，含有重组多肽的植物或植物部分可以用作如提高食物或饲料的质量，如改善营养价值、适口性和流变学特性或破坏抗营养因子。

转基因植物可以是双子叶或单子叶植物，单子叶植物有草，例如牧草(蓝色草，Poa)，草料草例如稻草，Lolium，气候草，例如草类和谷类等，如小麦、燕麦、黑麦、大麦、稻、高梁、栗和玉米。

双子叶植物有烟草，羽扇豆，马铃薯，糖用甜菜，豆类如豌豆、豆和大豆，和十字花科植物(如芸苔)，例如花椰菜、油菜、canola和密切相关的模型微生物Arabidopsis thaliana。

植物部分可以是茎、愈合组织、叶、根、果实、种子和块茎。还有特异的植物组织如叶绿体、质外体、线粒体、空泡、过氧物酶体和细胞质也被认为是植物部分。而且，任何一种植物细胞，不管其组织来源，均被认为是一植物部分。

在本发明的范围内还包括这种植物、植物部分和植物细胞的后代(克隆或种子)。

表达本发明多肽的转基因植物或植物细胞可以通过本领域已知的方法构建。简要地，可以通过转化进植物宿主基因组一或多个编码本发明多肽的表达结构构建植物或植物细胞，然后繁殖由此产生的修饰过的植物或植物细胞形成转基因植物或植物细胞。

便利地，表达结构是含有编码一种本发明多肽的核苷酸序列的核酸构建体，其中核苷酸序列与在所选植物或植物部分中表达核苷酸序列所需的适宜调节序列可操作地相连。而且，表达结构可以包含用于鉴别表达结构整合进的宿主细胞和将结构导入进所讨论植物必需的DNA序列(后者依赖于所使用的DNA导入的方法)。

在选择调节序列例如启动子和终止子序列和任意的信号或转运序列时需要考虑，例如希望多肽在什么时候、什么地点和怎样表达。例如，编码本发明多肽的基因的表达可以是组成型的或诱导型的，或可以是发展性的、阶段性的或细胞特异性的，和基因产物可以靶向一种特定的组织或植物部分例如种子或叶子。调节序列如参见Tague等的描述(1988，plantphysiology 86：506)。

35S-CaMV启动子可用于组成型表达(Franck等，1980，cell 24：285-294)。器官特异性的启动子可以来自如储水组织如种子、马铃薯块茎和果实(Edwards & Coruzzi，1990，Ann.Rev. Genet.24：275-303)，或来自水代谢组织如分裂组织(Ito等，1994，Plant Mol.Biol.24：863-878)，一种种子特异性的启动子例如来自鼠的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(Wu等，1988，Plant and Cell Physiology 39：885-889)，来自豆球蛋白B4和Vicia faba的一种未知种子基因的Vicia faba启动子(Conrad等，1998，journal of Plant Physiology 152：708-711)，一种来自种子油体蛋白的启动子(Chen等，1998，Plant and Cell Physiology39：935-941)，来自Brassica napus的贮存蛋白napA启动子，或任何其它本领域已知的种子特异性启动子，如在WO91/14772中所描述的那些。而且，启动子可以是一种叶子特异性启动子如来自鼠或马铃薯的rbcs启动子(Kyozuka等，1993，Plant Physiology 102：991-1000)，绿藻病毒腺嘌呤甲基转移酶基因启动子(Mitra and Higgins，1994，Plant MolecularBiology 26：85-93)，或是来自鼠的aldP基因(Kagaya et al.，1995，Molecular and general genetics 248：668-674)，或一种伤口诱导型启动子例如马铃薯pin2启动子(Xu et al.，1993，Plant Molecular Biology22：573-588)。

一种启动子增强元件还可以用于获得酶在植物中的高表达。例如，启动子增强子元件可以是一种置于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如，Xu等1993年在supra上公开了鼠肌动蛋白1基因的第一个内含子可用于增强表达。

可选择的标记基因和任何其它部分表达结构可以选自那些可获得的文献。

核酸构建体可以根据本领域已知的常规技术被导入植物基因组中，其中包括土壤杆菌介导的转化，病毒介导的转化，显微注射，粒子轰击，抗生素转化和电穿孔(Gasser等，1990，Science 244：1293；Potrykus，1990，Bio/Technology 8：535；Shimamato等，1989，Nature 338：274)。

目前，土壤杆菌介导的基因转化是用于产生转基因双子叶植物时选择的方法(参见Hooykas和Schilperoort，1992，Plant Molecular Biology19：15-38)。然而，该方法还可用于转化单子叶植物，虽然其它转发方法一般优选用于这些植物。目前，选择用于产生转基因单子叶植物的方法是粒子轰击(包被有转化DNA的显微的金或钨微粒)胚胎calli或发育的胚胎(Christou，1992，Plant journal 2：275-281；Shinmamoto，1994，Current Opinion Biotechnology 5：158-162；Vasil等，1992，Bio/Technology 10：667-674)。转化单子叶植物的一种替代方法基于原生质体的转化，如Omirulleh等描述的(1993，Plant Molecular Biology 21：415-428)。

转化后，根据本领域公知的技术将导入了本发明表达结构的转化体挑选出来并再生成完整的植物。

本发明还涉及生产本发明多肽的方法，包括：(a)在适合多肽生产的条件下培养含有编码本发明具有纤维二糖水解酶I活性多肽的核苷酸序列的转基因植物或植物细胞；和(b)回收多肽。

本发明还涉及原位生产本发明多肽的方法，包括：(a)在适合多肽生产的条件下培养含有编码本发明具有纤维二糖水解酶I活性多肽的核苷酸序列的转基因植物或植物细胞；和(b)将多肽与一种嗜好的底物如有纤维质的底物接触，没有前面多肽的回收。

组合物

在一个更进一步的方面，本发明涉及含有本发明多肽的组合物。

组合物可以包含一种本发明的多肽作为主要的酶促成分，如单成分合成物。或者，组合物可以具有多种酶促活性，例如作为一种氨基肽酶、淀粉酶、糖酶、羧肽酶、过氧化物酶、纤维素酶、几丁质酶、角质酶、环式糊精糖基转移酶、脱氧核糖核酸酶、脂肪酶、α-葡萄糖苷酶、葡糖淀粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、环过氧化物酶、转化酵素、漆酶、甘露糖苷酶、氧化酶、果胶酶、肽聚糖酶、过氧化物酶、肌醇六磷酸酶、蛋白水解酶、核糖核酸酶、转糖苷酶或木聚糖酶。

组合物可以根据本领域已知的方法来制备并形成液体或干燥形式的组合物。例如，多肽组合物可以形成颗粒或微粒的形式。包含在组合物中的多肽可以通过本领域已知技术进行稳定。

以下给出的是本发明多肽组合物优选的用途。本发明多肽组合物的剂量和其它有关在何种条件下使用组合物可以根据本领域已知方法进行确定。

去污剂组合物

本发明的多肽可以作为一种去污剂组合物成分被添加。

本发明的去污剂组合物可以制备成如一种人工或机械洗衣去污剂组合物，其中包括一种适合于对沾污的织物进行预处理的洗衣添加剂和一种织物柔顺漂洗剂，或制备成一种用于普通家庭坚硬表面请洗操作时的去污剂组合物，或是制备成一种人工或机械洗碗剂。

在一个优选的方面，本发明提供了一种含有本发明多肽的去污添加剂。和去污剂组合物一样去污添加剂可以包含一或多种其它的酶如蛋白酶，脂肪酶，角质酶，淀粉酶，糖酶，纤维素酶，果胶酶，甘露糖酶，阿拉伯糖酶，半乳糖酶，木聚糖酶，和氧化酶，如漆酶，和/或过氧化物酶。

一般来说所选酶的特性必须与所选去污剂组合物相适应，(如最佳PH值、和其它酶促和非酶促成分的相容性，等等)，并且酶必须以有效量存在。

蛋白酶：合适的蛋白酶包括那些动物、植物或微生物来源的。微生物来源是优选的。其中包括了那些化学修饰的酶或蛋白工程化变异体。蛋白酶可以是一种丝氨酸蛋白酶或金属蛋白酶，优选是一种嗜碱性微生物蛋白酶或类胰岛素蛋白酶。嗜碱性蛋白酶如枯草杆菌蛋白酶，尤其是那些来自芽孢杆菌属的，如枯草杆菌蛋白酶Novo，枯草杆菌蛋白酶Carlsberg，枯草杆菌蛋白酶309，枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(WO89/06279中描述的)。类胰岛素蛋白酶如胰岛素(如猪或牛来源的)和在WO89/06270和WO94/25583中所描述的镰孢属蛋白酶。

有用的蛋白酶如在WO92/19729、WO98/20115、WO98/20116和WO98/34946中公开的变异体，尤其是那些在以下一或多个位点发生取代的变异体：27、36、57、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。

脂肪酶：适合的脂肪酶包括那些细菌或真菌来源的，其中包括化学修饰的和蛋白工程化变异体。适合的脂肪酶包括来自腐质酶(synonymthermomyces)，如EP258068和EP305216中公开的来自H.Lanuginosa(T.Lanuginosus)或WO96/13580中公开的来自H.Insolens的脂肪酶，一种假单胞菌脂肪酶，如来自P.Alcaligenes或类产碱假单胞菌(EP218272)、葱头假单胞菌(EP331376)、司徒茨氏假单胞菌(GB1372034)、荧光假单胞菌、假单胞菌种菌株SD705(WO95/06720和WO96/27002)、P.Wiscomsinensis(WO9612012)的脂肪酶，一种芽孢杆菌属脂肪酶，如来自枯草芽孢杆菌(Dartois等，1993，Biochemica et Biophysica Acta，1131，253-360)、嗜热脂肪芽孢杆菌(JP64/74492)或短小芽孢杆菌(WO91/16422)的脂肪酶。

其它脂肪酶变异体如那些在WO92/05249、WO94/01541、EP407225、EP260105、WO9535381、WO9600292、WO95/30744、WO9425578、WO95/14783、WO97/04079和WO97/07202中公开的。

淀粉酶：适合的淀粉酶(α和/或β)包括细菌或真菌来源的那些，其中包括了化学修饰的或蛋白工程化的变异体。淀粉酶包括如获自芽孢杆菌如GB1296839中详细描述的地衣型芽孢杆菌特定菌株的α-淀粉酶。

有用的淀粉酶如WO9402597、WO9418314、WO9623873和WO9743424中描述的变异体，尤其是在以下一或多个位点发生取代的变异体：15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。

纤维素酶：适合的纤维素酶包括细菌或真菌来源的那些，其中包括了化学修饰的或蛋白工程化的变异体。适合的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、草根霉属、支顶孢属，如真菌纤维素酶产自Humicola Insolens、嗜热毁丝霉和尖胞镰孢，这些公开于US4435307、US5648263、US5691178、US5776757和WO8909259。

特别适合的纤维素酶是具有颜色偏好特性的嗜碱性或嗜中性纤维素酶。这种纤维素酶如EP0495257、WP0531372、WO9611262、WO9629397和WO9808940中公开的那些。其它纤维素酶变异体如在WO9407998、EP0531315、US5457046、US5686593、US5763254、WO9524471、WO9812307和PCT/DK98/00299中公开的那些。

过氧化物酶/氧化酶：适合的过氧化物酶/氧化酶包括细菌或真菌来源的那些，其中包括了化学修饰的或蛋白工程化的变异体。有用的多氧化物酶包括来自Coprinus如C.Cinereus和其变异体的多氧化物酶，这些在WO9324618、WO9510602和WO9815257中公开了。

去污剂酶可以包含在去污剂组合物组合物中，这可以通过加入含有一或多种酶的分离剂实现，或通过加入一种含有所有这种酶的组合添加剂获得。本发明的一种去污添加剂，如分离剂或组合添加剂可以被制备成如一种颗粒、液体、泥浆等。优选的去污添加剂制品可以是颗粒，优选无尘颗粒、液体，优选稳定的液体、泥浆。

无尘颗粒可以如按照US4106991和US4661452中公开的万法生产并可任意地根据本领域已知的方法进行包封。蜡制包衣材料如重约1000至2000平均分子量的聚(环氧乙烷)产物(聚乙二醇，PEG)；具有16至50个环氧乙烷单位的乙氧基化壬基苯；其中乙醇含有12至20个碳原子和其中有15至80个环氧乙烷单位的乙氧基化脂肪族乙醇；脂肪族乙醇；脂肪酸；和单和双和三甘油酯。适合于通过流化床技术应用的膜形成包衣原料在GB1483591中给出了。液体酶制品可以被稳定，如根据已建立的方法加入多羟基化合物如丙二醇，糖或糖乙醇，乳酸或硼酸。受保护的酶可以通过EP238216公开的方法制备。

本发明的去污剂组合物可以以任何一种便利的形式存在，如药条、药片、粉末、颗粒、药贴或一种液体。液体去污剂组合物可以是水溶性的，通常含有至多70％的水和0-30％的有机溶剂，或是非水性的。

去污剂组合物包含一或多种表面活性剂，可以是非离子包括半极性和/或阴离子和/或阳离子和/或两极性的表面活性剂。表面活性剂通常以0.1％至60％的重量水平存在。

当包括在其中时，去污剂组合物常含有约1％至约40％的阴离子表面活性剂例如线性烷基苯磺酸盐，α-石蜡磺酸盐，烷基硫酸盐(脂肪族乙醇硫酸盐)，乙醇乙氧基硫酸盐，二级烷磺酸盐，α-磺酰脂肪酸甲基酯，烷-或烯烃琥珀酸或肥皂。

当包括在其中时，去污剂组合物通常含有从约0.2％至约40％的非离子表面活性剂，例如脂肪醇乙氧基化物，壬基苯乙氧基化物，烷基聚配糖，烷基甲胺氧化物，乙氧基化的脂肪酸单乙醇酰胺，脂肪酸单乙醇酰胺，聚羟基烷基脂肪酸胺，或葡糖胺的N-酰基N-烷基衍生物(“glucamides”)。

去污剂组合物可以含有0-65％的去污剂组合物助洗剂或复合剂，例如沸石，二磷酸，三磷酸，磷酸盐，碳酸盐，柠檬酸盐，次氮基三乙酸，乙二胺四乙酸，二乙烯基三胺五乙酸，烷基-或烯烃琥珀酸，可溶性硅酸盐或分层的硅酸盐(如来自Hoechst的SKS-6)。

去污剂组合物可以包含一或多种聚合体，如羧甲基纤维素，聚乙烯吡咯烷酮，聚乙二醇，聚乙烯醇，聚乙烯基嘧啶-N-氧化物，聚乙烯基咪唑，聚羧酸盐如聚丙烯酸盐，马来酸/丙烯酸共聚物和月桂酸异丁烯酸盐/丙烯酸共聚物。

去污剂组合物可以包含一种漂白体系，其中包括一种H2O2来源如过硼酸盐或过碳酸盐，它们可以与过酸构成的漂白活化因子如四乙酰基乙二胺或壬酰苯酚磺酸盐。或者，漂白体系可以包含如氨化物、酰亚胺或砜的过氧酸。

本发明去污组合物中的酶可以通过使用常规稳定剂使之稳定，稳定剂如一种多羟基化合物如丙二醇或甘油，一种糖或糖醇，乳酸，硼酸或硼酸衍生物，如一种芳香族硼酸酯，或一种苯基硼酸衍生物如4-甲酸基苯基硼酸，并且该组合物可以根据如WO92/19709和WO92/19708中描述的方法制备。

去污剂组合物还可以含有常规的去污剂组合物成分如织物调节剂，其中包括粘合成分，起泡剂，泡沫抑制剂，抗腐蚀剂，油悬浮剂，抗油再沉淀剂，染料，杀虫剂，光学增白剂，助水溶物，失去光泽的抑制因子或香味素。

目前已经预期了去污剂组合物中的任何一种酶，优选本发明的多肽，可以以相应于每升洗液含0.01-100mg酶蛋白的量被加入，优选每升洗液含0.05-5mg酶蛋白，优选每升洗液含0.1-1mg酶蛋白。

本发明的多肽还可以额外地加入WO97/07202中公开地去污剂组合物制品中，该文献引入本文作为参考。

DNA重组(改组)

以下核苷酸序列可用于DNA重组(或改组)过程：SEQ ID NO：1，SEQ IDNO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ IDNO：13，SEQ ID NO：15，SEQ ID NO：17，SEQ ID NO：19，SEQ ID NO：21，SEQID NO：23，SEQ ID NO：25，SEQ ID NO：27，SEQ ID NO：29，SEQ ID NO：31，SEQ ID NO：33，SEQ ID NO：35，SEQ ID NO：37，SEQ ID NO：39，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47，SEQ ID NO：49，SEQ ID NO：51，SEQ ID NO：53，SEQ ID NO：55，SEQ ID NO：57，SEQ ID NO：59，SEQ ID NO：61，SEQ ID NO：62，SEQ ID NO：63，SEQ ID NO：64，SEQ ID NO：65，SEQ ID NO：67。由该过程获得的新的核苷酸序列可以编码具有改进的纤维二糖酶活性的新的多肽，如改进的稳定性(储存稳定性，热稳定性)，改进的特异性活性，改进的最适PH值，和/或改进的对特异性化合物的耐受力。

在两个或多个同源输入的多核苷酸(起始点多核苷酸)之间的改组包括打断核苷酸和重组片段，从而获得输出的多核苷酸(如已经经过改组循环)，其中核苷酸片段的数目与输入的多核苷酸相比发生了变化。

DNA重组或改组可以是(部分地)随机过程，其中设想的基因文库获自两个或多个起始基因。许多已知形式可以用于实施该改组或重组过程。

该过程可包括随机打断亲代DNA，接着通过PCR的重新接合形成新的全长基因，如在US5605793、US5811238、US5830721、US6117679中公开的。基因的体外重组可以按照US6159687、WO98/41623、US6159688、US5965408和US6153510中描述的方法进行。重组过程可以在活细胞内发生，如参见WO97/07205和WO98/28416。

亲代DNA可以通过脱氧核糖核酸酶I处理或限制性内切核酸酶的消化形成片段，方法参见Kikuchi等(2000a，Gene 236：159-167)。两亲代之间的改组可以通过改组两亲代中单一的标准亲代链来进行，参见Kikuchi等(2000b，Gene 243：133-137)。

一种特别的改组方法是根据Grameri等描述的方法(1998，Nature，391：288-291和Ness等，Nature Biotechnology 17：893-896)。另一种形式是在US6159687中的实施例1和2描述的方法。

从生物质生产乙醇

本发明还涉及从生物质如有纤维质的原料中生产乙醇的方法，其中包括生物质与本发明的多肽接触。乙醇可以基本上被回收。本发明的多肽可以通过在适合于生产本发明多肽的条件下培养宿主细胞或菌株而“原位”获得，如作为乙醇生产过程的一部分或直接就是该过程，其中宿主细胞或菌株以适合于生产该多肽的野生形式存在。

乙醇可以通过对生物质进行酶促降解并将释放的多糖转化为乙醇来生产。这种乙醇常常指生物乙醇或生物燃料。它可以被用作一种以从少于1％至高达100％的量混合的燃料添加剂或混合剂(一种燃料替代品)。在某些国家，例如在巴西，乙醇在很大程度上替代了汽油。

生物质的初级细胞壁中的主要多糖是纤维素，第二最多的是半纤维素，第三位的是胶质。在细胞停止生长后产生的次级细胞壁还含有多糖，并且经由聚合木质素与半纤维素的共价交联连接加固了。虽然通过取代光谱发现在半纤维素复杂的分枝结构中包括了各种化合物，如木聚糖，xyloglucans，树胶醛木聚糖，和甘露聚糖，但纤维素是一种纤维二糖酐的同源聚合体，并且是一种线性的β-(1-4)-D-葡聚糖。虽然纤维素具有多种形态，但在植物组织中它首先是被作为一种不可溶的并联葡聚糖链的结晶基体。半纤维素通常与纤维素以氢键连接，就如与其它半纤维素一样，这样能帮助稳定细胞壁基体。

三种主要类别的纤维素酶被用于分裂生物质：

·内切-1，4-β-葡聚糖酶或1，4-β-D-葡聚糖-4-葡聚糖水解酶(EC3.2.1.4)，它们能随机作用于可溶的和不可溶的1，4-β-葡聚糖底物。

·外切-1，4-β-D-葡聚糖酶包括1，4-β-D-葡聚糖葡聚糖水解酶(EC3.2.1.74)，该酶能从1，4-β-D-葡聚糖中释放出D-葡萄糖并且可以缓慢水解D-纤维二糖，和1，4-β-D-葡聚糖纤维二糖水解酶(EC 3.2.1.91)，也被称为纤维二糖水解酶I，它能从1，4-β-葡聚糖中释放出纤维二糖。

·β-D-葡糖苷酶或β-D-葡糖苷葡聚糖水解酶(EC 3.2.1.21)，它们能从纤维二糖和可溶性的纤维糊精中释放出D-葡萄糖单元，一种配糖的排列。

这三类酶在复合体中相互配合相互影响，从而能从生物质中有效地去结晶和水解天然的纤维素，产生能通过发酵转化为乙醇的还原糖类。

本发明通过一下实施例作进一步的描述，但不作为一种对本发明保护范围的限制。

实施例

用作缓冲液和底物的化学制品均是试剂等级的商品。

实施例1

克隆部分和全长的纤维二糖水解酶I(CBH1)的DNA序列

棉色二孢的cDNA文库被用于PCR筛选找出存在的CBH1基因。为了该目的，基于CBH1蛋白中保守区域的序列排列和标识设计了一套引物。通过凝胶电泳得到的PCR条带被用于获得来自棉色二包CBH1基因的部分序列。同源性研究证实了该部分序列是CBH1基因的部分序列(EC 3.2.1.91)。

通过访问专利保藏号CBS 247.96，进行DNA或cDNA制备，使用部分序列作为构建特异性引物的基础，并通过标准的PCR克隆技术一步步地得到棉色二孢的全长CBH1基因。

其它几种可以使用的方法：

·可以对cDNA文库或用于构建文库的cDNAs进行PCR筛选。为了这样做，基因特异性引物(GSP)和载体/连接物引物分别构建自CBH1基因的部分cDNA序列和自载体/连接物；两套引物均被设计成朝向(go outward into)CBH1基因cDNA缺失的5′和3′区。通过使用组合的GSP和载体/连接物引物获得的最长的PCR产物代表了来自棉色二孢CBH1 cDNA全长的5′和3′区。与部分cDNA序列的同源研究和比较证实了5′和3′PCR产物属于相同的棉色二孢CBH1 cDNA。使用构建自5′和3′端的引物组进行PCR可以获得全长的cDNA。

·或者，使用标准杂交技术并将部分cDNA序列作为探针可以从cDNA文库中筛选出全长cDNA。给出与探针阳性杂交信号的克隆被纯化并进行测序来确定最长的cDNA序列。同源研究和比较证实了全长cDNA对应于最初用作探针的部分CBH1 cDNA序列。

上述的两种方法基于全长CBH1 cDNA序列存在于cDNA文库或用于构建文库的cDNAs中。或者，5′和3′端示踪(RACE，cDNA末端的快速扩增)技术或衍生技术可以用于鉴别缺失的5′和3′区。为了该目的，优选分离出棉色二孢的mRNAs，并使用含有寡(dT)-的连接物引物或5′-基因特异性引物(GSP)的将之用于合成cDNAs的第一条链。

获自棉色二孢CBH1基因的全长cDNA还可以通过利用棉色二孢的基因组DNA获得。CBH1基因可以通过PCR技术鉴别出，例如上述的一种方法或使用杂交技术和部分CBH1 cDNA探针通过标准的基因组文库筛选出该基因。与部分cDNA序列的同源研究和比较证实了基因组序列对应于棉色二孢CBH1基因。对保守序列如作为转录的起始位点、起始和终止密码子或多聚腺苷酸位点进行鉴别，该结果可以被用于确定包含全长cDNA的区域。然后利用构建自该区的5′和3′端的引物从源自棉色二孢的mRNA和cDNA文库中扩增出全长的cDNA(如上)。

通过在适合的表达宿主构建体中表达全长基因，CBH1酶可以作为胞内酶或胞外酶从培养基中回收。

上述的方法可以应用于从所有的生物体而不只局限于棉色二孢中克隆出纤维二糖水解酶I的DNA序列。

实施例2

纤维二糖水解酶I(CBH1)的活性

纤维二糖水解酶I的特征在于相比于其它纤维素酶能非常有效地水解高度结晶的纤维二糖。纤维二糖水解酶I以PASC(磷酸膨胀纤维素，phosphoric acid swollen cellulose)为底物时比以CMC为底物时具有更高的催化活性。为了达到本发明的目的，下述任何一种测定方法均可用于鉴别纤维二糖水解酶I：

对偶氮-微晶纤维素(Azo-Avicel)的活性

根据操作手册使用氮-微晶纤维素(Megazyme，Bray Business Park，Bray，Wicklow，Irelang)。

对PNP-β-纤维二糖的活性

底物溶液：5mM PNPβ-D-纤维二糖(p-硝基苯β-d-纤维二糖糖苷SigmaN-5759)溶于0.1M醋酸钠缓冲液，PH 5.0；

终止试剂：0.1M碳酸钠，PH 11.5；

50μL CBH1溶液与1mL底物溶液混合并于40℃温育20分钟。加入5mL终止试剂终止反应。测定404nm时的吸光度。

对PASC和CMC的活性

底物被纤维二糖水解酶I(CBH1)降解成还原的糖类。一种Microdochiumnivale的碳水化合物氧化酶(rMnO)或另外等价的氧化酶在O₂存在时作用于还原的糖产生H₂O₂。在存在额外的过氧化物酶时形成的H₂O₂激活了氧化浓缩的4-氨基安替比林(AA)和N-乙烷基-N-磺酸丙烷基(sulfopropyl)-m-甲苯胺(TOPS)，形成了一种可通过在550nm处吸光度进行定量的紫色产物。

当所有的成分除了CBH1外有剩余时，吸光度的增加与CBH1活性成正比例。反应是一级动力学反应，并可以在一种Cobas Fara离心分析仪(Hoffmann La Roche)上或其它等价的能稳定测定状态动力学(steadystate kinetics)的分光光度计上自动进行。

缓冲液：50mM醋酸钠缓冲液(PH5.0)；

试剂：rMnO氧化酶，纯化的Microdochium nivale的碳水化合物氧化酶2mg/L(终浓度)；

过氧化物酶，SIGMA P-8125(96U/mg)，25mg/L(终浓度)；

4-氨基安替比林，SIGMA A-4382，200mg/L(终浓度)；

TOPS，SIGMA E-8506，600mg/L(终浓度)；

PASC或CMC(见下)，5g/L(终浓度)。

所有的试剂以上面提示的浓度加入缓冲液并充分混合试剂溶液。

50μL纤维二糖水解酶I样品(经合适的稀释)与300μL的试剂溶液混合并于40℃温育20分钟。检测紫颜色的形成并测定550nm处的吸光度。

AA/TOPS冷凝物吸收系数是0.01935A₅₅₀/(μM cm)。根据OD₅₅₀/min和吸收系数计算速率为每分钟产生μmols还原糖。

PASC

原料：5gAvicel_(Art.2331 Merck)；

150mL 85％正-磷酸(Art.573 Merck)；

800mL丙酮(Art.14 Merck)；

约2升去离子水(Milli-Q)；

1L玻璃烧杯；

1L玻璃过滤漏斗；

2L抽气细颈瓶；

Ultra Turrax Homogenizer。

丙酮和正-磷酸在冰上冷却。Avicel_用水弄湿，然后加入150mL冰冷的85％的正-磷酸。混合物置于冰浴中轻微搅拌一个小时。

加入500mL冰冷的丙酮并搅拌，将混合物转入一玻璃过滤漏斗并用3×100mL冰冷的丙酮冲洗，每次洗时尽量吸干。用2×500mL水(或直到没有丙酮的气味)，每次洗时尽量吸干。

将固体重悬于水中至总体积为500mL，使用一种Ultra Turrax匀浆器均匀混合物。湿保存在冰箱中，使用缓冲液通过离心平衡，使用前重悬。

CMC

不纯形式的细菌纤维素微原纤维(microfibrils)获自日本食物“natade coco”(Fujico Company，Japan)。将350g这种产品的纤维素悬于4L自来水中进行纯化。每天两次用新鲜的水置换，连续4天。

然后用1％(w/v)的NaOH替代水，产品重悬于碱性溶液，每天更换两次共4天。用蒸馏水漂洗纤维素来中和溶液直至产品表面的PH值为中性(PH7)。

纤维素被微原纤维化，通过在韦林氏搅切器中将纯化的纤维素微原纤维匀化30分钟获得一种单独的细菌纤维素微原纤维悬浮液。通过将悬浮液对去离子水透析过孔膜进一步纯化纤维素微原纤维，分离和纯化的纤维素微原纤维以水悬浮液的形式保存于4℃。

保藏的生物材料

中国普通微生物保藏中心(CGMCC)

下列微生物材料已经根据布达佩斯条约在中国普通微生物保藏中心(CGMCC)进行了保藏，中科院微生物所，海淀，北京100080，中国：

保藏号： CGMCC No.0584

申请人证明： ND000575

保藏日期： 2001-05-29

说明：在质粒上的嗜热支顶孢CBH 1基因

分类：子囊菌门；Sordariomycetes；Hypocrales；Hypocreceae

来源：中国，1999

相关序列： SEQ ID NO：1和SEQ ID NO：2(编码一种来自于嗜热

支顶孢的纤维二糖水解酶I的DNA序列和相应的蛋白

序列)。

保藏号： CGMCC No.0581

申请人证明： ND000548

保藏日期： 2001-05-29

说明：在质粒上的嗜热毛壳酶CBH 1基因

分类：子囊菌门；Sordariomycetes，Sordariales，

Chaetomiaceae

来源：中国，1999

相关序列： SEQ ID NO：3和SEQ ID NO：4(编码一种来自于嗜热

毛壳酶的纤维二糖水解酶I的DNA序列和相应的蛋白

序列)。

保藏号： CGMCC No.0585

申请人证明： ND001223

保藏日期： 2001-05-29

说明：在质粒上的小柱孢菌CBH 1基因

分类：子囊菌门；有丝分裂孢子真菌

来源：中国，1999

相关序列： SEQ ID NO：5和SEQ ID NO：6(编码一种来自于小柱

孢菌种的纤维二糖水解酶I的DNA序列和相应的蛋白序

列)。

保藏号： CGMCC No.0582

申请人证明： ND000549

保藏日期： 2001-05-29

说明：连接在质粒上的橙黄色热子囊菌CBH 1基因

分类： Eurotiomycetes，Eurotiales，Trichocomaceae

来源：中国

相关序列： SEQ ID NO：7和SEQ ID NO：8(编码一种来自于橙黄

色热子囊菌的纤维二糖水解酶I的DNA序列和相应的

蛋白序列)。

保藏号： CGMCC No.0583

申请人证明： ND001182

保藏日期： 2001-05-29

说明：连接在质粒上的Thielavia australiensis CBH1基

因

分类：子囊菌门，Sordariomycetes，Sordariales，

Chaetomiaceae

来源：中国，1998

相关序列： SEQ ID NO：9和SEQ ID NO：10(编码一种来自于

Thielavia australiensis的纤维二糖水解酶I的DNA

序列和相应的蛋白序列)。

保藏号： CGMCC No.0580

申请人证明： ND001182

保藏日期： 2001-05-29

说明：连接在质粒上的Melanocarpus albomyces CBH 1基

因

分类：子囊菌门，Sordariomycetes，Sordariales

来源：中国，1999

相关序列： SEQ ID NO：15和SEQ ID NO：16(编码一种来自于

Melanocarpus albomyces的纤维二糖水解酶I的DNA

序列和相应的蛋白序列)。

保藏号： CGMCC No.0748

申请人证明： ND001181

保藏日期： 2002-06-07

说明：连接在质粒上的支顶孢CBH 1基因

分类：有丝分裂孢子的子囊菌纲

来源：中国，2000

相关序列： SEQ ID NO：53和SEQ ID NO：54

保藏号： CGMCC No.0749

申请人证明： ND000577

保藏日期： 2002-06-07

说明：连接在质粒上的Chaetomidium pingtungium CBH 1

基因

分类： Chaetomiaceae，Sordariales，Ascomycota

来源：中国，2000

相关序列： SEQ ID NO：55和SEQ ID NO：56

保藏号： CGMCC No.0747

申请人证明： ND001175

保藏日期： 2002-06-07

说明：连接在质粒上的Sporotrichum pruinosum CBH 1基

因

分类： Meruliaceae，Sterealesales，担子菌门

来源：中国，2000

相关序列： SEQ ID NO：57和SEQ ID NO：58

保藏号： CGMCC No.0750

申请人证明： ND000571

保藏日期： 2002-06-07

说明：连接在质粒上的嗜热小柱孢菌CBH 1基因

分类：子囊菌门，有丝分裂孢子真菌

来源：中国，2000

相关序列： SEQ ID NO：59和SEQ ID NO：60

真菌菌种保藏中心(CBS)

下列微生物材料已根据布达佩斯条约在真菌菌种保藏中心(CBS)进行了保藏，Uppsalalaan 8，3584 CT Utrecht，荷兰(或者P.O.Box85167，3508AD Utrecht，荷兰)。

保藏号： CBS 109513

申请人证明： ND000538

保藏日期： 2001-06-01

说明：幼嫩轮枝孢

分类：子囊菌门，Hypocreceae，核菌类(有丝分裂孢子)

来源： -

相关序列： SEQ ID NO：11和SEQ ID NO：12(编码一种来自于幼

嫩轮枝孢的纤维二糖水解酶I的DNA序列和相应的蛋白

序列)。

保藏号： CBS 819.73

申请人证明： ND000533

保藏日期：公众可获得的(非申请人保藏)

说明：产黑色腐质酶

分类： Sordariaceae，Sordariales，Sordariomycetes，

子囊菌门

来源： -

相关序列： SEQ ID NO：18(编码来自于产黑色腐质酶的纤维二糖

水解酶I的部分DNA序列)。

保藏号： CBS 427.97

申请人证明： ND000530

保藏日期： 1997-01-23

说明： Cladorrhinum foecundissimum

分类： Sordariaceae，Sordariales，Sordariomycetes，子

囊菌门

来源：牙买加

相关序列： SEQ ID NO：19(编码Cladorrhinum foecundissimum

纤维二糖水解酶I的部分DNA序列)。

保藏号： CBS 247.96

申请人证明： ND000534和ND001231

保藏日期： 1996-03-12

说明：棉色二孢

分类： Dothideaceae，Dothideales，Dothideomycetes，

子囊菌门

来源：印尼

相关序列： SEQ ID NO：20(编码棉色二孢纤维二糖水解酶I的部

分DNA序列)，SEQ ID NO：37(编码棉色二孢纤维二糖

水解酶I的全长DNA序列)和SEQ ID NO：38(棉色二孢

纤维二糖水解酶I的全长蛋白序列)。

保藏号： CBS 117.65

申请人证明： ND000536

保藏日期：公众可得到的

说明：嗜热毁丝霉

分类： Sordariaceae，Sordariales，Sordariomycetes，子

囊菌门

来源： -

相关序列： SEQ ID NO：21(编码来自于嗜热毁丝霉的纤维二糖水

解酶I的部分DNA序列)。

保藏号： CBS 109471

申请人证明： ND000537

保藏日期： 2001-05-29

说明：微小根毛霉

分类：毛霉菌科，毛霉菌属，接合菌门

来源：丹麦

相关序列： SEQ ID NO：22(编码来自于微小根毛霉的纤维二糖水

解酶I的部分DNA序列)。

保藏号： CBS 521.95

申请人证明： ND000542

保藏日期： 1995-07-04

说明： Meripilus giganteus

分类： Rigidiporaceae，Hymenomycetales，Basidiomycota

来源：丹麦，1993

相关序列： SEQ ID NO：23(编码来自于Meripilus giganteus的

纤维二糖水解酶I的部分DNA序列)。

保藏号： CBS 277.96

申请人证明： ND000543，ND001346和ND001243

保藏日期： 1996-03-12

说明：黑耳

分类： Exidiaceae，Auriculariales，层菌纲，担子菌目

来源：丹麦，1993

相关序列： SEQ ID NO：24(编码来自于黑耳的纤维二糖水解酶I

的部分DNA序列)，SEQ ID NO：45(编码来自于黑耳的

具有CBD的纤维二糖水解酶I的全长DNA序列)，SEQ ID

NO：46(来自于黑耳的具有CBD的纤维二糖水解酶I的

全长蛋白序列)，SEQ ID NO：47(编码来自于黑耳的纤

维二糖水解酶I的全长DNA序列)，SEQ ID NO：48(编

码来自于黑耳的纤维二糖水解酶I的全长蛋白序列)。

保藏号： CBS 284.96

申请人证明： ND000544和ND001235

保藏日期： 1996-03-12

说明：块团炭角菌

分类： Sordariaceae，Sordariales，Sordariomycetes，

子囊菌门

来源：丹麦，1993

相关序列： SEQ ID NO：25(编码来自于块团炭角菌的纤维二糖水

解酶I的部分DNA序列)，SEQ ID NO：43(编码来自于

块团炭角菌的纤维二糖水解酶I的全长DNA序列)，SEQ

ID NO：44(编码来自于块团炭角菌的纤维二糖水解酶I

的全长蛋白序列)。

保藏号： CBS 804.70

申请人证明： ND001227

保藏日期：公众可获得的

说明： Trichophaea saccata

分类：子囊菌门，Pezizomycetes，盘菌目，Pyronemataceae

相关序列： SEQ ID NO：36(编码来自于Trichophaea saccata的

纤维二糖水解酶I的部分DNA序列)。

德意志微生物保藏中心(DSMZ)

下列微生物材料已经根据布达佩斯条约在德意志微生物保藏中心(DSM)进行了保藏，Mascheroder Weg 1b，38124 Braunschweig，德国：

保藏号： DSM 14348

申请人证明： ND000551

保藏日期： 2001-06-13

说明：与质粒连接的栗色新螱，白蚁CBH1基因

分类： -

相关序列： SEQ ID NO：13和SEQ ID NO：14(编码来自于栗色新

螱内脏细胞或微生物的纤维二糖水解酶I的DNA序列

及其相应的蛋白序列)。

保藏号： DSM 15066

申请人证明： ND001349

保藏日期： 2002-06-21

说明：与质粒连接的poitrasia circinans CBH1基因

分类：笄霉科，接合菌门，毛霉菌属

来源： -

相关序列： SEQ ID NO：49(编码来自于poitrasia circinans的

纤维二糖水解酶I的DNA序列)，SEQ ID NO：50(来自于

poitrasia circinans的纤维二糖水解酶I的蛋白序

列)。

保藏号： DSM 15065

申请人证明： ND001339

保藏日期： 2002-06-21

说明：与质粒连接的灰色鬼伞CBH1基因

分类： Basidiomycota，Hymenomycetes，Agaricales，

Agaricaceae

来源：丹麦

相关序列： SEQ ID NO：51(编码来自于灰色鬼伞的纤维二糖水解

酶I的DNA序列)，SEQ ID NO：52(来自于灰色鬼伞的

纤维二糖水解酶I的蛋白序列)。

保藏号： DSM 15064

申请人证明： ND001264

保藏日期： 2002-06-21

说明：与质粒连接的长毛盘菌CBH1基因

分类：子囊菌门，Pezizomycetes，Pezizales，

Pyronemataceae

来源： -

相关序列： SEQ ID NO：39(编码来自于长毛盘菌的纤维二糖水解

酶I的DNA序列)，SEQ ID NO：40(来自于长毛盘菌的

纤维二糖水解酶I的蛋白序列)。

保藏号： DSM 15067

申请人证明： ND001232

保藏日期： 2002-06-21

说明：与质粒连接的嗜热毁丝霉CBH1基因

分类： Sordariaceae，Sordariales，Sordariomycetes，

子囊菌门

来源： -

相关序列： SEQ ID NO：41(编码来自于嗜热毁丝霉的纤维二糖水

解酶I的DNA序列)，SEQ ID NO：42(来自于嗜热毁丝

霉的纤维二糖水解酶I的蛋白序列)。

发酵研究所，大阪(IFO)

下列微生物材料已经根据布达佩斯条约在发酵研究所，大阪(IFO)进行了保藏，17-85，Juso-Honmachi 2-chome，Yodogawa-Ku，大阪532-8686，日本：

保藏号： IFO 5372

申请人证明： ND000531

保藏日期：公众可获得的(非申请人保藏)

说明：玫瑰单瑞孢

分类：有丝分裂孢子的子囊菌门

来源： -

相关序列： SEQ ID NO：17(编码来自于玫瑰单瑞孢的纤维二糖水

解酶I的部分DNA序列)。

保藏的CBS427.97、CBS247.96、CBS521.95、CBS284.96、CBS274.96由Novo Nordisk A/S制备并且稍后转让给了Novozymes A/S。

0-10-1-1	表格-PCT/RO/134(EASY)与保藏微生物或其它生物材料相关的简要说明(PCT Rule13bis)准备使用	PCT-EASY 2.92版(更新于01.06.2002)
0-10-1-1	表格-PCT/RO/134(EASY)与保藏微生物或其它生物材料相关的简要说明(PCT Rule13bis)准备使用	PCT-EASY 2.92版(更新于01.06.2002)	0-2	国际申请号
0-3	申请人或代理人的申请标识	10129.204-WO	0-2	国际申请号

11-11-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	63-6431-2
11-11-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	63-6431-2	1-31-3-11-3-21-3-31-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2001-05-29CGMCC 0584
1-4	附注	无	1-31-3-11-3-21-3-31-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号
1-4	附注	无	1-5	指定的需要这些说明的国家	所有指定国
1-6	单独需要声明的稍后这些声明将被提交国际局	无	1-5	指定的需要这些说明的国家	所有指定国
1-6	单独需要声明的稍后这些声明将被提交国际局	无	22-12-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	644-12
2-32-3-12-3-22-3-32-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2001-05-29CGMCC 0581	22-12-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	644-12
2-32-3-12-3-22-3-32-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号		2-4	附注	无

2-5	指定的需要这些说明的国家	所有指定国
2-5	指定的需要这些说明的国家	所有指定国	2-6	单独需要声明的稍后这些声明将被提交国际局	无
33-13-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6414-22	2-6	单独需要声明的稍后这些声明将被提交国际局	无
33-13-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6414-22	3-33-3-13-3-23-3-33-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2001-05-29CGMCC 0585
3-4	附注	无	3-33-3-13-3-23-3-33-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号
3-4	附注	无	3-5	指定的需要这些说明的国家	所有指定国
3-6	单独需要声明的稍后这些声明将被提交国际局	无	3-5	指定的需要这些说明的国家	所有指定国
3-6	单独需要声明的稍后这些声明将被提交国际局	无	44-14-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6424-32
4-3	保藏证明		44-14-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6424-32
4-3	保藏证明		4-3-14-3-24-3-34-3-4	保藏单位名称保藏单位地址保藏日期保藏号	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2001-05-29CGMCC 0582
4-4	附注	无	4-3-14-3-24-3-34-3-4	保藏单位名称保藏单位地址保藏日期保藏号
4-4	附注	无	4-5	指定的需要这些说明的国家	所有指定国
4-6	单独需要声明的稍后这些声明将被提交国际局	无	4-5	指定的需要这些说明的国家	所有指定国
4-6	单独需要声明的稍后这些声明将被提交国际局	无	5	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：

5-15-2	页行	64-6534-5
5-15-2	页行	64-6534-5	5-35-3-15-3-25-3-35-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2001-05-29CGMCC 0583
5-4	附注	无	5-35-3-15-3-25-3-35-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号
5-4	附注	无	5-5	指定的需要这些说明的国家	所有指定国
5-6	单独需要声明的稍后这些声明将被提交国际局	无	5-5	指定的需要这些说明的国家	所有指定国
5-6	单独需要声明的稍后这些声明将被提交国际局	无	66-16-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	657-15
6-36-3-16-3-26-3-3	保藏证明保藏单位名称保藏单位地址保藏日期	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2001-05-29	66-16-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	657-15
6-36-3-16-3-26-3-3	保藏证明保藏单位名称保藏单位地址保藏日期	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2001-05-29	6-3-4	保藏号	CGMCC 0580
6-4	附注	无	6-3-4	保藏号	CGMCC 0580
6-4	附注	无	6-5	指定的需要这些说明的国家	所有指定国
6-6	单独需要声明的稍后这些声明将被提交国际局	无	6-5	指定的需要这些说明的国家	所有指定国
6-6	单独需要声明的稍后这些声明将被提交国际局	无	77-17-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6517-23
7-37-3-1	保藏证明保藏单位名称	中国普通微生物中心	77-17-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6517-23

7-3-27-3-37-3-4	保藏单位地址保藏日期保藏号	中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2002-06-07CGCCM 0748
7-3-27-3-37-3-4	保藏单位地址保藏日期保藏号	中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2002-06-07CGCCM 0748	7-4	附注	无
7-5	指定的需要这些说明的国家	所有指定国	7-4	附注	无
7-5	指定的需要这些说明的国家	所有指定国	7-6	单独需要声明的稍后这些声明将被提交国际局	无
88-18-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6525-31	7-6	单独需要声明的稍后这些声明将被提交国际局	无
88-18-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6525-31	8-38-3-18-3-28-3-38-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2002-06-07CGCCM 0749
8-4	附注	无	8-38-3-18-3-28-3-38-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号
8-4	附注	无	8-5	指定的需要这些说明的国家	所有指定国
8-6	单独需要声明的稍后这些声明将被提交国际局	无	8-5	指定的需要这些说明的国家	所有指定国
8-6	单独需要声明的稍后这些声明将被提交国际局	无	99-19-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	65-6633-2
9-39-3-19-3-29-3-39-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2002-06-07CGCCM 0747	99-19-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	65-6633-2

9-4	附注	无
9-4	附注	无	9-5	指定的需要这些说明的国家	所有指定国
9-6	单独需要声明的稍后这些声明将被提交国际局	无	9-5	指定的需要这些说明的国家	所有指定国
9-6	单独需要声明的稍后这些声明将被提交国际局	无	1010-110-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	664-10
10-310-3-110-3-210-3-310-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714，北京100080，中国2002-06-07CGCCM 0750	1010-110-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	664-10
10-310-3-110-3-210-3-310-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号		10-4	附注	无
10-5	指定的需要这些说明的国家	所有指定国	10-4	附注	无
10-5	指定的需要这些说明的国家	所有指定国	10-6	单独需要声明的稍后这些声明将被提交国际局	无

1111-111-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6618-26
1111-111-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6618-26	11-311-3-111-3-211-3-311-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	真菌菌种保藏中心Uppsalalaan 8，NL-3584 CT Ultrecht，The Netherlands/P.O.Box 85167，NL-3508 AD Utrecht，荷兰2001-06-01CBS 109513

11-4	附注	无
11-4	附注	无	11-5	指定的需要这些说明的国家	所有指定国
11-6	单独需要声明的稍后这些声明将被提交国际局	无	11-5	指定的需要这些说明的国家	所有指定国
11-6	单独需要声明的稍后这些声明将被提交国际局	无	1212-112-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	66-6737-7
12-312-3-112-3-212-3-312-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	真菌菌种保藏中心Uppsalalaan 8，NL-3584 CT Ultrecht，The Netherlands/P.O.Box 85167，NL-3508 AD Utrecht，荷兰1997-01-23CBS 427.97	1212-112-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	66-6737-7
12-312-3-112-3-212-3-312-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号		12-4	附注	无
12-5	指定的需要这些说明的国家	所有指定国	12-4	附注	无
12-5	指定的需要这些说明的国家	所有指定国	12-6	单独需要声明的稍后这些声明将被提交国际局	无

1313-113-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	679-19
1313-113-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	679-19	13-313-3-113-3-213-3-313-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	真菌菌种保藏中心Uppsalalaan 8，NL-3584 CT Ultrecht，The Netherlands/P.O.Box 85167，NL-3508 AD Utrecht，荷兰1996-03-12CBS 247.96

13-4	附注	无
13-4	附注	无	13-5	指定的需要这些说明的国家	所有指定国
13-6	单独需要声明的稍后这些声明将被提交国际局	无	13-5	指定的需要这些说明的国家	所有指定国
13-6	单独需要声明的稍后这些声明将被提交国际局	无	1414-114-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6730-37
14-314-3-114-3-214-3-314-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	真菌菌种保藏中心Uppsalalaan 8，NL-3584 CT Ultrecht，The Netherlands/P.O.Box 85167，NL-3508 AD Utrecht，荷兰2001-05-29CBS 109471	1414-114-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6730-37
14-314-3-114-3-214-3-314-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号		14-4	附注	无
14-5	指定的需要这些说明的国家	所有指定国	14-4	附注	无
14-5	指定的需要这些说明的国家	所有指定国	14-6	单独需要声明的稍后这些声明将被提交国际局	无

1515-115-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	682-9
1515-115-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	682-9	15-315-3-115-3-215-3-315-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	真菌菌种保藏中心Uppsalalaan 8，NL-3584 CT Ultrecht，The Netherlands/P.O.Box 85167，NL-3508 AD Utrecht，荷兰1995-07-04CBS 521.95

15-4	附注	无
15-4	附注	无	15-5	指定的需要这些说明的国家	所有指定国
15-6	单独需要声明的稍后这些声明将被提交国际局	无	15-5	指定的需要这些说明的国家	所有指定国
15-6	单独需要声明的稍后这些声明将被提交国际局	无	1616-116-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6826-36
16-316-3-116-3-216-3-316-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	真菌菌种保藏中心Uppsalalaan 8，NL-3584 CT Ultrecht，The Netherlands/P.O.Box 85167，NL-3508 AD Utrecht，荷兰1996-03-12CBS 284.96	1616-116-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6826-36
16-316-3-116-3-216-3-316-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号		16-4	附注	无
16-5	指定的需要这些说明的国家	所有指定国	16-4	附注	无
16-5	指定的需要这些说明的国家	所有指定国	16-6	单独需要声明的稍后这些声明将被提交国际局	无

1717-117-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6811-24
1717-117-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6811-24	17-317-3-117-3-217-3-317-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	真菌菌种保藏中心Uppsalalaan 8，NL-3584 CT Ultrecht，The Netherlands/P.O.Box 85167，NL-3508 AD Utrecht，荷兰1996-03-12CBS 277.96

17-4	附注	无
17-4	附注	无	17 -5	指定的需要这些说明的国家	所有指定国
17-6	单独需要声明的稍后这些声明将被提交国际局	无	17 -5	指定的需要这些说明的国家	所有指定国
17-6	单独需要声明的稍后这些声明将被提交国际局	无	1818-118-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6915-23
18-318-3-118-3-218-3-318-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	德意志微生物保藏中心Mascheroder Weg 1b，D-38124 Braunschweig，德国2001-06-13DSMZ 14348	1818-118-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6915-23
18-318-3-118-3-218-3-318-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号		l8-4	附注	无
18-5	指定的需要这些说明的国家	所有指定国	l8-4	附注	无
18-5	指定的需要这些说明的国家	所有指定国	18-6	单独需要声明的稍后这些声明将被提交国际局	无

1919-119-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6925-33
1919-119-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	6925-33	19-319-3-119-3-219-3-319-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	德意志微生物保藏中心Mascheroder Weg 1b，D-38124 Braunschweig，德国2002-06-21DSMZ 15066
19-4	附注	无	19-319-3-119-3-219-3-319-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号

19-5	指定的需要这些说明的国家	所有指定国
19-5	指定的需要这些说明的国家	所有指定国	19-6	单独需要声明的稍后这些声明将被提交国际局	无
2020-120-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	69-7035-6	19-6	单独需要声明的稍后这些声明将被提交国际局	无
2020-120-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	69-7035-6	20-320-3-120-3-220-3-320-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	德意志微生物保藏中心Mascheroder Weg 1b，D-38124 Braunschweig，德国2002-06-21DSMZ 15065
20-4	附注	无	20-320-3-120-3-220-3-320-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号
20-4	附注	无	20-5	指定的需要这些说明的国家	所有指定国
20-6	单独需要声明的稍后这些声明将被提交国际局	无	20-5	指定的需要这些说明的国家	所有指定国

2121-121-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	708-16
2121-121-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	708-16	21-321-3-121-3-221-3-321-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	德意志微生物保藏中心Mascheroder Weg 1b，D-38124 Braunschweig，德国2002-06-21DSMZ 15064
21-4	附注	无	21-321-3-121-3-221-3-321-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号

21-5	指定的需要这些说明的国家	所有指定国
21-5	指定的需要这些说明的国家	所有指定国	21-6	单独需要声明的稍后这些声明将被提交国际局	无
2222-122-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	708-16	21-6	单独需要声明的稍后这些声明将被提交国际局	无
2222-122-2	以下为说明书中涉及保藏微生物或其它生物材料的简要说明：页行	708-16	22-322-3-122-3-222-3-322-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号	德意志微生物保藏中心Mascheroder Weg 1b，D-38124 Braunschweig，德国2001-06-13DSMZ 15067
22-4	附注	无	22-322-3-122-3-222-3-322-3-4	保藏证明保藏单位名称保藏单位地址保藏日期保藏号
22-4	附注	无	22-5	指定的需要这些说明的国家	所有指定国
22-6	单独需要声明的稍后这些声明将被提交国际局	无	22-5	指定的需要这些说明的国家	所有指定国

序列表

<110> Novozymes A/S

<120> 具有纤维二糖水解酶I活性的多肽和编码多肽的多核苷酸

<130> 10129-WO

<160> 67

<170> PatentIn version 3.1

<210> 1

<211> 1581

<212> DNA

<213> 嗜热支顶孢(Acremonium thermophilum)

<220>

<221> CDS

<222> (1)..(1581)

<223>

<400> 1

atg cac gcc aag ttc gcg acc ctc gcc gcc ctt gtg gcg tcc gcc gcg 48

Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala

1 5 10 15

gcc cag cag gcc tgc aca ctc acg gct gag aac cac ccc acc ctg tcg 96

Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser

20 25 30

tgg tcc aag tgc acg tcc ggc ggc agc tgc acc agc gtc tcg ggc tcc 144

Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser

35 40 45

gtc acc atc gat gcc aac tgg cgg tgg act cac cag gtc tcg agc tcg 192

Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser

50 55 60

acc aac tgc tac acg ggc aat gag tgg gac acg tcc atc tgc acc gac 240

Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp

65 70 75 80

ggt gct tcg tgc gcc gcc gcc tgc tgc ctc gat ggc gcc gac tac tcg 288

Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser

85 90 95

ggc acc tat ggc atc acc acc agc ggc aac gcc ctc agc ctc cag ttc 336

Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe

100 105 110

gtc act cag ggc ccc tac tcg acc aac att ggc tcg cgt acc tac ctg 384

Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu

115 120 125

atg gcc tcg gac acc aag tac cag atg ttc act ctg ctc ggc aac gag 432

Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu

130 135 140

ttc acc ttc gac gtg gac gtc aca ggc ctc ggc tgc ggt ctg aac ggc 480

Phe Thr Phe Asp Val Asp Val Thr Gly Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

gcc ctc tac ttc gtc tcc atg gac gag gac ggt ggt ctt tcc aag tac 528

Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr

165 170 175

tcg ggc aac aag gct ggc gcc aag tac ggc acc ggc tac tgc gac tcg 576

Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

cag tgc ccc cgc gac ctc aag ttc atc aac ggc gag gct aac aac gtt 624

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val

195 200 205

ggc tgg acc ccg tcg tcc aac gac aag aac gcc ggc ttg ggc aac tac 672

Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr

210 215 220

ggc agc tgc tgc tcc gag atg gat gtc tgg gag gcc aac agc atc tcg 720

Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser

225 230 235 240

gcg gcc tac acg ccc cat cct tgc act acc atc ggc cag acg cgc tgc 768

Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys

245 250 255

gag ggc gac gac tgc ggt ggt acc tac agc act gac cgc tac gcc ggc 816

Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly

260 265 270

gag tgc gac cct gac gga tgc gac ttc aac tcg tac cgc atg ggc aac 864

Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn

275 280 285

acg acc ttc tac ggc aag ggc atg acc gtc gac acc agc aag aag ttc 912

Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe

290 295 300

acg gtg gtg acc cag ttc ctg acg gac tcg tct ggc aac ctg tcc gag 960

Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu

305 310 315 320

atc aag cgc ttc tac gtc cag aac ggc gtc gtc att ccc aac tcg aac 1008

Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn

325 330 335

tcc aac atc gcg ggc gtc tcg ggc aac tcc atc acc cag gcc ttc tgc 1056

Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys

340 345 350

gat gct cag aag acc gct ttc ggc gac acc aac gtc ttc gac caa aag 1104

Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys

355 360 365

ggc ggc ctg gcc cag atg ggc aag gct ctt gcc cag ccc atg gtc ctc 1152

Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu

370 375 380

gtc atg tcc ctc tgg gac gac cac gcc gtc aac atg ctc tgg ctc gac 1200

Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp

385 390 395 400

tcg acc tac ccg acc aac gcg gcc ggc aag ccg ggc gcc gcc cgc ggt 1248

Ser Thr Tyr Pro Thr Asn Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly

405 410 415

acc tgc ccc acc acc tcg ggc gtc ccc gcc gac gtc gag tcc cag gcg 1296

Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala

420 425 430

ccc aac tcc aag gtc atc tac tcc aac atc cgc ttc ggc ccc atc ggc 1344

Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly

435 440 445

tcc acc gtc tcc ggc ctg ccc ggc ggc ggc agc aac ccc ggc ggc ggc 1392

Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly

450 455 460

tcc agc tcc acc acc acc acc acc aga ccc gcc acc tcc acc acc tcc 1440

Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser

465 470 475 480

tcg gcc agc tcc ggc ccg acc ggc ggt ggc acg gct gcc cac tgg ggc 1488

Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly

485 490 495

cag tgc ggc ggc atc ggc tgg acc ggc ccg acc gtc tgc gcc tcg ccc 1536

Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro

500 505 510

tac acc tgc cag aag ctg aac gac tgg tac tac cag tgc ctc taa 1581

Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu

515 520 525

<210> 2

<211> 526

<212> PRT

<213> 嗜热支顶孢(Acremonium thermophilum)

<400> 2

Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala

1 5 10 15

Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser

20 25 30

Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser

35 40 45

Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser

50 55 60

Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp

65 70 75 80

Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser

85 90 95

Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe

100 105 110

Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu

115 120 125

Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu

130 135 140

Phe Thr Phe Asp Val Asp Val Thr Gly Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr

165 170 175

Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val

195 200 205

Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr

210 215 220

Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser

225 230 235 240

Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys

245 250 255

Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly

260 265 270

Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn

275 280 285

Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe

290 295 300

Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu

305 310 315 320

Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn

325 330 335

Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys

340 345 350

Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys

355 360 365

Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu

370 375 380

Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp

385 390 395 400

Ser Thr Tyr Pro Thr Asn Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly

405 410 415

Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala

420 425 430

Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly

435 440 445

Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly

450 455 460

Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser

465 470 475 480

Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly

485 490 495

Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro

500 505 510

Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu

515 520 525

<210> 3

<211> 1590

<212> DNA

<213> 嗜热毛壳酶(Chaetomium thermophilum)

<220>

<221> CDS

<222> (1)..(1590)

<223>

<400> 3

atg atg tac aag aag ttc gcc gct ctc gcc gcc ctc gtg gct ggc gcc 48

Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala

1 5 10 15

gcc gcc cag cag gct tgc tcc ctc acc act gag acc cac ccc aga ctc 96

Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu

20 25 30

act tgg aag cgc tgc acc tct ggc ggc aac tgc tcg acc gtg aac ggc 144

Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly

35 40 45

gcc gtc acc atc gat gcc aac tgg cgc tgg act cac acc gtt tcc ggc 192

Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly

50 55 60

tcg acc aac tgc tac acc ggc aac gag tgg gat acc tcc atc tgc tct 240

Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser

65 70 75 80

gat ggc aag agc tgc gcc cag acc tgc tgc gtc gac ggc gct gac tac 288

Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr

85 90 95

tct tcg acc tat ggt atc acc acc agc ggt gac tcc ctg aac ctc aag 336

Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys

100 105 110

ttc gtc acc aag cac cag tac ggc acc aat gtc ggc tct cgt gtc tac 384

Phe Val Thr Lys His Gln Tyr Gly Thr Asn Val Gly Ser Arg Val Tyr

115 120 125

ctg atg gag aac gac acc aag tac cag atg ttc gag ctc ctc ggc aac 432

Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn

130 135 140

gag ttc acc ttc gat gtc gat gtc tct aac ctg ggc tgc ggt ctc aac 480

Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn

145 150 155 160

ggt gcc ctc tac ttc gtc tcc atg gac gct gat ggt ggt atg agc aag 528

Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys

165 170 175

tac tct ggc aac aag gct ggc gcc aag tac ggg acg ggg tac tgt gat 576

Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp

180 185 190

gct cag tgc ccg cgc gac ctt aag ttc atc aac ggc gag gcc aac att 624

Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile

195 200 205

gag aac tgg acc cct tcg acc aat gat gcc aac gcc ggt ttc ggc cgc 672

Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg

210 215 220

tat ggc agc tgc tgc tct gag atg gat atc tgg gag gcc aac aac atg 720

Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met

225 230 235 240

gct act gcc ttc act cct cac cct tgc acc att atc ggc cag agc cgc 768

Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg

245 250 255

tgc gag ggc aac agc tgc ggt ggc acc tac agc tct gag cgc tat gct 816

Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala

260 265 270

ggt gtt tgc gat cct gat ggc tgc gac ttc aac gcc tac cgc cag ggc 864

Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly

275 280 285

gac aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag 912

Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys

290 295 300

atg acc gtc gtc acc cag ttc cac aag aac tcg gct ggc gtc ctc agc 960

Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser

305 310 315 320

gag atc aag cgc ttc tac gtt cag gac ggc aag gtc att gcc aac gcc 1008

Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Val Ile Ala Asn Ala

325 330 335

gag tcc aag atc ccc ggc aac ccc ggc aac tcc atc acc cag gag tgg 1056

Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp

340 345 350

tgc gat gcc cag aag gtc gcc ttc ggt gac atc gat gac ttc aac cgc 1104

Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg

355 360 365

aag ggc ggt atg gct cag atg agc aag gcc ctc gaa ggc cct atg gtc 1152

Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val

370 375 380

ctg gtc atg tcc gtc tgg gat gac cac tac gcc aac atg ctc tgg ctc 1200

Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu

385 390 395 400

gac tcg acc tac ccc atc gac aag gcc ggc acc ccc ggc gcc gag cgc 1248

Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg

405 410 415

ggt gct tgc ccg acc acc tcc ggt gtc cct gcc gag att gag gcc cag 1296

Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln

420 425 430

gtc ccc aac agc aac gtc atc ttc tcc aac atc cgc ttc ggc ccc atc 1344

Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile

435 440 445

ggc tcg acc gtc cct ggc ctc gac ggc agc act ccc agc aac ccg acc 1392

Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr

450 455 460

gcc acc gtt gct cct ccc act tct acc acc agc gtg aga agc agc act 1440

Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Ser Val Arg Ser Ser Thr

465 470 475 480

act cag att tcc acc ccg act agc cag ccc ggc ggc tgc acc acc cag 1488

Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr Gln

485 490 495

aag tgg ggc cag tgc ggt ggt atc ggc tac acc ggc tgc act aac tgc 1536

Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn Cys

500 505 510

gtt gct ggc act acc tgc act gag ctc aac ccc tgg tac agc cag tgc 1584

Val Ala Gly Thr Thr Cys Thr Glu Leu Ash Pro Trp Tyr Ser Gln Cys

515 520 525

ctg taa 1590

Leu

<210> 4

<211> 529

<212> PRT

<213> 嗜热毛壳酶(Chaetomium thermophilum)

<400> 4

Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala

1 5 10 15

Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu

20 25 30

Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly

35 40 45

Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly

50 55 60

Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser

65 70 75 80

Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr

85 90 95

Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys

100 105 110

Phe Val Thr Lys His Gln Tyr Gly Thr Asn Val Gly Ser Arg Val Tyr

115 120 125

Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn

130 135 140

Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn

145 150 155 160

Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys

165 170 175

Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp

180 185 190

Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile

195 200 205

Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg

210 215 220

Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met

225 230 235 240

Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg

245 250 255

Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala

260 265 270

Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly

275 280 285

Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys

290 295 300

Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser

305 310 315 320

Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Val Ile Ala Asn Ala

325 330 335

Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp

340 345 350

Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg

355 360 365

Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val

370 375 380

Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu

385 390 395 400

Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg

405 410 415

Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln

420 425 430

Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile

435 440 445

Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr

450 455 460

Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Ser Val Arg Ser Ser Thr

465 470 475 480

Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr Gln

485 490 495

Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn Cys

500 505 510

Val Ala Gly Thr Thr Cys Thr Glu Leu Asn Pro Trp Tyr Ser Gln Cys

515 520 525

Leu

<210> 5

<211> 1356

<212> DNA

<213> 小柱胞菌(Scytalidium sp.)

<220>

<221> CDS

<222> (1)..(1356)

<223>

<400> 5

atg cag atc aag agc tac atc cag tac ctg gcc gcg gct ctg ccg ctc 48

Met Gln Ile Lys Ser Tyr Ile Gln Tyr Leu Ala Ala Ala Leu Pro Leu

1 5 10 15

ctg agc agc gtc gct gcc cag cag gcc ggc acc atc acc gcc gag aac 96

Leu Ser Ser Val Ala Ala Gln Gln Ala Gly Thr Ile Thr Ala Glu Asn

20 25 30

cac ccc agg atg acc tgg aag agg tgc tcg ggc ccc ggc aac tgc cag 144

His Pro Arg Met Thr Trp Lys Arg Cys Ser Gly Pro Gly Asn Cys Gln

35 40 45

acc gtg cag ggc gag gtc gtc atc gac gcc aac tgg cgc tgg ctg cac 192

Thr Val Gln Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His

50 55 60

aac aac ggc cag aac tgc tat gag ggc aac aag tgg acc agc cag tgc 240

Asn Asn Gly Gln Asn Cys Tyr Glu Gly Asn Lys Trp Thr Ser Gln Cys

65 70 75 80

agc tcg gcc acc gac tgc gcg cag agg tgc gcc ctc gac ggt gcc aac 288

Ser Ser Ala Thr Asp Cys Ala Gln Arg Cys Ala Leu Asp Gly Ala Asn

85 90 95

tac cag tcg acc tac ggc gcc tcg acc agc ggc gac tcc ctg acg ctc 336

Tyr Gln Ser Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu

100 105 110

aag ttc gtc acc aag cac gag tac ggc acc aac atc ggc tcg cgc ttc 384

Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe

115 120 125

tac ctc atg gcc aac cag aac aag tac cag atg ttc acc ctg atg aac 432

Tyr Leu Met Ala Asn Gln Asn Lys Tyr Gln Met Phe Thr Leu Met Asn

130 135 140

aac gag ttc gcc ttc gat gtc gac ctc tcc aag gtt gag tgc ggt atc 480

Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Lys Val Glu Cys Gly Ile

145 150 155 160

aac agc gct ctg tac ttc gtc gcc atg gag gag gat ggt ggc atg gcc 528

Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala

165 170 175

agc tac ccg agc aac cgt gct ggt gcc aag tac ggc acg ggc tac tgc 576

Ser Tyr Pro Ser Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys

180 185 190

gat gcc caa tgc gcc cgt gac ctc aag ttc att ggc ggc aag gcc aac 624

Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Ile Gly Gly Lys Ala Asn

195 200 205

att gag ggc tgg cgc ccg tcc acc aac gac ccc aac gcc ggt gtc ggt 672

Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Pro Asn Ala Gly Val Gly

210 215 220

ccc atg ggt gcc tgc tgc gct gag atc gac gtt tgg gag tcc aac gcc 720

Pro Met Gly Ala Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala

225 230 235 240

tat gct tat gcc ttc acc ccc cac gcc tgc ggc agc aag aac cgc tac 768

Tyr Ala Tyr Ala Phe Thr Pro His Ala Cys Gly Ser Lys Asn Arg Tyr

245 250 255

cac atc tgc gag acc aac aac tgc ggt ggt acc tac tcg gat gac cgc 816

His Ile Cys Glu Thr Asn Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg

260 265 270

ttc gcc ggc tac tgc gac gcc aac ggc tgc gac tac aac ccc tac cgc 864

Phe Ala Gly Tyr Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg

275 280 285

atg ggc aac aag gac ttc tat ggc aag ggc aag acc gtc gac acc aac 912

Met Gly Asn Lys Asp Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Asn

290 295 300

cgc aag ttc acc gtt gtc tcc cgc ttc gag cgt aac agg ctc tct cag 960

Arg Lys Phe Thr Val Val Ser Arg Phe Glu Arg Asn Arg Leu Ser Gln

305 310 315 320

ttc ttc gtc cag gac ggc cgc aag atc gag gtg ccc cct ccg acc tgg 1008

Phe Phe Val Gln Asp Gly Arg Lys Ile Glu Val Pro Pro Pro Thr Trp

325 330 335

ccc ggc ctc ccg aac agc gcc gac atc acc cct gag ctc tgc gat gct 1056

Pro Gly Leu Pro Asn Ser Ala Asp Ile Thr Pro Glu Leu Cys Asp Ala

340 345 350

cag ttc cgc gtc ttc gat gac cgc aac cgc ttc gcc gag acc ggt ggc 1104

Gln Phe Arg Val Phe Asp Asp Arg Asn Arg Phe Ala Glu Thr Gly Gly

355 360 365

ttc gat gct ctg aac gag gcc ctc acc att ccc atg gtc ctt gtc atg 1152

Phe Asp Ala Leu Asn Glu Ala Leu Thr Ile Pro Met Val Leu Val Met

370 375 380

tcc atc tgg gat gac cac cac tcc aac atg ctc tgg ctc gac tcc agc 1200

Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp Ser Ser

385 390 395 400

tac ccg ccc gag aag gcc ggc ctc ccc ggt ggc gac cgt ggc ccg tgc 1248

Tyr Pro Pro Glu Lys Ala Gly Leu Pro Gly Gly Asp Arg Gly Pro Cys

405 410 415

ccg acc acc tct ggt gtc cct gcc gag gtc gag gct cag tac ccc gat 1296

Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asp

420 425 430

gct cag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg acc 1344

Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr

435 440 445

gtc aac gtc taa 1356

Val Asn Val

450

<210> 6

<211> 451

<212> PRT

<213> 小柱胞菌(Scytalidium sp.)

<400> 6

Met Gln Ile Lys Ser Tyr Ile Gln Tyr Leu Ala Ala Ala Leu Pro Leu

1 5 10 15

Leu Ser Ser Val Ala Ala Gln Gln Ala Gly Thr Ile Thr Ala Glu Asn

20 25 30

His Pro Arg Met Thr Trp Lys Arg Cys Ser Gly Pro Gly Asn Cys Gln

35 40 45

Thr Val Gln Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His

50 55 60

Asn Asn Gly Gln Asn Cys Tyr Glu Gly Asn Lys Trp Thr Ser Gln Cys

65 70 75 80

Ser Ser Ala Thr Asp Cys Ala Gln Arg Cys Ala Leu Asp Gly Ala Asn

85 90 95

Tyr Gln Ser Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu

100 105 110

Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe

115 120 125

Tyr Leu Met Ala Asn Gln Asn Lys Tyr Gln Met Phe Thr Leu Met Asn

130 135 140

Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Lys Val Glu Cys Gly Ile

145 150 155 160

Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala

165 170 175

Ser Tyr Pro Ser Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys

180 185 190

Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Ile Gly Gly Lys Ala Asn

195 200 205

Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Pro Asn Ala Gly Val Gly

210 215 220

Pro Met Gly Ala Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala

225 230 235 240

Tyr Ala Tyr Ala Phe Thr Pro His Ala Cys Gly Ser Lys Asn Arg Tyr

245 250 255

His Ile Cys Glu Thr Asn Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg

260 265 270

Phe Ala Gly Tyr Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg

275 280 285

Met Gly Asn Lys Asp Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Asn

290 295 300

Arg Lys Phe Thr Val Val Ser Arg Phe Glu Arg Asn Arg Leu Ser Gln

305 310 315 320

Phe Phe Val Gln Asp Gly Arg Lys Ile Glu Val Pro Pro Pro Thr Trp

325 330 335

Pro Gly Leu Pro Asn Ser Ala Asp Ile Thr Pro Glu Leu Cys Asp Ala

340 345 350

Gln Phe Arg Val Phe Asp Asp Arg Asn Arg Phe Ala Glu Thr Gly Gly

355 360 365

Phe Asp Ala Leu Asn Glu Ala Leu Thr Ile Pro Met Val Leu Val Met

370 375 380

Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp Ser Ser

385 390 395 400

Tyr Pro Pro Glu Lys Ala Gly Leu Pro Gly Gly Asp Arg Gly Pro Cys

405 410 415

Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asp

420 425 430

Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr

435 440 445

Val Asn Val

450

<210> 7

<211> 1374

<212> DNA

<213> 橙黄色热子囊菌(Thermoascus aurantiacus)

<220>

<221> CDS

<222> (1)..(1374)

<223>

<400> 7

atg tat cag cgc gct ctt ctc ttc tct ttc ttc ctc tcc gcc gcc cgc 48

Met Tyr Gln Arg Ala Leu Leu Phe Ser Phe Phe Leu Ser Ala Ala Arg

1 5 10 15

gcg cag cag gcc ggt acc cta acc gca gag aat cac cct tcc ctg acc 96

Ala Gln Gln Ala Gly Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr

20 25 30

tgg cag caa tgc tcc agc ggc ggt agt tgt acc acg cag aat gga aaa 144

Trp Gln Gln Cys Ser Ser Gly Gly Ser Cys Thr Thr Gln Asn Gly Lys

35 40 45

gtc gtt atc gat gcg aac tgg cgt tgg gtc cat acc acc tct gga tac 192

Val Val Ile Asp Ala Asn Trp Arg Trp Val His Thr Thr Ser Gly Tyr

50 55 60

acc aac tgc tac acg ggc aat acg tgg gac acc agt atc tgt ccc gac 240

Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Pro Asp

65 70 75 80

gac gtg acc tgc gct cag aat tgt gcc ttg gat gga gcg gat tac agt 288

Asp Val Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser

85 90 95

ggc acc tat ggt gtt acg acc agt ggc aac gcc ctg aga ctg aac ttt 336

Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Arg Leu Asn Phe

100 105 110

gtc acc caa agc tca ggg aag aac att ggc tcg cgc ctg tac ctg ctg 384

Val Thr Gln Ser Ser Gly Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu

115 120 125

cag gac gac acc act tat cag atc ttc aag ctg ctg ggt cag gag ttt 432

Gln Asp Asp Thr Thr Tyr Gln Ile Phe Lys Leu Leu Gly Gln Glu Phe

130 135 140

acc ttc gat gtc gac gtc tcc aat ctc cct tgc ggg ctg aac ggc gcc 480

Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala

145 150 155 160

ctc tac ttt gtg gcc atg gac gcc gac ggc gga ttg tcc aaa tac cct 528

Leu Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Leu Ser Lys Tyr Pro

165 170 175

ggc aac aag gca ggc gct aag tat ggc act ggt tac tgc gac tct cag 576

Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln

180 185 190

tgc cct cgg gat ctc aag ttc atc aac ggt cag gcc aac gtt gaa ggc 624

Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly

195 200 205

tgg cag ccg tct gcc aac gac cca aat gcc ggc gtt ggt aac cac ggt 672

Trp Gln Pro Ser Ala Asn Asp Pro Asn Ala Gly Val Gly Asn His Gly

210 215 220

tcc tgc tgc gct gag atg gat gtc tgg gaa gcc aac agc atc tct act 720

Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Thr

225 230 235 240

gcg gtg acg cct cac cca tgc gac acc ccc ggc cag acc atg tgc cag 768

Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Gln

245 250 255

gga gac gac tgt ggt gga acc tac tcc tcc act cga tat gct ggt acc 816

Gly Asp Asp Cys Gly Gly Thr Tyr Ser Ser Thr Arg Tyr Ala Gly Thr

260 265 270

tgc gac cct gat ggc tgc gac ttc aat cct tac cgc cag ggc aac cac 864

Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Gln Gly Asn His

275 280 285

tcg ttc tac ggc ccc ggg aag atc gtc gac act agc tcc aaa ttc acc 912

Ser Phe Tyr Gly Pro Gly Lys Ile Val Asp Thr Ser Ser Lys Phe Thr

290 295 300

gtc gtc acc cag ttc atc acc gac gac ggg acc ccc tcc ggc acc ctg 960

Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Pro Ser Gly Thr Leu

305 310 315 320

acg gag atc aaa cgc ttc tac gtc cag aac ggc aag gtg atc ccc cag 1008

Thr Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln

325 330 335

tcg gag tcg acg atc agc ggc gtc acc ggc aac tca atc acc acc gag 1056

Ser Glu Ser Thr Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu

340 345 350

tat tgc acg gcc cag aag gcc gcc ttc ggc gac aac acc ggc ttc ttc 1104

Tyr Cys Thr Ala Gln Lys Ala Ala Phe Gly Asp Asn Thr Gly Phe Phe

355 360 365

acg cac ggc ggg ctt cag aag atc agt cag gct ctg gct cag ggc atg 1152

Thr His Gly Gly Leu Gln Lys Ile Ser Gln Ala Leu Ala Gln Gly Met

370 375 380

gtc ctc gtc atg agc ctg tgg gac gat cac gcc gcc aac atg ctc tgg 1200

Val Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asn Met Leu Trp

385 390 395 400

ctg gac agc acc tac ccg act gat gcg gac ccg gac acc cct ggc gtc 1248

Leu Asp Ser Thr Tyr Pro Thr Asp Ala Asp Pro Asp Thr Pro Gly Val

405 410 415

gcg cgc ggt acc tgc ccc acg acc tcc ggc gtc ccg gcc gac gtt gag 1296

Ala Arg Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu

420 425 430

tcg cag aac ccc aat tca tat gtt atc tac tcc aac atc aag gtc gga 1344

Ser Gln Asn Pro Asn Ser Tyr Val Ile Tyr Ser Asn Ile Lys Val Gly

435 440 445

ccc atc aac tcg acc ttc acc gcc aac taa 1374

Pro Ile Asn Ser Thr Phe Thr Ala Asn

450 455

<210> 8

<211> 457

<212> PRT

<213> 橙黄色热子囊菌(Thermoascus aurantiacus)

<400> 8

Met Tyr Gln Arg Ala Leu Leu Phe Ser Phe Phe Leu Ser Ala Ala Arg

1 5 10 15

Ala Gln Gln Ala Gly Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr

20 25 30

Trp Gln Gln Cys Ser Ser Gly Gly Ser Cys Thr Thr Gln Asn Gly Lys

35 40 45

Val Val Ile Asp Ala Asn Trp Arg Trp Val His Thr Thr Ser Gly Tyr

50 55 60

Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Pro Asp

65 70 75 80

Asp Val Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser

85 90 95

Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Arg Leu Asn Phe

100 105 110

Val Thr Gln Ser Ser Gly Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu

115 120 125

Gln Asp Asp Thr Thr Tyr Gln Ile Phe Lys Leu Leu Gly Gln Glu Phe

130 135 140

Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala

145 150 155 160

Leu Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Leu Ser Lys Tyr Pro

165 170 175

Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln

180 185 190

Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly

195 200 205

Trp Gln Pro Ser Ala Asn Asp Pro Asn Ala Gly Val Gly Asn His Gly

210 215 220

Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Thr

225 230 235 240

Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Gln

245 250 255

Gly Asp Asp Cys Gly Gly Thr Tyr Ser Ser Thr Arg Tyr Ala Gly Thr

260 265 270

Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Gln Gly Asn His

275 280 285

Ser Phe Tyr Gly Pro Gly Lys Ile Val Asp Thr Ser Ser Lys Phe Thr

290 295 300

Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Pro Ser Gly Thr Leu

305 310 315 320

Thr Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln

325 330 335

Ser Glu Ser Thr Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu

340 345 350

Tyr Cys Thr Ala Gln Lys Ala Ala Phe Gly Asp Asn Thr Gly Phe Phe

355 360 365

Thr His Gly Gly Leu Gln Lys Ile Ser Gln Ala Leu Ala Gln Gly Met

370 375 380

Val Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asn Met Leu Trp

385 390 395 400

Leu Asp Ser Thr Tyr Pro Thr Asp Ala Asp Pro Asp Thr Pro Gly Val

405 410 415

Ala Arg Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu

420 425 430

Ser Gln Asn Pro Asn Ser Tyr Val Ile Tyr Ser Asn Ile Lys Val Gly

435 440 445

Pro Ile Asn Ser Thr Phe Thr Ala Asn

450 455

<210> 9

<211> 1617

<212> DNA

<213> Thielavia australiensis

<220>

<221> CDS

<222> (1)..(1617)

<223>

<400> 9

atg tat gcc aag ttc gcg acc ctc gcc gcc ctc gtg gct ggc gcc tcc 48

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ser

1 5 10 15

gcc cag gcc gtc tgc agc ctt acc gct gag acg cac cct tcc ctg acg 96

Ala Gln Ala Val Cys Ser Leu Thr Ala Glu Thr His Pro Ser Leu Thr

20 25 30

tgg cag aag tgc acg gcc ccc ggc agc tgc acc aac gtc gcc ggc tcc 144

Trp Gln Lys Cys Thr Ala Pro Gly Ser Cys Thr Asn Val Ala Gly Ser

35 40 45

atc acc atc gac gcc aac tgg cgc tgg act cac cag acc tcg tcc gcg 192

Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Thr Ser Ser Ala

50 55 60

acc aac tgc tac agc ggc agc aag tgg gac tcg tcc atc tgc acg acc 240

Thr Asn Cys Tyr Ser Gly Ser Lys Trp Asp Ser Ser Ile Cys Thr Thr

65 70 75 80

ggc acc gac tgc gcc tcc aag tgc tgc att gat ggc gcc gag tac tcg 288

Gly Thr Asp Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Glu Tyr Ser

85 90 95

agc acc tac ggc atc acc acc agc ggc aat gcc ctg aac ctc aag ttc 336

Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe

100 105 110

gtc acc aag ggc cag tac tcg acc aac att ggc tcg cgt acc tac ctc 384

Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu

115 120 125

atg gag tcg gac acc aag tac cag atg ttc aag ctc ctt ggc aac gag 432

Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Lys Leu Leu Gly Asn Glu

130 135 140

ttc acc ttc gac gtc gat gtc tcc aac ctc ggc tgc ggc ctc aac ggc 480

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

gcc ctg tac ttc gtc tcc atg gat gcc gac ggt ggc atg tcc aag tac 528

Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr

165 170 175

tcg ggc aac aag gcc ggt gcc aag tac ggt acc ggc tac tgc gat gct 576

Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala

180 185 190

cag tgc ccc cgc gac ctc aag ttc atc aac ggc gag gcc aac gtt gag 624

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu

195 200 205

ggc tgg gag agc tcg acc aac gac gcc aac gcc ggc tcg ggc aag tac 672

Gly Trp Glu Ser Ser Thr Asn Asp Ala Asn Ala Gly Ser Gly Lys Tyr

210 215 220

ggc agc tgc tgc acc gag atg gac gtc tgg gag gcc aac aac atg gcg 720

Gly Ser Cys Cys Thr Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala

225 230 235 240

act gcc ttc act cct cac cct tgc acc acc att ggc cag act cgc tgc 768

Thr Ala Phe Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys

245 250 255

gag ggc gac acc tgc ggc ggc acc tac agc tca gac cgc tac gcc ggc 816

Glu Gly Asp Thr Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly

260 265 270

gtc tgc gac ccc gac gga tgc gac ttc aac tcg tac cgc cag ggc aac 864

Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn

275 280 285

aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag atc 912

Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile

290 295 300

acg gtc gtc acc cag ttc ctc aag aac tcg gcc ggc gag ctc tcc gag 960

Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu

305 310 315 320

atc aag cgc ttc tac gcc cag gac ggc aag gtc atc ccg aac agt gag 1008

Ile Lys Arg Phe Tyr Ala Gln Asp Gly Lys Val Ile Pro Asn Ser Glu

325 330 335

tct acc att gcc ggc atc ccc ggc aac tcc atc acc aag gcc tac tgc 1056

Ser Thr Ile Ala Gly Ile Pro Gly Asn Ser Ile Thr Lys Ala Tyr Cys

340 345 350

gac gcc cag aag acc gtc ttc cag aac acc gac gac ttc acc gcc aag 1104

Asp Ala Gln Lys Thr Val Phe Gln Asn Thr Asp Asp Phe Thr Ala Lys

355 360 365

ggc ggc ctc gtc cag atg ggc aag gcc ctc gcc ggc gac atg gtc ctc 1152

Gly Gly Leu Val Gln Met Gly Lys Ala Leu Ala Gly Asp Met Val Leu

370 375 380

gtc atg tcc gtc tgg gac gac cac gcc gtc aac atg ctc tgg cta gac 1200

Val Met Ser Val Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp

385 390 395 400

tcg acc tac ccg acc gac cag gtc ggc gtt gcc ggc gct gag cgc ggc 1248

Ser Thr Tyr Pro Thr Asp Gln Val Gly Val Ala Gly Ala Glu Arg Gly

405 410 415

gcc tgc ccc acc acc tcg ggc gtc ccc tcg gat gtt gag gcc aac gcc 1296

Ala Cys Pro Thr Thr Ser Gly Val Pro Ser Asp Val Glu Ala Asn Ala

420 425 430

ccc aac tcc aac gtc atc ttc tcc aac atc cgc ttc ggc ccc atc ggc 1344

Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly

435 440 445

tcc acc gtc cag ggc ctg ccc agc tcc ggc ggc acc tcc agc agc tcg 1392

Ser Thr Val Gln Gly Leu Pro Ser Ser Gly Gly Thr Ser Ser Ser Ser

450 455 460

agc gcc gct ccc cag tcg acc agc acc aag gcc tcg acc acc acc tca 1440

Ser Ala Ala Pro Gln Ser Thr Ser Thr Lys Ala Ser Thr Thr Thr Ser

465 470 475 480

gct gtc cgc acc acc tcg act gcc acc acc aag acc acc tcc tcg gct 1488

Ala Val Arg Thr Thr Ser Thr Ala Thr Thr Lys Thr Thr Ser Ser Ala

485 490 495

ccc gcc cag ggc acc aac act gcc aag cat tgg cag caa tgc ggt ggt 1536

Pro Ala Gln Gly Thr Asn Thr Ala Lys His Trp Gln Gln Cys Gly Gly

500 505 510

aac ggc tgg acc ggc ccg acg gtg tgc gag tct ccc tac aag tgc acc 1584

Asn Gly Trp Thr Gly Pro Thr Val Cys Glu Ser Pro Tyr Lys Cys Thr

515 520 525

aag cag aac gac tgg tac tcg cag tgc ctc taa 1617

Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu

530 535

<210> 10

<211> 538

<212> PRT

<213> Thielavia australiensis

<400> 10

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ser

1 5 10 15

Ala Gln Ala Val Cys Ser Leu Thr Ala Glu Thr His Pro Ser Leu Thr

20 25 30

Trp Gln Lys Cys Thr Ala Pro Gly Ser Cys Thr Asn Val Ala Gly Ser

35 40 45

Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Thr Ser Ser Ala

50 55 60

Thr Asn Cys Tyr Ser Gly Ser Lys Trp Asp Ser Ser Ile Cys Thr Thr

65 70 75 80

Gly Thr Asp Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Glu Tyr Ser

85 90 95

Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe

100 105 110

Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu

115 120 125

Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Lys Leu Leu Gly Asn Glu

130 135 140

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr

165 170 175

Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala

180 185 190

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu

195 200 205

Gly Trp Glu Ser Ser Thr Asn Asp Ala Asn Ala Gly Ser Gly Lys Tyr

210 215 220

Gly Ser Cys Cys Thr Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala

225 230 235 240

Thr Ala Phe Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys

245 250 255

Glu Gly Asp Thr Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly

260 265 270

Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn

275 280 285

Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile

290 295 300

Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu

305 310 315 320

Ile Lys Arg Phe Tyr Ala Gln Asp Gly Lys Val Ile Pro Asn Ser Glu

325 330 335

Ser Thr Ile Ala Gly Ile Pro Gly Asn Ser Ile Thr Lys Ala Tyr Cys

340 345 350

Asp Ala Gln Lys Thr Val Phe Gln Asn Thr Asp Asp Phe Thr Ala Lys

355 360 365

Gly Gly Leu Val Gln Met Gly Lys Ala Leu Ala Gly Asp Met Val Leu

370 375 380

Val Met Ser Val Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp

385 390 395 400

Ser Thr Tyr Pro Thr Asp Gln Val Gly Val Ala Gly Ala Glu Arg Gly

405 410 415

Ala Cys Pro Thr Thr Ser Gly Val Pro Ser Asp Val Glu Ala Asn Ala

420 425 430

Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly

435 440 445

Ser Thr Val Gln Gly Leu Pro Ser Ser Gly Gly Thr Ser Ser Ser Ser

450 455 460

Ser Ala Ala Pro Gln Ser Thr Ser Thr Lys Ala Ser Thr Thr Thr Ser

465 470 475 480

Ala Val Arg Thr Thr Ser Thr Ala Thr Thr Lys Thr Thr Ser Ser Ala

485 490 495

Pro Ala Gln Gly Thr Asn Thr Ala Lys His Trp Gln Gln Cys Gly Gly

500 505 510

Asn Gly Trp Thr Gly Pro Thr Val Cys Glu Ser Pro Tyr Lys Cys Thr

515 520 525

Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu

530 535

<210> 11

<211> 1248

<212> DNA

<213> 幼嫩轮枝孢(Verticillium tenerum)

<220>

<221> CDS

<222> (1)..(1248)

<223>

<400> 11

atg aag aag gct ctc atc acc agc ctc tcc ctg ctg gcc acg gcc atg 48

Met Lys Lys Ala Leu Ile Thr Ser Leu Ser Leu Leu Ala Thr Ala Met

1 5 10 15

ggc cag cag gcc ggt acc ctc gag acc gag acg cat ccc aag ctg acc 96

Gly Gln Gln Ala Gly Thr Leu Glu Thr Glu Thr His Pro Lys Leu Thr

20 25 30

tgg cag cgc tgc acc acc tcc ggc tgt acc aac gtc aac ggc gag gtc 144

Trp Gln Arg Cys Thr Thr Ser Gly Cys Thr Asn Val Asn Gly Glu Val

35 40 45

gtc atc gac gcc aac tgg cgt tgg gcc cac gac atc aac ggc tac gag 192

Val Ile Asp Ala Asn Trp Arg Trp Ala His Asp Ile Asn Gly Tyr Glu

50 55 60

aac tgc ttc gag ggc aac acc tgg acc ggc acc tgc agc ggc gcc gac 240

Asn Cys Phe Glu Gly Asn Thr Trp Thr Gly Thr Cys Ser Gly Ala Asp

65 70 75 80

ggc tgc gcg aag aac tgc gcc gtc gag gga gcc aac tac cag tcg acc 288

Gly Cys Ala Lys Asn Cys Ala Val Glu Gly Ala Asn Tyr Gln Ser Thr

85 90 95

tac ggt gtc tcg acc agc ggc aac gcc ctc tcc ctg cgc ttc gtc acc 336

Tyr Gly Val Ser Thr Ser Gly Asn Ala Leu Ser Leu Arg Phe Val Thr

100 105 110

gag cac gag cac ggc gtc aac acc ggt tcg cgc acg tac ctc atg gag 384

Glu His Glu His Gly Val Asn Thr Gly Ser Arg Thr Tyr Leu Met Glu

115 120 125

agc gcc acc aag tac cag atg ttc acc ctg atg aac aac gag ctc gcc 432

Ser Ala Thr Lys Tyr Gln Met Phe Thr Leu Met Asn Asn Glu Leu Ala

130 135 140

ttc gac gtc gac ctg tcc aag gtc gcc tgc ggc atg aac agc gcc ctc 480

Phe Asp Val Asp Leu Ser Lys Val Ala Cys Gly Met Asn Ser Ala Leu

145 150 155 160

tac ctc gtc ccc atg aag gcc gac ggc ggt ctc tcg tcc gag acc aac 528

Tyr Leu Val Pro Met Lys Ala Asp Gly Gly Leu Ser Ser Glu Thr Asn

165 170 175

aac aac gcc ggc gcc aag tac ggt acc ggt tac tgc gac gcc cag tgc 576

Asn Asn Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys

180 185 190

gct cgc gat ctc aag ttc gtc aac ggc aag gcc aac atc gag ggc tgg 624

Ala Arg Asp Leu Lys Phe Val Asn Gly Lys Ala Asn Ile Glu Gly Trp

195 200 205

caa gcc tcc aag acc gac gag aac tct ggc gtc ggt aac atg ggc tcc 672

Gln Ala Ser Lys Thr Asp Glu Asn Ser Gly Val Gly Asn Met Gly Ser

210 215 220

tgc tgt gct gag att gac gtt tgg gag tcc aac cgc gag tct ttc gcc 720

Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Arg Glu Ser Phe Ala

225 230 235 240

ttc acc cct cac gct tgc tcg cag aac gag tac cac gtc tgc acc ggc 768

Phe Thr Pro His Ala Cys Ser Gln Asn Glu Tyr His Val Cys Thr Gly

245 250 255

gcc aac tgc ggc ggt acc tac tcg gac gac cgc ttc gcc ggc aag tgc 816

Ala Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe Ala Gly Lys Cys

260 265 270

gat gcc aac ggt tgc gac tac aac ccc ttc cgc gtg ggc aac cag aac 864

Asp Ala Asn Gly Cys Asp Tyr Asn Pro Phe Arg Val Gly Asn Gln Asn

275 280 285

ttc tac ggc ccc ggc atg acc gtc aac acc aac tcc aag ttc act gtc 912

Phe Tyr Gly Pro Gly Met Thr Val Asn Thr Asn Ser Lys Phe Thr Val

290 295 300

atc tct cgc ttc cgg gag aac gag gcc tac cag gtc ttc atc cag aac 960

Ile Ser Arg Phe Arg Glu Asn Glu Ala Tyr Gln Val Phe Ile Gln Asn

305 310 315 320

ggc cgc acc atc gag gtc ccc cgt ccc acc ctc tcc ggc atc acc cag 1008

Gly Arg Thr Ile Glu Val Pro Arg Pro Thr Leu Ser Gly Ile Thr Gln

325 330 335

ttc gag gcc aag atc acc ccc gag ttc tgc tcg acc tac ccc acc gtc 1056

Phe Glu Ala Lys Ile Thr Pro Glu Phe Cys Ser Thr Tyr Pro Thr Val

340 345 350

ttc ggc gac cgc gac cgc cac ggc gag atc ggc ggc cac acc gcc ctc 1104

Phe Gly Asp Arg Asp Arg His Gly Glu Ile Gly Gly His Thr Ala Leu

355 360 365

aac gcg gcc ctc cgc atg ccc atg gtc ctc gtc atg tcc atc tgg gcc 1152

Asn Ala Ala Leu Arg Met Pro Met Val Leu Val Met Ser Ile Trp Ala

370 375 380

gac cac tac gcc aac atg ctc tgg ctc gac tcc atc tac ccg cca gag 1200

Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ile Tyr Pro Pro Glu

385 390 395 400

aag agg ggc cag ccc ggc gcc cac cgc ggc cgc aga tct aga ggg tga 1248

Lys Arg Gly Gln Pro Gly Ala His Arg Gly Arg Arg Ser Arg Gly

405 410 415

<210> 12

<211> 415

<212> PRT

<213> 幼嫩轮枝孢(Verticillium tenerum)

<400> 12

Met Lys Lys Ala Leu Ile Thr Ser Leu Ser Leu Leu Ala Thr Ala Met

1 5 10 15

Gly Gln Gln Ala Gly Thr Leu Glu Thr Glu Thr His Pro Lys Leu Thr

20 25 30

Trp Gln Arg Cys Thr Thr Ser Gly Cys Thr Asn Val Asn Gly Glu Val

35 40 45

Val Ile Asp Ala Asn Trp Arg Trp Ala His Asp Ile Asn Gly Tyr Glu

50 55 60

Asn Cys Phe Glu Gly Asn Thr Trp Thr Gly Thr Cys Ser Gly Ala Asp

65 70 75 80

Gly Cys Ala Lys Asn Cys Ala Val Glu Gly Ala Asn Tyr Gln Ser Thr

85 90 95

Tyr Gly Val Ser Thr Ser Gly Asn Ala Leu Ser Leu Arg Phe Val Thr

100 105 110

Glu His Glu His Gly Val Asn Thr Gly Ser Arg Thr Tyr Leu Met Glu

115 120 125

Ser Ala Thr Lys Tyr Gln Met Phe Thr Leu Met Asn Asn Glu Leu Ala

130 135 140

Phe Asp Val Asp Leu Ser Lys Val Ala Cys Gly Met Asn Ser Ala Leu

145 150 155 160

Tyr Leu Val Pro Met Lys Ala Asp Gly Gly Leu Ser Ser Glu Thr Asn

165 170 175

Asn Asn Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys

180 185 190

Ala Arg Asp Leu Lys Phe Val Asn Gly Lys Ala Asn Ile Glu Gly Trp

195 200 205

Gln Ala Ser Lys Thr Asp Glu Asn Ser Gly Val Gly Asn Met Gly Ser

210 215 220

Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Arg Glu Ser Phe Ala

225 230 235 240

Phe Thr Pro His Ala Cys Ser Gln Asn Glu Tyr His Val Cys Thr Gly

245 250 255

Ala Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe Ala Gly Lys Cys

260 265 270

Asp Ala Asn Gly Cys Asp Tyr Asn Pro Phe Arg Val Gly Asn Gln Asn

275 280 285

Phe Tyr Gly Pro Gly Met Thr Val Asn Thr Asn Ser Lys Phe Thr Val

290 295 300

Ile Ser Arg Phe Arg Glu Asn Glu Ala Tyr Gln Val Phe Ile Gln Asn

305 310 315 320

Gly Arg Thr Ile Glu Val Pro Arg Pro Thr Leu Ser Gly Ile Thr Gln

325 330 335

Phe Glu Ala Lys Ile Thr Pro Glu Phe Cys Ser Thr Tyr Pro Thr Val

340 345 350

Phe Gly Asp Arg Asp Arg His Gly Glu Ile Gly Gly His Thr Ala Leu

355 360 365

Asn Ala Ala Leu Arg Met Pro Met Val Leu Val Met Ser Ile Trp Ala

370 375 380

Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ile Tyr Pro Pro Glu

385 390 395 400

Lys Arg Gly Gln Pro Gly Ala His Arg Gly Arg Arg Ser Arg Gly

405 410 415

<210> 13

<211> 1341

<212> DNA

<213> 栗色新螱(Neotermes castaneus)

<220>

<22l> CDS

<222> (1)..(1341)

<223>

<400> 13

gca cga ggg ctc gct gct gca ttg ttc acc ttt gca tgt agc gtt ggt 48

Ala Arg Gly Leu Ala Ala Ala Leu Phe Thr Phe Ala Cys Ser Val Gly

1 5 10 15

atc ggc acc aaa acg gcc gag aac cac ccg aag ctg aac tgg cag aac 96

Ile Gly Thr Lys Thr Ala Glu Asn His Pro Lys Leu Asn Trp Gln Asn

20 25 30

tgc gcc tcc aag ggc agc tgc tca caa gtg tcc ggc gaa gtg aca atg 144

Cys Ala Ser Lys Gly Ser Cys Ser Gln Val Ser Gly Glu Val Thr Met

35 40 45

gac tcg aac tgg cgg tgg acc cac gat ggc aac ggc aag aac tgc tac 192

Asp Ser Asn Trp Arg Trp Thr His Asp Gly Asn Gly Lys Asn Cys Tyr

50 55 60

gac ggc aac acc tgg atc tcc agc ctc tgc cca gac ggc aag acc tgc 240

Asp Gly Asn Thr Trp Ile Ser Ser Leu Cys Pro Asp Gly Lys Thr Cys

65 70 75 80

tct gac aag tgc gtc ctc gat ggc gcc gaa tac caa gcg acc tac ggc 288

Ser Asp Lys Cys Val Leu Asp Gly Ala Glu Tyr Gln Ala Thr Tyr Gly

85 90 95

atc acc tcg aac ggg acc gcg gtc acc ctc aag ttc gtc acc cac ggc 336

Ile Thr Ser Asn Gly Thr Ala Val Thr Leu Lys Phe Val Thr His Gly

100 105 110

tcg tac tcg acg aac atc ggc tcc cgc ctg tat ctc ctc aag gac gaa 384

Ser Tyr Ser Thr Asn Ile Gly Ser Arg Leu Tyr Leu Leu Lys Asp Glu

115 120 125

aac act tac tac atc ttc aag gtg aac aac aag gaa ttc aca ttc agc 432

Asn Thr Tyr Tyr Ile Phe Lys Val Asn Asn Lys Glu Phe Thr Phe Ser

130 135 140

gtc gat gtg tcg aag ctc ccg tgc ggc ctg aac ggt gcc ctc tac ttc 480

Val Asp Val Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe

145 150 155 160

gtc tcg atg gac gcc gac ggt ggc gca gga aag tat tca ggt gcg aag 528

Val Ser Met Asp Ala Asp Gly Gly Ala Gly Lys Tyr Ser Gly Ala Lys

165 170 175

cca ggc gcg aag tac ggc ctc ggc tac tgc gat gcg caa tgc ccg agc 576

Pro Gly Ala Lys Tyr Gly Leu Gly Tyr Cys Asp Ala Gln Cys Pro Ser

180 185 190

gat ctg aag ttc atc aac ggc gaa gcg aac agc gat ggc tgg aag ccc 624

Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ser Asp Gly Trp Lys Pro

195 200 205

cag gcg aac gac aag aat gcg gga aac ggc aaa tac gga tcg tgc tgc 672

Gln Ala Asn Asp Lys Asn Ala Gly Asn Gly Lys Tyr Gly Ser Cys Cys

210 215 220

tcg gaa atg gac gtt tgg gag gcg aac tcg cag gca aca gct tac act 720

Ser Glu Met Asp Val Trp Glu Ala Asn Ser Gln Ala Thr Ala Tyr Thr

225 230 235 240

ccg cac gtc tgc aag acc acg ggc cag cag cgc tgc tcg ggc aca tcg 768

Pro His Val Cys Lys Thr Thr Gly Gln Gln Arg Cys Ser Gly Thr Ser

245 250 255

gaa tgc ggc ggc cag gat ggc gca gcg cgt ttc cag gga ctg tgc gac 816

Glu Cys Gly Gly Gln Asp Gly Ala Ala Arg Phe Gln Gly Leu Cys Asp

260 265 270

gag gac ggt tgc gac ttc aac agc tgg cgc cag ggc gac aag acg ttc 864

Glu Asp Gly Cys Asp Phe Asn Ser Trp Arg Gln Gly Asp Lys Thr Phe

275 280 285

tac ggc ccg gga ttg act gtt gac acg aag tcg ccg ttc aca gtc gtc 912

Tyr Gly Pro Gly Leu Thr Val Asp Thr Lys Ser Pro Phe Thr Val Val

290 295 300

aca caa ttc gtc gga agt ccg gtg aag gaa atc cgc agg aag tac gtc 960

Thr Gln Phe Val Gly Ser Pro Val Lys Glu Ile Arg Arg Lys Tyr Val

305 310 315 320

cag aac gga aag gtg att gag aac tcg aag aac aag att tcg gga att 1008

Gln Asn Gly Lys Val Ile Glu Asn Ser Lys Asn Lys Ile Ser Gly Ile

325 330 335

gac gag acg aac gca gtg agt gat act ttc tgc gat cag caa aag aag 1056

Asp Glu Thr Asn Ala Val Ser Asp Thr Phe Cys Asp Gln Gln Lys Lys

340 345 350

gcc ttc ggt gat acg aac gat ttc aag aac aag ggc ggt ttc gct aag 1104

Ala Phe Gly Asp Thr Asn Asp Phe Lys Asn Lys Gly Gly Phe Ala Lys

355 360 365

ttg ggt cag gtg ttc gag act ggt cag gtt ctc gtg ctg tcg ctg tgg 1152

Leu Gly Gln Val Phe Glu Thr Gly Gln Val Leu Val Leu Ser Leu Trp

370 375 380

gat gac cac tcg gtt gca atg ctg tgg ttg gac tcg gcc tac cca acg 1200

Asp Asp His Ser Val Ala Met Leu Trp Leu Asp Ser Ala Tyr Pro Thr

385 390 395 400

aac aag gat aag agc agc cca ggt gtt gac cgt ggg cct tgc ccg acg 1248

Asn Lys Asp Lys Ser Ser Pro Gly Val Asp Arg Gly Pro Cys Pro Thr

405 410 415

act tcc ggg aag ccg gat gat gtt gaa agc caa tct ccc gat gca acc 1296

Thr Ser Gly Lys Pro Asp Asp Val Glu Ser Gln Ser Pro Asp Ala Thr

420 425 430

gtc att tat ggc aac atc aag ttc ggt gca ctg gac tcc act tac 1341

Val Ile Tyr Gly Asn Ile Lys Phe Gly Ala Leu Asp Ser Thr Tyr

435 440 445

<210> 14

<211> 447

<212> PRT

<213> 栗色新螱(Neotermes castaneus)

<400> 14

Ala Arg Gly Leu Ala Ala Ala Leu Phe Thr Phe Ala Cys Ser Val Gly

1 5 10 15

Ile Gly Thr Lys Thr Ala Glu Asn His Pro Lys Leu Asn Trp Gln Asn

20 25 30

Cys Ala Ser Lys Gly Ser Cys Ser Gln Val Ser Gly Glu Val Thr Met

35 40 45

Asp Ser Asn Trp Arg Trp Thr His Asp Gly Asn Gly Lys Asn Cys Tyr

50 55 60

Asp Gly Asn Thr Trp Ile Ser Ser Leu Cys Pro Asp Gly Lys Thr Cys

65 70 75 80

Ser Asp Lys Cys Val Leu Asp Gly Ala Glu Tyr Gln Ala Thr Tyr Gly

85 90 95

Ile Thr Ser Asn Gly Thr Ala Val Thr Leu Lys Phe Val Thr His Gly

100 105 110

Ser Tyr Ser Thr Asn Ile Gly Ser Arg Leu Tyr Leu Leu Lys Asp Glu

115 120 125

Asn Thr Tyr Tyr Ile Phe Lys Val Asn Asn Lys Glu Phe Thr Phe Ser

130 135 140

Val Asp Val Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe

145 150 155 160

Val Ser Met Asp Ala Asp Gly Gly Ala Gly Lys Tyr Ser Gly Ala Lys

165 170 175

Pro Gly Ala Lys Tyr Gly Leu Gly Tyr Cys Asp Ala Gln Cys Pro Ser

180 185 190

Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ser Asp Gly Trp Lys Pro

195 200 205

Gln Ala Asn Asp Lys Asn Ala Gly Asn Gly Lys Tyr Gly Ser Cys Cys

210 215 220

Ser Glu Met Asp Val Trp Glu Ala Asn Ser Gln Ala Thr Ala Tyr Thr

225 230 235 240

Pro His Val Cys Lys Thr Thr Gly Gln Gln Arg Cys Ser Gly Thr Ser

245 250 255

Glu Cys Gly Gly Gln Asp Gly Ala Ala Arg Phe Gln Gly Leu Cys Asp

260 265 270

Glu Asp Gly Cys Asp Phe Asn Ser Trp Arg Gln Gly Asp Lys Thr Phe

275 280 285

Tyr Gly Pro Gly Leu Thr Val Asp Thr Lys Ser Pro Phe Thr Val Val

290 295 300

Thr Gln Phe Val Gly Ser Pro Val Lys Glu Ile Arg Arg Lys Tyr Val

305 310 315 320

Gln Asn Gly Lys Val Ile Glu Asn Ser Lys Asn Lys Ile Ser Gly Ile

325 330 335

Asp Glu Thr Asn Ala Val Ser Asp Thr Phe Cys Asp Gln Gln Lys Lys

340 345 350

Ala Phe Gly Asp Thr Asn Asp Phe Lys Asn Lys Gly Gly Phe Ala Lys

355 360 365

Leu Gly Gln Val Phe Glu Thr Gly Gln Val Leu Val Leu Ser Leu Trp

370 375 380

Asp Asp His Ser Val Ala Met Leu Trp Leu Asp Ser Ala Tyr Pro Thr

385 390 395 400

Asn Lys Asp Lys Ser Ser Pro Gly Val Asp Arg Gly Pro Cys Pro Thr

405 410 415

Thr Ser Gly Lys Pro Asp Asp Val Glu Ser Gln Ser Pro Asp Ala Thr

420 425 430

Val Ile Tyr Gly Asn Ile Lys Phe Gly Ala Leu Asp Ser Thr Tyr

435 440 445

<210> 15

<211> 1359

<212> DNA

<213> 黑素白丝菌(Melanocarpus albomyces)

<220>

<221> CDS

<222> (1)..(1359)

<223>

<400> 15

atg atg atg aag cag tac ctc cag tac ctc gcg gcc gcg ctg ccg ctc 48

Met Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu

1 5 10 15

gtc ggc ctc gcc gcc ggc cag cgc gct ggt aac gag acg ccc gag agc 96

Val Gly Leu Ala Ala Gly Gln Arg Ala Gly Asn Glu Thr Pro Glu Ser

20 25 30

cac ccc ccg ctc acc tgg cag agg tgc acg gcc ccg ggc aac tgc cag 144

His Pro Pro Leu Thr Trp Gln Arg Cys Thr Ala Pro Gly Asn Cys Gln

35 40 45

acc gtg aac gcc gag gtc gta att gac gcc aac tgg cgc tgg ctg cac 192

Thr Val Asn Ala Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His

50 55 60

gac gac aac atg cag aac tgc tac gac ggc aac cag tgg acc aac gcc 240

Asp Asp Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala

65 70 75 80

tgc agc acc gcc acc gac tgc gct gag aag tgc atg atc gag ggt gcc 288

Cys Ser Thr Ala Thr Asp Cys Ala Glu Lys Cys Met Ile Glu Gly Ala

85 90 95

ggc gac tac ctg ggc acc tac ggc gcc tcg acc agc ggc gac gcc ctg 336

Gly Asp Tyr Leu Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu

100 105 110

acg ctc aag ttc gtc acg aag cac gag tac ggc acc aac gtc ggc tcg 384

Thr Leu Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Val Gly Ser

115 120 125

cgc ttc tac ctc atg aac ggc ccg gac aag tac cag atg ttc gac ctc 432

Arg Phe Tyr Leu Met Asn Gly Pro Asp Lys Tyr Gln Met Phe Asp Leu

130 135 140

ctg ggc aac gag ctt gcc ttt gac gtc gac ctc tcg acc gtc gag tgc 480

Leu Gly Asn Glu Leu Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys

145 150 155 160

ggc atc aac agc gcc ctg tac ttc gtc gcc atg gag gag gac ggc ggc 528

Gly Ile Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly

165 170 175

atg gcc agc tac ccg agc aac cag gcc ggc gcc cgg tac ggc act ggg 576

Met Ala Ser Tyr Pro Ser Asn Gln Ala Gly Ala Arg Tyr Gly Thr Gly

180 185 190

tac tgc gat gcc caa tgc gct cgt gac ctc aag ttc gtt ggc ggc aag 624

Tyr Cys Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys

195 200 205

gcc aac att gag ggc tgg aag ccg tcc acc aac gac ccc aac gct ggc 672

Ala Asn Ile Glu Gly Trp Lys Pro Ser Thr Asn Asp Pro Asn Ala Gly

210 215 220

gtc ggc ccg tac ggc ggc tgc tgc gct gag atc gac gtc tgg gag tcg 720

Val Gly Pro Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser

225 230 235 240

aac gcc tat gcc ttc gct ttc acg ccg cac gcg tgc acg acc aac gag 768

Asn Ala Tyr Ala Phe Ala Phe Thr Pro His Ala Cys Thr Thr Asn Glu

245 250 255

tac cac gtc tgc gag acc acc aac tgc ggt ggc acc tac tcg gag gac 816

Tyr His Val Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp

260 265 270

cgc ttc gcc ggc aag tgc gac gcc aac ggc tgc gac tac aac ccc tac 864

Arg Phe Ala Gly Lys Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr

275 280 285

cgc atg ggc aac ccc gac ttc tac ggc aag ggc aag acg ctc gac acc 912

Arg Met Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr

290 295 300

agc cgc aag ttc acc gtc gtc tcc cgc ttc gag gag aac aag ctc tcc 960

Ser Arg Lys Phe Thr Val Val Ser Arg Phe Glu Glu Asn Lys Leu Ser

305 310 315 320

cag tac ttc atc cag gac ggc cgc aag atc gag atc ccg ccg ccg acg 1008

Gln Tyr Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr

325 330 335

tgg gag ggc atg ccc aac agc agc gag atc acc ccc gag ctc tgc tcc 1056

Trp Glu Gly Met Pro Asn Ser Ser Glu Ile Thr Pro Glu Leu Cys Ser

340 345 350

acc atg ttc gat gtg ttc aac gac cgc aac cgc ttc gag gag gtc ggc 1104

Thr Met Phe Asp Val Phe Asn Asp Arg Asn Arg Phe Glu Glu Val Gly

355 360 365

ggc ttc gag cag ctg aac aac gcc ctc cgg gtt ccc atg gtc ctc gtc 1152

Gly Phe Glu Gln Leu Asn Asn Ala Leu Arg Val Pro Met Val Leu Val

370 375 380

atg tcc atc tgg gac gac cac tac gcc aac atg ctc tgg ctc gac tcc 1200

Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser

385 390 395 400

atc tac ccg ccc gag aag gag ggc cag ccc ggc gcc gcc cgt ggc gac 1248

Ile Tyr Pro Pro Glu Lys Glu Gly Gln Pro Gly Ala Ala Arg Gly Asp

405 410 415

tgc ccc acg gac tcg ggt gtc ccc gcc gag gtc gag gct cag ttc ccc 1296

Cys Pro Thr Asp Ser Gly Val Pro Ala Glu Val Glu Ala Gln Phe Pro

420 425 430

gac gcc cag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg 1344

Asp Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser

435 440 445

acc tac gac ttc taa 1359

Thr Tyr Asp Phe

450

<210> 16

<211> 452

<212> PRT

<213> 黑素白丝菌(Melanocarpus albomyces)

<400> 16

Met Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu

1 5 10 15

Val Gly Leu Ala Ala Gly Gln Arg Ala Gly Asn Glu Thr Pro Glu Ser

20 25 30

His Pro Pro Leu Thr Trp Gln Arg Cys Thr Ala Pro Gly Asn Cys Gln

35 40 45

Thr Val Asn Ala Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His

50 55 60

Asp Asp Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala

65 70 75 80

Cys Ser Thr Ala Thr Asp Cys Ala Glu Lys Cys Met Ile Glu Gly Ala

85 90 95

Gly Asp Tyr Leu Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu

100 105 110

Thr Leu Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Val Gly Ser

115 120 125

Arg Phe Tyr Leu Met Asn Gly Pro Asp Lys Tyr Gln Met Phe Asp Leu

130 135 140

Leu Gly Asn Glu Leu Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys

145 150 155 160

Gly Ile Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly

165 170 175

Met Ala Ser Tyr Pro Ser Asn Gln Ala Gly Ala Arg Tyr Gly Thr Gly

180 185 190

Tyr Cys Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys

195 200 205

Ala Asn Ile Glu Gly Trp Lys Pro Ser Thr Asn Asp Pro Asn Ala Gly

210 215 220

Val Gly Pro Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser

225 230 235 240

Asn Ala Tyr Ala Phe Ala Phe Thr Pro His Ala Cys Thr Thr Asn Glu

245 250 255

Tyr His Val Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp

260 265 270

Arg Phe Ala Gly Lys Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr

275 280 285

Arg Met Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr

290 295 300

Ser Arg Lys Phe Thr Val Val Ser Arg Phe Glu Glu Asn Lys Leu Ser

305 310 315 320

Gln Tyr Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr

325 330 335

Trp Glu Gly Met Pro Asn Ser Ser Glu Ile Thr Pro Glu Leu Cys Ser

340 345 350

Thr Met Phe Asp Val Phe Asn Asp Arg Asn Arg Phe Glu Glu Val Gly

355 360 365

Gly Phe Glu Gln Leu Asn Asn Ala Leu Arg Val Pro Met Val Leu Val

370 375 380

Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser

385 390 395 400

Ile Tyr Pro Pro Glu Lys Glu Gly Gln Pro Gly Ala Ala Arg Gly Asp

405 410 415

Cys Pro Thr Asp Ser Gly Val Pro Ala Glu Val Glu Ala Gln Phe Pro

420 425 430

Asp Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser

435 440 445

Thr Tyr Asp Phe

450

<210> 17

<211> 221

<212> DNA

<213> 玫瑰单瑞孢(Trichothecium roseum)

<220>

<221> misc_feature

<222> (1)..(221)

<223> 部分CBH1编码序列

<400> 17

tacgcccagt gcgcccgtga cctcaagttc ctcggcggca cttccaacta cgacggctgg 60

aagccctcgg acactgacga cagcgccggt gtcggcaacc gcggatcctg ctgcgccgag 120

attgacatct gggagtccaa ctcgcacgcc ttcgccttca ccccccacgc ctgcgagaac 180

aacgagtacc acatctgcga gaccaccgac tgcggcggca c 221

<210> 18

<211> 239

<212> DNA

<213> Humicola nigrescens

<220>

<221> misc_feature

<222> (1)..(239)

<223> 部分CBH1编码序列

<400> 18

tacggcacgg ggtactgcga cgcccaatgc gcccgcgatc tcaagttcgt tggcggcaag 60

gccaatgttg agggctggaa acagtccacc aacgatgcca atgccggcgt gggtccgatg 120

ggcggttgct gcgccgaaat tgacgtctgg gaatcgaacg cccatgcctt cgccttcacg 180

ccgcacgcgt gcgagaacaa caagtaccac atctgcgaga ctgacggatg cggcggcac 239

<210> 19

<211> 199

<212> DNA

<213> Cladorrhinum foecundissimum

<220>

<221> misc_feature

<222> (1)..(199)

<223> 部分CBH1编码序列

<400> 19

tacataaacg gtatcggcaa cgttgagggt tggtcctcct ctaccaacga tcccaacgct 60

ggtgtcggta accrcggtac ttgctgctcc gagaatggat atctgggagg ccaacaagat 120

ctcgaccgcc tacactcccc acccctgcac caccatcgac cagcacatgt gcgagggcaa 180

ctcgtgcggc ggaacctac 199

<210> 20

<211> 191

<212> DNA

<213> 棉色二孢(Diplodia gossypina)

<220>

<221> misc_feature

<222> (1)..(191)

<223> 部分CBH1编码序列

<400> 20

gttgatccga cggcaaggcc caacgtcgag ggctgggtcc cgtccgagaa cgactccaac 60

gctggtgtcg gcaaccttgg ctcttgctgt gctgagatgg atatctggga ggccaactcc 120

atctcgaccg cctacacccc ccacagctgc aagacggtcg cccagcactc ttgcactggc 180

gacgactgcg g 191

<210> 21

<211> 232

<212> DNA

<213> 嗜热毁丝酶(Myceliophthora thermophila)

<220>

<221> misc_feature

<222> (1)..(232)

<223> 部分CBH1编码序列

<400> 21

gggtactgcg acgcccaatg cgcacgcgac ctcaagttcg tcggcggcaa gggcaacatc 60

gagggctgga agccgtccac caacgatgcc aatgccggtg tcggtcctta tggcgggtgc 120

tgcgctgaga tcgacgtctg ggagtcgaac aagtatgctt tcgctttcac cccgcacggt 180

tgcgagaacc ctaaatacca cgtctgcgag accaccaact gcggcggcac ct 232

<210> 22

<211> 467

<212> DNA

<213> 微小根毛霉(Rhizomucor pusillus)

<220>

<221> misc_feature

<222> (1)..(467)

<223> 部分CBH1编码序列

<400> 22

tccttcgcct ttacccccca cgcttgctcg cagnaacgag taccacgtct gcaccaccaa 60

caactgcggc ggcacctact cggacgaccg cttcgccggc aagtgcgacg ccaacggttg 120

cgactacaac ccgttccgcc tgggcaacca ggacttctac ggcccgggca tgaccgtcga 180

caccaactcc aagttcaccg tcatctcccg cttcagggag aacgaggcct accaggtctt 240

catgcagggc ggccggacca tcgaggtccc ggccccgcag ctgtccgggc tcacccagtt 300

cgacgccaag atcacccccg agttctgcga cacctacccg accgtcttcg acgaccgcaa 360

ccgccacggc gagatcggcg gccacaccgc cctcaacgcc gccctgcgca tgcccatggt 420

cctcgtcatg tccatctggg ctgaccacta cgccagctgc tagtgtc 467

<210> 23

<211> 534

<212> DNA

<213> Meripilus giganteus

<220>

<221> misc_feature

<222> (1)..(534)

<223> 部分CBH1编码序列

<400> 23

gggagggctc cccgaacgac ccgaacgcgg gaagcggcca gtacggaacg tgctgcaacg 60

agatggacat ctgggaggcg aaccagaacg gcgcggcggt cacgccgcac gtctgctccg 120

tcgacggcca gacgcgctgc gagggcacgg actgcggcga cggcgacgag cggtacgacg 180

gcatctgcga caaggacggc tgcgacttca actcgtaccg catgggcgac cagtccttcc 240

tcggcctcgg caagaccgtc gacacctcga agaagttcac cgtcgtcacc cagttcctca 300

ccgcggacaa cacgacgtcc ggccagctca cggagatccg ccggctgtac gtgcaggacg 360

gcaaggtcat cgcgaactcg aagacgaaca tccccggcct cgactcgttc gactccatca 420

ccgacgactt ctgcaacgcg cagaaggagg tcttcggcga caccaactcg ttcgagaagc 480

tcggcggcct cgcggagatg ggcaaggcct tccagaaggg catggtcctc gtca 534

<210> 24

<211> 563

<212> DNA

<213> 黑耳(Exidia glandulosa)

<220>

<221> misc_feature

<222> (1)..(563)

<223> 部分CBH1编码序列

<400> 24

gccacgtcga gggctggact ccttcmccaa cgatgccaac gccggcattg gcacccacgg 60

ctcctgctgt tcggagatgg acatctggga ggctaacaat gttgccgctg cgtacacccc 120

ccatccttgc acaactatcg gccagtcgat ctgctcgggc gattcttgcg gaggaaccta 180

cagctctgac cgttacgccg gtgtctgcga tccagacggt tgcgatttca acagctaccg 240

catgggcgac acgggcttct acggcaaggg cctgacagtc gacacgagct ccaagttcac 300

cgtcgtcacc cagttcctca ccggctccga cggcaacctt tccgagatca agcgcttcta 360

cgtccagaac ggcaaggtca ttcccaactc gcagtccaag attgccggcg tcagcggcaa 420

ctccatcacc accgacttct gctccgccca gaagaccgcc ttcggcgaca ccaacgtctt 480

cgcgcaaaag ggaggtactc gccgggatgg gcgccgccct caaggccggc atggtcctcg 540

tcatgtccat ctgggacgac cac 563

<210> 25

<211> 218

<212> DNA

<213> 块团炭角菌(Xylaria hypoxylon)

<220>

<221> misc_feature

<222> (1)..(218)

<223> 部分CBH1编码序列

<400> 25

gacgctcagt gtgcccgtga cttgaagttc gtcggtggca agggcaacgt tgagggatgg 60

gagccatcca ccaacgacga caacgccggt gttggccctt acggwgcctg ctgtgccgaa 120

atsgatgtst gggagtccaa ctstcactct ttcgctttca cccctcaccc wtgcaccacc 180

aacgaatacc acgtctgtga gcaggacgag tgtggcgg 218

<210> 26

<211> 492

<212> DNA

<213> 支顶孢菌(Acremonium sp.)

<220>

<221> misc_feature

<222> (1)..(492)

<223> 部分CBH1编码序列

<400> 26

gggacggggt actgcgacgc ccaatgcgcc cgtgatctca agttcgtcgg cggcaaggcc 60

aacattgagg gctggaggcc gtccaccaac gacgcgaacg ccggcgtcgg cccgatgggc 120

ggctgctgcg cggaaatcga tgtctgggag tccaacgccc acgcttttgc cttcacgccg 180

cacgcgtgcg agaacaacaa ctaccacatc tgcgagacct ccaactgcgg cggtacctac 240

tccgacgacc gcttcgccgg cctctgcgac gccaacggct gcgactacaa cccgtaccgc 300

atgggcaacc ccgacttcta cggcaagggc aagactcttg acacctcgcg gaagttcacc 360

gtcgtcaccc gctttcagga gaacgacctc tcgcagtact tcgtccagga cggcccgaag 420

atcgagatcc cgcccccgac ctgggacggc ctcccgaaga gcagcacata cgccgagctg 480

tgcgcgaccc ag 492

<210> 27

<211> 481

<212> DNA

<213> 支顶孢菌(Acremonium sp.)

<220>

<221> misc_feature

<222> (1)..(481)

<223> 部分CBH1编码序列

<400> 27

ggctccgttt actcctaccc ttgcacggaa atcggccaga gccgctgcga gggcgacagc 60

tgcggcggta cctacagcac cgaccgctac gctggcgtct gcgaccccga tggatgcgac 120

ttcaactcgt accgccaggg caacaagacc ttctatggca agggcatgac cgtcgacacc 180

accaagaaga ttaccgtcgt cacccagttc ctcaccgact cgtccggcaa cctgtccgag 240

atcaagcgct tctacgccca gaacggcgtc gtcatcccca actccgagtc caccattgct 300

ggcgtccctg gcaactcgat cacccaggac tactgcgaca agcagaagac cgcctttggt 360

gacaacaacg acttcgacaa gaagggtggt ctcgcccaga tgggtaaggc cctggcccaa 420

cccatggtcc tcgtcatgtc cgtctgggat gaccatgccg tcaacatgct ctgcttcgaa 480

a 481

<210> 28

<211> 463

<212> DNA

<213> 毛壳霉(Chaetomium sp.)

<220>

<221> misc_feature

<222> (1)..(463)

<223> 部分CBH1编码序列

<400> 28

ctccccgtct tcacgccgca cgcgtgcaag aacatcaagt accacgtctg cgagacgtcg 60

ggatgcggcg gcacctactc ggaggaccgc ttcgcgggcg actgcgacgc caacggttgc 120

gactacaacc cctaccgcat gggcaacacc gacttctacg gcaagggcat gacggtcgac 180

accagcaaga agttcaccgt cgtgacccaa ttccaggaga acaagctcac ccagttcttc 240

gtccagaacg gcaagaagat cgagatccct ggccccaagt gggacggcat tgagggcgac 300

agcgccgcca tcacgcccca gctgtgcact tccatgttca aggccttcga cgaccgcgat 360

cgcttctcgg aggtcggcgg cttcacccag atcaaccagg ccctctcggt gcccatggtg 420

ctcgtcatgt ccatctggga cgaccactac gccaacatgc ttg 463

<210> 29

<211> 513

<212> DNA

<213> Chaetomidium pingtungium

<220>

<221> misc_feature

<222> (1)..(513)

<223> 部分CBH1编码序列

<400> 29

gaagggtggc agccctcctc caacgatgcc aatgcgggta ccggcaacca cgggtcctgc 60

tgcgcggaga tggatatctg ggaggccaac agcatctcca cggccttcac cccccatccg 120

tgcgacacgc ccggccaggt gatgtgcacc ggtgatgcct gcggtggcac ctacagctcc 180

gaccgctacg gcggcacctg cgaccccgac ggatgtgatt tcaactcctt ccgccagggc 240

aacaagacct tctacggccc tggcatgacc gtcgacacca agagcaagtt taccgtcgtc 300

acccagttca tcaccgacga cggcacctcc agcggcaccc tcaaggagat caagcgcttc 360

tacgtgcaga acggcaaggt gatccccaac tcggagtcga cctggaccgg cgtcagcggc 420

aactccatca ccaccgagta ctgcaccgcc cagaagagcc tgttccagga ccagaacgtc 480

ttcgaaaagc acggtggcct cgagggcatg ggt 513

<210> 30

<211> 579

<212> DNA

<213> 嗜热毁丝酶(Myceliophthora thermophila)

<220>

<221> misc_feature

<222> (1)..(579)

<223> 部分CBH1编码序列

<400> 30

gagatggata tttgggaggc caacaacatg gccgccgcct tcactcccca cccttgcacc 60

gtgatcggcc agtcgcgctg cgagggcgac tcgtgcggcg gtacctacag caccgaccgc 120

tatgccggca tctgcgaccc cgacggatgc gacttcaact cgtaccgcca gggcaacaag 180

accttctacg gcaagggcat gacggtcgac acgaccaaga agatcacggt cgtcacccag 240

ttcctcaaga actcggccgg cgagctctcc gagatcaagc ggttctacgt ccagaacggc 300

aaggtcatcc ccaactccga gtccaccatc ccgggcgtcg agggcaactc cattacccag 360

gactggtgcg accgccagaa ggccgctttc ggcgacgtga ccgactttca ggacaagggc 420

ggcatggtcc agatgggcaa ggccctcgcg ggcccaatgg tcctcgtcat gtccatctgg 480

gacgaccacg ccgtcaacat gctctggctc gaaatcacta gtgcggccgc tgcaggtcga 540

ccatatggga gagctccacg cgttggatgc atagcttga 579

<210> 31

<211> 514

<212> DNA

<213> 肉桂色毁丝霉(Myceliophthora hinnulea)

<220>

<221> misc_feature

<222> (1)..(514)

<223> 部分CBH1编码序列

<400> 31

cgtgagggct gggagagctc gaccaacgat gccaacgccg gcacgggcag gtacggcagc 60

tgctgctccg agatggacgt ctgggaggcc aacaacatgg ccaccgcctt caccccccat 120

ccttgcacca tcatcggcca gtcgcgctgc gagggcgaga cgtgcggcgg cacctacagc 180

tcggaccgct acgccggcgt ctgcgacccc gacggctgcg acttcaactc gtaccgccag 240

ggcaacaaga ccttctacgg caagggcatg acggtcgaca cgaccaagaa gctcacggtc 300

gtcacgcagt tcctcaagaa ctcggccggc gagctgtccg agatcaagcg gttctacgtc 360

caggacggca aggtgatccc caactccgag tccaccatcc ccggcgtcga gggcaactcg 420

atcacgcagg actggtgcga ccgccagaag gccgccttcg gcgacgtcac cgacttccag 480

gacaagggcg gcatggtcca gatggcaagg cgct 514

<210> 32

<211> 477

<212> DNA

<213> Sporotrichum pruinosum

<220>

<221> misc_feature

<222> (1)..(477)

<223> 部分CBH1编码序列

<400> 32

cacccttgcc gcaccacgaa cgacggtggc taccaacgct gccaaggacg tgactgcaac 60

cagcctcgtt atgagggtct ttgcgatcct gacggttgcg actacaaccc tttccgtatg 120

ggtaaccgcg aattctacgg ccctggaaag accgtcgaca ccaacaggaa gttcactgtt 180

gtgacccaat tcattaccga caacaactct gacactggta ccctcgtcga catccgccgc 240

ctctacgtcc aagacggccg tgtcattgcc aaccctccca ccaacttccc cggtctcatg 300

cccgcccacg actccatcac ttagcaattc tgtgacgacg ccaagcgagc attcgaggac 360

aacgacagct ttggcaggaa cggtggtctt gctcacatgg gtcgctccct tgccaagggc 420

catgtcctcg ccctttccat ttggaatgat cacactgcca acatgctctg gctcgaa 477

<210> 33

<211> 500

<212> DNA

<213> Thielavia cf.microspora

<220>

<221> misc_feature

<222> (1)..(500)

<223> 部分CBH1编码序列

<400> 33

gagatagatg tctgggagtc caactcgcac tcgtttgcct tcacgccgca cgcgtgcaag 60

aacaacaagt accacgtctg ccagacgacc gggtgcggcg gcacctactc ggaggaccgc 120

ttcgccggcg actgcgacgc caacggctgc gactacaacc cctaccgcat gggcaacacc 180

gacttttacg gcaagggcaa gacggtcgac acgagcaaga agtttaccat ggtgacccag 240

ttccaaaaga acaagctcgt ccagttcttt gtccaggacg gcaagaagat cgacatcccc 300

ggccccaagt gggacggcct gccgcagggc agcgccgcca tcaccccgga gctgtgcacc 360

ttcatgttca aggccttcaa cgaccgcgac cgcttctcag aggttggcgg cttcgaccag 420

atcaacacgg ccctctcggt gccaatggtg ctcgtcatgt ccatctggga tgatcactac 480

gccaacatgc tctggcttga 500

<210> 34

<211> 470

<212> DNA

<213> 小柱胞菌(Scytalidium sp.)

<220>

<221> misc_feature

<222> (1)..(470)

<223> 部分CBH1编码序列

<400> 34

cgttnggccc gcgtcgcatg ctcccgcccg catggcccgc gggatttcca gccagagcat 60

gttggagtgg tggtcatccc agatggacat gacaaggacc atgggaatgg tgagggcctc 120

gttcagagca tcgaagccac cggtctcggc gaagcggttg cggtcatcga agacgcggaa 180

ctgagcatcg cagagctcag gggtgatgtc ggcgctgttc gggaggccgg gccaggtcgg 240

agggggcacc tcgatcttgc ggccgtcctg gacgaagaac tgagagagcc tgttacgctc 300

gaagcgggag acaacggtga acttgcggtt ggtgtcgacg gtcttgccct tgccatagaa 360

gtccttgttg cccatgcggt aggggttgta gtcgcagccg ttggcatcgc agtagccggc 420

gaagcggtca tccgagtagg taccaccgca gttgttggtc tccagatgtg 470

<210> 35

<211> 491

<212> DNA

<213> 小柱胞菌(Scytalidium sp.)

<220>

<221> misc_feature

<222> (1)..(491)

<223> 部分CBH1编码序列

<400> 35

gaaatcgacg tctgggagtc gaacgcctat gcctatgcct taccccgcac gcttgcggca 60

gccagaaccg ctaccacgtc tgcgagacca acaactgcgg tggtacctac tcggatgacc 120

gcttcgccgg ttactgcgat gccaacggct gcgactacaa cccgtaccgc atgggcaaca 180

gggacttcta cggcaagggc ctgcaggtcg acaccagccg gaagttcacc gtcgtgagcc 240

gcttcgagcg caacaagctc acccagttct tcgttcagga cggccgcaag atcgagcccc 300

ctgcgccgac ctgggacggc atcccgaaga gcgccgacat cacccccgag ttctgcagcg 360

cccagttcaa ggtcttcgac gaccgtgacc gcttcgcgga gactggcggc ttcgatgccc 420

tgaacgatgc tctcagcatt cccatggtcc ttgtcatgtc catctgggat taccactact 480

ccaacataat c 491

<210> 36

<211> 221

<212> DNA

<213> 囊状长毛盘菌(Trichophaea saccata)

<220>

<221> misc_feature

<222> (1)..(221)

<223> 部分CBH1编码序列

<400> 36

tgcgactccc agtgtccccg cgatctcaag ttcatcaatg gacagggcaa cgttgaaggc 60

tggaagccat cctcaaatga tgccaacgca ggcgtcgggg gacacggttc ctgctgcgca 120

gagatggatg tttgggaggc caattccatc tccgcggccg taacaccgca ctcgtgctcc 180

acaaccagcc agacgatgtg caacggcgac tcctgcggcg g 221

<210> 37

<211> 1365

<212> DNA

<213> 棉色二孢(Diplodia gossypina)

<220>

<221> CDS

<222> (1)..(1365)

<223>

<400> 37

atg ctt acc cag gca gtt ctc gct act ctc gcc acc ctg gcc gcc agc 48

Met Leu Thr Gln Ala Val Leu Ala Thr Leu Ala Thr Leu Ala Ala Ser

1 5 10 15

cag cag gtc ggc acc cag aag gag gag gtc cac ccc tcc atg acc tgg 96

Gln Gln Val Gly Thr Gln Lys Glu Glu Val His Pro Ser Met Thr Trp

20 25 30

cag act tgc acc agc agc ggc tgc acc acc aac cag ggc tcc atc gtc 144

Gln Thr Cys Thr Ser Ser Gly Cys Thr Thr Asn Gln Gly Ser Ile Val

35 40 45

gtt gac gcc aac tgg cgc tgg gtc cac aac acc gag ggc tac acc aac 192

Val Asp Ala Asn Trp Arg Trp Val His Asn Thr Glu Gly Tyr Thr Asn

50 55 60

tgc tac acg ggc aac acc tgg aac gcc gac tac tgc acc gac aac acc 240

Cys Tyr Thr Gly Asn Thr Trp Asn Ala Asp Tyr Cys Thr Asp Asn Thr

65 70 75 80

gag tgc gcc tcc aac tgc gcc ctc gac ggc gcc gac tac tct ggc acc 288

Glu Cys Ala Ser Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr

85 90 95

tac ggc gct acc acc tcc ggc gac tcg ctg cgc ctg aac ttc atc acc 336

Tyr Gly Ala Thr Thr Ser Gly Asp Ser Leu Arg Leu Asn Phe Ile Thr

100 105 110

aac ggc cag cag aag aac att ggc tcc cgc atg tac ctc atg cag gat 384

Asn Gly Gln Gln Lys Asn Ile Gly Ser Arg Met Tyr Leu Met Gln Asp

115 120 125

gac gag acc tac gcc gtc cac aag ctc ctc aac aag gag ttc acc ttc 432

Asp Glu Thr Tyr Ala Val His Lys Leu Leu Asn Lys Glu Phe Thr Phe

130 135 140

gac gtc gac acc tcc aag ctg cct tgc ggc ctc aac ggt gcc gtc tac 480

Asp Val Asp Thr Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Val Tyr

145 150 155 160

ttc gtc tcc atg gac gct gac ggt ggc atg gcc aag ttc ccc gac aac 528

Phe Val Ser Met Asp Ala Asp Gly Gly Met Ala Lys Phe Pro Asp Asn

165 170 175

aag gcc ggc gcc aag tac ggt acc ggt tac tgc gac tcg cag tgc ccc 576

Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro

180 185 190

cgt gac ctc aag ttc atc gac ggc aag gcc aac gtc gag ggc tgg gtc 624

Arg Asp Leu Lys Phe Ile Asp Gly Lys Ala Asn Val Glu Gly Trp Val

195 200 205

ccg tcc gag aac gac tcc aac gct ggt gtc ggc aac ctt ggc tct tgc 672

Pro Ser Glu Asn Asp Ser Asn Ala Gly Val Gly Asn Leu Gly Ser Cys

210 215 220

tgt gct gag atg gat atc tgg gag gcc aac tcc atc tcg acc gcc tac 720

Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Tyr

225 230 235 240

acc ccc cac agc tgc aag acg gtc gcc cag cac tct tgc act ggc gac 768

Thr Pro His Ser Cys Lys Thr Val Ala Gln His Ser Cys Thr Gly Asp

245 250 255

gac tgc ggt ggc acc tac tcc gcg acc cgc tac gcc ggc gac tgc gac 816

Asp Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly Asp Cys Asp

260 265 270

ccc gac gga tgc gac ttc aac tcg tac cgc cag ggc gtc aag gac ttc 864

Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Val Lys Asp Phe

275 280 285

tac ggg ccc ggc atg acc gtc gac agc aac tcg gtc gtc acc gtc gtc 912

Tyr Gly Pro Gly Met Thr Val Asp Ser Asn Ser Val Val Thr Val Val

290 295 300

acg cag ttc atc acc aac gac ggc acc gcg tcc ggc acc ctc tcc gag 960

Thr Gln Phe Ile Thr Asn Asp Gly Thr Ala Ser Gly Thr Leu Ser Glu

305 310 315 320

atc aag cgc ttc tac gtc cag aac ggc aag gtt atc ccc aac tcc gag 1008

Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu

325 330 335

tcc acc atc gcc ggc gtc agc ggc aac agc atc acc tcc gcg tac tgc 1056

Ser Thr Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Ser Ala Tyr Cys

340 345 350

gac gcg cag aag gag gtc ttc ggc gac aac acg tcg ttc cag gac cag 1104

Asp Ala Gln Lys Glu Val Phe Gly Asp Asn Thr Ser Phe Gln Asp Gln

355 360 365

ggc ggc ttg gcc agc atg agc cag gcc ctc aac gcc ggc atg gtc ctc 1152

Gly Gly Leu Ala Ser Met Ser Gln Ala Leu Asn Ala Gly Met Val Leu

370 375 380

gtc atg tcc atc tgg gac gac cac cac agc aac atg ctc tgg ctc gac 1200

Val Met Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp

385 390 395 400

tcc gac tac ccc gtc gac gcc gac ccg agc cag ccc ggc atc tcc cgc 1248

Ser Asp Tyr Pro Val Asp Ala Asp Pro Ser Gln Pro Gly Ile Ser Arg

405 410 415

ggt act tgc ccc acc acc tct ggt gtc ccc agc gag gtt gag gag agc 1296

Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ser Glu Val Glu Glu Ser

420 425 430

gcc gct agc gcc tac gtc gtc tac tcg aac att aag gtt ggt gac ctt 1344

Ala Ala Ser Ala Tyr Val Val Tyr Ser Asn Ile Lys Val Gly Asp Leu

435 440 445

aac agc act ttc tct gct tag 1365

Asn Ser Thr Phe Ser Ala

450

<210> 38

<211> 454

<212> PRT

<213> 棉色二孢(Diplodia gossypina)

<400> 38

Met Leu Thr Gln Ala Val Leu Ala Thr Leu Ala Thr Leu Ala Ala Ser

1 5 10 15

Gln Gln Val Gly Thr Gln Lys Glu Glu Val His Pro Ser Met Thr Trp

20 25 30

Gln Thr Cys Thr Ser Ser Gly Cys Thr Thr Asn Gln Gly Ser Ile Val

35 40 45

Val Asp Ala Asn Trp Arg Trp Val His Asn Thr Glu Gly Tyr Thr Asn

50 55 60

Cys Tyr Thr Gly Asn Thr Trp Asn Ala Asp Tyr Cys Thr Asp Asn Thr

65 70 75 80

Glu Cys Ala Ser Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr

85 90 95

Tyr Gly Ala Thr Thr Ser Gly Asp Ser Leu Arg Leu Asn Phe Ile Thr

100 105 110

Asn Gly Gln Gln Lys Asn Ile Gly Ser Arg Met Tyr Leu Met Gln Asp

115 120 125

Asp Glu Thr Tyr Ala Val His Lys Leu Leu Asn Lys Glu Phe Thr Phe

130 135 140

Asp Val Asp Thr Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Val Tyr

145 150 155 160

Phe Val Ser Met Asp Ala Asp Gly Gly Met Ala Lys Phe Pro Asp Asn

165 170 175

Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro

180 185 190

Arg Asp Leu Lys Phe Ile Asp Gly Lys Ala Asn Val Glu Gly Trp Val

195 200 205

Pro Ser Glu Asn Asp Ser Asn Ala Gly Val Gly Asn Leu Gly Ser Cys

210 215 220

Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Tyr

225 230 235 240

Thr Pro His Ser Cys Lys Thr Val Ala Gln His Ser Cys Thr Gly Asp

245 250 255

Asp Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly Asp Cys Asp

260 265 270

Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Val Lys Asp Phe

275 280 285

Tyr Gly Pro Gly Met Thr Val Asp Ser Asn Ser Val Val Thr Val Val

290 295 300

Thr Gln Phe Ile Thr Asn Asp Gly Thr Ala Ser Gly Thr Leu Ser Glu

305 310 315 320

Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu

325 330 335

Ser Thr Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Ser Ala Tyr Cys

340 345 350

Asp Ala Gln Lys Glu Val Phe Gly Asp Asn Thr Ser Phe Gln Asp Gln

355 360 365

Gly Gly Leu Ala Ser Met Ser Gln Ala Leu Asn Ala Gly Met Val Leu

370 375 380

Val Met Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp

385 390 395 400

Ser Asp Tyr Pro Val Asp Ala Asp Pro Ser Gln Pro Gly Ile Ser Arg

405 410 415

Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ser Glu Val Glu Glu Ser

420 425 430

Ala Ala Ser Ala Tyr Val Val Tyr Ser Asn Ile Lys Val Gly Asp Leu

435 440 445

Asn Ser Thr Phe Ser Ala

450

<210> 39

<211> 1377

<212> DNA

<213> 囊状长毛盘菌(Trichophaea saccata)

<220>

<221> CDS

<222> (1)..(1377)

<223>

<400> 39

atg caa cgc ctt ctc gtt ctt ctc acc tcc ctt ctc gct ttc acc tat 48

Met Gln Arg Leu Leu Val Leu Leu Thr Ser Leu Leu Ala Phe Thr Tyr

1 5 10 15

ggc caa caa gtt ggc act caa cag gcc gaa gtc cac ccc tcg atg acc 96

Gly Gln Gln Val Gly Thr Gln Gln Ala Glu Val His Pro Ser Met Thr

20 25 30

tgg cag cag tgt aca aag tcc ggc ggc tgc acc acg aag aac ggc aaa 144

Trp Gln Gln Cys Thr Lys Ser Gly Gly Cys Thr Thr Lys Asn Gly Lys

35 40 45

gtc gtg atc gat gcc aac tgg cgt tgg gta cac aat gtc ggc ggc tac 192

Val Val Ile Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly Tyr

50 55 60

acc aat tgc tac act ggc aac acc tgg gac agt tcg ctt tgt ccc gac 240

Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Ser Ser Leu Cys Pro Asp

65 70 75 80

gat gtc acc tgc gcg aag aat tgc gct ctt gat ggc gcg gac tac tct 288

Asp Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser

85 90 95

ggc act tat gga gtt act gcg ggc ggg aat tcg ttg aag ctc acc ttc 336

Gly Thr Tyr Gly Val Thr Ala Gly Gly Asn Ser Leu Lys Leu Thr Phe

100 105 110

gtc act aag ggt caa tac tct act aat gtg ggc tcg cga ttg tat atg 384

Val Thr Lys Gly Gln Tyr Ser Thr Asn Val Gly Ser Arg Leu Tyr Met

115 120 125

ctc gcc gac gac agc aca tac cag atg tat aat ctg ctg aac cag gag 432

Leu Ala Asp Asp Ser Thr Tyr Gln Met Tyr Asn Leu Leu Asn Gln Glu

130 135 140

ttt acg ttc gac gtt gat gtt tct aat ctt cct tgt ggg ctt aac ggg 480

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly

145 150 155 160

gct ctg tat ttc gtc tcg atg gat aag gat ggt ggg atg tcg aag tac 528

Ala Leu Tyr Phe Val Ser Met Asp Lys Asp Gly Gly Met Ser Lys Tyr

165 170 175

tct ggg aac aag gct ggt gcc aag tat gga act ggg tac tgc gac tcc 576

Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

cag tgt ccc cgc gat ctc aag ttc atc aat gga cag ggc aac gtt gaa 624

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Gly Asn Val Glu

195 200 205

ggc tgg aag cca tcc tca aat gat gcc aac gca ggc gtc ggg gga cac 672

Gly Trp Lys Pro Ser Ser Asn Asp Ala Asn Ala Gly Val Gly Gly His

210 215 220

ggt tcc tgc tgc gca gag atg gat gtt tgg gag gcc aat tcc atc tcc 720

Gly Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser

225 230 235 240

gcg gcc gta aca ccg cac tcg tgc tcc aca acc agc cag acg atg tgc 768

Ala Ala Val Thr Pro His Ser Cys Ser Thr Thr Ser Gln Thr Met Cys

245 250 255

aac ggc gac tcc tgc ggc ggt acc tac tca gcc aca cga tac gct ggt 816

Asn Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly

260 265 270

gtc tgc gat ccc gat ggc tgc gac ttc aac tcc tac cgt atg ggc gac 864

Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp

275 280 285

acg acc ttc tac ggc aag gga aag acg gtc gat acc agc tcc aag ttc 912

Thr Thr Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Ser Ser Lys Phe

290 295 300

acg gtc gtg acc cag ttc atc acc gac act gga acc gcc tcc ggc tcg 960

Thr Val Val Thr Gln Phe Ile Thr Asp Thr Gly Thr Ala Ser Gly Ser

305 310 315 320

ctc acg gag atc cgc cgc ttc tac gtc cag aac gga aag ttg atc ccc 1008

Leu Thr Glu Ile Arg Arg Phe Tyr Val Gln Asn Gly Lys Leu Ile Pro

325 330 335

aac tcc cag tcg aag atc tcg ggc gtc act ggc aac tcc atc acc tct 1056

Asn Ser Gln Ser Lys Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Ser

340 345 350

gct ttc tgc gac gct cag aag gcg gct ttc ggc gat aac tac acg ttc 1104

Ala Phe Cys Asp Ala Gln Lys Ala Ala Phe Gly Asp Asn Tyr Thr Phe

355 360 365

aag gac aag ggc ggc ttc gca tcc atg act act gct atg aag aac gga 1152

Lys Asp Lys Gly Gly Phe Ala Ser Met Thr Thr Ala Met Lys Asn Gly

370 375 380

atg gtc ctg gtt atg agt ctt tgg gat gac cac tac gcc aat atg ctc 1200

Met Val Leu Val Met Ser Leu Trp Asp Asp His Tyr Ala Asn Met Leu

385 390 395 400

tgg ctt gat agc gac tat ccc act aac gcg gac tcc tcc aag ccg ggt 1248

Trp Leu Asp Ser Asp Tyr Pro Thr Asn Ala Asp Ser Ser Lys Pro Gly

405 410 415

gtt gct cgt ggc acc tgc ccg act tct tcc ggc gtg ccc tcg gat gtc 1296

Val Ala Arg Gly Thr Cys Pro Thr Ser Ser Gly Val Pro Ser Asp Val

420 425 430

gag act aac aat gca agc gct tcg gtc acg tac tcc aac att aga ttt 1344

Glu Thr Asn Asn Ala Ser Ala Ser Val Thr Tyr Ser Asn Ile Arg Phe

435 440 445

gga gat ctc aat tcc act tac acc gcc cag taa 1377

Gly Asp Leu Asn Ser Thr Tyr Thr Ala Gln

450 455

<210> 40

<211> 458

<212> PRT

<213> 囊状长毛盘菌(Trichophaea saccata)

<400> 40

Met Gln Arg Leu Leu Val Leu Leu Thr Ser Leu Leu Ala Phe Thr Tyr

1 5 10 15

Gly Gln Gln Val Gly Thr Gln Gln Ala Glu Val His Pro Ser Met Thr

20 25 30

Trp Gln Gln Cys Thr Lys Ser Gly Gly Cys Thr Thr Lys Asn Gly Lys

35 40 45

Val Val Ile Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly Tyr

50 55 60

Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Ser Ser Leu Cys Pro Asp

65 70 75 80

Asp Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser

85 90 95

Gly Thr Tyr Gly Val Thr Ala Gly Gly Asn Ser Leu Lys Leu Thr Phe

100 105 110

Val Thr Lys Gly Gln Tyr Ser Thr Asn Val Gly Ser Arg Leu Tyr Met

115 120 125

Leu Ala Asp Asp Ser Thr Tyr Gln Met Tyr Asn Leu Leu Asn Gln Glu

130 135 140

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly

145 150 155 160

Ala Leu Tyr Phe Val Ser Met Asp Lys Asp Gly Gly Met Ser Lys Tyr

165 170 175

Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Gly Asn Val Glu

195 200 205

Gly Trp Lys Pro Ser Ser Asn Asp Ala Asn Ala Gly Val Gly Gly His

210 215 220

Gly Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser

225 230 235 240

Ala Ala Val Thr Pro His Ser Cys Ser Thr Thr Ser Gln Thr Met Cys

245 250 255

Asn Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly

260 265 270

Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp

275 280 285

Thr Thr Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Ser Ser Lys Phe

290 295 300

Thr Val Val Thr Gln Phe Ile Thr Asp Thr Gly Thr Ala Ser Gly Ser

305 310 315 320

Leu Thr Glu Ile Arg Arg Phe Tyr Val Gln Asn Gly Lys Leu Ile Pro

325 330 335

Asn Ser Gln Ser Lys Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Ser

340 345 350

Ala Phe Cys Asp Ala Gln Lys Ala Ala Phe Gly Asp Asn Tyr Thr Phe

355 360 365

Lys Asp Lys Gly Gly Phe Ala Ser Met Thr Thr Ala Met Lys Asn Gly

370 375 380

Met Val Leu Val Met Ser Leu Trp Asp Asp His Tyr Ala Asn Met Leu

385 390 395 400

Trp Leu Asp Ser Asp Tyr Pro Thr Asn Ala Asp Ser Ser Lys Pro Gly

405 410 415

Val Ala Arg Gly Thr Cys Pro Thr Ser Ser Gly Val Pro Ser Asp Val

420 425 430

Glu Thr Asn Asn Ala Ser Ala Ser Val Thr Tyr Ser Asn Ile Arg Phe

435 440 445

Gly Asp Leu Asn Ser Thr Tyr Thr Ala Gln

450 455

<210> 41

<211> 1353

<212> DNA

<213> 嗜热毁丝酶(Myceliophthora thermophila)

<220>

<221> CDS

<222> (1)..(1353)

<223>

<400> 41

atg aag cag tac ctc cag tac ctc gcg gcg acc ctg ccc ctg gtg ggc 48

Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly

1 5 10 15

ctg gcc acg gcc cag cag gcg ggt aac ctg cag acc gag act cac ccc 96

Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro

20 25 30

agg ctc act tgg tcc aag tgc acg gcc ccg gga tcc tgc caa cag gtc 144

Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val

35 40 45

aac ggc gag gtc gtc atc gac tcc aac tgg cgc tgg gtg cac gac gag 192

Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu

50 55 60

aac gcg cag aac tgc tac gac ggc aac cag tgg acc aac gct tgc agc 240

Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser

65 70 75 80

tct gcc acc gac tgc gcc gag aat tgc gcg ctc gag ggt gcc gac tac 288

Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr

85 90 95

cag ggc acc tat ggc gcc tcg acc agc ggc aat gcc ctg acg ctc acc 336

Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr

100 105 110

ttc gtc act aag cac gag tac ggc acc aac att ggc tcg cgc ctc tac 384

Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr

115 120 125

ctc atg aac ggc gcg aac aag tac cag atg ttc acc ctc aag ggc aac 432

Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn

130 135 140

gag ctg gcc ttc gac gtc gac ctc tcg gcc gtc gag tgc ggc ctc aac 480

Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn

145 150 155 160

agc gcc ctc tac ttc gtg gcc atg gag gag gat ggc ggt gtg tcg agc 528

Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser

165 170 175

tac ccg acc aac acg gcc ggt gct aag ttc ggc act ggg tac tgc gac 576

Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp

180 185 190

gcc caa tgc gca cgc gac ctc aag ttc gtc ggc ggc aag ggc aac atc 624

Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile

195 200 205

gag ggc tgg aag ccg tcc acc aac gat gcc aat gcc ggt gtc ggt cct 672

Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro

210 215 220

tat ggc ggg tgc tgc gct gag atc gac gtc tgg gag tcg aac aag tat 720

Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr

225 230 235 240

gct ttc gct ttc acc ccg cac ggt tgc gag aac cct aaa tac cac gtc 768

Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val

245 250 255

tgc gag acc acc aac tgc ggt ggc acc tac tcc gag gac cgc ttc gct 816

Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala

260 265 270

ggt gac tgc gat gcc aac ggc tgc gac tac aac ccc tac cgc atg ggc 864

Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly

275 280 285

aac cag gac ttc tac ggt ccc ggc ttg acg gtc gat acc agc aag aag 912

Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys

290 295 300

ttc acc gtc gtc agc cag ttc gag gag aac aag ctc acc cag ttc ttc 960

Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe

305 310 315 320

gtc cag gac ggc aag aag att gag atc ccc ggc ccc aag gtc gag ggc 1008

Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly

325 330 335

atc gat gcg gac agc gcc gct atc acc cct gag ctg tgc agt gcc ctg 1056

Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu

340 345 350

ttc aag gcc ttc gat gac cgt gac cgc ttc tcg gag gtt ggc ggc ttc 1104

Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe

355 360 365

gat gcc atc aac acg gcc ctc agc act ccc atg gtc ctc gtc atg tcc 1152

Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser

370 375 380

atc tgg gat gat cac tac gcc aat atg ctc tgg ctc gac tcg agc tac 1200

Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr

385 390 395 400

ccc cct gag aag gct ggc cag cct ggc ggt gac cgt ggc ccg tgt cct 1248

Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro

405 410 415

cag gac tct ggc gtc ccg gcc gac gtt gag gct cag tac cct aat gcc 1296

Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala

420 425 430

aag gtc atc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg act gtc 1344

Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val

435 440 445

aac gtc taa 1353

Asn Val

450

<210> 42

<211> 450

<212> PRT

<213> 嗜热毁丝酶(Myceliophthora thermophila)

<400> 42

Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly

1 5 10 15

Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro

20 25 30

Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val

35 40 45

Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu

50 55 60

Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser

65 70 75 80

Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr

85 90 95

Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr

100 105 110

Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr

115 120 125

Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn

130 135 140

Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn

145 150 155 160

Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser

165 170 175

Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp

180 185 190

Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile

195 200 205

Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro

210 215 220

Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr

225 230 235 240

Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val

245 250 255

Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala

260 265 270

Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly

275 280 285

Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys

290 295 300

Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe

305 310 315 320

Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly

325 330 335

Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu

340 345 350

Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe

355 360 365

Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser

370 375 380

Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr

385 390 395 400

Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro

405 410 415

Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala

420 425 430

Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val

435 440 445

Asn Val

450

<210> 43

<211> 1341

<212> DNA

<213> 块团炭角菌(Xylaria hypoxylon)

<220>

<221> CDS

<222> (1)..(1341)

<223>

<400> 43

atg ttg tcc ctc gcc gtg tcg gcc gcc ctt ctc ggg ctc gcg tct gcc 48

Met Leu Ser Leu Ala Val Ser Ala Ala Leu Leu Gly Leu Ala Ser Ala

1 5 10 15

cag cag gtt gga aag gag caa tct gag act cac cct aag ctg tct tgg 96

Gln Gln Val Gly Lys Glu Gln Ser Glu Thr His Pro Lys Leu Ser Trp

20 25 30

aag aag tgc acc agc ggt ggt tcc tgc acc cag acc aac gct gag gtg 144

Lys Lys Cys Thr Ser Gly Gly Ser Cys Thr Gln Thr Asn Ala Glu Val

35 40 45

acc atc gac tct aac tgg cga tgg ctt cac tct ctc gaa ggc act gag 192

Thr Ile Asp Ser Asn Trp Arg Trp Leu His Ser Leu Glu Gly Thr Glu

50 55 60

aac tgc tac gat ggt aac aag tgg acc tcg cag tgc agc act ggc gag 240

Asn Cys Tyr Asp Gly Asn Lys Trp Thr Ser Gln Cys Ser Thr Gly Glu

65 70 75 80

gac tgc gcc acc aag tgc gcc atc gag ggt gcc gac tac agc aag acc 288

Asp Cys Ala Thr Lys Cys Ala Ile Glu Gly Ala Asp Tyr Ser Lys Thr

85 90 95

tac ggt gcc tct act agc ggc gat gct ctt acc ctc aag ttc ctg acc 336

Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu Thr Leu Lys Phe Leu Thr

100 105 110

aag cac gag tac gga acc aac atc ggc tcc cga ttc tac ctt atg aat 384

Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe Tyr Leu Met Asn

115 120 125

ggt gcc gac aag tac cag acc ttc gac ctc aag ggt aac gag ttc acc 432

Gly Ala Asp Lys Tyr Gln Thr Phe Asp Leu Lys Gly Asn Glu Phe Thr

130 135 140

ttc gat gtc gac ctg tcc acc gtc gac tgt ggt ctt aac gcc gct ctt 480

Phe Asp Val Asp Leu Ser Thr Val Asp Cys Gly Leu Asn Ala Ala Leu

145 150 155 160

tac ttc gtc gcc atg gag gaa gac ggt ggc atg gct agc tac ccc aac 528

Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala Ser Tyr Pro Asn

165 170 175

aac aag gcc ggt gcc aag tac ggt acc ggt tac tgt gac gct cag tgt 576

Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys

180 185 190

gcc cgt gac ttg aag ttc gtc ggt ggc aag ggc aac gtt gag gga tgg 624

Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Val Glu Gly Trp

195 200 205

gag cca tcc acc aac gac gac aac gcc ggt gtt ggc cct tac ggt gcc 672

Glu Pro Ser Thr Asn Asp Asp Asn Ala Gly Val Gly Pro Tyr Gly Ala

210 215 220

tgc tgt gcc gaa atc gat gtc tgg gag tcc aac tct cac tct ttc gct 720

Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ser His Ser Phe Ala

225 230 235 240

ttc acc cct cac cct tgc acc acc aac gaa tac cac gtc tgt gag cag 768

Phe Thr Pro His Pro Cys Thr Thr Asn Glu Tyr His Val Cys Glu Gln

245 250 255

gac gag tgt ggt ggt acc tac tct gag gac cga ttc gct ggc aag tgt 816

Asp Glu Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala Gly Lys Cys

260 265 270

gat gcc aac ggt tgt gac tac aac cct tac cgc atg ggt aac acc gac 864

Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly Asn Thr Asp

275 280 285

ttc tac ggc cag ggc aag acc gtc gac acc agc aag aaa ttc act gtt 912

Phe Tyr Gly Gln Gly Lys Thr Val Asp Thr Ser Lys Lys Phe Thr Val

290 295 300

gtc acc cag ttc gcc gaa aac aag ttg act cag ttc ttc gtc cag gac 960

Val Thr Gln Phe Ala Glu Asn Lys Leu Thr Gln Phe Phe Val Gln Asp

305 310 315 320

ggt aag aag att gag atc ccc ggt ccc aag att gac ggt ttc cct acc 1008

Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Ile Asp Gly Phe Pro Thr

325 330 335

gat agc gcc atc acc ccc gag tac tgc act gcc gaa ttc aac gtt cta 1056

Asp Ser Ala Ile Thr Pro Glu Tyr Cys Thr Ala Glu Phe Asn Val Leu

340 345 350

gga gac cgt gac cgc ttc agt gaa gtt ggt ggc ttc gac cag ctc aac 1104

Gly Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe Asp Gln Leu Asn

355 360 365

aac gct ctt gac gta ccc atg gtc ctt gtc atg tcc atc tgg gac gac 1152

Asn Ala Leu Asp Val Pro Met Val Leu Val Met Ser Ile Trp Asp Asp

370 375 380

cac tac gcc aac atg ctt tgg ctc gac tcc agc tac ccc cct gag aag 1200

His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr Pro Pro Glu Lys

385 390 395 400

gct ggc cag ccc ggt ggt gac cgt ggt gac tgt gcc ccc gac tcc ggt 1248

Ala Gly Gln Pro Gly Gly Asp Arg Gly Asp Cys Ala Pro Asp Ser Gly

405 410 415

gtc ccc tcc gac gtc gag gcc agc atc ccc gat gcc aag gtc gtc tgg 1296

Val Pro Ser Asp Val Glu Ala Ser Ile Pro Asp Ala Lys Val Val Trp

420 425 430

tcc aac atc cgc ttc ggt ccc atc ggc tct act gtc gag gtt taa 1341

Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val Glu Val

435 440 445

<210> 44

<211> 446

<212> PRT

<213> 块团炭角菌(Xylaria hypoxylon)

<400> 44

Met Leu Ser Leu Ala Val Ser Ala Ala Leu Leu Gly Leu Ala Ser Ala

1 5 10 15

Gln Gln Val Gly Lys Glu Gln Ser Glu Thr His Pro Lys Leu Ser Trp

20 25 30

Lys Lys Cys Thr Ser Gly Gly Ser Cys Thr Gln Thr Asn Ala Glu Val

35 40 45

Thr Ile Asp Ser Asn Trp Arg Trp Leu His Ser Leu Glu Gly Thr Glu

50 55 60

Asn Cys Tyr Asp Gly Asn Lys Trp Thr Ser Gln Cys Ser Thr Gly Glu

65 70 75 80

Asp Cys Ala Thr Lys Cys Ala Ile Glu Gly Ala Asp Tyr Ser Lys Thr

85 90 95

Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu Thr Leu Lys Phe Leu Thr

100 105 110

Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe Tyr Leu Met Asn

115 120 125

Gly Ala Asp Lys Tyr Gln Thr Phe Asp Leu Lys Gly Asn Glu Phe Thr

130 135 140

Phe Asp Val Asp Leu Ser Thr Val Asp Cys Gly Leu Asn Ala Ala Leu

145 150 155 160

Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala Ser Tyr Pro Asn

165 170 175

Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys

180 185 190

Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Val Glu Gly Trp

195 200 205

Glu Pro Ser Thr Asn Asp Asp Asn Ala Gly Val Gly Pro Tyr Gly Ala

210 215 220

Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ser His Ser Phe Ala

225 230 235 240

Phe Thr Pro His Pro Cys Thr Thr Asn Glu Tyr His Val Cys Glu Gln

245 250 255

Asp Glu Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala Gly Lys Cys

260 265 270

Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly Asn Thr Asp

275 280 285

Phe Tyr Gly Gln Gly Lys Thr Val Asp Thr Ser Lys Lys Phe Thr Val

290 295 300

Val Thr Gln Phe Ala Glu Asn Lys Leu Thr Gln Phe Phe Val Gln Asp

305 310 315 320

Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Ile Asp Gly Phe Pro Thr

325 330 335

Asp Ser Ala Ile Thr Pro Glu Tyr Cys Thr Ala Glu Phe Asn Val Leu

340 345 350

Gly Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe Asp Gln Leu Asn

355 360 365

Asn Ala Leu Asp Val Pro Met Val Leu Val Met Ser Ile Trp Asp Asp

370 375 380

His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr Pro Pro Glu Lys

385 390 395 400

Ala Gly Gln Pro Gly Gly Asp Arg Gly Asp Cys Ala Pro Asp Ser Gly

405 410 415

Val Pro Ser Asp Val Glu Ala Ser Ile Pro Asp Ala Lys Val Val Trp

420 425 430

Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val Glu Val

435 440 445

<210> 45

<211> 1584

<212> DNA

<213> 黑耳(Exidia glandulosa)

<220>

<221> CDS

<222> (1)..(1584)

<223>

<400> 45

atg tac gcc aag ttc gct acc ctc gct gcc ctc gtg gca gct gcc agc 48

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser

1 5 10 15

gcc cag cag gca tgc aca ctc acc gcc gag aac cat ccc fcc atg act 96

Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr

20 25 30

tgg tct aag tgt gcc gcc gga ggt agc tgc act tcg gtt tct ggt tca 144

Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser

35 40 45

gtc acc atc gat gcc aac tgg cga tgg ctt cac cag ctc aac agc gcc 192

Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala

50 55 60

acc aac tgc tac gac ggc aac aag tgg aac acc acc tac tgc agc aca 240

Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr

65 70 75 80

gat gct act tgc gct gct cag tgc tgt gtt gat ggc tca gac tat gct 288

Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala

85 90 95

ggc acc tac ggt gcc acc act agc ggt aac gct ctg aac ctc aag ttc 336

Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe

100 105 110

gtc acc caa ggg tcc tat tct aag aac atc ggt tcc cgg ttg tac ctc 384

Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu

115 120 125

atg gag tcg gat acc aag tat cag atg ttt caa ctg ctc ggc cag gag 432

Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu

130 135 140

ttc act ttc gac gta gat gtc tcc aac ttg ggc tgc ggt ctc aac ggt 480

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

gcc ctc tac ttc gtc agc atg gac gct gac ggt ggc acg tcc aag tat 528

Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr

165 170 175

acc ggc aac aag gcc ggc gcc aag tat ggc act ggc tac tgc gac agc 576

Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

cag tgc ccg cgc gac ctg aag ttc atc aat ggt cag gcc aac gtc gag 624

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu

195 200 205

ggc tgg act cct tcc acc aac gat gcc aac gcc ggc att ggc acc cac 672

Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His

210 215 220

ggc tcc tgc tgt tcg gag atg gac atc tgg gag gct aac aat gtt gcc 720

Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala

225 230 235 240

gct gcg tac acc ccc cat cct tgc aca act atc ggc cag tcg atc tgc 768

Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys

245 250 255

tcg ggc gat tct tgc gga gga acc tac agc tct gac cgt tac gcc ggt 816

Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly

260 265 270

gtc tgc gat cca gac ggt tgc gat ttc aac agc tac cgc atg ggc gac 864

Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp

275 280 285

acg ggc ttc tac ggc aag ggc ctg aca gtc gac acg agc tcc aag ttc 912

Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe

290 295 300

acc gtc gtc acc cag ttc ctc acc ggc tcc gac ggc aac ctt tcc gag 960

Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu

305 310 315 320

atc aag cgc ttc tac gtc cag aac ggc aag gtc att ccc aac tcg cag 1008

Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln

325 330 335

tcc aag att gcc ggc gtc agc ggc aac tcc atc acc acc gac ttc tgc 1056

Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys

340 345 350

tcc gcc cag aag acc gcc ttc ggc gac acc aac gtc ttc gcg caa aag 1104

Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys

355 360 365

gga ggt ctc gcc ggg atg ggc gcc gcc ctc aag gcc ggc atg gtc ctc 1152

Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu

370 375 380

gtc atg tcc atc tgg gac gac cac gca gtc aac atg ctg tgg ctg gac 1200

Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp

385 390 395 400

tcg acc tac ccg acc gac agc acc aag ccc ggc gcg gcc cgc ggc acc 1248

Ser Thr Tyr Pro Thr Asp Ser Thr Lys Pro Gly Ala Ala Arg Gly Thr

405 410 415

tgc ccg acc acc tcc ggc gtc ccc gcc gac gtc gag gcc cag gtc ccc 1296

Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ala Gln Val Pro

420 425 430

aac tcg aac gtc atc tac tcc aac atc aag gtc ggc ccc atc aac tcg 1344

Asn Ser Asn Val Ile Tyr Ser Asn Ile Lys Val Gly Pro Ile Asn Ser

435 440 445

act ttc acc ggc ggc act tcc ggc ggc ggc ggt agc agc agc agc tcc 1392

Thr Phe Thr Gly Gly Thr Ser Gly Gly Gly Gly Ser Ser Ser Ser Ser

450 455 460

acc acc atc cga acc agc acc acc agc act cgc acc acc agc acc agc 1440

Thr Thr Ile Arg Thr Ser Thr Thr Ser Thr Arg Thr Thr Ser Thr Ser

465 470 475 480

acc gcg ccc ggc ggc ggc tcc act ggc agc gcc ggc gcc gat cac tgg 1488

Thr Ala Pro Gly Gly Gly Ser Thr Gly Ser Ala Gly Ala Asp His Trp

485 490 495

gcg caa tgc ggc ggt atc ggc tgg act ggt ccc acg acc tgc aag agc 1536

Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Thr Cys Lys Ser

500 505 510

ccg tac acg tgc aca gcc tcc aac ccg tac tac tcg cag tgc ttg taa 1584

Pro Tyr Thr Cys Thr Ala Ser Asn Pro Tyr Tyr Ser Gln Cys Leu

515 520 525

<210> 46

<211> 527

<212> PRT

<213> 黑耳(Exidia glandulosa)

<400> 46

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser

1 5 10 15

Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr

20 25 30

Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser

35 40 45

Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala

50 55 60

Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr

65 70 75 80

Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala

85 90 95

Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe

100 105 110

Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu

115 120 125

Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu

130 135 140

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr

165 170 175

Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu

195 200 205

Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His

210 215 220

Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala

225 230 235 240

Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys

245 250 255

Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly

260 265 270

Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp

275 280 285

Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe

290 295 300

Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu

305 310 315 320

Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln

325 330 335

Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys

340 345 350

Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys

355 360 365

Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu

370 375 380

Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp

385 390 395 400

Ser Thr Tyr Pro Thr Asp Ser Thr Lys Pro Gly Ala Ala Arg Gly Thr

405 410 415

Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ala Gln Val Pro

420 425 430

Asn Ser Asn Val Ile Tyr Ser Asn Ile Lys Val Gly Pro Ile Asn Ser

435 440 445

Thr Phe Thr Gly Gly Thr Ser Gly Gly Gly Gly Ser Ser Ser Ser Ser

450 455 460

Thr Thr Ile Arg Thr Ser Thr Thr Ser Thr Arg Thr Thr Ser Thr Ser

465 470 475 480

Thr Ala Pro Gly Gly Gly Ser Thr Gly Ser Ala Gly Ala Asp His Trp

485 490 495

Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Thr Cys Lys Ser

500 505 510

Pro Tyr Thr Cys Thr Ala Ser Asn Pro Tyr Tyr Ser Gln Cys Leu

515 520 525

<210> 47

<211> 1368

<212> DNA

<213> 黑耳(Exidia glandulosa)

<220>

<221> CDS

<222> (1)..(1368)

<223>

<400> 47

atg tac gcc aag ttc gct acc ctc gct gcc ctc gtg gca gct gcc agc 48

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser

1 5 10 15

gcc cag cag gca tgc aca ctc acc gcc gag aac cat ccc tcc atg act 96

Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr

20 25 30

tgg tct aag tgt gcc gcc gga ggt agc tgc act tcg gtt tct ggt tca 144

Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser

35 40 45

gtc acc atc gat gcc aac tgg cga tgg ctt cac cag ctc aac agc gcc 192

Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala

50 55 60

acc aac tgc tac gac ggc aac aag tgg aac acc acc tac tgc agc aca 240

Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr

65 70 75 80

gat gct act tgc gct gct cag tgc tgt gtt gat ggc tca gac tat gct 288

Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala

85 90 95

ggc acc tac ggt gcc acc act agc ggt aac gct ctg aac ctc aag ttc 336

Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe

100 105 110

gtc acc caa ggg tcc tat tct aag aac atc ggt tcc cgg ttg tac ctc 384

Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu

115 120 125

atg gag tcg gat acc aag tat cag atg ttt caa ctg ctc ggc cag gag 432

Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu

130 135 140

ttc act ttc gac gta gat gtc tcc aac ttg ggc tgc ggt ctc aac ggt 480

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

gcc ctc tac ttc gtc agc atg gac gct gac ggt ggc acg tcc aag tat 528

Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr

165 170 175

acc ggc aac aag gcc ggc gcc aag tat ggc act ggc tac tgc gac agc 576

Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

cag tgc ccg cgc gac ctg aag ttc atc aat ggt cag gcc aac gtc gag 624

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu

195 200 205

ggc tgg act cct tcc acc aac gat gcc aac gcc ggc att ggc acc cac 672

Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His

210 215 220

ggc tcc tgc tgt tcg gag atg gac atc tgg gag gct aac aat gtt gcc 720

Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala

225 230 235 240

gct gcg tac acc ccc cat cct tgc aca act atc ggc cag tcg atc tgc 768

Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys

245 250 255

tcg ggc gat tct tgc gga gga acc tac agc tct gac cgt tac gcc ggt 816

Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly

260 265 270

gtc tgc gat cca gac ggt tgc gat ttc aac agc tac cgc atg ggc gac 864

Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp

275 280 285

acg ggc ttc tac ggc aag ggc ctg aca gtc gac acg agc tcc aag ttc 912

Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe

290 295 300

acc gtc gtc acc cag ttc ctc acc ggc tcc gac ggc aac ctt tcc gag 960

Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu

305 310 315 320

atc aag cgc ttc tac gtc cag aac ggc aag gtc att ccc aac tcg cag 1008

Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln

325 330 335

tcc aag att gcc ggc gtc agc ggc aac tcc atc acc acc gac ttc tgc 1056

Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys

340 345 350

tcc gcc cag aag acc gcc ttc ggc gac acc aac gtc ttc gcg caa aag 1104

Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys

355 360 365

gga ggt ctc gcc ggg atg ggc gcc gcc ctc aag gcc ggc atg gtc ctc 1152

Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu

370 375 380

gtc atg tcc atc tgg gac gat cac tac gcc aac atg ctg tgg ctc gac 1200

Val Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp

385 390 395 400

tcg acc tac ccg act gac gcc tct ccc gat gag ccc ggc aag ggc cgc 1248

Ser Thr Tyr Pro Thr Asp Ala Ser Pro Asp Glu Pro Gly Lys Gly Arg

405 410 415

ggc acc tgc gac acc agc tcg ggt gtt cct gct gac atc gag acc agc 1296

Gly Thr Cys Asp Thr Ser Ser Gly Val Pro Ala Asp Ile Glu Thr Ser

420 425 430

cag gcc agc aac tca gtc atc tac tcg aac atc aag ttc gga ccc atc 1344

Gln Ala Ser Asn Ser Val Ile Tyr Ser Asn Ile Lys Phe Gly Pro Ile

435 440 445

aac tcg acc ttc aag gcg tcc taa 1368

Asn Ser Thr Phe Lys Ala Ser

450 455

<210> 48

<211> 455

<212> PRT

<213> 黑耳(Exidia glandulosa)

<400> 48

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser

1 5 10 15

Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr

20 25 30

Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser

35 40 45

Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala

50 55 60

Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr

65 70 75 80

Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala

85 90 95

Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe

100 105 110

Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu

115 120 125

Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu

130 135 140

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr

165 170 175

Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu

195 200 205

Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His

210 215 220

Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala

225 230 235 240

Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys

245 250 255

Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly

260 265 270

Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp

275 280 285

Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe

290 295 300

Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu

305 310 315 320

Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln

325 330 335

Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys

340 345 350

Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn ValPhe Ala Gln Lys

355 360 365

Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu

370 375 380

Val Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp

385 390 395 400

Ser Thr Tyr Pro Thr Asp Ala Ser Pro Asp Glu Pro Gly Lys Gly Arg

405 410 415

Gly Thr Cys Asp Thr Ser Ser Gly Val Pro Ala Asp Ile Glu Thr Ser

420 425 430

Gln Ala Ser Asn Ser Val Ile Tyr Ser Asn Ile Lys Phe Gly Pro Ile

435 440 445

Asn Ser Thr Phe Lys Ala Ser

450 455

<210> 49

<211> 1395

<212> DNA

<213> Poitrasia circinans

<220>

<221> CDS

<222> (1)..(1395)

<223>

<400> 49

atg cat cag act tcc gtt ctt tct tcg ctc tct ttg ctc ctc gca gcc 48

Met His Gln Thr Ser Val Leu Ser Ser Leu Ser Leu Leu Leu Ala Ala

1 5 10 15

tcc ggt gcc cag cag gtc ggc acc cag aat gct gag act cac ccg agt 96

Ser Gly Ala Gln Gln Val Gly Thr Gln Asn Ala Glu Thr His Pro Ser

20 25 30

ctg acc acc cag aag tgt acc acc gac ggc ggc tgc acc gac cag tcc 144

Leu Thr Thr Gln Lys Cys Thr Thr Asp Gly Gly Cys Thr Asp Gln Ser

35 40 45

act gcc atc gtg ctt gac gcc aac tgg cgc tgg ctg cac acc acc gag 192

Thr Ala Ile Val Leu Asp Ala Asn Trp Arg Trp Leu His Thr Thr Glu

50 55 60

ggc tac acc aac tgc tac act ggc cag gaa tgg gac acc gac atc tgc 240

Gly Tyr Thr Asn Cys Tyr Thr Gly Gln Glu Trp Asp Thr Asp Ile Cys

65 70 75 80

tcc tcc ccg gag gct tgc gcc acc ggc tgc gct ctt gac ggt gcc gac 288

Ser Ser Pro Glu Ala Cys Ala Thr Gly Cys Ala Leu Asp Gly Ala Asp

85 90 95

tac gag ggc act tac ggc att acg act gac ggc aac gct ctt tcc atg 336

Tyr Glu Gly Thr Tyr Gly Ile Thr Thr Asp Gly Asn Ala Leu Ser Met

100 105 110

aag ttt gtc acc cag ggc tcg cag aag aac gtc ggc ggt cgt gtt tac 384

Lys Phe Val Thr Gln Gly Ser Gln Lys Asn Val Gly Gly Arg Val Tyr

115 120 125

ctg ctt gct ccc gac tcc gaa gat gcg tac gag ctc ttc aag ttg aag 432

Leu Leu Ala Pro Asp Ser Glu Asp Ala Tyr Glu Leu Phe Lys Leu Lys

130 135 140

aac cag gag ttc act ttc gac gtt gac gtc tcc gac ctc ccc tgc ggc 480

Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asp Leu Pro Cys Gly

145 150 155 160

ctg aac ggc gcc ctg tac ttc tcc gag atg gat gaa gat ggt ggc atg 528

Leu Asn Gly Ala Leu Tyr Phe Ser Glu Met Asp Glu Asp Gly Gly Met

165 170 175

tcc aag tac gag aac aac aag gcc ggc gcc aag tac ggc act ggc tac 576

Ser Lys Tyr Glu Asn Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr

180 185 190

tgc gac acg cag tgc ccc cac gac gtc aag ttc atc aac ggc gag gcc 624

Cys Asp Thr Gln Cys Pro His Asp Val Lys Phe Ile Asn Gly Glu Ala

195 200 205

aac att ctc aac tgg acc aag tcc gag acc gac gtc aac gcc ggc act 672

Asn Ile Leu Asn Trp Thr Lys Ser Glu Thr Asp Val Asn Ala Gly Thr

210 215 220

ggc caa tac ggc tcc tgc tgc aac gag atg gat atc tgg gag gcc aac 720

Gly Gln Tyr Gly Ser Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn

225 230 235 240

tcg cag gcc acc gcc gtc act ccc cac gtc tgc aac gcc gat gtc atc 768

Ser Gln Ala Thr Ala Val Thr Pro His Val Cys Asn Ala Asp Val Ile

245 250 255

ggc cag gtc cgt tgc aac ggc acc gac tgc ggt gac ggc gac aac cgc 816

Gly Gln Val Arg Cys Asn Gly Thr Asp Cys Gly Asp Gly Asp Asn Arg

260 265 270

tac ggc ggc gtc tgc gac aag gat ggc tgc gac tac aac ccc tac cgc 864

Tyr Gly Gly Val Cys Asp Lys Asp Gly Cys Asp Tyr Asn Pro Tyr Arg

275 280 285

atg ggc aac gag tcg ttc tac ggc tcc aac ggc agc acc atc gac acc 912

Met Gly Asn Glu Ser Phe Tyr Gly Ser Asn Gly Ser Thr Ile Asp Thr

290 295 300

act gcc aag ttc acc gtc att acg cag ttc atc acc tcg gac aac act 960

Thr Ala Lys Phe Thr Val Ile Thr Gln Phe Ile Thr Ser Asp Asn Thr

305 310 315 320

tcg act ggc gac ctc gtt gag atc cgc cgc aag tac gtc cag gac ggc 1008

Ser Thr Gly Asp Leu Val Glu Ile Arg Arg Lys Tyr Val Gln Asp Gly

325 330 335

acc gtc atc gag aac tcg ttc gcc gac tac gac acc ctg gcc acg ttc 1056

Thr Val Ile Glu Asn Ser Phe Ala Asp Tyr Asp Thr Leu Ala Thr Phe

340 345 350

aac tcc atc tcg gac gac ttc tgc gac gcc cag aag acg ctc ttc ggc 1104

Asn Ser Ile Ser Asp Asp Phe Cys Asp Ala Gln Lys Thr Leu Phe Gly

355 360 365

gac gag aac gac ttc aag acc aag ggc ggc att gcc cgc atg ggc gag 1152

Asp Glu Asn Asp Phe Lys Thr Lys Gly Gly Ile Ala Arg Met Gly Glu

370 375 380

tcc ttc gag cgc ggc atg gtc ctc gtc atg agc atc tgg gat gac cac 1200

Ser Phe Glu Arg Gly Met Val Leu Val Met Ser Ile Trp Asp Asp His

385 390 395 400

gcg gcc aac gcc ctc tgg ctc gac tcg acc tac ccc gtc gac ggc gac 1248

Ala Ala Asn Ala Leu Trp Leu Asp Ser Thr Tyr Pro Val Asp Gly Asp

405 410 415

gcg acc aag cct ggc atc aag cgc ggc cct tgc ggc acc gac act ggt 1296

Ala Thr Lys Pro Gly Ile Lys Arg Gly Pro Cys Gly Thr Asp Thr Gly

420 425 430

gtt ccc gcc gac gtc gag tcg gag tcg ccc gat tcg acc gtc atc tac 1344

Val Pro Ala Asp Val Glu Ser Glu Ser Pro Asp Ser Thr Val Ile Tyr

435 440 445

tcc aac att cgc tac gga gac att ggc tcc acc ttc aac gcc acc gct 1392

Ser Asn Ile Arg Tyr Gly Asp Ile Gly Ser Thr Phe Asn Ala Thr Ala

450 455 460

tag 1395

<210> 50

<211> 464

<212> PRT

<213> Poitrasia circinans

<400> 50

Met His Gln Thr Ser Val Leu Ser Ser Leu Ser Leu Leu Leu Ala Ala

1 5 10 15

Ser Gly Ala Gln Gln Val Gly Thr Gln Asn Ala Glu Thr His Pro Ser

20 25 30

Leu Thr Thr Gln Lys Cys Thr Thr Asp Gly Gly Cys Thr Asp Gln Ser

35 40 45

Thr Ala Ile Val Leu Asp Ala Asn Trp Arg Trp Leu His Thr Thr Glu

50 55 60

Gly Tyr Thr Asn Cys Tyr Thr Gly Gln Glu Trp Asp Thr Asp Ile Cys

65 70 75 80

Ser Ser Pro Glu Ala Cys Ala Thr Gly Cys Ala Leu Asp Gly Ala Asp

85 90 95

Tyr Glu Gly Thr Tyr Gly Ile Thr Thr Asp Gly Asn Ala Leu Ser Met

100 105 110

Lys Phe Val Thr Gln Gly Ser Gln Lys Asn Val Gly Gly Arg Val Tyr

115 120 125

Leu Leu Ala Pro Asp Ser Glu Asp Ala Tyr Glu Leu Phe Lys Leu Lys

130 135 140

Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asp Leu Pro Cys Gly

145 150 155 160

Leu Asn Gly Ala Leu Tyr Phe Ser Glu Met Asp Glu Asp Gly Gly Met

165 170 175

Ser Lys Tyr Glu Asn Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr

180 185 190

Cys Asp Thr Gln Cys Pro His Asp Val Lys Phe Ile Asn Gly Glu Ala

195 200 205

Asn Ile Leu Asn Trp Thr Lys Ser Glu Thr Asp Val Asn Ala Gly Thr

210 215 220

Gly Gln Tyr Gly Ser Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn

225 230 235 240

Ser Gln Ala Thr Ala Val Thr Pro His Val Cys Asn Ala Asp Val Ile

245 250 255

Gly Gln Val Arg Cys Asn Gly Thr Asp Cys Gly Asp Gly Asp Asn Arg

260 265 270

Tyr Gly Gly Val Cys Asp Lys Asp Gly Cys Asp Tyr Asn Pro Tyr Arg

275 280 285

Met Gly Asn Glu Ser Phe Tyr Gly Ser Asn Gly Ser Thr Ile Asp Thr

290 295 300

Thr Ala Lys Phe Thr Val Ile Thr Gln Phe Ile Thr Ser Asp Asn Thr

305 310 315 320

Ser Thr Gly Asp Leu Val Glu Ile Arg Arg Lys Tyr Val Gln Asp Gly

325 330 335

Thr Val Ile Glu Asn Ser Phe Ala Asp Tyr Asp Thr Leu Ala Thr Phe

340 345 350

Asn Ser Ile Ser Asp Asp Phe Cys Asp Ala Gln Lys Thr Leu Phe Gly

355 360 365

Asp Glu Asn Asp Phe Lys Thr Lys Gly Gly Ile Ala Arg Met Gly Glu

370 375 380

Ser Phe Glu Arg Gly Met Val Leu Val Met Ser Ile Trp Asp Asp His

385 390 395 400

Ala Ala Asn Ala Leu Trp Leu Asp Ser Thr Tyr Pro Val Asp Gly Asp

405 410 415

Ala Thr Lys Pro Gly Ile Lys Arg Gly Pro Cys Gly Thr Asp Thr Gly

420 425 430

Val Pro Ala Asp Val Glu Ser Glu Ser Pro Asp Ser Thr Val Ile Tyr

435 440 445

Ser Asn Ile Arg Tyr Gly Asp Ile Gly Ser Thr Phe Asn Ala Thr Ala

450 455 460

<210> 51

<211> 1383

<212> DNA

<213> 灰色鬼伞(Coprinus cinereus)

<220>

<221> CDS

<222> (1)..(1383)

<223>

<400> 51

atg ttc aag aaa gtc gcc ctc acc gct ctc tgc ttc ctc gcc gtc gca 48

Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala

1 5 10 15

cag gcc caa cag gtc ggt cgc gaa gtc gct gaa aac cac ccc cgt ctc 96

Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu

20 25 30

ccg tgg cag cgt tgc act cgc aac ggc gga tgc cag act gtc tcc aac 144

Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn

35 40 45

ggt cag gtc gtc ctc gac gcc aac tgg cga tgg ctc cac gtc acc gac 192

Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp

50 55 60

ggc tac acc aac tgc tac acc ggt aac tcc tgg aac agc acc gtc tgc 240

Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys

65 70 75 80

tcc gac ccc acc acc tgc gct cag cga tgc gct ctc gag ggt gcc aac 288

Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn

85 90 95

tac cag caa acc tac ggt atc acc acc aac gga gac gcc ctc acc atc 336

Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile

100 105 110

aag ttc ctc acc cga tcc caa caa acc aac gtc ggt gct cgt gtc tac 384

Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr

115 120 125

ctc atg gag aac gag aac cga tac cag atg ttc aac ctc ctc aac aag 432

Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys

130 135 140

gag ttc acc ttc gac gtt gac gtc tcc aag gtt cct tgc ggt atc aac 480

Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn

145 150 155 160

ggt gcc ctc tac ttc atc cag atg gac gcc gat ggt ggt atg agc aag 528

Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys

165 170 175

caa ccc aac aac agg gct ggt gct aag tac ggt acc ggc tac tgc gac 576

Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp

180 185 190

tct cag tgc ccc cgt gac atc aag ttc att gac ggc gtg gcc aac agc 624

Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser

195 200 205

gcc gac tgg act cca tcc gag acc gat ccc aat gcc gga agg ggt cgc 672

Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg

210 215 220

tac ggc att tgc tgc gcc gag atg gat atc tgg gag gcc aac tcc atc 720

Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile

225 230 235 240

tcc aat gcc tac acc ccc cac cct tgc cga acc cag aac gat ggt ggc 768

Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly

245 250 255

tac cag cgc tgc gag ggc cgc gac tgc aac cag cct cgc tat gag ggt 816

Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly

260 265 270

ctt tgc gat cct gat ggc tgt gac tac aac ccc ttc cgc atg ggt aac 864

Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn

275 280 285

aag gac ttc tac gga ccc gga aag acc gtc gac acc aac agg aag atg 912

Lys Asp Phe Tyr Gly Pro Gly Lys Thr Val Asp Thr Asn Arg Lys Met

290 295 300

acc gtc gtc acc caa ttc atc acc cac gac aac acc gac act ggc acc 960

Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr

305 310 315 320

ctc gtt gac atc cgc cgc ctc tac gtt caa gac ggc cgt gtc att gcc 1008

Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala

325 330 335

aac cct ccc acc aac ttc ccc ggt ctc atg ccc gcc cac gac tcc atc 1056

Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile

340 345 350

acc gag cag ttc tgc act gac cag aag aac ctc ttc ggc gac tac agc 1104

Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser

355 360 365

agc ttc gct cgt gac ggt ggt ctc gct cac atg ggt cgc tcc ctc gcc 1152

Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala

370 375 380

aag ggt cac gtc ctc gct ctc tcc atc tgg aac gac cac ggt gcc cac 1200

Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His

385 390 395 400

atg ttg tgg ctc gac tcc aac tac ccc acc gac gct gac ccc aac aag 1248

Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys

405 410 415

ccc ggt att gct cgt ggt acc tgc ccg acc act ggt ggc acc ccc cgt 1296

Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg

420 425 430

gaa acc gaa caa aac cac cct gat gcc cag gtc atc ttc tcc aac att 1344

Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile

435 440 445

aaa ttc ggt gac atc ggc tcg act ttc tct ggt tac taa 1383

Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr

450 455 460

<210> 52

<211> 460

<212> PRT

<213> 灰色鬼伞(Coprinus cinereus)

<400> 52

Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala

1 5 10 15

Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu

20 25 30

Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn

35 40 45

Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp

50 55 60

Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys

65 70 75 80

Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn

85 90 95

Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile

100 105 110

Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr

115 120 125

Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys

130 135 140

Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn

145 150 155 160

Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys

165 170 175

Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp

180 185 190

Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser

195 200 205

Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg

210 215 220

Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile

225 230 235 240

Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly

245 250 255

Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly

260 265 270

Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn

275 280 285

Lys Asp Phe Tyr Gly Pro Gly Lys Thr Val Asp Thr Asn Arg Lys Met

290 295 300

Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr

305 310 315 320

Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala

325 330 335

Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile

340 345 350

Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser

355 360 365

Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala

370 375 380

Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His

385 390 395 400

Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys

405 410 415

Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg

420 425 430

Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile

435 440 445

Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr

450 455 460

<210> 53

<211> 1353

<212> DNA

<213> 支顶孢菌(Acremonium sp.)

<220>

<221> CDS

<222> (1)..(1353)

<223>

<400> 53

atg atg aag cag tat ctt cag tac ctg gcg gcg gct ctg ccc cta atg 48

Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu Met

1 5 10 15

ggc ctt gcc gcg ggc cag caa gcc ggc cgg gag acg ccc gaa aac cac 96

Gly Leu Ala Ala Gly Gln Gln Ala Gly Arg Glu Thr Pro Glu Asn His

20 25 30

ccc cgg ctc acc tgg aag aag tgc tcg ggc cag ggg tcc tgc cag acc 144

Pro Arg Leu Thr Trp Lys Lys Cys Ser Gly Gln Gly Ser Cys Gln Thr

35 40 45

gtc aac ggc gag gtc gtc att gat gcc aac tgg cgc tgg ctc cac gac 192

Val Asn Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Asp

50 55 60

tcc aac atg cag aac tgc tac gac ggc aac cag tgg acc agc gcg tgc 240

Ser Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Ser Ala Cys

65 70 75 80

agc tcg gcc acc gac tgc gcc tcc aag tgc tac atc gag ggt gcc gac 288

Ser Ser Ala Thr Asp Cys Ala Ser Lys Cys Tyr Ile Glu Gly Ala Asp

85 90 95

tac ggc agg acc tac ggc gct tcg acg agc ggc gac tcc ctc acg ctc 336

Tyr Gly Arg Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu

100 105 110

aag ttt gtc act cag cac gag tac ggt acc aac atc ggc tcg cgc ttc 384

Lys Phe Val Thr Gln His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe

115 120 125

tac ctg atg agc agc ccg acc cgg tac cag atg ttc acc ctc atg aac 432

Tyr Leu Met Ser Ser Pro Thr Arg Tyr Gln Met Phe Thr Leu Met Asn

130 135 140

aac gaa ttt gct ttc gat gtc gac ctc tcg acc gtc gag tgc ggc atc 480

Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys Gly Ile

145 150 155 160

aac agc gcc ctg tac ttc gtc gcc atg gag gag gac ggc ggc atg gcc 528

Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala

165 170 175

agc tac ccc acc aac aag gcc gga gcc aag tac ggc acg ggt tac tgc 576

Ser Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys

180 185 190

gac gcc caa tgc gcc cgt gat ctc aag ttc gtc ggc ggc aag gcc aac 624

Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Ala Asn

195 200 205

att gag ggc tgg agg ccg tcc acc aac gac gcg aac gcc ggc gtc ggc 672

Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly

210 215 220

ccg atg ggc ggc tgc tgc gcg gaa atc gat gtt tgg gag tcc aac gcc 720

Pro Met Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala

225 230 235 240

cac gct ttt gcc ttc acg ccg cac gcg tgc gag aac aac aac tac cac 768

His Ala Phe Ala Phe Thr Pro His Ala Cys Glu Asn Asn Asn Tyr His

245 250 255

atc tgc gag acc tcc aac tgc ggc ggt acc tac tcc gac gac cgc ttc 816

Ile Cys Glu Thr Ser Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe

260 265 270

gcc ggc ctc tgc gac gcc aac ggc tgc gac tac aac ccg tac cgc atg 864

Ala Gly Leu Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met

275 280 285

ggc aac ccc gac ttc tac ggc aag ggc aag act ctt gac acc tcg cgg 912

Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr Ser Arg

290 295 300

aag ttc acc gtc gtc acc cgc ttc cag gag aac gac ctc tcg cag tac 960

Lys Phe Thr Val Val Thr Arg Phe Gln Glu Asn Asp Leu Ser Gln Tyr

305 310 315 320

ttc atc cag gac ggc cgc aag atc gag atc ccg ccc ccg acc tgg gac 1008

Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr Trp Asp

325 330 335

ggc ctc ccg aag agc agc cac atc acg ccc gag ctg tgc gcg acc cag 1056

Gly Leu Pro Lys Ser Ser His Ile Thr Pro Glu Leu Cys Ala Thr Gln

340 345 350

ttc gac gtc ttc gac gac cgc aac cgc ttc gag gag gtc ggc ggc ttc 1104

Phe Asp Val Phe Asp Asp Arg Asn Arg Phe Glu Glu Val Gly Gly Phe

355 360 365

ccc gcc ctc aac gcc gct ctc cgc atc ccc atg gtc ctt gtc atg tcc 1152

Pro Ala Leu Asn Ala Ala Leu Arg Ile Pro Met Val Leu Val Met Ser

370 375 380

atc tgg gac gac cac tac gcc aac atg ctc tgg ctc gac tcc gtc tac 1200

Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Val Tyr

385 390 395 400

ccg ccc gag aag gag ggc acc ccc ggc gcc gag cgt ggc cct tgc ccc 1248

Pro Pro Glu Lys Glu Gly Thr Pro Gly Ala Glu Arg Gly Pro Cys Pro

405 410 415

cag acc tct ggt gtc ccc gcc gaa gtc gag gcc cag tac ccc aac gcc 1296

Gln Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asn Ala

420 425 430

aag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg acc tac 1344

Lys Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Tyr

435 440 445

aac atg taa 1353

Asn Met

450

<210> 54

<211> 450

<212> PRT

<213> 支顶孢菌(Acremonium sp.)

<400> 54

Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu Met

1 5 10 15

Gly Leu Ala Ala Gly Gln Gln Ala Gly Arg Glu Thr Pro Glu Asn His

20 25 30

Pro Arg Leu Thr Trp Lys Lys Cys Ser Gly Gln Gly Ser Cys Gln Thr

35 40 45

Val Asn Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Asp

50 55 60

Ser Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Ser Ala Cys

65 70 75 80

Ser Ser Ala Thr Asp Cys Ala Ser Lys Cys Tyr Ile Glu Gly Ala Asp

85 90 95

Tyr Gly Arg Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu

100 105 110

Lys Phe Val Thr Gln His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe

115 120 125

Tyr Leu Met Ser Ser Pro Thr Arg Tyr Gln Met Phe Thr Leu Met Asn

130 135 140

Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys Gly Ile

145 150 155 160

Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala

165 170 175

Ser Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys

180 185 190

Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Ala Asn

195 200 205

Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly

210 215 220

Pro Met Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala

225 230 235 240

His Ala Phe Ala Phe Thr Pro His Ala Cys Glu Asn Asn Asn Tyr His

245 250 255

Ile Cys Glu Thr Ser Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe

260 265 270

Ala Gly Leu Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met

275 280 285

Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr Ser Arg

290 295 300

Lys Phe Thr Val Val Thr Arg Phe Gln Glu Asn Asp Leu Ser Gln Tyr

305 310 315 320

Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr Trp Asp

325 330 335

Gly Leu Pro Lys Ser Ser His Ile Thr Pro Glu Leu Cys Ala Thr Gln

340 345 350

Phe Asp Val Phe Asp Asp Arg Asn Arg Phe Glu Glu Val Gly Gly Phe

355 360 365

Pro Ala Leu Asn Ala Ala Leu Arg Ile Pro Met Val Leu Val Met Ser

370 375 380

Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Val Tyr

385 390 395 400

Pro Pro Glu Lys Glu Gly Thr Pro Gly Ala Glu Arg Gly Pro Cys Pro

405 410 415

Gln Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asn Ala

420 425 430

Lys Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Tyr

435 440 445

Asn Met

450

<210> 55

<211> 1599

<212> DNA

<213> Chaetomidium pingtungium

<220>

<221> CDS

<222> (1)..(1599)

<223>

<400> 55

atg ctg gcc tcc acc ttc tcc tac cgc atg tac aag acc gcg ctc atc 48

Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile

1 5 10 15

ctg gcc gcc ctt ctg ggc tct ggc cag gct cag cag gtc ggt act tcc 96

Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser

20 25 30

cag gcg gaa gtg cat ccg tcc atg acc tgg cag agc tgc acg gct ggc 144

Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly

35 40 45

ggc agc tgc acc acc aac aac ggc aag gtg gtc atc gac gcg aac tgg 192

Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp

50 55 60

cgt tgg gtg cac aaa gtc ggc gac tac acc aac tgc tac acc ggc aac 240

Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn

65 70 75 80

acc tgg gac acg act atc tgc cct gac gat gcg acc tgc gca tcc aac 288

Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn

85 90 95

tgc gcc ctt gag ggt gcc aac tac gaa tcc acc tat ggt gtg acc gcc 336

Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala

100 105 110

agc ggc aat tcc ctc cgc ctc aac ttc gtc acc acc agc cag cag aag 384

Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys

115 120 125

aac att ggc tcg cgt ctg tac atg atg aag gac gac tcg acc tac gag 432

Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu

130 135 140

atg ttt aag ctg ctg aac cag gag ttc acc ttc gat gtc gat gtc tcc 480

Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser

145 150 155 160

aac ctc ccc tgc ggt ctc aac ggt gct ctg tac ttt gtc gcc atg gac 528

Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp

165 170 175

gcc ggc ggt ggc atg tcc aag tac cca acc aac aag gcc ggt gcc aag 576

Ala Gly Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys

180 185 190

tac ggt act gga tac tgt gac tcg cag tgc cct cgc gac ctc aag ttc 624

Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe

195 200 205

atc aac ggt cag gcc aac gtt gaa ggg tgg cag ccc tcc tcc aac gat 672

Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp

210 215 220

gcc aat gcg ggt acc ggc aac cac ggg tcc tgc tgc gcg gag atg gat 720

Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp

225 230 235 240

atc tgg gag gcc aac agc atc tcc acg gcc ttc acc ccc cat ccg tgc 768

Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys

245 250 255

gac acg ccc ggc cag gtg atg tgc acc ggt gat gcc tgc ggt ggc acc 816

Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr

260 265 270

tac agc tcc gac cgc tac ggc ggc acc tgc gac ccc gac gga tgt gat 864

Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp

275 280 285

ttc aac tcc ttc cgc cag ggc aac aag acc ttc tac ggc cct ggc atg 912

Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met

290 295 300

acc gtc gac acc aag agc aag ttt acc gtc gtc acc cag ttc atc acc 960

Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr

305 310 315 320

gac gac ggc acc tcc agc ggc acc ctc aag gag atc aag cgc ttc tac 1008

Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr

325 330 335

gtg cag aac ggc aag gtg atc ccc aac tcg gag tcg acc tgg acc ggc 1056

Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly

340 345 350

gtc agc ggc aac tcc atc acc acc gag tac tgc acc gcc cag aag agc 1104

Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser

355 360 365

ctg ttc cag gac cag aac gtc ttc gaa aag cac ggc ggc ctc gag ggc 1152

Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly

370 375 380

atg ggt gct gcc ctc gcc cag ggc atg gtt ctc gtc atg tcc ctg tgg 1200

Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp

385 390 395 400

gat gat cac tcg gcc aac atg ctc tgg ctc gac agc aac tac ccg acc 1248

Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr

405 410 415

act gcc tct tcc acc act ccc ggc gtc gcc cgt ggt acc tgc gac atc 1296

Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile

420 425 430

tcc tcc ggc gtc cct gcg gat gtc gag gcg aac cac ccc gac gcc tac 1344

Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr

435 440 445

gtc gtc tac tcc aac atc aag gtc ggc ccc atc ggc tcg acc ttc aac 1392

Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn

450 455 460

agc ggt ggc tcg aac ccc ggt ggc gga acc acc acg aca act acc acc 1440

Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr

465 470 475 480

cag cct act acc acc acg acc acg gct gga aac cct ggc ggc acc gga 1488

Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly

485 490 495

gtc gca cag cac tat ggc cag tgt ggt gga atc gga tgg acc gga ccc 1536

Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro

500 505 510

aca acc tgt gcc agc cct tat acc tgc cag aag ctg aat gat tat tac 1584

Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr

515 520 525

tct cag tgc ctg tag 1599

Ser Gln Cys Leu

530

<210> 56

<211> 532

<212> PRT

<213> Chaetomidium pingtungium

<400> 56

Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile

1 5 10 15

Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser

20 25 30

Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly

35 40 45

Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp

50 55 60

Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn

65 70 75 80

Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn

85 90 95

Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala

100 105 110

Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys

115 120 125

Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu

130 135 140

Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser

145 150 155 160

Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp

165 170 175

Ala Gly Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys

180 185 190

Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe

195 200 205

Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp

210 215 220

Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp

225 230 235 240

Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys

245 250 255

Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr

260 265 270

Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp

275 280 285

Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met

290 295 300

Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr

305 310 315 320

Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr

325 330 335

Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly

340 345 350

Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser

355 360 365

Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly

370 375 380

Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp

385 390 395 400

Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr

405 410 415

Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile

420 425 430

Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr

435 440 445

Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn

450 455 460

Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr

465 470 475 480

Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly

485 490 495

Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro

500 505 510

Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr

515 520 525

Ser Gln Cys Leu

530

<210> 57

<211> 1383

<212> DNA

<213> Sporotrichum pruinosum

<220>

<221> CDS

<222> (1)..(1383)

<223>

<400> 57

atg ttc aag aaa gtc gcc ctc acc gct ctc tgc ttc ctc gcc gtc gca 48

Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala

1 5 10 15

cag gcc caa cag gtc ggt cgc gaa gtc gct gaa aac cac ccc cgt ctc 96

Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu

20 25 30

ccg tgg cag cgt tgc act cgc aac ggc gga tgc cag act gtc tct aac 144

Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn

35 40 45

ggt cag gtc gtc ctc gac gcc aac tgg cga tgg ctc cac gtc acc gat 192

Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp

50 55 60

ggc tac acc aac tgc tac acc ggt aac tcc tgg aac agc acc gtc tgc 240

Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys

65 70 75 80

tcc gac ccc acc acc tgc gct cag cga tgc gct ctc gag ggt gcc aac 288

Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn

85 90 95

tac cag caa acc tac ggt atc acc acc aac gga gac gcc ctc acc atc 336

Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile

100 105 110

aag ttc ctc acc cga tcc caa caa acc aac gtc ggt gct cgt gtc tac 384

Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr

115 120 125

ctc atg gag aac gag aac cga tac cag atg ttc aac ctc ctc aac aag 432

Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys

130 135 140

gag ttc acc ttc gac gtt gac gtc tcc aag gtt cct tgc ggt atc aac 480

Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn

145 150 155 160

ggt gcc ctc tac ttc atc cag atg gac gcc gat ggt ggt atg agc aag 528

Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys

165 170 175

caa ccc aac aac agg gct ggt gct aag tac ggt acc ggc tac tgc gac 576

Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp

180 185 190

tct cag tgc ccc cgt gac atc aag ttc att gac ggc gtg gcc aac agc 624

Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser

195 200 205

gcc gac tgg act cca tcc gag acc gat ccc aat gcc gga agg ggt cgc 672

Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg

210 215 220

tac ggc att tgc tgc gcc gag atg gat atc tgg gag gcc aac tcc atc 720

Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile

225 230 235 240

tcc aat gcc tac acc ccc cac cct tgc cga acc cag aac gat ggt ggc 768

Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly

245 250 255

tac cag cgc tgc gag ggc cgc gac tgc aac cag cct cgc tat gag ggt 816

Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly

260 265 270

ctt tgc gat cct gat ggc tgt gac tac aac ccc ttc cgc atg ggt aac 864

Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn

275 280 285

aag gac ttc tac gga ccc gga aag acc atc gac acc aac agg aag atg 912

Lys Asp Phe Tyr Gly Pro Gly Lys Thr Ile Asp Thr Asn Arg Lys Met

290 295 300

acc gtc gtc acc caa ttc atc acc cac gac aac acc gac act ggc acc 960

Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr

305 310 315 320

ctc gtt gac atc cgc cgc ctc tac gtt caa gac ggc cgt gtc att gcc 1008

Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala

325 330 335

aac cct ccc acc aac ttc ccc ggt ctc atg ccc gcc cac gac tcc atc 1056

Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile

340 345 350

acc gag cag ttc tgc act gac cag aag aac ctc ttc ggc gac tac agc 1104

Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser

355 360 365

agc ttc gct cgt gac ggt ggt ctc gct cac atg ggt cgc tcc ctc gcc 1152

Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala

370 375 380

aag ggt cac gtc ctc gct ctc tcc atc tgg aac gac cac ggt gcc cac 1200

Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His

385 390 395 400

atg ttg tgg ctc gac tcc aac tac ccc acc gac gct gac ccc aac aag 1248

Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys

405 410 415

ccc ggt att gct cgt ggt acc tgc ccg acc act ggt ggc acc ccc cgt 1296

Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg

420 425 430

gaa acc gaa caa aac cac cct gat gcc cag gtc atc ttc tcc aac att 1344

Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile

435 440 445

aaa ttc ggt gac atc ggc tcg act ttc tct ggt tac taa 1383

Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr

450 455 460

<210> 58

<211> 460

<212> PRT

<213> Sporotrichum pruinosum

<400> 58

Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala

1 5 10 15

Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu

20 25 30

Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn

35 40 45

Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp

50 55 60

Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys

65 70 75 80

Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn

85 90 95

Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile

100 105 110

Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr

115 120 125

Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys

130 135 140

Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn

145 150 155 160

Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys

165 170 175

Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp

180 185 190

Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser

195 200 205

Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg

210 215 220

Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile

225 230 235 240

Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly

245 250 255

Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly

260 265 270

Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn

275 280 285

Lys Asp Phe Tyr Gly Pro Gly Lys Thr Ile Asp Thr Asn Arg Lys Met

290 295 300

Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr

305 310 315 320

Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala

325 330 335

Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile

340 345 350

Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser

355 360 365

Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala

370 375 380

Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His

385 390 395 400

Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys

405 410 415

Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg

420 425 430

Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile

435 440 445

Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr

450 455 460

<210> 59

<211> 1578

<212> DNA

<213> 嗜热小柱孢菌(Scytalidium thermophilum)

<220>

<221> CDS

<222> (1)..(1578)

<223>

<400> 59

atg cgt acc gcc aag ttc gcc acc ctc gcc gcc ctt gtg gcc tcg gcc 48

Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala

1 5 10 15

gcc gcc cag cag gcg tgc agt ctc acc acc gag agg cac cct tcc ctc 96

Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu

20 25 30

tct tgg aag aag tgc acc gcc ggc ggc cag tgc cag acc gtc cag gct 144

Ser Trp Lys Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala

35 40 45

tcc atc act ctc gac tcc aac tgg cgc tgg act cac cag gtg tct ggc 192

Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly

50 55 60

tcc acc aac tgc tac acg ggc aac aag tgg gat act agc atc tgc act 240

Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr

65 70 75 80

gat gcc aag tcg tgc gct cag aac tgc tgc gtc gat ggt gcc gac tac 288

Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr

85 90 95

acc agc acc tat ggc atc acc acc aac ggt gat tcc ctg agc ctc aag 336

Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys

100 105 110

ttc gtc acc aag ggc cag cac tcg acc aac gtc ggc tcg cgt acc tac 384

Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr

115 120 125

ctg atg gac ggc gag gac aag tat cag acc ttc gag ctc ctc ggc aac 432

Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn

130 135 140

gag ttc acc ttc gat gtc gat gtc tcc aac atc ggc tgc ggt ctc aac 480

Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn

145 150 155 160

ggc gcc ctg tac ttc gtc tcc atg gac gcc gat ggt ggt ctc agc cgc 528

Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg

165 170 175

tat cct ggc aac aag gct ggt gcc aag tac ggt acc ggc tac tgc gat 576

Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp

180 185 190

gct cag tgc ccc cgt gac atc aag ttc atc aac ggc gag gcc aac att 624

Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile

195 200 205

gag ggc tgg acc ggc tcc acc aac gac ccc aac gcc ggc gcg ggc cgc 672

Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg

210 215 220

tat ggt acc tgc tgc tct gag atg gat atc tgg gaa gcc aac aac atg 720

Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met

225 230 235 240

gct act gcc ttc act cct cac cct tgc acc atc att ggc cag agc cgc 768

Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg

245 250 255

tgc gag ggc gac tcg tgc ggt ggc acc tac agc aac gag cgc tac gcc 816

Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala

260 265 270

ggc gtc tgc gac ccc gat ggc tgc gac ttc aac tcg tac cgc cag ggc 864

Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly

275 280 285

aat aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag 912

Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys

290 295 300

atc act gtc gtc acc cag ttc ctc aag gat gcc aac ggc gat ctc ggc 960

Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly

305 310 315 320

gag gtc aag cgc ttc tac gtc cag gat ggc aag atc atc ccc aac tcc 1008

Glu Val Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser

325 330 335

gag tcc acc atc ccc ggc gtc gag ggc aat tcc atc acc cag gac tgg 1056

Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp

340 345 350

tgc gac cgc cag aag gtt gcc ttt ggc gac att gac gac ttc aac cgc 1104

Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg

355 360 365

aag ggc ggc atg aag cag atg ggc aag gcc ctc gcc ggc ccc atg gtc 1152

Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val

370 375 380

ctg gtc atg tcc atc tgg gat gac cac gcc tcc aac atg ctc tgg ctc 1200

Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu

385 390 395 400

gac tcg acc ttc cct gtc gat gcc gct ggc aag ccc ggc gcc gag cgc 1248

Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg

405 410 415

ggt gcc tgc ccg acc acc tcg ggt gtc cct gct gag gtt gag gcc gag 1296

Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu

420 425 430

gcc ccc aac agc aac gtc gtc ttc tcc aac atc cgc ttc ggc ccc atc 1344

Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile

435 440 445

ggc tcg acc gtt gct ggt ctc ccc ggc gcg ggc aac ggc ggc aac aac 1392

Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn

450 455 460

ggc ggc aac ccc ccg ccc ccc acc acc acc acc tcc tcg gct ccg gcc 1440

Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala

465 470 475 480

acc acc acc acc gcc agc gct ggc ccc aag gct ggc cac tgg cag cag 1488

Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly His Trp Gln Gln

485 490 495

tgc ggc ggc atc ggc ttc act ggc ccg acc cag tgc gag gag ccc tac 1536

Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr

500 505 510

act tgc acc aag ctc aac gac tgg tac tct cag tgc ctg taa 1578

Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu

515 520 525

<210> 60

<211> 525

<212> PRT

<213> 嗜热小柱孢菌(Scytalidium thermophilum)

<400> 60

Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala

1 5 10 15

Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu

20 25 30

Ser Trp Lys Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala

35 40 45

Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly

50 55 60

Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr

65 70 75 80

Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr

85 90 95

Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys

100 105 110

Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr

115 120 125

Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn

130 135 140

Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn

145 150 155 160

Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg

165 170 175

Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp

180 185 190

Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile

195 200 205

Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg

210 215 220

Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met

225 230 235 240

Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg

245 250 255

Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala

260 265 270

Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly

275 280 285

Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys

290 295 300

Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly

305 310 315 320

Glu Val Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser

325 330 335

Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp

340 345 350

Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg

355 360 365

Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val

370 375 380

Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu

385 390 395 400

Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg

405 410 415

Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu

420 425 430

Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile

435 440 445

Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn

450 455 460

Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala

465 470 475 480

Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly His Trp Gln Gln

485 490 495

Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr

500 505 510

Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu

515 520 525

<210> 61

<211> 519

<212> DNA

<213> 曲霉(Aspergillus sp.)

<220>

<221> misc_feature

<222> (1)..(519)

<223> 部分CBH1编码序列

<400> 61

gagatggaca tatgggaggc caacagcatc tccacggcct tcacgcccca cccctgcgat 60

gtccccggcc aggtgatgtg cgagggcgac tcctgcggtg gcacctacag cagcgaccgc 120

tatggcggca cctgcgatcc cgatggatgt gacttcaact cctaccgcca gggcaacaag 180

tccttctacg gccccggcat gaccgtcgac accaacagca aggtcaccgt cgtgactcag 240

ttcctcaccg acgacggcac tgccaccggc accctgtcgg agatcaagcg gttctacgtg 300

cagaacggca aggtcatccc caactccgag tcgacctggc ccggcgtcgg cggcaactcc 360

atcaccaccg actactgtct ggcccagaag agcctcttcg gcgataccga cgtcttcacc 420

aagcacggcg gtatggaggg catgggcgcc gccctcgccg agggcatggt cctcgtcctg 480

agtctctggg acgaccacca ctccaacatg ctctggctg 519

<210> 62

<211> 497

<212> DNA

<213> 帚霉属(Scopulariopsis sp.)

<220>

<221> misc_feature

<222> (1)..(497)

<223> 部分CBH1编码序列

<400> 62

gagatcgatg tgtgggagtc gaacgcctat gccttcgttt tcacgccgca cgcgtgcacg 60

accaacgagt accacgtctg cgagaccacc aactgcggtg gcacctactc ggaggaccgc 120

ttcaccggca agtgcgacgc caacggctgc gactacaacc cctaccgcat gggcaacccc 180

gacttctacg gcaagggcaa gacgctcgac accagccgca agttcaccgt cgtctcccgc 240

ttcgaggaga acaagctctc ccagtacttc atccaggacg gccgcaagat cgagatcccg 300

ccgccgacgt gggagggcat gcccaacagc agcgagatca cccccgagct ctgctccacc 360

atgttcgatg tgctcgacga ccgcaaccgc ttgcaggagg tcggcggctt cgagcagctg 420

aacaacgccc tccgggttcc catggtcctc gtcatgtcca tctgggacga ccactacgcc 480

aacatgctct ggctcga 497

<210> 63

<211> 498

<212> DNA

<213> 镰孢属(Fusarium sp.)

<220>

<221> misc_feature

<222> (1)..(498)

<223> 部分CBH1编码序列

<400> 63

gagatggata tctgggaggc caacaagatc tccactgcct acactcccca cccctgcaag 60

agcctcaccc agcagtcctg cgagggcgat gcctgcggtg gcacctactc tactacccgc 120

tatgctggaa cttgcgaccc cgatggttgc gatttcaacc cttaccgcca gggcaacaag 180

accttctacg gccccggctc cggcttcaac gttgatacca ccaagaaggt gactgtcgtg 240

acccagttca tcaagggcag cgacggcaag ctttccgaga tcaagcgtct ctatgttcag 300

aatggcaagg tcattggcaa cccccagtct gagattgcca gcaaccctgg cagcagcgtc 360

accgacagct tctgcaaggc ccagaaggtt gccttcaacg accccgatga cttcaacaag 420

aagggtggct ggagcggaat gagcgacgcc ctcgccaagc ccatggttct cgtcatgagc 480

ttgtggcacg acgtgagt 498

<210> 64

<211> 525

<212> DNA

<213> 轮枝孢(Verticillium sp.)

<220>

<221> misc_feature

<222> (1)..(525)

<223> 部分CBH1编码序列

<400> 64

gagatggata tctgggaggc caacaagatc tccacggcct acactcccca tccctgcaag 60

agcctcaccc agcagtcctg tgagggcgat gcctgcggtg gcacctactc ttccacccgc 120

tatgctggaa cttgcgatcc cgatggctgc gatttcaacc cttaccgcca gggcaaccac 180

accttctacg gtcccggctc cggcttcaac gtcgatacca ccaagaaggt gactgtcgtg 240

acccagttca tcaagggcag cgacggcaag ctttccgaga tcaagcgtct ctatgttcag 300

aatggcaagg tcatcggcaa cccccagtcc gagattgcaa acaaccccgg cagctccgtc 360

accgacagct tctgcaaggc ccagaaggtt gccttcaacg accccgatga cttcaacaag 420

aagggtggct ggagcggcat gaacgacgcc ctcgccaagc ccatggttct cgtcatgagc 480

ctgtggcacg acgtgagtaa tctaacccct gagtctcgga caaga 525

<210> 65

<211> 1371

<212> DNA

<213> 淡黑假黑盘菌(Pseudoplectania nigrella)

<220>

<221> CDS

<222> (1)..(1371)

<400> 65

atg cta tcc aat ctc ctt ctc tca ctc tct ttc ctt tcc cta gcc tcc 48

Met Leu Ser Asn Leu Leu Leu Ser Leu Ser Phe Leu Ser Leu Ala Ser

1 5 10 15

ggg caa aac atc ggt acc aac acc gcc gaa agc cac ccc caa ctt cgt 96

Gly Gln Asn Ile Gly Thr Asn Thr Ala Glu Ser His Pro Gln Leu Arg

20 25 30

tct caa acc tgc acc aaa ggc aac gga tgc agc acc caa tcc acc tcc 144

Ser Gln Thr Cys Thr Lys Gly Asn Gly Cys Ser Thr Gln Ser Thr Ser

35 40 45

gta gtc ctg gac tcc aac tgg cgc tgg ctg cac aat aat gga ggt tca 192

Val Val Leu Asp Ser Asn Trp Arg Trp Leu His Asn Asn Gly Gly Ser

50 55 60

acg aac tgc tac acc ggc aat tcc tgg gac tct aca tta tgt ccc gac 240

Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asp Ser Thr Leu Cys Pro Asp

65 70 75 80

cca gtt acc tgc gcc aag aac tgt gct ctc gac ggt gcc gac tat tct 288

Pro Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser

85 90 95

ggg aca tac gga atc acc tct acg gga gat gct ttg acg ttg aag ttt 336

Gly Thr Tyr Gly Ile Thr Ser Thr Gly Asp Ala Leu Thr Leu Lys Phe

100 105 110

gtt act cag ggt cct tat tcg act aat att gga tct cgg gta tac cta 384

Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Val Tyr Leu

115 120 125

atg gcg agt gat act cag tat aag atg ttc cag ctc aag aac aag gag 432

Met Ala Ser Asp Thr Gln Tyr Lys Met Phe Gln Leu Lys Asn Lys Glu

130 135 140

ttt acg ttt gat gtt gat gtc tct aat ctt cct tgt gga tta aac gga 480

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly

145 150 155 160

gcg ttg tat ttt gtg gag atg gat gcg gat gga gga atg tcg aaa tac 528

Ala Leu Tyr Phe Val Glu Met Asp Ala Asp Gly Gly Met Ser Lys Tyr

165 170 175

ccg tct aat aaa gcc ggg gca aaa tat gga acc ggg tat tgt gat gcg 576

Pro Ser Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala

180 185 190

cag tgt cca cat gat atc aaa ttt atc aac ggg gag gca aat ctc cta 624

Gln Cys Pro His Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Leu Leu

195 200 205

gac tgg acg cct tca acc agc gac aaa aat gcc ggc tcc gga cgt tac 672

Asp Trp Thr Pro Ser Thr Ser Asp Lys Asn Ala Gly Ser Gly Arg Tyr

210 215 220

ggg acc tgt tgt caa gaa atg gac atc tgg gaa gcc aac agc atg gca 720

Gly Thr Cys Cys Gln Glu Met Asp Ile Trp Glu Ala Asn Ser Met Ala

225 230 235 240

acc gcc tat aca ccg cat ccc tgt agt gtc tca gga cct acc cga tgc 768

Thr Ala Tyr Thr Pro His Pro Cys Ser Val Ser Gly Pro Thr Arg Cys

245 250 255

tca gga acc caa tgt ggg gat ggt tct aac cgt cat aac gga att tgc 816

Ser Gly Thr Gln Cys Gly Asp Gly Ser Asn Arg His Asn Gly Ile Cys

260 265 270

gat aaa gat ggc tgc gat ttc aat tcc tac cgt atg ggc aat acg aca 864

Asp Lys Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn Thr Thr

275 280 285

ttc ttc ggc aag gga gca acg gtt aac acc aac tcc aaa ttt act gtt 912

Phe Phe Gly Lys Gly Ala Thr Val Asn Thr Asn Ser Lys Phe Thr Val

290 295 300

gta acg caa ttc atc acc tcc gac aac acc tca act gga gcg cta aag 960

Val Thr Gln Phe Ile Thr Ser Asp Asn Thr Ser Thr Gly Ala Leu Lys

305 310 315 320

gag att cgt cgt ctt tat att cag aat gga aaa gtc atc cag aac tcg 1008

Glu Ile Arg Arg Leu Tyr Ile Gln Asn Gly Lys Val Ile Gln Asn Ser

325 330 335

aaa agt aat atc tcc ggc atg tca gct tac gac tct ata acc gag gat 1056

Lys Ser Asn Ile Ser Gly Met Ser Ala Tyr Asp Ser Ile Thr Glu Asp

340 345 350

ttc tgt gcc gct caa aaa acc gca ttt gga gac aca aat gac ttt aag 1104

Phe Cys Ala Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Asp Phe Lys

355 360 365

gca aag ggc gga ttt aca aac ctt ggg aat gcg ttg caa aag gga atg 1152

Ala Lys Gly Gly Phe Thr Asn Leu Gly Asn Ala Leu Gln Lys Gly Met

370 375 380

gtt ttg gcg ttg agt att tgg gat gat cat gct gcg cag atg ctt tgg 1200

Val Leu Ala Leu Ser Ile Trp Asp Asp His Ala Ala Gln Met Leu Trp

385 390 395 400

ttg gat agt tct tac ccg ctc gat aaa gac cct tct caa cca ggt gtt 1248

Leu Asp Ser Ser Tyr Pro Leu Asp Lys Asp Pro Ser Gln Pro Gly Val

405 410 415

aag agg ggc gcg tgt gct acc tct tct ggt aaa ccg tcg gat gtc gag 1296

Lys Arg Gly Ala Cys Ala Thr Ser Ser Gly Lys Pro Ser Asp Val Glu

420 425 430

aac cag tct ccg aat gcg tcg gtg act ttt tcg aac att aag ttt ggg 1344

Asn Gln Ser Pro Asn Ala Ser Val Thr Phe Ser Asn Ile Lys Phe Gly

435 440 445

gat att gga tcg act tat tcc tct tag 1371

Asp Ile Gly Ser Thr Tyr Ser Ser

450 455

<210> 66

<211> 456

<212> PRT

<213> 淡黑假黑盘菌(Pseudoplectania nigrella)

<400> 66

Met Leu Ser Asn Leu Leu Leu Ser Leu Ser Phe Leu Ser Leu Ala Ser

1 5 10 15

Gly Gln Asn Ile Gly Thr Asn Thr Ala Glu Ser His Pro Gln Leu Arg

20 25 30

Ser Gln Thr Cys Thr Lys Gly Asn Gly Cys Ser Thr Gln Ser Thr Ser

35 40 45

Val Val Leu Asp Ser Asn Trp Arg Trp Leu His Asn Asn Gly Gly Ser

50 55 60

Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asp Ser Thr Leu Cys Pro Asp

65 70 75 80

Pro Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser

85 90 95

Gly Thr Tyr Gly Ile Thr Ser Thr Gly Asp Ala Leu Thr Leu Lys Phe

100 105 110

Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Val Tyr Leu

115 120 125

Met Ala Ser Asp Thr Gln Tyr Lys Met Phe Gln Leu Lys Asn Lys Glu

130 135 140

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly

145 150 155 160

Ala Leu Tyr Phe Val Glu Met Asp Ala Asp Gly Gly Met Ser Lys Tyr

165 170 175

Pro Ser Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala

180 185 190

Gln Cys Pro His Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Leu Leu

195 200 205

Asp Trp Thr Pro Ser Thr Ser Asp Lys Asn Ala Gly Ser Gly Arg Tyr

210 215 220

Gly Thr Cys Cys Gln Glu Met Asp Ile Trp Glu Ala Asn Ser Met Ala

225 230 235 240

Thr Ala Tyr Thr Pro His Pro Cys Ser Val Ser Gly Pro Thr Arg Cys

245 250 255

Ser Gly Thr Gln Cys Gly Asp Gly Ser Asn Arg His Asn Gly Ile Cys

260 265 270

Asp Lys Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn Thr Thr

275 280 285

Phe Phe Gly Lys Gly Ala Thr Val Asn Thr Asn Ser Lys Phe Thr Val

290 295 300

Val Thr Gln Phe Ile Thr Ser Asp Asn Thr Ser Thr Gly Ala Leu Lys

305 310 315 320

Glu Ile Arg Arg Leu Tyr Ile Gln Asn Gly Lys Val Ile Gln Asn Ser

325 330 335

Lys Ser Asn Ile Ser Gly Met Ser Ala Tyr Asp Ser Ile Thr Glu Asp

340 345 350

Phe Cys Ala Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Asp Phe Lys

355 360 365

Ala Lys Gly Gly Phe Thr Asn Leu Gly Asn Ala Leu Gln Lys Gly Met

370 375 380

Val Leu Ala Leu Ser Ile Trp Asp Asp His Ala Ala Gln Met Leu Trp

385 390 395 400

Leu Asp Ser Ser Tyr Pro Leu Asp Lys Asp Pro Ser Gln Pro Gly Val

405 410 415

Lys Arg Gly Ala Cys Ala Thr Ser Ser Gly Lys Pro Ser Asp Val Glu

420 425 430

Asn Gln Ser Pro Asn Ala Ser Val Thr Phe Ser Asn Ile Lys Phe Gly

435 440 445

Asp Ile Gly Ser Thr Tyr Ser Ser

450 455

<210> 67

<211> 951

<212> DNA

<213> 蔓延疫霉(Phytophthora infestans)

<220>

<221> misc_feature

<222> (1)..(951)

<223> 部分CBH1编码序列

<400> 67

tgcgatgctg atggttgtga cttcaactct taccgccagg gtaacacctc tttctatggt 60

gcaggtctta ccgtgaacac caacaaagtt ttcaccgttg taacccaatt catcaccaac 120

gatggaacag cttcaggtac cttgaaagaa atccgacgat tctatgttca gaatggcgtc 180

gtgattccaa actcgcaatc cacaatcgct ggagttccag gaaattccat caccgactct 240

ttctgtgccg cacaaaagac tgcttttggt gacaccaacg aattcgctac taagggaggt 300

cttgccacaa tgagcaaagc tttggcaaag ggtatggtac ttgtcatgtc catttgggat 360

gaccataccg ccaacatgtt gtggctcgat gccccttacc cagcaaccaa atccccaagc 420

gccccaggtg tcactcgagg atcatgcagt gctacttcag gtaaccccgt tgatgttgaa 480

gccaattctc caggttcttc cgtcaccttc tcaaacatca agtggggtcc catcaactct 540

acctacactg gatctggagc cgccccaagt gttccaggca ctacaaccgt tagctcggca 600

cccgcatcga ctgcaacttc aggagctggt ggtgtcgcta agtatgccca atgtggaggt 660

actggataca gtggagctac cgcttgcgtt tcaggcagca cctgtgttgc cctcaaccct 720

tactactccc aatgccaata gattgtttcc ctcaggagca attaggtttc caacctaagg 780

ggagagatct tcacaagtct gtacataggg tcagctaaat gttgatcatt catattcttt 840

catgtattta gttgttgaca atttgaagtt gcaagtcaag acgggaaaac agaagcagga 900

aatatatggg acataacaaa gtcaatcgtt tacataagaa ccttctttaa a 951

Claims

1.一种具有纤维二糖水解酶I活性的多肽，其选自下组：

(a)包含选自下组所示氨基酸序列的多肽：

与SEQ ID NO：66中第1-456位氨基酸具有至少80％同一性的氨基酸序列，

(b)包含选自下组所示氨基酸序列的多肽：

与存在于小柱孢菌种(Scytalidium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

与存在于支顶孢属(Acremonium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性的氨基酸序列，

存在于嗜热毁丝霉(Myceliophthora thermophila)CBS117.65中的纤维二糖水解酶I编码部分的核苷酸序列编码的的氨基酸序列，

存在于长毛盘菌(Trichophaea saccata)CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列编码的多氨基酸序列，

(c)包含选自下组所示氨基酸序列的多肽：

与SEQ ID NO：11中第1-1245位核苷酸编码的多肽具有至少70％同一性的氨基酸序列，

与SEQ ID NO：13中第1-1341位核苷酸编码的多肽具有至少70％同一性的氨基酸序列，

(d)由在高严谨条件下与选自下组所示的多核苷酸探针杂交的核苷酸序列编码的多肽：

(i)选自下组所示核苷酸的互补链：

SEQ ID NO：1中第1-1578位核苷酸，

SEQ ID NO：3中第1-1587位核苷酸，

SEQ ID NO：5中第1-1353位核苷酸，

SEQ ID NO：7中第1-1371位核苷酸，

SEQ ID NO：9中第1-1614位核苷酸，

SEQ ID NO：11中第1-1245位核苷酸，

SEQ ID NO：13中第1-1341位核苷酸，

SEQ ID NO：15中第1-1356位核苷酸，

SEQ ID NO：37中第1-1365位核苷酸，

SEQ ID NO：39中第1-1377位核苷酸，

SEQ ID NO：41中第1-1353位核苷酸，

SEQ ID NO：43中第1-1341位核苷酸，

SEQ ID NO：45中第1-1584位核苷酸，

SEQ ID NO：47中第1-1368位核苷酸，

SEQ ID NO：49中第1-1395位核苷酸，

SEQ ID NO：51中第1-1383位核苷酸，

SEQ ID NO：53中第1-1353位核苷酸，

SEQ ID NO：55中第1-1599位核苷酸，

SEQ ID NO：57中第1-1383位核苷酸，

SEQ ID NO：59中第1-1578位核苷酸，

SEQ ID NO：65中第1-1371位核苷酸，

(ii)选自下组所示核苷酸的互补链：

SEQ ID NO：1中第1-500位核苷酸，

SEQ ID NO：3中第1-500位核苷酸，

SEQ ID NO：5中第1-500位核苷酸，

SEQ ID NO：7中第1-500位核苷酸，

SEQ ID NO：9中第1-500位核苷酸，

SEQ ID NO：11中第1-500位核苷酸，

SEQ ID NO：13中第1-500位核苷酸，

SEQ ID NO：15中第1-500位核苷酸，

SEQ ID NO：37中第1-500位核苷酸，

SEQ ID NO：39中第1-500位核苷酸，

SEQ ID NO：41中第1-500位核苷酸，

SEQ ID NO：43中第1-500位核苷酸，

SEQ ID NO：45中第1-500位核苷酸，

SEQ ID NO：47中第1-500位核苷酸，

SEQ ID NO：49中第1-500位核苷酸，

SEQ ID NO：51第1-500位核苷酸，

SEQ ID NO：53第1-500位核苷酸，

SEQ ID NO：55中第1-500位核苷酸，

SEQ ID NO：57中第1-500位核苷酸，

SEQ ID NO：59中第1-500位核苷酸，

SEQ ID NO：65中第1-500位核苷酸，

SEQ ID NO：17中第1-221位核苷酸，

SEQ ID NO：18中第1-239位核苷酸，

SEQ ID NO：19中第1-199位核苷酸，

SEQ ID NO：20中第1-191位核苷酸，

SEQ ID NO：21中第1-232位核苷酸，

SEQ ID NO：22中第1-467位核苷酸，

SEQ ID NO：23中第1-534位核苷酸，

SEQ ID NO：24中第1-563位核苷酸，

SEQ ID NO：25中第1-218位核苷酸，

SEQ ID NO：26中第1-492位核苷酸，

SEQ ID NO：27中第1-481位核苷酸，

SEQ ID NO：28中第1-463位核苷酸，

SEQ ID NO：29中第1-513位核苷酸，

SEQ ID NO：30中第1-579位核苷酸，

SEQ ID NO：31中第1-514位核苷酸，

SEQ ID NO：32中第1-477位核苷酸，

SEQ ID NO：33中第1-500位核苷酸，

SEQ ID NO：34中第1-470位核苷酸，

SEQ ID NO：35中第1-491位核苷酸，

SEQ ID NO：36中第1-221位核苷酸，

SEQ ID NO：61中第1-519位核苷酸，

SEQ ID NO：62中第1-497位核苷酸，

SEQ ID NO：63中第1-498位核苷酸，

SEQ ID NO：64中第1-525位核苷酸，和

SEQ ID NO：67中第1-951位核苷酸，和

(iii)选自下组所示核苷酸的互补链：

SEQ ID NO：1中第1-200位核苷酸，

SEQ ID NO：3中第1-200位核苷酸，

SEQ ID NO：5中第1-200位核苷酸，

SEQ ID NO：7中第1-200位核苷酸，

SEQ ID NO：9中第1-200位核苷酸，

SEQ ID NO：11中第1-200位核苷酸，

SEQ ID NO：13中第1-200位核苷酸，

SEQ ID NO：15中第1-200位核苷酸，

SEQ ID NO：37中第1-200位核苷酸，

SEQ ID NO：39中第1-200位核苷酸，

SEQ ID NO：41中第1-200位核苷酸，

SEQ ID NO：43中第1-200位核苷酸，

SEQ ID NO：45中第1-200位核苷酸，

SEQ ID NO：47中第1-200位核苷酸，

SEQ ID NO：49中第1-200位核苷酸，

SEQ ID NO：51中第1-200位核苷酸，

SEQ ID NO：53中第1-200位核苷酸，

SEQ ID NO：55中第1-200位核苷酸，

SEQ ID NO：57中第1-200位核苷酸，

SEQ ID NO：59中第1-200位核苷酸，和

SEQ ID NO：65中第1-200位核苷酸，和

(e)具有纤维二糖水解酶I活性的(a)、(b)或(c)的片段。

2.根据权利要求1所述的多肽，包含选自下组所述的氨基酸序列：

与SEQ ID NO：2中第1-526位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：4中第1-529位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：6中第1-451位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：8中第1-457位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：10中第1-538位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：12中第1-415位氨基酸具有至少75％同一性、优选至少80％同一性、更优选至少90％同一性的氨基酸序列，

与SEQ ID NO：14中第1-447位氨基酸具有至少75％同一性、优选至少80％同一性、更优选至少90％同一性的氨基酸序列，

与SEQ ID NO：16中第1-452位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：38中第1-454位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：40中第1-458位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：42中第1-450位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：44中第1-446位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：46中第1-527位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：48中第1-455位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：50中第1-464位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：52中第1-460位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：54中第1-450位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：56中第1-532位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：58中第1-460位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：60中第1-525位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列，

与SEQ ID NO：66中第1-456位氨基酸具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的氨基酸序列。

3.根据权利要求1或2所述的多肽，其中包括选自下组所示的氨基酸序列：

与SEQ ID NO：2中第1-526位氨基酸，

与SEQ ID NO：4中第1-529位氨基酸，

与SEQ ID NO：6中第1-451位氨基酸，

与SEQ ID NO：8中第1-457位氨基酸，

与SEQ ID NO：10中第1-538位氨基酸，

与SEQ ID NO：12中第1-415位氨基酸，

与SEQ ID NO：14中第1-447位氨基酸，

与SEQ ID NO：16中第1-452位氨基酸，

与SEQ ID NO：38中第1-454位氨基酸，

与SEQ ID NO：40中第1-458位氨基酸，

与SEQ ID NO：42中第1-450位氨基酸，

与SEQ ID NO：44中第1-446位氨基酸，

与SEQ ID NO：46中第1-527位氨基酸，

与SEQ ID NO：48中第1-455位氨基酸，

与SEQ ID NO：50中第1-464位氨基酸，

与SEQ ID NO：52中第1-460位氨基酸，

与SEQ ID NO：54中第1-450位氨基酸，

与SEQ ID NO：56中第1-532位氨基酸，

与SEQ ID NO：58中第1-460位氨基酸，

与SEQ ID NO：60中第1-525位氨基酸，

与SEQ ID NO：66中第1-456位氨基酸。

4.根据权利要求1或2所述的多肽，该多肽是一种人工变异体，其中包括在相应于选自下组所示的氨基酸序列中含有至少一个氨基酸发生替代、缺失和/或插入的氨基酸序列：

与SEQ ID NO：2中第1-526位氨基酸，

与SEQ ID NO：4中第1-529位氨基酸，

与SEQ ID NO：6中第1-451位氨基酸，

与SEQ ID NO：8中第1-457位氨基酸，

与SEQ ID NO：10中第1-538位氨基酸，

与SEQ ID NO：12中第1-415位氨基酸，

与SEQ ID NO：14中第1-447位氨基酸，

与SEQ ID NO：16中第1-452位氨基酸，

与SEQ ID NO：38中第1-454位氨基酸，

与SEQ ID NO：40中第1-458位氨基酸，

与SEQ ID NO：42中第1-450位氨基酸，

与SEQ ID NO：44中第1-446位氨基酸，

与SEQ ID NO：46中第1-527位氨基酸，

与SEQ ID NO：48中第1-455位氨基酸，

与SEQ ID NO：50中第1-464位氨基酸，

与SEQ ID NO：52中第1-460位氨基酸，

与SEQ ID NO：54中第1-450位氨基酸，

与SEQ ID NO：56中第1-532位氨基酸，

与SEQ ID NO：58中第1-460位氨基酸，

与SEQ ID NO：60中第1-525位氨基酸，

与SEQ ID NO：66中第1-456位氨基酸。

5.根据权利要求1所述的多肽，其中包括选自下组所述的氨基酸序列：

与存在于保藏微生物CGMCC NO.0584中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0581中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0585中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0582中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0583中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CBS 109513中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CBS 14348中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0580中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0747中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0748中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0749中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物CGMCC NO.0750中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物DSM 15064中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物DSM 15065中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，

与存在于保藏微生物DSM 15066中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列，和

与存在于保藏微生物DSM 15067中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80％同一性、优选至少90％同一性的氨基酸序列。

6.根据权利要求5所述的多肽，其中包含由插入进存在于选自下组保藏微生物中的质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列，其中所述保藏微生物为CGMCC NO.0584，CGMCC NO.0581，CGMCCNO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCCNO.0580，CGMCC NO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCC NO.0750，DSM 15064，DSM 15065，DSM 15066和DSM 15067。

7.根据权利要求5或6所述的多肽，其中多肽由插入进存在于选自下组保藏微生物中的质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列组成，其中所述保藏微生物为CGMCC NO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，CGMCC NO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCCNO.0750，DSM 15064，DSM 15065，DSM 15066和DSM 15067。

8.根据权利要求5或6所述的多肽，其中多肽是一种人工变异体，与存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列相比，该变异体优选包括由具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列组成，其中所述保藏微生物为CGMCCNO.0584，CGMCC NO.0581，CGMCC NO.0585，CGMCC NO.0582，CGMCC NO.0583，CBS 109513，DSM 14348，CGMCC NO.0580，CGMCC NO.0747，CGMCC NO.0748，CGMCC NO.0749，CGMCC NO.0750，DSM 15064，DSM 15065，DSM 15066和DSM 15067。

9.一种具有编码如权利要求1-8任一项所述多肽的核苷酸序列的多肽。

10.一种核酸构建体，该结构含有与一种或多种指导多肽在适合宿主中生产的调控序列可操作连接的权利要求9中所述的核苷酸序列。

11.一种含有权利要求10所述核酸构建体的重组表达载体。

12.一种含有权利要求11所述的核酸构建体的重组宿主细胞。

13.一种生产权利要求1-8中任一项所述多肽的方法，该方法包括：

(a)培养一种菌株来生产多肽，该菌株野生型形式能生产多肽；和

(b)回收多肽。

14.一种生产权利要求1-8中任一项所述多肽的方法，该方法包括：

(a)在适于生产多肽的条件下培养权利要求12所述的重组宿主细胞，和

(b)回收多肽。

15.一种原位生产权利要求1-8中任一项所述多肽的方法，该方法包括：

(b)将多肽与一种所要的底物接触，没有前预先回收多肽。

16.一种含有选自下组的核苷酸序列的多核苷酸：

与SEQ ID NO：1中第1-1578位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：3中第1-1587位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：5中第1-1353位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：7中第1-1371位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：9中第1-1614位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：11中第1-1245位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：13中第1-1341位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：15中第1-1356位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：37中第1-1365位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：39中第1-1377位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：41中第1-1353位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：43中第1-1341位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：45中第1-1584位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：47中第1-1368位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：49中第1-1395位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：51中第1-1383位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：53中第1-1353位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：55中第1-1599位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：57中第1-1383位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：59中第1-1578位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：65中第1-1371位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：1中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：3中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：5中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：7中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：9中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：11中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：13中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：15中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：37中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：39中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：41中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：43中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：45中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：47中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：49中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：51中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：53中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：55中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：57中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：59中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：65中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：17中第1-221位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：18中第1-239位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：19中第1-199位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：20中第1-191位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：21中第1-232位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：22中第1-467位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：23中第1-534位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：24中第1-563位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：25中第1-218位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：26中第1-492位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：27中第1-481位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：28中第1-463位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：29中第1-513位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：30中第1-579位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：31中第1-514位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：32中第1-477位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：33中第1-500位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：34中第1-470位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：35中第1-491位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：36中第1-221位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：61中第1-519位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：62中第1-497位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：63中第1-498位核苷酸具有至少80％同一性的核苷酸序列，

与SEQ ID NO：64中第1-525位核苷酸具有至少80％同一性的核苷酸序列，和

与SEQ ID NO：67中第1-951位核苷酸具有至少80％同一性的核苷酸序列。

17.一种含有选自下组所述核苷酸序列的多核苷酸：

与存在于保藏微生物CGMCC NO.0584中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0581中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0585中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0582中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0583中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CBS 109513中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CBS 14348中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0580中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0747中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0748中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0749中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物CGMCC NO.0750中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物DSM 15064中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物DSM 15065中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于保藏微生物DSM 15066中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，和

与存在于保藏微生物DSM 15067中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

18.一种含有选自下组所述核苷酸序列的多核苷酸：

与存在于微生物玫瑰单瑞孢IFO 5372中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物产黑色腐质霉CBS 819.73中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物Ciadorrhinum foecundissimum CBS 427.97中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物棉色二孢CBS 247.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物嗜热毁丝霉CBS 117.65中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物微小根毛霉CBS 109471中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物Meripilus giganteus CBS 521.95中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物黑耳CBS 2377.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物块团炭角菌CBS 284.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物长毛盘菌CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物Acremonium sp中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物毛壳霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物Chaetomidium pingtungium中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物嗜热毁丝霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，

与存在于微生物肉桂色毁丝霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列，和

与存在于微生物Sporotrichum pruinosum中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

与存在于微生物有小孢子囊的草根霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

与存在于微生物小柱孢菌属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

与存在于微生物曲霉属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

与存在于微生物帚霉属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

与存在于微生物镰孢属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

与存在于微生物轮枝孢属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

与存在于微生物疫霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80％同一性的核苷酸序列。

19.具有编码有纤维二糖水解酶I活性的多肽的核苷酸序列的多核苷酸序列，其在高严谨条件下与选自下组所述的多核苷酸探针杂交：

(i)选自下组所示核苷酸的互补链：

SEQ ID NO：1中第1-1578位核苷酸，

SEQ ID NO：3中第1-1587位核苷酸，

SEQ ID NO：5中第1-1353位核苷酸，

SEQ ID NO：7中第1-1371位核苷酸，

SEQ ID NO：9中第1-1614位核苷酸，

SEQ ID NO：11中第1-1245位核苷酸，

SEQ ID NO：13中第1-1341位核苷酸，

SEQ ID NO：15中第1-1356位核苷酸，

SEQ ID NO：37中第1-1365位核苷酸，

SEQ ID NO：39中第1-1377位核苷酸，

SEQ ID NO：41中第1-1353位核苷酸，

SEQ ID NO：43中第1-1341位核苷酸，

SEQ ID NO：45中第1-1584位核苷酸，

SEQ ID NO：47中第1-1368位核苷酸，

SEQ ID NO：49中第1-1395位核苷酸，

SEQ ID NO：51中第1-1383位核苷酸，

SEQ ID NO：53中第1-1353位核苷酸，

SEQ ID NO：55中第1-1599位核苷酸，

SEQ ID NO：57中第1-1383位核苷酸，

SEQ ID NO：59中第1-1578位核苷酸，或

SEQ ID NO：65中第1-1371位核苷酸，

(ii)或是选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中第1-500位核苷酸，

SEQ ID NO：3中第1-500位核苷酸，

SEQ ID NO：5中第1-500位核苷酸，

SEQ ID NO：7中第1-500位核苷酸，

SEQ ID NO：9中第1-500位核苷酸，

SEQ ID NO：11中第1-500位核苷酸，

SEQ ID NO：13中第1-500位核苷酸，

SEQ ID NO：15中第1-500位核苷酸，

SEQ ID NO：37中第1-500位核苷酸，

SEQ ID NO：39中第1-500位核苷酸，

SEQ ID NO：41中第1-500位核苷酸，

SEQ ID NO：43中第1-500位核苷酸，

SEQ ID NO：45中第1-500位核苷酸，

SEQ ID NO：47中第1-500位核苷酸，

SEQ ID NO：49中第1-500位核苷酸，

SEQ ID NO：51中第1-500位核苷酸，

SEQ ID NO：53中第1-500位核苷酸，

SEQ ID NO：55中第1-500位核苷酸，

SEQ ID NO：57中第1-500位核苷酸，

SEQ ID NO：59中第1-500位核苷酸，

SEQ ID NO：65中第1-500位核苷酸，

SEQ ID NO：17中第1-221位核苷酸，

SEQ ID NO：18中第1-239位核苷酸，

SEQ ID NO：19中第1-199位核苷酸，

SEQ ID NO：20中第1-191位核苷酸，

SEQ ID NO：21中第1-232位核苷酸，

SEQ ID NO：22中第1-467位核苷酸，

SEQ ID NO：23中第1-534位核苷酸，

SEQ ID NO：24中第1-563位核苷酸，

SEQ ID NO：25中第1-218位核苷酸，

SEQ ID NO：26中第1-492位核苷酸，

SEQ ID NO：27中第1-481位核苷酸，

SEQ ID NO：28中第1-463位核苷酸，

SEQ ID NO：29中第1-513位核苷酸，

SEQ ID NO：30中第1-579位核苷酸，

SEQ ID NO：31中第1-514位核苷酸，

SEQ ID NO：32中第1-477位核苷酸，

SEQ ID NO：33中第1-500位核苷酸，

SEQ ID NO：34中第1-470位核苷酸，

SEQ ID NO：35中第1-491位核苷酸，

SEQ ID NO：36中第1-221位核苷酸，

SEQ ID NO：61中第1-519位核苷酸，

SEQ ID NO：62中第1-497位核苷酸，

SEQ ID NO：63中第1-498位核苷酸，

SEQ ID NO：64中第1-525位核苷酸，或

SEQ ID NO：67中第1-951位核苷酸，或

(iii)或是选自下组所示核苷酸序列的互补链：

SEQ ID NO：1中第1-200位核苷酸，

SEQ ID NO：3中第1-200位核苷酸，

SEQ ID NO：5中第1-200位核苷酸，

SEQ ID NO：7中第1-200位核苷酸，

SEQ ID NO：9中第1-200位核苷酸，

SEQ ID NO：11中第1-200位核苷酸，

SEQ ID NO：13中第1-200位核苷酸，

SEQ ID NO：15中第1-200位核苷酸，

SEQ ID NO：37中第1-200位核苷酸，

SEQ ID NO：39中第1-200位核苷酸，

SEQ ID NO：41中第1-200位核苷酸，

SEQ ID NO：43中第1-200位核苷酸，

SEQ ID NO：45中第1-200位核苷酸，

SEQ ID NO：47中第1-200位核苷酸，

SEQ ID NO：49中第1-200位核苷酸，

SEQ ID NO：51中第1-200位核苷酸，

SEQ ID NO：53中第1-200位核苷酸，

SEQ ID NO：55中第1-200位核苷酸，

SEQ ID NO：57中第1-200位核苷酸，

SEQ ID NO：59中第1-200位核苷酸，或

SEQ ID NO：65中第1-200位核苷酸。

20.一种含有选自下组所述的修饰的核苷酸序列的多核苷酸：

含有至少一个修饰的SEQ ID NO：1的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：2第1-526位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：3的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：4第1-529位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：5的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：6第1-451位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：7的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：8第1-457位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：9的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：10第1-538位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：11的核苷酸序列，其中修饰的核苷酸序列编码一种由SEQ ID NO：12第1-415位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：13的核苷酸序列，其中修饰的核苷酸序列编码一种由SEQ ID NO：14第1-447位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：15的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：16第1-452位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：37的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：38第1-454位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：39的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：40第1-458位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：41的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：42第1-450位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：43的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：44第1-446位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：45的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：46第1-527位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：47的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：48第1-455位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：49的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：50第1-464位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：51的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：52第1-460位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：53的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：54第1-450位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：55的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：56第1-532位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：57的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：58第1-460位氨基酸组成的多肽，

含有至少一个修饰的SEQ ID NO：59的核苷酸序列，其中修饰的核苷酸序列编码由SEQ ID NO：60第1-525位氨基酸组成的多肽，

含有至少一种修饰的SEQ ID NO：65的核苷酸序列，其中修饰的核苷酸序列编码一种由SEQ ID NO：66第1-456位氨基酸组成的多肽，

21.一种由存在于下组所述的微生物中的纤维二糖水解酶I编码部分核苷酸序列编码的具有纤维二糖水解酶I活性的多肽：

一种微生物，该微生物属于接合菌门，优选属于毛霉菌属，更优选属于毛霉菌科或是笄霉科，最优选属于根毛霉属或poitrasia属，尤其是微小根毛霉或poitrasia circinans。

一种微生物，该微生物属于卵菌纲，优选腐霉目，更优选腐霉科，最优选疫霉属，尤其是蔓延疫霉。

一种微生物，该微生物属于Auriculariales，优选属于Exidiaceae科，最优选黑耳。

一种微生物，该微生物属于Xylariales，优选属于炭角菌科，更优选属于炭角菌属，最优选块团炭角菌。

一种微生物，该微生物属于Dothideales，优选属于Dothideaceae科，更优选属于色二孢属，最优选棉色二孢。

一种微生物，该微生物属于盘菌目，优选属于Pyronemataceae科，更优选属于长毛盘菌科或是Sarcosoma taceae科，更优选属于长毛盘菌属或假黑盘菌属，最优选囊状长毛盘菌或淡黑假黑盘菌。

一种微生物，该微生物属于Rigidiporaceae科，优选属于Meripilus属，更优选Meripilus giganteus。

一种微生物，该微生物属于皱孔菌科，优选属于孢子丝菌属，更优选Sporotrichum Pruinosum。

一种微生物，该微生物属于蘑菇科(在Basidiomycota，Hymenomycetes，蘑菇目下)，更优选属于鬼伞属，最优选灰色鬼伞。

一种微生物，该微生物属于肉座菌科，优选属于支顶孢属或有丝分裂孢子的轮枝孢属，更优选嗜热支顶孢或幼嫩轮枝孢。

一种微生物，该微生物属Cladorrhinum属，优选Cladorrhinumfoecundissimum。

一种微生物，该微生物属于毁丝霉属，优选嗜热毁丝霉或肉桂色毁丝霉。

一种微生物，该微生物属于毛壳霉属，优选嗜热毛壳霉。

一种微生物，该微生物属于Chaetomidium属，优选Chaetomidiumpingtungium。

一种微生物，该微生物属于草根霉属，优选Thielavia australiensis或有孢子囊的草根霉。

一种微生物，该微生物属于热子囊菌属，优选橙黄色热子囊菌。

一种微生物，该微生物属于单瑞孢属，优选玫瑰单瑞孢，和

一种属于产黑色腐质霉种的微生物。

22.一种使用含有如权利要求9和16-20中任一项权利要求所定义的多核苷酸的DNA改组的方法。

23.一种可通过权利要求22所述方法获得的编码具有纤维二糖酶活性的多肽的多核苷酸。

24.一种由权利要求23所述的多核苷酸编码的具有纤维二糖活性的多肽。

25.如权利要求9和16-20中任一项权利要求所定义的多核苷酸在DNA改组中的用途。

26.一种从生物质中生产乙醇的方法，包括将生物质与权利要求1-8中任一项所定义的多肽接触。

27.权利要求1-8中任一项所定义的多肽在生产乙醇中的用途。

28.一种转基因植物、植物部分或植物细胞，其中已经转化了编码权利要求1-8中任一项所定义的具有纤维二糖水解酶I活性的多肽的核苷酸序列。

29.一种含有表面活性剂和权利要求1-8任一项所述多肽的去污剂。