CN1620501A - 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸 - Google Patents

具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸 Download PDF

Info

Publication number
CN1620501A
CN1620501A CNA028127684A CN02812768A CN1620501A CN 1620501 A CN1620501 A CN 1620501A CN A028127684 A CNA028127684 A CN A028127684A CN 02812768 A CN02812768 A CN 02812768A CN 1620501 A CN1620501 A CN 1620501A
Authority
CN
China
Prior art keywords
seq
nucleotide
identity
position nucleotide
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028127684A
Other languages
English (en)
Inventor
莱尼·兰格
吴文平
多米尼克·奥伯特
萨拉·兰德维克
柯克·M·施努尔
伊布·G·克劳森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1620501A publication Critical patent/CN1620501A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • C11D3/38645Preparations containing enzymes, e.g. protease or amylase containing cellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/14Multiple stages of fermentation; Multiple types of microorganisms or re-use of microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明涉及具有纤维二糖水解酶I(也被称为CBH I或CBH 1)活性的多肽和含有编码该多肽的核苷酸序列的多核苷酸。本发明还涉及含有该核苷酸构建体的核酸构建体、载体和宿主细胞,以及制备和使用该多肽的方法。

Description

具有纤维二糖水解酶I活性的多肽和编码多肽的多核苷酸
发明领域
本发明涉及具有纤维二糖水解酶(cellobiohydrolase)I(也被称为CBHI或CBH 1)活性的多肽和含有编码该多肽的核苷酸序列的多核苷酸。本发明还涉及含有核酸构建体、载体和该核酸构建体的宿主细胞,以及制备和使用该多肽的方法。
发明背景
纤维素是一种重要的工业原材料和一种可再生能源的来源。天然纤维素的物理结构和形态学很复杂,并且它的细微结构很难通过实验方法确定。然而,纤维素的化学结构很简单,它是由D-葡萄糖残基通过β-1,4-糖苷键连接形成的线性聚合体,链长超过10.000个糖苷残基。
为了有效地消化纤维素,需要几种酶的共同作用。其中至少有三类酶是必需的,它们将纤维素转化为葡萄糖:随机切断纤维素链的内切-(1,4)-β-D-葡聚糖酶(EC 3.2.1.4),从显微素链末端剪切纤维二糖单位的纤维二糖水解酶(EC 3.2.1.91),和将纤维二糖和可溶性纤维糊精转化为葡萄糖的β-葡萄糖苷酶(EC 3.2.1.21)。在这三类与纤维素降解有关的酶中,纤维二糖水解酶是降解天然晶态纤维素的关键性酶。
外切-纤维二糖水解酶(纤维二糖水解酶I,或CBH I)指通过从纤维素聚合体链的非还原末端水解纤维二糖降解纤维素的纤维二糖水解酶。
本发明的一个目的是提供具有纤维二糖水解酶I活性的改良多肽和编码该多肽的多核苷酸。改良多肽具有改善的特定活性和/或改善的稳定性特别是热稳定性。该多肽还具有改善的通过纤维二糖抵抗抑制的能力。
发明概述
本发明的第一个方面涉及选自下组所示的具有纤维二糖水解酶I活性的多肽:
(a)包含选自下组所示氨基酸序列的多肽:
与SEQ ID NO:2中第1-526位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:4中第1-529位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:6中第1-451位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:8中第1-457位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:10中第1-538位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:12中第1-415位氨基酸具有至少70%同一性的氨基酸序列,
与SEQ ID NO:14中第1-447位氨基酸具有至少70%同一性的氨基酸序列,
与SEQ ID NO:16中第1-452位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:38中第1-454位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:40中第1-458位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:42中第1-450位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:44中第1-446位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:46中第1-527位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:48中第1-455位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:50中第1-464位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:52中第1-460位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:54中第1-450位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:56中第1-532位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:58中第1-460位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:60中第1-525位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:66中第1-456位氨基酸具有至少80%同一性的氨基酸序列。
(b)包含选自下组所示氨基酸序列的多肽:
与存在于嗜热支顶孢(Acremonium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热毛壳霉(Chaetomium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于小柱孢菌(Scytalidium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热小柱孢菌(Scytalidium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于橙黄色热子囊菌(Thermoascus aurantiacus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Thielavia australiensis中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于幼嫩轮枝孢(Verticillium tenerum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70%同一性的氨基酸序列,
与存在于栗色新螱(Neotermes castaneus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70%同一性的氨基酸序列,
与存在于黑素白丝菌(Melanocarpus albomyces)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于支顶孢(Acremonium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Chaetomidium pingtungium中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Sporotrichum pruinosum中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于棉色二孢(Diplodia gossypina)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于囊状长毛盘菌(Trichophaea saccata)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热毁丝霉(Myceliophthora thermophila)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Exidia glandulosa中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于块团炭角菌(Xylaria hypoxylon)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于poitrasia circinans中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于灰色鬼伞(Coprinus cinereus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于淡黑假黑盘菌(Pseudoplectania nigrella)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
存在于玫瑰单瑞孢(Trichothecium roseum)IFO 5372中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于产黑色腐质霉(Humicola nigrescens)CBS 819.73中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于Cladorrhinum foecundissimum CBS 427.97中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于棉色二孢(Diplodia gossypina)CBS 247.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于嗜热毁丝霉(Myceliophthora thermophila)CBS117.65中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于微小根毛霉(Rhizomucor pusillus)CBS109471中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于Meripilus giganteus CBS 521.95中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于黑耳(Exidia glandulosa)CBS 2377.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于块团炭角菌(Xylaria hypoxylon)CBS 284.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于长毛盘菌(Trichophaea saccata)CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于毛壳霉(Chaetomium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于肉桂色毁丝霉(Myceliophthora hinnulea)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于有小孢子囊的草根霉(Thielavia cf.microspora)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于曲霉(Aspergillus sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于帚霉(Scopulariopsis sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于镰孢(Fusarium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于轮枝孢(Verticillium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,和
存在于蔓延疫霉(Phytophthora infestans)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列。
(c)包含选自下组所示氨基酸序列的多肽:
与SEQ ID NO:1中第1-1578位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:3中第1-1587位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:5中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:7中第1-1371位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:9中第1-1614位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:11中第1-1245位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:13中第1-1341位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:15中第1-1356位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:37中第1-1365位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:39中第1-1377位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:41中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:43中第1-1341位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:45中第1-1584位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:47中第1-1368位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:49中第1-1395位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:51中第1-1383位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:53中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:55中第1-1599位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:57中第1-1383位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:59中第1-1578位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:65中第1-1371位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
(d)由在高严谨条件下与下组所示的多核苷酸探针杂交的核苷酸序列编码的多肽:
(i)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,
(ii)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51第1-500位核苷酸,
SEQ ID NO:53第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,和
(iii)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,和
SEQ ID NO:65中第1-200位核苷酸,和
(e)具有纤维二糖水解酶I活性的(a)、(b)或(c)的片段。
本发明的第二个方面涉及一种含有编码本发明多肽的核苷酸序列的多核苷酸。
本发明的第三个方面涉及一种含有编码本发明多肽的核苷酸序列的核酸构建体,其中该核苷酸与一种或多种能引导多肽在适宜宿主中生产的调控序列可操作地连接。
本发明的第四个方面涉及含有本发明核酸构建体的重组表达载体。
本发明的第五个方面涉及含有本发明核酸构建体的重组宿主细胞。
本发明的第六个方面涉及一种生产本发明多肽的方法,该方法包括:
(a)培养菌株来生产多肽,该菌株野生型能生产多肽;和
(b)回收多肽。
本发明的第七个方面涉及一种生产本发明多肽的方法,该方法包括:
(a)在适宜于生产多肽的条件下培养本发明的重组宿主细胞,和
(b)回收多肽。
本发明的第八个方面涉及一种原位生产本发明多肽的方法,该方法包括:
(a)在适宜于生产多肽的条件下培养本发明的重组宿主细胞,和
(b)没有前面多肽的回收,而是将多肽与一种所要的底物接触。
本发明涉及的其它方面可以从以下的说明书和附的权利要求书中明显得出。
在进一步详细地讨论本发明之前,首先对下列术语和发明作出定义。
大致纯的多肽:在本文中,术语“大致(substantially)纯的多肽”指一种多肽制品,其中含有与其天然结合的至多10%重量的其它多肽物质(低百分比的其它多肽物质是优选的,如至多8%的重量,如至多6%的重量,如至多5%的重量,如至多4%的重量,如至多3%的重量,如至多2%的重量,如至多1%的重量,如至多1/2%的重量)。因此,优选大致纯的多肽为92%纯,即所述多肽至少占制品中总的多肽物质重量的92%,和优选高百分比纯度如至少94%纯,至少95%纯,至少96%纯,至少97%纯,至少98%纯,至少99%纯,至少99.5%纯。这里公开的多肽优选为大致纯的形式,尤其优选“基本纯的形式”,如多肽制品实质上不含有与其天然结合的其它多肽物质。这些可以通过如采用已知的重组方法来制备完成。这里,术语“大致纯的多肽”与术语“分离的多肽”及“分离形式的多肽”同义。
纤维二糖水解酶I活性:这里定义的术语“纤维二糖水解酶I活性”指作为一种纤维素1,4-β-纤维二糖酶(也称为外-葡聚糖酶,外-纤维二糖水解酶或1,4-β-纤维二糖水解酶)所具有的活性,如在酶的类别EC3.2.1.91中所定义的,能够催化纤维素和纤维四糖中的1,4-β-糖苷键水解并从链的非还原末端释放出纤维二糖。
与本发明的目的相适应,纤维二糖水解酶I的活性可以通过实施例2中描述的方法确定。
在一个方案中,纤维二糖水解酶I的活性可以根据Deshpande MV等(Methods in Enzymology,pp.126-130,“Selective Assay for Exo-1,4-β-glucanases”,1998)描述的方法测定。根据该方法,一个单位的纤维二糖水解酶I活性(糖苷键剪切活性)定义为在50℃、PH5.0时每分钟产生1.0μmol的p-硝基酚。
本发明的多肽应优选具有至少20%的选自下组所示氨基酸序列组成多肽的纤维二糖水解酶I活性:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60和SEQ ID NO:66。在一个优选方案中,由一种选自下组所示的氨基酸序列组成的多肽必须具有至少40%,如至少50%,优选至少60%,如至少70%,更优选至少80%,如至少90%,最好优选至少95%,如约或至少100%的纤维二糖水解酶I活性,该组包括SEQ IDNO:2中1-526位氨基酸、SEQ ID NO:4中1-529位氨基酸、SEQ ID NO:6中1-451位氨基酸、SEQ ID NO:8中1-457位氨基酸、SEQ ID NO:10中1-538位氨基酸、SEQ ID NO:12中1-415位氨基酸、SEQ ID NO:14中1-447位氨基酸、SEQ ID NO:16中1-452位氨基酸、SEQ ID NO:38中1-454位氨基酸、SEQ ID NO:40中1-458位氨基酸、SEQ ID NO:42中1-450位氨基酸、SEQ IDNO:44中1-446位氨基酸、SEQ ID NO:46中1-527位氨基酸、SEQ ID NO:48中1-455位氨基酸、SEQ ID NO:50中1-464位氨基酸、SEQ ID NO:52中1-460位氨基酸、SEQ ID NO:54中1-450位氨基酸、SEQ ID NO:56中1-532位氨基酸、SEQ ID NO:58中1-460位氨基酸、SEQ ID NO:60中1-525位氨基酸和SEQ ID NO:66中1-456位氨基酸。
同一性:在本文中,两个氨基酸序列或两个核苷酸序列之间的同源性通过参数同一性来描述。
适合于本发明的目标,两个氨基酸序列之间的同一性通过使用FASTA程序包2.0x版中的FASTA软件(参见W.R.Pearson和D.J.Lipman,1998,“Improved tools for biological sequence analysis”,PANS85:2444-2448;和W.R.Pearson,1990,“Rapid and Senstive SequenceComparison with FASTP and FASTA”,methods in enzymology 183:63-98)确定。使用的评分矩阵是BIOSUM50,间隙罚分(gap penalty)为12,间隙扩大罚分(gap extension penalty)为2。
两个核苷酸之间的同一性程度通过使用运算法则和上述的软件包确定,使用的矩阵为同一性矩阵,间隙罚分为16,间隙罚分为4。
片段:当在这里使用时,序列选自下组所示序列:SEQ ID NO:2,SEQ IDNO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ IDNO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,该序列片段为该氨基酸序列的氨基和/或羧基末端缺失了一或多个氨基酸的多肽。片段优选为具有缺失了相应于SWISS-PROT受理号P00725中描述的Trichoderma reesei纤维二糖水解酶I的“纤维素结合域”和/或“连接结构域”的氨基酸序列。片段更优选含有相应于SWISS-PROT受理号P00725中描述的Trichoderma reesei纤维二糖水解酶I的“催化域”的氨基酸序列。片段最优选是含有至少434个氨基酸残基,如选自下组所示的氨基酸残基:SEQ ID NO:2的第1-434位氨基酸,SEQ ID NO:4的第1-434位氨基酸,SEQ ID NO:6的第1-434位氨基酸,SEQ ID NO:8的第1-434位氨基酸,SEQ ID NO:10的第1-434位氨基酸,SEQ ID NO:12的第1-434位氨基酸,SEQ ID NO:14的第1-434位氨基酸,SEQ ID NO:16的第1-434位氨基酸,SEQ ID NO:38的第1-434位氨基酸,SEQ ID NO:40的第1-434位氨基酸,SEQ ID NO:42的第1-434位氨基酸,SEQ ID NO:44的第1-434位氨基酸,SEQ ID NO:46的第1-434位氨基酸,SEQ ID NO:48的第1-434位氨基酸,SEQ ID NO:50的第1-434位氨基酸,SEQ ID NO:52的第1-434位氨基酸,SEQ ID NO:54的第1-434位氨基酸,SEQ ID NO:56的第1-434位氨基酸,SEQ ID NO:58的第1-434位氨基酸,SEQ ID NO:60的第1-434位氨基酸和SEQ ID NO:66的第1-434位氨基酸。尤其是片段含有至少215个氨基酸残基,如选自下组所示的氨基酸残基:SEQ ID NO:2的第200-434位氨基酸,SEQ ID NO:4的第200-434位氨基酸,SEQ ID NO:6的第200-434位氨基酸,SEQ ID NO:8的第200-434位氨基酸,SEQ ID NO:10的第200-434位氨基酸,SEQ ID NO:12的第200-434位氨基酸,SEQ IDNO:14的第200-434位氨基酸,SEQ ID NO:16的第200-434位氨基酸,SEQ ID NO:38的第200-434位氨基酸,SEQ ID NO:40的第200-434位氨基酸,SEQ ID NO:42的第200-434位氨基酸,SEQ ID NO:44的第200-434位氨基酸,SEQ ID NO:46的第200-434位氨基酸,SEQ ID NO:48的第200-434位氨基酸,SEQ ID NO:50的第200-434位氨基酸,SEQ ID NO:52的第200-434位氨基酸,SEQ ID NO:54的第200-434位氨基酸,SEQ IDNO:56的第200-434位氨基酸,SEQ ID NO:58的第200-434位氨基酸,SEQ ID NO:60的第200-434位氨基酸和SEQ ID NO:66的第200-434位氨基酸。
等位基因变异体:在本文中,术语“等位基因变异体”指位于相同染色体位点基因的两个或多个可选择形式中的任何一种。等位基因变异体是由于突变天然产生的,并且可以导致群体内的多态性。基因突变可以是沉默的(编码的多肽没有变化)或可以编码具有相异氨基酸序列的多肽。一种多肽的一个等位基因变异体是由基因的一个等位基因变异体编码的多肽。
大致纯的多核苷酸:这里使用的术语“大致纯的多核苷酸”指一种多核苷酸制品,其中该多核苷酸已经远离它的自然遗传环境,因而不含有其它外源或不想要的编码序列,并以适于在遗传工程蛋白质生产体系中使用的形式存在。因此,一种大致纯的多核苷酸含有至多10%重量的其它与之天然关联的多核苷酸物质(低百分比的其它多核苷酸物质是优选的,如占至多8%的重量,6%的重量,5%的重量,4%的重量,3%的重量,2%的重量,1%的重量和1/2%的重量)。然而,一种大致纯的多核苷酸也可以含有天然存在的5′和3′非翻译区域,如作为启动子和终止子。优选大致纯的多核苷酸纯度至少为92%,如多核苷酸至少占制品中总的多核苷酸物质重量的92%,较高百分数优选如至少94%纯,至少95%纯,至少96%纯,至少97%纯,至少98%纯,至少99%纯,至少99.5%纯。这里公开的多核苷酸优选是一种大致纯的形式,特别优选这里公开的多核苷酸是一种基本纯的形式,如多核苷酸基本上不含有其它与之天然关联的多核苷酸物质。这里,术语“大致纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”同义。
修饰:本发明文中的术语“修饰”意指对选自下组所示的氨基酸序列的多肽进行任何一种化学修饰:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,以及对编码该多肽的DNA进行基因操作。修饰可以是氨基酸侧链的取代,在感兴趣的氨基酸上进行的替换、缺失和/或插入。
人工变异体:当在这里使用时,术语“人工变异体”指具有纤维二糖水解酶I活性的多肽,该多肽可通过微生物表达一种相应于下列序列修饰过的基因而生产:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59或SEQ ID NO:65。编码在适宜宿主中表达产生的所述变异体的修饰过的基因,可以通过修饰选自下组所示的多核苷酸序列进行人为干预获得:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ IDNO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59或SEQ ID NO:65。
cDNA:在本文中使用的术语“cDNA”包括通过从来源于真核细胞的天然的、成熟的、剪切过的mRNA分子反转录制备出的DNA分子。cDNA缺少了通常存在于相应基因组DNA中的内含子序列。初始的基本的RNA转录本是mRNA的前体,在成为成熟的剪切过的mRNA前它需经历一系列的加工事件,包括通过所谓的剪切过程剪切掉内含子序列。所以当cDNA来源于mRNA时,它就缺少了内含子序列。
核酸构建体:当在这里使用时,核酸构建体指一种核酸分子,不管是单链还是双链的,它是从天然存在的基因中分离出的或是已经被修饰过的,其中含有的核酸片段是不可能天然存在的。当核酸构建体含有表达本发明编码序列必需的调控序列时,术语核酸构建体与术语“表达框”同义。
调控序列:这里定义的术语“调控序列”包括了所有必需的或利于本发明多肽表达的组件。每一调控序列对于编码多肽的核酸序列可以是天然的或是外源的。这种调控序列包括但不局限于前导序列、多聚腺苷酸序列、前肽序列、启动子、信号肽序列和转录终止子。调控序列最低程度应包括一个启动子、转录和转录终止信号。为了引入能促进调控序列与编码多肽核苷酸序列的编码区连接的特异的限制性位点,可以在调控序列中加入接头。
可操作的连接:这里定义的“可操作的连接”作为一种构造,其中调控序列被适当地置于与DNA序列中编码序列相关联的位置,从而该调控序列能指导多肽的表达。
编码序列:当在这里使用时,术语“编码序列”包括直接特异于蛋白产物氨基酸序列的核酸序列。编码序列的界限通常由一个普遍起始于ATG启始密码子的开放式阅读框来确定。典型的编码序列包括DNA、cDNA和重组核苷酸序列。
表达:本文中的术语“表达”包括生产多肽中的任一步骤,包括但不局限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:本文中的术语“表达载体”包括线性或环状的DNA分子,该DNA分子含有可操作地与其它用于其转录的片段相连的编码本发明多肽的片段。
宿主细胞:这里使用的术语“宿主细胞”包括可耐受核酸构建体转化的任一细胞类型。
术语“多核苷酸探针”、“杂交”和各种严谨条件在题为“具有纤维二糖水解酶I活性的多肽”的章节中定义了。
热稳定性:这里使用的术语“热稳定性”按照实施例2中描述的方法测定。
发明详述
具有纤维二糖水解酶I活性的多肽
在第一个方案中,本发明涉及具有纤维二糖水解酶I活性的多肽,该多肽优选含有与选自下组所示的氨基酸序列有一定同一性的氨基酸序列:SEQID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,其中同一性为至少65%(如成熟的多肽),优选至少70%,如至少75%,更优选至少80%,如至少85%,甚至更优选90%,最优选至少95%,如至少96%,至少97%,和甚至最优选至少98%,如至少99%(其后的“同源多肽”)。在一个优选的方案中,氨基酸序列为与选自下组的氨基酸序列至多有10个氨基酸的差别(如10个氨基酸)的序列,其中特别是至多5个氨基酸的差别(如5个氨基酸),例如至多4个氨基酸的差别(如4个氨基酸),如至多3个氨基酸的差别(如3个氨基酸),该组包括SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。在一个最优选的方案中,氨基酸序列的差别至多为两个氨基酸(如两个氨基酸),例如选自下组所示的氨基酸序列中发生了一个氨基酸的改变:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。
优选地,本发明的多肽包括选自下组所示的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66;其中的等位基因变异体;或是其中具有纤维二糖水解酶I活性的片段。在另一个优选的方案中,本发明的多肽包括选自下组所示的氨基酸序列:SEQID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。
本发明的多肽可以是鉴定的野生型纤维二糖水解酶I,是天然来源分离的。这种野生型纤维二糖水解酶I可通过本领域已知标准技术特异地筛选出,如在实施例1中描述的分子筛选方法。而且,本发明的多肽可以通过DNA改组(shuffling)技术制备,如J.E.Ness等(Nature biotechnology,1999,17,893-896)所描述的。另外,本发明的多肽可以是一种人工变异体,其中包括在相应于选自下组所示的氨基酸序列中含有至少一个氨基酸发生替代、缺失和/或插入的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。这样的人工变体可通过本领域已知技术构建,如多肽的定点/随机诱变,所述多肽包含选自下组的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。在本发明的另一个方案中,氨基酸的变化(人工变异体和野生型多肽)是一种次要的状态,即可以是一种保守的氨基酸取代,故不会显著地影响折叠和/或蛋白的活性;少量的缺失,典型的有1至约30个氨基酸;少量的氨基或羧基端延伸,如氨基末端的甲硫氨酸残基;至多约20-25个残基的少量的连接肽;或通过改变净电荷或其它功能促进纯化的少量延伸,例如一种聚组氨酸区(tract)、抗原表位或结合域。
保守取代的例子在下组所述的氨基酸范围内,包括碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、中性氨基酸(谷氨酸和天冬酰胺酸)、疏水氨基酸(亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸),和小氨基酸(氨基乙酸、丙氨酸、丝氨酸和苏氨酸)。通常不改变特定活性的氨基酸取代是已知的并已经在现有技术中公开,如参见H.Neurath和R.L.Hill等的文献(1997,Theproteins,Academic Press,纽约)。最常进行的交换有Ala/Ser,Val/lle,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly,或是它们的反向交换。
在感兴趣的本发明的一个方案中,氨基酸的变化能改变多肽的物理化学特性,例如通过氨基酸的改变改善多肽的热稳定性,改变底物的特异性,或是改变最适PH值与其它。
这种取代、缺失和/或插入优选的氨基酸残基的数目与选自下组的氨基酸序列相比至多为10个,例如至多9个,如至多8个,更优选至多7个,如至多6个,例如至多5个,最优选至多4个,如至多3个,例如至多2个,尤其是至多1个,该组氨基酸有SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。
发明人已经分离出了编码具有纤维二糖水解酶I活性的多肽的核苷酸序列,这些酶来自于选自下组所述的微生物:嗜热支顶孢、嗜热毛壳霉、小柱孢菌属、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉;和来自白蚁幼虫内脏的栗色新螱。因此,在一个次要的方案中,本发明涉及含有同源氨基酸序列的多肽,该氨基酸序列与由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少65%同一性,其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。在本发明一个感兴趣的方案中,多肽含有的氨基酸序列与存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的同一性为至少70%的,如至少75%,优选至少80%,例如至少85%,更优选至少90%,最优选至少95%,如至少96%,例如97%,甚至最优选至少98%,例如99%,其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉,其后称它们为“同源多肽”。在一个感兴趣的方案中,氨基酸序列相应于由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的差别至多为10个氨基酸(如10个氨基酸),优选至多5个氨基酸的差别(如5个氨基酸),例如至多4个氨基酸的差别(如4个氨基酸),如至多3个氨基酸的差别(如3个氨基酸),其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinum foecundissimum CBS 427.97、棉色二孢CBS247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilusgiganteus CBS 521.95、黑耳CBS 2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。在一个特别优选的方案中,氨基酸序列相应于由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的差别至多为2个氨基酸(如2个氨基酸),例如仅有1个氨基酸的差别,其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。
优选地,本发明的多肽含有存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCCNO.0748,CGMCC NO.0749,CGMCC NO.0750。在另一个优选方案中,本发明的多肽由存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列组成,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCCNO.0749,CGMCC NO.0750。
在与上面所述相似的一个方案中,本发明的多肽可以是一种人工变异体,与存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列相比,该变异体包括优选由具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列组成,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCCNO.0749,CGMCC NO.0750。
在第三个方案中,本发明涉及由在极低严谨条件下杂交的核苷酸序列编码的具有纤维二糖水解酶I活性的多肽,优选在低严谨条件、更优选中等严谨条件、更优选中等偏上的严谨条件、甚至更优选高严谨条件和更优选极高严谨条件下与核苷酸探针进行杂交,其中探针选自下组所述的核苷酸序列:
(i)选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中1-1578位核苷酸,
SEQ ID NO:3中1-1587位核苷酸,
SEQ ID NO:5中1-1353位核苷酸,
SEQ ID NO:7中1-1371位核苷酸,
SEQ ID NO:9中1-1614位核苷酸,
SEQ ID NO:11中1-1245位核苷酸,
SEQ ID NO:13中1-1341位核苷酸,
SEQ ID NO:15中1-1356位核苷酸,
SEQ ID NO:37中1-1365位核苷酸,
SEQ ID NO:39中1-1377位核苷酸,
SEQ ID NO:41中1-1353位核苷酸,
SEQ ID NO:43中1-1341位核苷酸,
SEQ ID NO:45中1-1584位核苷酸,
SEQ ID NO:47中1-1368位核苷酸,
SEQ ID NO:49中1-1395位核苷酸,
SEQ ID NO:51中1-1383位核苷酸,
SEQ ID NO:53中1-1353位核苷酸,
SEQ ID NO:55中1-1599位核苷酸,
SEQ ID NO:57中1-1383位核苷酸,
SEQ ID NO:59中1-1578位核苷酸,和
SEQ ID NO:65中1-1371位核苷酸;
(ii)选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中1-500位核苷酸,
SEQ ID NO:3中1-500位核苷酸,
SEQ ID NO:5中1-500位核苷酸,
SEQ ID NO:7中1-500位核苷酸,
SEQ ID NO:9中1-500位核苷酸,
SEQ ID NO:11中1-500位核苷酸,
SEQ ID NO:13中1-500位核苷酸,
SEQ ID NO:15中1-500位核苷酸,
SEQ ID NO:37中1-500位核苷酸,
SEQ ID NO:39中1-500位核苷酸,
SEQ ID NO:41中1-500位核苷酸,
SEQ ID NO:43中1-500位核苷酸,
SEQ ID NO:45中1-500位核苷酸,
SEQ ID NO:47中1-500位核苷酸,
SEQ ID NO:49中1-500位核苷酸,
SEQ ID NO:51中1-500位核苷酸,
SEQ ID NO:53中1-500位核苷酸,
SEQ ID NO:55中1-500位核苷酸,
SEQ ID NO:57中1-500位核苷酸,
SEQ ID NO:59中1-500位核苷酸,
SEQ ID NO:65中1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,和
(iii)选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,和
SEQ ID NO:65中第1-200位核苷酸
(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,分子克隆实验室手册,第二版,冷泉巷,纽约)。
在另一个方案中,本发明涉及由存在于下组所述的微生物中的纤维二糖水解酶I编码部分核苷酸序列编码的具有纤维二糖水解酶I活性的多肽:
一种微生物,该微生物属于接合菌门(zygomycota),优选属于毛霉菌属(Mucorales),更优选属于毛霉菌科(Mucoraceae),最优选属于根毛霉属(Rhizomucor),如微小根毛霉(Rhizomucor pusillus),或是笄霉科(choanephoraceae),最优选属于poitrasia属,如poitrasia circinans。
一种微生物,该微生物属于卵菌纲(Oomycetes),优选腐霉目(Pythiales),更优选腐霉科(Pythiaceae),最优选疫霉属(Phytophthora),如蔓延疫霉(Phytophthora infestans)。
一种微生物,该微生物属于Auriculariales,担子菌目(Basidiomycota),层菌纲(Hymenomycetes),更优选属于Exidiaceae科,最优选属于Exidia属(如黑耳(Exidia glandulosa))。
一种微生物,该微生物属于Xylariales,(子囊菌门(Ascomycota),Sordariomycetes目),更优选属于炭角菌科(Xylariaceae),最优选属于炭角菌属(Xylaria),如块团炭角菌(Xylaria hypoxylon)。
一种微生物,该微生物属于Dothideales,子囊菌门,Dothideomycetes目,更优选属于Dothideaceae科,最优选属于色二孢属(Diplodia),如棉色二孢(Diplodia gossypina)。
一种微生物,该微生物属于盘菌目(Pezizales,子囊菌门),优选属于Pyronemataceae科,更优选属于长毛盘菌属(Trichophaea),如囊状长毛盘菌(Trichophaea saccata);或是Sarcosomataceae科,更优选属于假黑盘菌属(Pseudoplectania),如淡黑假黑盘菌(Pseudoplectanianigrella)。
一种微生物,该微生物属于Rigidiporaceae科(在担子菌门,Hymenomycetes,Hymenomycetales之下),更优选属于Meripilus属,如Meripilus giganteus。
一种微生物,该微生物属于皱孔菌科(Meruliaceae,在担子菌门,Hymenomycetes,Sterealesales之下),更优选属于孢子丝菌属(Sporothrichum),如孢子丝菌。
一种微生物,该微生物属于蘑菇科(Agaricaceae,在担子菌门,Hymenomycetes,伞菌目之下),更优选属于鬼伞属,如灰色鬼伞(Coprinuscinereus)。
一种微生物,该微生物属于肉座菌科(Hypocreceae,在子囊菌门,Sordariomycetes,肉座菌目之下),更优选属于支顶孢属(Acremonium,如嗜热支顶孢(Acremonium thermophilum),支顶孢;或有有丝分裂孢子的轮枝孢属(Verticillium),如幼嫩轮枝孢(Verticillium tenerum)。
一种微生物,该微生物属Cladorrhinum属(在子囊菌门,Sordariomycetes,Sordariales,Sordariaceae之下),如Cladorrhinumfoecundissimum。
一种微生物,该微生物属于毁丝霉属(在子囊菌门,Sordariomycetes,Sordariales,Sordariaceae之下),如嗜热毁丝霉(Myceliophthorathermophila)或肉桂色毁丝霉(Myceliophthora hinnulae)。
一种微生物,该微生物属于毛壳霉属(在子囊菌门,Sordariomycetes,Sordariales,Chaetomiaceae之下),如嗜热毛壳霉(Chaetomiumthermophilum)。
一种微生物,该微生物属于Chaetomidium属(在子囊菌门,Sordariomycetes,Sordariales,Chaetomiaceae之下),如Chaetomidiumpingtungium。
一种微生物,该微生物属于草根霉属(在子囊菌门,Sordariomycetes,Sordariales,Chaetomiaceae之下),如Thielavia australiensis或有孢子囊的草根霉(Thielavia microspora)。
一种微生物,该微生物属于热子囊菌属(在子囊菌门,之下),如橙黄色热子囊菌(Thermoascus aurantiacus)。
一种微生物,该微生物属于单瑞孢属(有丝分裂孢子的子囊菌门),如玫瑰单瑞孢(Trichothecium roseum),和
一种属于产黑色腐质霉种(Humicola nigrescens)的微生物。
一种选自下组所示序列的核苷酸序列或其亚序列:SEQ ID NO:1,SEQ IDNO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ IDNO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:65,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ IDNO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ IDNO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:61,SEQ ID NO:62,SEQ IDNO:63,SEQ ID NO:64和SEQ ID NO:67,以及是一种选自下组所示的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,或是其片段,它们可以用于设计多核苷酸探针来鉴别和克隆出编码具有纤维二糖水解酶I活性的多肽的DNA,可以根据本领域公知的技术从不同的属或种的菌株中获得该DNA。这种探针尤其可用于与感兴趣的属或种的基因组或cDNA杂交,随后进行标准的DNA印迹过程,从而鉴别和分离出其中相应的基因。这种探针可以比全序列短,但必须至少有15个核苷酸,优选至少25个,更优选至少35个核苷酸的长度,例如长度为至少70个核苷酸。然而优选核苷酸探针长至少为100个核苷酸。例如,多核苷酸探针可以为至少200个核苷酸长度,至少300个核苷酸长度,至少400个核苷酸长度或至少为500个核苷酸长度。甚至可以使用更长的探针,如多核苷酸探针的长度至少为600个核苷酸,至少为700个核苷酸,至少为800个核苷酸,或至少为900个核苷酸。DNA和RNA探针都可以使用,探针通常被标记后用来检测相应的基因(例如,用32P,3H,35S,生物素或抗生物素蛋白来标记)。
因此,通过建立其它微生物的DNA和cDNA文库,从中可以筛选出与上述探针杂交的DNA,该DNA编码具有纤维二糖水解酶I活性的多肽。来自于这些其它微生物的基因组或其它DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳分离,或是采用其它的分离技术。来自于文库的DNA或分离的DNA可以被转移或固定在硝化纤维或其它适合的载体物质上。为了鉴别出克隆或与SEQ ID NO:1同源的DNA,含有固定DNA的载体物质用于DNA印迹中。
为了达到本发明的目的,杂交显示了与标记的多核苷酸探针杂交的核苷酸序列,其中探针与SEQ ID NO:1所示序列能在极低至极高严谨条件下杂交。在这些条件下由多核苷酸探针杂交上的分子可以通过X光片或任何其它本领域已知技术测定。无论何时在本文中使用的术语“多核苷酸探针”都可以被理解成含有至少15个核苷酸的探针。
在一个感兴趣的方案中,多核苷酸探针是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:1中第1-1302位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:3中第1-1302位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:5中第1-1302位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:7中第1-1302位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:9中第1-1302位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:13中第1-1302位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:15中第1-1302位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:37中第1-1302位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:39中第1-1302位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:41中第1-1302位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:43中第1-1302位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:45中第1-1302位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:47中第1-1302位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:49中第1-1302位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:51中第1-1302位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:53中第1-1302位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:55中第1-1302位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:57中第1-1302位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:59中第1-1302位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,和
SEQ ID NO:65中第1-1302位核苷酸,
或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51中第1-500位核苷酸,
SEQ ID NO:53中第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,和
或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,
SEQ ID NO:65中第1-200位核苷酸,
SEQ ID NO:22中第1-200位核苷酸,
SEQ ID NO:23中第1-200位核苷酸,
SEQ ID NO:24中第1-200位核苷酸,
SEQ ID NO:25中第1-200位核苷酸,
SEQ ID NO:26中第1-200位核苷酸,
SEQ ID NO:27中第1-200位核苷酸,
SEQ ID NO:28中第1-200位核苷酸,
SEQ ID NO:29中第1-200位核苷酸,
SEQ ID NO:30中第1-200位核苷酸,
SEQ ID NO:31中第1-200位核苷酸,
SEQ ID NO:32中第1-200位核苷酸,
SEQ ID NO:33中第1-200位核苷酸,
SEQ ID NO:34中第1-200位核苷酸,
SEQ ID NO:35中第1-200位核苷酸,
SEQ ID NO:61中第1-200位核苷酸,
SEQ ID NO:62中第1-200位核苷酸,
SEQ ID NO:63中第1-200位核苷酸,
SEQ ID NO:64中第1-200位核苷酸,和
SEQ ID NO:67中第1-200位核苷酸。
在另一个感兴趣的方案中,多核苷酸探针是编码选自下组所示多肽的核苷酸序列的互补链:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60和SEQ ID NO:66。在更优选的方案中,多核苷酸探针是选自下组所示核苷酸序列的互补链:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59或SEQ ID NO:65。在另一个优选的方案中,多核苷酸探针是包含在质粒中的核苷酸序列的互补链,其中质粒存在于选自于下组的保藏微生物中:CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCCNO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。
对于至少100个核苷酸长度的探针来说,极低至极高的严谨条件定义为在42℃、5×SSPE、1.0% SDS、5×分子杂交封闭剂(Denhardt’ssolution)、100μg/ml剪切和变性鲑精DNA条件下预杂交和杂交,随后进入标准的DNA印迹程序。优选地,至少100个核苷酸的长探针不含有1000个以上的核苷酸。对于至少100个核苷酸长度的探针,最后在42℃用2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(极低严谨条件);优选在42℃使用0.5×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(低严谨条件);更优选在42℃使用0.2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(中等严谨条件);甚至更优选在55℃使用0.2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(中等偏上严谨条件);最优选在60℃使用0.2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(高严谨条件);尤其是在68℃使用0.2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(极高严谨条件)。
虽然没有被特别地选定,但也预期了可以使用短的探针,如约15至99个核苷酸长度的探针,例如从约15至约70个核苷酸长度的探针。对于这种短的探针来说,严谨条件定义为在低于Tm值下5-10℃时进行预杂交、杂交和杂交后洗涤,Tm值根据Bolton和McCaethy所述方法计算(1962,Proceedings of the National Academy of Sciences USA 48:1390),其中每毫升杂交液含有0.9M NaCl,0.09M PH7.6 Tris-HCl,6mM EDYA,0.5%NP-40,1×分子杂交封闭剂,1mM焦磷酸盐,1mM磷酸单碱钠,0.1mM ATP,和0.2mg酵母RNA条件下预杂交和杂交,随后进入标准的DNA印迹程序。
对于约15至99个核苷酸长度的短探针来说,第一次在6×SSC加上0.1%SDS中洗涤载体材料15分钟,在低于计算的Tm值5-10℃时使用6×SSC再洗涤两次,每次15分钟。
具有纤维二糖水解酶I活性的多肽的来源
本发明的多肽可以从任何一种微生物获得。适应于本发明目的,这里使用的“获自”指由核苷酸编码的多肽由细胞生产,该核苷酸序列天然存在于或该核苷酸序列已经被插入细胞中。在一个优选的方案中,多肽被分泌到细胞外。
本发明的多肽可以是一种细菌多肽。例如,多肽可以是一种革兰氏阳性菌,例如是一种芽孢杆菌多肽,如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂类芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽;或一种链霉菌多肽,如变青链霉菌或鼠灰链霉菌多肽;或是一种革兰氏阴性菌,如大肠杆菌或一种假单孢菌多肽。
本发明的多肽可以是一种真菌多肽,和更优选一种酵母多肽,例如假丝酵母属、克鲁维氏酵母属、Neocallimastix、毕赤氏酵母属、Piromyces、糖酵母属、裂殖糖酵母属或Yarrowia多肽;或更优选一种细丝状真菌多肽如支顶孢属、曲霉属、短柄酶属Cryptococcus、Filibasidium、镰孢属、腐质霉属、Magnaporthe、毛霉属、毁丝霉属、链孢霉属、拟青霉属、青霉属、裂褶菌属、踝节菌属、热子囊菌属、草根霉属、Tolypocladium或木霉属多肽。
在一个感兴趣的方案中,多肽是一种卡尔斯伯糖酵母、啤酒糖酵母、糖化糖酵母、Saccaromyces douglasii、Saccaromyces kluyveri、Saccaromyces norbensis或卵形糖酵母多肽。
在另一个感兴趣的方案中,多肽是一种棘孢曲霉、泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑色曲霉、米曲霉、杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、玫瑰色镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、Fusarium torulosum、Fusariumtrichothecioides、Fusarium venenatum、Humicola insolens、Humicolalanuginosa、米赫毛霉、嗜热毁丝霉、粗糙链孢霉、产紫青霉、Trichodermaharzianum、康宁氏木霉、Trichoderma longibrachiatum、Trichodermareesei或绿色木霉多肽。
在一个优选的方案中,多肽是一种嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌或蔓延疫霉多肽。
在一个更优选的方案中,多肽是一种嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、Poitrasia circinans或Coprinus cinereus多肽。如该多肽由选自所示的氨基酸序列组成:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60和SEQ ID NO:66。
可以理解上述微生物包括了完全和不完全的形态,和其它分类学等价物,如变异体,而不管它们已知的品种名称。本领域的技术人员将容易地识别和鉴别适合的等价物。
公众可以从一些保藏单位容易获得这些菌株,例如美国典型培养物保藏中心(ATCC),德意志微生物保藏中心(DSMZ),中国普通微生物保藏中心(CGMCC),荷兰真菌菌种保藏中心(CBS),美国农业机构保藏中心(NRRL)。
而且,通过前述探针可以从自然界(如土壤、水、植物、动物等)中分离出的微生物等其它来源鉴别出和获得这种多肽。从自然环境中分离微生物的技术是本领域公知的。然后可以通过对其它微生物的基因组或cDNA文库进行相似筛选得到核苷酸序列。一旦编码多肽的核苷酸序列被探针检测出来,使用本领域普通技术人员已知的技术可以将该序列分离或克隆(参见Sambrook等,1989,supra)。
由本发明核苷酸序列编码的多肽还包括融合多肽或可剪切多肽,其中其它的多肽在该多肽或其片段的N-末端或C-末端融合。融合多肽可以通过一种编码其它多肽的核苷酸序列(或其部分)与本发明的核苷酸序列(或其部分)融合产生。融合多肽的生产技术是本领域公知的,并且包括了连接编码多肽的编码序列,这样它们处于表达框中并且融合多肽的表达处于相同启动子和终止子的调控之下。
多核苷酸和核苷酸序列
本发明还涉及含有编码本发明多肽的核苷酸序列的多核苷酸,本发明尤其涉及由编码本发明多肽的核苷酸序列组成的多核苷酸。在一个优选的方案中,核苷酸序列选自下组所示的序列:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65。在一个更优选的方案中,核苷酸序列为成熟多肽编码区,它包含在质粒中,所述质例包含在选自下组的保藏微生物中:CGMCC NO.0584,CGMCC NO.0581,CGMCCNO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCCNO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。本发明还包括一种多核苷酸,它含有、优选具有编码与选自下组的一种氨基酸序列一致的多肽的核苷酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,该核苷酸序列的遗传密码与选自下组的核苷酸序列的简并性不同:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ IDNO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ IDNO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65。
本发明还涉及含有,优选由下列组成,选自下组的核苷酸序列的亚序列的多核苷酸:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,和SEQ ID NO:65,该核苷酸序列编码一种选自下组的氨基酸序列的片段,该片段具有纤维二糖水解酶I的活性:SEQ ID NO:2,SEQ IDNO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ IDNO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。一种选自下组的核苷酸序列的亚序列:SEQ ID NO:1,SEQ ID NO:3,SEQ IDNO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ IDNO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65,该核苷酸序列包含在选自下组的核苷酸序列中,除了5’和/或3’端缺失了一个或多个核苷酸以外:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65,
本发明还涉及具有选自下组的,优选由其组成,成熟多肽编码序列中含有至少一种修饰的核苷酸序列的多核苷酸:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65,而且其中修饰的核苷酸序列编码一种具有选自下组氨基酸序列的多肽:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。
分离或克隆编码一种多肽的核苷酸序列的方法是本领域已知的,并且包括了从基因组DNA中的分离技术、来自cDNA的制备方法或它们的组合。从这种基因组DNA中克隆出本发明的核苷酸序列是可以实现的,如使用公知的聚合酶链反应(PCR)或利用共同的结构特征经抗体筛选表达文库来检测克隆的DNA片段(参见如Innis等,1990,PCR:A Guide to Methods andApplication,Academic Press,New York)。其它扩增程序例如连接酶链反应(LCR)、连接激活转录(LAT)和基于核苷酸序列的扩增(NASBA)可以被使用。核苷酸序列可以从一种选自下组的菌株中克隆:支顶孢、小柱孢菌、热子囊菌、草根霉、轮枝孢、新螱、白丝菌、poitrasia、鬼伞、单瑞孢、产腐质霉、Cladorrhinum、二孢、毁丝霉、根毛霉、Meripilus、黑耳、炭角菌、盘菌、毛壳霉、Chaetomidium、毁丝霉、Sporotrichum、草根霉、曲霉、帚霉、镰孢、假黑盘菌和疫霉,或其它相关的微生物,这样,该序列可以是如多肽编码区核苷酸序列的一种等位基因或变异体。
在遗传工程中使用标准的克隆技术可以获得核苷酸序列,将它从天然位点重新定位到它将被复制的不同位点。克隆方法可以包括对感兴趣的含有编码多肽的核苷酸序列的片段进行切除和分离,将片段插入载体分子中和将重组载体转化进宿主细胞,宿主细胞中的核苷酸序列的多拷贝或克隆将被复制。核苷酸序列可以是基因组、cDNA、RNA、半合成、合成来源或它们的组合。
本发明还涉及包含,优选具有与选自下组的核苷酸序列具有一定同一性的核苷酸序列的多核苷酸:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51中第1-500位核苷酸,
SEQ ID NO:53中第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸
其中同一性为至少70%,例如至少75%;优选序列具有至少80%的同一性,如85%的同一性,例如至少90%的同一性,更优选至少95%的同一性,例如至少96%的同一性,如至少97%的同一性,甚至更优选至少98%的同一性,例如99%。优选核苷酸序列编码具有纤维二糖水解酶I活性的多肽。两种核苷酸序列之间的同一性可根据前述方法确定(参见题为“定义”的章节)。
在感兴趣的另一个方面,本发明涉及包含,优选具有,与存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少65%同一性的核苷酸序列的多核苷酸:CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。在另一个优选的方案中,核苷酸序列与存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列的同一性至少为70%:CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCCNO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750,例如至少75%;优选序列具有至少80%的同一性,如85%的同一性,例如至少90%的同一性,更优选至少95%的同一性,例如至少96%的同一性,如至少97%的同一性,甚至更优选至少98%的同一性,例如99%。优选核苷酸序列含有存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列:CGMCC NO.0584,CGMCCNO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。在一个更优选的方案中,核苷酸序列具有存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列:CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。
编码本发明多肽的核苷酸序列的修饰对于多肽的合成可以是必需的,其中包括相应于选自下组的氨基酸序列具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ IDNO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。根据某些工程方法,这些人工变异体不同于从天然来源分离的多肽,如它们之间的区别在于特定的活性、热稳定性、最适PH值等。
对于本领域的技术人员来说,很显然这些修饰可以在与分子功能密切相关的区域以外进行,从而获得具有活性的多肽。对于由本发明核苷酸序列编码的多肽的活性所必需的氨基酸残基自然是优选不被进行取代等修饰的,可以根据本领域公知的技术如位点直接突变或丙氨酸筛选突变等方法确定这些残基(参见如Cunningham和Wells,1989,Science244:1081-1085)。在后一种方法中,对分子中的每一个正电荷残基进行突变,然后通过对生成的突变分子进行纤维二糖水解酶I活性检测,从而鉴定出发生突变的氨基酸残基对于分子活性是否必需。还可以通过分析由核磁共振、晶体衍射技术或光亲和标记等技术测定的三维结构来确定底物-酶互作位点(参见如Vos等,1992,Science 255:306-312;Smith等,1992,Journal of moleucar biology 224:899-904;Wlodaver等,1992,FEBSLetters 309:59-64)。
而且,编码本发明多肽的核苷酸序列可以经引入一个核苷酸替代进行修饰,该修饰不会导致生成另一种由核苷酸序列编码多肽的氨基酸序列,但是需与宿主微生物生产酶时使用密码子的习惯相一致。
可以通过使用本领域已知的任何方法进行位点定向诱变,从而在核苷酸序列中引入突变,使一个核苷酸变成另一个核苷酸。在这些方法中,尤其实用的方法是使用一种超螺旋双链DNA载体,将感兴趣的基因和所需突变的两条合成引物插入该载体中,其中每条寡核苷酸引物与载体的相反链互补并且能在温度循环中依靠Pfu DNA聚合酶进行延伸。在引物结合上之后生成了含有交错缺口的突变质粒。温度循环后,用特异于甲基化和半甲基化DNA的Dpnl处理产物,消化亲代DNA模板并挑选出含有突变的合成DNA。本领域已知的其它方法也可以使用。对于核苷酸替代的综合描述参见如Ford等的文献(1991,Protein Expression and Purification 2:95-107)。
本发明还涉及包含,优选具有,一种编码具有纤维二糖水解酶I活性的多肽的核苷酸序列,并且该核苷酸序列在极低严谨条件、优选低严谨条件、更优选中等严谨条件、更优选中等偏上严谨条件、甚至更优选高严谨条件和最优选极高严谨条件下与选自下组所述的核苷酸探针杂交:
(i)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:1中第1-1302位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:3中第1-1302位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:5中第1-1302位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:7中第1-1302位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:9中第1-1302位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:13中第1-1302位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:15中第1-1302位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:37中第1-1302位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:39中第1-1302位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:41中第1-1302位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:43中第1-1302位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:45中第1-1302位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:47中第1-1302位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:49中第1-1302位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:51中第1-1302位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:53中第1-1302位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:55中第1-1302位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:57中第1-1302位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:59中第1-1302位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,和
SEQ ID NO:65中第1-1302位核苷酸,
(ii)或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51中第1-500位核苷酸,
SEQ ID NO:53中第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,
(iii)或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,
SEQ ID NO:65中第1-200位核苷酸,
SEQ ID NO:22中第1-200位核苷酸,
SEQ ID NO:23中第1-200位核苷酸,
SEQ ID NO:24中第1-200位核苷酸,
SEQ ID NO:25中第1-200位核苷酸,
SEQ ID NO:26中第1-200位核苷酸,
SEQ ID NO:27中第1-200位核苷酸,
SEQ ID NO:28中第1-200位核苷酸,
SEQ ID NO:29中第1-200位核苷酸,
SEQ ID NO:30中第1-200位核苷酸,
SEQ ID NO:31中第1-200位核苷酸,
SEQ ID NO:32中第1-200位核苷酸,
SEQ ID NO:33中第1-200位核苷酸,
SEQ ID NO:34中第1-200位核苷酸,
SEQ ID NO:35中第1-200位核苷酸,
SEQ ID NO:61中第1-200位核苷酸,
SEQ ID NO:62中第1-200位核苷酸,
SEQ ID NO:63中第1-200位核苷酸,
SEQ ID NO:64中第1-200位核苷酸,和
SEQ ID NO:67中第1-200位核苷酸。
可以理解,有关核苷酸序列杂交的细节和特例与在名为“具有纤维二糖水解酶I活性的多肽”的章节中讨论的相同或类似。
核苷酸构建体
本发明还涉及一种核苷酸构建体,其中本发明的核苷酸序列可操作地与一个或多个调控序列相连,这些调控序列能在适合的宿主细胞内在调控序列适应的条件下指导编码序列的表达。
编码本发明多肽的核苷酸序列可以经各种操作处理后用于多肽的表达。在核苷酸序列插入载体之前可以对它们进行处理或这种处理是必须的,这取决于表达载体本身。通过重组DNA技术修饰核苷酸序列的方法是本领域公知的。
调控序列可以是一种适合的启动子序列,该序列可以被表达核苷酸序列的宿主细胞识别。启动子序列含有介导多肽表达的转录调控序列。启动子可以是任何一种在所选宿主细胞中具有转录活性的核苷酸序列,包括发生突变的、截短的和杂合的启动子,并且可以获自那些对于宿主细胞同源或异源的编码胞外或胞内多肽的基因。
特异于大肠杆菌的用于指导本发明核苷酸构建体转录的适合的启动子有:获自大肠杆菌lac操纵子的启动子,天蓝色链霉菌乳糖基因(dagA),模式种果聚糖蔗糖酶基因(SacB),地衣芽孢杆菌α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌麦芽糖淀粉酶(amyM),解淀粉芽孢杆菌α-淀粉酶基因(amyQ),地衣芽孢杆菌青霉素酶基因(penP),模式种xylA和xylB基因,和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceeding of thenational academy of sciences USA 75:3727-3731),以及tac启动子(DeBoer等,1983,Proceeding of the national academy of sciences USA80:21-25)。更多的有关启动子的描述参见“Useful proteins fromrecombinant bacteria”(Scientific American,198O,242:74-94)和Sambrook等(1989,supra)。
用于在细丝状真菌宿主细胞中指导本发明核苷酸构建体转录的适合的启动子如获自以下基因的启动子:米曲霉TAKA淀粉酶基因,Rhizomucormiehei天冬氨酸蛋白酶,黑色曲霉中性α-淀粉酶,黑色曲霉稳定的α-淀粉酶,黑色曲霉或泡盛曲霉葡糖淀粉酶(glaA),Rhizomucor miehei脂肪酶,米曲霉碱性蛋白酶,米曲霉丙糖磷酸盐异构酶,构巢曲霉乙酰胺酶,和尖孢镰孢类胰岛素蛋白酶(WO96/00787),以及NA2-tpi启动子(来自于黑色曲霉中性α-淀粉酶和米曲霉丙糖磷酸盐异构酶的杂合的启动子),和它们的变异体,截短的和杂合的形式。
在酵母宿主中,有用的启动子获自啤酒糖酵母烯醇酶(ENO-1)、啤酒糖酵母半乳糖激酶(GAL1)、啤酒糖酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和啤酒糖酵母3-磷酸甘油酸盐激酶基因。更多用于酵母宿主细胞的有用的启动子由Romanos等描述了(1992,Yeast,8:423-488)。
调控序列还可以是适合的转录终止序列,该序列可以被宿主细胞识别而终止转录。终止序列可操作地连接于编码多肽的核苷酸序列的3′端。任何一种在所选宿主细胞内具有功能的终止子均可用于本发明。
优选适用于细丝状真菌宿主细胞的终止子获自米曲霉TAKA淀粉酶基因、黑色曲霉葡糖淀粉酶基因、构巢曲霉邻基苯甲酸盐合成酶基因、黑色曲霉α-淀粉酶基因和类胰岛素蛋白酶基因。
优选适用于酵母宿主细胞的终止子获自啤酒糖酵母烯醇酶基因、啤酒糖酵母细胞色素C(CYC1)基因和啤酒糖酵母甘油醛-3-磷酸脱氢酶基因。其它用于酵母宿主细胞的有用的终止子由Romanos等描述了(1992,Supra)。
调控序列还可以是一种适合的前导序列,一种对于宿主细胞非常重要的mRNA的非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5′端。任何一种在所选宿主细胞内具有功能的前导序列均可用于本发明。
优选用于细丝状真菌宿主细胞的前导序列获自米曲霉TAKA淀粉酶基因和米曲霉丙糖磷酸盐异构酶基因。
适用于酵母宿主细胞启动子获自啤酒糖酵母烯醇酶(ENO-1)基因、啤酒糖酵母3-磷酸甘油酸盐激酶基因、啤酒糖酵母α-因子和啤酒糖酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因。
调控序列还可以是一种聚腺苷酸化序列,该序列可操作地连接于编码多肽的核苷酸序列的3′端,当转录时作为一种在转录的mRNA上添加多聚腺苷酸残基的信号被宿主细胞识别。任何一种在所选宿主细胞内具有功能的聚腺苷酸化序列均可用于本发明。
优选适用于细丝状真菌宿主细胞的聚腺苷酸化序列获自米曲霉TAKA淀粉酶基因、黑色曲霉葡糖淀粉酶基因、构巢曲霉邻基苯甲酸盐合成酶基因、尖孢镰孢类胰岛素蛋白酶基因和黑色曲霉α-糖苷酶。
适用于酵母宿主细胞的聚腺苷酸化序列由Guo和Sherman公开了(1995,Molecular cellular biology 15:5983-5990)。
调控序列还可以是一种信号肽编码区,它编码一种连接于多肽的氨基端的氨基酸序列并指导编码的多肽进入细胞的分泌途径。编码序列5′端的核苷酸序列可以原本就含有信号肽编码区,在翻译阅读框中它与编码分泌多肽的编码区片段天然相连。或者,编码序列的5′端可以含有一种与编码序列异源的信号肽编码区。当编码序列不天然含有信号肽编码区时,外源信号肽编码区有可能需要。或者,为了促进多肽的分泌,可以只是用外源信号肽编码区替换天然的信号肽编码区。然而,任何一种能指导表达的多肽进入所选宿主细胞的分泌途径的信号肽编码区都可以用于本发明。
适合于细菌宿主细胞的有效的信号肽编码区是获自芽孢杆菌NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的信号肽编码区。Simonen和Palva描述了更多的信号肽(1993,Microbiological Reviews 57:109-137)。
用于细丝状真菌宿主细胞的有效的信号肽编码区获自米曲霉TAKA淀粉酶基因、黑色曲霉中性淀粉酶基因、黑色曲霉葡糖淀粉酶基因、Rhizomucormiehei天冬氨酸蛋白酶基因、Humicola insolens纤维素酶和Humicolalanuginosa脂肪酶基因。
适用于酵母宿主细胞的信号肽编码区获自啤酒糖酵母α-因子基因和啤酒糖酵母转化酵素基因。Romanos等描述了其它有用的信号肽编码区(1992,supra)。
调控序列还可以是一种编码位于多肽氨基端氨基酸序列的前肽编码区。这种生成的多肽称之为酶原或多肽原(或在某些情形时被称为酵素原)。多肽原通常没有活性,经由催化或多肽的自发催化剪切作用从多肽原转化成成熟的活性多肽。多肽原编码区可以获自模式种碱性蛋白酶(aprE)基因、模式种中性蛋白酶(nprT)基因、啤酒糖酵母α-因子基因、Rhizomucormiehei天冬氨酸蛋白酶基因和嗜热性毁丝霉漆酶基因(WO95/33836)。
其中信号肽和前肽区存在于多肽的氨基端,前肽区相邻于多肽的氨基端,信号肽区相邻于前肽的氨基端。
还可以添加其它的调节序列来调节与宿主细胞生长相关的多肽的表达。如当收到一种化学或物理刺激包括存在一种调节化合物时,调节系统发生反应开始或停止基因的表达。原核系统中的调节体系包括lac、tac和trp操纵子系统。在酵母中,可以使用ADH2和GAL1系统。在细丝状真菌中,TAKA淀粉酶启动子、黑色曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可以用作调节序列。其它调节序列如那些允许基因扩增的序列,在真核系统中,这些序列包括二氢叶酸还原酶基因和金属硫因基因,前者在存在氨甲蝶呤时被扩增,后者扩增时需要重金属。在这些例子里,编码多肽的核苷酸序列被可操作地与调节序列连接。
表达载体
本发明还涉及含有本发明核酸构建体的重组表达载体。上述各种核苷酸和调控序列可以被连接起来产生一种重组表达载体,该载体可以包括一或多个适宜的限制性位点用于编码多肽的核苷酸序列在这些位点插入或替代。或者,本发明的核苷酸序列可以通过将核苷酸序列或含有该序列的核酸构建体插入一种适合于表达的载体而进行表达。构建表达载体时,编码序列插入载体中这样编码序列可以与适于表达的调控序列可操作地连接起来。
重组表达载体可以是任何一种能方便地用于重组DNA技术和能使核苷酸序列表达的载体(如质粒或病毒)。载体的选择主要根据载体与载体转化的宿主细胞之间的相容性。载体可以是线性的或闭合的环状质粒。
载体可以是一种能自我复制的载体,如作为一种染色体外实体存在的载体,它的复制依赖于染色体的复制,如质粒,一种染色体外元件,微型染色体,或一种人工染色体。
载体可以通过任何一种方式来确保自我复制。或者,当转化入宿主细胞时,载体可以整合进基因组并与其整合进的染色体一起复制。而且,可以使用引入宿主细胞基因组的单个载体或质粒或一起包含总DNA的两个或多个载体或质粒,或者一种转座子。
本发明的载体优选含有一或多个可选择的标记,从而能容易地挑选出转化的细胞。可选择的标记是一种基因,其产物能提供杀虫或病毒抗性、重金属耐受性、原养型或营养缺陷型,等等。
细菌的可选标记如来自模式种或地衣芽孢杆菌,或具有抗生素如氨苄西林、卡那徽素、氯霉素或四环素抗性的标记。适用于酵母宿主细胞的可选择标记有ADE1、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于细丝状真菌宿主细胞的可选择标记包括但不局限于amdS(乙酰胺酶)、argA(鸟氨酸氨基甲酰转移酶)、bar(瞵丝菌素乙酰基转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺嘌呤转移酶)和trpC(氨基苯甲酸盐合成酶),以及它们的等价物。
优选用于曲霉细胞的可选择标记有米曲霉或构巢曲霉的amdS和pyrG基因和吸水链霉菌的bar基因。
本发明的载体优选含有允许载体稳定地整合进宿主细胞基因组或载体在细胞中不依赖于基因组进行自发复制的元件。
为了整合进宿主细胞基因组,载体可以依靠编码多肽的核苷酸序列或载体的其它元件,通过同源或非同源重组稳定地整合进基因组。或者,载体可以含有额外的核苷酸序列用于指导通过同源重组整合进宿主细胞基因组。额外的核苷酸序列使得载体能在染色体上的一个精确的位点被整合进宿主细胞基因组。为了提高在准确位点整合的可能性,整合元件必须优选含有足够数量的核苷酸,例如100至1500个碱基对,优选400至1500个碱基对,和更优选800至1500个碱基对,并且核苷酸序列与相应的靶序列具有很高的同一性能增强同源重组的可能性。整合的元件可以是任一种与宿主细胞内基因组上的靶序列同源的序列。而且,整合的元件可以是非编码或编码核苷酸序列。在另一方面,通过非同源重组可以将载体整合进宿主细胞的基因组中。
为了能自发复制,载体进一步包含一种复制起点使得载体能在所讨论的宿主细胞内自发复制。在细菌中的复制起始点的离子有能在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起始点,以及能在芽孢杆菌中复制的pUB110、PE194、pTA1060和pAMβ1的复制起始点。用于酵母宿主细胞中的复制起始点是2微米的复制起始点ARS1、ARS4、ARS1与CEN3的组合、ARS4与CEN6的组合。复制起始点可以包含一种突变使得它在宿主细胞中具有温度敏感性(参见如Ehrlich,1978,proceedings ofthe national academy of sciences USA 75:1433)。
多于一拷贝的本发明的核苷酸序列可以插入宿主细胞中以提高基因产物的产量。核苷酸序列的拷贝数量的提高可以通过将至少一个额外拷贝的序列整合进宿主细胞基因组来获得,或者额外拷贝的核苷酸序列包括一种可进行扩增选择的标记基因,当细胞含有扩增的可选择标记基因的拷贝时,因此在存在适合的可选择剂时培养细胞可以被挑选出额外拷贝的核苷酸序列。
用于连接上述元件来构建本发明重组表达载体的方法是本领域技术人员所公知的(参见如Sambrook等,1989,supra).
宿主细胞
本发明还涉及含有本发明核酸构建体的重组宿主细胞,可以适用于重组产生多肽。含有本发明核苷酸序列的载体被转化进宿主细胞,这样载体被保持作为一种染色体的整合部分或如前所述的作为一种染色体外自我复制的载体。
宿主细胞可以是一种单细胞微生物,如原核微生物,或是一种非单细胞微生物如真核微生物。
适用的单细胞微生物有细菌细胞如革兰氏阳性细菌包括但不局限于,一种芽孢杆菌细胞,如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂类芽孢杆菌、迟缓芽孢杆菌、地衣形芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌;或一种链霉菌多肽,如变青链霉菌或鼠灰链霉菌;或是一种革兰氏阴性菌,如大肠杆菌或一种假单孢菌。在一个优选方案中,细菌宿主细胞是迟缓芽孢杆菌、地衣形芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌。在另一个优选方案中,细菌宿主细胞是嗜碱芽孢杆菌。
载体导入细菌宿主细胞可以受到原生质体转化的影响(参见如Chang和Cohen,1979,molecular general genetics 168:111-115),使用全细胞(参见Young和Spizizin,journal of bacteriology 81:823-829;或Dubnau和Davidoff-Abelson,journal of molecular biology 56:209-221),电穿孔(参见如Shigekawa和Dower,1988,Biortechniques 6:742-751),或接合作用(参见如Koehler和Thorne,1987,journal ofbacteriology 169:5771-5278)。
宿主细胞可以是真核细胞,例如哺乳动物、昆虫、植物或真菌细胞。
在一个优选方案中,宿主细胞是真菌细胞。这里使用的“真菌”包括Phyla Ascomycota、Basidiomycota、Chytridiomycota和Zygomycota(定义参见Hawksworth等,Ainsworth and Bisby’s dictionary of the fungi,第八版,1995,CAB international,University Press,Cambridge,UK)以及Oomycota(引用于Hawksworth等,1995,supra,171)和所有的有丝分裂孢子真菌(Hawksworth等,1995,supra)。
在一个更优选的方案中,真菌宿主细胞是酵母细胞。这里使用的“酵母”包括ascosporogenous yeast(Endomycetales),basidiosporogenousyeast,和属于fundi Impefecti(Blastomycetes)的酵母。由于酵母的分类可能在将来发生变化,为了达到本发明的目的,酵母的定义如在Biologyand Activities of Yeast中所描述的(Skinner,F.A.Passmore,S.M.Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium SeriesNo.91980)。
在一个更优选的方案中,酵母宿主细胞是假丝酵母、Aschbyii、Hansenula、克鲁维氏酵母属、毕赤氏酵母属、糖酵母属、裂殖糖酵母属或Yarrowia细胞。
在一个更优选的方案中,酵母细胞是卡尔斯伯糖酵母、啤酒糖酵母、糖化糖酵母、Saccaromyces douglasii、Saccaromyces kluyveri、Saccaromyces norbensis或卵形糖酵母细胞。在另一个更优选的方案中,酵母细胞是乳克鲁维氏酵母细胞。在另一个更优选的方案中,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个更优选的方案中,真菌细胞是一种细丝状真菌细胞。“细丝状真菌”包括细丝形式的子目Eumycota和Oomycota(定义按Hawksworth等,1995,supra)。细丝状真菌的特征在于由角素、纤维素、葡聚糖、几丁质、甘露聚糖和其它复合多肽组成的菌丝体壁。通过菌丝延长和碳的分解作用的植物生长依赖于氧。相反,通过酵母如啤酒糖酵母的植物生长是通过发出单细胞叶状体芽,其碳的分解是一种发酵。
在一个更优选的方案中,细丝状真菌宿主细胞是一种类的细胞,但不仅仅局限于支顶孢、曲霉、镰孢、毛霉、毁丝霉、链孢霉、青霉或木霉。
在一个最优选的方案中,细丝状真菌宿主细胞是棘孢曲霉、泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑色曲霉或米曲霉细胞。在另一个最优选的方案中,细丝状真菌宿主细胞是杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、玫瑰色镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、Fusarium torulosum、Fusariumtrichothecioides、Fusarium venenatum细胞。在一个甚至最优选的方案中,细丝状真菌宿主细胞是Fusarium venenatum(Nirenberg sp.Nov.)细胞。在另一个最优选的方案中,细丝状真菌宿主细胞是Humicolainsolens、Humicola lanuginosa、米赫毛霉、嗜热毁丝霉、粗糙链孢霉、产紫青霉、Trichoderma harzianum、康宁氏木霉、Trichodermalongibrachiatum、Trichoderma reesei或绿色木霉多肽。
真菌细胞可以通过已知的方法进行转化,包括原生质体形成、原生质体转化和细胞壁的再生。用于曲霉宿主细胞的转化的适合的方法参见EP238023和Yelton等(1984,proceedings of the national academy ofsciences USA 81:1470-1474)。适合于镰孢属转化的方法参见Malardier等,1989,Gene 78:147-156和WO9600787。可以使用Becker和Grarente描述的方法转化酵母(in Abelson,J.N.和Simon,M.l.,editors,Guideto Yeast genetics and molecular biology,methods in enzymology,Volume 194,pp182-187,academic press inc.,New York;Ito等,1983,journal of bacteriology 153:163;和Hinnen等,1978,Proceedingsof the national academy of sciences USA 75:1920)。
生产方法
本发明还涉及生产本发明多肽的方法,包括(a)培养野生型菌株,该菌株适于生产多肽;和(b)回收多肽。优选菌株选自下组所示真菌:支顶孢、小柱孢菌、热子囊菌、草根霉、轮枝孢、新螱、白丝菌、poitrasia、鬼伞、单瑞孢、腐质霉、Cladorrhinum、二孢、毁丝霉、根毛霉、Meripilus、黑耳、炭角菌、长毛盘菌、毛壳霉、Chaetomidium、Sporotrichum、草根霉、曲霉、帚霉、镰孢、假黑盘菌或疫霉;更优选菌株选自下组所示真菌:嗜热支顶孢、嗜热毛壳霉、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、淡黑假黑盘菌或蔓延疫霉。
本发明还涉及生产本发明多肽的方法,包括(a)在适于生产多肽的条件下培养野生型菌株,和(b)将多肽与一种嗜好的底物如有纤维质的底物接触,没有前面多肽的回收。术语“原位产物”意指多肽在在其将要被使用的位置处直接产生,例如在一个用于生产乙醇的发酵过程中。
在本发明的生产方法中,细胞使用本领域已知的方法在适合于生产多肽的营养培养基上培养细胞。例如,细胞可以通过振荡烧瓶培养,实验室里的小范围或大范围发酵(包括连续的、一批、同批或固体阶段发酵)培养或在适宜的培养基中和允许多肽被表达和/或分离的条件下进行工业发酵培养。根据本领域已知方法在适宜的包括碳、氮源和无机盐的营养培养基中进行细胞培养。适合的培养基获自商家或可以根据发表的组合无进行制备(如,in catalogues of the American Type Culture Collection)。如果多肽被分泌进营养培养基,就可以直接从培养基中回收多肽。如果多肽没有分泌,可以从细胞溶解产物中回收多肽。
可以使用本领域已知的特异于多肽的技术来检测多肽。这些检测方法包括使用特异性抗体,形成一种酶产物,或一种酶底物的消失。例如,酶检测可以用于确定上述多肽的活性。
生产的多肽可以通过本领域已知方法来回收。例如,通过但不局限于离心、过滤、提取、喷雾干燥、真空抽干或沉淀这些常规方法可以将多肽从营养培养基中回收。
本发明的多肽可以经过进一步的纯化处理,其中可以使用各种本领域已知的方法包括但不局限于层析(如离子交换,亲和,疏水,层析聚焦,和顺序排除),电泳方法(如预备等电子聚焦),差示溶解度(如硫酸铵沉淀),SDS-PAGE,或抽提(参见如,Protein Purification,J.-C.Janson和Las Ryden,editors,VCH Publishers,New York,1989)。
植物
本发明还涉及转化有编码具有本发明纤维二糖水解酶I活性的多肽的核苷酸序列的转基因植物、植物部分或植物细胞,这样能表达和产生可回收量的的多肽。多肽可以从植物或植物部分中回收。或者,含有重组多肽的植物或植物部分可以用作如提高食物或饲料的质量,如改善营养价值、适口性和流变学特性或破坏抗营养因子。
转基因植物可以是双子叶或单子叶植物,单子叶植物有草,例如牧草(蓝色草,Poa),草料草例如稻草,Lolium,气候草,例如草类和谷类等,如小麦、燕麦、黑麦、大麦、稻、高梁、栗和玉米。
双子叶植物有烟草,羽扇豆,马铃薯,糖用甜菜,豆类如豌豆、豆和大豆,和十字花科植物(如芸苔),例如花椰菜、油菜、canola和密切相关的模型微生物Arabidopsis thaliana。
植物部分可以是茎、愈合组织、叶、根、果实、种子和块茎。还有特异的植物组织如叶绿体、质外体、线粒体、空泡、过氧物酶体和细胞质也被认为是植物部分。而且,任何一种植物细胞,不管其组织来源,均被认为是一植物部分。
在本发明的范围内还包括这种植物、植物部分和植物细胞的后代(克隆或种子)。
表达本发明多肽的转基因植物或植物细胞可以通过本领域已知的方法构建。简要地,可以通过转化进植物宿主基因组一或多个编码本发明多肽的表达结构构建植物或植物细胞,然后繁殖由此产生的修饰过的植物或植物细胞形成转基因植物或植物细胞。
便利地,表达结构是含有编码一种本发明多肽的核苷酸序列的核酸构建体,其中核苷酸序列与在所选植物或植物部分中表达核苷酸序列所需的适宜调节序列可操作地相连。而且,表达结构可以包含用于鉴别表达结构整合进的宿主细胞和将结构导入进所讨论植物必需的DNA序列(后者依赖于所使用的DNA导入的方法)。
在选择调节序列例如启动子和终止子序列和任意的信号或转运序列时需要考虑,例如希望多肽在什么时候、什么地点和怎样表达。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发展性的、阶段性的或细胞特异性的,和基因产物可以靶向一种特定的组织或植物部分例如种子或叶子。调节序列如参见Tague等的描述(1988,plantphysiology 86:506)。
35S-CaMV启动子可用于组成型表达(Franck等,1980,cell 24:285-294)。器官特异性的启动子可以来自如储水组织如种子、马铃薯块茎和果实(Edwards & Coruzzi,1990,Ann.Rev. Genet.24:275-303),或来自水代谢组织如分裂组织(Ito等,1994,Plant Mol.Biol.24:863-878),一种种子特异性的启动子例如来自鼠的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(Wu等,1988,Plant and Cell Physiology 39:885-889),来自豆球蛋白B4和Vicia faba的一种未知种子基因的Vicia faba启动子(Conrad等,1998,journal of Plant Physiology 152:708-711),一种来自种子油体蛋白的启动子(Chen等,1998,Plant and Cell Physiology39:935-941),来自Brassica napus的贮存蛋白napA启动子,或任何其它本领域已知的种子特异性启动子,如在WO91/14772中所描述的那些。而且,启动子可以是一种叶子特异性启动子如来自鼠或马铃薯的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000),绿藻病毒腺嘌呤甲基转移酶基因启动子(Mitra and Higgins,1994,Plant MolecularBiology 26:85-93),或是来自鼠的aldP基因(Kagaya et al.,1995,Molecular and general genetics 248:668-674),或一种伤口诱导型启动子例如马铃薯pin2启动子(Xu et al.,1993,Plant Molecular Biology22:573-588)。
一种启动子增强元件还可以用于获得酶在植物中的高表达。例如,启动子增强子元件可以是一种置于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如,Xu等1993年在supra上公开了鼠肌动蛋白1基因的第一个内含子可用于增强表达。
可选择的标记基因和任何其它部分表达结构可以选自那些可获得的文献。
核酸构建体可以根据本领域已知的常规技术被导入植物基因组中,其中包括土壤杆菌介导的转化,病毒介导的转化,显微注射,粒子轰击,抗生素转化和电穿孔(Gasser等,1990,Science 244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamato等,1989,Nature 338:274)。
目前,土壤杆菌介导的基因转化是用于产生转基因双子叶植物时选择的方法(参见Hooykas和Schilperoort,1992,Plant Molecular Biology19:15-38)。然而,该方法还可用于转化单子叶植物,虽然其它转发方法一般优选用于这些植物。目前,选择用于产生转基因单子叶植物的方法是粒子轰击(包被有转化DNA的显微的金或钨微粒)胚胎calli或发育的胚胎(Christou,1992,Plant journal 2:275-281;Shinmamoto,1994,Current Opinion Biotechnology 5:158-162;Vasil等,1992,Bio/Technology 10:667-674)。转化单子叶植物的一种替代方法基于原生质体的转化,如Omirulleh等描述的(1993,Plant Molecular Biology 21:415-428)。
转化后,根据本领域公知的技术将导入了本发明表达结构的转化体挑选出来并再生成完整的植物。
本发明还涉及生产本发明多肽的方法,包括:(a)在适合多肽生产的条件下培养含有编码本发明具有纤维二糖水解酶I活性多肽的核苷酸序列的转基因植物或植物细胞;和(b)回收多肽。
本发明还涉及原位生产本发明多肽的方法,包括:(a)在适合多肽生产的条件下培养含有编码本发明具有纤维二糖水解酶I活性多肽的核苷酸序列的转基因植物或植物细胞;和(b)将多肽与一种嗜好的底物如有纤维质的底物接触,没有前面多肽的回收。
组合物
在一个更进一步的方面,本发明涉及含有本发明多肽的组合物。
组合物可以包含一种本发明的多肽作为主要的酶促成分,如单成分合成物。或者,组合物可以具有多种酶促活性,例如作为一种氨基肽酶、淀粉酶、糖酶、羧肽酶、过氧化物酶、纤维素酶、几丁质酶、角质酶、环式糊精糖基转移酶、脱氧核糖核酸酶、脂肪酶、α-葡萄糖苷酶、葡糖淀粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、环过氧化物酶、转化酵素、漆酶、甘露糖苷酶、氧化酶、果胶酶、肽聚糖酶、过氧化物酶、肌醇六磷酸酶、蛋白水解酶、核糖核酸酶、转糖苷酶或木聚糖酶。
组合物可以根据本领域已知的方法来制备并形成液体或干燥形式的组合物。例如,多肽组合物可以形成颗粒或微粒的形式。包含在组合物中的多肽可以通过本领域已知技术进行稳定。
以下给出的是本发明多肽组合物优选的用途。本发明多肽组合物的剂量和其它有关在何种条件下使用组合物可以根据本领域已知方法进行确定。
去污剂组合物
本发明的多肽可以作为一种去污剂组合物成分被添加。
本发明的去污剂组合物可以制备成如一种人工或机械洗衣去污剂组合物,其中包括一种适合于对沾污的织物进行预处理的洗衣添加剂和一种织物柔顺漂洗剂,或制备成一种用于普通家庭坚硬表面请洗操作时的去污剂组合物,或是制备成一种人工或机械洗碗剂。
在一个优选的方面,本发明提供了一种含有本发明多肽的去污添加剂。和去污剂组合物一样去污添加剂可以包含一或多种其它的酶如蛋白酶,脂肪酶,角质酶,淀粉酶,糖酶,纤维素酶,果胶酶,甘露糖酶,阿拉伯糖酶,半乳糖酶,木聚糖酶,和氧化酶,如漆酶,和/或过氧化物酶。
一般来说所选酶的特性必须与所选去污剂组合物相适应,(如最佳PH值、和其它酶促和非酶促成分的相容性,等等),并且酶必须以有效量存在。
蛋白酶:合适的蛋白酶包括那些动物、植物或微生物来源的。微生物来源是优选的。其中包括了那些化学修饰的酶或蛋白工程化变异体。蛋白酶可以是一种丝氨酸蛋白酶或金属蛋白酶,优选是一种嗜碱性微生物蛋白酶或类胰岛素蛋白酶。嗜碱性蛋白酶如枯草杆菌蛋白酶,尤其是那些来自芽孢杆菌属的,如枯草杆菌蛋白酶Novo,枯草杆菌蛋白酶Carlsberg,枯草杆菌蛋白酶309,枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(WO89/06279中描述的)。类胰岛素蛋白酶如胰岛素(如猪或牛来源的)和在WO89/06270和WO94/25583中所描述的镰孢属蛋白酶。
有用的蛋白酶如在WO92/19729、WO98/20115、WO98/20116和WO98/34946中公开的变异体,尤其是那些在以下一或多个位点发生取代的变异体:27、36、57、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
脂肪酶:适合的脂肪酶包括那些细菌或真菌来源的,其中包括化学修饰的和蛋白工程化变异体。适合的脂肪酶包括来自腐质酶(synonymthermomyces),如EP258068和EP305216中公开的来自H.Lanuginosa(T.Lanuginosus)或WO96/13580中公开的来自H.Insolens的脂肪酶,一种假单胞菌脂肪酶,如来自P.Alcaligenes或类产碱假单胞菌(EP218272)、葱头假单胞菌(EP331376)、司徒茨氏假单胞菌(GB1372034)、荧光假单胞菌、假单胞菌种菌株SD705(WO95/06720和WO96/27002)、P.Wiscomsinensis(WO9612012)的脂肪酶,一种芽孢杆菌属脂肪酶,如来自枯草芽孢杆菌(Dartois等,1993,Biochemica et Biophysica Acta,1131,253-360)、嗜热脂肪芽孢杆菌(JP64/74492)或短小芽孢杆菌(WO91/16422)的脂肪酶。
其它脂肪酶变异体如那些在WO92/05249、WO94/01541、EP407225、EP260105、WO9535381、WO9600292、WO95/30744、WO9425578、WO95/14783、WO97/04079和WO97/07202中公开的。
淀粉酶:适合的淀粉酶(α和/或β)包括细菌或真菌来源的那些,其中包括了化学修饰的或蛋白工程化的变异体。淀粉酶包括如获自芽孢杆菌如GB1296839中详细描述的地衣型芽孢杆菌特定菌株的α-淀粉酶。
有用的淀粉酶如WO9402597、WO9418314、WO9623873和WO9743424中描述的变异体,尤其是在以下一或多个位点发生取代的变异体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
纤维素酶:适合的纤维素酶包括细菌或真菌来源的那些,其中包括了化学修饰的或蛋白工程化的变异体。适合的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、草根霉属、支顶孢属,如真菌纤维素酶产自Humicola Insolens、嗜热毁丝霉和尖胞镰孢,这些公开于US4435307、US5648263、US5691178、US5776757和WO8909259。
特别适合的纤维素酶是具有颜色偏好特性的嗜碱性或嗜中性纤维素酶。这种纤维素酶如EP0495257、WP0531372、WO9611262、WO9629397和WO9808940中公开的那些。其它纤维素酶变异体如在WO9407998、EP0531315、US5457046、US5686593、US5763254、WO9524471、WO9812307和PCT/DK98/00299中公开的那些。
过氧化物酶/氧化酶:适合的过氧化物酶/氧化酶包括细菌或真菌来源的那些,其中包括了化学修饰的或蛋白工程化的变异体。有用的多氧化物酶包括来自Coprinus如C.Cinereus和其变异体的多氧化物酶,这些在WO9324618、WO9510602和WO9815257中公开了。
去污剂酶可以包含在去污剂组合物组合物中,这可以通过加入含有一或多种酶的分离剂实现,或通过加入一种含有所有这种酶的组合添加剂获得。本发明的一种去污添加剂,如分离剂或组合添加剂可以被制备成如一种颗粒、液体、泥浆等。优选的去污添加剂制品可以是颗粒,优选无尘颗粒、液体,优选稳定的液体、泥浆。
无尘颗粒可以如按照US4106991和US4661452中公开的万法生产并可任意地根据本领域已知的方法进行包封。蜡制包衣材料如重约1000至2000平均分子量的聚(环氧乙烷)产物(聚乙二醇,PEG);具有16至50个环氧乙烷单位的乙氧基化壬基苯;其中乙醇含有12至20个碳原子和其中有15至80个环氧乙烷单位的乙氧基化脂肪族乙醇;脂肪族乙醇;脂肪酸;和单和双和三甘油酯。适合于通过流化床技术应用的膜形成包衣原料在GB1483591中给出了。液体酶制品可以被稳定,如根据已建立的方法加入多羟基化合物如丙二醇,糖或糖乙醇,乳酸或硼酸。受保护的酶可以通过EP238216公开的方法制备。
本发明的去污剂组合物可以以任何一种便利的形式存在,如药条、药片、粉末、颗粒、药贴或一种液体。液体去污剂组合物可以是水溶性的,通常含有至多70%的水和0-30%的有机溶剂,或是非水性的。
去污剂组合物包含一或多种表面活性剂,可以是非离子包括半极性和/或阴离子和/或阳离子和/或两极性的表面活性剂。表面活性剂通常以0.1%至60%的重量水平存在。
当包括在其中时,去污剂组合物常含有约1%至约40%的阴离子表面活性剂例如线性烷基苯磺酸盐,α-石蜡磺酸盐,烷基硫酸盐(脂肪族乙醇硫酸盐),乙醇乙氧基硫酸盐,二级烷磺酸盐,α-磺酰脂肪酸甲基酯,烷-或烯烃琥珀酸或肥皂。
当包括在其中时,去污剂组合物通常含有从约0.2%至约40%的非离子表面活性剂,例如脂肪醇乙氧基化物,壬基苯乙氧基化物,烷基聚配糖,烷基甲胺氧化物,乙氧基化的脂肪酸单乙醇酰胺,脂肪酸单乙醇酰胺,聚羟基烷基脂肪酸胺,或葡糖胺的N-酰基N-烷基衍生物(“glucamides”)。
去污剂组合物可以含有0-65%的去污剂组合物助洗剂或复合剂,例如沸石,二磷酸,三磷酸,磷酸盐,碳酸盐,柠檬酸盐,次氮基三乙酸,乙二胺四乙酸,二乙烯基三胺五乙酸,烷基-或烯烃琥珀酸,可溶性硅酸盐或分层的硅酸盐(如来自Hoechst的SKS-6)。
去污剂组合物可以包含一或多种聚合体,如羧甲基纤维素,聚乙烯吡咯烷酮,聚乙二醇,聚乙烯醇,聚乙烯基嘧啶-N-氧化物,聚乙烯基咪唑,聚羧酸盐如聚丙烯酸盐,马来酸/丙烯酸共聚物和月桂酸异丁烯酸盐/丙烯酸共聚物。
去污剂组合物可以包含一种漂白体系,其中包括一种H2O2来源如过硼酸盐或过碳酸盐,它们可以与过酸构成的漂白活化因子如四乙酰基乙二胺或壬酰苯酚磺酸盐。或者,漂白体系可以包含如氨化物、酰亚胺或砜的过氧酸。
本发明去污组合物中的酶可以通过使用常规稳定剂使之稳定,稳定剂如一种多羟基化合物如丙二醇或甘油,一种糖或糖醇,乳酸,硼酸或硼酸衍生物,如一种芳香族硼酸酯,或一种苯基硼酸衍生物如4-甲酸基苯基硼酸,并且该组合物可以根据如WO92/19709和WO92/19708中描述的方法制备。
去污剂组合物还可以含有常规的去污剂组合物成分如织物调节剂,其中包括粘合成分,起泡剂,泡沫抑制剂,抗腐蚀剂,油悬浮剂,抗油再沉淀剂,染料,杀虫剂,光学增白剂,助水溶物,失去光泽的抑制因子或香味素。
目前已经预期了去污剂组合物中的任何一种酶,优选本发明的多肽,可以以相应于每升洗液含0.01-100mg酶蛋白的量被加入,优选每升洗液含0.05-5mg酶蛋白,优选每升洗液含0.1-1mg酶蛋白。
本发明的多肽还可以额外地加入WO97/07202中公开地去污剂组合物制品中,该文献引入本文作为参考。
DNA重组(改组)
以下核苷酸序列可用于DNA重组(或改组)过程:SEQ ID NO:1,SEQ IDNO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ IDNO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:62,SEQ ID NO:63,SEQ ID NO:64,SEQ ID NO:65,SEQ ID NO:67。由该过程获得的新的核苷酸序列可以编码具有改进的纤维二糖酶活性的新的多肽,如改进的稳定性(储存稳定性,热稳定性),改进的特异性活性,改进的最适PH值,和/或改进的对特异性化合物的耐受力。
在两个或多个同源输入的多核苷酸(起始点多核苷酸)之间的改组包括打断核苷酸和重组片段,从而获得输出的多核苷酸(如已经经过改组循环),其中核苷酸片段的数目与输入的多核苷酸相比发生了变化。
DNA重组或改组可以是(部分地)随机过程,其中设想的基因文库获自两个或多个起始基因。许多已知形式可以用于实施该改组或重组过程。
该过程可包括随机打断亲代DNA,接着通过PCR的重新接合形成新的全长基因,如在US5605793、US5811238、US5830721、US6117679中公开的。基因的体外重组可以按照US6159687、WO98/41623、US6159688、US5965408和US6153510中描述的方法进行。重组过程可以在活细胞内发生,如参见WO97/07205和WO98/28416。
亲代DNA可以通过脱氧核糖核酸酶I处理或限制性内切核酸酶的消化形成片段,方法参见Kikuchi等(2000a,Gene 236:159-167)。两亲代之间的改组可以通过改组两亲代中单一的标准亲代链来进行,参见Kikuchi等(2000b,Gene 243:133-137)。
一种特别的改组方法是根据Grameri等描述的方法(1998,Nature,391:288-291和Ness等,Nature Biotechnology 17:893-896)。另一种形式是在US6159687中的实施例1和2描述的方法。
从生物质生产乙醇
本发明还涉及从生物质如有纤维质的原料中生产乙醇的方法,其中包括生物质与本发明的多肽接触。乙醇可以基本上被回收。本发明的多肽可以通过在适合于生产本发明多肽的条件下培养宿主细胞或菌株而“原位”获得,如作为乙醇生产过程的一部分或直接就是该过程,其中宿主细胞或菌株以适合于生产该多肽的野生形式存在。
乙醇可以通过对生物质进行酶促降解并将释放的多糖转化为乙醇来生产。这种乙醇常常指生物乙醇或生物燃料。它可以被用作一种以从少于1%至高达100%的量混合的燃料添加剂或混合剂(一种燃料替代品)。在某些国家,例如在巴西,乙醇在很大程度上替代了汽油。
生物质的初级细胞壁中的主要多糖是纤维素,第二最多的是半纤维素,第三位的是胶质。在细胞停止生长后产生的次级细胞壁还含有多糖,并且经由聚合木质素与半纤维素的共价交联连接加固了。虽然通过取代光谱发现在半纤维素复杂的分枝结构中包括了各种化合物,如木聚糖,xyloglucans,树胶醛木聚糖,和甘露聚糖,但纤维素是一种纤维二糖酐的同源聚合体,并且是一种线性的β-(1-4)-D-葡聚糖。虽然纤维素具有多种形态,但在植物组织中它首先是被作为一种不可溶的并联葡聚糖链的结晶基体。半纤维素通常与纤维素以氢键连接,就如与其它半纤维素一样,这样能帮助稳定细胞壁基体。
三种主要类别的纤维素酶被用于分裂生物质:
·内切-1,4-β-葡聚糖酶或1,4-β-D-葡聚糖-4-葡聚糖水解酶(EC3.2.1.4),它们能随机作用于可溶的和不可溶的1,4-β-葡聚糖底物。
·外切-1,4-β-D-葡聚糖酶包括1,4-β-D-葡聚糖葡聚糖水解酶(EC3.2.1.74),该酶能从1,4-β-D-葡聚糖中释放出D-葡萄糖并且可以缓慢水解D-纤维二糖,和1,4-β-D-葡聚糖纤维二糖水解酶(EC 3.2.1.91),也被称为纤维二糖水解酶I,它能从1,4-β-葡聚糖中释放出纤维二糖。
·β-D-葡糖苷酶或β-D-葡糖苷葡聚糖水解酶(EC 3.2.1.21),它们能从纤维二糖和可溶性的纤维糊精中释放出D-葡萄糖单元,一种配糖的排列。
这三类酶在复合体中相互配合相互影响,从而能从生物质中有效地去结晶和水解天然的纤维素,产生能通过发酵转化为乙醇的还原糖类。
本发明通过一下实施例作进一步的描述,但不作为一种对本发明保护范围的限制。
实施例
用作缓冲液和底物的化学制品均是试剂等级的商品。
实施例1
克隆部分和全长的纤维二糖水解酶I(CBH1)的DNA序列
棉色二孢的cDNA文库被用于PCR筛选找出存在的CBH1基因。为了该目的,基于CBH1蛋白中保守区域的序列排列和标识设计了一套引物。通过凝胶电泳得到的PCR条带被用于获得来自棉色二包CBH1基因的部分序列。同源性研究证实了该部分序列是CBH1基因的部分序列(EC 3.2.1.91)。
通过访问专利保藏号CBS 247.96,进行DNA或cDNA制备,使用部分序列作为构建特异性引物的基础,并通过标准的PCR克隆技术一步步地得到棉色二孢的全长CBH1基因。
其它几种可以使用的方法:
·可以对cDNA文库或用于构建文库的cDNAs进行PCR筛选。为了这样做,基因特异性引物(GSP)和载体/连接物引物分别构建自CBH1基因的部分cDNA序列和自载体/连接物;两套引物均被设计成朝向(go outward into)CBH1基因cDNA缺失的5′和3′区。通过使用组合的GSP和载体/连接物引物获得的最长的PCR产物代表了来自棉色二孢CBH1 cDNA全长的5′和3′区。与部分cDNA序列的同源研究和比较证实了5′和3′PCR产物属于相同的棉色二孢CBH1 cDNA。使用构建自5′和3′端的引物组进行PCR可以获得全长的cDNA。
·或者,使用标准杂交技术并将部分cDNA序列作为探针可以从cDNA文库中筛选出全长cDNA。给出与探针阳性杂交信号的克隆被纯化并进行测序来确定最长的cDNA序列。同源研究和比较证实了全长cDNA对应于最初用作探针的部分CBH1 cDNA序列。
上述的两种方法基于全长CBH1 cDNA序列存在于cDNA文库或用于构建文库的cDNAs中。或者,5′和3′端示踪(RACE,cDNA末端的快速扩增)技术或衍生技术可以用于鉴别缺失的5′和3′区。为了该目的,优选分离出棉色二孢的mRNAs,并使用含有寡(dT)-的连接物引物或5′-基因特异性引物(GSP)的将之用于合成cDNAs的第一条链。
获自棉色二孢CBH1基因的全长cDNA还可以通过利用棉色二孢的基因组DNA获得。CBH1基因可以通过PCR技术鉴别出,例如上述的一种方法或使用杂交技术和部分CBH1 cDNA探针通过标准的基因组文库筛选出该基因。与部分cDNA序列的同源研究和比较证实了基因组序列对应于棉色二孢CBH1基因。对保守序列如作为转录的起始位点、起始和终止密码子或多聚腺苷酸位点进行鉴别,该结果可以被用于确定包含全长cDNA的区域。然后利用构建自该区的5′和3′端的引物从源自棉色二孢的mRNA和cDNA文库中扩增出全长的cDNA(如上)。
通过在适合的表达宿主构建体中表达全长基因,CBH1酶可以作为胞内酶或胞外酶从培养基中回收。
上述的方法可以应用于从所有的生物体而不只局限于棉色二孢中克隆出纤维二糖水解酶I的DNA序列。
实施例2
纤维二糖水解酶I(CBH1)的活性
纤维二糖水解酶I的特征在于相比于其它纤维素酶能非常有效地水解高度结晶的纤维二糖。纤维二糖水解酶I以PASC(磷酸膨胀纤维素,phosphoric acid swollen cellulose)为底物时比以CMC为底物时具有更高的催化活性。为了达到本发明的目的,下述任何一种测定方法均可用于鉴别纤维二糖水解酶I:
对偶氮-微晶纤维素(Azo-Avicel)的活性
根据操作手册使用氮-微晶纤维素(Megazyme,Bray Business Park,Bray,Wicklow,Irelang)。
对PNP-β-纤维二糖的活性
底物溶液:5mM PNPβ-D-纤维二糖(p-硝基苯β-d-纤维二糖糖苷SigmaN-5759)溶于0.1M醋酸钠缓冲液,PH 5.0;
终止试剂:0.1M碳酸钠,PH 11.5;
50μL CBH1溶液与1mL底物溶液混合并于40℃温育20分钟。加入5mL终止试剂终止反应。测定404nm时的吸光度。
对PASC和CMC的活性
底物被纤维二糖水解酶I(CBH1)降解成还原的糖类。一种Microdochiumnivale的碳水化合物氧化酶(rMnO)或另外等价的氧化酶在O2存在时作用于还原的糖产生H2O2。在存在额外的过氧化物酶时形成的H2O2激活了氧化浓缩的4-氨基安替比林(AA)和N-乙烷基-N-磺酸丙烷基(sulfopropyl)-m-甲苯胺(TOPS),形成了一种可通过在550nm处吸光度进行定量的紫色产物。
当所有的成分除了CBH1外有剩余时,吸光度的增加与CBH1活性成正比例。反应是一级动力学反应,并可以在一种Cobas Fara离心分析仪(Hoffmann La Roche)上或其它等价的能稳定测定状态动力学(steadystate kinetics)的分光光度计上自动进行。
缓冲液:50mM醋酸钠缓冲液(PH5.0);
试剂:rMnO氧化酶,纯化的Microdochium nivale的碳水化合物氧化酶2mg/L(终浓度);
过氧化物酶,SIGMA P-8125(96U/mg),25mg/L(终浓度);
4-氨基安替比林,SIGMA A-4382,200mg/L(终浓度);
TOPS,SIGMA E-8506,600mg/L(终浓度);
PASC或CMC(见下),5g/L(终浓度)。
所有的试剂以上面提示的浓度加入缓冲液并充分混合试剂溶液。
50μL纤维二糖水解酶I样品(经合适的稀释)与300μL的试剂溶液混合并于40℃温育20分钟。检测紫颜色的形成并测定550nm处的吸光度。
AA/TOPS冷凝物吸收系数是0.01935A550/(μM cm)。根据OD550/min和吸收系数计算速率为每分钟产生μmols还原糖。
PASC
原料:5gAvicel_(Art.2331 Merck);
      150mL 85%正-磷酸(Art.573 Merck);
      800mL丙酮(Art.14 Merck);
      约2升去离子水(Milli-Q);
      1L玻璃烧杯;
      1L玻璃过滤漏斗;
      2L抽气细颈瓶;
      Ultra Turrax Homogenizer。
丙酮和正-磷酸在冰上冷却。Avicel_用水弄湿,然后加入150mL冰冷的85%的正-磷酸。混合物置于冰浴中轻微搅拌一个小时。
加入500mL冰冷的丙酮并搅拌,将混合物转入一玻璃过滤漏斗并用3×100mL冰冷的丙酮冲洗,每次洗时尽量吸干。用2×500mL水(或直到没有丙酮的气味),每次洗时尽量吸干。
将固体重悬于水中至总体积为500mL,使用一种Ultra Turrax匀浆器均匀混合物。湿保存在冰箱中,使用缓冲液通过离心平衡,使用前重悬。
CMC
不纯形式的细菌纤维素微原纤维(microfibrils)获自日本食物“natade coco”(Fujico Company,Japan)。将350g这种产品的纤维素悬于4L自来水中进行纯化。每天两次用新鲜的水置换,连续4天。
然后用1%(w/v)的NaOH替代水,产品重悬于碱性溶液,每天更换两次共4天。用蒸馏水漂洗纤维素来中和溶液直至产品表面的PH值为中性(PH7)。
纤维素被微原纤维化,通过在韦林氏搅切器中将纯化的纤维素微原纤维匀化30分钟获得一种单独的细菌纤维素微原纤维悬浮液。通过将悬浮液对去离子水透析过孔膜进一步纯化纤维素微原纤维,分离和纯化的纤维素微原纤维以水悬浮液的形式保存于4℃。
保藏的生物材料
中国普通微生物保藏中心(CGMCC)
下列微生物材料已经根据布达佩斯条约在中国普通微生物保藏中心(CGMCC)进行了保藏,中科院微生物所,海淀,北京100080,中国:
保藏号:        CGMCC No.0584
申请人证明:    ND000575
保藏日期:      2001-05-29
说明:          在质粒上的嗜热支顶孢CBH 1基因
分类:          子囊菌门;Sordariomycetes;Hypocrales;Hypocreceae
来源:          中国,1999
相关序列:      SEQ ID NO:1和SEQ ID NO:2(编码一种来自于嗜热
                支顶孢的纤维二糖水解酶I的DNA序列和相应的蛋白
                序列)。
保藏号:        CGMCC No.0581
申请人证明:    ND000548
保藏日期:      2001-05-29
说明:          在质粒上的嗜热毛壳酶CBH 1基因
分类:          子囊菌门;Sordariomycetes,Sordariales,
                Chaetomiaceae
来源:          中国,1999
相关序列:      SEQ ID NO:3和SEQ ID NO:4(编码一种来自于嗜热
                毛壳酶的纤维二糖水解酶I的DNA序列和相应的蛋白
                序列)。
保藏号:        CGMCC No.0585
申请人证明:    ND001223
保藏日期:      2001-05-29
说明:          在质粒上的小柱孢菌CBH 1基因
分类:          子囊菌门;有丝分裂孢子真菌
来源:          中国,1999
相关序列:      SEQ ID NO:5和SEQ ID NO:6(编码一种来自于小柱
                孢菌种的纤维二糖水解酶I的DNA序列和相应的蛋白序
                列)。
保藏号:        CGMCC No.0582
申请人证明:    ND000549
保藏日期:      2001-05-29
说明:          连接在质粒上的橙黄色热子囊菌CBH 1基因
分类:          Eurotiomycetes,Eurotiales,Trichocomaceae
来源:          中国
相关序列:      SEQ ID NO:7和SEQ ID NO:8(编码一种来自于橙黄
                色热子囊菌的纤维二糖水解酶I的DNA序列和相应的
                蛋白序列)。
保藏号:        CGMCC No.0583
申请人证明:    ND001182
保藏日期:      2001-05-29
说明:          连接在质粒上的Thielavia australiensis CBH1基
                因
分类:          子囊菌门,Sordariomycetes,Sordariales,
                Chaetomiaceae
来源:          中国,1998
相关序列:      SEQ ID NO:9和SEQ ID NO:10(编码一种来自于
                Thielavia australiensis的纤维二糖水解酶I的DNA
                序列和相应的蛋白序列)。
保藏号:        CGMCC No.0580
申请人证明:    ND001182
保藏日期:      2001-05-29
说明:          连接在质粒上的Melanocarpus albomyces CBH 1基
                因
分类:          子囊菌门,Sordariomycetes,Sordariales
来源:          中国,1999
相关序列:      SEQ ID NO:15和SEQ ID NO:16(编码一种来自于
                Melanocarpus albomyces的纤维二糖水解酶I的DNA
                序列和相应的蛋白序列)。
保藏号:        CGMCC No.0748
申请人证明:    ND001181
保藏日期:      2002-06-07
说明:          连接在质粒上的支顶孢CBH 1基因
分类:          有丝分裂孢子的子囊菌纲
来源:          中国,2000
相关序列:      SEQ ID NO:53和SEQ ID NO:54
保藏号:        CGMCC No.0749
申请人证明:    ND000577
保藏日期:      2002-06-07
说明:          连接在质粒上的Chaetomidium pingtungium CBH 1
                基因
分类:          Chaetomiaceae,Sordariales,Ascomycota
来源:          中国,2000
相关序列:      SEQ ID NO:55和SEQ ID NO:56
保藏号:        CGMCC No.0747
申请人证明:    ND001175
保藏日期:      2002-06-07
说明:          连接在质粒上的Sporotrichum pruinosum CBH 1基
                因
分类:          Meruliaceae,Sterealesales,担子菌门
来源:          中国,2000
相关序列:      SEQ ID NO:57和SEQ ID NO:58
保藏号:        CGMCC No.0750
申请人证明:    ND000571
保藏日期:      2002-06-07
说明:          连接在质粒上的嗜热小柱孢菌CBH 1基因
分类:          子囊菌门,有丝分裂孢子真菌
来源:          中国,2000
相关序列:      SEQ ID NO:59和SEQ ID NO:60
真菌菌种保藏中心(CBS)
下列微生物材料已根据布达佩斯条约在真菌菌种保藏中心(CBS)进行了保藏,Uppsalalaan 8,3584 CT Utrecht,荷兰(或者P.O.Box85167,3508AD Utrecht,荷兰)。
保藏号:        CBS 109513
申请人证明:    ND000538
保藏日期:      2001-06-01
说明:          幼嫩轮枝孢
分类:          子囊菌门,Hypocreceae,核菌类(有丝分裂孢子)
来源:          -
相关序列:      SEQ ID NO:11和SEQ ID NO:12(编码一种来自于幼
                嫩轮枝孢的纤维二糖水解酶I的DNA序列和相应的蛋白
                序列)。
保藏号:        CBS 819.73
申请人证明:    ND000533
保藏日期:      公众可获得的(非申请人保藏)
说明:          产黑色腐质酶
分类:          Sordariaceae,Sordariales,Sordariomycetes,
                子囊菌门
来源:          -
相关序列:      SEQ ID NO:18(编码来自于产黑色腐质酶的纤维二糖
                水解酶I的部分DNA序列)。
保藏号:        CBS 427.97
申请人证明:    ND000530
保藏日期:      1997-01-23
说明:          Cladorrhinum foecundissimum
分类:          Sordariaceae,Sordariales,Sordariomycetes,子
                囊菌门
来源:          牙买加
相关序列:      SEQ ID NO:19(编码Cladorrhinum foecundissimum
                纤维二糖水解酶I的部分DNA序列)。
保藏号:        CBS 247.96
申请人证明:    ND000534和ND001231
保藏日期:      1996-03-12
说明:          棉色二孢
分类:          Dothideaceae,Dothideales,Dothideomycetes,
                子囊菌门
来源:          印尼
相关序列:      SEQ ID NO:20(编码棉色二孢纤维二糖水解酶I的部
                分DNA序列),SEQ ID NO:37(编码棉色二孢纤维二糖
                水解酶I的全长DNA序列)和SEQ ID NO:38(棉色二孢
                纤维二糖水解酶I的全长蛋白序列)。
保藏号:        CBS 117.65
申请人证明:    ND000536
保藏日期:      公众可得到的
说明:          嗜热毁丝霉
分类:          Sordariaceae,Sordariales,Sordariomycetes,子
                囊菌门
来源:          -
相关序列:      SEQ ID NO:21(编码来自于嗜热毁丝霉的纤维二糖水
                解酶I的部分DNA序列)。
保藏号:        CBS 109471
申请人证明:    ND000537
保藏日期:      2001-05-29
说明:          微小根毛霉
分类:          毛霉菌科,毛霉菌属,接合菌门
来源:          丹麦
相关序列:      SEQ ID NO:22(编码来自于微小根毛霉的纤维二糖水
                解酶I的部分DNA序列)。
保藏号:        CBS 521.95
申请人证明:    ND000542
保藏日期:      1995-07-04
说明:          Meripilus giganteus
分类:          Rigidiporaceae,Hymenomycetales,Basidiomycota
来源:          丹麦,1993
相关序列:      SEQ ID NO:23(编码来自于Meripilus giganteus的
                纤维二糖水解酶I的部分DNA序列)。
保藏号:        CBS 277.96
申请人证明:    ND000543,ND001346和ND001243
保藏日期:      1996-03-12
说明:          黑耳
分类:          Exidiaceae,Auriculariales,层菌纲,担子菌目
来源:          丹麦,1993
相关序列:      SEQ ID NO:24(编码来自于黑耳的纤维二糖水解酶I
                的部分DNA序列),SEQ ID NO:45(编码来自于黑耳的
                具有CBD的纤维二糖水解酶I的全长DNA序列),SEQ ID
                NO:46(来自于黑耳的具有CBD的纤维二糖水解酶I的
                全长蛋白序列),SEQ ID NO:47(编码来自于黑耳的纤
                维二糖水解酶I的全长DNA序列),SEQ ID NO:48(编
                码来自于黑耳的纤维二糖水解酶I的全长蛋白序列)。
保藏号:        CBS 284.96
申请人证明:    ND000544和ND001235
保藏日期:      1996-03-12
说明:          块团炭角菌
分类:          Sordariaceae,Sordariales,Sordariomycetes,
                子囊菌门
来源:          丹麦,1993
相关序列:      SEQ ID NO:25(编码来自于块团炭角菌的纤维二糖水
                解酶I的部分DNA序列),SEQ ID NO:43(编码来自于
                块团炭角菌的纤维二糖水解酶I的全长DNA序列),SEQ
                ID NO:44(编码来自于块团炭角菌的纤维二糖水解酶I
                的全长蛋白序列)。
保藏号:        CBS 804.70
申请人证明:    ND001227
保藏日期:      公众可获得的
说明:          Trichophaea saccata
分类:          子囊菌门,Pezizomycetes,盘菌目,Pyronemataceae
相关序列:      SEQ ID NO:36(编码来自于Trichophaea saccata的
                纤维二糖水解酶I的部分DNA序列)。
德意志微生物保藏中心(DSMZ)
下列微生物材料已经根据布达佩斯条约在德意志微生物保藏中心(DSM)进行了保藏,Mascheroder Weg 1b,38124 Braunschweig,德国:
保藏号:        DSM 14348
申请人证明:    ND000551
保藏日期:      2001-06-13
说明:          与质粒连接的栗色新螱,白蚁CBH1基因
分类:          -
相关序列:      SEQ ID NO:13和SEQ ID NO:14(编码来自于栗色新
                螱内脏细胞或微生物的纤维二糖水解酶I的DNA序列
                及其相应的蛋白序列)。
保藏号:        DSM 15066
申请人证明:    ND001349
保藏日期:      2002-06-21
说明:          与质粒连接的poitrasia circinans CBH1基因
分类:          笄霉科,接合菌门,毛霉菌属
来源:          -
相关序列:      SEQ ID NO:49(编码来自于poitrasia circinans的
                纤维二糖水解酶I的DNA序列),SEQ ID NO:50(来自于
                poitrasia circinans的纤维二糖水解酶I的蛋白序
                列)。
保藏号:        DSM 15065
申请人证明:    ND001339
保藏日期:      2002-06-21
说明:          与质粒连接的灰色鬼伞CBH1基因
分类:          Basidiomycota,Hymenomycetes,Agaricales,
                Agaricaceae
来源:          丹麦
相关序列:      SEQ ID NO:51(编码来自于灰色鬼伞的纤维二糖水解
                酶I的DNA序列),SEQ ID NO:52(来自于灰色鬼伞的
                纤维二糖水解酶I的蛋白序列)。
保藏号:        DSM 15064
申请人证明:    ND001264
保藏日期:      2002-06-21
说明:          与质粒连接的长毛盘菌CBH1基因
分类:          子囊菌门,Pezizomycetes,Pezizales,
                Pyronemataceae
来源:          -
相关序列:      SEQ ID NO:39(编码来自于长毛盘菌的纤维二糖水解
                酶I的DNA序列),SEQ ID NO:40(来自于长毛盘菌的
                纤维二糖水解酶I的蛋白序列)。
保藏号:        DSM 15067
申请人证明:    ND001232
保藏日期:      2002-06-21
说明:          与质粒连接的嗜热毁丝霉CBH1基因
分类:          Sordariaceae,Sordariales,Sordariomycetes,
                子囊菌门
来源:          -
相关序列:      SEQ ID NO:41(编码来自于嗜热毁丝霉的纤维二糖水
                解酶I的DNA序列),SEQ ID NO:42(来自于嗜热毁丝
                霉的纤维二糖水解酶I的蛋白序列)。
发酵研究所,大阪(IFO)
下列微生物材料已经根据布达佩斯条约在发酵研究所,大阪(IFO)进行了保藏,17-85,Juso-Honmachi 2-chome,Yodogawa-Ku,大阪532-8686,日本:
保藏号:        IFO 5372
申请人证明:    ND000531
保藏日期:      公众可获得的(非申请人保藏)
说明:          玫瑰单瑞孢
分类:          有丝分裂孢子的子囊菌门
来源:          -
相关序列:      SEQ ID NO:17(编码来自于玫瑰单瑞孢的纤维二糖水
                解酶I的部分DNA序列)。
保藏的CBS427.97、CBS247.96、CBS521.95、CBS284.96、CBS274.96由Novo Nordisk A/S制备并且稍后转让给了Novozymes A/S。
0-10-1-1   表格-PCT/RO/134(EASY)与保藏微生物或其它生物材料相关的简要说明(PCT Rule13bis)准备使用 PCT-EASY 2.92版(更新于01.06.2002)
  0-2   国际申请号
  0-3   申请人或代理人的申请标识     10129.204-WO
11-11-2   以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 63-6431-2
  1-31-3-11-3-21-3-31-3-4   保藏证明保藏单位名称保藏单位地址保藏日期保藏号 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0584
  1-4   附注   无
  1-5   指定的需要这些说明的国家   所有指定国
  1-6   单独需要声明的稍后这些声明将被提交国际局   无
22-12-2   以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 644-12
  2-32-3-12-3-22-3-32-3-4   保藏证明保藏单位名称保藏单位地址保藏日期保藏号 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0581
  2-4   附注   无
  2-5 指定的需要这些说明的国家 所有指定国
  2-6 单独需要声明的稍后这些声明将被提交国际局
33-13-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6414-22
  3-33-3-13-3-23-3-33-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0585
  3-4 附注
  3-5 指定的需要这些说明的国家 所有指定国
  3-6 单独需要声明的稍后这些声明将被提交国际局
44-14-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6424-32
  4-3 保藏证明
  4-3-14-3-24-3-34-3-4 保藏单位名称保藏单位地址保藏日期保藏号 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0582
  4-4 附注
  4-5 指定的需要这些说明的国家 所有指定国
  4-6 单独需要声明的稍后这些声明将被提交国际局
5 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:
5-15-2 页行 64-6534-5
  5-35-3-15-3-25-3-35-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0583
  5-4 附注
  5-5 指定的需要这些说明的国家 所有指定国
  5-6 单独需要声明的稍后这些声明将被提交国际局
66-16-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 657-15
  6-36-3-16-3-26-3-3 保藏证明保藏单位名称保藏单位地址保藏日期 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29
  6-3-4 保藏号 CGMCC 0580
  6-4 附注
  6-5 指定的需要这些说明的国家 所有指定国
  6-6 单独需要声明的稍后这些声明将被提交国际局
77-17-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6517-23
  7-37-3-1 保藏证明保藏单位名称 中国普通微生物中心
 7-3-27-3-37-3-4 保藏单位地址保藏日期保藏号 中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2002-06-07CGCCM 0748
 7-4 附注
 7-5 指定的需要这些说明的国家 所有指定国
 7-6 单独需要声明的稍后这些声明将被提交国际局
88-18-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6525-31
 8-38-3-18-3-28-3-38-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2002-06-07CGCCM 0749
 8-4 附注
 8-5 指定的需要这些说明的国家 所有指定国
 8-6 单独需要声明的稍后这些声明将被提交国际局
99-19-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 65-6633-2
 9-39-3-19-3-29-3-39-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2002-06-07CGCCM 0747
 9-4 附注
 9-5 指定的需要这些说明的国家 所有指定国
 9-6 单独需要声明的稍后这些声明将被提交国际局
1010-110-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 664-10
 10-310-3-110-3-210-3-310-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2002-06-07CGCCM 0750
 10-4 附注
 10-5 指定的需要这些说明的国家 所有指定国
 10-6 单独需要声明的稍后这些声明将被提交国际局
1111-111-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6618-26
 11-311-3-111-3-211-3-311-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰2001-06-01CBS 109513
 11-4 附注
 11-5 指定的需要这些说明的国家 所有指定国
 11-6 单独需要声明的稍后这些声明将被提交国际局
1212-112-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 66-6737-7
 12-312-3-112-3-212-3-312-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1997-01-23CBS 427.97
 12-4 附注
 12-5 指定的需要这些说明的国家 所有指定国
 12-6 单独需要声明的稍后这些声明将被提交国际局
1313-113-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 679-19
 13-313-3-113-3-213-3-313-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1996-03-12CBS 247.96
 13-4 附注
 13-5 指定的需要这些说明的国家 所有指定国
 13-6 单独需要声明的稍后这些声明将被提交国际局
1414-114-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6730-37
 14-314-3-114-3-214-3-314-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰2001-05-29CBS 109471
 14-4 附注
 14-5 指定的需要这些说明的国家 所有指定国
 14-6 单独需要声明的稍后这些声明将被提交国际局
1515-115-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 682-9
 15-315-3-115-3-215-3-315-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1995-07-04CBS 521.95
 15-4 附注
 15-5 指定的需要这些说明的国家 所有指定国
 15-6 单独需要声明的稍后这些声明将被提交国际局
1616-116-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6826-36
 16-316-3-116-3-216-3-316-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1996-03-12CBS 284.96
 16-4 附注
 16-5 指定的需要这些说明的国家 所有指定国
 16-6 单独需要声明的稍后这些声明将被提交国际局
1717-117-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6811-24
 17-317-3-117-3-217-3-317-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1996-03-12CBS 277.96
 17-4 附注
 17 -5 指定的需要这些说明的国家 所有指定国
 17-6 单独需要声明的稍后这些声明将被提交国际局
1818-118-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6915-23
 18-318-3-118-3-218-3-318-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2001-06-13DSMZ 14348
 l8-4 附注
 18-5 指定的需要这些说明的国家 所有指定国
 18-6 单独需要声明的稍后这些声明将被提交国际局
1919-119-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 6925-33
 19-319-3-119-3-219-3-319-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2002-06-21DSMZ 15066
 19-4 附注
 19-5 指定的需要这些说明的国家 所有指定国
 19-6 单独需要声明的稍后这些声明将被提交国际局
2020-120-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 69-7035-6
 20-320-3-120-3-220-3-320-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2002-06-21DSMZ 15065
 20-4 附注
 20-5 指定的需要这些说明的国家 所有指定国
 20-6 单独需要声明的稍后这些声明将被提交国际局
2121-121-2 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 708-16
 21-321-3-121-3-221-3-321-3-4 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2002-06-21DSMZ 15064
 21-4 附注
  21-5   指定的需要这些说明的国家   所有指定国
  21-6   单独需要声明的稍后这些声明将被提交国际局   无
2222-122-2   以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 708-16
  22-322-3-122-3-222-3-322-3-4   保藏证明保藏单位名称保藏单位地址保藏日期保藏号 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2001-06-13DSMZ 15067
  22-4   附注   无
  22-5   指定的需要这些说明的国家   所有指定国
  22-6   单独需要声明的稍后这些声明将被提交国际局   无
                           序列表
<110>  Novozymes A/S
<120>  具有纤维二糖水解酶I活性的多肽和编码多肽的多核苷酸
<130>  10129-WO
<160>  67
<170>  PatentIn version 3.1
<210>  1
<211>  1581
<212>  DNA
<213>  嗜热支顶孢(Acremonium thermophilum)
<220>
<221>  CDS
<222>  (1)..(1581)
<223>
<400>  1
atg cac gcc aag ttc gcg acc ctc gcc gcc ctt gtg gcg tcc gcc gcg       48
Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala
1               5                   10                  15
gcc cag cag gcc tgc aca ctc acg gct gag aac cac ccc acc ctg tcg       96
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser
            20                  25                  30
tgg tcc aag tgc acg tcc ggc ggc agc tgc acc agc gtc tcg ggc tcc      144
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
        35                  40                  45
gtc acc atc gat gcc aac tgg cgg tgg act cac cag gtc tcg agc tcg      192
Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser
    50                  55                  60
acc aac tgc tac acg ggc aat gag tgg gac acg tcc atc tgc acc gac      240
Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp
65                  70                  75                  80
ggt gct tcg tgc gcc gcc gcc tgc tgc ctc gat ggc gcc gac tac tcg      288
Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser
                85                  90                  95
ggc acc tat ggc atc acc acc agc ggc aac gcc ctc agc ctc cag ttc      336
Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe
            100                 105                 110
gtc act cag ggc ccc tac tcg acc aac att ggc tcg cgt acc tac ctg      384
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
        115                 120                 125
atg gcc tcg gac acc aag tac cag atg ttc act ctg ctc ggc aac gag      432
Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu
    130                 135                 140
ttc acc ttc gac gtg gac gtc aca ggc ctc ggc tgc ggt ctg aac ggc      480
Phe Thr Phe Asp Val Asp Val Thr Gly Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
gcc ctc tac ttc gtc tcc atg gac gag gac ggt ggt ctt tcc aag tac      528
Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr
                165                 170                 175
tcg ggc aac aag gct ggc gcc aag tac ggc acc ggc tac tgc gac tcg      576
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
cag tgc ccc cgc gac ctc aag ttc atc aac ggc gag gct aac aac gtt      624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val
        195                 200                 205
ggc tgg acc ccg tcg tcc aac gac aag aac gcc ggc ttg ggc aac tac      672
Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr
    210                 215                 220
ggc agc tgc tgc tcc gag atg gat gtc tgg gag gcc aac agc atc tcg      720
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225                 230                 235                 240
gcg gcc tac acg ccc cat cct tgc act acc atc ggc cag acg cgc tgc      768
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
                245                 250                 255
gag ggc gac gac tgc ggt ggt acc tac agc act gac cgc tac gcc ggc      816
Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
            260                 265                 270
gag tgc gac cct gac gga tgc gac ttc aac tcg tac cgc atg ggc aac      864
Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn
        275                 280                 285
acg acc ttc tac ggc aag ggc atg acc gtc gac acc agc aag aag ttc      912
Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe
    290                 295                 300
acg gtg gtg acc cag ttc ctg acg gac tcg tct ggc aac ctg tcc gag      960
Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu
305                 310                 315                 320
atc aag cgc ttc tac gtc cag aac ggc gtc gtc att ccc aac tcg aac     1008
Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn
                325                 330                 335
tcc aac atc gcg ggc gtc tcg ggc aac tcc atc acc cag gcc ttc tgc     1056
Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys
            340                 345                 350
gat gct cag aag acc gct ttc ggc gac acc aac gtc ttc gac caa aag     1104
Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys
        355                 360                 365
ggc ggc ctg gcc cag atg ggc aag gct ctt gcc cag ccc atg gtc ctc     1152
Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu
    370                 375                 380
gtc atg tcc ctc tgg gac gac cac gcc gtc aac atg ctc tgg ctc gac     1200
Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385                 390                 395                 400
tcg acc tac ccg acc aac gcg gcc ggc aag ccg ggc gcc gcc cgc ggt     1248
Ser Thr Tyr Pro Thr Asn Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly
                405                 410                 415
acc tgc ccc acc acc tcg ggc gtc ccc gcc gac gtc gag tcc cag gcg     1296
Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala
            420                 425                 430
ccc aac tcc aag gtc atc tac tcc aac atc cgc ttc ggc ccc atc ggc     1344
Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly
        435                 440                 445
tcc acc gtc tcc ggc ctg ccc ggc ggc ggc agc aac ccc ggc ggc ggc     1392
Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly
    450                 455                 460
tcc agc tcc acc acc acc acc acc aga ccc gcc acc tcc acc acc tcc     1440
Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser
465                 470                 475                 480
tcg gcc agc tcc ggc ccg acc ggc ggt ggc acg gct gcc cac tgg ggc     1488
Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly
                485                 490                 495
cag tgc ggc ggc atc ggc tgg acc ggc ccg acc gtc tgc gcc tcg ccc     1536
Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro
            500                 505                 510
tac acc tgc cag aag ctg aac gac tgg tac tac cag tgc ctc taa         1581
Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu
        515                 520                 525
<210>  2
<211>  526
<212>  PRT
<213>  嗜热支顶孢(Acremonium thermophilum)
<400>  2
Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala
1               5                   10                  15
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser
            20                  25                  30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
        35                  40                  45
Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser
    50                  55                  60
Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp
65                  70                  75                  80
Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser
                85                  90                  95
Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe
            100                 105                 110
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
        115                 120                 125
Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu
    130                 135                 140
Phe Thr Phe Asp Val Asp Val Thr Gly Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr
                165                 170                 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val
        195                 200                 205
Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr
    210                 215                 220
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225                 230                 235                 240
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
                245                 250                 255
Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
            260                 265                 270
Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn
        275                 280                 285
Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe
    290                 295                 300
Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu
305                 310                 315                 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn
                325                 330                 335
Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys
            340                 345                 350
Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys
        355                 360                 365
Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu
    370                 375                 380
Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385                 390                 395                 400
Ser Thr Tyr Pro Thr Asn Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly
                405                 410                 415
Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala
            420                 425                 430
Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly
        435                 440                 445
Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly
    450                 455                 460
Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser
465                 470                 475                 480
Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly
                485                 490                 495
Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro
            500                 505                 510
Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu
        515                 520                 525
<210>  3
<211>  1590
<212>  DNA
<213>  嗜热毛壳酶(Chaetomium thermophilum)
<220>
<221>  CDS
<222>  (1)..(1590)
<223>
<400>  3
atg atg tac aag aag ttc gcc gct ctc gcc gcc ctc gtg gct ggc gcc       48
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
1               5                   10                  15
gcc gcc cag cag gct tgc tcc ctc acc act gag acc cac ccc aga ctc       96
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
            20                  25                  30
act tgg aag cgc tgc acc tct ggc ggc aac tgc tcg acc gtg aac ggc      144
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
        35                  40                  45
gcc gtc acc atc gat gcc aac tgg cgc tgg act cac acc gtt tcc ggc      192
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
    50                  55                  60
tcg acc aac tgc tac acc ggc aac gag tgg gat acc tcc atc tgc tct      240
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
65                  70                  75                  80
gat ggc aag agc tgc gcc cag acc tgc tgc gtc gac ggc gct gac tac      288
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
                85                  90                  95
tct tcg acc tat ggt atc acc acc agc ggt gac tcc ctg aac ctc aag      336
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
            100                 105                 110
ttc gtc acc aag cac cag tac ggc acc aat gtc ggc tct cgt gtc tac      384
Phe Val Thr Lys His Gln Tyr Gly Thr Asn Val Gly Ser Arg Val Tyr
        115                 120                 125
ctg atg gag aac gac acc aag tac cag atg ttc gag ctc ctc ggc aac      432
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
    130                 135                 140
gag ttc acc ttc gat gtc gat gtc tct aac ctg ggc tgc ggt ctc aac      480
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
145                 150                 155                 160
ggt gcc ctc tac ttc gtc tcc atg gac gct gat ggt ggt atg agc aag      528
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
                165                 170                 175
tac tct ggc aac aag gct ggc gcc aag tac ggg acg ggg tac tgt gat      576
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
            180                 185                 190
gct cag tgc ccg cgc gac ctt aag ttc atc aac ggc gag gcc aac att      624
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
        195                 200                 205
gag aac tgg acc cct tcg acc aat gat gcc aac gcc ggt ttc ggc cgc      672
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
    210                 215                 220
tat ggc agc tgc tgc tct gag atg gat atc tgg gag gcc aac aac atg      720
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225                 230                 235                 240
gct act gcc ttc act cct cac cct tgc acc att atc ggc cag agc cgc      768
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
                245                 250                 255
tgc gag ggc aac agc tgc ggt ggc acc tac agc tct gag cgc tat gct      816
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
            260                 265                 270
ggt gtt tgc gat cct gat ggc tgc gac ttc aac gcc tac cgc cag ggc      864
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
        275                 280                 285
gac aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag      912
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
    290                 295                 300
atg acc gtc gtc acc cag ttc cac aag aac tcg gct ggc gtc ctc agc      960
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
305                 310                 315                 320
gag atc aag cgc ttc tac gtt cag gac ggc aag gtc att gcc aac gcc     1008
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Val Ile Ala Asn Ala
                325                 330                 335
gag tcc aag atc ccc ggc aac ccc ggc aac tcc atc acc cag gag tgg     1056
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
            340                 345                 350
tgc gat gcc cag aag gtc gcc ttc ggt gac atc gat gac ttc aac cgc     1104
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
        355                 360                 365
aag ggc ggt atg gct cag atg agc aag gcc ctc gaa ggc cct atg gtc     1152
Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val
    370                 375                 380
ctg gtc atg tcc gtc tgg gat gac cac tac gcc aac atg ctc tgg ctc     1200
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
385                 390                 395                 400
gac tcg acc tac ccc atc gac aag gcc ggc acc ccc ggc gcc gag cgc     1248
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
                405                 410                 415
ggt gct tgc ccg acc acc tcc ggt gtc cct gcc gag att gag gcc cag     1296
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
            420                 425                 430
gtc ccc aac agc aac gtc atc ttc tcc aac atc cgc ttc ggc ccc atc    1344
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
        435                 440                 445
ggc tcg acc gtc cct ggc ctc gac ggc agc act ccc agc aac ccg acc    1392
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
    450                 455                 460
gcc acc gtt gct cct ccc act tct acc acc agc gtg aga agc agc act    1440
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Ser Val Arg Ser Ser Thr
465                 470                 475                 480
act cag att tcc acc ccg act agc cag ccc ggc ggc tgc acc acc cag    1488
Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr Gln
                485                 490                 495
aag tgg ggc cag tgc ggt ggt atc ggc tac acc ggc tgc act aac tgc    1536
Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn Cys
            500                 505                 510
gtt gct ggc act acc tgc act gag ctc aac ccc tgg tac agc cag tgc    1584
Val Ala Gly Thr Thr Cys Thr Glu Leu Ash Pro Trp Tyr Ser Gln Cys
        515                 520                 525
ctg taa                                                            1590
Leu
<210>  4
<211>  529
<212>  PRT
<213>  嗜热毛壳酶(Chaetomium thermophilum)
<400>  4
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
1               5                   10                  15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
            20                  25                  30
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
        35                  40                  45
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
    50                  55                  60
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
65                  70                  75                  80
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
                85                  90                  95
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
            100                 105                 110
Phe Val Thr Lys His Gln Tyr Gly Thr Asn Val Gly Ser Arg Val Tyr
        115                 120                 125
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
    130                 135                 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
145                 150                 155                 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
                165                 170                 175
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
            180                 185                 190
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
        195                 200                 205
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
    210                 215                 220
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225                 230                 235                 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
                245                 250                 255
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
            260                 265                 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
        275                 280                 285
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
    290                 295                 300
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
305                 310                 315                 320
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Val Ile Ala Asn Ala
                325                 330                 335
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
            340                 345                 350
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
        355                 360                 365
Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val
    370                 375                 380
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
385                 390                 395                 400
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
                405                 410                 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
            420                 425                 430
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
        435                 440                 445
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
    450                 455                 460
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Ser Val Arg Ser Ser Thr
465                 470                 475                 480
Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr Gln
                485                 490                 495
Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn Cys
            500                 505                 510
Val Ala Gly Thr Thr Cys Thr Glu Leu Asn Pro Trp Tyr Ser Gln Cys
        515                 520                 525
Leu
<210>  5
<211>  1356
<212>  DNA
<213>  小柱胞菌(Scytalidium sp.)
<220>
<221>  CDS
<222>  (1)..(1356)
<223>
<400>  5
atg cag atc aag agc tac atc cag tac ctg gcc gcg gct ctg ccg ctc       48
Met Gln Ile Lys Ser Tyr Ile Gln Tyr Leu Ala Ala Ala Leu Pro Leu
1               5                   10                  15
ctg agc agc gtc gct gcc cag cag gcc ggc acc atc acc gcc gag aac       96
Leu Ser Ser Val Ala Ala Gln Gln Ala Gly Thr Ile Thr Ala Glu Asn
            20                  25                  30
cac ccc agg atg acc tgg aag agg tgc tcg ggc ccc ggc aac tgc cag      144
His Pro Arg Met Thr Trp Lys Arg Cys Ser Gly Pro Gly Asn Cys Gln
        35                  40                  45
acc gtg cag ggc gag gtc gtc atc gac gcc aac tgg cgc tgg ctg cac      192
Thr Val Gln Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His
    50                  55                  60
aac aac ggc cag aac tgc tat gag ggc aac aag tgg acc agc cag tgc      240
Asn Asn Gly Gln Asn Cys Tyr Glu Gly Asn Lys Trp Thr Ser Gln Cys
65                  70                  75                  80
agc tcg gcc acc gac tgc gcg cag agg tgc gcc ctc gac ggt gcc aac      288
Ser Ser Ala Thr Asp Cys Ala Gln Arg Cys Ala Leu Asp Gly Ala Asn
                85                  90                  95
tac cag tcg acc tac ggc gcc tcg acc agc ggc gac tcc ctg acg ctc      336
Tyr Gln Ser Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu
            100                 105                 110
aag ttc gtc acc aag cac gag tac ggc acc aac atc ggc tcg cgc ttc      384
Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe
        115                 120                 125
tac ctc atg gcc aac cag aac aag tac cag atg ttc acc ctg atg aac      432
Tyr Leu Met Ala Asn Gln Asn Lys Tyr Gln Met Phe Thr Leu Met Asn
    130                 135                 140
aac gag ttc gcc ttc gat gtc gac ctc tcc aag gtt gag tgc ggt atc      480
Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Lys Val Glu Cys Gly Ile
145                 150                 155                 160
aac agc gct ctg tac ttc gtc gcc atg gag gag gat ggt ggc atg gcc      528
Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala
                165                 170                 175
agc tac ccg agc aac cgt gct ggt gcc aag tac ggc acg ggc tac tgc      576
Ser Tyr Pro Ser Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
            180                 185                 190
gat gcc caa tgc gcc cgt gac ctc aag ttc att ggc ggc aag gcc aac      624
Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Ile Gly Gly Lys Ala Asn
        195                 200                 205
att gag ggc tgg cgc ccg tcc acc aac gac ccc aac gcc ggt gtc ggt      672
Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Pro Asn Ala Gly Val Gly
    210                 215                 220
ccc atg ggt gcc tgc tgc gct gag atc gac gtt tgg gag tcc aac gcc      720
Pro Met Gly Ala Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala
225                 230                 235                 240
tat gct tat gcc ttc acc ccc cac gcc tgc ggc agc aag aac cgc tac      768
Tyr Ala Tyr Ala Phe Thr Pro His Ala Cys Gly Ser Lys Asn Arg Tyr
                245                 250                 255
cac atc tgc gag acc aac aac tgc ggt ggt acc tac tcg gat gac cgc      816
His Ile Cys Glu Thr Asn Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg
            260                 265                 270
ttc gcc ggc tac tgc gac gcc aac ggc tgc gac tac aac ccc tac cgc      864
Phe Ala Gly Tyr Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg
        275                 280                 285
atg ggc aac aag gac ttc tat ggc aag ggc aag acc gtc gac acc aac      912
Met Gly Asn Lys Asp Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Asn
    290                 295                 300
cgc aag ttc acc gtt gtc tcc cgc ttc gag cgt aac agg ctc tct cag      960
Arg Lys Phe Thr Val Val Ser Arg Phe Glu Arg Asn Arg Leu Ser Gln
305                 310                 315                 320
ttc ttc gtc cag gac ggc cgc aag atc gag gtg ccc cct ccg acc tgg     1008
Phe Phe Val Gln Asp Gly Arg Lys Ile Glu Val Pro Pro Pro Thr Trp
                325                 330                 335
ccc ggc ctc ccg aac agc gcc gac atc acc cct gag ctc tgc gat gct     1056
Pro Gly Leu Pro Asn Ser Ala Asp Ile Thr Pro Glu Leu Cys Asp Ala
            340                 345                 350
cag ttc cgc gtc ttc gat gac cgc aac cgc ttc gcc gag acc ggt ggc     1104
Gln Phe Arg Val Phe Asp Asp Arg Asn Arg Phe Ala Glu Thr Gly Gly
        355                 360                 365
ttc gat gct ctg aac gag gcc ctc acc att ccc atg gtc ctt gtc atg     1152
Phe Asp Ala Leu Asn Glu Ala Leu Thr Ile Pro Met Val Leu Val Met
    370                 375                 380
tcc atc tgg gat gac cac cac tcc aac atg ctc tgg ctc gac tcc agc    1200
Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp Ser Ser
385                 390                 395                 400
tac ccg ccc gag aag gcc ggc ctc ccc ggt ggc gac cgt ggc ccg tgc    1248
Tyr Pro Pro Glu Lys Ala Gly Leu Pro Gly Gly Asp Arg Gly Pro Cys
                405                 410                 415
ccg acc acc tct ggt gtc cct gcc gag gtc gag gct cag tac ccc gat    1296
Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asp
            420                 425                 430
gct cag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg acc    1344
Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr
        435                 440                 445
gtc aac gtc taa                                                    1356
Val Asn Val
    450
<210>  6
<211>  451
<212>  PRT
<213>  小柱胞菌(Scytalidium sp.)
<400>  6
Met Gln Ile Lys Ser Tyr Ile Gln Tyr Leu Ala Ala Ala Leu Pro Leu
1               5                   10                  15
Leu Ser Ser Val Ala Ala Gln Gln Ala Gly Thr Ile Thr Ala Glu Asn
            20                  25                  30
His Pro Arg Met Thr Trp Lys Arg Cys Ser Gly Pro Gly Asn Cys Gln
        35                  40                  45
Thr Val Gln Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His
    50                  55                  60
Asn Asn Gly Gln Asn Cys Tyr Glu Gly Asn Lys Trp Thr Ser Gln Cys
65                  70                  75                  80
Ser Ser Ala Thr Asp Cys Ala Gln Arg Cys Ala Leu Asp Gly Ala Asn
                85                  90                  95
Tyr Gln Ser Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu
            100                 105                 110
Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe
        115                 120                 125
Tyr Leu Met Ala Asn Gln Asn Lys Tyr Gln Met Phe Thr Leu Met Asn
    130                 135                 140
Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Lys Val Glu Cys Gly Ile
145                 150                 155                 160
Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala
                165                 170                 175
Ser Tyr Pro Ser Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
            180                 185                 190
Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Ile Gly Gly Lys Ala Asn
        195                 200                 205
Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Pro Asn Ala Gly Val Gly
    210                 215                 220
Pro Met Gly Ala Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala
225                 230                 235                 240
Tyr Ala Tyr Ala Phe Thr Pro His Ala Cys Gly Ser Lys Asn Arg Tyr
                245                 250                 255
His Ile Cys Glu Thr Asn Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg
            260                 265                 270
Phe Ala Gly Tyr Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg
        275                 280                 285
Met Gly Asn Lys Asp Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Asn
    290                 295                 300
Arg Lys Phe Thr Val Val Ser Arg Phe Glu Arg Asn Arg Leu Ser Gln
305                 310                 315                 320
Phe Phe Val Gln Asp Gly Arg Lys Ile Glu Val Pro Pro Pro Thr Trp
                325                 330                 335
Pro Gly Leu Pro Asn Ser Ala Asp Ile Thr Pro Glu Leu Cys Asp Ala
            340                 345                 350
Gln Phe Arg Val Phe Asp Asp Arg Asn Arg Phe Ala Glu Thr Gly Gly
        355                 360                 365
Phe Asp Ala Leu Asn Glu Ala Leu Thr Ile Pro Met Val Leu Val Met
    370                 375                 380
Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp Ser Ser
385                 390                 395                 400
Tyr Pro Pro Glu Lys Ala Gly Leu Pro Gly Gly Asp Arg Gly Pro Cys
                405                 410                 415
Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asp
            420                 425                 430
Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr
        435                 440                 445
Val Asn Val
    450
<210>  7
<211>  1374
<212>  DNA
<213>  橙黄色热子囊菌(Thermoascus aurantiacus)
<220>
<221>  CDS
<222>  (1)..(1374)
<223>
<400>  7
atg tat cag cgc gct ctt ctc ttc tct ttc ttc ctc tcc gcc gcc cgc    48
Met Tyr Gln Arg Ala Leu Leu Phe Ser Phe Phe Leu Ser Ala Ala Arg
1               5                   10                  15
gcg cag cag gcc ggt acc cta acc gca gag aat cac cct tcc ctg acc     96
Ala Gln Gln Ala Gly Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
            20                  25                  30
tgg cag caa tgc tcc agc ggc ggt agt tgt acc acg cag aat gga aaa    144
Trp Gln Gln Cys Ser Ser Gly Gly Ser Cys Thr Thr Gln Asn Gly Lys
        35                  40                  45
gtc gtt atc gat gcg aac tgg cgt tgg gtc cat acc acc tct gga tac    192
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Thr Thr Ser Gly Tyr
    50                  55                  60
acc aac tgc tac acg ggc aat acg tgg gac acc agt atc tgt ccc gac    240
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Pro Asp
65                  70                  75                  80
gac gtg acc tgc gct cag aat tgt gcc ttg gat gga gcg gat tac agt    288
Asp Val Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
                85                  90                  95
ggc acc tat ggt gtt acg acc agt ggc aac gcc ctg aga ctg aac ttt    336
Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Arg Leu Asn Phe
            100                 105                 110
gtc acc caa agc tca ggg aag aac att ggc tcg cgc ctg tac ctg ctg    384
Val Thr Gln Ser Ser Gly Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu
        115                 120                 125
cag gac gac acc act tat cag atc ttc aag ctg ctg ggt cag gag ttt    432
Gln Asp Asp Thr Thr Tyr Gln Ile Phe Lys Leu Leu Gly Gln Glu Phe
    130                 135                 140
acc ttc gat gtc gac gtc tcc aat ctc cct tgc ggg ctg aac ggc gcc    480
Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala
145                 150                 155                 160
ctc tac ttt gtg gcc atg gac gcc gac ggc gga ttg tcc aaa tac cct    528
Leu Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Leu Ser Lys Tyr Pro
                165                 170                 175
ggc aac aag gca ggc gct aag tat ggc act ggt tac tgc gac tct cag    576
Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
            180                 185                 190
tgc cct cgg gat ctc aag ttc atc aac ggt cag gcc aac gtt gaa ggc    624
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
        195                 200                 205
tgg cag ccg tct gcc aac gac cca aat gcc ggc gtt ggt aac cac ggt    672
Trp Gln Pro Ser Ala Asn Asp Pro Asn Ala Gly Val Gly Asn His Gly
    210                 215                 220
tcc tgc tgc gct gag atg gat gtc tgg gaa gcc aac agc atc tct act    720
Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Thr
225                 230                 235                 240
gcg gtg acg cct cac cca tgc gac acc ccc ggc cag acc atg tgc cag    768
Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Gln
                245                 250                 255
gga gac gac tgt ggt gga acc tac tcc tcc act cga tat gct ggt acc    816
Gly Asp Asp Cys Gly Gly Thr Tyr Ser Ser Thr Arg Tyr Ala Gly Thr
            260                 265                 270
tgc gac cct gat ggc tgc gac ttc aat cct tac cgc cag ggc aac cac    864
Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Gln Gly Asn His
        275                 280                 285
tcg ttc tac ggc ccc ggg aag atc gtc gac act agc tcc aaa ttc acc    912
Ser Phe Tyr Gly Pro Gly Lys Ile Val Asp Thr Ser Ser Lys Phe Thr
    290                 295                 300
gtc gtc acc cag ttc atc acc gac gac ggg acc ccc tcc ggc acc ctg     960
Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Pro Ser Gly Thr Leu
305                 310                 315                 320
acg gag atc aaa cgc ttc tac gtc cag aac ggc aag gtg atc ccc cag    1008
Thr Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln
                325                 330                 335
tcg gag tcg acg atc agc ggc gtc acc ggc aac tca atc acc acc gag    1056
Ser Glu Ser Thr Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu
            340                 345                 350
tat tgc acg gcc cag aag gcc gcc ttc ggc gac aac acc ggc ttc ttc    1104
Tyr Cys Thr Ala Gln Lys Ala Ala Phe Gly Asp Asn Thr Gly Phe Phe
        355                 360                 365
acg cac ggc ggg ctt cag aag atc agt cag gct ctg gct cag ggc atg    1152
Thr His Gly Gly Leu Gln Lys Ile Ser Gln Ala Leu Ala Gln Gly Met
    370                 375                 380
gtc ctc gtc atg agc ctg tgg gac gat cac gcc gcc aac atg ctc tgg    1200
Val Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asn Met Leu Trp
385                 390                 395                 400
ctg gac agc acc tac ccg act gat gcg gac ccg gac acc cct ggc gtc    1248
Leu Asp Ser Thr Tyr Pro Thr Asp Ala Asp Pro Asp Thr Pro Gly Val
                405                 410                 415
gcg cgc ggt acc tgc ccc acg acc tcc ggc gtc ccg gcc gac gtt gag    1296
Ala Arg Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu
            420                 425                 430
tcg cag aac ccc aat tca tat gtt atc tac tcc aac atc aag gtc gga    1344
Ser Gln Asn Pro Asn Ser Tyr Val Ile Tyr Ser Asn Ile Lys Val Gly
        435                 440                 445
ccc atc aac tcg acc ttc acc gcc aac taa                            1374
Pro Ile Asn Ser Thr Phe Thr Ala Asn
    450                 455
<210>  8
<211>  457
<212>  PRT
<213>  橙黄色热子囊菌(Thermoascus aurantiacus)
<400>  8
Met Tyr Gln Arg Ala Leu Leu Phe Ser Phe Phe Leu Ser Ala Ala Arg
1               5                   10                  15
Ala Gln Gln Ala Gly Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
            20                  25                  30
Trp Gln Gln Cys Ser Ser Gly Gly Ser Cys Thr Thr Gln Asn Gly Lys
        35                  40                  45
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Thr Thr Ser Gly Tyr
    50                  55                  60
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Pro Asp
65                  70                  75                  80
Asp Val Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
                85                  90                  95
Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Arg Leu Asn Phe
            100                 105                 110
Val Thr Gln Ser Ser Gly Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu
        115                 120                 125
Gln Asp Asp Thr Thr Tyr Gln Ile Phe Lys Leu Leu Gly Gln Glu Phe
    130                 135                 140
Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala
145                 150                 155                 160
Leu Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Leu Ser Lys Tyr Pro
                165                 170                 175
Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
            180                 185                 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
        195                 200                 205
Trp Gln Pro Ser Ala Asn Asp Pro Asn Ala Gly Val Gly Asn His Gly
    210                 215                 220
Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Thr
225                 230                 235                 240
Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Gln
                245                 250                 255
Gly Asp Asp Cys Gly Gly Thr Tyr Ser Ser Thr Arg Tyr Ala Gly Thr
            260                 265                 270
Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Gln Gly Asn His
        275                 280                 285
Ser Phe Tyr Gly Pro Gly Lys Ile Val Asp Thr Ser Ser Lys Phe Thr
    290                 295                 300
Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Pro Ser Gly Thr Leu
305                 310                 315                 320
Thr Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln
                325                 330                 335
Ser Glu Ser Thr Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu
            340                 345                 350
Tyr Cys Thr Ala Gln Lys Ala Ala Phe Gly Asp Asn Thr Gly Phe Phe
        355                 360                 365
Thr His Gly Gly Leu Gln Lys Ile Ser Gln Ala Leu Ala Gln Gly Met
    370                 375                 380
Val Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asn Met Leu Trp
385                 390                 395                 400
Leu Asp Ser Thr Tyr Pro Thr Asp Ala Asp Pro Asp Thr Pro Gly Val
                405                 410                 415
Ala Arg Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu
            420                 425                 430
Ser Gln Asn Pro Asn Ser Tyr Val Ile Tyr Ser Asn Ile Lys Val Gly
        435                 440                 445
Pro Ile Asn Ser Thr Phe Thr Ala Asn
    450                 455
<210>  9
<211>  1617
<212>  DNA
<213>  Thielavia australiensis
<220>
<221>  CDS
<222>  (1)..(1617)
<223>
<400>  9
atg tat gcc aag ttc gcg acc ctc gcc gcc ctc gtg gct ggc gcc tcc     48
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ser
1               5                   10                  15
gcc cag gcc gtc tgc agc ctt acc gct gag acg cac cct tcc ctg acg     96
Ala Gln Ala Val Cys Ser Leu Thr Ala Glu Thr His Pro Ser Leu Thr
            20                  25                  30
tgg cag aag tgc acg gcc ccc ggc agc tgc acc aac gtc gcc ggc tcc    144
Trp Gln Lys Cys Thr Ala Pro Gly Ser Cys Thr Asn Val Ala Gly Ser
        35                  40                  45
atc acc atc gac gcc aac tgg cgc tgg act cac cag acc tcg tcc gcg    192
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Thr Ser Ser Ala
    50                  55                  60
acc aac tgc tac agc ggc agc aag tgg gac tcg tcc atc tgc acg acc    240
Thr Asn Cys Tyr Ser Gly Ser Lys Trp Asp Ser Ser Ile Cys Thr Thr
65                  70                  75                  80
ggc acc gac tgc gcc tcc aag tgc tgc att gat ggc gcc gag tac tcg    288
Gly Thr Asp Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Glu Tyr Ser
                85                  90                  95
agc acc tac ggc atc acc acc agc ggc aat gcc ctg aac ctc aag ttc    336
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
            100                 105                 110
gtc acc aag ggc cag tac tcg acc aac att ggc tcg cgt acc tac ctc     384
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
        115                 120                 125
atg gag tcg gac acc aag tac cag atg ttc aag ctc ctt ggc aac gag     432
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Lys Leu Leu Gly Asn Glu
    130                 135                 140
ttc acc ttc gac gtc gat gtc tcc aac ctc ggc tgc ggc ctc aac ggc     480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
gcc ctg tac ttc gtc tcc atg gat gcc gac ggt ggc atg tcc aag tac     528
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
                165                 170                 175
tcg ggc aac aag gcc ggt gcc aag tac ggt acc ggc tac tgc gat gct     576
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
            180                 185                 190
cag tgc ccc cgc gac ctc aag ttc atc aac ggc gag gcc aac gtt gag     624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu
        195                 200                 205
ggc tgg gag agc tcg acc aac gac gcc aac gcc ggc tcg ggc aag tac     672
Gly Trp Glu Ser Ser Thr Asn Asp Ala Asn Ala Gly Ser Gly Lys Tyr
    210                 215                 220
ggc agc tgc tgc acc gag atg gac gtc tgg gag gcc aac aac atg gcg     720
Gly Ser Cys Cys Thr Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala
225                 230                 235                 240
act gcc ttc act cct cac cct tgc acc acc att ggc cag act cgc tgc     768
Thr Ala Phe Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
                245                 250                 255
gag ggc gac acc tgc ggc ggc acc tac agc tca gac cgc tac gcc ggc     816
Glu Gly Asp Thr Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
            260                 265                 270
gtc tgc gac ccc gac gga tgc gac ttc aac tcg tac cgc cag ggc aac     864
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn
        275                 280                 285
aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag atc     912
Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile
    290                 295                 300
acg gtc gtc acc cag ttc ctc aag aac tcg gcc ggc gag ctc tcc gag     960
Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu
305                 310                 315                 320
atc aag cgc ttc tac gcc cag gac ggc aag gtc atc ccg aac agt gag    1008
Ile Lys Arg Phe Tyr Ala Gln Asp Gly Lys Val Ile Pro Asn Ser Glu
                325                 330                 335
tct acc att gcc ggc atc ccc ggc aac tcc atc acc aag gcc tac tgc    1056
Ser Thr Ile Ala Gly Ile Pro Gly Asn Ser Ile Thr Lys Ala Tyr Cys
            340                 345                 350
gac gcc cag aag acc gtc ttc cag aac acc gac gac ttc acc gcc aag    1104
Asp Ala Gln Lys Thr Val Phe Gln Asn Thr Asp Asp Phe Thr Ala Lys
        355                 360                 365
ggc ggc ctc gtc cag atg ggc aag gcc ctc gcc ggc gac atg gtc ctc    1152
Gly Gly Leu Val Gln Met Gly Lys Ala Leu Ala Gly Asp Met Val Leu
    370                 375                 380
gtc atg tcc gtc tgg gac gac cac gcc gtc aac atg ctc tgg cta gac    1200
Val Met Ser Val Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385                 390                 395                 400
tcg acc tac ccg acc gac cag gtc ggc gtt gcc ggc gct gag cgc ggc    1248
Ser Thr Tyr Pro Thr Asp Gln Val Gly Val Ala Gly Ala Glu Arg Gly
                405                 410                 415
gcc tgc ccc acc acc tcg ggc gtc ccc tcg gat gtt gag gcc aac gcc    1296
Ala Cys Pro Thr Thr Ser Gly Val Pro Ser Asp Val Glu Ala Asn Ala
            420                 425                 430
ccc aac tcc aac gtc atc ttc tcc aac atc cgc ttc ggc ccc atc ggc    1344
Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly
        435                 440                 445
tcc acc gtc cag ggc ctg ccc agc tcc ggc ggc acc tcc agc agc tcg    1392
Ser Thr Val Gln Gly Leu Pro Ser Ser Gly Gly Thr Ser Ser Ser Ser
    450                 455                 460
agc gcc gct ccc cag tcg acc agc acc aag gcc tcg acc acc acc tca    1440
Ser Ala Ala Pro Gln Ser Thr Ser Thr Lys Ala Ser Thr Thr Thr Ser
465                 470                 475                 480
gct gtc cgc acc acc tcg act gcc acc acc aag acc acc tcc tcg gct    1488
Ala Val Arg Thr Thr Ser Thr Ala Thr Thr Lys Thr Thr Ser Ser Ala
                485                 490                 495
ccc gcc cag ggc acc aac act gcc aag cat tgg cag caa tgc ggt ggt    1536
Pro Ala Gln Gly Thr Asn Thr Ala Lys His Trp Gln Gln Cys Gly Gly
            500                 505                 510
aac ggc tgg acc ggc ccg acg gtg tgc gag tct ccc tac aag tgc acc    1584
Asn Gly Trp Thr Gly Pro Thr Val Cys Glu Ser Pro Tyr Lys Cys Thr
        515                 520                 525
aag cag aac gac tgg tac tcg cag tgc ctc taa                        1617
Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu
    530                 535
<210>  10
<211>  538
<212>  PRT
<213>  Thielavia australiensis
<400>  10
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ser
1               5                   10                  15
Ala Gln Ala Val Cys Ser Leu Thr Ala Glu Thr His Pro Ser Leu Thr
            20                  25                  30
Trp Gln Lys Cys Thr Ala Pro Gly Ser Cys Thr Asn Val Ala Gly Ser
        35                  40                  45
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Thr Ser Ser Ala
    50                  55                  60
Thr Asn Cys Tyr Ser Gly Ser Lys Trp Asp Ser Ser Ile Cys Thr Thr
65                  70                  75                  80
Gly Thr Asp Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Glu Tyr Ser
                85                  90                  95
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
            100                 105                 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
        115                 120                 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Lys Leu Leu Gly Asn Glu
    130                 135                 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
                165                 170                 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
            180                 185                 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu
        195                 200                 205
Gly Trp Glu Ser Ser Thr Asn Asp Ala Asn Ala Gly Ser Gly Lys Tyr
    210                 215                 220
Gly Ser Cys Cys Thr Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala
225                 230                 235                 240
Thr Ala Phe Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
                245                 250                 255
Glu Gly Asp Thr Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
            260                 265                 270
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn
        275                 280                 285
Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile
    290                 295                 300
Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu
305                 310                 315             320
Ile Lys Arg Phe Tyr Ala Gln Asp Gly Lys Val Ile Pro Asn Ser Glu
                325                 330                 335
Ser Thr Ile Ala Gly Ile Pro Gly Asn Ser Ile Thr Lys Ala Tyr Cys
            340                 345                 350
Asp Ala Gln Lys Thr Val Phe Gln Asn Thr Asp Asp Phe Thr Ala Lys
        355                 360                 365
Gly Gly Leu Val Gln Met Gly Lys Ala Leu Ala Gly Asp Met Val Leu
    370                 375                 380
Val Met Ser Val Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385                 390                 395                 400
Ser Thr Tyr Pro Thr Asp Gln Val Gly Val Ala Gly Ala Glu Arg Gly
                405                 410                 415
Ala Cys Pro Thr Thr Ser Gly Val Pro Ser Asp Val Glu Ala Asn Ala
            420                 425                 430
Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly
        435                 440                 445
Ser Thr Val Gln Gly Leu Pro Ser Ser Gly Gly Thr Ser Ser Ser Ser
    450                 455                 460
Ser Ala Ala Pro Gln Ser Thr Ser Thr Lys Ala Ser Thr Thr Thr Ser
465                 470                 475                 480
Ala Val Arg Thr Thr Ser Thr Ala Thr Thr Lys Thr Thr Ser Ser Ala
                485                 490                 495
Pro Ala Gln Gly Thr Asn Thr Ala Lys His Trp Gln Gln Cys Gly Gly
            500                 505                 510
Asn Gly Trp Thr Gly Pro Thr Val Cys Glu Ser Pro Tyr Lys Cys Thr
        515                 520                 525
Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu
    530                 535
<210>  11
<211>  1248
<212>  DNA
<213>  幼嫩轮枝孢(Verticillium tenerum)
<220>
<221>  CDS
<222>  (1)..(1248)
<223>
<400>  11
atg aag aag gct ctc atc acc agc ctc tcc ctg ctg gcc acg gcc atg     48
Met Lys Lys Ala Leu Ile Thr Ser Leu Ser Leu Leu Ala Thr Ala Met
1               5                   10                  15
ggc cag cag gcc ggt acc ctc gag acc gag acg cat ccc aag ctg acc     96
Gly Gln Gln Ala Gly Thr Leu Glu Thr Glu Thr His Pro Lys Leu Thr
            20                  25                  30
tgg cag cgc tgc acc acc tcc ggc tgt acc aac gtc aac ggc gag gtc    144
Trp Gln Arg Cys Thr Thr Ser Gly Cys Thr Asn Val Asn Gly Glu Val
        35                  40                  45
gtc atc gac gcc aac tgg cgt tgg gcc cac gac atc aac ggc tac gag    192
Val Ile Asp Ala Asn Trp Arg Trp Ala His Asp Ile Asn Gly Tyr Glu
    50                  55                  60
aac tgc ttc gag ggc aac acc tgg acc ggc acc tgc agc ggc gcc gac    240
Asn Cys Phe Glu Gly Asn Thr Trp Thr Gly Thr Cys Ser Gly Ala Asp
65                  70                  75                  80
ggc tgc gcg aag aac tgc gcc gtc gag gga gcc aac tac cag tcg acc    288
Gly Cys Ala Lys Asn Cys Ala Val Glu Gly Ala Asn Tyr Gln Ser Thr
                85                  90                  95
tac ggt gtc tcg acc agc ggc aac gcc ctc tcc ctg cgc ttc gtc acc    336
Tyr Gly Val Ser Thr Ser Gly Asn Ala Leu Ser Leu Arg Phe Val Thr
            100                 105                 110
gag cac gag cac ggc gtc aac acc ggt tcg cgc acg tac ctc atg gag    384
Glu His Glu His Gly Val Asn Thr Gly Ser Arg Thr Tyr Leu Met Glu
        115                 120                 125
agc gcc acc aag tac cag atg ttc acc ctg atg aac aac gag ctc gcc    432
Ser Ala Thr Lys Tyr Gln Met Phe Thr Leu Met Asn Asn Glu Leu Ala
    130                 135                 140
ttc gac gtc gac ctg tcc aag gtc gcc tgc ggc atg aac agc gcc ctc    480
Phe Asp Val Asp Leu Ser Lys Val Ala Cys Gly Met Asn Ser Ala Leu
145                 150                 155                 160
tac ctc gtc ccc atg aag gcc gac ggc ggt ctc tcg tcc gag acc aac    528
Tyr Leu Val Pro Met Lys Ala Asp Gly Gly Leu Ser Ser Glu Thr Asn
                165                 170                 175
aac aac gcc ggc gcc aag tac ggt acc ggt tac tgc gac gcc cag tgc    576
Asn Asn Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys
            180                 185                 190
gct cgc gat ctc aag ttc gtc aac ggc aag gcc aac atc gag ggc tgg    624
Ala Arg Asp Leu Lys Phe Val Asn Gly Lys Ala Asn Ile Glu Gly Trp
        195                 200                 205
caa gcc tcc aag acc gac gag aac tct ggc gtc ggt aac atg ggc tcc    672
Gln Ala Ser Lys Thr Asp Glu Asn Ser Gly Val Gly Asn Met Gly Ser
    210                 215                 220
tgc tgt gct gag att gac gtt tgg gag tcc aac cgc gag tct ttc gcc    720
Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Arg Glu Ser Phe Ala
225                 230                 235                 240
ttc acc cct cac gct tgc tcg cag aac gag tac cac gtc tgc acc ggc    768
Phe Thr Pro His Ala Cys Ser Gln Asn Glu Tyr His Val Cys Thr Gly
                245                 250                 255
gcc aac tgc ggc ggt acc tac tcg gac gac cgc ttc gcc ggc aag tgc    816
Ala Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe Ala Gly Lys Cys
            260                 265                 270
gat gcc aac ggt tgc gac tac aac ccc ttc cgc gtg ggc aac cag aac    864
Asp Ala Asn Gly Cys Asp Tyr Asn Pro Phe Arg Val Gly Asn Gln Asn
        275                 280                 285
ttc tac ggc ccc ggc atg acc gtc aac acc aac tcc aag ttc act gtc    912
Phe Tyr Gly Pro Gly Met Thr Val Asn Thr Asn Ser Lys Phe Thr Val
    290                 295                 300
atc tct cgc ttc cgg gag aac gag gcc tac cag gtc ttc atc cag aac    960
Ile Ser Arg Phe Arg Glu Asn Glu Ala Tyr Gln Val Phe Ile Gln Asn
305                 310                 315                 320
ggc cgc acc atc gag gtc ccc cgt ccc acc ctc tcc ggc atc acc cag   1008
Gly Arg Thr Ile Glu Val Pro Arg Pro Thr Leu Ser Gly Ile Thr Gln
                325                 330                 335
ttc gag gcc aag atc acc ccc gag ttc tgc tcg acc tac ccc acc gtc    1056
Phe Glu Ala Lys Ile Thr Pro Glu Phe Cys Ser Thr Tyr Pro Thr Val
            340                 345                 350
ttc ggc gac cgc gac cgc cac ggc gag atc ggc ggc cac acc gcc ctc    1104
Phe Gly Asp Arg Asp Arg His Gly Glu Ile Gly Gly His Thr Ala Leu
        355                 360                 365
aac gcg gcc ctc cgc atg ccc atg gtc ctc gtc atg tcc atc tgg gcc    1152
Asn Ala Ala Leu Arg Met Pro Met Val Leu Val Met Ser Ile Trp Ala
    370                 375                 380
gac cac tac gcc aac atg ctc tgg ctc gac tcc atc tac ccg cca gag    1200
Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ile Tyr Pro Pro Glu
385                 390                 395                 400
aag agg ggc cag ccc ggc gcc cac cgc ggc cgc aga tct aga ggg tga    1248
Lys Arg Gly Gln Pro Gly Ala His Arg Gly Arg Arg Ser Arg Gly
                405                 410                 415
<210>  12
<211>  415
<212>  PRT
<213>  幼嫩轮枝孢(Verticillium tenerum)
<400>  12
Met Lys Lys Ala Leu Ile Thr Ser Leu Ser Leu Leu Ala Thr Ala Met
1               5                   10                  15
Gly Gln Gln Ala Gly Thr Leu Glu Thr Glu Thr His Pro Lys Leu Thr
            20                  25                  30
Trp Gln Arg Cys Thr Thr Ser Gly Cys Thr Asn Val Asn Gly Glu Val
        35                  40                  45
Val Ile Asp Ala Asn Trp Arg Trp Ala His Asp Ile Asn Gly Tyr Glu
    50                  55                  60
Asn Cys Phe Glu Gly Asn Thr Trp Thr Gly Thr Cys Ser Gly Ala Asp
65                  70                  75                  80
Gly Cys Ala Lys Asn Cys Ala Val Glu Gly Ala Asn Tyr Gln Ser Thr
                85                  90                  95
Tyr Gly Val Ser Thr Ser Gly Asn Ala Leu Ser Leu Arg Phe Val Thr
            100                 105                 110
Glu His Glu His Gly Val Asn Thr Gly Ser Arg Thr Tyr Leu Met Glu
        115                 120                 125
Ser Ala Thr Lys Tyr Gln Met Phe Thr Leu Met Asn Asn Glu Leu Ala
    130                 135                140
Phe Asp Val Asp Leu Ser Lys Val Ala Cys Gly Met Asn Ser Ala Leu
145                 150                 155                 160
Tyr Leu Val Pro Met Lys Ala Asp Gly Gly Leu Ser Ser Glu Thr Asn
                165                 170                 175
Asn Asn Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys
            180                 185                 190
Ala Arg Asp Leu Lys Phe Val Asn Gly Lys Ala Asn Ile Glu Gly Trp
        195                 200                 205
Gln Ala Ser Lys Thr Asp Glu Asn Ser Gly Val Gly Asn Met Gly Ser
    210                 215                 220
Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Arg Glu Ser Phe Ala
225                 230                 235                 240
Phe Thr Pro His Ala Cys Ser Gln Asn Glu Tyr His Val Cys Thr Gly
                245                 250                 255
Ala Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe Ala Gly Lys Cys
            260                 265                 270
Asp Ala Asn Gly Cys Asp Tyr Asn Pro Phe Arg Val Gly Asn Gln Asn
        275                 280                 285
Phe Tyr Gly Pro Gly Met Thr Val Asn Thr Asn Ser Lys Phe Thr Val
    290                 295                 300
Ile Ser Arg Phe Arg Glu Asn Glu Ala Tyr Gln Val Phe Ile Gln Asn
305                 310                 315                 320
Gly Arg Thr Ile Glu Val Pro Arg Pro Thr Leu Ser Gly Ile Thr Gln
                325                 330                 335
Phe Glu Ala Lys Ile Thr Pro Glu Phe Cys Ser Thr Tyr Pro Thr Val
            340                 345                 350
Phe Gly Asp Arg Asp Arg His Gly Glu Ile Gly Gly His Thr Ala Leu
        355                 360                 365
Asn Ala Ala Leu Arg Met Pro Met Val Leu Val Met Ser Ile Trp Ala
    370                 375                 380
Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ile Tyr Pro Pro Glu
385                 390                 395                 400
Lys Arg Gly Gln Pro Gly Ala His Arg Gly Arg Arg Ser Arg Gly
                405                 410                 415
<210>  13
<211>  1341
<212>  DNA
<213>  栗色新螱(Neotermes castaneus)
<220>
<22l>  CDS
<222>  (1)..(1341)
<223>
<400>  13
gca cga ggg ctc gct gct gca ttg ttc acc ttt gca tgt agc gtt ggt     48
Ala Arg Gly Leu Ala Ala Ala Leu Phe Thr Phe Ala Cys Ser Val Gly
1               5                   10                  15
atc ggc acc aaa acg gcc gag aac cac ccg aag ctg aac tgg cag aac     96
Ile Gly Thr Lys Thr Ala Glu Asn His Pro Lys Leu Asn Trp Gln Asn
            20                  25                  30
tgc gcc tcc aag ggc agc tgc tca caa gtg tcc ggc gaa gtg aca atg    144
Cys Ala Ser Lys Gly Ser Cys Ser Gln Val Ser Gly Glu Val Thr Met
        35                  40                  45
gac tcg aac tgg cgg tgg acc cac gat ggc aac ggc aag aac tgc tac    192
Asp Ser Asn Trp Arg Trp Thr His Asp Gly Asn Gly Lys Asn Cys Tyr
    50                  55                  60
gac ggc aac acc tgg atc tcc agc ctc tgc cca gac ggc aag acc tgc    240
Asp Gly Asn Thr Trp Ile Ser Ser Leu Cys Pro Asp Gly Lys Thr Cys
65                  70                  75                  80
tct gac aag tgc gtc ctc gat ggc gcc gaa tac caa gcg acc tac ggc    288
Ser Asp Lys Cys Val Leu Asp Gly Ala Glu Tyr Gln Ala Thr Tyr Gly
                85                  90                  95
atc acc tcg aac ggg acc gcg gtc acc ctc aag ttc gtc acc cac ggc    336
Ile Thr Ser Asn Gly Thr Ala Val Thr Leu Lys Phe Val Thr His Gly
            100                 105                 110
tcg tac tcg acg aac atc ggc tcc cgc ctg tat ctc ctc aag gac gaa    384
Ser Tyr Ser Thr Asn Ile Gly Ser Arg Leu Tyr Leu Leu Lys Asp Glu
        115                 120                 125
aac act tac tac atc ttc aag gtg aac aac aag gaa ttc aca ttc agc    432
Asn Thr Tyr Tyr Ile Phe Lys Val Asn Asn Lys Glu Phe Thr Phe Ser
    130                 135                 140
gtc gat gtg tcg aag ctc ccg tgc ggc ctg aac ggt gcc ctc tac ttc    480
Val Asp Val Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe
145                 150                 155                 160
gtc tcg atg gac gcc gac ggt ggc gca gga aag tat tca ggt gcg aag    528
Val Ser Met Asp Ala Asp Gly Gly Ala Gly Lys Tyr Ser Gly Ala Lys
                165                 170                 175
cca ggc gcg aag tac ggc ctc ggc tac tgc gat gcg caa tgc ccg agc    576
Pro Gly Ala Lys Tyr Gly Leu Gly Tyr Cys Asp Ala Gln Cys Pro Ser
            180                 185                 190
gat ctg aag ttc atc aac ggc gaa gcg aac agc gat ggc tgg aag ccc    624
Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ser Asp Gly Trp Lys Pro
        195                 200                 205
cag gcg aac gac aag aat gcg gga aac ggc aaa tac gga tcg tgc tgc    672
Gln Ala Asn Asp Lys Asn Ala Gly Asn Gly Lys Tyr Gly Ser Cys Cys
    210                 215                 220
tcg gaa atg gac gtt tgg gag gcg aac tcg cag gca aca gct tac act    720
Ser Glu Met Asp Val Trp Glu Ala Asn Ser Gln Ala Thr Ala Tyr Thr
 225                230                 235                 240
ccg cac gtc tgc aag acc acg ggc cag cag cgc tgc tcg ggc aca tcg     768
Pro His Val Cys Lys Thr Thr Gly Gln Gln Arg Cys Ser Gly Thr Ser
                245                 250                 255
gaa tgc ggc ggc cag gat ggc gca gcg cgt ttc cag gga ctg tgc gac     816
Glu Cys Gly Gly Gln Asp Gly Ala Ala Arg Phe Gln Gly Leu Cys Asp
            260                 265                 270
gag gac ggt tgc gac ttc aac agc tgg cgc cag ggc gac aag acg ttc     864
Glu Asp Gly Cys Asp Phe Asn Ser Trp Arg Gln Gly Asp Lys Thr Phe
        275                 280                 285
tac ggc ccg gga ttg act gtt gac acg aag tcg ccg ttc aca gtc gtc     912
Tyr Gly Pro Gly Leu Thr Val Asp Thr Lys Ser Pro Phe Thr Val Val
    290                 295                 300
aca caa ttc gtc gga agt ccg gtg aag gaa atc cgc agg aag tac gtc     960
Thr Gln Phe Val Gly Ser Pro Val Lys Glu Ile Arg Arg Lys Tyr Val
305                 310                 315                 320
cag aac gga aag gtg att gag aac tcg aag aac aag att tcg gga att    1008
Gln Asn Gly Lys Val Ile Glu Asn Ser Lys Asn Lys Ile Ser Gly Ile
                325                 330                 335
gac gag acg aac gca gtg agt gat act ttc tgc gat cag caa aag aag    1056
Asp Glu Thr Asn Ala Val Ser Asp Thr Phe Cys Asp Gln Gln Lys Lys
            340                 345                 350
gcc ttc ggt gat acg aac gat ttc aag aac aag ggc ggt ttc gct aag    1104
Ala Phe Gly Asp Thr Asn Asp Phe Lys Asn Lys Gly Gly Phe Ala Lys
        355                 360                 365
ttg ggt cag gtg ttc gag act ggt cag gtt ctc gtg ctg tcg ctg tgg    1152
Leu Gly Gln Val Phe Glu Thr Gly Gln Val Leu Val Leu Ser Leu Trp
    370                 375                 380
gat gac cac tcg gtt gca atg ctg tgg ttg gac tcg gcc tac cca acg    1200
Asp Asp His Ser Val Ala Met Leu Trp Leu Asp Ser Ala Tyr Pro Thr
385                 390                 395                 400
aac aag gat aag agc agc cca ggt gtt gac cgt ggg cct tgc ccg acg    1248
Asn Lys Asp Lys Ser Ser Pro Gly Val Asp Arg Gly Pro Cys Pro Thr
                405                 410                 415
act tcc ggg aag ccg gat gat gtt gaa agc caa tct ccc gat gca acc    1296
Thr Ser Gly Lys Pro Asp Asp Val Glu Ser Gln Ser Pro Asp Ala Thr
            420                 425                 430
gtc att tat ggc aac atc aag ttc ggt gca ctg gac tcc act tac        1341
Val Ile Tyr Gly Asn Ile Lys Phe Gly Ala Leu Asp Ser Thr Tyr
        435                 440                 445
<210>  14
<211>  447
<212>  PRT
<213>  栗色新螱(Neotermes castaneus)
<400>  14
Ala Arg Gly Leu Ala Ala Ala Leu Phe Thr Phe Ala Cys Ser Val Gly
1               5                   10                  15
Ile Gly Thr Lys Thr Ala Glu Asn His Pro Lys Leu Asn Trp Gln Asn
            20                  25                  30
Cys Ala Ser Lys Gly Ser Cys Ser Gln Val Ser Gly Glu Val Thr Met
        35                  40                  45
Asp Ser Asn Trp Arg Trp Thr His Asp Gly Asn Gly Lys Asn Cys Tyr
    50                  55                  60
Asp Gly Asn Thr Trp Ile Ser Ser Leu Cys Pro Asp Gly Lys Thr Cys
65                  70                  75                  80
Ser Asp Lys Cys Val Leu Asp Gly Ala Glu Tyr Gln Ala Thr Tyr Gly
                85                  90                  95
Ile Thr Ser Asn Gly Thr Ala Val Thr Leu Lys Phe Val Thr His Gly
            100                 105                 110
Ser Tyr Ser Thr Asn Ile Gly Ser Arg Leu Tyr Leu Leu Lys Asp Glu
        115                 120                 125
Asn Thr Tyr Tyr Ile Phe Lys Val Asn Asn Lys Glu Phe Thr Phe Ser
    130                 135                 140
Val Asp Val Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe
145                 150                 155                 160
Val Ser Met Asp Ala Asp Gly Gly Ala Gly Lys Tyr Ser Gly Ala Lys
                165                 170                 175
Pro Gly Ala Lys Tyr Gly Leu Gly Tyr Cys Asp Ala Gln Cys Pro Ser
            180                 185                 190
Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ser Asp Gly Trp Lys Pro
        195                 200                 205
Gln Ala Asn Asp Lys Asn Ala Gly Asn Gly Lys Tyr Gly Ser Cys Cys
    210                 215                 220
Ser Glu Met Asp Val Trp Glu Ala Asn Ser Gln Ala Thr Ala Tyr Thr
225                 230                 235                 240
Pro His Val Cys Lys Thr Thr Gly Gln Gln Arg Cys Ser Gly Thr Ser
                245                 250                 255
Glu Cys Gly Gly Gln Asp Gly Ala Ala Arg Phe Gln Gly Leu Cys Asp
            260                 265                 270
Glu Asp Gly Cys Asp Phe Asn Ser Trp Arg Gln Gly Asp Lys Thr Phe
        275                 280                 285
Tyr Gly Pro Gly Leu Thr Val Asp Thr Lys Ser Pro Phe Thr Val Val
    290                 295                 300
Thr Gln Phe Val Gly Ser Pro Val Lys Glu Ile Arg Arg Lys Tyr Val
305                 310                 315                 320
Gln Asn Gly Lys Val Ile Glu Asn Ser Lys Asn Lys Ile Ser Gly Ile
                325                 330                 335
Asp Glu Thr Asn Ala Val Ser Asp Thr Phe Cys Asp Gln Gln Lys Lys
            340                 345                 350
Ala Phe Gly Asp Thr Asn Asp Phe Lys Asn Lys Gly Gly Phe Ala Lys
        355                 360                 365
Leu Gly Gln Val Phe Glu Thr Gly Gln Val Leu Val Leu Ser Leu Trp
    370                 375                 380
Asp Asp His Ser Val Ala Met Leu Trp Leu Asp Ser Ala Tyr Pro Thr
385                 390                 395                400
Asn Lys Asp Lys Ser Ser Pro Gly Val Asp Arg Gly Pro Cys Pro Thr
                405                 410                 415
Thr Ser Gly Lys Pro Asp Asp Val Glu Ser Gln Ser Pro Asp Ala Thr
            420                 425                 430
Val Ile Tyr Gly Asn Ile Lys Phe Gly Ala Leu Asp Ser Thr Tyr
        435                 440                 445
<210>  15
<211>  1359
<212>  DNA
<213>  黑素白丝菌(Melanocarpus albomyces)
<220>
<221>  CDS
<222>  (1)..(1359)
<223>
<400>  15
atg atg atg aag cag tac ctc cag tac ctc gcg gcc gcg ctg ccg ctc     48
Met Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu
1               5                   10                  15
gtc ggc ctc gcc gcc ggc cag cgc gct ggt aac gag acg ccc gag agc     96
Val Gly Leu Ala Ala Gly Gln Arg Ala Gly Asn Glu Thr Pro Glu Ser
            20                  25                  30
cac ccc ccg ctc acc tgg cag agg tgc acg gcc ccg ggc aac tgc cag    144
His Pro Pro Leu Thr Trp Gln Arg Cys Thr Ala Pro Gly Asn Cys Gln
        35                  40                  45
acc gtg aac gcc gag gtc gta att gac gcc aac tgg cgc tgg ctg cac    192
Thr Val Asn Ala Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His
    50                  55                  60
gac gac aac atg cag aac tgc tac gac ggc aac cag tgg acc aac gcc    240
Asp Asp Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala
65                  70                  75                  80
tgc agc acc gcc acc gac tgc gct gag aag tgc atg atc gag ggt gcc    288
Cys Ser Thr Ala Thr Asp Cys Ala Glu Lys Cys Met Ile Glu Gly Ala
                85                  90                  95
ggc gac tac ctg ggc acc tac ggc gcc tcg acc agc ggc gac gcc ctg    336
Gly Asp Tyr Leu Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu
            100                 105                 110
acg ctc aag ttc gtc acg aag cac gag tac ggc acc aac gtc ggc tcg    384
Thr Leu Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Val Gly Ser
        115                 120                 125
cgc ttc tac ctc atg aac ggc ccg gac aag tac cag atg ttc gac ctc    432
Arg Phe Tyr Leu Met Asn Gly Pro Asp Lys Tyr Gln Met Phe Asp Leu
    130                 135                 140
ctg ggc aac gag ctt gcc ttt gac gtc gac ctc tcg acc gtc gag tgc    480
Leu Gly Asn Glu Leu Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys
145                 150                 155                 160
ggc atc aac agc gcc ctg tac ttc gtc gcc atg gag gag gac ggc ggc    528
Gly Ile Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly
                165                 170                 175
atg gcc agc tac ccg agc aac cag gcc ggc gcc cgg tac ggc act ggg    576
Met Ala Ser Tyr Pro Ser Asn Gln Ala Gly Ala Arg Tyr Gly Thr Gly
            180                 185                 190
tac tgc gat gcc caa tgc gct cgt gac ctc aag ttc gtt ggc ggc aag    624
Tyr Cys Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys
        195                 200                 205
gcc aac att gag ggc tgg aag ccg tcc acc aac gac ccc aac gct ggc    672
Ala Asn Ile Glu Gly Trp Lys Pro Ser Thr Asn Asp Pro Asn Ala Gly
    210                 215                 220
gtc ggc ccg tac ggc ggc tgc tgc gct gag atc gac gtc tgg gag tcg    720
Val Gly Pro Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser
225                 230                 235                 240
aac gcc tat gcc ttc gct ttc acg ccg cac gcg tgc acg acc aac gag    768
Asn Ala Tyr Ala Phe Ala Phe Thr Pro His Ala Cys Thr Thr Asn Glu
                245                 250                 255
tac cac gtc tgc gag acc acc aac tgc ggt ggc acc tac tcg gag gac    816
Tyr His Val Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp
            260                 265                 270
cgc ttc gcc ggc aag tgc gac gcc aac ggc tgc gac tac aac ccc tac    864
Arg Phe Ala Gly Lys Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr
        275                 280                 285
cgc atg ggc aac ccc gac ttc tac ggc aag ggc aag acg ctc gac acc    912
Arg Met Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr
    290                 295                 300
agc cgc aag ttc acc gtc gtc tcc cgc ttc gag gag aac aag ctc tcc    960
Ser Arg Lys Phe Thr Val Val Ser Arg Phe Glu Glu Asn Lys Leu Ser
305                 310                 315                 320
cag tac ttc atc cag gac ggc cgc aag atc gag atc ccg ccg ccg acg   1008
Gln Tyr Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr
                325                 330                 335
tgg gag ggc atg ccc aac agc agc gag atc acc ccc gag ctc tgc tcc   1056
Trp Glu Gly Met Pro Asn Ser Ser Glu Ile Thr Pro Glu Leu Cys Ser
            340                 345                 350
acc atg ttc gat gtg ttc aac gac cgc aac cgc ttc gag gag gtc ggc   1104
Thr Met Phe Asp Val Phe Asn Asp Arg Asn Arg Phe Glu Glu Val Gly
        355                 360                 365
ggc ttc gag cag ctg aac aac gcc ctc cgg gtt ccc atg gtc ctc gtc   1152
Gly Phe Glu Gln Leu Asn Asn Ala Leu Arg Val Pro Met Val Leu Val
    370                 375                 380
atg tcc atc tgg gac gac cac tac gcc aac atg ctc tgg ctc gac tcc    1200
Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser
385                 390                 395                 400
atc tac ccg ccc gag aag gag ggc cag ccc ggc gcc gcc cgt ggc gac    1248
Ile Tyr Pro Pro Glu Lys Glu Gly Gln Pro Gly Ala Ala Arg Gly Asp
                405                 410                 415
tgc ccc acg gac tcg ggt gtc ccc gcc gag gtc gag gct cag ttc ccc    1296
Cys Pro Thr Asp Ser Gly Val Pro Ala Glu Val Glu Ala Gln Phe Pro
            420                 425                 430
gac gcc cag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg    1344
Asp Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser
        435                 440                 445
acc tac gac ttc taa                                                1359
Thr Tyr Asp Phe
    450
<210>  16
<211>  452
<212>  PRT
<213>  黑素白丝菌(Melanocarpus albomyces)
<400>  16
Met Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu
1               5                   10                  15
Val Gly Leu Ala Ala Gly Gln Arg Ala Gly Asn Glu Thr Pro Glu Ser
            20                  25                  30
His Pro Pro Leu Thr Trp Gln Arg Cys Thr Ala Pro Gly Asn Cys Gln
        35                  40                  45
Thr Val Asn Ala Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His
    50                  55                  60
Asp Asp Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala
65                  70                  75                  80
Cys Ser Thr Ala Thr Asp Cys Ala Glu Lys Cys Met Ile Glu Gly Ala
                85                  90                  95
Gly Asp Tyr Leu Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu
            100                 105                 110
Thr Leu Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Val Gly Ser
        115                 120                 125
Arg Phe Tyr Leu Met Asn Gly Pro Asp Lys Tyr Gln Met Phe Asp Leu
    130                 135                 140
Leu Gly Asn Glu Leu Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys
145                 150                 155                 160
Gly Ile Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly
                165                 170                 175
Met Ala Ser Tyr Pro Ser Asn Gln Ala Gly Ala Arg Tyr Gly Thr Gly
            180                 185                 190
Tyr Cys Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys
        195                 200                 205
Ala Asn Ile Glu Gly Trp Lys Pro Ser Thr Asn Asp Pro Asn Ala Gly
    210                 215                 220
Val Gly Pro Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser
225                 230                 235                 240
Asn Ala Tyr Ala Phe Ala Phe Thr Pro His Ala Cys Thr Thr Asn Glu
                245                 250                 255
Tyr His Val Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp
            260                 265                 270
Arg Phe Ala Gly Lys Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr
        275                 280                 285
Arg Met Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr
    290                 295                 300
Ser Arg Lys Phe Thr Val Val Ser Arg Phe Glu Glu Asn Lys Leu Ser
305                 310                 315                 320
Gln Tyr Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr
                325                 330                 335
Trp Glu Gly Met Pro Asn Ser Ser Glu Ile Thr Pro Glu Leu Cys Ser
            340                 345                 350
Thr Met Phe Asp Val Phe Asn Asp Arg Asn Arg Phe Glu Glu Val Gly
        355                 360                 365
Gly Phe Glu Gln Leu Asn Asn Ala Leu Arg Val Pro Met Val Leu Val
    370                 375                 380
Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser
385                 390                 395                 400
Ile Tyr Pro Pro Glu Lys Glu Gly Gln Pro Gly Ala Ala Arg Gly Asp
                405                 410                 415
Cys Pro Thr Asp Ser Gly Val Pro Ala Glu Val Glu Ala Gln Phe Pro
            420                 425                 430
Asp Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser
        435                 440                 445
Thr Tyr Asp Phe
    450
<210>  17
<211>  221
<212>  DNA
<213>  玫瑰单瑞孢(Trichothecium roseum)
<220>
<221>  misc_feature
<222>  (1)..(221)
<223>  部分CBH1编码序列
<400>  17
tacgcccagt gcgcccgtga cctcaagttc ctcggcggca cttccaacta cgacggctgg     60
aagccctcgg acactgacga cagcgccggt gtcggcaacc gcggatcctg ctgcgccgag    120
attgacatct gggagtccaa ctcgcacgcc ttcgccttca ccccccacgc ctgcgagaac    180
aacgagtacc acatctgcga gaccaccgac tgcggcggca c                        221
<210>  18
<211>  239
<212>  DNA
<213>  Humicola nigrescens
<220>
<221>  misc_feature
<222>  (1)..(239)
<223>  部分CBH1编码序列
<400>  18
tacggcacgg ggtactgcga cgcccaatgc gcccgcgatc tcaagttcgt tggcggcaag     60
gccaatgttg agggctggaa acagtccacc aacgatgcca atgccggcgt gggtccgatg    120
ggcggttgct gcgccgaaat tgacgtctgg gaatcgaacg cccatgcctt cgccttcacg    180
ccgcacgcgt gcgagaacaa caagtaccac atctgcgaga ctgacggatg cggcggcac     239
<210>  19
<211>  199
<212>  DNA
<213>  Cladorrhinum foecundissimum
<220>
<221>  misc_feature
<222>  (1)..(199)
<223>  部分CBH1编码序列
<400>  19
tacataaacg gtatcggcaa cgttgagggt tggtcctcct ctaccaacga tcccaacgct     60
ggtgtcggta accrcggtac ttgctgctcc gagaatggat atctgggagg ccaacaagat    120
ctcgaccgcc tacactcccc acccctgcac caccatcgac cagcacatgt gcgagggcaa    180
ctcgtgcggc ggaacctac                                                 199
<210>  20
<211>  191
<212>  DNA
<213>  棉色二孢(Diplodia gossypina)
<220>
<221>  misc_feature
<222>  (1)..(191)
<223>  部分CBH1编码序列
<400>  20
gttgatccga cggcaaggcc caacgtcgag ggctgggtcc cgtccgagaa cgactccaac     60
gctggtgtcg gcaaccttgg ctcttgctgt gctgagatgg atatctggga ggccaactcc    120
atctcgaccg cctacacccc ccacagctgc aagacggtcg cccagcactc ttgcactggc    180
gacgactgcg g                                                         191
<210>  21
<211>  232
<212>  DNA
<213>  嗜热毁丝酶(Myceliophthora thermophila)
<220>
<221>  misc_feature
<222>  (1)..(232)
<223>  部分CBH1编码序列
<400>  21
gggtactgcg acgcccaatg cgcacgcgac ctcaagttcg tcggcggcaa gggcaacatc     60
gagggctgga agccgtccac caacgatgcc aatgccggtg tcggtcctta tggcgggtgc    120
tgcgctgaga tcgacgtctg ggagtcgaac aagtatgctt tcgctttcac cccgcacggt    180
tgcgagaacc ctaaatacca cgtctgcgag accaccaact gcggcggcac ct            232
<210>  22
<211>  467
<212>  DNA
<213>  微小根毛霉(Rhizomucor pusillus)
<220>
<221>  misc_feature
<222>  (1)..(467)
<223>  部分CBH1编码序列
<400>  22
tccttcgcct ttacccccca cgcttgctcg cagnaacgag taccacgtct gcaccaccaa     60
caactgcggc ggcacctact cggacgaccg cttcgccggc aagtgcgacg ccaacggttg    120
cgactacaac ccgttccgcc tgggcaacca ggacttctac ggcccgggca tgaccgtcga    180
caccaactcc aagttcaccg tcatctcccg cttcagggag aacgaggcct accaggtctt    240
catgcagggc ggccggacca tcgaggtccc ggccccgcag ctgtccgggc tcacccagtt    300
cgacgccaag atcacccccg agttctgcga cacctacccg accgtcttcg acgaccgcaa    360
ccgccacggc gagatcggcg gccacaccgc cctcaacgcc gccctgcgca tgcccatggt    420
cctcgtcatg tccatctggg ctgaccacta cgccagctgc tagtgtc                  467
<210>  23
<211>  534
<212>  DNA
<213>  Meripilus giganteus
<220>
<221>  misc_feature
<222>  (1)..(534)
<223>  部分CBH1编码序列
<400>  23
gggagggctc cccgaacgac ccgaacgcgg gaagcggcca gtacggaacg tgctgcaacg     60
agatggacat ctgggaggcg aaccagaacg gcgcggcggt cacgccgcac gtctgctccg    120
tcgacggcca gacgcgctgc gagggcacgg actgcggcga cggcgacgag cggtacgacg    180
gcatctgcga caaggacggc tgcgacttca actcgtaccg catgggcgac cagtccttcc    240
tcggcctcgg caagaccgtc gacacctcga agaagttcac cgtcgtcacc cagttcctca    300
ccgcggacaa cacgacgtcc ggccagctca cggagatccg ccggctgtac gtgcaggacg    360
gcaaggtcat cgcgaactcg aagacgaaca tccccggcct cgactcgttc gactccatca    420
ccgacgactt ctgcaacgcg cagaaggagg tcttcggcga caccaactcg ttcgagaagc    480
tcggcggcct cgcggagatg ggcaaggcct tccagaaggg catggtcctc gtca          534
<210>  24
<211>  563
<212>  DNA
<213>  黑耳(Exidia glandulosa)
<220>
<221>  misc_feature
<222>  (1)..(563)
<223>  部分CBH1编码序列
<400>  24
gccacgtcga gggctggact ccttcmccaa cgatgccaac gccggcattg gcacccacgg     60
ctcctgctgt tcggagatgg acatctggga ggctaacaat gttgccgctg cgtacacccc    120
ccatccttgc acaactatcg gccagtcgat ctgctcgggc gattcttgcg gaggaaccta    180
cagctctgac cgttacgccg gtgtctgcga tccagacggt tgcgatttca acagctaccg    240
catgggcgac acgggcttct acggcaaggg cctgacagtc gacacgagct ccaagttcac    300
cgtcgtcacc cagttcctca ccggctccga cggcaacctt tccgagatca agcgcttcta    360
cgtccagaac ggcaaggtca ttcccaactc gcagtccaag attgccggcg tcagcggcaa    420
ctccatcacc accgacttct gctccgccca gaagaccgcc ttcggcgaca ccaacgtctt    480
cgcgcaaaag ggaggtactc gccgggatgg gcgccgccct caaggccggc atggtcctcg    540
tcatgtccat ctgggacgac cac                                            563
<210>  25
<211>  218
<212>  DNA
<213>  块团炭角菌(Xylaria hypoxylon)
<220>
<221>  misc_feature
<222>  (1)..(218)
<223>  部分CBH1编码序列
<400>  25
gacgctcagt gtgcccgtga cttgaagttc gtcggtggca agggcaacgt tgagggatgg     60
gagccatcca ccaacgacga caacgccggt gttggccctt acggwgcctg ctgtgccgaa    120
atsgatgtst gggagtccaa ctstcactct ttcgctttca cccctcaccc wtgcaccacc    180
aacgaatacc acgtctgtga gcaggacgag tgtggcgg                            218
<210>  26
<211>  492
<212>  DNA
<213>  支顶孢菌(Acremonium sp.)
<220>
<221>  misc_feature
<222>  (1)..(492)
<223>  部分CBH1编码序列
<400>  26
gggacggggt actgcgacgc ccaatgcgcc cgtgatctca agttcgtcgg cggcaaggcc     60
aacattgagg gctggaggcc gtccaccaac gacgcgaacg ccggcgtcgg cccgatgggc    120
ggctgctgcg cggaaatcga tgtctgggag tccaacgccc acgcttttgc cttcacgccg    180
cacgcgtgcg agaacaacaa ctaccacatc tgcgagacct ccaactgcgg cggtacctac    240
tccgacgacc gcttcgccgg cctctgcgac gccaacggct gcgactacaa cccgtaccgc    300
atgggcaacc ccgacttcta cggcaagggc aagactcttg acacctcgcg gaagttcacc    360
gtcgtcaccc gctttcagga gaacgacctc tcgcagtact tcgtccagga cggcccgaag    420
atcgagatcc cgcccccgac ctgggacggc ctcccgaaga gcagcacata cgccgagctg    480
tgcgcgaccc ag                                                        492
<210>  27
<211>  481
<212>  DNA
<213>  支顶孢菌(Acremonium sp.)
<220>
<221>  misc_feature
<222>  (1)..(481)
<223>  部分CBH1编码序列
<400>  27
ggctccgttt actcctaccc ttgcacggaa atcggccaga gccgctgcga gggcgacagc     60
tgcggcggta cctacagcac cgaccgctac gctggcgtct gcgaccccga tggatgcgac    120
ttcaactcgt accgccaggg caacaagacc ttctatggca agggcatgac cgtcgacacc    180
accaagaaga ttaccgtcgt cacccagttc ctcaccgact cgtccggcaa cctgtccgag    240
atcaagcgct tctacgccca gaacggcgtc gtcatcccca actccgagtc caccattgct    300
ggcgtccctg gcaactcgat cacccaggac tactgcgaca agcagaagac cgcctttggt    360
gacaacaacg acttcgacaa gaagggtggt ctcgcccaga tgggtaaggc cctggcccaa    420
cccatggtcc tcgtcatgtc cgtctgggat gaccatgccg tcaacatgct ctgcttcgaa    480
a                                                                    481
<210>  28
<211>  463
<212>  DNA
<213>  毛壳霉(Chaetomium sp.)
<220>
<221>  misc_feature
<222>  (1)..(463)
<223>  部分CBH1编码序列
<400>  28
ctccccgtct tcacgccgca cgcgtgcaag aacatcaagt accacgtctg cgagacgtcg     60
ggatgcggcg gcacctactc ggaggaccgc ttcgcgggcg actgcgacgc caacggttgc    120
gactacaacc cctaccgcat gggcaacacc gacttctacg gcaagggcat gacggtcgac    180
accagcaaga agttcaccgt cgtgacccaa ttccaggaga acaagctcac ccagttcttc    240
gtccagaacg gcaagaagat cgagatccct ggccccaagt gggacggcat tgagggcgac    300
agcgccgcca tcacgcccca gctgtgcact tccatgttca aggccttcga cgaccgcgat    360
cgcttctcgg aggtcggcgg cttcacccag atcaaccagg ccctctcggt gcccatggtg    420
ctcgtcatgt ccatctggga cgaccactac gccaacatgc ttg                      463
<210>  29
<211>  513
<212>  DNA
<213>  Chaetomidium pingtungium
<220>
<221>  misc_feature
<222>  (1)..(513)
<223>  部分CBH1编码序列
<400>  29
gaagggtggc agccctcctc caacgatgcc aatgcgggta ccggcaacca cgggtcctgc     60
tgcgcggaga tggatatctg ggaggccaac agcatctcca cggccttcac cccccatccg    120
tgcgacacgc ccggccaggt gatgtgcacc ggtgatgcct gcggtggcac ctacagctcc    180
gaccgctacg gcggcacctg cgaccccgac ggatgtgatt tcaactcctt ccgccagggc    240
aacaagacct tctacggccc tggcatgacc gtcgacacca agagcaagtt taccgtcgtc    300
acccagttca tcaccgacga cggcacctcc agcggcaccc tcaaggagat caagcgcttc    360
tacgtgcaga acggcaaggt gatccccaac tcggagtcga cctggaccgg cgtcagcggc    420
aactccatca ccaccgagta ctgcaccgcc cagaagagcc tgttccagga ccagaacgtc    480
ttcgaaaagc acggtggcct cgagggcatg ggt                                 513
<210>  30
<211>  579
<212>  DNA
<213>  嗜热毁丝酶(Myceliophthora thermophila)
<220>
<221>  misc_feature
<222>  (1)..(579)
<223>  部分CBH1编码序列
<400>  30
gagatggata tttgggaggc caacaacatg gccgccgcct tcactcccca cccttgcacc     60
gtgatcggcc agtcgcgctg cgagggcgac tcgtgcggcg gtacctacag caccgaccgc    120
tatgccggca tctgcgaccc cgacggatgc gacttcaact cgtaccgcca gggcaacaag    180
accttctacg gcaagggcat gacggtcgac acgaccaaga agatcacggt cgtcacccag    240
ttcctcaaga actcggccgg cgagctctcc gagatcaagc ggttctacgt ccagaacggc    300
aaggtcatcc ccaactccga gtccaccatc ccgggcgtcg agggcaactc cattacccag    360
gactggtgcg accgccagaa ggccgctttc ggcgacgtga ccgactttca ggacaagggc    420
ggcatggtcc agatgggcaa ggccctcgcg ggcccaatgg tcctcgtcat gtccatctgg    480
gacgaccacg ccgtcaacat gctctggctc gaaatcacta gtgcggccgc tgcaggtcga    540
ccatatggga gagctccacg cgttggatgc atagcttga                           579
<210>  31
<211>  514
<212>  DNA
<213>  肉桂色毁丝霉(Myceliophthora hinnulea)
<220>
<221>  misc_feature
<222>  (1)..(514)
<223>  部分CBH1编码序列
<400>  31
cgtgagggct gggagagctc gaccaacgat gccaacgccg gcacgggcag gtacggcagc     60
tgctgctccg agatggacgt ctgggaggcc aacaacatgg ccaccgcctt caccccccat    120
ccttgcacca tcatcggcca gtcgcgctgc gagggcgaga cgtgcggcgg cacctacagc    180
tcggaccgct acgccggcgt ctgcgacccc gacggctgcg acttcaactc gtaccgccag    240
ggcaacaaga ccttctacgg caagggcatg acggtcgaca cgaccaagaa gctcacggtc    300
gtcacgcagt tcctcaagaa ctcggccggc gagctgtccg agatcaagcg gttctacgtc    360
caggacggca aggtgatccc caactccgag tccaccatcc ccggcgtcga gggcaactcg    420
atcacgcagg actggtgcga ccgccagaag gccgccttcg gcgacgtcac cgacttccag    480
gacaagggcg gcatggtcca gatggcaagg cgct                                514
<210>  32
<211>  477
<212>  DNA
<213>  Sporotrichum pruinosum
<220>
<221>  misc_feature
<222>  (1)..(477)
<223>  部分CBH1编码序列
<400>  32
cacccttgcc gcaccacgaa cgacggtggc taccaacgct gccaaggacg tgactgcaac     60
cagcctcgtt atgagggtct ttgcgatcct gacggttgcg actacaaccc tttccgtatg    120
ggtaaccgcg aattctacgg ccctggaaag accgtcgaca ccaacaggaa gttcactgtt    180
gtgacccaat tcattaccga caacaactct gacactggta ccctcgtcga catccgccgc    240
ctctacgtcc aagacggccg tgtcattgcc aaccctccca ccaacttccc cggtctcatg    300
cccgcccacg actccatcac ttagcaattc tgtgacgacg ccaagcgagc attcgaggac    360
aacgacagct ttggcaggaa cggtggtctt gctcacatgg gtcgctccct tgccaagggc    420
catgtcctcg ccctttccat ttggaatgat cacactgcca acatgctctg gctcgaa       477
<210>  33
<211>  500
<212>  DNA
<213>  Thielavia cf.microspora
<220>
<221>  misc_feature
<222>  (1)..(500)
<223>  部分CBH1编码序列
<400>  33
gagatagatg tctgggagtc caactcgcac tcgtttgcct tcacgccgca cgcgtgcaag     60
aacaacaagt accacgtctg ccagacgacc gggtgcggcg gcacctactc ggaggaccgc    120
ttcgccggcg actgcgacgc caacggctgc gactacaacc cctaccgcat gggcaacacc    180
gacttttacg gcaagggcaa gacggtcgac acgagcaaga agtttaccat ggtgacccag    240
ttccaaaaga acaagctcgt ccagttcttt gtccaggacg gcaagaagat cgacatcccc    300
ggccccaagt gggacggcct gccgcagggc agcgccgcca tcaccccgga gctgtgcacc    360
ttcatgttca aggccttcaa cgaccgcgac cgcttctcag aggttggcgg cttcgaccag    420
atcaacacgg ccctctcggt gccaatggtg ctcgtcatgt ccatctggga tgatcactac    480
gccaacatgc tctggcttga                                                500
<210>  34
<211>  470
<212>  DNA
<213>  小柱胞菌(Scytalidium sp.)
<220>
<221>  misc_feature
<222>  (1)..(470)
<223>  部分CBH1编码序列
<400>  34
cgttnggccc gcgtcgcatg ctcccgcccg catggcccgc gggatttcca gccagagcat     60
gttggagtgg tggtcatccc agatggacat gacaaggacc atgggaatgg tgagggcctc    120
gttcagagca tcgaagccac cggtctcggc gaagcggttg cggtcatcga agacgcggaa    180
ctgagcatcg cagagctcag gggtgatgtc ggcgctgttc gggaggccgg gccaggtcgg    240
agggggcacc tcgatcttgc ggccgtcctg gacgaagaac tgagagagcc tgttacgctc    300
gaagcgggag acaacggtga acttgcggtt ggtgtcgacg gtcttgccct tgccatagaa    360
gtccttgttg cccatgcggt aggggttgta gtcgcagccg ttggcatcgc agtagccggc    420
gaagcggtca tccgagtagg taccaccgca gttgttggtc tccagatgtg               470
<210>  35
<211>  491
<212>  DNA
<213>  小柱胞菌(Scytalidium sp.)
<220>
<221>  misc_feature
<222>  (1)..(491)
<223>  部分CBH1编码序列
<400>  35
gaaatcgacg tctgggagtc gaacgcctat gcctatgcct taccccgcac gcttgcggca     60
gccagaaccg ctaccacgtc tgcgagacca acaactgcgg tggtacctac tcggatgacc    120
gcttcgccgg ttactgcgat gccaacggct gcgactacaa cccgtaccgc atgggcaaca    180
gggacttcta cggcaagggc ctgcaggtcg acaccagccg gaagttcacc gtcgtgagcc    240
gcttcgagcg caacaagctc acccagttct tcgttcagga cggccgcaag atcgagcccc    300
ctgcgccgac ctgggacggc atcccgaaga gcgccgacat cacccccgag ttctgcagcg    360
cccagttcaa ggtcttcgac gaccgtgacc gcttcgcgga gactggcggc ttcgatgccc    420
tgaacgatgc tctcagcatt cccatggtcc ttgtcatgtc catctgggat taccactact    480
ccaacataat c                                                         491
<210>  36
<211>  221
<212>  DNA
<213>  囊状长毛盘菌(Trichophaea saccata)
<220>
<221>  misc_feature
<222>  (1)..(221)
<223>  部分CBH1编码序列
<400>  36
tgcgactccc agtgtccccg cgatctcaag ttcatcaatg gacagggcaa cgttgaaggc     60
tggaagccat cctcaaatga tgccaacgca ggcgtcgggg gacacggttc ctgctgcgca    120
gagatggatg tttgggaggc caattccatc tccgcggccg taacaccgca ctcgtgctcc    180
acaaccagcc agacgatgtg caacggcgac tcctgcggcg g                        221
<210>  37
<211>  1365
<212>  DNA
<213>  棉色二孢(Diplodia gossypina)
<220>
<221>  CDS
<222>  (1)..(1365)
<223>
<400>  37
atg ctt acc cag gca gtt ctc gct act ctc gcc acc ctg gcc gcc agc     48
Met Leu Thr Gln Ala Val Leu Ala Thr Leu Ala Thr Leu Ala Ala Ser
1               5                   10                  15
cag cag gtc ggc acc cag aag gag gag gtc cac ccc tcc atg acc tgg     96
Gln Gln Val Gly Thr Gln Lys Glu Glu Val His Pro Ser Met Thr Trp
            20                  25                  30
cag act tgc acc agc agc ggc tgc acc acc aac cag ggc tcc atc gtc    144
Gln Thr Cys Thr Ser Ser Gly Cys Thr Thr Asn Gln Gly Ser Ile Val
        35                  40                  45
gtt gac gcc aac tgg cgc tgg gtc cac aac acc gag ggc tac acc aac    192
Val Asp Ala Asn Trp Arg Trp Val His Asn Thr Glu Gly Tyr Thr Asn
    50                  55                  60
tgc tac acg ggc aac acc tgg aac gcc gac tac tgc acc gac aac acc    240
Cys Tyr Thr Gly Asn Thr Trp Asn Ala Asp Tyr Cys Thr Asp Asn Thr
65                  70                  75                  80
gag tgc gcc tcc aac tgc gcc ctc gac ggc gcc gac tac tct ggc acc    288
Glu Cys Ala Ser Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr
                85                  90                  95
tac ggc gct acc acc tcc ggc gac tcg ctg cgc ctg aac ttc atc acc    336
Tyr Gly Ala Thr Thr Ser Gly Asp Ser Leu Arg Leu Asn Phe Ile Thr
            100                 105                 110
aac ggc cag cag aag aac att ggc tcc cgc atg tac ctc atg cag gat    384
Asn Gly Gln Gln Lys Asn Ile Gly Ser Arg Met Tyr Leu Met Gln Asp
        115                 120                 125
gac gag acc tac gcc gtc cac aag ctc ctc aac aag gag ttc acc ttc    432
Asp Glu Thr Tyr Ala Val His Lys Leu Leu Asn Lys Glu Phe Thr Phe
    130                 135                 140
gac gtc gac acc tcc aag ctg cct tgc ggc ctc aac ggt gcc gtc tac    480
Asp Val Asp Thr Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Val Tyr
145                 150                 155                 160
ttc gtc tcc atg gac gct gac ggt ggc atg gcc aag ttc ccc gac aac    528
Phe Val Ser Met Asp Ala Asp Gly Gly Met Ala Lys Phe Pro Asp Asn
                165                 170                 175
aag gcc ggc gcc aag tac ggt acc ggt tac tgc gac tcg cag tgc ccc    576
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
            180                 185                 190
cgt gac ctc aag ttc atc gac ggc aag gcc aac gtc gag ggc tgg gtc    624
Arg Asp Leu Lys Phe Ile Asp Gly Lys Ala Asn Val Glu Gly Trp Val
        195                 200                 205
ccg tcc gag aac gac tcc aac gct ggt gtc ggc aac ctt ggc tct tgc    672
Pro Ser Glu Asn Asp Ser Asn Ala Gly Val Gly Asn Leu Gly Ser Cys
    210                 215                 220
tgt gct gag atg gat atc tgg gag gcc aac tcc atc tcg acc gcc tac    720
Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Tyr
225                 230                 235                 240
acc ccc cac agc tgc aag acg gtc gcc cag cac tct tgc act ggc gac    768
Thr Pro His Ser Cys Lys Thr Val Ala Gln His Ser Cys Thr Gly Asp
                245                 250                 255
gac tgc ggt ggc acc tac tcc gcg acc cgc tac gcc ggc gac tgc gac    816
Asp Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly Asp Cys Asp
            260                 265                 270
ccc gac gga tgc gac ttc aac tcg tac cgc cag ggc gtc aag gac ttc    864
Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Val Lys Asp Phe
        275                 280                 285
tac ggg ccc ggc atg acc gtc gac agc aac tcg gtc gtc acc gtc gtc    912
Tyr Gly Pro Gly Met Thr Val Asp Ser Asn Ser Val Val Thr Val Val
    290                 295                 300
acg cag ttc atc acc aac gac ggc acc gcg tcc ggc acc ctc tcc gag    960
Thr Gln Phe Ile Thr Asn Asp Gly Thr Ala Ser Gly Thr Leu Ser Glu
305                 310                 315                 320
atc aag cgc ttc tac gtc cag aac ggc aag gtt atc ccc aac tcc gag   1008
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu
                325                 330                 335
tcc acc atc gcc ggc gtc agc ggc aac agc atc acc tcc gcg tac tgc   1056
Ser Thr Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Ser Ala Tyr Cys
            340                 345                 350
gac gcg cag aag gag gtc ttc ggc gac aac acg tcg ttc cag gac cag   1104
Asp Ala Gln Lys Glu Val Phe Gly Asp Asn Thr Ser Phe Gln Asp Gln
        355                 360                 365
ggc ggc ttg gcc agc atg agc cag gcc ctc aac gcc ggc atg gtc ctc   1152
Gly Gly Leu Ala Ser Met Ser Gln Ala Leu Asn Ala Gly Met Val Leu
    370                 375                 380
gtc atg tcc atc tgg gac gac cac cac agc aac atg ctc tgg ctc gac   1200
Val Met Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp
385                 390                 395                 400
tcc gac tac ccc gtc gac gcc gac ccg agc cag ccc ggc atc tcc cgc   1248
Ser Asp Tyr Pro Val Asp Ala Asp Pro Ser Gln Pro Gly Ile Ser Arg
                405                 410                 415
ggt act tgc ccc acc acc tct ggt gtc ccc agc gag gtt gag gag agc   1296
Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ser Glu Val Glu Glu Ser
            420                 425                 430
gcc gct agc gcc tac gtc gtc tac tcg aac att aag gtt ggt gac ctt   1344
Ala Ala Ser Ala Tyr Val Val Tyr Ser Asn Ile Lys Val Gly Asp Leu
        435                 440                 445
aac agc act ttc tct gct tag                                       1365
Asn Ser Thr Phe Ser Ala
    450
<210>  38
<211>  454
<212>  PRT
<213>  棉色二孢(Diplodia gossypina)
<400>  38
Met Leu Thr Gln Ala Val Leu Ala Thr Leu Ala Thr Leu Ala Ala Ser
1               5                   10                  15
Gln Gln Val Gly Thr Gln Lys Glu Glu Val His Pro Ser Met Thr Trp
            20                  25                  30
Gln Thr Cys Thr Ser Ser Gly Cys Thr Thr Asn Gln Gly Ser Ile Val
        35                  40                  45
Val Asp Ala Asn Trp Arg Trp Val His Asn Thr Glu Gly Tyr Thr Asn
    50                  55                  60
Cys Tyr Thr Gly Asn Thr Trp Asn Ala Asp Tyr Cys Thr Asp Asn Thr
65                  70                  75                  80
Glu Cys Ala Ser Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr
                85                  90                  95
Tyr Gly Ala Thr Thr Ser Gly Asp Ser Leu Arg Leu Asn Phe Ile Thr
            100                 105                 110
Asn Gly Gln Gln Lys Asn Ile Gly Ser Arg Met Tyr Leu Met Gln Asp
        115                 120                 125
Asp Glu Thr Tyr Ala Val His Lys Leu Leu Asn Lys Glu Phe Thr Phe
    130                 135                 140
Asp Val Asp Thr Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Val Tyr
145                 150                 155                 160
Phe Val Ser Met Asp Ala Asp Gly Gly Met Ala Lys Phe Pro Asp Asn
                165                 170                 175
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
            180                 185                 190
Arg Asp Leu Lys Phe Ile Asp Gly Lys Ala Asn Val Glu Gly Trp Val
        195                 200                205
Pro Ser Glu Asn Asp Ser Asn Ala Gly Val Gly Asn Leu Gly Ser Cys
    210                 215                 220
Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Tyr
225                 230                 235                 240
Thr Pro His Ser Cys Lys Thr Val Ala Gln His Ser Cys Thr Gly Asp
                245                 250                 255
Asp Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly Asp Cys Asp
            260                 265                 270
Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Val Lys Asp Phe
        275                 280                 285
Tyr Gly Pro Gly Met Thr Val Asp Ser Asn Ser Val Val Thr Val Val
    290                 295                 300
Thr Gln Phe Ile Thr Asn Asp Gly Thr Ala Ser Gly Thr Leu Ser Glu
305                 310                 315                 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu
                325                 330                 335
Ser Thr Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Ser Ala Tyr Cys
            340                 345                 350
Asp Ala Gln Lys Glu Val Phe Gly Asp Asn Thr Ser Phe Gln Asp Gln
        355                 360                 365
Gly Gly Leu Ala Ser Met Ser Gln Ala Leu Asn Ala Gly Met Val Leu
    370                 375                 380
Val Met Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp
385                 390                 395                 400
Ser Asp Tyr Pro Val Asp Ala Asp Pro Ser Gln Pro Gly Ile Ser Arg
                405                 410                 415
Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ser Glu Val Glu Glu Ser
            420                 425                 430
Ala Ala Ser Ala Tyr Val Val Tyr Ser Asn Ile Lys Val Gly Asp Leu
        435                 440                 445
Asn Ser Thr Phe Ser Ala
    450
<210>  39
<211>  1377
<212>  DNA
<213>  囊状长毛盘菌(Trichophaea saccata)
<220>
<221>  CDS
<222>  (1)..(1377)
<223>
<400>  39
atg caa cgc ctt ctc gtt ctt ctc acc tcc ctt ctc gct ttc acc tat     48
Met Gln Arg Leu Leu Val Leu Leu Thr Ser Leu Leu Ala Phe Thr Tyr
1               5                   10                  15
ggc caa caa gtt ggc act caa cag gcc gaa gtc cac ccc tcg atg acc     96
Gly Gln Gln Val Gly Thr Gln Gln Ala Glu Val His Pro Ser Met Thr
            20                  25                  30
tgg cag cag tgt aca aag tcc ggc ggc tgc acc acg aag aac ggc aaa    144
Trp Gln Gln Cys Thr Lys Ser Gly Gly Cys Thr Thr Lys Asn Gly Lys
        35                  40                  45
gtc gtg atc gat gcc aac tgg cgt tgg gta cac aat gtc ggc ggc tac    192
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly Tyr
    50                  55                  60
acc aat tgc tac act ggc aac acc tgg gac agt tcg ctt tgt ccc gac    240
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Ser Ser Leu Cys Pro Asp
65                  70                  75                  80
gat gtc acc tgc gcg aag aat tgc gct ctt gat ggc gcg gac tac tct    288
Asp Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
                85                  90                  95
ggc act tat gga gtt act gcg ggc ggg aat tcg ttg aag ctc acc ttc    336
Gly Thr Tyr Gly Val Thr Ala Gly Gly Asn Ser Leu Lys Leu Thr Phe
            100                 105                 110
gtc act aag ggt caa tac tct act aat gtg ggc tcg cga ttg tat atg    384
Val Thr Lys Gly Gln Tyr Ser Thr Asn Val Gly Ser Arg Leu Tyr Met
        115                 120                 125
ctc gcc gac gac agc aca tac cag atg tat aat ctg ctg aac cag gag    432
Leu Ala Asp Asp Ser Thr Tyr Gln Met Tyr Asn Leu Leu Asn Gln Glu
    130                 135                 140
ttt acg ttc gac gtt gat gtt tct aat ctt cct tgt ggg ctt aac ggg    480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly
145                 150                 155                 160
gct ctg tat ttc gtc tcg atg gat aag gat ggt ggg atg tcg aag tac    528
Ala Leu Tyr Phe Val Ser Met Asp Lys Asp Gly Gly Met Ser Lys Tyr
                165                 170                 175
tct ggg aac aag gct ggt gcc aag tat gga act ggg tac tgc gac tcc    576
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
cag tgt ccc cgc gat ctc aag ttc atc aat gga cag ggc aac gtt gaa    624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Gly Asn Val Glu
        195                 200                 205
ggc tgg aag cca tcc tca aat gat gcc aac gca ggc gtc ggg gga cac    672
Gly Trp Lys Pro Ser Ser Asn Asp Ala Asn Ala Gly Val Gly Gly His
    210                 215                 220
ggt tcc tgc tgc gca gag atg gat gtt tgg gag gcc aat tcc atc tcc    720
Gly Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225                 230                 235                 240
gcg gcc gta aca ccg cac tcg tgc tcc aca acc agc cag acg atg tgc    768
Ala Ala Val Thr Pro His Ser Cys Ser Thr Thr Ser Gln Thr Met Cys
                245                 250                 255
aac ggc gac tcc tgc ggc ggt acc tac tca gcc aca cga tac gct ggt    816
Asn Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly
            260                 265                 270
gtc tgc gat ccc gat ggc tgc gac ttc aac tcc tac cgt atg ggc gac    864
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
        275                 280                 285
acg acc ttc tac ggc aag gga aag acg gtc gat acc agc tcc aag ttc    912
Thr Thr Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Ser Ser Lys Phe
    290                 295                 300
acg gtc gtg acc cag ttc atc acc gac act gga acc gcc tcc ggc tcg     960
Thr Val Val Thr Gln Phe Ile Thr Asp Thr Gly Thr Ala Ser Gly Ser
305                 310                 315                 320
ctc acg gag atc cgc cgc ttc tac gtc cag aac gga aag ttg atc ccc    1008
Leu Thr Glu Ile Arg Arg Phe Tyr Val Gln Asn Gly Lys Leu Ile Pro
                325                 330                 335
aac tcc cag tcg aag atc tcg ggc gtc act ggc aac tcc atc acc tct    1056
Asn Ser Gln Ser Lys Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Ser
            340                 345                 350
gct ttc tgc gac gct cag aag gcg gct ttc ggc gat aac tac acg ttc    1104
Ala Phe Cys Asp Ala Gln Lys Ala Ala Phe Gly Asp Asn Tyr Thr Phe
        355                 360                 365
aag gac aag ggc ggc ttc gca tcc atg act act gct atg aag aac gga    1152
Lys Asp Lys Gly Gly Phe Ala Ser Met Thr Thr Ala Met Lys Asn Gly
    370                 375                 380
atg gtc ctg gtt atg agt ctt tgg gat gac cac tac gcc aat atg ctc    1200
Met Val Leu Val Met Ser Leu Trp Asp Asp His Tyr Ala Asn Met Leu
385                 390                 395                 400
tgg ctt gat agc gac tat ccc act aac gcg gac tcc tcc aag ccg ggt    1248
Trp Leu Asp Ser Asp Tyr Pro Thr Asn Ala Asp Ser Ser Lys Pro Gly
                405                 410                 415
gtt gct cgt ggc acc tgc ccg act tct tcc ggc gtg ccc tcg gat gtc    1296
Val Ala Arg Gly Thr Cys Pro Thr Ser Ser Gly Val Pro Ser Asp Val
            420                 425                 430
gag act aac aat gca agc gct tcg gtc acg tac tcc aac att aga ttt    1344
Glu Thr Asn Asn Ala Ser Ala Ser Val Thr Tyr Ser Asn Ile Arg Phe
        435                 440                 445
gga gat ctc aat tcc act tac acc gcc cag taa                        1377
Gly Asp Leu Asn Ser Thr Tyr Thr Ala Gln
    450                 455
<210>  40
<211>  458
<212>  PRT
<213>  囊状长毛盘菌(Trichophaea saccata)
<400>  40
Met Gln Arg Leu Leu Val Leu Leu Thr Ser Leu Leu Ala Phe Thr Tyr
1               5                   10                  15
Gly Gln Gln Val Gly Thr Gln Gln Ala Glu Val His Pro Ser Met Thr
            20                  25                  30
Trp Gln Gln Cys Thr Lys Ser Gly Gly Cys Thr Thr Lys Asn Gly Lys
        35                  40                  45
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly Tyr
    50                  55                  60
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Ser Ser Leu Cys Pro Asp
65                  70                  75                  80
Asp Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
                85                  90                  95
Gly Thr Tyr Gly Val Thr Ala Gly Gly Asn Ser Leu Lys Leu Thr Phe
            100                 105                 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Val Gly Ser Arg Leu Tyr Met
        115                 120                 125
Leu Ala Asp Asp Ser Thr Tyr Gln Met Tyr Asn Leu Leu Asn Gln Glu
    130                 135                 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly
145                 150                 155                 160
Ala Leu Tyr Phe Val Ser Met Asp Lys Asp Gly Gly Met Ser Lys Tyr
                165                 170                 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Gly Asn Val Glu
        195                 200                 205
Gly Trp Lys Pro Ser Ser Asn Asp Ala Asn Ala Gly Val Gly Gly His
    210                 215                 220
Gly Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225                 230                 235                 240
Ala Ala Val Thr Pro His Ser Cys Ser Thr Thr Ser Gln Thr Met Cys
                245                 250                 255
Asn Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly
            260                 265                 270
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
        275                 280                 285
Thr Thr Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Ser Ser Lys Phe
    290                 295                 300
Thr Val Val Thr Gln Phe Ile Thr Asp Thr Gly Thr Ala Ser Gly Ser
305                 310                 315                 320
Leu Thr Glu Ile Arg Arg Phe Tyr Val Gln Asn Gly Lys Leu Ile Pro
                325                 330                 335
Asn Ser Gln Ser Lys Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Ser
            340                 345                 350
Ala Phe Cys Asp Ala Gln Lys Ala Ala Phe Gly Asp Asn Tyr Thr Phe
        355                 360                 365
Lys Asp Lys Gly Gly Phe Ala Ser Met Thr Thr Ala Met Lys Asn Gly
    370                 375                 380
Met Val Leu Val Met Ser Leu Trp Asp Asp His Tyr Ala Asn Met Leu
385                 390                 395                 400
Trp Leu Asp Ser Asp Tyr Pro Thr Asn Ala Asp Ser Ser Lys Pro Gly
                405                 410                 415
Val Ala Arg Gly Thr Cys Pro Thr Ser Ser Gly Val Pro Ser Asp Val
            420                 425                 430
Glu Thr Asn Asn Ala Ser Ala Ser Val Thr Tyr Ser Asn Ile Arg Phe
        435                 440                 445
Gly Asp Leu Asn Ser Thr Tyr Thr Ala Gln
    450                 455
<210>  41
<211>  1353
<212>  DNA
<213>  嗜热毁丝酶(Myceliophthora thermophila)
<220>
<221>  CDS
<222>  (1)..(1353)
<223>
<400>  41
atg aag cag tac ctc cag tac ctc gcg gcg acc ctg ccc ctg gtg ggc     48
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
1               5                   10                  15
ctg gcc acg gcc cag cag gcg ggt aac ctg cag acc gag act cac ccc     96
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
            20                  25                  30
agg ctc act tgg tcc aag tgc acg gcc ccg gga tcc tgc caa cag gtc    144
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
        35                  40                  45
aac ggc gag gtc gtc atc gac tcc aac tgg cgc tgg gtg cac gac gag    192
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
    50                  55                  60
aac gcg cag aac tgc tac gac ggc aac cag tgg acc aac gct tgc agc    240
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
65                  70                  75                  80
tct gcc acc gac tgc gcc gag aat tgc gcg ctc gag ggt gcc gac tac    288
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
                85                  90                  95
cag ggc acc tat ggc gcc tcg acc agc ggc aat gcc ctg acg ctc acc    336
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
            100                 105                 110
ttc gtc act aag cac gag tac ggc acc aac att ggc tcg cgc ctc tac    384
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
        115                 120                 125
ctc atg aac ggc gcg aac aag tac cag atg ttc acc ctc aag ggc aac    432
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
    130                 135                 140
gag ctg gcc ttc gac gtc gac ctc tcg gcc gtc gag tgc ggc ctc aac    480
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
145                 150                 155                 160
agc gcc ctc tac ttc gtg gcc atg gag gag gat ggc ggt gtg tcg agc    528
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
                165                 170                 175
tac ccg acc aac acg gcc ggt gct aag ttc ggc act ggg tac tgc gac    576
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
            180                 185                 190
gcc caa tgc gca cgc gac ctc aag ttc gtc ggc ggc aag ggc aac atc    624
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
        195                 200                 205
gag ggc tgg aag ccg tcc acc aac gat gcc aat gcc ggt gtc ggt cct    672
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
    210                 215                 220
tat ggc ggg tgc tgc gct gag atc gac gtc tgg gag tcg aac aag tat    720
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
225                 230                 235                 240
gct ttc gct ttc acc ccg cac ggt tgc gag aac cct aaa tac cac gtc    768
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
                245                 250                 255
tgc gag acc acc aac tgc ggt ggc acc tac tcc gag gac cgc ttc gct    816
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
            260                 265                 270
ggt gac tgc gat gcc aac ggc tgc gac tac aac ccc tac cgc atg ggc    864
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
        275                 280                 285
aac cag gac ttc tac ggt ccc ggc ttg acg gtc gat acc agc aag aag    912
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
    290                 295                 300
ttc acc gtc gtc agc cag ttc gag gag aac aag ctc acc cag ttc ttc    960
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
305                 310                 315                 320
gtc cag gac ggc aag aag att gag atc ccc ggc ccc aag gtc gag ggc   1008
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
                325                 330                 335
atc gat gcg gac agc gcc gct atc acc cct gag ctg tgc agt gcc ctg   1056
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
            340                 345                 350
ttc aag gcc ttc gat gac cgt gac cgc ttc tcg gag gtt ggc ggc ttc   1104
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
        355                 360                 365
gat gcc atc aac acg gcc ctc agc act ccc atg gtc ctc gtc atg tcc   1152
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
    370                 375                 380
atc tgg gat gat cac tac gcc aat atg ctc tgg ctc gac tcg agc tac   1200
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385                 390                 395                 400
ccc cct gag aag gct ggc cag cct ggc ggt gac cgt ggc ccg tgt cct    1248
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
                405                 410                 415
cag gac tct ggc gtc ccg gcc gac gtt gag gct cag tac cct aat gcc    1296
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
            420                 425                 430
aag gtc atc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg act gtc    1344
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
        435                 440                 445
aac gtc taa                                                        1353
Asn Val
    450
<210>  42
<211>  450
<212>  PRT
<213>  嗜热毁丝酶(Myceliophthora thermophila)
<400>  42
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
1               5                   10                  15
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
            20                  25                  30
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
        35                  40                  45
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
    50                  55                  60
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
65                  70                  75                  80
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
                85                  90                  95
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
            100                 105                 110
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
        115                 120                 125
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
    130                 135                 140
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
145                 150                 155                 160
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
                165                 170                 175
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
            180                 185                 190
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
        195                 200                 205
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
    210                 215                 220
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
225                 230                 235                 240
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
                245                 250                 255
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
            260                 265                 270
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
        275                 280                 285
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
    290                 295                 300
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
305                 310                 315                 320
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
                325                 330                 335
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
            340                 345                 350
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
        355                 360                 365
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
    370                 375                 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385                 390                 395                 400
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
                405                 410                 415
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
            420                 425                 430
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
        435                 440                 445
Asn Val
    450
<210>  43
<211>  1341
<212>  DNA
<213>  块团炭角菌(Xylaria hypoxylon)
<220>
<221>  CDS
<222>  (1)..(1341)
<223>
<400>  43
atg ttg tcc ctc gcc gtg tcg gcc gcc ctt ctc ggg ctc gcg tct gcc     48
Met Leu Ser Leu Ala Val Ser Ala Ala Leu Leu Gly Leu Ala Ser Ala
1               5                   10                  15
cag cag gtt gga aag gag caa tct gag act cac cct aag ctg tct tgg     96
Gln Gln Val Gly Lys Glu Gln Ser Glu Thr His Pro Lys Leu Ser Trp
            20                  25                  30
aag aag tgc acc agc ggt ggt tcc tgc acc cag acc aac gct gag gtg    144
Lys Lys Cys Thr Ser Gly Gly Ser Cys Thr Gln Thr Asn Ala Glu Val
        35                  40                  45
acc atc gac tct aac tgg cga tgg ctt cac tct ctc gaa ggc act gag    192
Thr Ile Asp Ser Asn Trp Arg Trp Leu His Ser Leu Glu Gly Thr Glu
    50                  55                  60
aac tgc tac gat ggt aac aag tgg acc tcg cag tgc agc act ggc gag    240
Asn Cys Tyr Asp Gly Asn Lys Trp Thr Ser Gln Cys Ser Thr Gly Glu
65                  70                  75                  80
gac tgc gcc acc aag tgc gcc atc gag ggt gcc gac tac agc aag acc    288
Asp Cys Ala Thr Lys Cys Ala Ile Glu Gly Ala Asp Tyr Ser Lys Thr
                85                  90                  95
tac ggt gcc tct act agc ggc gat gct ctt acc ctc aag ttc ctg acc    336
Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu Thr Leu Lys Phe Leu Thr
            100                 105                 110
aag cac gag tac gga acc aac atc ggc tcc cga ttc tac ctt atg aat    384
Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe Tyr Leu Met Asn
        115                 120                 125
ggt gcc gac aag tac cag acc ttc gac ctc aag ggt aac gag ttc acc    432
Gly Ala Asp Lys Tyr Gln Thr Phe Asp Leu Lys Gly Asn Glu Phe Thr
    130                 135                 140
ttc gat gtc gac ctg tcc acc gtc gac tgt ggt ctt aac gcc gct ctt    480
Phe Asp Val Asp Leu Ser Thr Val Asp Cys Gly Leu Asn Ala Ala Leu
145                 150                 155                 160
tac ttc gtc gcc atg gag gaa gac ggt ggc atg gct agc tac ccc aac    528
Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala Ser Tyr Pro Asn
                165                 170                 175
aac aag gcc ggt gcc aag tac ggt acc ggt tac tgt gac gct cag tgt    576
Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys
            180                 185                 190
gcc cgt gac ttg aag ttc gtc ggt ggc aag ggc aac gtt gag gga tgg    624
Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Val Glu Gly Trp
        195                 200                 205
gag cca tcc acc aac gac gac aac gcc ggt gtt ggc cct tac ggt gcc    672
Glu Pro Ser Thr Asn Asp Asp Asn Ala Gly Val Gly Pro Tyr Gly Ala
    210                 215                 220
tgc tgt gcc gaa atc gat gtc tgg gag tcc aac tct cac tct ttc gct     720
Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ser His Ser Phe Ala
225                 230                 235                 240
ttc acc cct cac cct tgc acc acc aac gaa tac cac gtc tgt gag cag     768
Phe Thr Pro His Pro Cys Thr Thr Asn Glu Tyr His Val Cys Glu Gln
                245                 250                 255
gac gag tgt ggt ggt acc tac tct gag gac cga ttc gct ggc aag tgt     816
Asp Glu Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala Gly Lys Cys
            260                 265                 270
gat gcc aac ggt tgt gac tac aac cct tac cgc atg ggt aac acc gac     864
Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly Asn Thr Asp
        275                 280                 285
ttc tac ggc cag ggc aag acc gtc gac acc agc aag aaa ttc act gtt     912
Phe Tyr Gly Gln Gly Lys Thr Val Asp Thr Ser Lys Lys Phe Thr Val
    290                 295                 300
gtc acc cag ttc gcc gaa aac aag ttg act cag ttc ttc gtc cag gac     960
Val Thr Gln Phe Ala Glu Asn Lys Leu Thr Gln Phe Phe Val Gln Asp
305                 310                 315                 320
ggt aag aag att gag atc ccc ggt ccc aag att gac ggt ttc cct acc    1008
Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Ile Asp Gly Phe Pro Thr
                325                 330                 335
gat agc gcc atc acc ccc gag tac tgc act gcc gaa ttc aac gtt cta    1056
Asp Ser Ala Ile Thr Pro Glu Tyr Cys Thr Ala Glu Phe Asn Val Leu
            340                 345                 350
gga gac cgt gac cgc ttc agt gaa gtt ggt ggc ttc gac cag ctc aac    1104
Gly Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe Asp Gln Leu Asn
        355                 360                 365
aac gct ctt gac gta ccc atg gtc ctt gtc atg tcc atc tgg gac gac    1152
Asn Ala Leu Asp Val Pro Met Val Leu Val Met Ser Ile Trp Asp Asp
    370                 375                 380
cac tac gcc aac atg ctt tgg ctc gac tcc agc tac ccc cct gag aag    1200
His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr Pro Pro Glu Lys
385                 390                 395                 400
gct ggc cag ccc ggt ggt gac cgt ggt gac tgt gcc ccc gac tcc ggt    1248
Ala Gly Gln Pro Gly Gly Asp Arg Gly Asp Cys Ala Pro Asp Ser Gly
                405                 410                 415
gtc ccc tcc gac gtc gag gcc agc atc ccc gat gcc aag gtc gtc tgg    1296
Val Pro Ser Asp Val Glu Ala Ser Ile Pro Asp Ala Lys Val Val Trp
            420                 425                 430
tcc aac atc cgc ttc ggt ccc atc ggc tct act gtc gag gtt taa        1341
Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val Glu Val
        435                 440                 445
<210>  44
<211>  446
<212>  PRT
<213>  块团炭角菌(Xylaria hypoxylon)
<400>  44
Met Leu Ser Leu Ala Val Ser Ala Ala Leu Leu Gly Leu Ala Ser Ala
1               5                   10                  15
Gln Gln Val Gly Lys Glu Gln Ser Glu Thr His Pro Lys Leu Ser Trp
            20                  25                  30
Lys Lys Cys Thr Ser Gly Gly Ser Cys Thr Gln Thr Asn Ala Glu Val
        35                  40                  45
Thr Ile Asp Ser Asn Trp Arg Trp Leu His Ser Leu Glu Gly Thr Glu
    50                  55                  60
Asn Cys Tyr Asp Gly Asn Lys Trp Thr Ser Gln Cys Ser Thr Gly Glu
65                  70                  75                  80
Asp Cys Ala Thr Lys Cys Ala Ile Glu Gly Ala Asp Tyr Ser Lys Thr
                85                  90                  95
Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu Thr Leu Lys Phe Leu Thr
            100                 105                 110
Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe Tyr Leu Met Asn
        115                 120                 125
Gly Ala Asp Lys Tyr Gln Thr Phe Asp Leu Lys Gly Asn Glu Phe Thr
    130                 135                 140
Phe Asp Val Asp Leu Ser Thr Val Asp Cys Gly Leu Asn Ala Ala Leu
145                 150                 155                 160
Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala Ser Tyr Pro Asn
                165                 170                 175
Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys
            180                 185                 190
Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Val Glu Gly Trp
        195                 200                 205
Glu Pro Ser Thr Asn Asp Asp Asn Ala Gly Val Gly Pro Tyr Gly Ala
    210                 215                 220
Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ser His Ser Phe Ala
225                 230                 235                 240
Phe Thr Pro His Pro Cys Thr Thr Asn Glu Tyr His Val Cys Glu Gln
                245                 250                 255
Asp Glu Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala Gly Lys Cys
            260                 265                 270
Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly Asn Thr Asp
        275                 280                 285
Phe Tyr Gly Gln Gly Lys Thr Val Asp Thr Ser Lys Lys Phe Thr Val
    290                 295                 300
Val Thr Gln Phe Ala Glu Asn Lys Leu Thr Gln Phe Phe Val Gln Asp
305                 310                 315                 320
Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Ile Asp Gly Phe Pro Thr
                325                 330                 335
Asp Ser Ala Ile Thr Pro Glu Tyr Cys Thr Ala Glu Phe Asn Val Leu
            340                 345                 350
Gly Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe Asp Gln Leu Asn
        355                 360                 365
Asn Ala Leu Asp Val Pro Met Val Leu Val Met Ser Ile Trp Asp Asp
    370                 375                 380
His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr Pro Pro Glu Lys
385                 390                 395                 400
Ala Gly Gln Pro Gly Gly Asp Arg Gly Asp Cys Ala Pro Asp Ser Gly
                405                 410                 415
Val Pro Ser Asp Val Glu Ala Ser Ile Pro Asp Ala Lys Val Val Trp
            420                 425                 430
Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val Glu Val
        435                 440                 445
<210>  45
<211>  1584
<212>  DNA
<213>  黑耳(Exidia glandulosa)
<220>
<221>  CDS
<222>  (1)..(1584)
<223>
<400>  45
atg tac gcc aag ttc gct acc ctc gct gcc ctc gtg gca gct gcc agc     48
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser
1               5                   10                  15
gcc cag cag gca tgc aca ctc acc gcc gag aac cat ccc fcc atg act     96
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr
            20                  25                  30
tgg tct aag tgt gcc gcc gga ggt agc tgc act tcg gtt tct ggt tca    144
Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
        35                  40                  45
gtc acc atc gat gcc aac tgg cga tgg ctt cac cag ctc aac agc gcc    192
Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala
    50                  55                  60
acc aac tgc tac gac ggc aac aag tgg aac acc acc tac tgc agc aca    240
Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr
65                  70                  75                  80
gat gct act tgc gct gct cag tgc tgt gtt gat ggc tca gac tat gct    288
Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala
                85                  90                  95
ggc acc tac ggt gcc acc act agc ggt aac gct ctg aac ctc aag ttc    336
Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
            100                 105                 110
gtc acc caa ggg tcc tat tct aag aac atc ggt tcc cgg ttg tac ctc    384
Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu
        115                 120                 125
atg gag tcg gat acc aag tat cag atg ttt caa ctg ctc ggc cag gag    432
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu
    130                 135                 140
ttc act ttc gac gta gat gtc tcc aac ttg ggc tgc ggt ctc aac ggt    480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
gcc ctc tac ttc gtc agc atg gac gct gac ggt ggc acg tcc aag tat    528
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr
                165                 170                 175
acc ggc aac aag gcc ggc gcc aag tat ggc act ggc tac tgc gac agc    576
Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
cag tgc ccg cgc gac ctg aag ttc atc aat ggt cag gcc aac gtc gag    624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu
        195                 200                 205
ggc tgg act cct tcc acc aac gat gcc aac gcc ggc att ggc acc cac    672
Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His
    210                 215                 220
ggc tcc tgc tgt tcg gag atg gac atc tgg gag gct aac aat gtt gcc    720
Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala
225                 230                 235                 240
gct gcg tac acc ccc cat cct tgc aca act atc ggc cag tcg atc tgc    768
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys
                245                 250                 255
tcg ggc gat tct tgc gga gga acc tac agc tct gac cgt tac gcc ggt    816
Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
            260                 265                 270
gtc tgc gat cca gac ggt tgc gat ttc aac agc tac cgc atg ggc gac    864
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
        275                 280                 285
acg ggc ttc tac ggc aag ggc ctg aca gtc gac acg agc tcc aag ttc    912
Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe
    290                 295                 300
acc gtc gtc acc cag ttc ctc acc ggc tcc gac ggc aac ctt tcc gag    960
Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu
305                 310                 315                 320
atc aag cgc ttc tac gtc cag aac ggc aag gtc att ccc aac tcg cag   1008
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln
                325                 330                 335
tcc aag att gcc ggc gtc agc ggc aac tcc atc acc acc gac ttc tgc   1056
Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys
            340                 345                 350
tcc gcc cag aag acc gcc ttc ggc gac acc aac gtc ttc gcg caa aag    1104
Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys
        355                 360                 365
gga ggt ctc gcc ggg atg ggc gcc gcc ctc aag gcc ggc atg gtc ctc    1152
Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu
    370                 375                 380
gtc atg tcc atc tgg gac gac cac gca gtc aac atg ctg tgg ctg gac    1200
Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385                 390                 395                 400
tcg acc tac ccg acc gac agc acc aag ccc ggc gcg gcc cgc ggc acc    1248
Ser Thr Tyr Pro Thr Asp Ser Thr Lys Pro Gly Ala Ala Arg Gly Thr
                405                 410                 415
tgc ccg acc acc tcc ggc gtc ccc gcc gac gtc gag gcc cag gtc ccc    1296
Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ala Gln Val Pro
            420                 425                 430
aac tcg aac gtc atc tac tcc aac atc aag gtc ggc ccc atc aac tcg    1344
Asn Ser Asn Val Ile Tyr Ser Asn Ile Lys Val Gly Pro Ile Asn Ser
        435                 440                 445
act ttc acc ggc ggc act tcc ggc ggc ggc ggt agc agc agc agc tcc    1392
Thr Phe Thr Gly Gly Thr Ser Gly Gly Gly Gly Ser Ser Ser Ser Ser
    450                 455                 460
acc acc atc cga acc agc acc acc agc act cgc acc acc agc acc agc    1440
Thr Thr Ile Arg Thr Ser Thr Thr Ser Thr Arg Thr Thr Ser Thr Ser
465                 470                 475                 480
acc gcg ccc ggc ggc ggc tcc act ggc agc gcc ggc gcc gat cac tgg    1488
Thr Ala Pro Gly Gly Gly Ser Thr Gly Ser Ala Gly Ala Asp His Trp
                485                 490                 495
gcg caa tgc ggc ggt atc ggc tgg act ggt ccc acg acc tgc aag agc    1536
Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Thr Cys Lys Ser
            500                 505                 510
ccg tac acg tgc aca gcc tcc aac ccg tac tac tcg cag tgc ttg taa    1584
Pro Tyr Thr Cys Thr Ala Ser Asn Pro Tyr Tyr Ser Gln Cys Leu
        515                 520                 525
<210>  46
<211>  527
<212>  PRT
<213>  黑耳(Exidia glandulosa)
<400>  46
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser
1               5                   10                  15
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr
            20                  25                  30
Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
        35                  40                  45
Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala
    50                  55                  60
Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr
65                  70                  75                  80
Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala
                85                  90                  95
Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
            100                 105                 110
Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu
        115                 120                 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu
    130                 135                 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr
                165                 170                 175
Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu
        195                 200                 205
Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His
    210                 215                 220
Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala
225                 230                 235                 240
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys
                245                 250                 255
Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
            260                 265                 270
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
        275                 280                 285
Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe
    290                 295                 300
Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu
305                 310                 315                 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln
                325                 330                 335
Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys
            340                 345                 350
Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys
        355                 360                 365
Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu
    370                 375                 380
Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385                 390                 395                 400
Ser Thr Tyr Pro Thr Asp Ser Thr Lys Pro Gly Ala Ala Arg Gly Thr
                405                 410                 415
Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ala Gln Val Pro
            420                 425                 430
Asn Ser Asn Val Ile Tyr Ser Asn Ile Lys Val Gly Pro Ile Asn Ser
        435                 440                 445
Thr Phe Thr Gly Gly Thr Ser Gly Gly Gly Gly Ser Ser Ser Ser Ser
    450                 455                 460
Thr Thr Ile Arg Thr Ser Thr Thr Ser Thr Arg Thr Thr Ser Thr Ser
465                 470                 475                 480
Thr Ala Pro Gly Gly Gly Ser Thr Gly Ser Ala Gly Ala Asp His Trp
                485                 490                 495
Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Thr Cys Lys Ser
            500                 505                 510
Pro Tyr Thr Cys Thr Ala Ser Asn Pro Tyr Tyr Ser Gln Cys Leu
        515                 520                 525
<210>  47
<211>  1368
<212>  DNA
<213>  黑耳(Exidia glandulosa)
<220>
<221>  CDS
<222>  (1)..(1368)
<223>
<400>  47
atg tac gcc aag ttc gct acc ctc gct gcc ctc gtg gca gct gcc agc     48
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser
1               5                   10                  15
gcc cag cag gca tgc aca ctc acc gcc gag aac cat ccc tcc atg act     96
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr
            20                  25                  30
tgg tct aag tgt gcc gcc gga ggt agc tgc act tcg gtt tct ggt tca    144
Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
        35                  40                  45
gtc acc atc gat gcc aac tgg cga tgg ctt cac cag ctc aac agc gcc    192
Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala
    50                  55                  60
acc aac tgc tac gac ggc aac aag tgg aac acc acc tac tgc agc aca    240
Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr
65                  70                  75                  80
gat gct act tgc gct gct cag tgc tgt gtt gat ggc tca gac tat gct    288
Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala
                85                  90                  95
ggc acc tac ggt gcc acc act agc ggt aac gct ctg aac ctc aag ttc    336
Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
            100                 105                 110
gtc acc caa ggg tcc tat tct aag aac atc ggt tcc cgg ttg tac ctc    384
Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu
        115                 120                 125
atg gag tcg gat acc aag tat cag atg ttt caa ctg ctc ggc cag gag    432
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu
    130                 135                 140
ttc act ttc gac gta gat gtc tcc aac ttg ggc tgc ggt ctc aac ggt    480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
gcc ctc tac ttc gtc agc atg gac gct gac ggt ggc acg tcc aag tat    528
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr
                165                 170                 175
acc ggc aac aag gcc ggc gcc aag tat ggc act ggc tac tgc gac agc    576
Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
cag tgc ccg cgc gac ctg aag ttc atc aat ggt cag gcc aac gtc gag    624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu
        195                 200                 205
ggc tgg act cct tcc acc aac gat gcc aac gcc ggc att ggc acc cac    672
Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His
    210                 215                 220
ggc tcc tgc tgt tcg gag atg gac atc tgg gag gct aac aat gtt gcc    720
Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala
225                 230                 235                 240
gct gcg tac acc ccc cat cct tgc aca act atc ggc cag tcg atc tgc    768
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys
                245                 250                 255
tcg ggc gat tct tgc gga gga acc tac agc tct gac cgt tac gcc ggt    816
Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
            260                 265                 270
gtc tgc gat cca gac ggt tgc gat ttc aac agc tac cgc atg ggc gac    864
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
        275                 280                 285
acg ggc ttc tac ggc aag ggc ctg aca gtc gac acg agc tcc aag ttc    912
Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe
    290                 295                 300
acc gtc gtc acc cag ttc ctc acc ggc tcc gac ggc aac ctt tcc gag     960
Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu
305                 310                 315                 320
atc aag cgc ttc tac gtc cag aac ggc aag gtc att ccc aac tcg cag    1008
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln
                325                 330                 335
tcc aag att gcc ggc gtc agc ggc aac tcc atc acc acc gac ttc tgc    1056
Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys
            340                 345                 350
tcc gcc cag aag acc gcc ttc ggc gac acc aac gtc ttc gcg caa aag    1104
Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys
        355                 360                 365
gga ggt ctc gcc ggg atg ggc gcc gcc ctc aag gcc ggc atg gtc ctc    1152
Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu
    370                 375                 380
gtc atg tcc atc tgg gac gat cac tac gcc aac atg ctg tgg ctc gac    1200
Val Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp
385                 390                 395                 400
tcg acc tac ccg act gac gcc tct ccc gat gag ccc ggc aag ggc cgc    1248
Ser Thr Tyr Pro Thr Asp Ala Ser Pro Asp Glu Pro Gly Lys Gly Arg
                405                 410                 415
ggc acc tgc gac acc agc tcg ggt gtt cct gct gac atc gag acc agc    1296
Gly Thr Cys Asp Thr Ser Ser Gly Val Pro Ala Asp Ile Glu Thr Ser
            420                 425                 430
cag gcc agc aac tca gtc atc tac tcg aac atc aag ttc gga ccc atc    1344
Gln Ala Ser Asn Ser Val Ile Tyr Ser Asn Ile Lys Phe Gly Pro Ile
        435                 440                 445
aac tcg acc ttc aag gcg tcc taa                                     1368
Asn Ser Thr Phe Lys Ala Ser
    450                 455
<210>  48
<211>  455
<212>  PRT
<213>  黑耳(Exidia glandulosa)
<400>  48
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser
1               5                   10                  15
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr
            20                  25                  30
Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
        35                  40                  45
Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala
    50                  55                  60
Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr
65                  70                  75                  80
Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala
                85                  90                  95
Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
            100                 105                 110
Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu
        115                 120                 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu
    130                 135                 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr
                165                 170                 175
Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu
        195                 200                 205
Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His
    210                 215                 220
Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala
225                 230                 235                 240
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys
                245                 250                 255
Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
            260                 265                 270
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
        275                 280                 285
Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe
    290                 295                 300
Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu
305                 310                 315                 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln
                325                 330                 335
Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys
            340                 345                 350
Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn ValPhe Ala Gln Lys
        355                 360                 365
Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu
    370                 375                 380
Val Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp
385                 390                 395                 400
Ser Thr Tyr Pro Thr Asp Ala Ser Pro Asp Glu Pro Gly Lys Gly Arg
                405                 410                 415
Gly Thr Cys Asp Thr Ser Ser Gly Val Pro Ala Asp Ile Glu Thr Ser
            420                 425                 430
Gln Ala Ser Asn Ser Val Ile Tyr Ser Asn Ile Lys Phe Gly Pro Ile
        435                 440                 445
Asn Ser Thr Phe Lys Ala Ser
    450                 455
<210>  49
<211>  1395
<212>  DNA
<213>  Poitrasia circinans
<220>
<221>  CDS
<222>  (1)..(1395)
<223>
<400>  49
atg cat cag act tcc gtt ctt tct tcg ctc tct ttg ctc ctc gca gcc     48
Met His Gln Thr Ser Val Leu Ser Ser Leu Ser Leu Leu Leu Ala Ala
1               5                   10                  15
tcc ggt gcc cag cag gtc ggc acc cag aat gct gag act cac ccg agt     96
Ser Gly Ala Gln Gln Val Gly Thr Gln Asn Ala Glu Thr His Pro Ser
            20                  25                  30
ctg acc acc cag aag tgt acc acc gac ggc ggc tgc acc gac cag tcc    144
Leu Thr Thr Gln Lys Cys Thr Thr Asp Gly Gly Cys Thr Asp Gln Ser
        35                  40                  45
act gcc atc gtg ctt gac gcc aac tgg cgc tgg ctg cac acc acc gag    192
Thr Ala Ile Val Leu Asp Ala Asn Trp Arg Trp Leu His Thr Thr Glu
    50                  55                  60
ggc tac acc aac tgc tac act ggc cag gaa tgg gac acc gac atc tgc    240
Gly Tyr Thr Asn Cys Tyr Thr Gly Gln Glu Trp Asp Thr Asp Ile Cys
65                  70                  75                  80
tcc tcc ccg gag gct tgc gcc acc ggc tgc gct ctt gac ggt gcc gac    288
Ser Ser Pro Glu Ala Cys Ala Thr Gly Cys Ala Leu Asp Gly Ala Asp
                85                  90                  95
tac gag ggc act tac ggc att acg act gac ggc aac gct ctt tcc atg    336
Tyr Glu Gly Thr Tyr Gly Ile Thr Thr Asp Gly Asn Ala Leu Ser Met
            100                 105                 110
aag ttt gtc acc cag ggc tcg cag aag aac gtc ggc ggt cgt gtt tac    384
Lys Phe Val Thr Gln Gly Ser Gln Lys Asn Val Gly Gly Arg Val Tyr
        115                 120                 125
ctg ctt gct ccc gac tcc gaa gat gcg tac gag ctc ttc aag ttg aag    432
Leu Leu Ala Pro Asp Ser Glu Asp Ala Tyr Glu Leu Phe Lys Leu Lys
    130                 135                 140
aac cag gag ttc act ttc gac gtt gac gtc tcc gac ctc ccc tgc ggc    480
Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asp Leu Pro Cys Gly
145                 150                 155                 160
ctg aac ggc gcc ctg tac ttc tcc gag atg gat gaa gat ggt ggc atg    528
Leu Asn Gly Ala Leu Tyr Phe Ser Glu Met Asp Glu Asp Gly Gly Met
                165                 170                 175
tcc aag tac gag aac aac aag gcc ggc gcc aag tac ggc act ggc tac    576
Ser Lys Tyr Glu Asn Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr
            180                 185                 190
tgc gac acg cag tgc ccc cac gac gtc aag ttc atc aac ggc gag gcc    624
Cys Asp Thr Gln Cys Pro His Asp Val Lys Phe Ile Asn Gly Glu Ala
        195                 200                 205
aac att ctc aac tgg acc aag tcc gag acc gac gtc aac gcc ggc act    672
Asn Ile Leu Asn Trp Thr Lys Ser Glu Thr Asp Val Asn Ala Gly Thr
    210                 215                 220
ggc caa tac ggc tcc tgc tgc aac gag atg gat atc tgg gag gcc aac    720
Gly Gln Tyr Gly Ser Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn
225                 230                 235                 240
tcg cag gcc acc gcc gtc act ccc cac gtc tgc aac gcc gat gtc atc    768
Ser Gln Ala Thr Ala Val Thr Pro His Val Cys Asn Ala Asp Val Ile
                245                 250                 255
ggc cag gtc cgt tgc aac ggc acc gac tgc ggt gac ggc gac aac cgc    816
Gly Gln Val Arg Cys Asn Gly Thr Asp Cys Gly Asp Gly Asp Asn Arg
            260                 265                 270
tac ggc ggc gtc tgc gac aag gat ggc tgc gac tac aac ccc tac cgc    864
Tyr Gly Gly Val Cys Asp Lys Asp Gly Cys Asp Tyr Asn Pro Tyr Arg
        275                 280                 285
atg ggc aac gag tcg ttc tac ggc tcc aac ggc agc acc atc gac acc    912
Met Gly Asn Glu Ser Phe Tyr Gly Ser Asn Gly Ser Thr Ile Asp Thr
    290                 295                 300
act gcc aag ttc acc gtc att acg cag ttc atc acc tcg gac aac act    960
Thr Ala Lys Phe Thr Val Ile Thr Gln Phe Ile Thr Ser Asp Asn Thr
305                 310                 315                 320
tcg act ggc gac ctc gtt gag atc cgc cgc aag tac gtc cag gac ggc   1008
Ser Thr Gly Asp Leu Val Glu Ile Arg Arg Lys Tyr Val Gln Asp Gly
                325                 330                 335
acc gtc atc gag aac tcg ttc gcc gac tac gac acc ctg gcc acg ttc   1056
Thr Val Ile Glu Asn Ser Phe Ala Asp Tyr Asp Thr Leu Ala Thr Phe
            340                 345                 350
aac tcc atc tcg gac gac ttc tgc gac gcc cag aag acg ctc ttc ggc   1104
Asn Ser Ile Ser Asp Asp Phe Cys Asp Ala Gln Lys Thr Leu Phe Gly
        355                 360                 365
gac gag aac gac ttc aag acc aag ggc ggc att gcc cgc atg ggc gag   1152
Asp Glu Asn Asp Phe Lys Thr Lys Gly Gly Ile Ala Arg Met Gly Glu
    370                 375                 380
tcc ttc gag cgc ggc atg gtc ctc gtc atg agc atc tgg gat gac cac   1200
Ser Phe Glu Arg Gly Met Val Leu Val Met Ser Ile Trp Asp Asp His
385                 390                 395                 400
gcg gcc aac gcc ctc tgg ctc gac tcg acc tac ccc gtc gac ggc gac    1248
Ala Ala Asn Ala Leu Trp Leu Asp Ser Thr Tyr Pro Val Asp Gly Asp
                405                 410                 415
gcg acc aag cct ggc atc aag cgc ggc cct tgc ggc acc gac act ggt    1296
Ala Thr Lys Pro Gly Ile Lys Arg Gly Pro Cys Gly Thr Asp Thr Gly
            420                 425                 430
gtt ccc gcc gac gtc gag tcg gag tcg ccc gat tcg acc gtc atc tac    1344
Val Pro Ala Asp Val Glu Ser Glu Ser Pro Asp Ser Thr Val Ile Tyr
        435                 440                 445
tcc aac att cgc tac gga gac att ggc tcc acc ttc aac gcc acc gct    1392
Ser Asn Ile Arg Tyr Gly Asp Ile Gly Ser Thr Phe Asn Ala Thr Ala
    450                 455                 460
tag                                                                1395
<210>  50
<211>  464
<212>  PRT
<213>  Poitrasia circinans
<400>  50
Met His Gln Thr Ser Val Leu Ser Ser Leu Ser Leu Leu Leu Ala Ala
1               5                   10                  15
Ser Gly Ala Gln Gln Val Gly Thr Gln Asn Ala Glu Thr His Pro Ser
            20                  25                  30
Leu Thr Thr Gln Lys Cys Thr Thr Asp Gly Gly Cys Thr Asp Gln Ser
        35                  40                  45
Thr Ala Ile Val Leu Asp Ala Asn Trp Arg Trp Leu His Thr Thr Glu
    50                  55                  60
Gly Tyr Thr Asn Cys Tyr Thr Gly Gln Glu Trp Asp Thr Asp Ile Cys
65                  70                  75                  80
Ser Ser Pro Glu Ala Cys Ala Thr Gly Cys Ala Leu Asp Gly Ala Asp
                85                  90                  95
Tyr Glu Gly Thr Tyr Gly Ile Thr Thr Asp Gly Asn Ala Leu Ser Met
            100                 105                 110
Lys Phe Val Thr Gln Gly Ser Gln Lys Asn Val Gly Gly Arg Val Tyr
        115                 120                 125
Leu Leu Ala Pro Asp Ser Glu Asp Ala Tyr Glu Leu Phe Lys Leu Lys
    130                 135                 140
Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asp Leu Pro Cys Gly
145                 150                 155                 160
Leu Asn Gly Ala Leu Tyr Phe Ser Glu Met Asp Glu Asp Gly Gly Met
                165                 170             175
Ser Lys Tyr Glu Asn Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr
            180                 185             190
Cys Asp Thr Gln Cys Pro His Asp Val Lys Phe Ile Asn Gly Glu Ala
        195                 200                 205
Asn Ile Leu Asn Trp Thr Lys Ser Glu Thr Asp Val Asn Ala Gly Thr
    210                 215                 220
Gly Gln Tyr Gly Ser Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn
225                 230                 235                 240
Ser Gln Ala Thr Ala Val Thr Pro His Val Cys Asn Ala Asp Val Ile
                245                 250                 255
Gly Gln Val Arg Cys Asn Gly Thr Asp Cys Gly Asp Gly Asp Asn Arg
            260                 265                 270
Tyr Gly Gly Val Cys Asp Lys Asp Gly Cys Asp Tyr Asn Pro Tyr Arg
        275                 280                 285
Met Gly Asn Glu Ser Phe Tyr Gly Ser Asn Gly Ser Thr Ile Asp Thr
    290                 295                 300
Thr Ala Lys Phe Thr Val Ile Thr Gln Phe Ile Thr Ser Asp Asn Thr
305                 310                 315                 320
Ser Thr Gly Asp Leu Val Glu Ile Arg Arg Lys Tyr Val Gln Asp Gly
                325                 330                 335
Thr Val Ile Glu Asn Ser Phe Ala Asp Tyr Asp Thr Leu Ala Thr Phe
            340                 345                 350
Asn Ser Ile Ser Asp Asp Phe Cys Asp Ala Gln Lys Thr Leu Phe Gly
        355                 360                 365
Asp Glu Asn Asp Phe Lys Thr Lys Gly Gly Ile Ala Arg Met Gly Glu
    370                 375                 380
Ser Phe Glu Arg Gly Met Val Leu Val Met Ser Ile Trp Asp Asp His
385                 390                 395                 400
Ala Ala Asn Ala Leu Trp Leu Asp Ser Thr Tyr Pro Val Asp Gly Asp
                405                 410                 415
Ala Thr Lys Pro Gly Ile Lys Arg Gly Pro Cys Gly Thr Asp Thr Gly
            420                 425                 430
Val Pro Ala Asp Val Glu Ser Glu Ser Pro Asp Ser Thr Val Ile Tyr
        435                 440                 445
Ser Asn Ile Arg Tyr Gly Asp Ile Gly Ser Thr Phe Asn Ala Thr Ala
    450                 455                 460
<210>  51
<211>  1383
<212>  DNA
<213>  灰色鬼伞(Coprinus cinereus)
<220>
<221>  CDS
<222>  (1)..(1383)
<223>
<400>  51
atg ttc aag aaa gtc gcc ctc acc gct ctc tgc ttc ctc gcc gtc gca     48
Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala
1               5                   10                  15
cag gcc caa cag gtc ggt cgc gaa gtc gct gaa aac cac ccc cgt ctc     96
Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu
            20                  25                  30
ccg tgg cag cgt tgc act cgc aac ggc gga tgc cag act gtc tcc aac    144
Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn
        35                  40                  45
ggt cag gtc gtc ctc gac gcc aac tgg cga tgg ctc cac gtc acc gac    192
Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp
    50                  55                  60
ggc tac acc aac tgc tac acc ggt aac tcc tgg aac agc acc gtc tgc    240
Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys
65                  70                  75                  80
tcc gac ccc acc acc tgc gct cag cga tgc gct ctc gag ggt gcc aac    288
Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn
                85                  90                  95
tac cag caa acc tac ggt atc acc acc aac gga gac gcc ctc acc atc    336
Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile
            100                 105                 110
aag ttc ctc acc cga tcc caa caa acc aac gtc ggt gct cgt gtc tac    384
Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr
        115                 120                 125
ctc atg gag aac gag aac cga tac cag atg ttc aac ctc ctc aac aag    432
Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys
    130                 135                 140
gag ttc acc ttc gac gtt gac gtc tcc aag gtt cct tgc ggt atc aac    480
Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn
145                 150                 155                 160
ggt gcc ctc tac ttc atc cag atg gac gcc gat ggt ggt atg agc aag    528
Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys
                165                 170                 175
caa ccc aac aac agg gct ggt gct aag tac ggt acc ggc tac tgc gac    576
Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
            180                 185                 190
tct cag tgc ccc cgt gac atc aag ttc att gac ggc gtg gcc aac agc    624
Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser
        195                 200                 205
gcc gac tgg act cca tcc gag acc gat ccc aat gcc gga agg ggt cgc    672
Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg
    210                 215                 220
tac ggc att tgc tgc gcc gag atg gat atc tgg gag gcc aac tcc atc    720
Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile
225                 230                 235                 240
tcc aat gcc tac acc ccc cac cct tgc cga acc cag aac gat ggt ggc    768
Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly
                245                 250                 255
tac cag cgc tgc gag ggc cgc gac tgc aac cag cct cgc tat gag ggt    816
Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly
            260                 265                 270
ctt tgc gat cct gat ggc tgt gac tac aac ccc ttc cgc atg ggt aac    864
Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn
        275                 280                 285
aag gac ttc tac gga ccc gga aag acc gtc gac acc aac agg aag atg    912
Lys Asp Phe Tyr Gly Pro Gly Lys Thr Val Asp Thr Asn Arg Lys Met
    290                 295                 300
acc gtc gtc acc caa ttc atc acc cac gac aac acc gac act ggc acc    960
Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr
305                 310                 315                 320
ctc gtt gac atc cgc cgc ctc tac gtt caa gac ggc cgt gtc att gcc   1008
Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala
                325                 330                 335
aac cct ccc acc aac ttc ccc ggt ctc atg ccc gcc cac gac tcc atc   1056
Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile
            340                 345                 350
acc gag cag ttc tgc act gac cag aag aac ctc ttc ggc gac tac agc   1104
Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser
        355                 360                 365
agc ttc gct cgt gac ggt ggt ctc gct cac atg ggt cgc tcc ctc gcc   1152
Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala
    370                 375                 380
aag ggt cac gtc ctc gct ctc tcc atc tgg aac gac cac ggt gcc cac   1200
Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His
385                 390                 395                 400
atg ttg tgg ctc gac tcc aac tac ccc acc gac gct gac ccc aac aag   1248
Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys
                405                 410                 415
ccc ggt att gct cgt ggt acc tgc ccg acc act ggt ggc acc ccc cgt   1296
Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg
            420                 425                 430
gaa acc gaa caa aac cac cct gat gcc cag gtc atc ttc tcc aac att   1344
Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile
        435                 440                 445
aaa ttc ggt gac atc ggc tcg act ttc tct ggt tac taa               1383
Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr
    450                 455                 460
<210>  52
<211>  460
<212>  PRT
<213>  灰色鬼伞(Coprinus cinereus)
<400>  52
Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala
1               5                   10                  15
Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu
            20                  25                  30
Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn
        35                  40                  45
Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp
    50                  55                  60
Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys
65                  70                  75                  80
Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn
                85                  90                  95
Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile
            100                 105                 110
Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr
        115                 120                 125
Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys
    130                 135                 140
Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn
145                 150                 155                 160
Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys
                165                 170                 175
Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
            180                 185                 190
Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser
        195                 200                 205
Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg
    210                 215                 220
Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile
225                 230                 235                 240
Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly
                245                 250                 255
Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly
            260                 265                 270
Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn
        275                 280                 285
Lys Asp Phe Tyr Gly Pro Gly Lys Thr Val Asp Thr Asn Arg Lys Met
    290                 295                 300
Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr
305                 310                 315                 320
Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala
                325                 330                 335
Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile
            340                 345                 350
Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser
        355                 360                 365
Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala
    370                 375                 380
Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His
385                 390                 395                 400
Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys
                405                 410                 415
Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg
            420                 425                 430
Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile
        435                 440                 445
Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr
    450                 455                 460
<210>  53
<211>  1353
<212>  DNA
<213>  支顶孢菌(Acremonium sp.)
<220>
<221>  CDS
<222>  (1)..(1353)
<223>
<400>  53
atg atg aag cag tat ctt cag tac ctg gcg gcg gct ctg ccc cta atg       48
Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu Met
1               5                   10                  15
ggc ctt gcc gcg ggc cag caa gcc ggc cgg gag acg ccc gaa aac cac       96
Gly Leu Ala Ala Gly Gln Gln Ala Gly Arg Glu Thr Pro Glu Asn His
            20                  25                  30
ccc cgg ctc acc tgg aag aag tgc tcg ggc cag ggg tcc tgc cag acc      144
Pro Arg Leu Thr Trp Lys Lys Cys Ser Gly Gln Gly Ser Cys Gln Thr
        35                  40                  45
gtc aac ggc gag gtc gtc att gat gcc aac tgg cgc tgg ctc cac gac      192
Val Asn Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Asp
    50                  55                  60
tcc aac atg cag aac tgc tac gac ggc aac cag tgg acc agc gcg tgc      240
Ser Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Ser Ala Cys
65                  70                  75                  80
agc tcg gcc acc gac tgc gcc tcc aag tgc tac atc gag ggt gcc gac      288
Ser Ser Ala Thr Asp Cys Ala Ser Lys Cys Tyr Ile Glu Gly Ala Asp
                85                  90                  95
tac ggc agg acc tac ggc gct tcg acg agc ggc gac tcc ctc acg ctc      336
Tyr Gly Arg Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu
            100                 105                 110
aag ttt gtc act cag cac gag tac ggt acc aac atc ggc tcg cgc ttc      384
Lys Phe Val Thr Gln His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe
        115                 120                 125
tac ctg atg agc agc ccg acc cgg tac cag atg ttc acc ctc atg aac      432
Tyr Leu Met Ser Ser Pro Thr Arg Tyr Gln Met Phe Thr Leu Met Asn
    130                 135                 140
aac gaa ttt gct ttc gat gtc gac ctc tcg acc gtc gag tgc ggc atc      480
Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys Gly Ile
145                 150                 155                 160
aac agc gcc ctg tac ttc gtc gcc atg gag gag gac ggc ggc atg gcc      528
Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala
                165                 170                 175
agc tac ccc acc aac aag gcc gga gcc aag tac ggc acg ggt tac tgc      576
Ser Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
            180                 185                 190
gac gcc caa tgc gcc cgt gat ctc aag ttc gtc ggc ggc aag gcc aac      624
Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Ala Asn
        195                 200                 205
att gag ggc tgg agg ccg tcc acc aac gac gcg aac gcc ggc gtc ggc      672
Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly
    210                 215                 220
ccg atg ggc ggc tgc tgc gcg gaa atc gat gtt tgg gag tcc aac gcc      720
Pro Met Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala
225                 230                 235                 240
cac gct ttt gcc ttc acg ccg cac gcg tgc gag aac aac aac tac cac      768
His Ala Phe Ala Phe Thr Pro His Ala Cys Glu Asn Asn Asn Tyr His
                245                 250                 255
atc tgc gag acc tcc aac tgc ggc ggt acc tac tcc gac gac cgc ttc      816
Ile Cys Glu Thr Ser Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe
            260                 265                 270
gcc ggc ctc tgc gac gcc aac ggc tgc gac tac aac ccg tac cgc atg      864
Ala Gly Leu Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met
        275                 280                 285
ggc aac ccc gac ttc tac ggc aag ggc aag act ctt gac acc tcg cgg      912
Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr Ser Arg
    290                 295                 300
aag ttc acc gtc gtc acc cgc ttc cag gag aac gac ctc tcg cag tac      960
Lys Phe Thr Val Val Thr Arg Phe Gln Glu Asn Asp Leu Ser Gln Tyr
305                 310                 315                 320
ttc atc cag gac ggc cgc aag atc gag atc ccg ccc ccg acc tgg gac     1008
Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr Trp Asp
                325                 330                 335
ggc ctc ccg aag agc agc cac atc acg ccc gag ctg tgc gcg acc cag     1056
Gly Leu Pro Lys Ser Ser His Ile Thr Pro Glu Leu Cys Ala Thr Gln
            340                 345                 350
ttc gac gtc ttc gac gac cgc aac cgc ttc gag gag gtc ggc ggc ttc     1104
Phe Asp Val Phe Asp Asp Arg Asn Arg Phe Glu Glu Val Gly Gly Phe
        355                 360                 365
ccc gcc ctc aac gcc gct ctc cgc atc ccc atg gtc ctt gtc atg tcc     1152
Pro Ala Leu Asn Ala Ala Leu Arg Ile Pro Met Val Leu Val Met Ser
    370                 375                 380
atc tgg gac gac cac tac gcc aac atg ctc tgg ctc gac tcc gtc tac     1200
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Val Tyr
385                 390                 395                 400
ccg ccc gag aag gag ggc acc ccc ggc gcc gag cgt ggc cct tgc ccc     1248
Pro Pro Glu Lys Glu Gly Thr Pro Gly Ala Glu Arg Gly Pro Cys Pro
                405                 410                 415
cag acc tct ggt gtc ccc gcc gaa gtc gag gcc cag tac ccc aac gcc     1296
Gln Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asn Ala
            420                 425                 430
aag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg acc tac     1344
Lys Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Tyr
        435                 440                 445
aac atg taa                                                         1353
Asn Met
    450
<210>  54
<211>  450
<212>  PRT
<213>  支顶孢菌(Acremonium sp.)
<400>  54
Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu Met
1               5                   10                  15
Gly Leu Ala Ala Gly Gln Gln Ala Gly Arg Glu Thr Pro Glu Asn His
            20                  25                  30
Pro Arg Leu Thr Trp Lys Lys Cys Ser Gly Gln Gly Ser Cys Gln Thr
        35                  40                  45
Val Asn Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Asp
    50                  55                  60
Ser Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Ser Ala Cys
65                  70                  75                  80
Ser Ser Ala Thr Asp Cys Ala Ser Lys Cys Tyr Ile Glu Gly Ala Asp
                85                  90                  95
Tyr Gly Arg Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu
            100                 105                 110
Lys Phe Val Thr Gln His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe
        115                 120                 125
Tyr Leu Met Ser Ser Pro Thr Arg Tyr Gln Met Phe Thr Leu Met Asn
    130                 135                 140
Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys Gly Ile
145                 150                 155                 160
Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala
                165                 170                 175
Ser Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
            180                 185                 190
Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Ala Asn
        195                 200                 205
Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly
    210                 215                 220
Pro Met Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala
225                 230                 235                 240
His Ala Phe Ala Phe Thr Pro His Ala Cys Glu Asn Asn Asn Tyr His
                245                 250                 255
Ile Cys Glu Thr Ser Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe
            260                 265                 270
Ala Gly Leu Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met
        275                 280                 285
Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr Ser Arg
    290                 295                 300
Lys Phe Thr Val Val Thr Arg Phe Gln Glu Asn Asp Leu Ser Gln Tyr
305                 310                 315                 320
Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr Trp Asp
                325                 330                 335
Gly Leu Pro Lys Ser Ser His Ile Thr Pro Glu Leu Cys Ala Thr Gln
            340                 345                 350
Phe Asp Val Phe Asp Asp Arg Asn Arg Phe Glu Glu Val Gly Gly Phe
        355                 360                 365
Pro Ala Leu Asn Ala Ala Leu Arg Ile Pro Met Val Leu Val Met Ser
    370                 375                 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Val Tyr
385                 390                 395                 400
Pro Pro Glu Lys Glu Gly Thr Pro Gly Ala Glu Arg Gly Pro Cys Pro
                405                 410                 415
Gln Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asn Ala
            420                 425                 430
Lys Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Tyr
        435                 440                 445
Asn Met
    450
<210>  55
<211>  1599
<212>  DNA
<213>  Chaetomidium pingtungium
<220>
<221>  CDS
<222>  (1)..(1599)
<223>
<400>  55
atg ctg gcc tcc acc ttc tcc tac cgc atg tac aag acc gcg ctc atc        48
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1               5                   10                  15
ctg gcc gcc ctt ctg ggc tct ggc cag gct cag cag gtc ggt act tcc        96
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
            20                  25                  30
cag gcg gaa gtg cat ccg tcc atg acc tgg cag agc tgc acg gct ggc       144
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
        35                  40                  45
ggc agc tgc acc acc aac aac ggc aag gtg gtc atc gac gcg aac tgg       192
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
    50                  55                  60
cgt tgg gtg cac aaa gtc ggc gac tac acc aac tgc tac acc ggc aac       240
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65                  70                  75                  80
acc tgg gac acg act atc tgc cct gac gat gcg acc tgc gca tcc aac       288
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
                85                  90                  95
tgc gcc ctt gag ggt gcc aac tac gaa tcc acc tat ggt gtg acc gcc       336
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
            100                 105                 110
agc ggc aat tcc ctc cgc ctc aac ttc gtc acc acc agc cag cag aag       384
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
        115                 120                 125
aac att ggc tcg cgt ctg tac atg atg aag gac gac tcg acc tac gag      432
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
    130                 135                 140
atg ttt aag ctg ctg aac cag gag ttc acc ttc gat gtc gat gtc tcc      480
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145                 150                 155                 160
aac ctc ccc tgc ggt ctc aac ggt gct ctg tac ttt gtc gcc atg gac      528
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
                165                 170                 175
gcc ggc ggt ggc atg tcc aag tac cca acc aac aag gcc ggt gcc aag      576
Ala Gly Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
            180                 185                 190
tac ggt act gga tac tgt gac tcg cag tgc cct cgc gac ctc aag ttc      624
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
        195                 200                 205
atc aac ggt cag gcc aac gtt gaa ggg tgg cag ccc tcc tcc aac gat      672
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
    210                 215                 220
gcc aat gcg ggt acc ggc aac cac ggg tcc tgc tgc gcg gag atg gat      720
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225                 230                 235                 240
atc tgg gag gcc aac agc atc tcc acg gcc ttc acc ccc cat ccg tgc      768
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
                245                 250                 255
gac acg ccc ggc cag gtg atg tgc acc ggt gat gcc tgc ggt ggc acc      816
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
            260                 265                 270
tac agc tcc gac cgc tac ggc ggc acc tgc gac ccc gac gga tgt gat      864
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
        275                 280                 285
ttc aac tcc ttc cgc cag ggc aac aag acc ttc tac ggc cct ggc atg      912
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
    290                 295                 300
acc gtc gac acc aag agc aag ttt acc gtc gtc acc cag ttc atc acc      960
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305                 310                 315                 320
gac gac ggc acc tcc agc ggc acc ctc aag gag atc aag cgc ttc tac     1008
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
                325                 330                 335
gtg cag aac ggc aag gtg atc ccc aac tcg gag tcg acc tgg acc ggc     1056
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
            340                 345                 350
gtc agc ggc aac tcc atc acc acc gag tac tgc acc gcc cag aag agc     1104
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
        355                 360                 365
ctg ttc cag gac cag aac gtc ttc gaa aag cac ggc ggc ctc gag ggc     1152
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
    370                 375                 380
atg ggt gct gcc ctc gcc cag ggc atg gtt ctc gtc atg tcc ctg tgg     1200
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385                 390                 395                 400
gat gat cac tcg gcc aac atg ctc tgg ctc gac agc aac tac ccg acc     1248
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
                405                 410                 415
act gcc tct tcc acc act ccc ggc gtc gcc cgt ggt acc tgc gac atc     1296
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
            420                 425                 430
tcc tcc ggc gtc cct gcg gat gtc gag gcg aac cac ccc gac gcc tac     1344
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
        435                 440                 445
gtc gtc tac tcc aac atc aag gtc ggc ccc atc ggc tcg acc ttc aac     1392
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
    450                 455                 460
agc ggt ggc tcg aac ccc ggt ggc gga acc acc acg aca act acc acc     1440
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465                 470                 475                 480
cag cct act acc acc acg acc acg gct gga aac cct ggc ggc acc gga     1488
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
                485                 490                 495
gtc gca cag cac tat ggc cag tgt ggt gga atc gga tgg acc gga ccc     1536
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
            500                 505                 510
aca acc tgt gcc agc cct tat acc tgc cag aag ctg aat gat tat tac     1584
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
        515                 520                 525
tct cag tgc ctg tag                                                 1599
Ser Gln Cys Leu
    530
<210>  56
<211>  532
<212>  PRT
<213>  Chaetomidium pingtungium
<400>  56
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1               5                   10                  15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
            20                  25                  30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
        35                  40                  45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
    50                  55                  60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65                  70                  75                  80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
                85                  90                  95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
            100                 105                 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
        115                 120                 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
    130                 135                 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145                 150                 155                 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
                165                 170                 175
Ala Gly Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
            180                 185                 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
        195                 200                 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
    210                 215                 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225                 230                 235                 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
                245                 250                 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
            260                 265                 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
        275                 280                 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
    290                 295                 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305                 310                 315                 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
                325                 330                 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
            340                 345                 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
        355                 360                 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
    370                 375                 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385                 390                 395                 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
                405                 410                 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
            420                 425                 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
        435                 440                 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
    450                 455                 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465                 470                 475                 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
                485                 490                 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
            500                 505                 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
        515                 520                 525
Ser Gln Cys Leu
    530
<210>  57
<211>  1383
<212>  DNA
<213>  Sporotrichum pruinosum
<220>
<221>  CDS
<222>  (1)..(1383)
<223>
<400>  57
atg ttc aag aaa gtc gcc ctc acc gct ctc tgc ttc ctc gcc gtc gca       48
Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala
1               5                   10                  15
cag gcc caa cag gtc ggt cgc gaa gtc gct gaa aac cac ccc cgt ctc       96
Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu
            20                  25                  30
ccg tgg cag cgt tgc act cgc aac ggc gga tgc cag act gtc tct aac      144
Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn
        35                  40                  45
ggt cag gtc gtc ctc gac gcc aac tgg cga tgg ctc cac gtc acc gat      192
Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp
    50                  55                  60
ggc tac acc aac tgc tac acc ggt aac tcc tgg aac agc acc gtc tgc      240
Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys
65                  70                  75                  80
tcc gac ccc acc acc tgc gct cag cga tgc gct ctc gag ggt gcc aac      288
Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn
                85                  90                  95
tac cag caa acc tac ggt atc acc acc aac gga gac gcc ctc acc atc      336
Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile
            100                 105                 110
aag ttc ctc acc cga tcc caa caa acc aac gtc ggt gct cgt gtc tac      384
Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr
        115                 120                 125
ctc atg gag aac gag aac cga tac cag atg ttc aac ctc ctc aac aag      432
Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys
    130                 135                 140
gag ttc acc ttc gac gtt gac gtc tcc aag gtt cct tgc ggt atc aac      480
Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn
145                 150                 155                 160
ggt gcc ctc tac ttc atc cag atg gac gcc gat ggt ggt atg agc aag      528
Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys
                165                 170                 175
caa ccc aac aac agg gct ggt gct aag tac ggt acc ggc tac tgc gac      576
Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
            180                 185                 190
tct cag tgc ccc cgt gac atc aag ttc att gac ggc gtg gcc aac agc      624
Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser
        195                 200                 205
gcc gac tgg act cca tcc gag acc gat ccc aat gcc gga agg ggt cgc      672
Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg
    210                 215                 220
tac ggc att tgc tgc gcc gag atg gat atc tgg gag gcc aac tcc atc      720
Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile
225                 230                 235                 240
tcc aat gcc tac acc ccc cac cct tgc cga acc cag aac gat ggt ggc      768
Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly
                245                 250                 255
tac cag cgc tgc gag ggc cgc gac tgc aac cag cct cgc tat gag ggt      816
Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly
            260                 265                 270
ctt tgc gat cct gat ggc tgt gac tac aac ccc ttc cgc atg ggt aac      864
Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn
        275                 280                 285
aag gac ttc tac gga ccc gga aag acc atc gac acc aac agg aag atg      912
Lys Asp Phe Tyr Gly Pro Gly Lys Thr Ile Asp Thr Asn Arg Lys Met
    290                 295                 300
acc gtc gtc acc caa ttc atc acc cac gac aac acc gac act ggc acc      960
Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr
305                 310                 315                 320
ctc gtt gac atc cgc cgc ctc tac gtt caa gac ggc cgt gtc att gcc     1008
Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala
                325                 330                 335
aac cct ccc acc aac ttc ccc ggt ctc atg ccc gcc cac gac tcc atc     1056
Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile
            340                 345                 350
acc gag cag ttc tgc act gac cag aag aac ctc ttc ggc gac tac agc     1104
Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser
        355                 360                 365
agc ttc gct cgt gac ggt ggt ctc gct cac atg ggt cgc tcc ctc gcc     1152
Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala
    370                 375                 380
aag ggt cac gtc ctc gct ctc tcc atc tgg aac gac cac ggt gcc cac     1200
Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His
385                 390                 395                 400
atg ttg tgg ctc gac tcc aac tac ccc acc gac gct gac ccc aac aag     1248
Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys
                405                 410                 415
ccc ggt att gct cgt ggt acc tgc ccg acc act ggt ggc acc ccc cgt     1296
Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg
            420                 425                 430
gaa acc gaa caa aac cac cct gat gcc cag gtc atc ttc tcc aac att     1344
Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile
        435                 440                 445
aaa ttc ggt gac atc ggc tcg act ttc tct ggt tac taa                 1383
Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr
    450                 455                 460
<210>  58
<211>  460
<212>  PRT
<213>  Sporotrichum pruinosum
<400>  58
Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala
1               5                   10                  15
Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu
            20                  25                  30
Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn
        35                  40                  45
Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp
    50                  55                  60
Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys
65                  70                  75                  80
Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn
                85                  90                  95
Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile
            100                 105                 110
Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr
        115                 120                 125
Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys
    130                 135                 140
Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn
145                 150                 155                 160
Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys
                165                 170                 175
Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
            180                 185                 190
Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser
        195                 200                 205
Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg
    210                 215                 220
Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile
225                 230                 235                 240
Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly
                245                 250                 255
Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly
            260                 265                 270
Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn
        275                 280                 285
Lys Asp Phe Tyr Gly Pro Gly Lys Thr Ile Asp Thr Asn Arg Lys Met
    290                 295                 300
Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr
305                 310                 315                 320
Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala
                325                 330                 335
Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile
            340                 345                 350
Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser
        355                 360                 365
Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala
    370                 375                 380
Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His
385                 390                 395                 400
Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys
                405                 410                 415
Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg
            420                 425                 430
Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile
        435                 440                 445
Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr
    450                 455                 460
<210>  59
<211>  1578
<212>  DNA
<213>  嗜热小柱孢菌(Scytalidium thermophilum)
<220>
<221>  CDS
<222>  (1)..(1578)
<223>
<400>  59
atg cgt acc gcc aag ttc gcc acc ctc gcc gcc ctt gtg gcc tcg gcc     48
Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala
1               5                   10                  15
gcc gcc cag cag gcg tgc agt ctc acc acc gag agg cac cct tcc ctc     96
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu
            20                  25                  30
tct tgg aag aag tgc acc gcc ggc ggc cag tgc cag acc gtc cag gct    144
Ser Trp Lys Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala
        35                  40                  45
tcc atc act ctc gac tcc aac tgg cgc tgg act cac cag gtg tct ggc    192
Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly
    50                  55                  60
tcc acc aac tgc tac acg ggc aac aag tgg gat act agc atc tgc act    240
Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr
65                  70                  75                  80
gat gcc aag tcg tgc gct cag aac tgc tgc gtc gat ggt gcc gac tac    288
Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr
                85                  90                  95
acc agc acc tat ggc atc acc acc aac ggt gat tcc ctg agc ctc aag    336
Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys
            100                 105                 110
ttc gtc acc aag ggc cag cac tcg acc aac gtc ggc tcg cgt acc tac    384
Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr
        115                 120                 125
ctg atg gac ggc gag gac aag tat cag acc ttc gag ctc ctc ggc aac    432
Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn
    130                 135                 140
gag ttc acc ttc gat gtc gat gtc tcc aac atc ggc tgc ggt ctc aac    480
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn
145                 150                 155                 160
ggc gcc ctg tac ttc gtc tcc atg gac gcc gat ggt ggt ctc agc cgc    528
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg
                165                 170                 175
tat cct ggc aac aag gct ggt gcc aag tac ggt acc ggc tac tgc gat    576
Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
            180                 185                 190
gct cag tgc ccc cgt gac atc aag ttc atc aac ggc gag gcc aac att    624
Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile
        195                 200                 205
gag ggc tgg acc ggc tcc acc aac gac ccc aac gcc ggc gcg ggc cgc    672
Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg
    210                 215                 220
tat ggt acc tgc tgc tct gag atg gat atc tgg gaa gcc aac aac atg    720
Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225                 230                 235                 240
gct act gcc ttc act cct cac cct tgc acc atc att ggc cag agc cgc    768
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
                245                 250                 255
tgc gag ggc gac tcg tgc ggt ggc acc tac agc aac gag cgc tac gcc    816
Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala
            260                 265                 270
ggc gtc tgc gac ccc gat ggc tgc gac ttc aac tcg tac cgc cag ggc    864
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly
        275                 280                 285
aat aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag    912
Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
    290                 295                 300
atc act gtc gtc acc cag ttc ctc aag gat gcc aac ggc gat ctc ggc    960
Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly
305                 310                 315                 320
gag gtc aag cgc ttc tac gtc cag gat ggc aag atc atc ccc aac tcc   1008
Glu Val Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser
                325                 330                 335
gag tcc acc atc ccc ggc gtc gag ggc aat tcc atc acc cag gac tgg   1056
Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp
            340                 345                 350
tgc gac cgc cag aag gtt gcc ttt ggc gac att gac gac ttc aac cgc   1104
Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
        355                 360                 365
aag ggc ggc atg aag cag atg ggc aag gcc ctc gcc ggc ccc atg gtc   1152
Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val
    370                 375                 380
ctg gtc atg tcc atc tgg gat gac cac gcc tcc aac atg ctc tgg ctc   1200
Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu
385                 390                 395                 400
gac tcg acc ttc cct gtc gat gcc gct ggc aag ccc ggc gcc gag cgc   1248
Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg
                405                 410                 415
ggt gcc tgc ccg acc acc tcg ggt gtc cct gct gag gtt gag gcc gag   1296
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu
            420                 425                 430
gcc ccc aac agc aac gtc gtc ttc tcc aac atc cgc ttc ggc ccc atc   1344
Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile
        435                 440                 445
ggc tcg acc gtt gct ggt ctc ccc ggc gcg ggc aac ggc ggc aac aac    1392
Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn
    450                 455                 460
ggc ggc aac ccc ccg ccc ccc acc acc acc acc tcc tcg gct ccg gcc    1440
Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala
465                 470                 475                 480
acc acc acc acc gcc agc gct ggc ccc aag gct ggc cac tgg cag cag    1488
Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly His Trp Gln Gln
                485                 490                 495
tgc ggc ggc atc ggc ttc act ggc ccg acc cag tgc gag gag ccc tac    1536
Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr
            500                 505                 510
act tgc acc aag ctc aac gac tgg tac tct cag tgc ctg taa            1578
Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
        515                 520                 525
<210>  60
<211>  525
<212>  PRT
<213>  嗜热小柱孢菌(Scytalidium thermophilum)
<400>  60
Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala
1               5                   10                  15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu
            20                  25                  30
Ser Trp Lys Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala
        35                  40                  45
Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly
    50                  55                  60
Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr
65                  70                  75                  80
Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr
                85                  90                  95
Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys
            100                 105                 110
Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr
        115                 120                 125
Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn
    130                 135                 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn
145                 150                 155                 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg
                165                 170                 175
Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
            180                 185                 190
Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile
        195                 200                 205
Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg
    210                 215                 220
Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225                 230                 235                 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
                245                 250                 255
Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala
            260                 265                 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly
        275                 280                 285
Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
    290                 295                 300
Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly
305                 310                 315                 320
Glu Val Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser
                325                 330                 335
Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp
            340                 345                 350
Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
        355                 360                 365
Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val
    370                 375                 380
Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu
385                 390                 395                 400
Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg
                405                 410                 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu
            420                 425                 430
Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile
        435                 440                 445
Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn
    450                 455                 460
Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala
465                 470                 475                 480
Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly His Trp Gln Gln
                485                 490                 495
Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr
            500                 505                 510
Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
        515                 520                 525
<210>  61
<211>  519
<212>  DNA
<213>  曲霉(Aspergillus sp.)
<220>
<221>  misc_feature
<222>  (1)..(519)
<223>  部分CBH1编码序列
<400>  61
gagatggaca tatgggaggc caacagcatc tccacggcct tcacgcccca cccctgcgat     60
gtccccggcc aggtgatgtg cgagggcgac tcctgcggtg gcacctacag cagcgaccgc    120
tatggcggca cctgcgatcc cgatggatgt gacttcaact cctaccgcca gggcaacaag    180
tccttctacg gccccggcat gaccgtcgac accaacagca aggtcaccgt cgtgactcag    240
ttcctcaccg acgacggcac tgccaccggc accctgtcgg agatcaagcg gttctacgtg    300
cagaacggca aggtcatccc caactccgag tcgacctggc ccggcgtcgg cggcaactcc    360
atcaccaccg actactgtct ggcccagaag agcctcttcg gcgataccga cgtcttcacc    420
aagcacggcg gtatggaggg catgggcgcc gccctcgccg agggcatggt cctcgtcctg    480
agtctctggg acgaccacca ctccaacatg ctctggctg                           519
<210>  62
<211>  497
<212>  DNA
<213>  帚霉属(Scopulariopsis sp.)
<220>
<221>  misc_feature
<222>  (1)..(497)
<223>  部分CBH1编码序列
<400>  62
gagatcgatg tgtgggagtc gaacgcctat gccttcgttt tcacgccgca cgcgtgcacg     60
accaacgagt accacgtctg cgagaccacc aactgcggtg gcacctactc ggaggaccgc    120
ttcaccggca agtgcgacgc caacggctgc gactacaacc cctaccgcat gggcaacccc    180
gacttctacg gcaagggcaa gacgctcgac accagccgca agttcaccgt cgtctcccgc    240
ttcgaggaga acaagctctc ccagtacttc atccaggacg gccgcaagat cgagatcccg    300
ccgccgacgt gggagggcat gcccaacagc agcgagatca cccccgagct ctgctccacc    360
atgttcgatg tgctcgacga ccgcaaccgc ttgcaggagg tcggcggctt cgagcagctg    420
aacaacgccc tccgggttcc catggtcctc gtcatgtcca tctgggacga ccactacgcc    480
aacatgctct ggctcga                                                   497
<210>  63
<211>  498
<212>  DNA
<213>  镰孢属(Fusarium sp.)
<220>
<221>  misc_feature
<222>  (1)..(498)
<223>  部分CBH1编码序列
<400>  63
gagatggata tctgggaggc caacaagatc tccactgcct acactcccca cccctgcaag     60
agcctcaccc agcagtcctg cgagggcgat gcctgcggtg gcacctactc tactacccgc    120
tatgctggaa cttgcgaccc cgatggttgc gatttcaacc cttaccgcca gggcaacaag    180
accttctacg gccccggctc cggcttcaac gttgatacca ccaagaaggt gactgtcgtg    240
acccagttca tcaagggcag cgacggcaag ctttccgaga tcaagcgtct ctatgttcag    300
aatggcaagg tcattggcaa cccccagtct gagattgcca gcaaccctgg cagcagcgtc    360
accgacagct tctgcaaggc ccagaaggtt gccttcaacg accccgatga cttcaacaag    420
aagggtggct ggagcggaat gagcgacgcc ctcgccaagc ccatggttct cgtcatgagc    480
ttgtggcacg acgtgagt                                                  498
<210>  64
<211>  525
<212>  DNA
<213>  轮枝孢(Verticillium sp.)
<220>
<221>  misc_feature
<222>  (1)..(525)
<223>  部分CBH1编码序列
<400>  64
gagatggata tctgggaggc caacaagatc tccacggcct acactcccca tccctgcaag     60
agcctcaccc agcagtcctg tgagggcgat gcctgcggtg gcacctactc ttccacccgc    120
tatgctggaa cttgcgatcc cgatggctgc gatttcaacc cttaccgcca gggcaaccac    180
accttctacg gtcccggctc cggcttcaac gtcgatacca ccaagaaggt gactgtcgtg    240
acccagttca tcaagggcag cgacggcaag ctttccgaga tcaagcgtct ctatgttcag    300
aatggcaagg tcatcggcaa cccccagtcc gagattgcaa acaaccccgg cagctccgtc    360
accgacagct tctgcaaggc ccagaaggtt gccttcaacg accccgatga cttcaacaag    420
aagggtggct ggagcggcat gaacgacgcc ctcgccaagc ccatggttct cgtcatgagc    480
ctgtggcacg acgtgagtaa tctaacccct gagtctcgga caaga                    525
<210>  65
<211>  1371
<212>  DNA
<213>  淡黑假黑盘菌(Pseudoplectania nigrella)
<220>
<221>  CDS
<222>  (1)..(1371)
<400>  65
atg cta tcc aat ctc ctt ctc tca ctc tct ttc ctt tcc cta gcc tcc       48
Met Leu Ser Asn Leu Leu Leu Ser Leu Ser Phe Leu Ser Leu Ala Ser
1               5                   10                  15
ggg caa aac atc ggt acc aac acc gcc gaa agc cac ccc caa ctt cgt       96
Gly Gln Asn Ile Gly Thr Asn Thr Ala Glu Ser His Pro Gln Leu Arg
            20                  25                  30
tct caa acc tgc acc aaa ggc aac gga tgc agc acc caa tcc acc tcc      144
Ser Gln Thr Cys Thr Lys Gly Asn Gly Cys Ser Thr Gln Ser Thr Ser
        35                  40                  45
gta gtc ctg gac tcc aac tgg cgc tgg ctg cac aat aat gga ggt tca      192
Val Val Leu Asp Ser Asn Trp Arg Trp Leu His Asn Asn Gly Gly Ser
    50                  55                  60
acg aac tgc tac acc ggc aat tcc tgg gac tct aca tta tgt ccc gac      240
Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asp Ser Thr Leu Cys Pro Asp
65                  70                  75                  80
cca gtt acc tgc gcc aag aac tgt gct ctc gac ggt gcc gac tat tct      288
Pro Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
                85                  90                  95
ggg aca tac gga atc acc tct acg gga gat gct ttg acg ttg aag ttt      336
Gly Thr Tyr Gly Ile Thr Ser Thr Gly Asp Ala Leu Thr Leu Lys Phe
            100                 105                 110
gtt act cag ggt cct tat tcg act aat att gga tct cgg gta tac cta      384
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Val Tyr Leu
        115                 120                 125
atg gcg agt gat act cag tat aag atg ttc cag ctc aag aac aag gag      432
Met Ala Ser Asp Thr Gln Tyr Lys Met Phe Gln Leu Lys Asn Lys Glu
    130                 135                 140
ttt acg ttt gat gtt gat gtc tct aat ctt cct tgt gga tta aac gga      480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly
145                 150                 155                 160
gcg ttg tat ttt gtg gag atg gat gcg gat gga gga atg tcg aaa tac      528
Ala Leu Tyr Phe Val Glu Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
                165                 170                 175
ccg tct aat aaa gcc ggg gca aaa tat gga acc ggg tat tgt gat gcg      576
Pro Ser Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
            180                 185                 190
cag tgt cca cat gat atc aaa ttt atc aac ggg gag gca aat ctc cta      624
Gln Cys Pro His Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Leu Leu
        195                 200                 205
gac tgg acg cct tca acc agc gac aaa aat gcc ggc tcc gga cgt tac      672
Asp Trp Thr Pro Ser Thr Ser Asp Lys Asn Ala Gly Ser Gly Arg Tyr
    210                 215                 220
ggg acc tgt tgt caa gaa atg gac atc tgg gaa gcc aac agc atg gca      720
Gly Thr Cys Cys Gln Glu Met Asp Ile Trp Glu Ala Asn Ser Met Ala
225                 230                 235                 240
acc gcc tat aca ccg cat ccc tgt agt gtc tca gga cct acc cga tgc      768
Thr Ala Tyr Thr Pro His Pro Cys Ser Val Ser Gly Pro Thr Arg Cys
                245                 250                 255
tca gga acc caa tgt ggg gat ggt tct aac cgt cat aac gga att tgc      816
Ser Gly Thr Gln Cys Gly Asp Gly Ser Asn Arg His Asn Gly Ile Cys
            260                 265                 270
gat aaa gat ggc tgc gat ttc aat tcc tac cgt atg ggc aat acg aca      864
Asp Lys Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn Thr Thr
        275                 280                 285
ttc ttc ggc aag gga gca acg gtt aac acc aac tcc aaa ttt act gtt      912
Phe Phe Gly Lys Gly Ala Thr Val Asn Thr Asn Ser Lys Phe Thr Val
    290                 295                 300
gta acg caa ttc atc acc tcc gac aac acc tca act gga gcg cta aag      960
Val Thr Gln Phe Ile Thr Ser Asp Asn Thr Ser Thr Gly Ala Leu Lys
305                 310                 315                 320
gag att cgt cgt ctt tat att cag aat gga aaa gtc atc cag aac tcg     1008
Glu Ile Arg Arg Leu Tyr Ile Gln Asn Gly Lys Val Ile Gln Asn Ser
                325                 330                 335
aaa agt aat atc tcc ggc atg tca gct tac gac tct ata acc gag gat     1056
Lys Ser Asn Ile Ser Gly Met Ser Ala Tyr Asp Ser Ile Thr Glu Asp
            340                 345                 350
ttc tgt gcc gct caa aaa acc gca ttt gga gac aca aat gac ttt aag     1104
Phe Cys Ala Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Asp Phe Lys
        355                 360                 365
gca aag ggc gga ttt aca aac ctt ggg aat gcg ttg caa aag gga atg     1152
Ala Lys Gly Gly Phe Thr Asn Leu Gly Asn Ala Leu Gln Lys Gly Met
    370                 375                 380
gtt ttg gcg ttg agt att tgg gat gat cat gct gcg cag atg ctt tgg     1200
Val Leu Ala Leu Ser Ile Trp Asp Asp His Ala Ala Gln Met Leu Trp
385                 390                 395                 400
ttg gat agt tct tac ccg ctc gat aaa gac cct tct caa cca ggt gtt     1248
Leu Asp Ser Ser Tyr Pro Leu Asp Lys Asp Pro Ser Gln Pro Gly Val
                405                 410                 415
aag agg ggc gcg tgt gct acc tct tct ggt aaa ccg tcg gat gtc gag     1296
Lys Arg Gly Ala Cys Ala Thr Ser Ser Gly Lys Pro Ser Asp Val Glu
            420                 425                 430
aac cag tct ccg aat gcg tcg gtg act ttt tcg aac att aag ttt ggg     1344
Asn Gln Ser Pro Asn Ala Ser Val Thr Phe Ser Asn Ile Lys Phe Gly
        435                 440                 445
gat att gga tcg act tat tcc tct tag                                 1371
Asp Ile Gly Ser Thr Tyr Ser Ser
    450                 455
<210>  66
<211>  456
<212>  PRT
<213>  淡黑假黑盘菌(Pseudoplectania nigrella)
<400>  66
Met Leu Ser Asn Leu Leu Leu Ser Leu Ser Phe Leu Ser Leu Ala Ser
1               5                   10                  15
Gly Gln Asn Ile Gly Thr Asn Thr Ala Glu Ser His Pro Gln Leu Arg
            20                  25                  30
Ser Gln Thr Cys Thr Lys Gly Asn Gly Cys Ser Thr Gln Ser Thr Ser
        35                  40                  45
Val Val Leu Asp Ser Asn Trp Arg Trp Leu His Asn Asn Gly Gly Ser
    50                  55                  60
Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asp Ser Thr Leu Cys Pro Asp
65                  70                  75                  80
Pro Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
                85                  90                  95
Gly Thr Tyr Gly Ile Thr Ser Thr Gly Asp Ala Leu Thr Leu Lys Phe
            100                 105                 110
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Val Tyr Leu
        115                 120                 125
Met Ala Ser Asp Thr Gln Tyr Lys Met Phe Gln Leu Lys Asn Lys Glu
    130                 135                 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly
145                 150                 155                 160
Ala Leu Tyr Phe Val Glu Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
                165                 170                 175
Pro Ser Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
            180                 185                 190
Gln Cys Pro His Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Leu Leu
        195                 200                 205
Asp Trp Thr Pro Ser Thr Ser Asp Lys Asn Ala Gly Ser Gly Arg Tyr
    210                 215                 220
Gly Thr Cys Cys Gln Glu Met Asp Ile Trp Glu Ala Asn Ser Met Ala
225                 230                 235                 240
Thr Ala Tyr Thr Pro His Pro Cys Ser Val Ser Gly Pro Thr Arg Cys
                245                 250                 255
Ser Gly Thr Gln Cys Gly Asp Gly Ser Asn Arg His Asn Gly Ile Cys
            260                 265                 270
Asp Lys Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn Thr Thr
        275                 280                 285
Phe Phe Gly Lys Gly Ala Thr Val Asn Thr Asn Ser Lys Phe Thr Val
    290                 295                 300
Val Thr Gln Phe Ile Thr Ser Asp Asn Thr Ser Thr Gly Ala Leu Lys
305                 310                 315                 320
Glu Ile Arg Arg Leu Tyr Ile Gln Asn Gly Lys Val Ile Gln Asn Ser
                325                 330                 335
Lys Ser Asn Ile Ser Gly Met Ser Ala Tyr Asp Ser Ile Thr Glu Asp
            340                 345                 350
Phe Cys Ala Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Asp Phe Lys
        355                 360                 365
Ala Lys Gly Gly Phe Thr Asn Leu Gly Asn Ala Leu Gln Lys Gly Met
    370                 375                 380
Val Leu Ala Leu Ser Ile Trp Asp Asp His Ala Ala Gln Met Leu Trp
385                 390                 395                 400
Leu Asp Ser Ser Tyr Pro Leu Asp Lys Asp Pro Ser Gln Pro Gly Val
                405                 410                 415
Lys Arg Gly Ala Cys Ala Thr Ser Ser Gly Lys Pro Ser Asp Val Glu
            420                 425                 430
Asn Gln Ser Pro Asn Ala Ser Val Thr Phe Ser Asn Ile Lys Phe Gly
        435                 440                 445
Asp Ile Gly Ser Thr Tyr Ser Ser
    450                 455
<210>  67
<211>  951
<212>  DNA
<213>  蔓延疫霉(Phytophthora infestans)
<220>
<221>  misc_feature
<222>  (1)..(951)
<223>  部分CBH1编码序列
<400>  67
tgcgatgctg atggttgtga cttcaactct taccgccagg gtaacacctc tttctatggt     60
gcaggtctta ccgtgaacac caacaaagtt ttcaccgttg taacccaatt catcaccaac    120
gatggaacag cttcaggtac cttgaaagaa atccgacgat tctatgttca gaatggcgtc    180
gtgattccaa actcgcaatc cacaatcgct ggagttccag gaaattccat caccgactct    240
ttctgtgccg cacaaaagac tgcttttggt gacaccaacg aattcgctac taagggaggt    300
cttgccacaa tgagcaaagc tttggcaaag ggtatggtac ttgtcatgtc catttgggat    360
gaccataccg ccaacatgtt gtggctcgat gccccttacc cagcaaccaa atccccaagc    420
gccccaggtg tcactcgagg atcatgcagt gctacttcag gtaaccccgt tgatgttgaa    480
gccaattctc caggttcttc cgtcaccttc tcaaacatca agtggggtcc catcaactct    540
acctacactg gatctggagc cgccccaagt gttccaggca ctacaaccgt tagctcggca    600
cccgcatcga ctgcaacttc aggagctggt ggtgtcgcta agtatgccca atgtggaggt    660
actggataca gtggagctac cgcttgcgtt tcaggcagca cctgtgttgc cctcaaccct    720
tactactccc aatgccaata gattgtttcc ctcaggagca attaggtttc caacctaagg    780
ggagagatct tcacaagtct gtacataggg tcagctaaat gttgatcatt catattcttt    840
catgtattta gttgttgaca atttgaagtt gcaagtcaag acgggaaaac agaagcagga    900
aatatatggg acataacaaa gtcaatcgtt tacataagaa ccttctttaa a             951

Claims (29)

1.一种具有纤维二糖水解酶I活性的多肽,其选自下组:
(a)包含选自下组所示氨基酸序列的多肽:
与SEQ ID NO:2中第1-526位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:4中第1-529位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:6中第1-451位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:8中第1-457位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:10中第1-538位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:12中第1-415位氨基酸具有至少70%同一性的氨基酸序列,
与SEQ ID NO:14中第1-447位氨基酸具有至少70%同一性的氨基酸序列,
与SEQ ID NO:16中第1-452位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:38中第1-454位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:40中第1-458位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:42中第1-450位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:44中第1-446位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:46中第1-527位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:48中第1-455位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:50中第1-464位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:52中第1-460位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:54中第1-450位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:56中第1-532位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:58中第1-460位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:60中第1-525位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:66中第1-456位氨基酸具有至少80%同一性的氨基酸序列,
(b)包含选自下组所示氨基酸序列的多肽:
与存在于嗜热支顶孢(Acremonium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热毛壳霉(Chaetomium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于小柱孢菌种(Scytalidium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热小柱孢菌(Scytalidium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于橙黄色热子囊菌(Thermoascus aurantiacus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Thielavia australiensis中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于幼嫩轮枝孢(Verticillium tenerum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70%同一性的氨基酸序列,
与存在于栗色新螱(Neotermes castaneus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70%同一性的氨基酸序列,
与存在于黑素白丝菌(Melanocarpus albomyces)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于支顶孢属(Acremonium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Chaetomidium pingtungium中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Sporotrichum pruinosum中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于棉色二孢(Diplodia gossypina)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于囊状长毛盘菌(Trichophaea saccata)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热毁丝霉(Myceliophthora thermophila)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Exidia glandulosa中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于块团炭角菌(Xylaria hypoxylon)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Poitrasia circinans中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于灰色鬼伞(Coprinus cinereus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于淡黑假黑盘菌(Pseudoplectania nigrella)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
存在于玫瑰单瑞孢(Trichothecium roseum)IFO 5372中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于产黑色腐质霉(Humicola nigrescens)CBS 819.73中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于Cladorrhinum foecundissimum CBS 427.97中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于棉色二孢(Diplodia gossypina)CBS 247.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于嗜热毁丝霉(Myceliophthora thermophila)CBS117.65中的纤维二糖水解酶I编码部分的核苷酸序列编码的的氨基酸序列,
存在于微小根毛霉(Rhizomucor pusillus)CBS109471中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于Meripilus giganteus CBS 521.95中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于黑耳(Exidia glandulosa)CBS 2377.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于块团炭角菌(Xylaria hypoxylon)CBS 284.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于长毛盘菌(Trichophaea saccata)CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列编码的多氨基酸序列,
存在于毛壳霉(Chaetomium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于肉桂色毁丝霉(Myceliophthora hinnulea)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于有小孢子囊的草根霉(Thielavia cf.microspora)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于曲霉(Aspergillus sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于帚霉(Scopulariopsis sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于镰孢(Fusarium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于轮枝孢(Verticillium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,和
存在于蔓延疫霉(Phytophthora infestans)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列。
(c)包含选自下组所示氨基酸序列的多肽:
与SEQ ID NO:1中第1-1578位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:3中第1-1587位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:5中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:7中第1-1371位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:9中第1-1614位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:11中第1-1245位核苷酸编码的多肽具有至少70%同一性的氨基酸序列,
与SEQ ID NO:13中第1-1341位核苷酸编码的多肽具有至少70%同一性的氨基酸序列,
与SEQ ID NO:15中第1-1356位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:37中第1-1365位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:39中第1-1377位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:41中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:43中第1-1341位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:45中第1-1584位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:47中第1-1368位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:49中第1-1395位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:51中第1-1383位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:53中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:55中第1-1599位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:57中第1-1383位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:59中第1-1578位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:65中第1-1371位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
(d)由在高严谨条件下与选自下组所示的多核苷酸探针杂交的核苷酸序列编码的多肽:
(i)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,
(ii)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51第1-500位核苷酸,
SEQ ID NO:53第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,和
(iii)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,和
SEQ ID NO:65中第1-200位核苷酸,和
(e)具有纤维二糖水解酶I活性的(a)、(b)或(c)的片段。
2.根据权利要求1所述的多肽,包含选自下组所述的氨基酸序列:
与SEQ ID NO:2中第1-526位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:4中第1-529位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:6中第1-451位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:8中第1-457位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:10中第1-538位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:12中第1-415位氨基酸具有至少75%同一性、优选至少80%同一性、更优选至少90%同一性的氨基酸序列,
与SEQ ID NO:14中第1-447位氨基酸具有至少75%同一性、优选至少80%同一性、更优选至少90%同一性的氨基酸序列,
与SEQ ID NO:16中第1-452位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:38中第1-454位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:40中第1-458位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:42中第1-450位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:44中第1-446位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:46中第1-527位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:48中第1-455位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:50中第1-464位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:52中第1-460位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:54中第1-450位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:56中第1-532位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:58中第1-460位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:60中第1-525位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:66中第1-456位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列。
3.根据权利要求1或2所述的多肽,其中包括选自下组所示的氨基酸序列:
与SEQ ID NO:2中第1-526位氨基酸,
与SEQ ID NO:4中第1-529位氨基酸,
与SEQ ID NO:6中第1-451位氨基酸,
与SEQ ID NO:8中第1-457位氨基酸,
与SEQ ID NO:10中第1-538位氨基酸,
与SEQ ID NO:12中第1-415位氨基酸,
与SEQ ID NO:14中第1-447位氨基酸,
与SEQ ID NO:16中第1-452位氨基酸,
与SEQ ID NO:38中第1-454位氨基酸,
与SEQ ID NO:40中第1-458位氨基酸,
与SEQ ID NO:42中第1-450位氨基酸,
与SEQ ID NO:44中第1-446位氨基酸,
与SEQ ID NO:46中第1-527位氨基酸,
与SEQ ID NO:48中第1-455位氨基酸,
与SEQ ID NO:50中第1-464位氨基酸,
与SEQ ID NO:52中第1-460位氨基酸,
与SEQ ID NO:54中第1-450位氨基酸,
与SEQ ID NO:56中第1-532位氨基酸,
与SEQ ID NO:58中第1-460位氨基酸,
与SEQ ID NO:60中第1-525位氨基酸,
与SEQ ID NO:66中第1-456位氨基酸。
4.根据权利要求1或2所述的多肽,该多肽是一种人工变异体,其中包括在相应于选自下组所示的氨基酸序列中含有至少一个氨基酸发生替代、缺失和/或插入的氨基酸序列:
与SEQ ID NO:2中第1-526位氨基酸,
与SEQ ID NO:4中第1-529位氨基酸,
与SEQ ID NO:6中第1-451位氨基酸,
与SEQ ID NO:8中第1-457位氨基酸,
与SEQ ID NO:10中第1-538位氨基酸,
与SEQ ID NO:12中第1-415位氨基酸,
与SEQ ID NO:14中第1-447位氨基酸,
与SEQ ID NO:16中第1-452位氨基酸,
与SEQ ID NO:38中第1-454位氨基酸,
与SEQ ID NO:40中第1-458位氨基酸,
与SEQ ID NO:42中第1-450位氨基酸,
与SEQ ID NO:44中第1-446位氨基酸,
与SEQ ID NO:46中第1-527位氨基酸,
与SEQ ID NO:48中第1-455位氨基酸,
与SEQ ID NO:50中第1-464位氨基酸,
与SEQ ID NO:52中第1-460位氨基酸,
与SEQ ID NO:54中第1-450位氨基酸,
与SEQ ID NO:56中第1-532位氨基酸,
与SEQ ID NO:58中第1-460位氨基酸,
与SEQ ID NO:60中第1-525位氨基酸,
与SEQ ID NO:66中第1-456位氨基酸。
5.根据权利要求1所述的多肽,其中包括选自下组所述的氨基酸序列:
与存在于保藏微生物CGMCC NO.0584中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0581中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0585中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0582中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0583中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CBS 109513中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CBS 14348中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0580中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0747中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0748中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0749中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0750中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物DSM 15064中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物DSM 15065中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物DSM 15066中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,和
与存在于保藏微生物DSM 15067中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列。
6.根据权利要求5所述的多肽,其中包含由插入进存在于选自下组保藏微生物中的质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCCNO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCCNO.0580,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750,DSM 15064,DSM 15065,DSM 15066和DSM 15067。
7.根据权利要求5或6所述的多肽,其中多肽由插入进存在于选自下组保藏微生物中的质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列组成,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCCNO.0750,DSM 15064,DSM 15065,DSM 15066和DSM 15067。
8.根据权利要求5或6所述的多肽,其中多肽是一种人工变异体,与存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列相比,该变异体优选包括由具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列组成,其中所述保藏微生物为CGMCCNO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750,DSM 15064,DSM 15065,DSM 15066和DSM 15067。
9.一种具有编码如权利要求1-8任一项所述多肽的核苷酸序列的多肽。
10.一种核酸构建体,该结构含有与一种或多种指导多肽在适合宿主中生产的调控序列可操作连接的权利要求9中所述的核苷酸序列。
11.一种含有权利要求10所述核酸构建体的重组表达载体。
12.一种含有权利要求11所述的核酸构建体的重组宿主细胞。
13.一种生产权利要求1-8中任一项所述多肽的方法,该方法包括:
(a)培养一种菌株来生产多肽,该菌株野生型形式能生产多肽;和
(b)回收多肽。
14.一种生产权利要求1-8中任一项所述多肽的方法,该方法包括:
(a)在适于生产多肽的条件下培养权利要求12所述的重组宿主细胞,和
(b)回收多肽。
15.一种原位生产权利要求1-8中任一项所述多肽的方法,该方法包括:
(a)在适于生产多肽的条件下培养权利要求12所述的重组宿主细胞,和
(b)将多肽与一种所要的底物接触,没有前预先回收多肽。
16.一种含有选自下组的核苷酸序列的多核苷酸:
与SEQ ID NO:1中第1-1578位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:3中第1-1587位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:5中第1-1353位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:7中第1-1371位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:9中第1-1614位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:11中第1-1245位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:13中第1-1341位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:15中第1-1356位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:37中第1-1365位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:39中第1-1377位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:41中第1-1353位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:43中第1-1341位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:45中第1-1584位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:47中第1-1368位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:49中第1-1395位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:51中第1-1383位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:53中第1-1353位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:55中第1-1599位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:57中第1-1383位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:59中第1-1578位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:65中第1-1371位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:1中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:3中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:5中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:7中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:9中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:11中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:13中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:15中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:37中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:39中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:41中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:43中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:45中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:47中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:49中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:51中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:53中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:55中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:57中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:59中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:65中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:17中第1-221位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:18中第1-239位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:19中第1-199位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:20中第1-191位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:21中第1-232位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:22中第1-467位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:23中第1-534位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:24中第1-563位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:25中第1-218位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:26中第1-492位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:27中第1-481位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:28中第1-463位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:29中第1-513位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:30中第1-579位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:31中第1-514位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:32中第1-477位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:33中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:34中第1-470位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:35中第1-491位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:36中第1-221位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:61中第1-519位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:62中第1-497位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:63中第1-498位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:64中第1-525位核苷酸具有至少80%同一性的核苷酸序列,和
与SEQ ID NO:67中第1-951位核苷酸具有至少80%同一性的核苷酸序列。
17.一种含有选自下组所述核苷酸序列的多核苷酸:
与存在于保藏微生物CGMCC NO.0584中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0581中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0585中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0582中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0583中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CBS 109513中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CBS 14348中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0580中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0747中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0748中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0749中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0750中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物DSM 15064中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物DSM 15065中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物DSM 15066中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,和
与存在于保藏微生物DSM 15067中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
18.一种含有选自下组所述核苷酸序列的多核苷酸:
与存在于微生物玫瑰单瑞孢IFO 5372中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物产黑色腐质霉CBS 819.73中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物Ciadorrhinum foecundissimum CBS 427.97中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物棉色二孢CBS 247.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物嗜热毁丝霉CBS 117.65中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物微小根毛霉CBS 109471中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物Meripilus giganteus CBS 521.95中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物黑耳CBS 2377.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物块团炭角菌CBS 284.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物长毛盘菌CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物Acremonium sp中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物毛壳霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物Chaetomidium pingtungium中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物嗜热毁丝霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物肉桂色毁丝霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,和
与存在于微生物Sporotrichum pruinosum中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物有小孢子囊的草根霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物小柱孢菌属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物曲霉属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物帚霉属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物镰孢属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物轮枝孢属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物疫霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
19.具有编码有纤维二糖水解酶I活性的多肽的核苷酸序列的多核苷酸序列,其在高严谨条件下与选自下组所述的多核苷酸探针杂交:
(i)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,或
SEQ ID NO:65中第1-1371位核苷酸,
(ii)或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51中第1-500位核苷酸,
SEQ ID NO:53中第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,或
SEQ ID NO:67中第1-951位核苷酸,或
(iii)或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,或
SEQ ID NO:65中第1-200位核苷酸。
20.一种含有选自下组所述的修饰的核苷酸序列的多核苷酸:
含有至少一个修饰的SEQ ID NO:1的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:2第1-526位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:3的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:4第1-529位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:5的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:6第1-451位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:7的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:8第1-457位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:9的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:10第1-538位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:11的核苷酸序列,其中修饰的核苷酸序列编码一种由SEQ ID NO:12第1-415位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:13的核苷酸序列,其中修饰的核苷酸序列编码一种由SEQ ID NO:14第1-447位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:15的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:16第1-452位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:37的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:38第1-454位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:39的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:40第1-458位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:41的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:42第1-450位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:43的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:44第1-446位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:45的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:46第1-527位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:47的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:48第1-455位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:49的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:50第1-464位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:51的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:52第1-460位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:53的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:54第1-450位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:55的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:56第1-532位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:57的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:58第1-460位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:59的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:60第1-525位氨基酸组成的多肽,
含有至少一种修饰的SEQ ID NO:65的核苷酸序列,其中修饰的核苷酸序列编码一种由SEQ ID NO:66第1-456位氨基酸组成的多肽,
21.一种由存在于下组所述的微生物中的纤维二糖水解酶I编码部分核苷酸序列编码的具有纤维二糖水解酶I活性的多肽:
一种微生物,该微生物属于接合菌门,优选属于毛霉菌属,更优选属于毛霉菌科或是笄霉科,最优选属于根毛霉属或poitrasia属,尤其是微小根毛霉或poitrasia circinans。
一种微生物,该微生物属于卵菌纲,优选腐霉目,更优选腐霉科,最优选疫霉属,尤其是蔓延疫霉。
一种微生物,该微生物属于Auriculariales,优选属于Exidiaceae科,最优选黑耳。
一种微生物,该微生物属于Xylariales,优选属于炭角菌科,更优选属于炭角菌属,最优选块团炭角菌。
一种微生物,该微生物属于Dothideales,优选属于Dothideaceae科,更优选属于色二孢属,最优选棉色二孢。
一种微生物,该微生物属于盘菌目,优选属于Pyronemataceae科,更优选属于长毛盘菌科或是Sarcosoma taceae科,更优选属于长毛盘菌属或假黑盘菌属,最优选囊状长毛盘菌或淡黑假黑盘菌。
一种微生物,该微生物属于Rigidiporaceae科,优选属于Meripilus属,更优选Meripilus giganteus。
一种微生物,该微生物属于皱孔菌科,优选属于孢子丝菌属,更优选Sporotrichum Pruinosum。
一种微生物,该微生物属于蘑菇科(在Basidiomycota,Hymenomycetes,蘑菇目下),更优选属于鬼伞属,最优选灰色鬼伞。
一种微生物,该微生物属于肉座菌科,优选属于支顶孢属或有丝分裂孢子的轮枝孢属,更优选嗜热支顶孢或幼嫩轮枝孢。
一种微生物,该微生物属Cladorrhinum属,优选Cladorrhinumfoecundissimum。
一种微生物,该微生物属于毁丝霉属,优选嗜热毁丝霉或肉桂色毁丝霉。
一种微生物,该微生物属于毛壳霉属,优选嗜热毛壳霉。
一种微生物,该微生物属于Chaetomidium属,优选Chaetomidiumpingtungium。
一种微生物,该微生物属于草根霉属,优选Thielavia australiensis或有孢子囊的草根霉。
一种微生物,该微生物属于热子囊菌属,优选橙黄色热子囊菌。
一种微生物,该微生物属于单瑞孢属,优选玫瑰单瑞孢,和
一种属于产黑色腐质霉种的微生物。
22.一种使用含有如权利要求9和16-20中任一项权利要求所定义的多核苷酸的DNA改组的方法。
23.一种可通过权利要求22所述方法获得的编码具有纤维二糖酶活性的多肽的多核苷酸。
24.一种由权利要求23所述的多核苷酸编码的具有纤维二糖活性的多肽。
25.如权利要求9和16-20中任一项权利要求所定义的多核苷酸在DNA改组中的用途。
26.一种从生物质中生产乙醇的方法,包括将生物质与权利要求1-8中任一项所定义的多肽接触。
27.权利要求1-8中任一项所定义的多肽在生产乙醇中的用途。
28.一种转基因植物、植物部分或植物细胞,其中已经转化了编码权利要求1-8中任一项所定义的具有纤维二糖水解酶I活性的多肽的核苷酸序列。
29.一种含有表面活性剂和权利要求1-8任一项所述多肽的去污剂。
CNA028127684A 2001-06-26 2002-06-26 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸 Pending CN1620501A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200101000 2001-06-26
DKPA200101000 2001-06-26

Publications (1)

Publication Number Publication Date
CN1620501A true CN1620501A (zh) 2005-05-25

Family

ID=8160587

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028127684A Pending CN1620501A (zh) 2001-06-26 2002-06-26 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸

Country Status (7)

Country Link
US (10) US7785853B2 (zh)
EP (4) EP2277997B1 (zh)
CN (1) CN1620501A (zh)
AU (1) AU2002316809A1 (zh)
DK (4) DK2298868T3 (zh)
ES (4) ES2438146T3 (zh)
WO (1) WO2003000941A2 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102666847A (zh) * 2009-10-29 2012-09-12 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN102947442A (zh) * 2009-11-06 2013-02-27 诺维信股份有限公司 用于糖化纤维素材料的组合物
CN101384713B (zh) * 2005-12-22 2013-03-20 罗尔公司 纤维素材料的处理和用于其中的酶
WO2013071871A1 (en) * 2011-11-15 2013-05-23 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
CN101874109B (zh) * 2007-09-28 2013-07-10 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103517985A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103534348A (zh) * 2011-01-26 2014-01-22 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN104350148A (zh) * 2011-11-15 2015-02-11 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN104694517A (zh) * 2009-11-06 2015-06-10 诺维信股份有限公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN104962537A (zh) * 2007-05-10 2015-10-07 诺维信股份有限公司 用于增强含纤维素材料的降解或转化的组合物和方法
CN108949726A (zh) * 2018-06-15 2018-12-07 河南农业大学 一种改组纤维素酶基因及其表达载体和应用
CN113151223A (zh) * 2020-01-22 2021-07-23 山东宏业海洋科技股份有限公司 一种制备海带水解液的方法

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7883872B2 (en) * 1996-10-10 2011-02-08 Dyadic International (Usa), Inc. Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
WO2004056981A2 (en) * 2002-12-20 2004-07-08 Novozymes A/S Polypeptides having cellobiohydrolase ii activity and polynucleotides encoding same
CA2520636C (en) * 2003-04-01 2012-05-08 Genencor International, Inc. Variant humicola grisea cbh1.1
AU2004254640B2 (en) 2003-07-02 2010-08-26 Bp Corporation North America Inc. Glucanases, nucleic acids encoding them and methods for making and using them
EP1660637A4 (en) 2003-08-25 2009-10-21 Novozymes Inc VARIANTS OF GLYCOSIDE HYDROLASES
CN1875098A (zh) * 2003-10-30 2006-12-06 诺和酶股份有限公司 新家族的碳水化合物结合组件
EP2287179A3 (en) 2004-01-09 2011-05-18 Novozymes A/S Increased bacillus YweA expression
AU2005269084B2 (en) 2004-08-06 2010-05-27 Novozymes A/S Polypeptides of Botryosphaeria rhodina
ES2358243T5 (es) * 2005-01-06 2014-06-09 Novozymes, Inc. Polipéptidos con actividad celobiohidrolasa y polinucleótidos que los codifican
EP1861506B1 (en) 2005-03-15 2015-04-15 BP Corporation North America Inc. Cellulases, nucleic acids encoding them and methods for making and using them
NZ595499A (en) 2006-02-10 2013-05-31 Verenium Corp Cellulolytic enzymes, nucleic acids encoding them and methods for making and using them
ES2368608T3 (es) * 2006-03-20 2011-11-18 Novozymes, Inc. Polipéptidos con actividad endoglucanasa y polinucleótidos codifcando los polipéptidos.
BRPI0710217A2 (pt) 2006-03-30 2011-08-02 Novozymes Inc polipeptìdeo, polinucleotìdeo, construção de ácido nucleico, vetor de expressão recombinante, célula hospedeira recombinante, métodos para produzir o polipeptìdeo, para produzir um mutante a partir de uma célula precursora, para produzir uma proteìna, para produzir um polinucleotìdeo, para degradar ou converter um material celulósico, para produzir uma substáncia e para inibir a expressão de um polinucleotìdeo em uma célula, célula mutante, planta transgênica, parte de planta ou célula de planta, e, molécula de rna de filamento duplo
EP2007884B1 (en) * 2006-04-13 2012-05-16 AB Enzymes Oy Cellulase fusion proteins and their use
US7361487B2 (en) * 2006-04-13 2008-04-22 Ab Enzymes Oy Enzyme fusion proteins and their use
FI119434B (fi) * 2006-04-13 2008-11-14 Ab Enzymes Oy Entsyymifuusioproteiineja ja niiden käyttö
CA2658483A1 (en) 2006-07-21 2008-01-24 Xyleco, Inc. Conversion systems for biomass
BRPI0714876B1 (pt) 2006-08-04 2022-04-19 Verenium Corporation Ácido nucleico isolado, sintético ou recombinante, cassete de expressão, vetor ou veículo de clonagem, célula bacteriana, fúngica ou de levedura transformada, polipeptídeo isolado, sintético ou recombinante, composição, bem como métodos de produção e de usos dos mesmos
US8017373B2 (en) * 2006-08-31 2011-09-13 Iogen Energy Corporation Process for enzymatic hydrolysis of pretreated lignocellulosic feedstocks
US8017361B2 (en) * 2007-08-30 2011-09-13 Iogen Energy Corporation Enzymatic hydrolysis of lignocellulosic feedstocks using accessory enzymes
WO2009133035A1 (en) * 2008-04-29 2009-11-05 Dsm Ip Assets B.V. Cellobiohydrolase 1 from penicillium chysogenum and uses thereof
WO2009138877A2 (en) * 2008-05-11 2009-11-19 Universiteit Stellenbosch Heterologous expression of fungal cellobiohydrolases in yeast
US8658398B2 (en) 2008-07-07 2014-02-25 Mascoma Corporation Heterologous expression of termite cellulases yeast
DK2421965T3 (en) * 2009-04-24 2016-09-05 Dsm Ip Assets Bv Carbohydratdegraderende polypeptide and uses thereof
FI122937B (fi) 2009-12-30 2012-09-14 Roal Oy Menetelmä selluloosamateriaalin käsittelemiseksi sekä tässä käyttökelpoiset CBH II/Cel6A entsyymit
DK2357227T3 (en) 2010-02-11 2015-09-14 Süd Chemie Ip Gmbh & Co Kg Optimized cellulase enzymes
WO2011143632A2 (en) * 2010-05-14 2011-11-17 Codexis, Inc. Cellobiohydrolase variants
MX2013007720A (es) 2011-01-26 2013-08-09 Novozymes As Polipeptidos que tienen actividad celobiohidrolasa y polinucleotidos que codifican para los mismos.
BR112013019039A2 (pt) 2011-01-26 2020-07-21 Novozymes A/S Célula hospedeira microbiana transgênica, métodos para produzir um polipeptídeo, para produzir um mutante de uma célula originária, para produzir uma proteína, para degradar um material celulósico, para produzir um produto de fermentação, 5 e parafermentar um material celulósico, construção de ácido nucleico ou vetor de expressão, polipeptídeo isolado, e polinucleotídeo isolado
EP2748187A4 (en) 2011-08-23 2015-03-04 Codexis Inc VARIANTS OF CELLOBIOHYDROLASE
US20130109055A1 (en) 2011-10-31 2013-05-02 Bp Corporation North America Inc. Use of mammalian promoters in filamentous fungi
WO2013067026A1 (en) 2011-10-31 2013-05-10 Bp Corporation North America Inc. Use of plant promoters in filamentous fungi
WO2013138357A1 (en) * 2012-03-12 2013-09-19 Codexis, Inc. Cbh1a variants
TR201815368T4 (tr) * 2012-08-16 2018-11-21 Bangladesh Jute Res Institute Macrophomina Phaseolina'dan elde edilen selüloz ve hemiselüloz parçalama enzimleri ve bunların kullanımları.
WO2014070856A2 (en) 2012-11-02 2014-05-08 Bp Corporation North America Inc. Thermotolerant beta-glucosidase variants
US8778640B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8778641B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8993275B2 (en) * 2013-02-12 2015-03-31 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8753860B1 (en) * 2013-02-12 2014-06-17 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8771994B1 (en) * 2013-02-12 2014-07-08 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
WO2014145768A2 (en) 2013-03-15 2014-09-18 Bp Corporation North America Inc. Use of non-fungal 5' utrs in filamentous fungi
US11390898B2 (en) * 2014-09-05 2022-07-19 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same

Family Cites Families (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1296839A (zh) 1969-05-29 1972-11-22
GB1372034A (en) 1970-12-31 1974-10-30 Unilever Ltd Detergent compositions
GB1483591A (en) 1973-07-23 1977-08-24 Novo Industri As Process for coating water soluble or water dispersible particles by means of the fluid bed technique
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
EP0218272B1 (en) 1985-08-09 1992-03-18 Gist-Brocades N.V. Novel lipolytic enzymes and their use in detergent compositions
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
DE3750450T2 (de) 1986-08-29 1995-01-05 Novo Industri As Enzymhaltiger Reinigungsmittelzusatz.
NZ221627A (en) 1986-09-09 1993-04-28 Genencor Inc Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios
ES2076939T3 (es) 1987-08-28 1995-11-16 Novo Nordisk As Lipasa recombinante de humicola y procedimiento para la produccion de lipasas recombinantes de humicola.
JPS6474992A (en) 1987-09-16 1989-03-20 Fuji Oil Co Ltd Dna sequence, plasmid and production of lipase
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
ATE129523T1 (de) 1988-01-07 1995-11-15 Novo Nordisk As Spezifische protease.
JP3079276B2 (ja) 1988-02-28 2000-08-21 天野製薬株式会社 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法
US5776757A (en) 1988-03-24 1998-07-07 Novo Nordisk A/S Fungal cellulase composition containing alkaline CMC-endoglucanase and essentially no cellobiohydrolase and method of making thereof
EP0406314B1 (en) 1988-03-24 1993-12-01 Novo Nordisk A/S A cellulase preparation
US5487989A (en) * 1988-08-31 1996-01-30 Bioenergy International, L.C. Ethanol production by recombinant hosts
GB8915658D0 (en) 1989-07-07 1989-08-23 Unilever Plc Enzymes,their production and use
US5120463A (en) * 1989-10-19 1992-06-09 Genencor International, Inc. Degradation resistant detergent compositions based on cellulase enzymes
NZ237549A (en) 1990-03-23 1993-06-25 Gist Brocades Nv Production of enhanced levels of enzymes in the seeds of transgenic plants and the use of these seeds
DK0528828T4 (da) 1990-04-14 1998-08-31 Genencor Internat Gmbh Alkaliske bacillus-lipaser, DNA-sekvenser, der koder herfor, og bacilli der producerer sådanne lipaser
EP0531372B2 (en) 1990-05-09 2004-04-14 Novozymes A/S A cellulase preparation comprising an endoglucanase enzyme
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
AU657278B2 (en) 1990-09-13 1995-03-09 Novo Nordisk A/S Lipase variants
DE69133035T2 (de) 1991-01-16 2003-02-13 Procter & Gamble Kompakte Waschmittelzusammensetzungen mit hochaktiven Cellulasen
EP0511456A1 (en) 1991-04-30 1992-11-04 The Procter & Gamble Company Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme
HU213044B (en) 1991-04-30 1997-01-28 Procter & Gamble Built liquid detergents with boric-polyol complex to inhibit proteolytic enzyme with additives improving detergent effect
DE69226182T2 (de) 1991-05-01 1999-01-21 Novo Nordisk As Stabilisierte enzyme und waschmittelzusammensetzungen
DK72992D0 (da) 1992-06-01 1992-06-01 Novo Nordisk As Enzym
DK88892D0 (da) 1992-07-06 1992-07-06 Novo Nordisk As Forbindelse
ES2334590T3 (es) 1992-07-23 2010-03-12 Novozymes A/S Alfa-amilasa mutante, detergente y agente de lavado de vajilla.
JP3681750B2 (ja) 1992-10-06 2005-08-10 ノボザイムス アクティーゼルスカブ セルラーゼ変異体
PL310326A1 (en) 1993-02-11 1995-12-11 Genencor Int Novel oxidation-stable mutants of alpha-amylase as well as detergent and starch liquefaction compositions containing them
JP3618748B2 (ja) 1993-04-27 2005-02-09 ジェネンコー インターナショナル インコーポレイテッド 洗剤に使用する新しいリパーゼ変異体
DK52393D0 (zh) 1993-05-05 1993-05-05 Novo Nordisk As
CN1129011A (zh) * 1993-07-12 1996-08-14 诺沃挪第克公司 含有两种纤维素酶成分的洗涤剂组合物
JP2859520B2 (ja) 1993-08-30 1999-02-17 ノボ ノルディスク アクティーゼルスカブ リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物
KR100338786B1 (ko) 1993-10-13 2002-12-02 노보자임스 에이/에스 H2o2-안정한퍼록시다제변이체
JPH07143883A (ja) 1993-11-24 1995-06-06 Showa Denko Kk リパーゼ遺伝子及び変異体リパーゼ
GB9400623D0 (en) 1994-01-14 1994-03-09 Univ Leeds Exploitation of the cellulase enzyme complex of neurospora
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
MX9603542A (es) 1994-02-22 1997-03-29 Novo Nordisk As Metodo para preparar una variante de una enzima lipolitica.
DK0749473T3 (da) 1994-03-08 2006-02-27 Novozymes As Hidtil ukendte alkaliske cellulaser
US6017866A (en) 1994-05-04 2000-01-25 Genencor International, Inc. Lipases with improved surfactant resistance
KR970703426A (ko) 1994-06-03 1997-07-03 제임스 쉐한 정제된 Myceliophthora 락카제 및 그것을 암호화 하는 핵산(PURIFIED MYCELIOPHTHORA LACCASES AND NUCLEIC ACIDS ENCODING SAME)
AU2884595A (en) 1994-06-20 1996-01-15 Unilever Plc Modified pseudomonas lipases and their use
WO1996000292A1 (en) 1994-06-23 1996-01-04 Unilever N.V. Modified pseudomonas lipases and their use
CN101659926A (zh) 1994-06-30 2010-03-03 诺沃奇梅兹有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
EP1995303A3 (en) 1994-10-06 2008-12-31 Novozymes A/S Enzyme preparation with endoglucanase activity
BE1008998A3 (fr) 1994-10-14 1996-10-01 Solvay Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci.
US5827719A (en) 1994-10-26 1998-10-27 Novo Nordisk A/S Enzyme with lipolytic activity
AR000862A1 (es) 1995-02-03 1997-08-06 Novozymes As Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del
JPH08228778A (ja) 1995-02-27 1996-09-10 Showa Denko Kk 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法
CN101173263A (zh) 1995-03-17 2008-05-07 诺沃奇梅兹有限公司 新的内切葡聚糖酶
ATE282087T1 (de) 1995-07-14 2004-11-15 Novozymes As Modifiziertes enzym mit lipolytischer aktivität
WO1997007205A1 (en) 1995-08-11 1997-02-27 Novo Nordisk A/S Method for preparing polypeptide variants
EP0851913B1 (en) 1995-08-11 2004-05-19 Novozymes A/S Novel lipolytic enzymes
DK0857216T3 (en) 1995-10-17 2014-12-15 Ab Enzymes Oy Cellulases, GENES ENCODING THEM AND USES THEREOF
US6184019B1 (en) * 1995-10-17 2001-02-06 Röhm Enzyme Finland OY Cellulases, the genes encoding them and uses thereof
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US5763385A (en) 1996-05-14 1998-06-09 Genencor International, Inc. Modified α-amylases having altered calcium binding properties
WO1998008940A1 (en) 1996-08-26 1998-03-05 Novo Nordisk A/S A novel endoglucanase
EP0937138B1 (en) 1996-09-17 2006-04-26 Novozymes A/S Cellulase variants
CN1232384A (zh) 1996-10-08 1999-10-20 诺沃挪第克公司 作为染料前体的二氨基苯甲酸衍生物
AU4773197A (en) 1996-11-04 1998-05-29 Novo Nordisk A/S Subtilase variants and compositions
KR100561826B1 (ko) 1996-11-04 2006-03-16 노보자임스 에이/에스 섭틸라제 변종과 조성물
CN1208456C (zh) 1996-12-20 2005-06-29 诺维信公司 体内重组
WO1998034946A1 (en) 1997-02-12 1998-08-13 Massachusetts Institute Of Technology Daxx, a novel fas-binding protein that activates jnk and apoptosis
JPH10242147A (ja) 1997-02-27 1998-09-11 Toshiba Corp 半導体装置およびその製造方法ならびに半導体記憶装置およびその製造方法
US6159687A (en) 1997-03-18 2000-12-12 Novo Nordisk A/S Methods for generating recombined polynucleotides
EP1015575B1 (en) 1997-03-18 2010-05-19 Novozymes A/S Shuffling of heterologous dna sequences
US6159688A (en) 1997-03-18 2000-12-12 Novo Nordisk A/S Methods of producing polynucleotide variants
JP2001512024A (ja) * 1997-07-31 2001-08-21 デーエスエム・ナムローゼ・フェンノートシャップ アスペルギルスのセルロース分解酵素
CA2379326A1 (en) * 1999-07-13 2001-01-18 Midwest Research Institute Cellobiohydrolase reduced glycosylation variants: cbhin45a; cbhin270a; and cbhin384a
AU4352700A (en) 1999-10-06 2001-05-10 Mark Aaron Emalfarb High-throughput screening of expressed dna libraries in filamentous fungi
JP4922524B2 (ja) * 2000-04-13 2012-04-25 ダイアデイツク・インターナシヨナル(ユーエスエイ)インコーポレーテツド 糸状菌の分野における新規発現調節配列および発現産物

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101384713B (zh) * 2005-12-22 2013-03-20 罗尔公司 纤维素材料的处理和用于其中的酶
CN102174492B (zh) * 2005-12-22 2014-01-01 罗尔公司 纤维素材料的处理和用于其中的酶
CN104962537A (zh) * 2007-05-10 2015-10-07 诺维信股份有限公司 用于增强含纤维素材料的降解或转化的组合物和方法
CN101874109B (zh) * 2007-09-28 2013-07-10 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN102666847B (zh) * 2009-10-29 2015-12-09 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN102666847A (zh) * 2009-10-29 2012-09-12 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN102947442A (zh) * 2009-11-06 2013-02-27 诺维信股份有限公司 用于糖化纤维素材料的组合物
CN104694517B (zh) * 2009-11-06 2019-06-28 诺维信股份有限公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN106167796B (zh) * 2009-11-06 2019-06-04 诺维信股份有限公司 用于糖化纤维素材料的组合物
CN106167796A (zh) * 2009-11-06 2016-11-30 诺维信股份有限公司 用于糖化纤维素材料的组合物
CN102947442B (zh) * 2009-11-06 2016-03-09 诺维信股份有限公司 用于糖化纤维素材料的组合物
CN104694517A (zh) * 2009-11-06 2015-06-10 诺维信股份有限公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN103517985A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103620028A (zh) * 2011-01-26 2014-03-05 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103517985B (zh) * 2011-01-26 2016-12-07 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103620028B (zh) * 2011-01-26 2017-05-03 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103534348B (zh) * 2011-01-26 2018-04-10 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103534348A (zh) * 2011-01-26 2014-01-22 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN110628803A (zh) * 2011-01-26 2019-12-31 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN104350148A (zh) * 2011-11-15 2015-02-11 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
WO2013071871A1 (en) * 2011-11-15 2013-05-23 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
CN108949726A (zh) * 2018-06-15 2018-12-07 河南农业大学 一种改组纤维素酶基因及其表达载体和应用
CN108949726B (zh) * 2018-06-15 2021-11-16 河南农业大学 一种改组纤维素酶基因及其表达载体和应用
CN113151223A (zh) * 2020-01-22 2021-07-23 山东宏业海洋科技股份有限公司 一种制备海带水解液的方法
CN113151223B (zh) * 2020-01-22 2022-08-30 山东宏业海洋科技股份有限公司 一种制备海带水解液的方法

Also Published As

Publication number Publication date
US20130078679A1 (en) 2013-03-28
DK2298868T3 (en) 2015-04-20
US8603793B2 (en) 2013-12-10
US9309504B2 (en) 2016-04-12
EP2298868B1 (en) 2015-01-07
AU2002316809A1 (en) 2003-01-08
US8993299B2 (en) 2015-03-31
EP2277997A2 (en) 2011-01-26
DK1421224T3 (da) 2013-01-21
WO2003000941A3 (en) 2004-03-25
US20130034890A1 (en) 2013-02-07
EP2298868A3 (en) 2011-05-11
US20150218542A1 (en) 2015-08-06
US20040197890A1 (en) 2004-10-07
US20120237993A1 (en) 2012-09-20
EP1421224B1 (en) 2012-10-17
ES2533923T3 (es) 2015-04-16
EP2295544A2 (en) 2011-03-16
US20140051142A1 (en) 2014-02-20
ES2397267T3 (es) 2013-03-05
US9447399B2 (en) 2016-09-20
DK2277997T3 (da) 2013-12-02
EP1421224A2 (en) 2004-05-26
ES2589831T3 (es) 2016-11-16
WO2003000941A2 (en) 2003-01-03
EP2277997A3 (en) 2011-05-18
US8338156B2 (en) 2012-12-25
EP2277997B1 (en) 2013-09-18
US9187739B2 (en) 2015-11-17
DK2295544T3 (en) 2016-09-26
US8986969B2 (en) 2015-03-24
US20140051143A1 (en) 2014-02-20
US20160177282A1 (en) 2016-06-23
US7785853B2 (en) 2010-08-31
US20100256037A1 (en) 2010-10-07
US20160046919A1 (en) 2016-02-18
EP2295544B1 (en) 2016-06-22
ES2438146T3 (es) 2014-01-16
EP2298868A2 (en) 2011-03-23
US8603794B2 (en) 2013-12-10
EP2295544A3 (en) 2011-04-27
US8507238B2 (en) 2013-08-13

Similar Documents

Publication Publication Date Title
CN1620501A (zh) 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸
CN1729287A (zh) 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸
CN1234854C (zh) 具有碱性α-淀粉酶活性的多肽以及编码该多肽的核酸
CN1509330A (zh) 具有纤维二糖酶活性的多肽和编码其的多核苷酸
CN1211483C (zh) 具有分支酶活性的多肽及其编码核酸
CN1902310A (zh) 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸
CN1875097A (zh) 杂交酶
CN1351657A (zh) 具有碱性α-淀粉酶活性的多肽及其编码核酸
CN1309700A (zh) 葡糖淀粉酶变体
CN1360630A (zh) 葡糖淀粉酶变体
CN101031643A (zh) 具有α-葡糖苷酶活性的多肽及编码其的多核苷酸
CN1195058C (zh) 草酰乙酸水解酶缺陷型真菌宿主细胞
CN1816631A (zh) β-葡糖苷酶的变体
CN101052721A (zh) Botryosphaeria Rhodina的多肽
CN1842596A (zh) 用于淀粉加工的酶
CN1137994C (zh) 具有葡聚糖转移酶活性的多肽和编码该多肽的核酸
CN1930285A (zh) 脂环酸芽孢杆菌的多肽

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20050525