CN1729287A - 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸 - Google Patents

具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸 Download PDF

Info

Publication number
CN1729287A
CN1729287A CNA2003801069409A CN200380106940A CN1729287A CN 1729287 A CN1729287 A CN 1729287A CN A2003801069409 A CNA2003801069409 A CN A2003801069409A CN 200380106940 A CN200380106940 A CN 200380106940A CN 1729287 A CN1729287 A CN 1729287A
Authority
CN
China
Prior art keywords
seq
polypeptide
nucleotide
aminoacid sequence
identity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2003801069409A
Other languages
English (en)
Inventor
吴文平
莱恩·兰格
多米尼克·A·斯科夫伦德
刘晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=32682155&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1729287(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1729287A publication Critical patent/CN1729287A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • C11D3/38645Preparations containing enzymes, e.g. protease or amylase containing cellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明涉及具有纤维二糖水解酶II活性的多肽及具有编码该多肽的核苷酸序列的多核苷酸。本发明也涉及核酸构建体、载体和宿主细胞,其包含了所述多核苷酸,以及制备和应用所述多核苷酸的方法。

Description

具有纤维二糖水解酶II活性的 多肽及编码它的多核苷酸
技术领域
本发明涉及具有纤维二糖水解酶II(cellobiohydrolase II)(也称为CBH II或CBH2)活性的多肽及含有编码该多肽的核苷酸序列的多核苷酸。本发明也涉及核酸构建体、载体和宿主细胞,其包含该核酸构建体,以及制备和应用所述多肽的方法。
发明背景
纤维素是重要的工业原材料和可重新利用的能量来源。天然纤维素的物理结构和形态非常复杂,其结构的详细细节很难通过实验来确定。然而,纤维素的化学成分非常简单,它是由D-葡萄糖残基通过β-1,4-糖苷键连接形成线性多聚体,其链长可超过10000糖苷残基。
有效地对纤维素的降解要求多种类型酶的协同作用。至少有三种类型的酶对于将纤维素转化成葡萄糖是必需的:随机切割纤维素链的内切(1,4)-β-D-葡聚糖酶(EC.3.2.1.4);自纤维素链的末端切下纤维二糖单元的纤维素二糖水解酶(EC3.2.1.91)以及将纤维二糖和可溶性纤维糊精转换成葡萄糖。在涉及纤维素的生物降解的这三种类型的酶中,纤维二糖水解酶(cellobiohydrolases)是降解天然晶态纤维素(crystalline cellulose)的关键酶。
外切-纤维二糖水解酶(纤维二糖水解酶II或CBH II)是指通过从纤维素聚合链的还原末端水解纤维二糖而降解纤维素的纤维二糖水解酶。纤维二糖水解酶II组属于与纤维二糖水解酶I相同的EC组,即EC3.2.1.91,其区别是纤维二糖水解酶I通过从纤维素聚合链的非还原末端水解纤维二糖而降解纤维素。
本发明的目的之一是提供具有纤维二糖水解酶II活性的改进的多肽,及其编码所述多肽的多核苷酸。所述改进的多肽具有改善的特异性活性和/或改善的稳定性-尤其是改善了热稳定性。所述多肽也具有改善的对纤维二糖的抑制性的抗性。
发明概述
本发明的第一个方面涉及具有纤维二糖水解酶II活性的多肽,选自:
(a)含有选自下述氨基酸序列的多肽:与SEQ ID NO:2的第1至477位氨基酸所示的氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:4的第1至82位氨基酸所示的部分氨基酸序列的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:4的第1至420位氨基酸所示的部分氨基酸序列的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:6的第1至139位氨基酸所示的部分氨基酸序列的同一性至少80%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:8的第1至102位氨基酸所示的部分氨基酸序列的同一性至少95%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:10的第1至144位氨基酸所示的部分氨基酸序列的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:12的第1至99位氨基酸所示的部分氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:14的第1至140位氨基酸所示的部分氨基酸序列的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:16的第1至109位氨基酸所示的部分氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:16所示的氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:18的第1至143位氨基酸所示的部分氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:20的第1至71位氨基酸所示的部分氨基酸序列的同一性至少70%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:22的第1至220位氨基酸所示的氨基酸序列的同一性至少60%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:24的第1至458位氨基酸所示的氨基酸序列的同一性至少65%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:26的第1至390位氨基酸所示的氨基酸序列的同一性至少70%的氨基酸序列,
(b)含有选自下述的氨基酸序列的多肽:与由Chaetomium thermophilum的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述的氨基酸序列的多肽:与由Mycellophtora thermophila的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少85%的氨基酸序列,
与由编码的多肽的同一性至少80%的氨基酸序列,
与由Acremonium thermophilum的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少80%的氨基酸序列,
与由Melanocarpus sp.的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少95%的氨基酸序列,
与由Thielavia microspora的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少85%的氨基酸序列,
与由曲霉属菌种(Aspergillus sp.)的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少75%的氨基酸序列,
与由Thielavia australiensis的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少85%的氨基酸序列,
与由塔宾曲霉(Aspergillus tubingensis)的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少75%的氨基酸序列,
与由密粘褶菌(Gloeophyllum trabeum)的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少75%的氨基酸序列,
与由Meripilus giganteus的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少70%的氨基酸序列,
与由Trichophaea saccata的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少60%的氨基酸序列,
与由Stilbella annulata的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少65%的氨基酸序列,
与由Malbrancheae cinnamomea的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少70%的氨基酸序列,
(c)含有选自下述氨基酸序列的多肽:与SEQ ID NO:1的第63至1493位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:3的第1至246位核苷酸编码的多肽的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:3的第1至1272位核苷酸编码的多肽的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:5的第1至417位核苷酸编码的多肽的同一性至少80%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:7的第1至306位核苷酸编码的多肽的同一性至少95%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:9的第1至432位核苷酸编码的多肽的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:11的第1至297位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:13的第1至420位核苷酸编码的多肽的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:15的第1至330位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:15的第1至1221位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:15的第1至1221位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:17的第1至429位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:19的第1至213位核苷酸编码的多肽的同一性至少70%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:21的第43至701位核苷酸编码的多肽的同一性至少60%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:23的第21至1394位核苷酸编码的多肽的同一性至少65%的氨基酸序列,以及
含有选自下述氨基酸序列的多肽:与SEQ ID NO:25的第41至1210位核苷酸编码的多肽的同一性至少70%的氨基酸序列,
(d)由在高度严谨条件下能与选自下述的多核苷酸探针杂交的核苷酸序列编码的多肽:
(iv)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-1493位核苷酸,
SEQ ID NO:3的第1-246位核苷酸,
SEQ ID NO:3的第1-1272位核苷酸,
SEQ ID NO:5的第1-417位核苷酸,
SEQ ID NO:7的第1-306位核苷酸,
SEQ ID NO:9的第1-432位核苷酸,
SEQ ID NO:11的第1-297位核苷酸,
SEQ ID NO:13的第1-420位核苷酸,
SEQ ID NO:15的第1-330位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-429位核苷酸,
SEQ ID NO:19的第1-213位核苷酸,
SEQ ID NO:21的第43-701位核苷酸,
SEQ ID NO:23的第21-1394位核苷酸,以及
SEQ ID NO:25的第41-1210位核苷酸,
(v)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-563位核苷酸,
SEQ ID NO:21的第43-543位核苷酸,
SEQ ID NO:23的第21-521位核苷酸,以及
SEQ ID NO:25的第41-541位核苷酸,
(vi)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-263位核苷酸,
SEQ ID NO:3的第1-200位核苷酸,
SEQ ID NO:5的第1-200位核苷酸,
SEQ ID NO:7的第1-200位核苷酸,
SEQ ID NO:9的第1-200位核苷酸,
SEQ ID NO:11的第1-200位核苷酸,
SEQ ID NO:13的第1-200位核苷酸,
SEQ ID NO:15的第1-200位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-200位核苷酸,
SEQ ID NO:19的第1-200位核苷酸,
SEQ ID NO:21的第43-243位核苷酸,
SEQ ID NO:23的第21-221位核苷酸,以及
SEQ ID NO:25的第41-241位核苷酸,
(e)具有纤维二糖水解酶II活性的(a)、(b)或(c)的片段。
本发明第二个方面涉及具有编码了本发明多肽的核苷酸序列的多核苷酸。
本发明第三个方面涉及核酸构建体,其含有编码本发明多肽的核苷酸序列,可操作性的连接于一个或多个调控序列,其指导在合适的宿主中产生多肽。
本发明第四个方面涉及含有本发明的核酸构建体的重组表达载体。
本发明第五个方面涉及含有本发明的核酸构建体的重组宿主细胞。
本发明第六个方面涉及制备本发明的多肽的方法,该方法包括:
(a)培养在野生型即能产生所述多肽的菌株,以产生所述多肽,以及
(b)收获所述多肽
本发明第七个方面涉及产生本发明的多肽的方法,该方法包括:
(a)在能够诱导产生本发明多肽的条件下培养本发明的重组宿主细胞,以及
(b)收获所述多肽
本发明第八个方面涉及原位(in-situ)产生本发明的多肽的方法,该方法包括:
(a)在能够诱导产生本发明的多肽的条件下培养本发明的重组宿主细胞,以及
(b)将产生的多肽与预期底物接触,而预先不进行多肽的收获。
基于下述描述和所附的权利要求,本发明的其它方面变得显而易见。
定义
在详细描述本发明之前,对下述术语和惯例进行定义:
基本(substantially)纯的多肽:在本发明中,术语“基本纯的多肽”指多肽制备物包含最多10%重量的与所述多肽天然关联的其它多肽物质(优选更低百分比的其它多肽物质,例如最多8%重量、最多6%重量、最多5%重量、最多4%重量、最多3%重量、最多2%重量、最多1%重量,及最多0.5%重量)。因此,优选基本纯的多肽至少92%的纯度,即在制备物中所述多肽至少占整个多肽物质的92%重量,以及更高百分比优选为例如至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的纯度,以及最多(at themost)99.5%的纯度。此处公开的多肽优选为基本纯的形式。尤其是,此处公开的多肽优选为“基本上(essentially)纯的形式”,即多肽制备物基本上不含与所述多肽天然关联的其它多肽。例如,可通过公知重组方法来制备。在此处,术语“基本纯的多肽”与术语“分离的多肽”和“分离形式的多肽”是同义词。
纤维二糖水解酶II活性:术语“纤维二糖水解酶II活性”此处定义为纤维素1,4-β-纤维二糖水解酶活性(也称为外切-葡聚糖酶、外切-纤维二糖水解酶或1,4-β-纤维二糖水解酶)活性,酶分类为EC3.2.1.91或CAZy FamilyGlycoside Hydrolase Family 6,所述酶活性催化对纤维素和纤维四糖中的1,4-β-D-糖苷键的水解,从链的还原端释放出纤维二糖。
在本发明中,纤维二糖水解酶II活性可通过实施例2中描述的方法来测定。
在一个实施方式中,纤维二糖水解酶II活性可根据描述于DeshpandeMV等,Methods in Enzymoloyg(1988)一书中第126-130页的“外切-1,4-β-葡聚糖酶的筛选试验”方法来测定。根据该方法,一单位纤维二糖水解酶II活性(葡糖苷键(gluconic bond)的切割活性)被定义为在50℃,pH5.0条件下,每分钟产生1.0微摩尔的p-硝基酚。本发明的多肽优选具有至少20%纤维二糖水解酶II活性的选自下述序列的氨基酸序列组成的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24及SEQ ID NO:26。在特别优选的实施方式中,多肽应当具有至少40%,如至少50%,优选至少60%,如至少70%,更优选至少80%,如至少90%,最优选至少95%,如约或至少100%的纤维二糖水解酶II活性的选自下述序列的氨基酸序列组成的多肽:SEQ ID NO:2的第1-477位氨基酸,SEQ ID NO:4的第1-82位氨基酸,SEQ ID NO:4的第1-420位氨基酸,SEQ ID NO:6的第1-139位氨基酸,SEQ ID NO:8的第1-102位氨基酸,SEQ ID NO:10的第1-144位氨基酸,SEQ ID NO:12的第1-99位氨基酸,SEQ ID NO:14的第1-140位氨基酸,SEQ ID NO:16的第1-109位氨基酸,SEQ ID NO:16的第1-407位氨基酸,SEQ ID NO:18的第1-143位氨基酸,SEQ ID NO:20的第1-71位氨基酸,SEQ ID NO:22的第1-220位氨基酸,SEQ ID NO:24的第1-458位氨基酸,以及SEQ IDNO:26的第1-390位氨基酸。
同一性:在本发明说明书中,两个氨基酸序列之间或两个核苷酸序列之间的同源性被用参数“同一性”来描述。
在本发明中,两个氨基酸序列之间的同一性程度用FASTA程序来确定,该程序包括在2.0版的FASTA程序包中(参见W.R.Pearson和D.J.Lipman(1988),“Improved Tools for Biological Sequence Analysis”,PNAS85:2444-2448;和W.R.Pearson(1990)“Rapid and Sensitive SequenceComparison with FASTP and FASTA”,Method in Enzymology 183:63-98)。使用BLOSUM50作为分数矩阵(scoring matrix),缺口罚分为-12,以及缺口延伸罚分为-2。
两个核苷酸序列之间的同一性程度用上述相同的算法和软件包来确定。使用同一性矩阵(identity)作为分数矩阵(scoring matrix),缺口罚分为-16,以及缺口延伸罚分为-4。
片段:在这里,选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ IDNO:26中的序列的“片段”是指在这些序列的氨基和/或碳末端缺失具有一个或多个氨基酸后的多肽。
等位基因突变体:在本发明说明书中,术语“等位基因突变体“指在相同的染色体位点出现的两个或多个变换(alternative)形式的基因。等位基因突变体是指通过自然突变产生的,可以导致群体中的多态性。基因突变可以沉默的(未改变编码的多肽)或者编码的多肽具有改变的氨基酸序列。一个多肽的等位基因突变体是由等位基因突变体编码的多肽。
基本纯的多核苷酸:术语“基本纯的多核苷酸”在这里所指的多核苷酸制备物,已从其天然遗传环境中分离出来,因而不含有其它额外的或不期望的编码序列,并适合用于遗传工程蛋白制备体系中。因此,基本纯的多核苷酸含有最多10%重量的其它与所述多核苷酸关联的多核苷酸物质(优选更低百分比的其它多核苷酸物质,例如最多8%重量、最多6%重量、最多5%重量、最多4%重量、最多3%重量、最多2%重量、最多1%重量,及最多0.5%重量)。然而,基本纯的多核苷酸可包括天然存在的5’和3’非翻译区,如启动子和终止子。优选基本纯的多核苷酸至少92%的纯度,即在制备物中所述多核苷酸至少占整个多核苷酸物质的92%重量,以及优选更高百分比为例如至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的纯度,以及最多99.5%的纯度。此处公开的多核苷酸优选为基本纯的形式。尤其是,此处公开的多核苷酸优选为“基本纯的形式”,即多核苷酸制备物基本上不含与所述多核苷酸天然关联的其它多核苷酸。在此处,术语“基本纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”是同义词。
修饰:在本发明中,术语“修饰”意指对选自下述序列号所示氨基酸序列所组成的多肽的任何化学修饰:SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26,也指对编码所述多肽的DNA进行的遗传操作。修饰可以是对氨基酸侧链的替换(replacement)、或在感兴趣的氨基酸位点进行取代、缺失和/或插入。
人工突变体:在此处,术语“人工突变体”指具有纤维二糖水解酶II活性的多肽是通过生物表达相对于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23及SEQ ID NO:25而言的修饰基因来制备。修饰基因在合适的宿主中表达产生所述突变体,所述修饰基因可通过人为干预来修饰选自下述的核苷酸序列来获得:SEQ ID NO:l、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ ID NO:25。
cDNA:术语“cDNA”在此处指包括了从来源于真核细胞的成熟、剪切mRNA通过反转录制备得到的DNA分子。cDNA缺乏内含子序列,而在相应的基因组DNA中通常存在内含子序列。起始的最初的RNA转录体是mRNA的前体,通过一系列加工事件最后成为成熟的剪切mRNA。这些事件包括通过称为剪切步骤而将内含子序列去除。故从mRNA获得的cDNA缺乏内含子序列。
核酸构建体:在此处,术语“核酸构建体”指核酸分子,可以是单链或双链,它已从天然存在的基因中分离出来或已被修饰成包含了以自然状态下不存在的形式的核酸片段。当核酸构建体包含了表达本发明的编码序列所需要的调控序列时,术语核酸构建体与术语“表达盒”是同义词。
调控序列:术语“调控序列”在此处包括所有对于表达本发明的多肽的表达所必需或有利的元件。每一个调控序列可以是与编码所述多肽的核苷酸序列而言是内源或外源的。这种调控序列包括,但不局限于,前导序列、聚腺苷化序列、前体肽(propeptide)序列、启动子、信号肽序列和转录终止子。最小的情况是,调控序列包括启动子,和转录和翻译终止信号。调控序列可以引入有特异的限制性位点的接头而有利于将其与编码所述多肽的核苷酸序列的编码区连接。
可操作性连接:术语“可操作性连接”指调控序列相对于DNA序列的编码序列以置于合适的位置而能使调控序列指导多肽的表达。
编码序列:术语“编码序列”在此处指覆盖了编码蛋白质产物的特定氨基酸序列的核苷酸序列。编码序列的边界通常由开放阅读框来确定,常常开始于ATG起始密码子。编码序列典型包括DNA、cDNA和重组核苷酸序列。
表达:在本发明中,术语“表达”包括涉及产生多肽的任何步骤,包括,但不局限于,转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:在此处,术语“载体”指概括了线形或环形的DNA分子,包含了编码本发明多肽的片段,它与额外的使之转录的片段可操作性连接。
宿主细胞:在此处,术语“宿主细胞”包括了能够用核酸构建体转化的任何细胞类型。
术语“多核苷酸探针”、“杂交”及各种严谨条件在“具有纤维二糖水解酶II活性的多肽”一节中有定义。
热稳定:本文中术语“热稳定”在实施例2中进行描述测定
发明的详细描述
具有纤维二糖水解酶II活性的多肽
在第一个实施方式中,本发明涉及具有纤维二糖水解酶II活性的多肽,所述多肽包含与选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ IDNO:26(即成熟多肽)的氨基酸序列有至少有65%,优选至少70%,例如至少75%、更优选至少80%,诸如至少85%,甚至更优选至少90%,更优选至少95%,如至少96%、如至少97%,甚至最优选为至少98%,如至少99%(下称为“同源多肽”)同一性的氨基酸序列,优选为由上述氨基酸序列组成的多肽。在一个感兴趣的实施方式中,所述多肽的氨基酸序列与选自:SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸序列有最多10个氨基酸(如10个氨基酸),尤其最多5个氨基酸(如5个氨基酸),如最多4个氨基酸(如4个氨基酸),最多3个氨基酸(如3个氨基酸)的差别。在一个特别优选的实施方式中,所述多肽的氨基酸序列与选自:SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸序列有最多2个氨基酸(如2个氨基酸),如1个氨基酸的差别。
优选地,本发明的多肽包含选自:SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸序列;及其等位基因突变体;或其具有纤维二糖水解酶II活性的片断。在另一个实施方式中,本发明的多肽由选自SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸序列所组成。
本发明的多肽可以鉴定野生型的纤维二糖水解酶II,并从自然状态中分离出来。这种野生型多肽可用已知的标准技术来特异性的筛选出来,例如利用实施例1中描述的分子筛选方法。而且,本发明的多肽也可通过DNAshuffling(DNA改组)法(如描述于J.E.Ness等,Nature Biotechnology17,893-896(1999))来制备。进一步地,本发明的多肽可以是人工突变体,其包含了由选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸序列经过至少一个氨基酸取代、缺失和/或插入得到的氨基酸序列,优选地由这些突变的氨基酸组成。这种人工突变体可用已知的标准技术来获得,如通过位点/随机突变方法对包含选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24及SEQ ID NO:26的氨基酸序列进行突变来得到。在本发明的一个实施方式中,氨基酸的改变(在人工突变体及野生型多肽中)是细微的(minornature),即对蛋白折叠和/或活性没有显著影响的保守性氨基酸取代;小部分的缺失,典型的是1至约30个氨基酸缺失;氨基端或羧基端的小部分延伸,例如氨基末端的甲硫氨酸残基;至多约20-25个残基的小的接头多肽;或通过改变净电荷或其它功能而便于纯化的小部分延伸,如多个组氨酸通道(tract)、抗原表位或结合域。
保守性氨基酸取代的实例下述氨基酸组内进行取代:碱性氨基酸(精氨酸,赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰氨和天冬酰氨)、疏水性氨基酸(亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小型氨基酸(甘氨酸、丙氨酸、丝氨酸和苏氨酸)。在现有技术中已经知晓那些通常不改变特异性活性的氨基酸取代,例如可见于H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,New York。最常见的取代是:Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu以及Asp/Gly,以及反过来取代。
本发明的一个实施方式中,氨基酸的改变使多肽的物理-化学特性也被改变。例如,氨基酸的改变改善多肽的热稳定性,或改变底物特异性或改变多肽的最佳pH等。
优选地,对选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸进行取代、缺失和/或插入的数目最多为10个、如最多9个,例如最多8个,更优选为最多7个,例如最多6个,如最多5个,最优选为最多4个,例如最多3个,如最多2个,尤其优选为最多1个。
本发明人从选自下述的微生物中分离了编码具有纤维二糖水解酶II活性的核苷酸序列:Chaetomium thermophilum、Myceliophthora thermophila、Acremonium thermophilum、Thielavia australiensis、Thielavia microspore、塔宾曲霉、塔宾曲霉syn.、Aspergilllus neotubingensis Frisvad sp.Nov.、密粘褶菌、Meripilus giganteus、Trichophaea saccata、Stilbella annulata、Stilbellaannulata以及Malbrancheae cinnamomea。
因此,第二方面实施方式,本发明涉及的多肽含有的氨基酸序列与选自下述微生物:Chaetomium thermophilum CGMCC 0859、Myceliophthorathermophila CGMCC 0862、Myceliophthora thermophila CGMCC 0862,支顶孢属的种(Acremonium sp.)T178-4 CGMCC 0857、支顶孢属的种T178-4、Melanocarpus sp.CGMCC 0861、Thielavia microspora CGMCC 0863、曲霉属的种T186-2 CGMCC 0858、Thielavia australiensis CGMCC 0864、密粘褶菌ATCC 11.39、塔宾曲霉CBS 161.79、Trichophaea saccata CBS 804.70、Stilbellaannulata CBS 185.70以及Malbrancheae cinnamomea CBS 115.68中的纤维二糖水解酶II的编码部分核苷酸序列所编码的多肽有至少65%的同一性。在一个感兴趣的实施方式中,所述多肽含有的氨基酸序列与选自下述微生物:Chaetomium thermophilum CGMCC 0859、Myceliophthora thermophilaCGMCC 0862、Myceliophthora thermophila CGMCC 0862、支顶孢属的种T178-4 CGMCC 0857、支顶孢属的种T178-4、Melanocarpus sp.CGMCC0861、Thielavia microspora CGMCC 0863、曲霉属的种T186-2 CGMCC 0858、Thielavia australiensis CGMCC 0864、密粘褶菌ATCC 11.39、塔宾曲霉CBS161.79、Trichophaea saccata CBS 804.70、Stilbella annulata CBS 185.70以及Malbrancheae cinnamomea CBS 115.68中的纤维二糖水解酶II的编码部分核苷酸序列所编码的多肽有至少70%、例如至少75%、优选至少80%、如至少85%,更优选至少90%,最优选至少95%,如至少96%,如至少97%,进一步最优选至少98%,如至少99%的同一性。(下称“同源多肽”)。在一个实施方式中,所述多肽的氨基酸序列与选自下述微生物:Chaetomiumthermophilum CGMCC 0859、Myceliophthora thermophila CGMCC 0862、Myceliophthora thermophila CGMCC 0862,支顶孢属的种T178-4 CGMCC 0857、支顶孢属的种T178-4、Melanocarpus sp.CGMCC 0861、Thielavia microsporaCGMCC 0863、曲霉属的种T186-2 CGMCC 0858、Thielavia australiensisCGMCC 0864、密粘褶菌ATCC 11.39、塔宾曲霉CBS 161.79、Trichophaeasaccata CBS 804.70、Stilbella annulata CBS 185.70以及Malbrancheaecinnamomea CBS 115.68中的纤维二糖水解酶II的编码部分核苷酸序列所编码的多肽有最多10个氨基酸(如10个氨基酸),尤其最多5个氨基酸(如5个氨基酸),如最多4个氨基酸(如4个氨基酸),最多3个氨基酸(如3个氨基酸)的差别。在一个特别优选的实施方式中,所述多肽的氨基酸序列与选自下述微生物:Chaetomium thermophilum CGMCC 0859、Myceliophthorathermophila CGMCC 0862、Myceliophthora thermophila CGMCC 0862,支顶孢属的种T178-4 CGMCC 0857、支顶孢属的种T178-4、Melanocarpus sp.CGMCC 0861、Thielavia microspora CGMCC 0863、曲霉属的种T186-2CGMCC 0858、Thielavia australiensis CGMCC 0864、密粘褶菌ATCC 11.39、塔宾曲霉CBS 161.79、Trichophaea saccata,CBS 804.70、Stilbella annulataCBS 185.70以及Malbranchea cinnamomea CBS 115.68中的纤维二糖水解酶II的编码部分核苷酸序列所编码的多肽有最多2个氨基酸(如2个氨基酸),如1个氨基酸的差别。
第三方面的实施方式中,本发明涉及具有纤维二糖水解酶II活性的多肽是由能够在极低严谨条件下,优选在低严谨条件下,更优选在中度严谨条件下,更优选在中高度严谨条件下,甚至更优选在高度严谨条件下,以及最优选在极高度严谨条件下与选自下述的核苷酸序列的互补链中选取的多核苷酸探针杂交的核苷酸序列所编码:
SEQ ID NO:1的第63-1493位核苷酸,
SEQ ID NO:3的第1-246位核苷酸,
SEQ ID NO:5的第1-417位核苷酸,
SEQ ID NO:7的第1-306位核苷酸,
SEQ ID NO:9的第1-432位核苷酸,
SEQ ID NO:11的第1-297位核苷酸,
SEQ ID NO:13的第1-420位核苷酸,
SEQ ID NO:15的第1-330位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-429位核苷酸,
SEQ ID NO:19的第1-213位核苷酸,
SEQ ID NO:21的第43-701位核苷酸,
SEQ ID NO:23的第21-1394位核苷酸,以及
SEQ ID NO:25的第41-1210位核苷酸。
在另一个实施方式中,本发明涉及具有纤维二糖水解酶II活性的多肽由选自下述微生物中的纤维二糖水解酶II的编码部分核苷酸序列所编码:
属于毛壳霉科(Chaetomiaceae)的微生物,优选属于毛壳霉属(Chaetomium),更优选属于Chaetomium thermophilum种的微生物,
属于毁丝霉属(Myceliophthora)的微生物,优选属于Myceliophthorathermophila种的微生物,
属于Acremonium thermophilum种的微生物,
属于毛壳霉科(Chaetomiaceae)的微生物,优选属于草根霉属(Thielavia),更优选属于Thielavia australiensis种的微生物,
属于曲霉属(Aspergillus)的微生物,优选属于black Aspergilli(黑曲霉)
属于毛壳霉科(Chaetomiaceae)的微生物,优选属于草根霉(草根霉属),更优选属于Thielavia microspore种的微生物,
属于曲霉属(Aspergillus)的微生物,优选属于black Aspergilli(黑曲霉),更优选属于塔宾曲霉(Aspergillus tubingensis),以及最优选属于A.neotubingensis Frisvad sp.nov.种的微生物,
属于Polyporales属的微生物,优选属于Fomitopsidacea科,更优选属于Gloeophyllum属,以及最优选属于密粘褶菌种的微生物,
属于Hymenochaetales的微生物,优选属于Rieidiporaceae科,更优选属于Meripilus属,以及更优选属于Meripilus giganteus种的微生物,
属于Pezizomycotina的微生物,优选属于Pezizales,更优选属于Pyronemataceae或Sarcosomataceae科,更优选属于Trichophaea或Pseudoplectania属,以及最优选属于Trichophaea saccata种的微生物,
属于Stilbella annulata种的微生物,以及
属于Malbrancheae cinnamomea种的微生物。
选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ ID NO:25的核苷酸序列及其亚序列,以及选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸序列及其片段,可用于根据现有技术来设计多核苷酸探针,以从不同种属的物种中鉴定和克隆编码具有纤维二糖水解酶II活性的DNA。特别是,这种探针可根据标准的Southern印迹方法而与感兴趣的属或种的物种的基因组或cDNA杂交,以便鉴定和分离相应的基因。这种探针可短于全长序列,但至少有15个核苷酸,优选至少25个,更优选至少35个核苷酸的长度,例如至少70个核苷酸的长度。然而,探针优选至少100个核苷酸的长度。例如,探针优选至少200个核苷酸、至少300个核苷酸、至少400个核苷酸或至少500个核苷酸的长度。甚至更长的探针也可使用,如多核苷酸探针至少600个核苷酸、至少700、至少800或至少900个核苷酸的长度。DNA和RNA探针均可采用。这种探针通常被标记以检测相应的基因(例如,用32P、3H、35S,生物素或亲和素)。
因此,以其它生物体制备的基因组DNA或cDNA文库可用筛选出能够与上述探针杂交的DNA,且编码具有纤维二糖水解酶II活性的DNA。其它生物体的基因组或其它DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术来分离。来自文库或分离的DNA的DNA可转移并印迹到硝化纤维或其它合适的载体材料。为了鉴定出与SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ ID NO:25所示序列之一同源的DNA或克隆,所述印迹有DNA的载体材料用于进行Southern印迹。
在本发明中,杂交指核苷酸序列与标记的多核苷酸探针杂交,所述探针能够与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ ID NO:25任一所示核苷酸序列在极低严谨条件下杂交。在这种条件下与多核苷酸探针杂交的分子可通过X-ray膜或其它已知的技术来检测。在本发明说明书中使用的“多核苷酸探针”一词应被理解成至少含有15个核苷酸。
在一个实施方式中,多核苷酸探针是选自下述的核苷酸序列的互补链:
SEQ ID NO:1的第63-1493位核苷酸,
SEQ ID NO:3的第1-246位核苷酸,
SEQ ID NO:3的第1-1272位核苷酸,
SEQ ID NO:5的第1-417位核苷酸,
SEQ ID NO:7的第1-306位核苷酸,
SEQ ID NO:9的第1-432位核苷酸,
SEQ ID NO:11的第1-297位核苷酸,
SEQ ID NO:1 3的第1-420位核苷酸,
SEQ ID NO:15的第1-330位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-429位核苷酸,
SEQ ID NO:19的第1-213位核苷酸,
SEQ ID NO:21的第43-701位核苷酸,
SEQ ID NO:23的第21-1394位核苷酸,以及
SEQ ID NO:25的第41-1210位核苷酸。
在另一个实施方式中,多核苷酸探针是编码选自:SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24及SEQ ID NO:26的多肽的核苷酸序列的互补链。进一步的实施方式中,多核苷酸探针是选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23及SEQ ID NO:25的核苷酸序列的互补链。
对于至少为100个核苷酸的长度的长探针,极低到极高度的严谨条件的定义为:于42℃,在5×SSPE,1.0%SDS,5X Denhardt’s溶液,100ug/ml修剪(sheared)和变性鲑鱼精子DNA中进行预杂交和杂交,继而进行标准的Southern印迹程序。优选地,至少长100个核苷酸的长探针不包括超过1000个核苷酸。对于至少为100个核苷酸的长度的长探针,载体材料最后用2×SSC,0.1%SDS于42℃下(极低严谨条件)洗涤3次,每次15分钟,优选在0.5×SSC,0.1%SDS于42℃下(低严谨条件)洗涤3次,每次15分钟,更优选在0.2×SSC,0.1%SDS于42℃下(中度严谨条件)洗涤3次,每次15分钟,进一步优选在0.2×SSC,0.1%SDS于55℃下(中高度严谨条件)洗涤3次,每次15分钟,最优选在0.1×SSC,0.1%SDS于60℃下(高度严谨条件)洗涤3次,每次15分钟,尤其优选在0.1×SSC,0.1%SDS于68℃下(极高度严谨条件)洗涤3次,每次15分钟。
虽然并不是特别优选,可以设想对于较短的探针,例如约15至99个核苷酸的长度的探针,如约15至约70个核苷酸的长度的探针也可以使用。对于这种短的探针,严谨条件被定义为:在低于估计的Tm值5℃至10℃的温度下,在0.9M NaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1X Denhardt’s溶液,1mM焦磷酸钠,1mM sodium monobasic phosphate,0.1mM ATP以及0.2mg酵母RNA/ml中进行预杂交、杂交和洗涤后杂交,继而进行标准的Southern印迹程序。其中Tm值可根据Bolton和McCarthv(1962,PNAS,48:1390)所描述方法来估算。
对于约15个核苷酸至99个核苷酸长度的短探针,载体材料用在低于估计的Tm值5℃至10℃的温度下,于添加有0.1%SDS的6X SSC中洗涤1次,时间为15分钟,然后在6X SSC中洗涤2次,每次为15分钟。
具有纤维二糖水解酶II活性的多肽的来源
本发明的多肽可从任何属的微生物中获得。在本发明中,术语“获自”在此处应当理解为由核苷酸序列编码的多肽由天然存在的核苷酸序列的细胞或插入有所述核苷酸序列的细胞所产生。在优选的实施方式中,多肽被分泌到细胞外。
本发明的多肽可以细菌多肽。例如,多肽可以是革兰氏阳性细菌多肽,如枯草杆菌属(Bacillus)多肽,如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽;或者是链霉菌属(Streptomyces)多肽,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)多肽;或革兰氏阴性细菌多肽,如大肠杆菌(E.coli)或假单胞菌属(Pseudomonas)sp.多肽。
本发明的多肽可以是真菌多肽,且优选为酵母多肽,如假丝酵母属(Candida)、克鲁维氏酵母属(Kluyveromyces)、Neocallimastix、毕赤开酵母属(Pichia)、Piromyces、糖酵母属(Saccharomyces)、裂殖糖酵母属(Schizosaccharomyces)或Yarrowia多肽;或更优选为丝状真菌多肽如支顶孢属(Acremonium)、曲霉属(Aspergillus)、毛壳霉属(Chaetomium)、毛壳霉属(Chaetomium)、粘褶菌属(Gloeophyllum)、Malbrancheae、Melanocarpus、Meripilus、毁丝霉属(Myceliophthora)、Stilbella、草根霉属(Thielavia)或长毛霉菌属(Trichophaea)多肽。
在一实施方式中,所述多肽是卡尔斯伯糖酵母(Saccharomycescarlsbergensis)、啤酒糖酵母(Saccharomyces cerevisiae)、糖化糖酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、Saccharomyceskluyveri、Saccharomyces norbensis或Saccharomyces oviformis多肽。在一优选实施方式中,所述多肽是Chaetomium thermophilum、Myceliophthorathermophila、Acremonium thermophilum、Thielavia australiensis、Aspergilli多肽;Thielavia microspore、塔宾曲霉(Aspergillus tubingensis)、密粘褶菌、Meripilus giganteus、Trichophaea saccata、Stilbella annulata或Malbrancheaecinnamomea多肽。
应当理解的是,上述提到的微生物种,本发明包括完全纯化或不完全纯化(perfect and imperfect)状态,以及其它分类学上的等同物,如无性型(anamorphs),而不管它们的已知的种名。本领域技术人员可以意识到相应的等同物的同一性。
而且,包括从自然分离的(如土壤、水、植物、动物等)其它种的微生物中也可用上述提到的探针来鉴定和分离得到。现在技术中已经熟知从自然状态中分离微生物的技术。然后,可用由另一微生物的基因组或cDNA文库的类似筛选来获得所述核苷酸序列。一旦用探针检测到编码多肽的核苷酸序列,即可用本领域熟知的技术来分离或克隆所述序列(参见J.SambrookE.F.Fritsch和T.Maniatus,1989,Molecular Cloning,A laboratory Manual,2dedition,Cold Spring Harbor,New York)。
由本发明的核苷酸序列所编码的多肽也包括融合多肽或可切割的融合多肽,其中另一个多肽在所述多肽或其片段的N末端或C末端与之融合。由编码另一个多肽的核苷酸序列(或其片段)融合到本发明的核苷酸序列(或其片段)上,则可产生融合多肽。在现在技术中,产生融合多肽的技术是熟知的,包括将编码多肽的编码序列的连接以便它们能在正确的阅读框,并在同一启动子和终止子控制下表达融合多肽。
多核苷酸和核苷酸序列
本发明也涉及具有编码了本发明多肽的核苷酸序列的多核苷酸。尤其是,本发明涉及由编码本发明的多肽的核苷酸序列组成的多核苷酸。在一个优选实施方式中,核苷酸序列选自:SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ ID NO:25。本发明也包括编码了由选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24及SEQ ID NO:26的氨基酸序列组成的多肽的核苷酸序列的多核苷酸,优选为由所述核苷酸序列组成的多核苷酸,其中所述核苷酸序列由于遗传密码简并性而与选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ IDNO:25的核苷酸序列不同。
本发明也涉及包含选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ IDNO:25的核苷酸序列的亚序列的多核苷酸,优选为由所述亚序列组成的多核苷酸,其中序列编码选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸序列的片段,且具有纤维二糖水解酶II活性。选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ ID NO:25的核苷酸序列的亚序列是这样一种核苷酸序列,其包含于选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23及SEQ ID NO:25的序列,除了在5’和/或3’末端缺失1个或多个核苷酸。
本发明也涉及具有修饰的核苷酸序列的多核苷酸序列,优选由它们组成的多核苷酸,其中修饰的核苷酸序列在选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23及SEQ ID NO:25的成熟多肽的编码序列中至少包括有1个修饰,且所述的修饰的核苷酸序列编码了由选自:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24及SEQ ID NO:26的氨基酸序列组成的多肽。
用于分离或克隆编码多肽的核苷酸序列的技术是熟知的,包括从基因组DNA、cDNA制备物或其结合中分离出核苷酸序列。从这种基因组DNA中克隆本发明的核苷酸序列可通过熟知的PCR或抗体筛选表达文库以检测出具有共同结构特征的克隆DNA片段。如参见Innis et al.,1990,PCR:A Guideto Methods and Application,Academic Press,New York。其它扩增方法如连接酶链式反应(LCR)、连接激活转录(LAT)和基于核苷酸序列的扩增(NASBA)也可采用。所述核苷酸序列可从属于选自:毛壳霉属、毁丝霉属、Melanocarpus、Acremonium、草根霉属、曲霉属(Aspergillus)、Gloeophyllum、Meripilus、Trichophaea、Stilbella以及Malbrancheae的微生物种的菌株或其它相关的微生物中克隆得到,因而可以是多肽编码区的核苷酸序列的等位基因或种系(species)突变体。
核苷酸序列可通过标准克隆方法来获得,并用于遗传工程中使所述核苷酸序列重新插入到相对于天然位点不同的位点,但仍然能够复制。克隆方法包括切除和分离含有编码了所述多肽的核苷酸序列的预期片段、将所述片段插入到载体分子中以及将重组载体整合到宿主细胞以使多个拷贝或克隆的所述核苷酸序列得以复制。所述核苷酸序列可以是基因组、cDNA、RNA、半合成、合成来源的,或者它们的组合。
本发明涉及的多核苷酸含有与选自:
SEQ ID NO:1的第63-1493位核苷酸,
SEQ ID NO:3的第1-246位核苷酸,
SEQ ID NO:3的第1-1272位核苷酸,
SEQ ID NO:5的第1-417位核苷酸,
SEQ ID NO:7的第1-306位核苷酸,
SEQ ID NO:9的第1-432位核苷酸,
SEQ ID NO:11的第1-297位核苷酸,
SEQ ID NO:13的第1-420位核苷酸,
SEQ ID NO:15的第1-330位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-424位核苷酸,
SEQ ID NO:19的第1-213位核苷酸,
SEQ ID NO:21的第43-701位核苷酸,
SEQ ID NO:23的第21-1394位核苷酸,以及
SEQ ID NO:25的第41-1210位核苷酸
的核苷酸序列的同源性至少为70%、如至少75%;优选为至少80%、如至少85%、如至少90%,更优选至少为95%,例如至少96%,如至少97%,甚至更优选为至少98%,如至少99%的同一性的核苷酸序列,优选地所述多核苷酸由这些核苷酸序列组成。优选地,所述核苷酸序列编码具有纤维二糖水解酶II活性的多肽。两个核苷酸序列之间同一性程度的计算在前面已有描述(参见“定义”一节)。
编码本发明多肽的核苷酸序列的修饰可能在多肽合成中是需要的,包含相对于选自:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24及SEQ ID NO:26的氨基酸序列而言的至少一个氨基酸取代、缺失和/或插入。这些人工突变体可能在一些方式上(engineered)不同于某些从天然来源分离到的多肽,如在特异性活性、热稳定性或最佳pH方面不同。
对本领域技术人员显而易见的是上述修饰可在对于分子功能而言关键的区域之外进行,故仍然能保持其活性。由本发明的核苷酸序列编码的多肽的活性所必需的氨基酸残基,优选不对其进行修饰如取代,可根据现有技术如位点特异性突变或丙氨酸-扫描突变法(参见Cunningham andWells,1989,Science 244:1081-1085)来确定。在后一技术中,在分子中的每一个正电荷残基引入突变,检测所得到的突变体分子是否具纤维二糖水解酶II的活性以鉴定出分子中对活性是关键的氨基酸残基。底物与酶互作位点可通过分析三维结构来确定,其中三维结构可利用如核磁共振、结晶或光亲和(photoaffinity)标记技术来确定(参见de Vos et al.,1992,Science 255:306-312;Smith et al.,1992,Journal of Molecular Biology 224:899-904;Wlodaver et al.,1992,FEBS Letters 309:59-64)。
此外,编码本发明多肽的核苷酸序列引入核苷酸取代来修饰,但并不导致由所述核苷酸序列编码的多肽具有另一个氨基酸序列,且其与于欲用于产生酶的宿主生物体中的密码子应用相符。
可用本领域任何已知技术的位点特异性突变来用一个核苷酸取代另一个核苷酸而达到在核苷酸序列中引入突变的目的。特别有用的方法是利用插入有目的插入片断的超螺旋、双链DNA载体和两个包含预期突变的合成引物。寡核苷酸引物,每一个分别与载体上的相对链互补,在Pfu DNA聚合酶的存在下在温度循环中得以延伸。通过引物的整合,而产生含有交错切口的突变质粒。用特异于甲基化和半甲基化DNA的Dpn I处理温度循环后得到的产物,以消化亲本DNA模板,并选择含有突变的合成DNA。也可采用其它已知的技术。对于核苷酸取代的全面描述,可参见Ford etal.,1991,Protein Expression and Purification 2:95-107。
本发明也涉及包含编码具有纤维二糖水解酶II活性多肽的由能够在极低严谨条件下,优选在低严谨条件下,更优选在中度严谨条件下,更优选在中高度严谨条件下,甚至更优选在高度严谨条件下,以及最优选在极高度严谨条件下与选自下述(i):
SEQ ID NO:1的第63-1493位核苷酸,
SEQ ID NO:3的第1-246位核苷酸,
SEQ ID NO:3的第1-1272位核苷酸,
SEQ ID NO:5的第1-417位核苷酸,
SEQ ID NO:7的第1-306位核苷酸,
SEQ ID NO:9的第1-432位核苷酸,
SEQ ID NO:11的第1-297位核苷酸,
SEQ ID NO:13的第1-420位核苷酸,
SEQ ID NO:15的第1-330位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-429位核苷酸,
SEQ ID NO:19的第1-213位核苷酸,
SEQ ID NO:21的第43-701位核苷酸,
SEQ ID NO:23的第21-1394位核苷酸,以及
SEQ ID NO:25的第41-1210位核苷酸
的核苷酸序列的互补链中选取的多核苷酸探针杂交的核苷酸序列,优选由所述核苷酸序列组成。
应当理解的是,有关细节,尤其关于核苷酸序列的杂交方面的细节与在“具有纤维二糖水解酶II活性的多肽”一节中关于杂交方面的讨论相同或类似。
DNA重组(改组)
SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23及SEQ ID NO:25的核苷酸序列可用于DNA重组(或改组)方法中。在这种方法中获得的新多核苷酸序列可以是编码了改善了特性的新的具有纤维二糖酶活性的多肽,如改善了稳定性(贮藏稳定性、热稳定性)、改善了特异性活性、改善了最佳pH值和/或改善对特定化合物的耐受性。
在两个或更多个同源性输入(input)多核苷酸序列(起始点多核苷酸)之间进行改组涉及多核苷酸的片段化(fragmenting)和这些片段之间的重组,最后获得输出(output)多核苷酸(即经过改组循环的多核苷酸),其中相对于输入多核苷酸而言,有多个核苷酸片段发生了互换。
DNA重组或改组可以是(部分)随机方法,其中嵌合基因文库由两个或更多个起始基因(starting genes)产生。有多个已知的方式(formats)可用于实施这种改组或重组方法。
所述方法可涉及对亲本DNA的随机片段化,接着用PCR进行重新组装产生新的全长基因,例如在US5605793、US5811238、US5830721和US6117679中所描述的。基因的体外重组可通过如在US6159687、WO98/41623、US6159688、US5965408和US6153510中描述的方法来进行。也可在活体细胞中发生基因重组,例如WO97/07205和WO98/28416中描述的方法。
可按在Kikuchi et al(2000a,Gene 236:159-167)中描述的用DNA’seI处理或通过限制性内切酶消化来对亲本DNA片段化。两个亲本DNA之间的改组可通过在Kikuchi et al(2000b,Gene 243:133-137)中所描述的在两个亲本DNA的单链亲本DNA之间进行改组。
改组的特别方法按照在Crameri et al,1998,Nature,391:288-291和Ness etal.Nature Biotechnology 17:893-896中描述的方法来进行。另一个方式(format)是在US6159687的实施例1和2。
核酸构建体
本发明也涉及核酸构建体,其包含本发明的核苷酸序列可操作性的连接于一个或多个调控序列,以使编码序列在合适的宿主细胞中在适合于调控序列的条件下得以表达。
编码本发明多肽的核苷酸序列可通过多种方式来操纵以提供多肽的表达。在将核苷酸序列插入到载体中之前,对核苷酸序列的操纵是否是预期的或必需的有赖于表达载体。利用重组DNA方法来修饰核苷酸序列的技术是本领域熟知的。
调控序列可以是合适的启动子序列,它是可被宿主细胞识别的控制核苷酸序列表达的一种序列。启动子包含介导多肽表达的转录调控序列。启动子可以是在宿主细胞中显示有转录活性的任何核苷酸序列,包括突变体、截短和杂交启动子,且可从编码胞外或胞内多肽的基因获得,与宿主细胞是同源或异源的。
尤其在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子可以来自E.colilac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶(levansucrase)基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和oxyl8基因以及原核β-内酰胺酶基因(Villa-Kamaroff et al.,1978,PNAS,75:3727-3731)的启动子,以及tac启动子(DeBoer et al.,1983,PNAS,80:21-25)。更多的启动子可参见“Usefulproteins from recombinant bacteria”,Scientific American,1980,242:74-94和Sambrook et al.,1989(同上)中的描述。
指导本发明的核酸构建体在丝状真菌宿主细胞中转录的例子,包括获自于米曲霉(Aspergillus oryzae)TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、Rhizomucormiehei脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶(acetamidase)以及尖孢镰孢(Fusariumoxysporum)类胰蛋白酶基因的启动子(WO 96/00787),以及NA2-tpi启动子(这是一种来自黑曲霉中性α-淀粉酶基因的启动子与米曲霉磷酸丙糖异构酶基因的启动子之间的杂交启动子),以及这些启动子的突变体、截短和杂交启动子。
在酵母宿主中有用的启动子如获自啤酒糖酵母烯醇化酶(ENO-1)、啤酒糖酵母半乳糖激酶(GAL1)、啤酒糖酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和啤酒糖酵母3-磷酸甘油酸激酶基因的启动子。其它在酵母宿主细胞中有用的启动子描述于Romanos et al.,1992,Yeast 8:423-488。
调控序列也可以是合适的转录终止子序列,它是可被宿主细胞识别终止转录的序列。终止序列可操作连接于编码多肽的核苷酸序列的3’末端。任何在宿主细胞中起作用的终止子均可用于本发明。
对于真菌宿主细胞,优选的终止子获自于米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶和尖孢镰孢类胰蛋白酶基因。
对于酵母宿主细胞,优选的终止子获自于啤酒糖酵母烯醇化酶、啤酒糖酵母细胞色素C(CYC1)和啤酒糖酵母甘油醛-3-磷酸脱氢酶基因。其它在酵母宿主细胞中有用的终止子描述Romanos et al.,1992(同上)。
调控序列也可以是合适的前导序列,mRNA的非翻译区对宿主细胞进行翻译而言是重要的。前导序列可操作连接于编码多肽的核苷酸序列的5’末端。任何在宿主细胞中起作用的前导序列均可用于本发明。
对于丝状真菌宿主细胞,优选的前导序列终止子获自于米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶基因。
对于酵母宿主细胞,优选的合适前导序列获自于啤酒糖酵母烯醇化酶(ENO-1)、啤酒糖酵母3-磷酸甘油酸激酶、啤酒糖酵母α-因子和啤酒糖酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因。
调控序列也可以是聚腺苷酸化序列,它可操作连接于核苷酸序列的3’末端,因而当进行转录时,可作为被宿主细胞识别的信号而在转录的mRNA上添加聚腺苷酸残基。任何在宿主细胞中起作用的聚腺苷酸化序列均可用于本发明。
对于丝状真菌宿主细胞,优选的聚腺苷酸化序列获自于米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉氨基苯甲酸合成酶、尖孢镰孢类胰蛋白酶和黑曲霉β-葡糖苷酶基因。
对于酵母宿主细胞,有用的聚腺苷酸化序列描述于Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990。
调控序列也可是信号肽编码区,其编码的氨基酸序列连接于多肽的氨基末端,并指导编码的多肽进入细胞分泌通道。核苷酸序列的编码序列的5’末端可能固有包含信号肽编码区,其与翻译阅读框自然连接,而编码区的片段编码了分泌肽。可选地,编码序列的5’末端可包含与编码序列异源的信号肽编码区。外源信号肽编码区是编码序列天然形式下并不包含的信号肽编码区。任选地,外源信号肽编码区可简单的取代天然的信号肽编码区以增强多肽的分泌。然而,任何能够在所选择的宿主细胞中指导多肽进入分泌通道的信号肽编码区均可用于本发明。
对于细菌宿主细胞,有效的信号肽编码区获自于属于属Bacillus NCIB11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA基因。其他信号肽描述于Simonen and Palva,1993,Microbiological Reviews 57:109-137。
对于丝状真菌宿主细胞,有效的信号肽编码区获自于米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicola insolens纤维素酶和Humicola lanuginosa脂肪酶基因。
对于酵母宿主细胞,有用的信号肽编码区获自于啤酒糖酵母α-因子和啤酒糖酵母转化酶基因。其它有用的信号肽编码区描述于Romanos et al.,1992(同上)。
调控序列也可以是前肽编码区,编码了位于多肽的氨基末端的氨基酸序列。得到的多肽被认为是酶原或多肽原(或有时称为酶原zymogen)。多肽原通常不具有活性,可通过催化或自催化将多肽原上的前肽切割下来而转化为成熟的活性多肽。前肽编码区可获自于枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(npr7)、啤酒糖酵母α-因子、Rhizomucormiehei天冬氨酸蛋白酶和Myceliophthora thermophila漆酶基因(WO95/33836)。
当信号肽和前肽区均存在于多肽的氨基末端时,则前肽区紧接于多肽的氨基末端,信号肽区再位于前肽区的氨基末端。
可以预计也可增加调节序列,以相对于宿主细胞的生长而调节多肽的表达。调节系统的例子是引起基因的表达根据化学或物理激发子,包括调节化合物的存在与否而得以开启或关闭。在原核生物中的调节系统包括lac、tac和trp操纵系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子均可用作调节序列。其它调节序列的例子是允许基因扩增的调节序列。在真核生物中,包括二氢叶酸还原酶基因在氨甲蝶呤存在下得以扩增,金属硫蛋白基因在重金属存在下的扩增。在这些例子中,编码多肽的核苷酸序列与调节序列可操作性连接。
表达载体
本发明也涉及包含本发明的核酸构建体的重组表达载体。上面描述的各种核苷酸和调控序列可连接在一起而获得重组表达载体,其中表达载体包括一个或多个方便的限制性位点以允许在这些位点用编码多肽的核苷酸序列进行插入或取代。任选地,本发明的核苷酸序列可通过将所述核苷酸序列或含有所述序列的核酸构建体插入到合适的载体中进行表达。为了构建表达载体,编码序列在载体上的位置以使所述序列可操作的连接于合适的调控序列。
重组表达载体可以是任何能方便用于重组DNA方法,并能使核苷酸序列表达的载体(如质粒或病毒)。载体的选择通常依赖于与将要导入的宿主细胞的相容性。载体可以是线性或闭合环状质粒。
载体可以是能够自我复制的载体,即作为存在于染色体外实体的载体,其复制不依赖于染色体的复制,例如质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。
载体可包含任何保证自我复制的方式。或着,载体可是当导入到宿主细胞时可整合到其基因组中,并与所整合到的染色体一起进行复制。而且,可将含有整个DNA的单个载体或质粒,或共同含有整个DNA的两个或多个载体或质粒导入到宿主细胞的基因组中,或者利用转座子。
本发明的载体优选包含1个或多个选择标记,以便容易的进行选择转化细胞。选择标记是那些其产物能提供对生物杀灭剂或病毒、重金属有抗性的基因,或者使原养型变成营养缺陷型等。
细菌性选择标记的例子有来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者赋予对抗生素抗性的标记,如对氨苄青霉素、卡那霉素、氯霉素或四环素的抗性。对酵母细胞有效的选择标记如ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括,但不局限于amdS(乙酰胺酶acetamidase)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5′-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、trpC(氨基苯甲酸合成酶)以及它们的等同物。
在曲霉属细胞中使用优选为构巢曲霉(Aspergillus nidulans)或米曲霉的amdS和pyrG基因,以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选包含允许将载体稳定地整合进宿主细胞基因组的元件,或者包含允许载体在细胞中不依赖于基因组而自我复制的元件。
对于整合到宿主细胞基因组中,载体可能依赖于编码多肽的核苷酸序列或载体上其它的经同源或非同源重组使载体稳定整合的元件。或者,载体可包含额外的核苷酸序列以指导经同源重组而将载体整合到宿主细胞基因组中。所述额外的核苷酸序列能使载体在染色体上的精确位置处进行整合入宿主细胞基因组。为了增加在精确位置处进行整合的可能性,整合元件应优选包含与相应靶标序列高度同源的足够数目的核苷酸,如100至1500碱基对、优选为400-1500碱基对、最优选为800-1500碱基对,以增强同源重组的发生率。整合元件可以是与在宿主细胞基因组上的靶标序列同源的任何序列。此外,整合元件可以非编码或编码核苷酸序列。另一方面,载体也可通过非同源重组而整合进宿主细胞基因组。
对于自我复制,载体可进一步包含能使载体在宿主细胞中进行自我复制的复制起始点。细菌复制起始点的例子包括能够在E.coli中进行复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起始点,和能在芽孢杆菌属中进行复制的pUB110、pE194、pTA1060和pAMβ1复制起始点。在酵母宿主细胞中使用的复制起始点的例子包括2个微米(micron)复制起始点ARS1和ARS4,或者ARS1和CEN3的结合以及ARS4和CEN6的结合。复制起始点可以具有一个突变以使之在宿主细胞中具有温度敏感性(参见如Ehrlich,1978,PNAS,75:1433)。
本发明的核苷酸序列可以1个以上拷贝插入到宿主细胞中以增加基因产物的产量。增加核苷酸序列的拷贝数可通过整合至少一个额外拷贝的序列到宿主细胞基因组或通过包含与核苷酸序列一起的可扩增性选择标记基因,那么含有可扩增性选择标记基因的细胞也含有额外拷贝的核苷酸序列,可以在有合适选择试剂的存在下培养细胞来进行选择。
连接上述提及的元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(如参见Sambrook等,1989,同上)。
宿主细胞
本发明也涉及含有本发明的核酸构建体的重组宿主细胞,对于多肽的重组产生中有用。含有本发明的核苷酸序列的载体导入到宿主细胞,而载体整合到染色体中或作为能自我复制的染色体外载体,这在上面已有描述。
宿主细胞可以是单细胞微生物,如原核生物,或者非单细胞微生物,如真核生物。
有用的单细胞是细菌细胞如革兰氏阳性细胞,包括,但不局限于,芽孢杆菌属细胞,如Bacillus alkalophilus、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillus brevis),环状芽孢杆菌(Bacilluscirculans)、Bacillus clausii、凝结芽孢杆菌(Bacillus coagulans)、Bacilluslautus、缓慢芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽胞杆菌(Bacillus thuringiensis);或者链霉菌属细胞(Streptomyces)细胞,如变青链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus),或者革兰氏阴性细胞,如E.coli和Pseudomonas sp.。在一个优选实施方式中,细菌宿主细胞是缓慢芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选实施方式中,芽孢杆菌属(Bacillus)细胞是嗜碱性芽孢杆菌。
将载体导入到细菌宿主细胞,例如可通过原生质体转化法(如参见Chang和Cohen,1979,Molecular General Genetics 168:111-115)、利用感受态细胞(如参见Young和Spizizin,1961,Journal of Bacteriology 81:823-829或Dubnau和Davidoff-Abelson,l971,Journal of Molecular Biology 56:209-221)、电激法(如参见Shigekawa和Dower,1988,Biotechniques 6:742-751)或者接合作用(如参见Koehler和Thorne,1987,Journal of Bacteriology 169:5771-5278)。
宿主细胞可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
在一个优选实施方式中,宿主细胞是真菌细胞。“真菌”在此处包括Ascomycota、Basidiomycota、Chytridiomycota和Zygomycota(其界定参见Hawksworth et al.,In,Ainsworth and Bisby′s Dictionary of The Fungi,8thedition,1995,CAB International,University Press,Cambridge,UK)以及Oomycota(也参见Hawksworth et al.,1995,同上第171页)和所有有丝分裂真菌(mitosporic fungi)(Hawksworth et al.,1995,同上)。
一个更优选的实施方式中,真菌宿主细胞是酵母细胞。“酵母”在此处包括产子囊酵母(Endomycetales)、basidiosporogenous酵母和属于FungiImperfecti的酵母(Blastomycetes)。由于酵母的分类系统在将来可能变化,在本发明中,酵母应当以描述于Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.SymposiumSeries No.9,1980)的定义为准。
一个更优选的实施方式中,酵母宿主细胞是假丝酵母属(Candida)、Aschbyii、汉逊氏酵母属(Hansenula)、克鲁维氏酵母属(Kluyveromyces)、毕赤氏酵母属(Pichia)、糖酵母属(Saccharomyces)、裂殖糖酵母属(Schizosaccharomyces)或Yarrowia细胞。
最优选的实施方式中,酵母宿主细胞是卡尔斯伯糖酵母(Saccharomycescarlsbergensis)、啤酒糖酵母、糖化糖酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomyces norbensis或卵形糖酵母(Saccharomyces oviformis)细胞。在另一最优选的实施方式中,酵母宿主细胞是乳克鲁维氏酵母(Kluyveromyces lactis)细胞。在另一最优选的实施方式中,酵母宿主细胞是Yarrowia lipolytica细胞。
另一较优的实施方式中,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括所有Eumycota和Oomycota亚部中的细丝形状的真菌(参见Hawksworthet al.,1995,同上)。丝状真菌的特征在于菌丝体壁由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖及其它复杂多糖组成。营养生长是菌丝伸长,而碳代射是专性需氧的。相反,酵母如啤酒糖酵母的营养生长是单细胞菌体的出芽,而碳代射可以是发酵的(fermentative)。
一个更优选的实施方式中,丝状真菌宿主细胞是,但不局限于,下述种类的真菌支顶孢属(Acremonium)、曲霉属、镰孢属、腐质霉属(Humicola)、毛霉菌(Mucor)、毁丝霉属(Myceliophthora)、链孢霉属(Neurospora)、青霉属(Penicillium)、草根霉属(Thielavia)、Tolypocladium或木霉属(Trichoderma)。
在最优选的实施方式中,丝状真菌宿主细胞是泡盛曲霉(Aspergillusawamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉或米曲霉细胞。在另一个最优选的实施方式中,丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactridioides)、Fusariumcereals、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、玫瑰色镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucihum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum细胞。在进一步最优选的实施方式中,丝状真菌宿主细胞是Fusarium venenatum(Nirenberg sp.nov.)细胞。在另一个最优选实施方式中,丝状真菌宿主细胞是Humicola insolens、Humicola lanuginosa、米赫毛霉(Mucor miehei)、Myceliophthora thermophila、粗糙链孢霉(Neurospora crassa)、Penicilliumpurpurogenum、Thielavia terrestris、Trichoderma harzianum、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichoderma viride)细胞。
真菌细胞的转化方法可通过原生质体形成、原生质体的转化和细胞壁的再生,这些均是已知的方式。转化Aspergillus宿主细胞的合适方法描述于EP 238 023和Yelton et al.,1984,PNAS,81:1470-1474。转化Fusarium的合适方法描述于Malardier et al.,1989,Gene 78:147-156和WO 96/00787。可通过Becker and Guarente,In Abelon,J.N.and Simon,M.I.,editors,Guide toYeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp182-187,Academic Press,Inc.,New York;Ito et al.,1983,Journal ofBacteriology 153:163和Hinnen et al.,1978,PNAS,75:1920中描述的方法来转化酵母。
制备方法
本发明也涉及制备本发明多肽的方法,包括:(a)培养菌株,其野生型菌株可以产生所述多肽,以及(b)收获所述多肽。优选地,所述菌株选自下述属的种类:支顶孢属、曲霉属、毛壳霉属、毛壳霉属、Gloeophyllum、Malbrancheae、Melanocarpus、Meripilus、毁丝霉属、Stilbella、Thielavia或Trichophaea;更优选的菌株选自Chaetomium thermophilum、Myceliophthorathermophila、Thielavia australiensis、Thielavia microspore、曲霉属的种、blackAspergilli、塔宾曲霉syn.A.neotubingensis Frisvad sp.nov.、密粘褶菌、Meripilus giganteus、Trichophaea saccata、Stilbella annulata和Malbrancheaecinnamomea。
本发明也涉及产生本发明的多肽的方法,包括:(a)在能诱导产生所述多肽的条件下培养宿主细胞,以及(b)收获所述多肽。
本发明也涉及原位产生本发明多肽的方法,包括:(a)在能诱导产生所述多肽的条件下培养宿主细胞,以及(b)在未先收所述多肽之前,将其与预期基质接触,所述基质如纤维素基质。术语“原位产生”意指多肽直接在意图使用的位点产生,如用于发酵产生乙醇的过程中。
在本发明的产生多肽方法中,细胞在适合于产生所述多肽的营养培养基中利用现有技术已知的方法进行培养。例如,细胞可在实验室或工业发酵罐中,于能够表达和/或分离所述多肽的合适培养基和条件下进行,通过摇瓶振荡培养、小规模或在规模发酵(包括连续、批式、补料分批(fed-batch)或固态发酵)方法来进行。培养是在含有碳源和氮源以及无机盐的合适营养培养基中,通过已知方法来进行。合适的培养可从商业途径获得或根据已公开的组分来制备得到(如美国典型培养物保藏中心的目录)。如果多肽分泌到营养培养基中,则多肽可从培养基中直接收获。如果多肽不是分泌型的,则从细胞裂解物中收获。
所述多肽可通过本领域特异于该肽的已知方法来检测。这些检测方法包括利用特异性抗体、酶的产物的形成或酶的底物的消失。例如,酶分析可用于确定本发明的多肽的活性。
所得到的多肽可通过本领域已知方法来收获。例如,从营养培养基中收获多肽的常规方法包括,但不局限于,离心、过滤、提取、喷射干燥、蒸发或沉淀。
本发明的多肽可通过各种已知的方法来纯化,包括,但不局限于,色谱法(如离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳法(如制备型等电点聚焦)、溶解性差别(differential solubility)(如硫酸胺沉淀法)、SDS-PAGE或抽提法(如参见Protein Purification,J.-C.Janson and Lars Ryden、editors,VCH Publishers,New York,1989)。
植物
本发明也涉及转基因植物、植物的部分或植物细胞,其中已经用本发明的编码具有纤维二糖水解酶II活性的多肽的核苷酸序列进行转化,以表达和产生可收获量的多肽。多肽可从植物或植物部分中收获。任选地,包含重组多肽的植物或植物部分可用于改善食品或饲料的品质,例如改善营养价值、适口性和流变学性质,或者破坏抗营养因子。
转基因植物可以是双子叶(dicot)或单子叶(monocot)植物。单子叶植物的例子如草,如蓝草(blue grass,Poa)、草料草,如Festuca、Lolium,温带草(temperature grass),如Agrostis,以及谷类作物,如小麦、燕麦、裸麦(rye)、大麦、稻、高梁、粟(millets)和玉米。
双子叶植物如烟草、羽扇豆(lupins)、马铃薯、甜菜、豆类(legumes),如豌豆(pea)、菜豆(bean)和大豆,以及十字花科植物(Brassicaceae科),如花椰菜、油菜、canola和密切相关的模式植物拟南芥(Arabidopsis thaliana)。
植物部分的例子如茎、愈伤组织、叶、根、果实、种子和块茎。特定的植物组织,如原生质体、质外体、线粒体、液泡、过氧化物酶体和细胞质也被认为是植物的部分。此外,任何植物细胞,不管其组织来源如何,均被认为是植物部分。
上述植物、植物部分和植物细胞的子代(克隆或种子)也包括在本发明的范围之内。
表达本发明多肽的转基因植物或植物细胞可根据本领域已知技术来制备。简单地说,通过整合一或多个编码本发明多肽的表达载体到植物宿主基因组中,并通过繁殖所述修饰的植物或植物细胞成为转基因植物或植物细胞。
通常,表达载体是核酸构建体,其中包含了编码本发明多肽的核苷酸序列,其可操作的连接于对于所选在植物或植物部分中表达所述核苷酸序列所需要的合适调节序列。此外,表达构建体可包含用于鉴定构建体已整合入到宿主细胞中的选择标记和对于将构建体导入到所研究植物中所需要的DNA序列(后者需要考虑所采用的DNA导入方法)。
诸如启动子和终止子序列,以及任选的信号或转运序列等调节序列的选择,例如要考虑到预期多肽在何时、何部位和如何表达。例如,编码本发明多肽的基因的表达可以是组成型或诱导型表达,可以是发育阶段型(developmental stage)或组织特异性表达,基因产物可以靶向于特定组织或植物部分如种子或叶。调节序列例如参见Tague et al.,1988,Plant Physiology86:506。
对于组成型表达,可采用35S-CaMV启动子(Franck et al.,1980,Cell 21:285-294)。器官特异性启动子如来自贮藏(storage sink)组织如种子、马铃薯块茎和果实(Edwards & Coruzzi,1990,Ann.Rev.Genet.24:275-303),或者来自于代谢库(metabolic sink)组织如分生组织(Ito et al.,1994,Plant Mol.Biol.24:863-878)、种子特异性启动子如来自水稻的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(Wu et al.,1998,Plant and Cell Physiology 39:885-889)、来自于豆球蛋白B4的蚕豆启动子和来自于蚕豆(Vicia faba)的未知种子启动子(Conrad et al.,1998,Journal of Plant Physiology 152:708-711)、来自于种子油体蛋白(seed oil body protein)的启动子(Chen et al.,1998,Plant and CellPhysiology 39:935-94 1)、来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子或其它现有技术中已知的任何种子特异性启动子如在WO 91/14772中公开的启动子。此外,启动子可以是叶特异性启动子如来自水稻或番茄的rbcs启动子(Kyozuka et al.,1993,Plant Physiology 102:991-1000)、chlorella病毒腺嘌呤甲基转移酶基因启动子(Mitra and Higgins,1994,Plant MolecularBiology 26:85-93),或来自水稻的aldP基因启动子(Kagaya et al.,1995,Molecular and General Genetics 248:668-674),或伤害诱导型启动子如马铃薯pin2启动子(Xu et al.,1993,Plant Molecular Biology 22:573-588)。
启动子增强子元件可用于在植物中达到更高水平的表达。例如,启动子增强子元件可是内含子,将其置于启动子和编码本发明多肽的核苷酸序列之间。例如,Xu et al.,1993(同上)公开了使用水稻肌动蛋白1基因的第一个内含子来增强表达。
选择标记基因和表达构建体中的其它部分可根据现有技术来选择。
可利用熟知的常规技术来将核酸构建体整合到植物基因组中,其中包括农杆菌介导的转化、病毒介导的转化、微注射、粒子轰击、biolistic转化和电激法(Gasser et al.,1990,Science 244:1293;Potrykus,1990,Bio/technology 8:535;Shimamoto et al.,1989,Nature 338:274)。
目前,根癌农杆菌介导的转化主要用于产生转基因双子叶植物(其综述参见Hooykas and Schilperoort,1992,Plant Molecular Biology 19:15-38)。然而,也可以用于产生转基因单子叶植物,虽然其它转化方法通常优先被考虑用于这些植物。目前产生转基因单子叶植物的方法主要选择粒子轰击(包覆有待转化DNA的颗粒金或钨颗粒)胚性愈伤组织或发育中的胚(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current OpinionBiotechnology 5:158-162;Vasil et al.,1992,Bio/Technology 10:667-674)。一种可选用于转化单子叶植物的方法是基于原生质体的转化,可参见Omirulleh et a/.,1993,Plant Molecular Biology 21:415-428。
在转化之后,根据本领域已知方法来选择出已整合了此处所述的表达构建载体的转化体,并再生成为整株植物。
本发明也涉及产生本发明多肽的方法,包括:(a)在适合于诱导多肽产生的条件下,培养含有编码本发明的具有纤维二糖水解酶II活性的核苷酸序列的转基因植物或植物细胞,以及(b)收获所述多肽。
本发明也涉及原位产生本发明多肽的方法,包括:(a)在适合于诱导多肽产生的条件下,培养含有编码本发明的具有纤维二糖水解酶II活性的核苷酸序列的转基因植物或植物细胞,以及(b)没有先收获所述多肽,直接将所述多肽与预期基质接触,所述基质如纤维素基质。
组合物
在进一步的方面,本发明涉及含有本发明多肽的组合物。
所述组合物含有的本发明多肽作为主要酶组分,如单组分的组合物。或者,组合物可含有多个酶活性,如氨基肽酶、淀粉酶、糖酶(carbohydrase)、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖酶、β-半乳糖酶、葡糖淀粉酶,α-葡糖苷酶,β-葡糖苷酶,haloperoxidase、转化酶、漆酶、脂肪酶、甘露糖酶、氧化酶、果胶降解酶(pectinolytic)、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、植酸酶、多酚氧化酶(polyphenoloxidase)、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶(transglutaminase),或木聚糖酶。
可根据本领域已知方法来制备所述组合物,或以液体或干燥形式的组合物。例如,多肽组合物可以是颗粒状或微粒状的形式。可根据现在技术中方法来使包含在组合物中的多肽的稳定化。
下面给出利用本发明的多肽组合物的优选例子。也根据现有技术的已知方法来确定本发明的多肽组合物的剂量和其它的使用条件。
清洁剂(detergent)组合物
本发明的多肽可加入并成为清洁剂组合物的成分之一。
本发明的清洁剂组合物例如可制成手洗或机洗清洁剂组合物,包括适合于对染色织物的预处理的洗衣添加剂组合物和清洗添加的织物软化剂组合物,或制备成用于家居中硬表面的清洗的清洁剂组合物,或制成用于手工或机器洗碗(dishwashing)的组合物。
在一个特别方面,本发明提供含有本发明多肽的清洁添加剂。清洁添加剂与清洁剂组合物一样,可以含有一个或多个酶,如蛋白酶、脂肪酶、角质酶、淀粉酶、糖酶、纤维素酶、果胶酶(pectinase)、甘露聚糖酶(mannanase)、阿聚糖酶(arabinase)、半乳聚糖酶(galactanase)、木聚糖酶、氧化酶,如漆酶和/或过氧化物酶。
通常,所选择的酶的特性应当与所选择的清洁剂是相容的(即最佳pH值,与其它的酶或非酶成分相容等),并且应当含有效量的酶。
蛋白酶:合适的蛋白酶包括那些动物、植物或微生物来源的酶。微生物来源的酶是优选的。也包括化学修饰或蛋白工程的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性微生物蛋白酶或类胰蛋白酶。碱性蛋白酶的实例包括枯草杆菌蛋白酶,尤其来自芽孢杆菌属的酶,如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(参见WO 89/06279)。类胰蛋白酶的实例如胰蛋白酶(如猪或牛来源的)和镰孢属(Fusarium)蛋白酶,可参见WO89/06270和WO 94/25583。
有用的蛋白酶的例子可参见WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946,尤其是那些在下述位点进行一个或多个取代的突变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235以及274。
脂肪酶:合适的脂肪酶包括细菌或真菌来源的。也包括化学修饰或蛋白工程的突变体。有用的脂肪酶的实例包括来自于腐质霉属(Humicola)(同Thermomyces),如H.lanuginosa(T.lanuginosus)的脂肪酶,参见EP 258 068和EP 305 216,或者来自于H.insolens的脂肪酶,参见WO 96/13580、假单孢菌属(Pseudomonas)脂肪酶,如来自产碱假单孢菌(P.alcaligenes)或类产碱假单孢菌(P.pseudoalcaligenes)(EP 218 272)、葱头假单孢菌(P.cepacia)(EP331 376)、施氏假单孢菌(P.stutzeri)(GB 1,372,034)、荧光假单孢菌(P.fluorescens)、假单孢菌属菌株(Pseudomonas sp.strain SD 705(WO 95/06720和WO 96/27002)、P.wisconsinensis(WO 96/12012)、以及芽孢杆菌属脂肪酶,如来自枯草芽孢杆菌(B.subtilis)(Dartois et al.(1993),Biochemica etBiophysica Acta,1131,253-360)、嗜热脂肪芽孢杆菌(B.stearothermophilus)(JP 64/744992)或短小芽孢杆菌(B.pumilus)(WO 91/16422)。
其它脂肪酶的突变体,如参见WO 92/05249、WO 94/01541、EP 407 225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202。
淀粉酶:合适的淀粉酶(α和/或β),包括来自细菌或真菌来源的淀粉酶。也包括化学修饰或蛋白工程的突变体。淀粉酶包括,例如α-淀粉酶,来自芽孢杆菌属,如地衣芽孢杆菌(B.licheniformis),详细的可参见GB 1,296,839。
有用的淀粉酶实例如描述于WO 94/02597、WO 94/18314、WO 96/23873和WO 97/43424中的变体,尤其是在下述位点进行一个或多个取代的突变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
纤维素酶:合适的纤维素酶包括细菌或真菌来源的。也包括化学修饰或蛋白工程的突变体。合适的纤维素酶包括来自Bacillus、Pseudomonas、Humicola、Fusarium、草根霉属(Thielavia)、支顶孢属(Acremonium)的纤维素酶,如由Humicola insolens、Myceliophthora thermophila和尖孢镰孢产生的真菌纤维素酶,参见US 4,435,307、US 5,648,263、US 5,691,178、US5,776,757和WO 89/09259。
特别合适的纤维素酶是碱性或中性纤维素酶,具有不使颜色褪除的优点(colour care benefits)。这种纤维素酶的例子参见EP 0 495 257、EP 0 531372、WO 96/11262、WO 96/29397、WO 98/08940。其它例子是纤维素酶突变体,如参见WO 94/07998、EP 0 531 315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌来源的。也包括化学修饰或蛋白工程的突变体。有用的过氧化物酶,包括来自Coprins,如C.cinereus的酶,它们的突变体参见WO 93/24618、WO95/10602和WO 98/15257。
清洁酶可通过添加含有一或多个酶的单独添加剂,或添加含有所有酶的组合添加剂而将其包含在清洁剂组合物中。本发明的清洁添加剂,即单独或组合的添加剂,可以制成粒状、液体或浆状等形式。优选的清洁添加剂制型是粒状,特别是无粉尘(non-dusting)粒状,或者液体,特别是稳定的液体或浆状。
无粉尘粒状可通过描述于US 4,106,991和4,661,452的方法来生产,且可选地用本领域已知技术进行包覆。蜡包覆材料包括聚(氧化乙烯(ethyleneoxide))产物(聚乙二醇,PEG),其平均摩尔重量为1000-20000;乙氧基化壬基酚(ethoxylated nonylphenols)具有16-50个氧化乙烯单元;乙氧基化脂肪族醇,其中醇含有12-20个碳原子和具有15-80个氧化乙烯单元;脂肪族醇;脂肪酸以及脂肪酸甘油单-和双及三酯。在GB 1483591中提供了适合于流化床技术的成膜包覆材料。液态酶预制备物(pre-parations),例如可根据现有技术来添加下述物质进行稳定化:多羟基化合物,如丙二醇、糖类或糖醇、乳酸或硼酸。根据EP 238,216中公开的方法来制备保护性酶。
本发明的清洁剂组合物可以是任何方便的形式,如条状、片状、粉状、粒状、糊状或液状。液态清洁剂可以是水剂或非水剂,其中水剂典型的包含最多至70%的水和0-30%的有机溶剂。
清洁剂组合物含有一或多个表面活性剂,可以是非离子型的,包括半极性(semi-polar)和/或阴离子和/或阳离子和/或两性离子。表面活性剂的添加量典型地在0.1%重量-60%重量。
当在清洁剂中包含阴离子表面活性剂,通常的添加量为约1%-约40%,例如线性烷基苯磺酸盐、α-烯属磺酸酯、烷基硫酸盐(脂肪族纯的硫酸酯)、醇乙氧基硫酸盐、次级烷基磺酸盐(secondary alkanesulfonate)、α-磺基脂肪酸甲基酯(alpha-sulfo fatty acid methyl ester)、烷基-或链烯基-琥珀酸或肥皂。
当在清洁剂中包含非离子表面活性剂,通常的添加量为约0.2%-约40%,例如脂肪醇乙氧基化物、壬基苯酚乙氧基化物、烷基多苷、烷基二甲基胺氧化物、脂肪单乙醇酰胺乙氧基化物、脂肪单乙醇酰胺、多羟基烷基脂肪酰胺或葡糖胺的N-酰基N-烷基衍生物(″葡糖酰胺″)。
清洁剂中也可含有0-65%的洗涤剂助剂或络合剂,如沸石、二磷酸盐、三磷酸盐、磷酸盐、碳酸盐、柠檬酸盐、氨三乙酸、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或链烯基琥珀酸、可溶性硅酸盐或layered硅酸盐(例如购自Hoechst的SKS-6)。
清洁剂可含有一或多种聚合物。例如羧甲基纤维素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(丁苯吡-N-o氧化物)、聚(乙烯基咪唑)、聚羧酸酯,如聚丙烯酸酯、马来酸/丙烯酸共聚物和甲基丙烯酸月桂酯/丙烯酸共聚物。
清洁剂可含有漂白系统,可含有H2O2源,如过硼酸盐或过碳酸盐,其可与过酸形式的漂白激活剂组合,如四乙酰基乙二胺或壬酰羟苯磺酰。可选地,漂白系统可含有如氨基化合物、酰亚胺或砜的过氧酸。
本发明的清洁剂组合物的酶可通过常规的稳定化试剂来进行稳定,如多元醇,例如丙二醇或丙三醇、糖类或糖醇、乳酸、硼酸或硼酸衍生物,如芳香硼酸酯或苯基硼酸衍生物如4-甲醛酚(formylphenyl)硼酸,并且组合物中可制成如WO 92/19709和WO 92/19708中描述的制型。
清洁剂也可含有其它常规的清洁剂成分,如织物调节剂(fabricconditioners),包括粘土、泡沫促进剂、抑泡剂、抗腐蚀剂、污垢悬浮剂、抗污垢重新沉淀淀剂、染料(dyes)、杀菌剂、荧光增白剂、水溶助长剂、晦暗抑制剂或香料。
从目前看来,清洁剂组合物中酶,尤其是本发明的多肽的添加量相当于0.01-100mg酶蛋白每升洗涤液,优选为0.05-5mg酶蛋白每升洗涤液,特别优选为0.1-1mg酶蛋白每升洗涤液。
本发明的多肽可额外增加到WO 97/07202中公开的清洁剂制型中,该文献引入作为参考。
从生物质(biomass)产生乙醇
本发明也涉及从生物质例如是纤维材料产生乙醇的方法,包括:将生物质与本发明的多肽接触。然后收获得乙醇。本发明的多肽可“原位产生”即作为乙醇产生过程中的一部分或直接于该过程中产生,是通过在能够产生所述多肽的条件下培养宿主细胞或菌株,其中所述宿主细胞或菌株的野生型形式即能产生所述多肽。
通过对生物质进行酶解,并将释放出来的多糖转换成乙醇。这种类型的乙醇被称为生物乙醇(bioethanol)或生物燃料(biofuel)。它可作为燃料添加剂或混合中的补充剂从低至1%和高至100%(燃料替代物)。在有些国家,如巴西,乙醇在很大程度上代替了汽油。
在生物质的初级细胞壁中主要的多糖是纤维素,其次半纤维素,第三位的是果胶。次级细胞壁是在细胞停止生长之后产生的,也含有多糖,并通过聚合木质素共价交联到半纤维素加强。纤维素是脱水纤维二糖的均聚化物,因而是线性β(1-4)-D-葡聚糖,而半纤维素包括了多种化合物,如木聚糖、xyloglucans、阿拉伯糖基木聚糖和甘露聚糖,并具有取代物谱复杂分支结构(complex branched structure with a spectrum of substitents)。虽然通常是多形性,纤维素以平行的葡聚糖链作为不溶性晶形基质(crystalline matrix)主要存在于植物组织中。半纤维素通常经氢键连接到纤维素和其它半纤维素上,以协助对细胞壁基质的稳定。
三种主要类型的纤维素酶用于降解生物质:
“内切-1,4-β-葡聚糖酶”或1,4-β-D-葡聚糖-4-葡聚糖水解酶(glucanohydrolases)(EC 3.2.1.4),随机作用于可溶性和不溶性1,4-β-葡聚糖底物。
“外切-1,4-β-D-葡聚糖酶”包括1,4-β-D-葡聚糖-糖水解酶(glucohydrolases)(EC 3.2.1.74),它作用于1,4-β-D-葡聚糖而释放D-葡萄糖,并能缓慢水解D-纤维二糖,也包括1,4-β-D-葡聚糖纤维二糖水解酶(EC 3.2.1.91),也称为纤维二糖水解酶I和II,自1,4-β-葡聚糖而释放出D-纤维二糖。
“β-D-葡糖苷酶”或β-D-葡糖苷糖水解酶(EC 3.2.1.21),自纤维二糖和可溶性纤维糊精以及葡糖苷组(array of glycosides)以释放出D-葡萄糖单元。
这三种类型的酶共同作用,产生复杂的互作,因而能有效地自生物质的天然纤维素进行去晶化和水解,产生还原性糖,再通过发酵获得乙醇。
通过下面的实施例对本发明作进一步的描述,但不能解释为对本发明范围的限制。
实施例
缓冲液中使用的化学试剂和底物,从商业途径获得,并至少为试剂纯级别。
实施例1
在嗜热真菌中进行纤维二糖水解酶II的分子筛选
真菌菌株用80ml液体培养基(2.5%Avicel,0.5%葡萄糖,0.14%(NH4)2SO4)于500ml Erlenmeyer瓶中生长。在45℃和165rpm转速条件下培养72小时。通过7000rpm离心30分钟收获菌丝体,并在进行RNA提取之前于-80℃保藏。
采用RNeasy Mini Kit(QIAGEN,Cat.No.74904)从每一个菌株的100mg菌丝体中提取总RNA。
基于已知的CBHII蛋白序列的排比设计简并引物。设计了下述引物(也参见SEQ ID NO:27-32)
SEQ ID NO:27 CBHII 1S:5′TGG GGN CA(A/G)TG(T/C)GGN GG3′
SEQ ID NO:28  CBHII 2S:5′TGG(T/C)TN GGN TGG CCN GC 3′
SEQ ID NO:29  CBHII 2AS:5′GCN GGC CAN CCN A(A/G)C CA 3′(反向)
SEQ ID NO:30 CBHII 3AS:5′TT(A/G)CAC CA(A/G)TCN CCC CA 3′(反向)
SEQ ID NO:31 CBHII 4AS:5′GG(T/C)TTN ACC CAN AC(A/G)AA 3′(反向)
SEQ ID NO:32 CBHII 5AS:5′AA(A/G)TAN GC(T/C)TG(A/G)AACCA 3′(反向)
采用3′RACE系统(GIBCO.,Cat.No.18373-019)自总RNA合成cDNA。约5μg总RNA作为模板和Adapter Primer(由3′RACE system提供)用于合成第一链cDNA。然后用不同的简并引物组合扩增cDNA。反应混合物含有2.5μl 10x PCR缓冲液,1.5μl 25mM MgCI2,1.5μl 25mM MgCI2,0.5μl 10mMdNTP混合物,0.5μl,10μM 3′引物,0.5μl AUAP(10μM,均由3′RACE system提供),0.5 μl TaqDNA聚合酶(5u/μl,Promega),1μl cDNA合成反应以及加入高压灭菌的蒸馏水至25μl。
PCR反应条件如下:反应混合物于94℃ 3分钟,继续进行30个循环,即94℃ 30秒,50℃ 30秒和72℃延伸1分钟。最后于72℃延伸10分钟,于4℃保持。
将每一对引物产生的正确大小的PCR产物从1%琼脂糖(1X TBE)凝胶上回收,然后于60℃水浴中温育,继续而用GFXTMPCR DNA和Gel BandPurification Kit(Amersham Pharmacia Biotech Inc.,Cat.No.27-9602-01)进行纯化。通过分光光度计于A260和A280下测定纯化产物的浓度。然后根据Promega试剂盒(Cat.No.A3600)将这些纯化片段连接到pGEM-T Vector(Promega,Cat.No.A3600)。
利用“热激”方法,将1microL连接产物转化50microL JM109高度感受态细胞。转化培养液与氨苄青霉素/IPTG/X-Gal涂布于LB培养平板上,并于37℃培养过夜。通过在指示平板上进行颜色筛选和集落PCR筛选获得重组克隆。阳性克隆接种在3ml LB液体培养基中,于37℃和250rpm进行培养。于10,000xg下离心5分钟进行沉淀,用Minipreps DNA PurificationSystem(Promega,Cat.No.A7100)从细胞沉淀中制备质粒样品。最后利用BigDye Terminator Cycle Sequencing Ready Reaction Kit(PE),在AB1377测序仪上对质粒进行测序。测序反应如下:4μl Terminator Ready Reaction Mix,1.0-1.5μg质粒DNA,3.2pmol引物,加dH2O至最终体积10μl。
由不同引物对获得的cDNA克隆进行序列分析表明序列中含有CBHII基因的编码区。利用引物成功地从所有下述被测真菌中筛选到CBHII基因:Chaetomium thermophilum、Myceliophtora thermophila、Acremoniumthermophilum、Melanocarpus sp.、Thielavia microspore、曲霉属的种、Thielaviaaustraliensis、塔宾曲霉、密粘褶菌、Meripilus giganteus、Trichophaea saccata、Stibella anualata以及Malbrancheae cinnamonea。鉴定出的CBHII编码DNA序列如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQID NO:9、SEQ ID NO:13、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23以及SEQID NO:25所示。从塔宾曲霉、Chaetomium thermophilum、Myceliophtorathermophila、Trichophaea saccata、Stibella anualata和Malbrancheae cinnamonea中获得了全长序列。从Acremonium thermophilum、Melanocarpus sp.、Thielavia microspore、曲霉属的种、Thielavia australiensis、密粘褶菌和Meripilus giganteus中只获得了部分序列。
除应用上述方法之外,可通过标准杂交技术和部分cDNA序列作为探针筛选cDNA文库获得全长cDNA。将探针检测获得显示阳性杂交信号的克隆纯化,并通过测序确定最长cDNA序列。同源搜索和对比验证全长cDNA与相应的最初作为探针的部分CBHII cDNA序列。
上面描述的两种技术需要根据cDNA文库或用于构建的cDNA中是否存在全长的CBHII cDNA。或者5′和3′RACE(Rapid Amplification of cDNAEnds)技术或衍生技术可以用于鉴定缺失的5′和3′区域。基于此,用含有Adapter Primer或5′-Gene Specific Primer(GSP)的寡聚(dT)以分离获得的mRNA为模板合成第一链cDNAs。
CBHII基因的全长cDNA也可从基因组DNA中获得。通过如上面描述的PCR技术或用杂交方法和部分CBHII cDNA作为探针进行标准基因组文库筛选来鉴定CBHII基因。用CBHII cDNA进行同源搜索和对比与CBHII基因相应的基因组序列。鉴定出共有序列如转录起始位点、起始和终止密码子或polyA位点可用于确定是否包含了全长cDNA。然后就可用根据这个区域的5’和3’端设计的引物从mRNA或cDNA文库中扩增全长的cDNA(如上所述)。
在合适的表达宿主构建体中表达全长基因,CBHII酶作为胞内酶或作为胞外酶分泌到培养液中而被收获。
实施例2
用Blast将蛋白序列与Swall、ERDBP和GenSeqP进行比较。如果序列是全长的,催化核心可用PFAMM HMM进行预测,且只有核心区用于搜索数据库。在公共数据库中有最高击中(highest hit)的序列如下,但在ERDB中重复存在的序列除外:
Chaetomium thermophilum NP000980与SWALL:Q9C1S9,family 6结构域中的Humicola insolen微晶纤维素酶II糖基水解酶(Glycosyl hydrolase)有83%的同一性。
Myceliophtora thermophila NP001130与 geneseqp|aaw44827laaw44827中H.insolens NCE2有79%的蛋白同一性。
支顶孢属的种T178-4 NP001132与 geneseqp|aaw25789Law25789中的Acremonium cellulolyticus纤维素酶有74%的蛋白同一性。糖基水解酶family 6结构域(domain)。
Melanocarpus sp.AT181-3 NP001133与 aeneseqp|aay010771aa 01077中的H.insolens Cel6A真菌纤维素酶有91%的蛋白同一性。糖基水解酶family6结构域。
Thielavia microspora T046-1 NP001134与 geneseqp|aaw44827|aw44827中的H.insolens纤维素酶NC2有79%的蛋白同一性。糖基水解酶family 6结构域。
曲霉属的种T186-2 NP001136与 swall|q02321|q02321 Phanerochaetechrysosporium中的外切纤维二糖水解酶有71%的蛋白同一性。糖基水解酶family 6结构域。
Thielavia australiensis NP001000与 geneseqp|aaw44827|aaw44827中的H.insolens纤维素酶NC2蛋白有77%的蛋白同一性。糖基水解酶family 6结构域。
塔宾曲霉NP001143与SWALL:Q8NIB5 Talaromyces emersonii中的CBHII有67%的蛋白同一性。其DNA序列与NP001144密粘褶菌有94%的同一性。糖基水解酶family 6结构域。
密粘褶菌NP001144与CBHII SWALL:Q8NIB5 Talaromyces emersonii有67%的蛋白同一性。其DNA序列与NP001144密粘褶菌有94%的同一性。
实施例3
Malbranchia cinnamonea CBHII基因和Stilbella anulata CBHII基因的测序
在克隆ZY043193中的cDNA插入序列,编码了Malbranchia cinnamoneaCBHII的cDNA,克隆ZY040206,编码Stilbella anulata CBHII的cDNA,对其进行测序,其phred质量值>40,表明DNA序列数据具有高度真实性。DNA测序是在ABI 3700(ABI,Foster City,CA)上,根据厂家提供的程序进行操作。序列数据的组装按phred/phrap/consed(University of Washington)进行。
实施例4
Malbranchia cinnamonea CBHII基因和Stilbella anulata CBHII基因的表达质粒的构建
上述的Malbranchia cinnamonea CBHII基因的克隆和核苷酸序列被用于基因的亚克隆,并于曲霉属宿主中进行表达。聚合酶链式反应方法用于从分离的cDNA克隆ZY043193进行CBHII基因(没有其启动子)的亚克隆,所用引物根据所述核苷酸序列进行设计。为了便于将基因片段亚克隆到pAILo 2表达载体中,在基因的5’和3’末端分别引入BspH I和Pac I限制性内切酶位点。pAILo 2载体中含有TAKA启动子,NA2-tpi前导序列和AMG终止子作为调控序列。该质粒中也含有构巢曲霉(Aspergillus nidulans)pyrG基因作为真菌转化的选择标记。下述引物用于PCR扩增反应:
Primer F4(正向):5′GGGTCATGAGAGACTCTTTGTTCAC 3′(SEQ IDNO:33)
Primer R4(反向):5′GGGTTAATTAATTAGAATGGGGGGTTGGCATTTC3′(SEQ ID NO:34)
用Pwo聚合酶(Boehringer Mannheim),根据厂家说明书进行PCR反应。PCR扩增产物通过凝胶进行分离,并用BspH I和Pac I酶切割,进而凝胶纯化。纯化片段连接到pAILo 2载体(已用Nco I和Pac I切割),获得质粒pEJG100,其中M.einnamonea CBHII基因的转录由TAKA启动子控制。质粒pEJG100转化入E coli Solopac Gold细胞(Stratagene,La Jolla,CA)。分离含有pEJG100质粒的E.coli转化体,并制备质粒DNA,以转化和于曲霉属中进行表达。
上面描述的Stilbella anulata CBHII基因的克隆和核苷酸序列用于基因的亚克隆和在曲属霉宿主中的表达。根据核苷酸序列设计引物,利用聚合酶链式反应技术从eDNA克隆ZY040206中对CBHII基因(没有自身的启动子)进行亚克隆。为了便于将基因片段亚克隆到pAILo2表达载体中,PCR引物被设计成含有与pAILo2表达载体的克隆位点相容的限制性位点(Nco I和Pac I),以满足Infusion PCR试剂盒方案(Clonetech,Palo Alto,CA)对重叠区的要求。下述引物用于PCR扩增反应:
Primer F4.1(正向):5′ACTGGATTTACCATGGCCGGTCGATTCTTCC 3′(SEQ ID NO:35)
Primer R4.1(反向):5′AGTCACCTCTAGTTATTAGAAGGCGGGGTTG3′(SEQ ID NO:36)
用Pfx聚合酶(Life Technologies)和1x enhancer以获得PCR产物。将1400bp产物的凝胶带切下,用Qiaquick(Qiagen,Valencia,CA)纯化,用Infusion反应将其连接到pALLO 2中。获得的pEJG96质粒转化入E coliSolopac Gold细胞(Stratagene,La Jolla,CA)。分离含有pEJG96质粒的E.coli转化体,并从中制备质粒DNA,用以转化和在曲属霉中进行表达。
实施例3
米曲霉的转化
制备A.oryzae菌株JAL 250的原生质体,该菌株中的pyrG基因缺失。原生质体的制备和转化按前面述描述的方法进行(Christensen et al.,同上)。基于在尿嘧啶不存在时也能生长的能力而选择表达乳清酸核苷单磷酸脱羧酶的米曲霉转化体。对于转化体,在选择平板上进行两次孢子纯化,孢子纯化的转化体用于进一步分析。
实施例4
在米曲霉中表达Malbranchia cinnamonea CBHII基因和Stilbella anulataCBHII
振摇的三角瓶(125ml的三角瓶中含25ml培养基)中筛选能表达CBHII的转化体,所用培养基含有下述成分(单位g/L):麦芽糖50、MgSO4.7H2O2.0、KH2PO4 10.0、K2SO4 2.0、柠檬酸2.0、酵母抽提物10.0、AMG痕量金属溶液0.5ml、尿素2.0。在进行高压灭菌之前,将培养基的pH调节到6.5。在三角瓶中接种新鲜孢子,在34℃,200rpm的转速下培养。第5天收集培养液上清。取5微升的培养液上清进行8-16%Tris-甘氨酸凝胶电泳。对于Malbranchia cinnamonea CBHII,蛋白的预期分子量为43kDa。相对于背景而言,转化体的电泳条带在约50kDa处可见明显斑点。对于Stilbellaanulata CBHII,蛋白的预期分子量为49kDa。转化体的电泳条带在约55kDa处可见明显斑点。
实施例5
根据Schulen 1997,J.Biotechnol.Vol.57,第71-81页所述方法制备磷酸纤维素(PASC)。用BCA Protein Assay(Pierce),根据产品说明书来测定蛋白浓度。蛋白等份于8-16%丙烯酰胺梯度凝胶(Invitrogen)上电泳,并用BiosafeCoomassie Stain(Biorad)染色。
对于表达了Stilbella annulata Cel6A(约55kD)和Malbranchia cinnamoneaCel6A(约49kD)酶的米曲霉液体培养基,用Centricon Plus 20(Millipore)过滤装置通过吊桶式(bucket)转头(Sorvall RC3B Plus,总时间约25分钟,转速3000rpm)离心浓缩。约3ml的每一个浓缩物上样到10DG Econo PAC柱(Biorad)上,用50mM乙酸钠pH5.0平衡,脱盐材料用4ml的50mM乙酸钠pH5.0进行洗脱。测定每个样品的蛋白浓度,并取等份在8-16%丙烯酰胺梯度凝胶上电泳。用96孔微量培养板进行PASC活性分析(终点分析endpoint assay)。简而言之,10μl适当稀释葡萄糖标准液(2mg/ml至0.25mg/ml)置于含有190μl 50mM乙酸钠缓冲液pH5.0和0.5mg/ml BSA(稀释缓冲液)的孔中。每一个分析中均包括试剂对照(200μl稀释缓冲液)、样品对照(10μl稀释液与190μl稀释缓冲液)以及底物对照(10μl稀释缓冲液与190μl 2g/LPASC的稀释缓冲液)。每一个待测样品设计一系列稀释液,每一稀释液的10μl置于指定的孔中。加入190μl的2g/L PASC以起动反应。混匀,并将微量培养板置于50℃的水浴中30分钟。加入500μl的0.5M NaOH到每一孔中以终止反应。微量培养板于2000rpm下离心5分钟(Sorvall RT7),每一样品的100μl等份转移到96孔微量培养板的圆锥形孔中。还原性糖含量的测定通过加入50μl的1.5%(w/v)p-Hydroxybenzoic Acid Hydrazide(PHBAH)到每一个孔中,并于95℃中温育10分钟。板冷却到室温后,每孔加入50μl双蒸水。再从每孔中取100μl等份转移到平底96孔微量滴定板,利用SpectraMAX平板读数仪测定OD 410值。
用于PHBAH部分分析的葡萄糖标准液建立葡萄糖标准曲线(A410相对于葡萄糖浓度(mg/ml))。用标准曲线的斜率(slope)和截点产生第二图,即以μmol还原性糖/min/ml相对于蛋白浓度(mg/ml)进行绘图,以得到样品于50℃下测定的特异性活性(IU/mg)。Stilbella annulata的特异性活性是0.24(IU/mg),而Malbranchia cinnamonea为1.40(IU/mg)。
实施例6
纤维二糖水解酶活性
纤维二糖水解酶的特点在于相对于其它纤维素而言,能有效的水解高晶形纤维素。纤维二糖水解酶对用PASC(磷酸溶胀(swollen)纤维素)作为底物时的催化活性要高于以CMC作底物的活性。对于本发明,下述任何方法均可用于鉴定纤维二糖水解酶:
对Azo-Avicel的活性
Azo-Avicel(Megazyme,Bray Business Park,Bray,Wicklow,Ireland)的使用根据厂家说明书进行。
对PNP-β-纤维二糖的活性
50microL CBH底物溶液(5mM PNP-β-纤维二糖(p-Nitrophenyl(3-d-Cellobioside Sigma N-5759)于0.1M乙酸钠缓冲液,pH5.0)与1mL底物溶液混合,于40℃下保持20分钟。加入5mL终止试剂(0.1M乙酸钠,pH11.5)终止反应。于404nm处测定光吸收值。
对PASC和CMC的活性
用纤维二糖水解酶降解这些底物形成还原性糖。Microdochium nivale糖(carbohydrate)氧化酶(rMnO)或另一种等价物氧化物在氧气存在的情况下作用于还原性糖而形成H2O2。形成的H2O2在过量的过氧化酶存在下激活于4-氨基安替比林(4-aminoantipyrine,AA)和N-乙基-N-磺丙基-m-甲苯胺(TOPS)的氧化浓缩形成紫色产物,而该产物可通过在550nm的光吸收值进行过量测定。
当除纤维二糖水解酶之外的所有成分都过量时,光吸收值增加的速率与纤维二糖水解酶活性成比例关系。该反应是单动力学步骤(one-kinetic-step)反应,可在能测量稳定状态动力学的Cobas Fara离心分析仪(centrifugalanalyzer)(Hoffmann La Roche)或其它等价的分光光度计中自动的进行。
缓冲液:50mM乙酸钠缓冲液(pH5.0)
试剂:rMnO氧化酶,纯化的Microdochium nivale糖氧化酶,2mg/L
过氧化酶,SIGMA P-8125(96 U/mg),25mg/L
4-氨基安替比林,SIGMA A-4382,200mg/L
TOPS,SIGMA E-8506,600mg/L
PASC或CMC(见下述),5g/L
所有试剂按上述浓度加入到缓冲液中,得到反应溶液充分混匀。
50microL纤维二糖水解酶II样品(以合适的稀释形式)与300microL反应溶液混合,于40℃中保持20分钟。在550nm处检测和测量紫色产物。
AA/TOPS凝聚物的光吸收系数是0.01935 A550/(microM cm)。根据OD550/分钟和光吸收系数计算出每分钟产生还原糖的微摩尔数作为反应速率。
PASC:
材料:5g微晶纤维素(Art.2331 Merck);
150mL 85%正磷酸(Art.573 Merck);
800mL丙酮(Art.14 Merck);
约2升去离子水(Milli-Q);
1L glass beaker;
1L玻璃过滤漏斗;
2L抽吸烧瓶;
Ultra Turrax Homogenizer。
丙酮和正磷酸在冰上冷却。微晶纤维素Avicel用水湿润,然后加入150mL冷预冷的85%正磷酸。混合物置于冰浴中轻轻摇动1小时。
加入500mL冰冷的丙酮,同时搅拌,然后将混合物转移到玻璃过滤漏斗,用3×100mL冰冷的丙酮洗涤,每一次洗涤都尽量抽吸干。用2×500mL水洗涤(或直到没有丙酮气味为止),每一次洗涤都尽量抽吸干。
将得到的固体重悬于水中,至总体积为500mL,并用Ultra TurraxHomogenizer进行匀化,冷藏,在使用前通过离心和重悬而被缓冲液平衡。
CMC:
未纯化的细菌纤维素微纤维从日本食品″nata de coco″(Fujico Company,Japan)中获取。350g的这种产品中的纤维素悬浮于约4L自来水中进行纯化。每天用新鲜水置换2次,持续4天。
然后1%(w/v)NaOH,而不再用水,将产品悬液于该碱性溶液中,每天两次,持续4天。用蒸馏水冲洗纯化的纤维素直到产品表面的达到中性(pH7)而中和。
该纤维素为微纤维化,单独的细菌纤维素微纤维的悬浮液可将纯化的纤维素微纤维在Waring搅拌机中均化30分钟。纤维素微纤维进一步通过对悬浮液进行透析来纯化,用孔膜通过蒸馏水进行透析。分离和纯化的纤维素微纤维的水溶液于4℃保藏。
实施例7
在米曲霉中表达Malbranchia cinnamonea CBHII基因
Malbranchia cinnamonea CBHII基因在米曲霉中进行表达,纯化约42kDa大小的酶至95%的纯度,其活性为1650pnp-BDG。
实施例8
两个重组表达(米曲霉)来自Stilbella annulata(Cel6A)和Malbrancheacinnamonea(Cel6B)CBHII酶,通过对磷酸纤维素(PASC)的作用分析其活性。
表达重组Stilbella annulata Cel6A(-55kDa)和Malbranchia cinnamoneaCel6B(-49kDa)的米曲霉(Aspergillus orzyae)液体培养基通过Centricon Plus20过滤装置用吊桶式转子(Sorvall RC3B Plus,-25分钟,3,000rpm)进行浓缩。约3ml的每一个浓缩物上样到用50mM乙酸钠(pH5.0)平衡的10DGEcono PAC柱(Biorad),脱盐的材料用4ml 50mM乙酸钠pH5.0进行洗脱。每一个样品的蛋白浓度用BCA ProteinAssay Kit(Pierce)进行测定,另一等份于8-16%丙烯酰胺梯度凝胶(Invitrogen)上进行电泳。
对PASC的活性分析是利用96孔微量培养板上进行的。简而言之,10μl适当稀释葡萄糖标准液(2mg/ml至0.25mg/ml)置于含有190μl 50mM乙酸钠缓冲液pH5.0和0.5mg/ml BSA(稀释缓冲液)的孔中。每一个分析中均包括试剂对照(200μl稀释缓冲液)、样品对照(10μl稀释液与190μl稀释缓冲液)以及底物对照(10μl稀释缓冲液与190μl 2g/L PASC的稀释缓冲液)。每一个待测样品设计一系列稀释液,每一稀释液的10μl置于指定的孔中。加入190μl的2g/L PASC以起动反应。并将微量培养板密封并置于50℃的水浴中30分钟。加入500μl的0.5M NaOH到每一孔中以终止反应。微量培养板于2000rpm下离心5分钟(Sorvall RT7),每一样品的100μl等份转移到96孔微量培养板的圆锥形孔中。通过加入50μl的1.5%(w/v)p-Hydroxybenzoic Acid Hydrazide(PHBAH)到每一个孔中,并于95℃中温育10分钟来测定还原性糖含量。接着培养步骤后,微量培养板冷却到室温后,每孔加入50μl ddH2O。再从每孔中取100μl等份转移到平底96孔微量滴定板,利用Spectra MAX平板读数仪测定OD410值。
用于PASC分析的葡萄糖标准曲线(A410相对于葡萄糖浓度(mg/ml)),用其斜率和截点(intercept)产生第二图,即以μmol还原性糖/min/ml相对于蛋白浓度(mg/ml)进行绘图,以得到所测样品的特异性活性(IU/mg)。在确定对PASC的特异性活性(SA)时,只有转化百分率低于2%的才使用。
用1.1ml Immunoware微管(Pierce)作底物,总反应体系为1.0ml来进行对PCS的水解分析。在该水解PCS(20mg/ml,50mM乙酸钠缓冲液pH5.0)的方法中,用不同的蛋白上样量(用mg酶/克PCS表示),即Thielavia terrestris液体培养基或含3%米曲霉β葡糖苷酶的Celluclast 1.5L样品(3%的Cellulase蛋白样量)。草根霉属的PCS水解能力的特征鉴定是在多种温度下进行:即40℃、50℃和65℃(Isotemp 102S水浴仪)。典型地,反应设置有重复,并在不同水解时间(t=0,2,4,6,8和24小时)取出等份。在20μl等份的每一水解液与180μl的0.44%NaOH(终止试剂)以终止对PCS的水解反应。产生每一个样品的合适的系列稀释液,采用96孔微量培养板,通过p-Hydroxybenzoic Acid Hydrazide(PHBAH)分析来确定其中的还原糖含量。简而言之,90μl等份的合适稀释液样品置于96孔圆锥形底微量培养板的孔中。加入60μl 1.5%(w/v)PHBAH的2%NaOH溶液至每一孔中。培养板不密封(uncover),于95℃加热10分钟。培养板冷却到室温,再加入50μlddH2O至每一孔中。从每一孔中取出100μl等份转移到平底的96孔培养板中,用SpectraMax Microplate Reader(Molecular Devices)测定A410nm的光吸收值。葡萄糖标准溶液(用0.4%氢氧化钠稀释至0.1-0.0125mg/ml)用于制备标准曲线,通过该曲线将A410光吸收值转换成相应的葡萄糖等价量。获得的葡萄糖等价量(equivalent)用于计算每一个反应中的PCS纤维素转换百分率。对于Celluclast 1.5L PCS水解分析所采用的基准条件如下:50mg/mlPCS的50mM乙酸钠pH5.0溶液,约21mg酶/g PCS(等于约10FPU),不额外添加β葡糖苷酶,温度为38℃。
表达来自Stilbella annulata(Cel6A)和Malbranchea cinnamonea(Cel6B)的CBHII酶的米曲霉液体培养基被脱盐,浓缩并用“材料与方法”部分描述的方法来测定蛋白浓度。在8-16%丙烯酰胺梯度凝胶上分析这些重组表达蛋白表达Stilbella Cel6A酶(图1,第1道)明显具有分子量约55kDa的条带,而对于Malbranchea Cel6B是约49kDa(图1,第2道)。
为了确定这些重组蛋白是否具有酶活性,以PASC作底物进行了水解反应。根据上面描述的条件,测得Stilbella annulata(Cel6A)和Malbrancheacinnamonea(Cel6B)分别具有0.24IU/mg和1.40IU/mg的特异性活性。
生物材料的保藏
中国微生物保藏管理委员会普通微生物中心(CGMCC)
下述生物材料于2002年12月19日根据布达佩期条约保藏于中国微生物保藏管理委员会普通微生物中心(CGMCC),北京海淀中国科学院微生物研究所(100080):
保藏号:CGMCC 0859
申请人给出的编号:NP000980
描述:Chaetomium thermophilum
分类:毛壳霉科(Chaetomiaceae),Sordariales,Ascomycota
相关序列:SEQ ID NO:1,SEQ ID NO:2
保藏号:CGMCC 0862
申请人给出的编号:NP001130
描述:Myceliophthora thermophila
分类:毛壳霉科,Sordariales,Ascomycota
相关序列:SEQ ID NO:3,SEQ ID NO:4
保藏号:支顶孢属的种(Acremonium sp.)T178-4 CGMCC 0857
申请人给出的编号:NP001132
描述:支顶孢属的种T178-4
分类:mitosporic Ascomycetes
相关序列:SEQ ID NO:5,SEQ ID NO:6
保藏号:Melanocarpus sp.CGMCC 0861
申请人给出的编号:NP001133
描述:Melanocarpus sp.
分类:Trichocomaceae,Eurotiales,Ascomycota
相关序列:SEQ ID NO:7,SEQ ID NO:8
保藏号:Thielavia microspora CGMCC 0863
申请人给出的编号:NP001134
描述:Thielavia microspora
分类:毛壳霉科,Sordariales,Ascomycota
相关序列:SEQ ID NO:9,SEQ ID NO:10
保藏号:曲霉属的种T186-2 CGMCC 0858
申请人给出的编号:NP001132
描述:曲霉属的种T186-2
分类:Trichocomaceae,Eurotiales,Ascomycota
相关序列:SEQ ID NO:11,SEQ fD NO:12
保藏号:Thielavia australiensis CGMCC 0864
申请人给出的编号:NP001000
描述:Thielavia australiensis
分类:毛壳霉科,Sordariales,Ascomycota
相关序列:SEQ ID NO:13,SEQ ID NO:14
美国典型培养物保藏中心(ATCC)
下述生物材料可从美国典型培养物保藏中心获得,地址:P.O.Box 1549,Manassas,VA 20108,USA
保藏号:ATCC 11.39
申请人给出的编号:NP001144
描述:密粘褶菌
分类:-
相关序列:SEQ ID NO:17,SEQ ID NO:18
真菌菌种保藏中心(CBS)
下述生物材料可从真菌菌种保藏中心(CBS)获得,地址:Uppsalalaan8,3584 CT Utrecht,The Netherlands(或者P.O.Box 85167,3508 AD Utrecht,The Netherlands):
保藏号:CBS 161.79
申请人给出的编号:NP001143
描述:塔宾曲霉
分类:-
相关序列:SEQ ID NO:15,SEQ ID NO:16
保藏号:CBS 521.95
申请人给出的编号:ND001631
描述:Meripilus giganteus
分类:-
相关序列:SEQ ID NO:19,SEQ ID NO:20
保藏号:CBS 804.70
申请人给出的编号:NP000960
描述:Trichophaea saccata
分类:-
相关序列:SEQ ID NO:21,SEQ ID NO:22
保藏号:CBS 185.70
申请人给出的编号:NP001040
描述:Stilbella annulata
分类:-
相关序列:SEQ ID NO:23,SEQ ID NO:24
保藏号:CBS 115.68
申请人给出的编号:NP001045
描述:Malbranchea cinnamomea
分类:-
相关序列:SEQ ID NO:25,SEQ ID NO:26
 0-1 PCT/RO/134表(PCT.EASY格式)对保藏的微生物或其它生物材料的说明
0-1-1 (PCT细则13之二)使用 PCT-EASY版本2.92(2003年11月01日更新)
0-2 国际申请号
0-3 申请人或代理人档案号 10377-WO
 11-11-2 以下说明是针对在说明书被提及材料保藏的微生物或其它生物材料:页数行数 53-5436-08
 1-31-3-11-3-21-3-31-3-4 保藏说明保藏机构保藏机构的地址保藏日期保藏编号 中国微生物菌种保藏管理委员会普通微生物中心中国,北京,2714信箱,邮编1000802002年12月19日(19.12.2002)CGMCC 0859
 1-4 补充说明
 1-5 本说明所针对的指定国 所有指定国
 1-6 分别提供的说明本说明将于后些时候提交到国际局
 22-12-2 以下说明是针对在说明书被提及保藏的微生物或其它生物材料:页数行数 5410-14
 2-32-3-12-3-22-3-32-3-4 保藏说明保藏机构保藏机构的地址保藏日期保藏编号 中国微生物菌种保藏管理委员会普通微生物中心中国,北京,2714信箱,邮编1000802002年12月19日(19.12.2002)CGMCC 0862
 2-4 补充说明
 2-5 本说明所针对的指定国 所有指定国
 2-6 分别提供的说明本说明将于后些时候提交到国际局
 33-13-2 以下说明是针对在说明书被提及保藏的微生物或其它生物材料:页数行数 5416-20
 3-33-3-13-3-23-3-33-3-4 保藏说明保藏机构保藏机构的地址保藏日期保藏编号 中国微生物菌种保藏管理委员会普通微生物中心中国,北京,2714信箱,邮编1000802002年12月19日(19.12.2002)CGMCC 0857
 3-4 补充说明
 3-5 本说明所针对的指定国 所有指定国
 3-6 分别提供的说明本说明将于后些时候提交到国际局
 44-14-2 以下说明是针对在说明书被提及保藏的微生物或其它生物材料:页数行数 5422-26
 4-34-3-14-3-24-3-34-3-4 保藏说明保藏机构保藏机构的地址保藏日期保藏编号 中国微生物菌种保藏管理委员会普通微生物中心中国,北京,2714信箱,邮编1000802002年12月19日(19.12.2002)CGMCC 0861
 4-4 补充说明
 4-5 本说明所针对的指定国 所有指定国
 4-6 分别提供的说明本说明将于后些时候提交到国际局
 55-1 以下说明是针对在说明书被提及保藏的微生物或其它生物材料:页数 54
  5-2   行数   28-32
  5-35-3-15-3-25-3-35-3-4   保藏说明保藏机构保藏机构的地址保藏日期保藏编号 中国微生物菌种保藏管理委员会普通微生物中心中国,北京,2714信箱,邮编1000802002年12月19日(19.12.2002)CGMCC 0863
  5-4   补充说明   无
  5-5   本说明所针对的指定国   所有指定国
  5-6   分别提供的说明本说明将于后些时候提交到国际局   无
  66-16-2   以下说明是针对在说明书被提及保藏的微生物或其它生物材料:页数行数 5434-38
  6-36-3-16-3-26-3-36-3-4   保藏说明保藏机构保藏机构的地址保藏日期保藏编号 中国微生物菌种保藏管理委员会普通微生物中心中国,北京,2714信箱,邮编1000802002年12月19日(22.08.2001)CGMCC 0858
  6-4   补充说明   无
  6-5   本说明所针对的指定国   所有指定国
  6-6   分别提供的说明本说明将于后些时候提交到国际局   无
  77-17-2   以下说明是针对在说明书被提及保藏的微生物或其它生物材料:页数行数 5440-44
  7-37-3-17-3-2   保藏说明保藏机构保藏机构的地址 中国微生物菌种保藏管理委员会普通微生物中心中国,北京,2714信箱,邮编100080
  7-3-37-3-4   保藏日期保藏编号   2002年12月19日(19.12.2002)CGMCC 0864
  7-4   补充说明   无
  7-5   本说明所针对的指定国   所有指定国
  7-6   分别提供的说明本说明将于后些时候提交到国际局   无
                由受理局填写
                由国际局填写
0-5 国际局收到本表格日期
0-5-1 受理官员
                                     序列表
<110>诺维信公司(Novozymes AS)
<120>CBHII
<130>10377.204-WO
<160>36
<170>PatentIn version 3.2
<210>1
<211>1731
<212>DNA
<213>Chaetomium thermophilum NP000980
<220>
<221>CDS
<222>(63)..(1493)
<400>1
cggggggggg ggacagcaca acagagtcaa gacaagcttg gtcgctttgt cagaagttca        60
tc atg gct aag cag ctg ctg ctc act gcc gct ctt gcg gcc act tcg          107
   Met Ala Lys Gln Leu Leu Leu Thr Ala Ala Leu Ala Ala Thr Ser
   1               5                   10                  15
ctg gct gcc cct ctc ctt gag gag cgc cag agc tgc tcc tcc gtc tgg         155
Leu Ala Ala Pro Leu Leu Glu Glu Arg Gln Ser Cys Ser Ser Val Trp
                20                  25                  30
ggt caa tgc ggt ggc atc aat tac aac ggc ccg acc tgc tgc cag tcc         203
Gly Gln Cys Gly Gly Ile Asn Tyr Asn Gly Pro Thr Cys Cys Gln Ser
            35                  40                  45
ggc agt gtt tgc act tac ctg aat gac tgg tac agc cag tgc att ccc         251
Gly Ser Val Cys Thr Tyr Leu Asn Asp Trp Tyr Ser Gln Cys Ile Pro
        50                  55                  60
ggt cag gct cag ccc ggc acg act agc acc acg gct cgg acc acc agc         299
Gly Gln Ala Gln Pro Gly Thr Thr Ser Thr Thr Ala Arg Thr Thr Ser
    65                  70                  75
acc agc acc acc agc act tcg tcg gtc cgc ccg acc acc tcg aat acc         347
Thr Ser Thr Thr Ser Thr Ser Ser Val Arg Pro Thr Thr Ser Asn Thr
80                  85                  90                  95
cct gtg acg act gct ccc ccg acg acc acc atc ccg ggc ggc gcc tcg         395
Pro Val Thr Thr Ala Pro Pro Thr Thr Thr Ile Pro Gly Gly Ala Ser
                100                 105                 110
agc acg gcc agc tac aac ggc aac ccg ttt tcg ggt gtt caa ctt tgg         443
Ser Thr Ala Ser Tyr Asn Gly Asn Pro Phe Ser Gly Val Gln Leu Trp
            115                 120                 125
gcc aac acc tac tac tcg tcc gag gtg cac act ttg gcc atc ccc agc         491
Ala Asn Thr Tyr Tyr Ser Ser Glu Val His Thr Leu Ala Ile Pro Ser
        130                 135                 140
ttg tct cct gag ctg gct gcc aag gcc gcc aag gtc gct gag gtt ccc         539
Leu Ser Pro Glu Leu A1a Ala Lys Ala Ala Lys Val Ala Glu Val Pro
    145                 150                 155
agc ttc cag tgg ctc gac cgc aat gtg act gtt gac act ctc ttc tcc         587
Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser
160                 165                 170                 175
ggc act ctt gcc gaa atc cgc gcc gcc aac cag cgc ggt gcc aac ccg       635
Gly Thr Leu Ala Glu Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro
                180                 185                 190
cct tat gcc ggc att ttc gtg gtt tat gac tta cca gac cgt gat tgc       683
Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys
            195                 200                 205
gcg gct gct gct tcg aac ggc gag tgg tct atc gcc aac aat ggt  gcc      731
Ala Ala Ala Ala Ser Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala
        210                 215                 220
aac aac tac aag cgc tac atc gac cgg atc cgt gag ctc ctt atc cag       779
Asn Asn Tyr Lys Arg Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln
    225                 230                 235
tac tcc gat atc cgc act att ctg gtc att gaa cct gat tcc ctg gcc       827
Tyr Ser Asp Ile Arg Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala
240                 245                 250                 255
aac atg gtc acc aac atg aac gtc cag aag tgc tcg aac gct gcc tcc       875
Asn Met Val Thr Asn Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser
                260                 265                 270
act tac aag gag ctt act gtc tat gcc ctc aaa cag ctc aat ctt cct       923
Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro
            275                 280                 285
cac gtt gcc atg tac atg gat gct ggc cac gct ggc tgg ctt ggc tgg       971
His Val Ala Met Tyr Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp
        290                 295                 300
ccc gcc aac atc cag cct gct gct gag ctc ttt gct caa atc tac cgc      1019
Pro Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg
    305                 310                 315
gac gct ggc agg ccc gct gct gtc cgc ggt ctt gcg acc aac gtt gcc      1067
Asp Ala Gly Arg Pro Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala
320                 325                 330                 335
aac tac aat gct tgg tcg atc gcc agc cct ccg tcc tac acc tct cct      1115
Asn Tyr Asn Ala Trp Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro
                340                 345                 350
aac ccg aac tac gac gag aag cac tat att gag gcc ttt gct cct ctt      1163
Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu
            355                 360                 365
ctc cgc aac cag ggc ttc gac gca aag ttc atc gtc gac acc ggc cgt      1211
Leu Arg Asn Gln Gly Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg
        370                 375                 380
aac ggc aag cag ccc act ggc cag ctt gaa tgg ggt cac tgg tgc aat      1259
Asn Gly Lys Gln Pro Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn
    385                 390                 395
gtc aag gga act ggc ttc ggt gtg cgc cct act gct aac act ggg cat      1307
Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His
400                 405                 410                 415
gaa ctt gtt gat gct ttc gtg tgg gtc aag ccc ggt ggc gag tcc gac      1355
Glu Leu Val Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp
                420                 425                 430
ggc acc agt gcg gac acc agc gct gct cgt tat gac tat cac tgc ggc      1403
Gly Thr Ser Ala Asp Thr Ser Ala Ala Arg Tyr Asp Tyr His Cys Gly
            435                 440                 445
ctt tcc gac gca ctg act ccg gcg cct gag gct ggc caa tgg ttc cag      1451
Leu Ser Asp Ala Leu Thr Pro Ala Pro Glu Ala Gly Gln Trp Phe Gln
        450                 455                 460
gct tat ttc gaa cag ctg ctc atc aat gcc aac cct ccg ctc              1493
Ala Tyr Phe Glu Gln Leu Leu Ile Asn Ala Asn Pro Pro Leu
    465                 470                 475
tgaacggaag cggagatacc ggaaggcggt gagaagagcg gaattcaagt ctgcttatca    1553
aaatccactc accaagtgga ttaaagcgga tttatacatc tgagaaacaa cctgctttaa    1613
actcttcttg tacatatttc acttcgagac gtgcctcttt ctcaggagca ctgtagatac    1673
caatatatct gtcacatttc atataaaaaa aaaaaaaaag aaaaaaagta ctagtcga      1731
<210>2
<211>477
<212>PRT
<213>Chaetomium thermophilum NP000980
<400>2
Met Ala Lys Gln Leu Leu Leu Thr Ala Ala Leu Ala Ala Thr Ser Leu
1               5                   10                  15
Ala Ala Pro Leu Leu Glu Glu Arg Gln Ser Cys Ser Ser Val Trp Gly
            20                  25                  30
Gln Cys Gly Gly Ile Asn Tyr Asn Gly Pro Thr Cys Cys GIn Ser Gly
        35                  40                  45
Ser Val Cys Thr Tyr Leu Asn Asp Trp Tyr Ser Gln Cys Ile Pro Gly
    50                  55                  60
Gln Ala Gln Pro Gly Thr Thr Ser Thr Thr Ala Arg Thr Thr Ser Thr
65                  70                  75                   80
Ser Thr Thr Ser Thr Ser Ser Val Arg Pro Thr Thr Ser Asn Thr Pro
                85                  90                  95
Val Thr Thr Ala Pro Pro Thr Thr Thr Ile Pro Gly Gly Ala Ser Ser
            100                 105                110
Thr Ala Ser Tyr Asn Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala
        115                 120                 125
Asn Thr Tyr Tyr Ser Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu
    130                 135                 140
Ser Pro Glu Leu Ala Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser
145                 150                 155                 160
Phe Gln Trp Leu Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly
                165                 170                 175
Thr Leu Ala Glu Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro
            180                 185                 190
Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala
        195                 200                 205
Ala Ala Ala Ser Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn
    210                 215                 220
Asn Tyr Lys Arg Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr
225                 230                 235                 240
Ser Asp Ile Arg Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn
                245                 250                 255
Met Val Thr Asn Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr
            260                 265                 270
Tyr Lys Glu Leu Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His
        275                 280                 285
Val Ala Met Tyr Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro
    290                 295                 300
Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp
305                 310                 315                 320
Ala Gly Arg Pro Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn
                 325                330                 335
Tyr Asn Ala Trp Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn
             340                345                 350
Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu
         355                360                 365
Arg Asn Gln Gly Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn
     370                375                 380
Gly Lys Gln Pro Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val
385                 390                 395                 400
Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu
                405                 410                 415
Leu Val Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
            420                 425                 430
Thr Ser Ala Asp Thr Ser Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu
        435                 440                 445
Ser Asp Ala Leu Thr Pro Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala
    450                 455                 460
Tyr Phe Glu Gln Leu Leu Ile Asn Ala Asn Pro Pro Leu
465                 470                 475
<210>3
<211>1272
<212>DNA
<213>Myceliophthora thermophila
<220>
<221>misc_feature
<222>(61)..(61)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(87)..(8 7)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(420)..(420)
<223>n是a,c,g或t
<400>3
acgtggatcc gaattcaagc ttcatggggt tctcctgcga tccactagta acggctcgcc     60
ngagagctgg aaagccagca gcacctnttg gagaggcagc tctctcectc caccacgccc    120
ccgcccgtct ccagccctcg tgaccagcat tcccggcggt gcgacctcca cggcgagcta    180
ctctggcaac cccttctcgg gcgtccggct cttcgccaac gactactaca ggtccgaggt    240
ccacaatctc gccattccta gcatgactgg tactctggcg gctcaaggct tccgccgtcg    300
cgcgaagtcc ctagcttcca gtggctcgac acggaacgtg cactcatcag acaccctgat    360
ggtccagact ctgtacccag gtccgggctc tcaataaggc acggtgaaca atcctacccn    420
tatgctgccc aactcgtcgt ctacgacctc cccgaccgtg actgtgccgc cgctgcgtcc    480
aacggygagt tttcgattgc aaacggcggc gccgccaact acaggagcta catcgacgct    540
atccgcaagc acatcattga gtactcggac atccggatca tcctggttat cgagcccgac    600
tcgatggcca acatggtgac caacatgaac gtggccaagt gcagcaacgc cgcgtcgacg    660
taccacgagt tgaccgtgta cgcgctcaag cagctgaacc tgcccaacgt cgccatgtat    720
ctcgacgccg gccacgccgg ctggctcggc tggcccgcca acatccagcc cgccgccgag    780
ctgtttgccg gcatctacaa tgatgccggc aagccggctg ccgtccgcgg cctggccact    840
aacgtcgcca actacaacgc ctggagcatc gcttcggccc cgtcgtacac gtcggctaac    900
cctaactacg acgagaagca ctacatcgag gccttcagcc cgctcttgaa ctcggccggc    960
ttccccgcac gcttcattgt cgacactggc cgcaacggca aacaacctac cggccaacaa   1020
cagtggggcg actggtgcaa tgtcaagggc accggctttg gcgtgcgccc gacggccaac   1080
acgggccacg agctggtcga tgcctttgtc tgggtcaagc ccggcggcga gtccgacggc   1140
acaagcgaca ccagcgccgc ccgctacgac taccactgcg gcctgtccga tgccctgcag    1200
cctgcccccg aggctggaca gtggttccag gcctacttcg agcagctgct caccaacgcc    1260
aacccgccct tc                                                        1272
<210>4
<211>420
<212>PRT
<213>Myceliophthora thermophi1a
<400>4
Thr Trp Ile Arg Ile Gln Ala Ser Trp Gly Ser Pro Ala Ile His Arg
1               5                   10                  15
Leu Ala Glu Leu Glu Ser Gln Gln His Leu Leu Glu Arg Gln Leu Ser
            20                  25                  30
Leu Ser Thr Thr Pro Pro Pro Val Ser Ser Pro Arg Asp Gln His Ser
        35                  40                  45
Arg Arg Cys Asp Leu His Gly Glu Leu Leu Trp Gln Pro Leu Leu Gly
    50                  55                  60
Arg Pro Ala Leu Arg Gln Arg Leu Leu Gln Val Arg Gly Pro Gln Ser
65                  70                  75                  80
Arg His Ser His Asp Trp Tyr Ser Gly Gly Ser Arg Leu Pro Pro Ser
                85                  90                  95
Arg Glu Val Pro Ser Phe Gln Trp Leu Asp Thr Glu Arg Ala Leu Ile
            100                 105                 110
Arg His Pro Asp Gly Pro Asp Ser Val Pro Arg Ser Gly Leu Ser Ile
        115                 120                 125
Arg His Gly Glu Gln Ser Tyr Pro Tyr Ala Ala Gln Leu Val Val Tyr
    130                 135                 140
Asp Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe
145                 150                 155                 160
Ser Ile Ala Asn Gly Gly Ala Ala Asn Tyr Arg Ser Tyr Ile Asp Ala
                165                 170                 175
Ile Arg Lys His Ile Ile Glu Tyr Ser Asp Ile Arg Ile Ile Leu Val
            180                 185                 190
Ile Glu Pro Asp Ser Met Ala Asn Met Val Thr Asn Met Asn Val Ala
        195                 200                 205
Lys Cys Ser Asn Ala Ala Ser Thr Tyr His Glu Leu Thr Val Tyr Ala
    210                 215                 220
Leu Lys Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly
225                 230                 235                 240
His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Glu
                245                 250                 255
Leu Phe Ala Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ala Val Arg
            260                 265                 270
Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Scr
        275                 280                 285
Ala Pro Ser Tyr Thr Ser Ala Asn Pro Asn Tyr Asp Glu Lys His Tyr
    290                 295                 300
Ile Glu Ala Phe Ser Pro Leu Leu Asn Ser Ala Gly Phe Pro Ala Arg
305                  310                315                 320
Phe Ile Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln
                325                 330                 335
Gln Trp Gly Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg
            340                 345                 350
Pro Thr Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp Val
        355                 360                 365
Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Scr Ala Ala Arg
     370                375                 380
Tyr Asp Tyr His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pr0 Glu
385                 390                 395                 400
Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala
                405                 410                 415
Asn Pro Pro Phe
            420
<210>5
<211>419
<212>DNA
<213>支顶孢属的种(Acremonium sp.)T178-4 NP001132
<220>
<221>CDS
<222>(1)..(417)
<400>5
tac gca agt gtc tac tcg gac gcc gga tca ccg gct gca ctc cgc ggt     48
Tyr Ala Ser Val Tyr Ser Asp Ala Gly Ser Pro Ala Ala Leu Arg Gly
1               5                   10                  15
ctc gct acc aac gtc gcc aat tac aac gcc tgg aca atc gat acc tgc     96
Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Thr Ile Asp Thr Cys
            20                  25                  30
cct tca tac aca cag ggt aac tcc att tgc gac gag aag gac tac atc    144
Pro Ser Tyr Thr Gln Gly Asn Ser Ile Cys Asp Glu Lys Asp Tyr Ile
        35                  40                  45
aat gcg ctt gct ccc ctg ctt cgc agc tca ggg ctt acg gac gct cat    192
Asn Ala Leu Ala Pro Leu Leu Arg Ser Ser Gly Leu Thr Asp Ala His
    50                  55                  60
ttc atc act gat acc ggc cgc aac ggc aag caa cca aca ggc caa caa    240
Phe Ile Thr Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln
65                  70                  75                  80
gcc tgg ggc gac tgg tgc aat gtc atc ggc acg ggc ttt ggc gtg cgc    288
Ala Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg
                85                  90                  95
ccg tcc acg aac aca ggt gat tct tta ctt gac gcc ttc gtc tgg gtt    336
Pro Ser Thr Asn Thr Gly Asp Ser Leu Leu Asp Ala Phe Val Trp Val
            100                 105                 110
aaa ccc ggt ggc gag agt gac ggg act tct gat act tgt gcg gcg cgg    384
Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Cys Ala Ala Arg
        115                 120                 125
tat gat gcg cat tgc ggg tat age gat gcg ctg ca                     419
Tyr Asp Ala His Cys Gly Tyr Ser Asp Ala Leu
    130                 135
<210>6
<211>139
<212>PRT
<213>支顶孢属的种(Acremonium sp.)T178-4 NP001132
<400>6
Tyr Ala Ser Val Tyr Ser Asp Ala Gly Ser Pro Ala Ala Leu Arg Gly
1               5                   10                  15
Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Thr Ile Asp Thr Cys
            20                  25                  30
Pro Ser Tyr Thr Gln Gly Asn Ser Ile Cys Asp Glu Lys Asp Tyr Ile
        35                  40                  45
Asn Ala Leu Ala Pro Leu Leu Arg Ser Ser Gly Leu Thr Asp Ala His
    50                  55                  60
Phe Ile Thr Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln
65                  70                  75                  80
Ala Trp Gly Asp Trp Cys Ash Val Ile Gly Thr Gly Phe Gly Val Arg
                85                  90                  95
Pro Ser Thr Asn Thr Gly Asp Ser Leu Leu Asp Ala Phe Val Trp Val
            100                 105                 110
Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Cys Ala Ala Arg
        115                 120                 125
Tyr Asp Ala His Cys Gly Tyr Ser Asp Ala Leu
    130                 135
<210>7
<211>306
<212>DNA
<213>Melanocarpus sp.AT181-3 NP001133
<220>
<221>CDS
<222>(1)..(306)
<400>7
gat gcc ggc aag ccg cac tcg gtc cgc ggt ctc gcc acc aac gtc gcc     48
Asp Ala Gly Lys Pro His Ser Val Arg Gly Leu Ala Thr Asn Val Ala
1               5                   10                  15
aac tac aat gcc tgg agc gtc gcc tcg gcc ccg cct tac acc agc ccc     96
Asn Tyr Asn Ala Trp Ser Val Ala Ser Ala Pro Pro Tyr Thr Ser Pro
            20                  25                  30
aac ccc aac tac gat gag aag cac tac att gag gcc ttc agc cct ctc    144
Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu Ala Phe Ser Pro Leu
       35                   40                  45
ctt gag gcc cgc ggc ttc cct gcc cgc ttc atc gtc gac cag ggc cgc    192
Leu Glu Ala Arg Gly Phe Pro Ala Arg Phe Ile yal Asp Gln Gly Arg
    50                  55                  60
agc ggc aag cag ccc acc ggc cag aag gag tgg ggc cac tgg tgc aac    240
Ser Gly Lys Gln Pro Thr Gly Gln Lys Glu Trp Gly His Trp Cys Asn
65                  70                  75                  80
gct atc ggc acc ggc ttc ggc att cgc ccg acc gcc aac acc ggc cac    288
Ala Ile Gly Thr Gly Phe Gly Ile Arg Pro Thr Ala Asn Thr Gly His
                85                  90                  95
aac ctg gtt gat gcc ttc                                            306
Asn Leu Val Asp Ala Phe
           100
<210>8
<211>102
<212>PRT
<213>Melanoca rpus sp.AT181-3 NP001133
<400>8
Asp Ala Gly Lys Pro His Ser Val Arg Gly Leu Ala Thr Asn Val Ala
1               5                   10                  15
Asn Tyr Asn Ala Trp Ser Val Ala Ser Ala Pro Pro Tyr Thr Ser Pro
            20                  25                   30
Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu Ala Phe Ser Pro Leu
        35                  40                  45
Leu Glu Ala Arg Gly Phe Pro Ala Arg Phe Ile Val Asp Gln Gly Arg
    50                  55                  60
Ser Gly Lys Gln Pro Thr Gly Gln Lys Glu Trp Gly His Trp Cys Asn
65                  70                  75                  80
Ala Ile Gly Thr Gly Phe Gly Ile Arg Pro Thr Ala Asn Thr Gly His
                85                  90                  95
Asn Leu Val Asp Ala Phe
            100
<210>9
<211>432
<212>DNA
<213>Thielavia cf.microspora T046-1 NP001134
<220>
<221>CDS
<222>(1)..(432)
<400>9
gcc aac atc cag ccc gct gcc acc ctg ttc gcc ggc atc tac agc gac     48
Ala A sn Ile Gln Pro Ala Ala Thr Leu Phe Ala Gly Ile Tyr Ser Asp
1                5                   10                  15
gct ggc aag ccc gcc tcg gtc cgc ggt ttg gcc acc aac gtg gcc aac     96
Ala Gly Lys Pro Ala Ser Val Arg Gly Leu Ala Thr Asn Val Ala Asn
            20                  25                  30
tac aac gcc tgg agc ctg tcg tcg gcg ccg tcg tac acg agc ccc aac    144
Tyr Asn Ala Trp Ser Leu Ser Ser Ala Pro Ser Tyr Thr Ser Pro Asn
        35                  40                  45
gcc aac tac gac gag aag cac tac gtc gag gcc ttt gcc ccg ctc ctc    192
Ala Asn Tyr Asp Glu Lys His Tyr Val Glu Ala Phe Ala Pro Leu Leu
    50                  55                  60
cag gcg gcc ggc ttc ccc gcc aag ttc atc acc gac acg ggc cgc aac    240
Gln Ala Ala Gly Phe Pro Ala Lys Phe Ile Thr Asp Thr Gly Arg Asn
65                  70                  75                  80
ggc aag cag ccc acg ggc cag agc gcg tgg ggc gac tgg tgc aac gtc    288
Gly Lys Gln Pro Thr Gly Gln Ser Ala Trp Gly Asp Trp Cys Asn Val
                85                  90                  95
aag ggc acc ggc ttc ggt gtc cgc ccg acc tcg gag acg ggc cac gac    336
Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ser Glu Thr Gly His Asp
            100                 105                 110
ctc ctc gac gcc ttc gtc tgg gtc aag ccc ggt ggc gag tcg gac ggc    384
Leu Leu Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
        115                 120                 125
acc agc gac acc agc gcc gcc cgc tac gac tac cac tgc ggt ctg tcg    432
Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser
130                     135                 140
<210>10
<211>144
<212>PRT
<213>Thielavia cf.microspora T046-1 NP001134
<400>10
Ala Asn Ile Gln Pro Ala Ala Thr Leu Phe Ala Gly Ile Tyr Ser Asp
1               5                   10                  15
Ala Gly Lys Pro Ala Ser Val Arg Gly Leu Ala Thr Asn Val Ala Asn
            20                  25                  30
Tyr Asn Ala Trp Ser Leu Ser Ser Ala Pro Ser Tyr Thr Ser Pro Asn
        35                  40                  45
Ala Asn Tyr Asp Glu Lys His Tyr Val Glu Ala Phe Ala Pro Leu Leu
    50                  55                  60
Gln Ala Ala Gly Phe Pro Ala Lys Phe Ile Thr Asp Thr Gly Arg Asn
65                  70                  75                  80
Gly Lys Gln Pro Thr Gly Gln Ser Ala Trp Gly Asp Trp Cys Asn Val
                85                  90                  95
Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ser Glu Thr Gly His Asp
            100                 105                 110
Leu Leu Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
        115                 120                 125
Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu Ser
    130                 135                 140
<210>11
<211>297
<212>DNA
<213>曲霉属的种(Aspergillus sp.)T186-2 NP001136
<220>
<221>CDS
<222>(1)..(297)
<400>11
gga ttg ttt ggg tgg cct gcc aac ctt act cct tcc gct cgt ctc ttc    48
Gly Leu Phe Gly Trp Pro Ala Asn Leu Thr Pro Ser Ala Arg Leu Phe
1               5                   10                  15
gcc caa atc tac aag gat gcc ggc agg tct gcc ttc atc cgt ggt ctt    96
Ala Gln Ile Tyr Lys A sp Ala Gly Arg Ser Ala Phe Ile Arg Gly Leu
            20                   25                  30
gcc acc aac gtc tcc aac tac aac gcc ctc agt gca acc acc cgt gat    144
Ala Thr Asn Val Ser Asn Tyr Asn Ala Leu Ser Ala Thr Thr Arg Asp
        35                  40                  45
ccc gtc acc cag ggc aat gac aac tac gat gag ctc cgc ttc atc aac    192
Pro Val Thr Gln Gly Asn Asp Asn Tyr Asp Glu Leu Arg Phc Ilc Asn
     50                  55                 60
gct ctt gct cct ctc ctc cga aat gaa ggc tgg gac gcc aag ttc atc    240
Ala Leu Ala Pro Leu Leu Arg Asn Glu Gly Trp Asp Ala Lys Phe Ile
65                  70                  75                  80
gtc gac cag ggt cgt tct ggt gtc cag aac atc cga cag gag tgg ggc    288
Val Asp Gln Gly Arg Ser Gly Val Gln Asn Ile Arg Gln Glu Trp Gly
                85                  90                  95
gac tgg tgc                                                        297
Asp Trp Cys
<210>12
<211>99
<212>PRT
<213>曲霉属的种(Aspergillus sp.)T186-2 NP001136
<400>12
Gly Leu Phe Gly Trp Pro Ala Asn Leu Thr Pro Ser Ala Arg Leu Phe
1               5                   10                  15
Ala Gln Ile Tyr Lys Asp Ala Gly Arg Ser Ala Phe Ile Arg Gly Leu
            20                  25                  30
Ala Thr Asn Val Ser Ash Tyr Asn Ala Leu Ser Ala Thr Thr Arg Asp
        35                  40                  45
Pro Val Thr Gln Gly Asn Asp Asn Tyr Asp Glu Leu Arg Phe Ile Asn
    50                  55                  60
Ala Leu Ala Pro Leu Leu Arg Asn Glu Gly Trp Asp Ala Lys Phe Ile
65                  70                  75                  80
Val Asp Gln Gly Arg Ser Gly Val Gln Asn Ile Arg Gln Glu Trp Gly
                85                  90                  95
Asp Trp Cys
<210>13
<211>420
<212>DNA
<213>Thielavia cf.australiensis T55-15 NP001000
<220>
<221>CDS
<222>(1)..(420)
<400>13
tgg ctg ggg tgg ccc gcc aac atc cag ccc gct gct acc ctg ttc gcc    48
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Thr Leu Phe Ala
1               5                   10                  15
ggc atc tac aac gac gct ggc aag ccc gcc tcg gtc cgt ggt ctg gcc    96
Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ser Val Arg Gly Leu Ala
            20                  25                  30
acc aac gtt gcc aac tac aac gcc tgg agc ctg tcc tcg gcc ccg tcg    144
Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Leu Ser Ser Ala Pro Ser
        35                  40                  45
tac acg acc ccc aac gcc aac tac gac gag aag cac tac gtc gag gcc    192
Tyr Thr Thr Pro Asn Ala Asn Tyr Asp Glu Lys His Tyr Val Glu Ala
    50                  55                  60
ttt gcc ccg ctt ctc tcg gcc gct ggc ttc ccc gcc aag ttc atc acc    240
Phe Ala Pro Leu Leu Ser Ala Ala Gly Phe Pro Ala Lys Phe Ile Thr
65                  70                  75                  80
gac act ggc cgc aac ggc aag cag ccc acc ggc cag agc cag tgg ggc    288
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Ser Gln Trp Gly
                85                  90                  95
gat tgg tgc aac gtc aag ggc acc ggc ttc ggt gtc cgc ccg acc tcc    336
Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ser
            100                 105                 110
gag acg ggc cac gag ctc ctg gat gcc ttt gtc tgg gcc aag ccc ggt    384
Glu Thr Gly His Glu Leu Leu Asp Ala Phe Val Trp Ala Lys Pro Gly
        115                 120                 125
ggc gag tcc gac ggt acc agc gac acc agc gct gcc                    420
Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala
    130                 135                 140
<210>14
<211>140
<212>PRT
<213>Thielavia cf.australiensis T55-15 NP001000
<400>14
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Thr Leu Phe Ala
1               5                   10                  15
Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ser Val Arg Gly Leu Ala
            20                  25                  30
Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Leu Ser Ser Ala Pro Ser
        35                  40                  45
Tyr Thr Thr Pro Asn Ala Asn Tyr Asp Glu Lys His Tyr Val Glu Ala
    50                  55                  60
Phe Ala Pro Leu Leu Ser Ala Ala Gly Phe Pro Ala Lys Phe Ile Thr
65                  70                  75                  80
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Ser Gln Trp Gly
                85                  90                  95
Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ser
            100                 105                 110
Glu Thr Gly His Glu Leu Leu Asp Ala Phe Val Trp Ala Lys Pro Gly
        115                 120                 125
Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala
    130                 135                 140
<210>15
<211>1221
<212>DNA
<213>塔宾曲霉(Aspergillus tubingensis)NP001143
<220>
<221>CDS
<222>(1)..(1221)
<220>
<221>misc_feature
<222>(903)..(903)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(1011)..(1011)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(1017)..(1017)
<223>n是a,c,g或t
<400>15
atg aat atg cac tcc atc aac atg cga gcc atc tgg ccc ctc gtc tct     48
Met Asn Met His Ser Ile Asn Met Arg Ala Ile Trp Pro Leu Val Ser
1               5                   10                  15
ctc ttc tct gcc gtt aag gcc ctc ccc gcc gca agc gcg act gct tca     96
Leu Phe Ser Ala Val Lys Ala Leu Pro Ala Ala Ser Ala Thr Ala Ser
            20                  25                  30
gcg tct gtt gcg gcc tcg agc tct ccg gcg ccg act gcc tct gct acc    144
Ala Ser Val Ala Ala Ser Ser Ser Pro Ala Pro Thr Ala Ser Ala Thr
        35                  40                  45
ggc aat ccc ttt gag gga tac cag ctc tat gtg aac ccc tac tat aag    192
Gly Asn Pro Phe Glu Gly Tyr Gln Leu Tyr Val Asn Pro Tyr Tyr Lys
    50                  55                  60
tcg caa gtg gag agt tcg gcc att cea rca ttg tct gct agt tcg ctg    240
Ser Gln Val Glu Ser Ser Ala Ile Pro Ser Leu Ser Ala Ser Ser Leu
65                  70                  75                  80
gtc gcg cag gcg agt gct gca gcc gat gtg cct tca ttt tac tgg cta    288
Val Ala Gln Ala Ser Ala Ala Ala Asp Val Pro Ser Phe Tyr Trp Leu
                85                  90                  95
gac acg gcc gac aag gtg cct acc atg ggt gaa tat ctg gat gac atc    336
Asp Thr Ala Asp Lys Val Pro Thr Met Gly Glu Tyr Leu Asp Asp Ile
            100                 105                 110
cag acg caa aac gcc gct gga gcg aat cct ccc att gct ggt atc ttc    384
Gln Thr Gln Asn Ala Ala Gly Ala Asn Pro Pro Ile Ala Gly Ile Phe
        115                 120                 125
gtc gtc tat gac ctg ccg gat cgg gat tgc gct gcc ttg gct agt aat    432
Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn
    130                 135                 140
ggg gaa tac gcg atc agt gat gga ggc gtg gag aag tat aag gcg tac    480
Gly Glu Tyr Ala Ile Ser Asp Gly Gly Val Glu Lys Tyr Lys Ala Tyr
145                 150                 155                 160
att gat tct att cgc gag cag gtc gag acg tac tcg gat gtt cag act    528
Ile Asp Ser Ile Arg Glu Gln Val Glu Thr Tyr Ser Asp Val Gln Thr
                165                 170                 175
att ttg att atc gaa ccg gat agc tta gct aac ctg gtg acg aat ctc    576
Ile Leu Ile Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu
            180                 185                 190
gat gtg gct aaa tgc gcc aat gct caa tct gct tac ctg gaa tgc acc    624
Asp Val Ala Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Thr
        195                 200                 205
aat tat gca ctt gag cag ttg aat ctr ccg aac gtg gct atg tat ctt    672
Asn Tyr Ala Leu Glu Gln Leu Asn Xaa Pro Asn Val Ala Met Tyr Leu
    210                 215                 220
gat gct ggc cat gct gga tgg ctg gga tgg cct gcc aac atc ggt ccc    720
Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gly Pro
225                 230                 235                 240
gcg gcg gaa ctc tac gca tcg gtg tat aag aat gcg tcg tct cca gca    768
Ala Ala Glu Leu Tyr Ala Ser Val Tyr Lys Asn Ala Ser Ser Pro Ala
                245                 250                 255
gct gtt cgt gga ctc gct aca rac gta gct aac ttc aat gcc tgg agc    816
Ala Val Arg Gly Leu Ala Thr Xaa Val Ala Asn Phe Asn Ala Trp Ser
            260                 265                 270
atc gac act tgc ccc tcc tat acw tcg ggt aac gat gtc tgt gat gaa    864
Ile Asp Thr Cys Pro Ser Tyr Xaa Ser Gly Asn Asp Val Cys Asp Glu
        275                 280                 285
aaa agc tac atc aat gcc ttt gca ccg gag ctc tct agn gct gga ttt    912
Lys Ser Tyr Ile Asn Ala Phe Ala Pro Glu Leu Ser Xaa Ala Gly Phe
    290                 295                 300
gat gcc cac ttt att acc gat acg ggt cgc aat gga aag cag cct act    960
Asp Ala His Phe Ile Thr Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr
305                 310                 315                 320
gga caa agc gcg tgg ggt gac tgg ggc aat gtc aag gat act ggc ttc   1008
Gly Gln Ser Ala Trp Gly Asp Trp Gly Asn Val Lys Asp Thr Gly Phe
                325                 330                 335
ggn gct can ccg aca acc gat act gga aac gag ctg gct gat gcc ttt   1056
Gly Ala Xaa Pro Thr Thr Asp Thr Gly Asn Glu Leu Ala Asp Ala Phe
            340                 345                 350
gtc tgg gyc aac cct ggc gga aag agt gat ggg acg tcg gac act agc    1104
Val Trp Xaa Asn Pro Gly Gly Lys Ser Asp Gly Thr Ser Asp Thr Ser
        355                 360                 365
tct tct cgc tac gat gcg cat tgc gga tat agt gat gct ttg cag cct    1152
Ser Ser Arg Tyr Asp Ala His Cys Gly Tyr Ser Asp Ala Leu Gln Pro
    370                 375                 380
gcc ccg gag gct ggt act tgg ttc cag gca tac ttt gag cag ctt ttg    1200
Ala Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu
385                 390                 395                 400
acc aat gcc aac cct tcc ctg                                        1221
Thr Asn Ala Asn Pro Ser Leu
                405
<210>16
<211>407
<212>PRT
<213>塔宾曲霉(Aspergillus tubingensis)NP001143
<220>
<221>misc_feature
<222>(217)..(217)
<223>217位的′Xaa′代表Leu.
<220>
<221>misc_feature
<222>(264)..(264)
<223>264位的′Xaa′代表Asp或Asn.
<220>
<221>misc_feature
<222>(280)..(280)
<223>280位的′Xaa′代表Thr.
<220>
<221>misc_feature
<222>(301)..(301)
<223>301位的′Xaa′代表Arg或Ser.
<220>
<221>misc_feature
<222>(339)..(339)
<223>339位的′Xaa′代表Gln或His.
<220>
<221>misc_feature
<222>(355)..(355)
<223>355位的′Xaa′代表Ala或Val.
<400>16
Met Asn Met His Ser Ile Asn Met Arg Ala Ile Trp Pro Leu Vat Ser
1               5                   10                  15
Leu Phe Ser Ala Val Lys Ala Leu Pro Ala Ala Ser Ala Thr Ala Ser
            20                  25                  30
Ala Ser Val Ala Ala Ser Ser Ser Pro Ala Pro Thr Ala Ser Ala Thr
        35                  40                  45
Gly Asn Pro Phe Glu Gly Tyr Gln Leu Tyr Val Asn Pro Tyr Tyr Lys
    50                  55                  60
Ser Gln Val Glu Ser Ser Ala Ile Pro Ser Lcu Scr Ala Scr Ser Leu
65                  70                  75                  80
Val Ala Gln Ala Ser Ala Ala Ala Asp Val Pro Ser Phe Tyr Trp Leu
                85                  90                  95
Asp Thr Ala Asp Lys Val Pro Thr Met Gly Glu Tyr Leu Asp Asp Ile
            100                 105                 110
Gln Thr Gln Asn Ala Ala Gly Ala Asn Pro Pro Ile Ala Gly Ile Phe
        115                 120                 125
Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn
    130                 135                 140
Gly Glu Tyr Ala Ile Ser Asp Gly Gly Val Glu Lys Tyr Lys Ala Tyr
145                 150                 155                 160
Ile Asp Ser Ile Arg Glu Gln Val Glu Thr Tyr Ser Asp Val Gln Thr
                165                 170                 175
Ile Leu Ile Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu
            180                 185                 190
Asp Val Ala Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Thr
        195                 200                 205
Asn Tyr Ala Leu Glu Gln Leu Asn Xaa Pro Asn Val Ala Met Tyr Leu
    210                 215                 220
Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gly Pro
225                 230                 235                 240
Ala Ala Glu Leu Tyr Ala Ser Val Tyr Lys Asn Ala Ser Ser Pro Ala
                245                 250                 255
Ala Val Arg Gly Leu Ala Thr Xaa Val Ala Asn Phe Asn Ala Trp Ser
            260                 265                 270
Ile Asp Thr Cys Pro Ser Tyr Xaa Ser Gly Asn Asp Val Cys Asp Glu
        275                 280                 285
Lys Ser Tyr Ile Asn Ala Phe Ala Pro Glu Leu Ser Xaa Ala Gly Phe
    290                 295                 300
Asp Ala His Phe Ile Thr Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr
305                 310                 315                 320
Gly Gln Ser Ala Trp Gly Asp Trp Gly Asn Val Lys Asp Thr Gly Phe
                325                 330                 335
Gly Ala Xaa Pro Thr Thr Asp Thr Gly Asn Glu Leu Ala Asp Ala Phe
            340                 345                 350
Val Trp Xaa Asn Pro Gly Gly Lys Ser Asp Gly Thr Ser Asp Thr Ser
        355                 360                 365
Ser Ser Arg Tyr Asp Ala His Cys Gly Tyr Ser Asp Ala Leu Gln Pro
    370                 375                 380
Ala Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu
385                 390                 395                 400
Thr Asn Ala Asn Pro Ser Leu
                405
<210>17
<211>429
<212>DNA
<213>Gloeophyl1um trabeum NP001144
<220>
<221>CDS
<222>(1)..(429)
<400>17
gca tcg tct cca gca gct gtt cgt gga ctc gct aca aac gta gct aac     48
Ala Ser Ser Pro Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn
1               5                   10                  15
ttc aat gcc tgg agc atc gac act tgc ccc tcc tat aca tcg ggt aac     96
Phe Asn Ala Trp Ser Ile Asp Thr Cys Pro Ser Tyr Thr Ser Gly Asn
            20                  25                  30
gat gtc tgt gat gag aag agc tac atc aat gcc ttt gca ccg gag ctc    144
Asp Val Cys Asp Glu Lys Ser Tyr Ile Asn Ala Phe Ala Pro Glu Leu
        35                  40                  45
tct agt gct gga ttt gat gcc cac ttt att acc gat acg ggt cgc aat    192
Ser Ser Ala Gly Phe Asp Ala His Phe Ile Thr Asp Thr Gly Arg Asn
    50                  55                  60
gga aag cag cct act gga cag agc gcg tgg ggt gac tgg tgc aat gtc    240
Gly Lys Gln Pro Thr Gly Gln Ser Ala Trp Gly Asp Trp Cys Asn Val
65                  70                  75                  80
aag gat act ggc ttc ggt gct cag ccg acg acc gat act gga gac gag    288
Lys Asp Thr Gly Phe Gly Ala Gln Pro Thr Thr Asp Thr Gly Asp Glu
                85                  90                  95
ctg gct gat gcc ttt gtc tgg gtc aag cct ggc gga gag agt gat ggg    336
Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
            100                 105                 110
acg tcg gac act agc tct tct cgc tac gat gcg cat tgc gga tat agt     384
Thr Ser Asp Thr Ser Ser Ser Arg Tyr Asp Ala His Cys Gly Tyr Ser
        115                 120                 125
gat gct ttg cag cct gcc ccg gag gct ggt act tgg ttc caa ggc         429
Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr Trp Phe Gln Gly
    130                 135                 140
<210>18
<211>143
<212>PRT
<213>Gloeophyllum trabeum NP001144
<400>18
Ala Ser Ser Pro Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn
1               5                   10                  15
Phe Asn Ala Trp Ser Ile Asp Thr Cys Pro Ser Tyr Thr Ser Gly Asn
            20                  25                  30
Asp Val Cys Asp Glu Lys Ser Tyr Ile Asn Ala Phe Ala Pro Glu Leu
        35                  40                  45
Ser Ser Ala Gly Phe Asp Ala His Phe Ile Thr Asp Thr Gly Arg Asn
    50                  55                  60
Gly Lys Gln Pro Thr Gly Gln Ser Ala Trp Gly Asp Trp Cys Asn Val
65                  70                  75                  80
Lys Asp Thr Gly Phe Gly Ala Gln Pro Thr Thr Asp Thr Gly Asp Glu
                85                  90                  95
Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
            100                 105                 110
Thr Ser Asp Thr Ser Ser Ser Arg Tyr Asp Ala His Cys Gly Tyr Ser
        115                 120                 125
Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr Trp Phe Gln Gly
    130                 135                 140
<210>19
<211>213
<212>DNA
<213>Meripilus giganteus ND001631
<220>
<221>misc_feature
<222>(1)..(213)
<223>y是c or t
<400>19
aaactcggag tacgtctgga acaagtgccg gcctcnggcr gctgggtacc gtcttcgtcc    60
gacagacagc asgtgctgtc gtaccggtrg cgacgagctg ttcgaggtay cgtcggactc    120
ryctccgggm ttcacccaga tkatcacgtc tatgasyggg ttgcccgtgt tcgtcctcat    180
ggcgcgtgcc gaagccgttg cccttgatgt tgc                                 213
<210>20
<211>71
<212>PRT
<213>Meripilus giganteus ND001631 enzyme
<220>
<221>MISC_FEATURE
<222>(1)..(71)
<223>x是任意氨基酸
<400>20
Ala Thr Ser Arg Ala Thr Ala Ser Ala Arg Ala Met Arg Thr Asn Thr
1               5                   10                  15
Gly Asn Pro Xaa Ile Asp Val Ile Ile Trp Val Xaa Pro Gly Xaa Glu
            20                  25                  30
Ser Asp Xaa Thr Ser Asn Ser Ser Ser Xaa Pro Val Arg Gln His Xaa
        35                  40                  45
Leu Ser Val Gly Arg Arg Arg Tyr Pro Ala Ala Xaa Gly Arg His Leu
    50                  55                  60
Phe Gln Thr Tyr Ser Glu Phe
65                  70
<210>21
<211>782
<212>DNA
<213>Trichophaea saccata NP000960
<220>
<221>CDS
<222>(43)..(702)
<400>21
ggcacgaggg cagatcgatc gactcgagga ccacatcgca tc atg aag aac ttc      54
                                               Met Lys Asn Phe
                                               1
ctt ctg gcg tcc gcg ctg atc gcg gtt gcc gca gct cag cag agt gct    102
Leu Leu Ala Ser Ala Leu Ile Ala Val Ala Ala Ala Gln Gln Ser Ala
5                   10                  15                  20
tgg gga cag tgc ggt gga att ggc tgg act ggc gcg acg act tgt atc    150
Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Ala Thr Thr Cys Ile
                25                  30                  35
tct ggc tac acg tgc tea aag atc aac gac tac tat tcc cag tgc att    198
Ser Gly Tyr Thr Cys Ser Lys Ile Asn Asp Tyr Tyr Ser Gln Cys Ile
            40                  45                  50
ccg ggt acg gct tca acc acc act caa ggc ggc ggc aat ggc gga  gga   246
Pro Gly Thr Ala Ser Thr Thr Thr Gln Gly Gly Gly Asn Gly Gly Gly
        55                  60                  65
aac ggc ggt aca acg act act ccc act acc act cca gcg gcc agt aac    294
Asn Gly Gly Thr Thr Thr Thr Pro Thr Thr Thr Pro Ala Ala Ser Asn
    70                  75                  80
acc aac aac ccg ttc tcc ggc aag acc caa tgg gcg aac cct tac tac    342
Thr Asn Asn Pro Phe Ser Gly Lys Thr Gln Trp Ala Asn Pro Tyr Tyr
85                  90                  95                  100
gct tcc gag gtc tcg agc atc gcc atc ccg tcc ctc gtt gcc gcc gga    390
Ala Ser Glu Val Ser Ser Ile Ala Ile Pro Ser Leu Val Ala Ala Gly
                105                 110                 115
aac acc cac tac atc gtc gac caa ggc cgc agc ggc aag cag ccg acc    438
Asn Thr His Tyr Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr
            120                 125                 130
ggc cag ctc cag cag ggc gat tgg tgc aac gcc ctg gga acc ggc ttt    486
Gly Gln Leu Gln Gln Gly Asp Trp Cys Asn Ala Lcu Gly Thr Gly Phc
        135                 140                 145
gga att cgt cct gat aca acc ccg gat gat ccc aac ctt gat gct ttc    534
Gly Ile Arg Pro Asp Thr Thr Pro Asp Asp Pro Asn Leu Asp Ala Phe
    150                 155                 160
gtg tgg gtt aag ccg ggt ggt gaa tcg gat ggt acc agc aat act tcc    582
Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asn Thr Ser
165                 170                 175                 180
tcg acc cgc tat gat tat cat tgt gga cag agc gat gcg cta caa ccg    630
Ser Thr Arg Tyr Asp Tyr His Cys Gly Gln Ser Asp Ala Leu Gln Pro
                185                 190                 195
gcc ccg gag gcg gga acg tgg ttc cag gcg tat ttt gtg cag ttg ctg    678
Ala Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu
            200                 205                 210
cag aat gct aat cct agc ttc acg taagcttggg agcgtggggg ttggaagatg   732
Gln Asn Ala Asn Pro Ser Phe Thr
        215                 220
tgtattgtat gtgtagatag agaaaaactg ttggcctatt caggactaag             782
<210>22
<211>220
<212>PRT
<213>Trichophaea saccata NP000960
<400>22
Met Lys Asn Phe Leu Leu Ala Ser Ala Leu Ile Ala Val Ala Ala Ala
1               5                   10                  15
Gln Gln Ser Ala Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Ala
            20                  25                  30
Thr Thr Cys Ile Ser Gly Tyr Thr Cys Ser Lys Ile Asn Asp Tyr Tyr
        35                  40                  45
Ser Gln Cys Ile Pro Gly Thr Ala Ser Thr Thr Thr Gln Gly Gly Gly
    50                  55                  60
Asn Gly Gly Gly Asn Gly Gly Thr Thr Thr Thr Pro Thr Thr Thr Pro
65                  70                  75                  80
Ala Ala Ser Asn Thr Asn Asn Pro Phe Ser Gly Lys Thr Gln Trp Ala
                85                  90                  95
Asn Pro Tyr Tyr Ala Ser Glu Val Ser Ser Ile Ala Ile Pr0 Ser Leu
            100                 105                 110
Val Ala Ala Gly Asn Thr His Tyr Ile Val Asp Gln Gly Arg Ser Gly
        115                 120                 125
Lys Gln Pro Thr Gly Gln Leu Gln Gln Gly Asp Trp Cys Asn Ala Leu
    130                 135                 140
Gly Thr Gly Phe Gly Ile Arg Pro Asp Thr Thr Pro Asp Asp Pro Asn
145                 150                 155                 160
Leu Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr
                165                 170                 175
Ser Asn Thr Ser Ser Thr Arg Tyr Asp Tyr His Cys Gly Gln Ser Asp
            180                 185                 190
Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe
        195                 200                 205
Val Gln Leu Leu Gln Asn Ala Asn Pro Ser Phe Thr
    210                 215                 220
<210>23
<211>1587
<212>DNA
<213>Stibella annulata NP001040
<220>
<221>CDS
<222>(21)..(1394)
<400>23
ggcacgaggc gcgcatcaca atg gcc ggt cga ttc ttc ctc tct gct gcc ttc     53
                      Met Ala Gly Arg Phe Phe Leu Ser Ala Ala Phe
                      1               5                   10
ctg gct agc gcg gct ttg gcc gtc cct ctc gag gag agg cag aac tgc      101
Leu Ala Ser Ala Ala Leu Ala Val Pro Leu Glu Glu Arg Gln Asn Cys
            15                  20                  25
tcc ccg cag tgg gcc cag tgc ggt gga aat gga tgg agc ggt ccg acg      149
Ser Pro Gln Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Pro Thr
        30                  35                  40
tgc tgc gcc tcc ggc agc aac tgc cag gtc acc aac gag tgg tac tct    197
Cys Cys Ala Ser Gly Ser Asn Cys Gln Val Thr Asn Glu Trp Tyr Ser
    45                  50                  55
cag tgt gtt ccg ggc gcg gcg cct ccc cct ccc ccc gtc acc acg acg    245
Gln Cys Val Pro Gly Ala Ala Pro Pro Pro Pro Pro Val Thr Thr Thr
60                  65                  70                  75
cgg tcg acc acc acg ccc ccg acg acg acg acc agg acc acc gct gat    293
Arg Ser Thr Thr Thr Pro Pro Thr Thr Thr Thr Arg Thr Thr Ala Asp
                80                  85                  90
gcc cct cct ccc acc ggc ggc gct act tac acc ggc aac ccc ttc ctc    341
Ala Pro Pro Pro Thr Gly Gly Ala Thr Tyr Thr Gly Asn Pro Phe Leu
            95                  100                 105
ggt gtc aac cag tgg gcc aac aac ttc tac cgg tct gag atc atg aac    389
Gly Val Asn Gln Trp Ala Asn Asn Phe Tyr Arg Ser Glu Ile Met Asn
        110                 115                 120
atc gcc gtc ccg tcc ctg tcc ggt gcc atg gct acc gcc gcc gcc aag    437
Ile Ala Val Pro Ser Leu Ser Gly Ala Met Ala Thr Ala Ala Ala Lys
    125                 130                 135
gtc gcc gat gtg ccc acc ttc cag tgg att gac aag atg gac aag ctc    485
Val Ala Asp Val Pro Thr Phe Gln Trp Ile Asp Lys Met Asp Lys Leu
140                 145                 150                 155
ccc ttg atc gat gag gct ctc gcc gac gtc cgc gct gcc aac gcc cgt    533
Pro Leu Ile Asp Glu Ala Leu Ala Asp Val Arg Ala Ala Asn Ala Arg
                160                 165                 170
ggc ggc aac tac gct tcc atc ctg gtc gtc tac aac ctg ccc gac cgt    581
Gly Gly Asn Tyr Ala Ser Ile Leu Val Val Tyr Asn Leu Pro Asp Arg
            175                 180                 185
gac tgc gcc gcc gcc gcc tcg aac ggc gag ttc gcc atc gcc gac ggc    629
Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ala Ile Ala Asp Gly
        190                 195                 200
ggt gtt gct aag tac aag aac tac att gac gag att cgc aag ctc gtc    677
Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Glu Ile Arg Lys Leu Val
    205                 210                 215
atc aag tac aac gac ctc cgt atc atc ctg gtc atc gag ccc gac tcc    725
Ile Lys Tyr Asn Asp Leu Arg Ile Ile Leu Val Ile Glu Pro Asp Ser
220                 225                 230                 235
ctc gcc aac atg gtg acc aac atg aac gtc gcc aag tgc cag aac gcc    773
Leu Ala Asn Met Val Thr Asn Met Asn Val Ala Lys Cys Gln Asn Ala
                240                 245                 250
gcc tcg gcc tac cgg gag tgc acc aac tat gcc ctg acg aac ctc gac    821
Ala Ser Ala Tyr Arg Glu Cys Thr Asn Tyr Ala Leu Thr Asn Leu Asp
            255                 260                 265
ctg ccc aac gtc gcc cag tac atg gat gcc gga cat gct ggc tgg ctc    869
Leu Pro Asn Val Ala Gln Tyr Met Asp Ala Gly His Ala Gly Trp Leu
        270                 275                 280
ggc tgg ccc gcc aac atc acc ccc gcc gcc cag ctc ttc gcc gag gtc    917
Gly Trp Pro Ala Asn Ile Thr Pro Ala Ala Gln Leu Phe Ala Glu Val
    285                 290                 295
tac aag cag gcc ggc agc ccc aag tcg gtc cgt ggt ctg gcc atc aac       965
Tyr Lys Gln Ala Gly Ser Pro Lys Ser Val Arg Gly Leu Ala Ile Asn
300                 305                 310                 315
gtc tcc aac tac aac gcg tgg agc gtt tcg tcc cct cct ccc tac acc      1013
Val Ser Asn Tyr Asn Ala Trp Ser Val Ser Ser Pro Pro Pro Tyr Thr
                320                 325                 330
tct ccc aac ccc aac tac gac gag cgc cac ttc gtt gag gcc ttt gcg      1061
Ser Pro Asn Pro Asn Tyr Asp Glu Arg His Phe Val Glu Ala Phe Ala
            335                 340                 345
ccc ctc ctg cgc cag aac ggc tgg gat gcc aag ttc atc gtc gac cag      1109
Pro Leu Leu Arg Gln Asn Gly Trp Asp Ala Lys Phe Ile Val Asp Gln
        350                 355                 360
ggc cgc tcc ggc agg cag ccc acc ggc cag cag gag tgg gga cac tgg      1157
Gly Arg Ser Gly Arg Gln Pro Thr Gly Gln Gln Glu Trp Gly His Trp
    365                 370                 375
tgc aac gcc atc ggc act ggc ttc ggc cag cgc ccg acg tcc aac acc      1205
Cys Asn Ala Ile Gly Thr Gly Phe Gly Gln Arg Pro Thr Ser Asn Thr
380                 385                 390                 395
ggc cac gcc gat gtt gac gct ttc gtc tgg atc aag ccg ggc ggt gag      1253
Gly His Ala Asp Val Asp Ala Phe Val Trp Ile Lys Pro Gly Gly Glu
                400                 405                 410
tgc gac ggc acc agc gac acc tcg gcc gcc cgc tac gac cac ttc tgt      1301
Cys Asp Gly Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp His Phe Cys
            415                 420                 425
ggc aac cct gat gcc ctc aag ccg gcc ccc gaa gcc gga gag tgg ttc      1349
Gly Asn Pro Asp Ala Leu Lys Pro Ala Pro Glu Ala Gly Glu Trp Phe
        430                 435                 440
cag gcc tac ttc gag cag ctt ctg cgc aac gcc aac ccc gcc ttc          1394
Gln Ala Tyr Phe Glu Gln Leu Leu Arg Asn Ala Asn Pro Ala Phe
    445                 450                 455
taagtgctgg atgagctttt ctgagagggt acttccgcgg tcttgggttt cactcttctc    1454
agcctttcag ggcagcagtt ttggtttctt ggggtaggac ctccgggttt atgtagacgg    1514
agttaggaag ccaaacctac tatgaatgta gtattcaaga agataatgac ttgaaaaaaa    1574
aaaaaaaaaa aaa                                                       1587
<210>24
<211>458
<2l2>PRT
<213>Stibella annulata NP001040
<400>24
Met Ala Gly Arg Phe Phe Leu Ser Ala Ala Phe Leu Ala Ser Ala Ala
1               5                   10                  15
Leu Ala Val Pro Leu Glu Glu Arg Gln Asn Cys Scr Pro Gln Trp Ala
            20                  25                  30
Gln Cys Gly Gly Asn Gly Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
        35                  40                  45
Ser Asn Cys Gln Val Thr Asn Glu Trp Tyr Ser Gln Cys Val Pro Gly
    50                  55                  60
Ala Ala Pro Pro Pro Pro Pro Val Thr Thr Thr Arg Ser Thr Thr Thr
65                  70                  75                  80
Pro Pro Thr Thr Thr Thr Arg Thr Thr Ala Asp Ala Pro Pro Pro Thr
                85                  90                  95
Gly Gly Ala Thr Tyr Thr Gly Asn Pro Phe Leu Gly Val Asn Gln Trp
            100                 105                 110
Ala Asn Asn Phe Tyr Arg Ser Glu Ile Met Asn Ile Ala Val Pro Ser
        115                 120                 125
Leu Ser Gly Ala Met Ala Thr Ala Ala Ala Lys Val Ala Asp Val Pro
    130                 135                 140
Thr Phe Gln Trp Ile Asp Lys Met Asp Lys Leu Pro Leu Ile Asp Glu
145                 150                 155                 160
Ala Leu Ala Asp Val Arg Ala Ala Asn Ala Arg Gly Gly Asn Tyr Ala
                165                 170                 175
Ser Ile Leu Val Val Tyr Asn Leu Pro Asp Arg Asp Cys Ala Ala Ala
            180                  185                 190
Ala Ser Asn Gly Glu Phe Ala  Ile Ala Asp Gly Gly Val Ala Lys Tyr
        195                 200                 205
Lys Asn Tyr Ile Asp Glu Ile Arg Lys Leu Val Ile Lys Tyr Asn Asp
    210                 215                 220
Leu Arg Ile Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val
225                 230                 235                 240
Thr Asn Met Asn Val Ala Lys Cys Gln Asn Ala Ala Ser Ala Tyr Arg
                245                 250                 255
Glu Cys Thr Asn Tyr Ala Leu Thr Asn Leu Asp Leu Pro Asn Val Ala
            260                 265                 270
Gln Tyr Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn
        275                 280                 285
Ile Thr Pro Ala Ala Gln Leu Phe Ala Glu Val Tyr Lys Gln Ala Gly
    290                 295                 300
Ser Pro Lys Ser Val Arg Gly Leu Ala Ile Asn Val Ser Asn Tyr Asn
305                 310                 315                 320
Ala Trp Ser Val Ser Ser Pro Pro Pro Tyr Thr Ser Pro Asn Pro Asn
                325                 330                 335
Tyr Asp Glu Arg His Phe Val Glu Ala Phe Ala Pro Leu Leu Arg Gln
            340                 345                 350
Asn Gly Trp Asp Ala Lys Phe Ile Val Asp Gln Gly Arg Ser Gly Arg
        355                 360                 365
Gln Pro Thr Gly Gln Gln Glu Trp Gly His Trp Cys Asn Ala Ile Gly
    370                 375                 380
Thr Gly Phe Gly Gln Arg Pro Thr Ser Asn Thr Gly His Ala Asp Val
 385                390                 395                 400
Asp Ala Phe Val Trp Ile Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser
                405                 410                 415
Asp Thr Ser Ala Ala Arg Tyr Asp His Phe Cys Gly Asn Pro Asp Ala
            420                 425                 430
Leu Lys Pro Ala Pro Glu Ala Gly Glu Trp Phe Gln Ala Tyr Phe Glu
        435                 440                 445
Gln Leu Leu Arg Asn Ala Asn Pro Ala Phe
    450                 455
<210>25
<211>1559
<212>DNA
<213>Malbrancheae cinnamonea NP001045
<220>
<221>CDS
<222>(41)..(1210)
<400>25
cgaggcgtcc atcccacgcc gcacgcgtca gccagtcatt atg aga gac tct ttg     55
                                            Met Arg Asp Ser Leu
                                            1               5
ttc act ttg cta tct ctt gcc ttg ggc tcg gcc tct gcc agc cct ttc    103
Phe Thr Leu Leu Ser Leu Ala Leu Gly Ser Ala Ser Ala Ser Pro Phe
                10                  15                  20
ctt ctt cca agg caa gcg aac tcc tcc aac ccg ttt gct gga cac acg    151
Leu Leu Pro Arg Gln Ala Asn Ser Ser Asn Pro Phe Ala Gly His Thr
            25                  30                  35
atc tat cca aac ccg tac tac tcc aac gag att gac gag ttt gcc att    199
Ile Tyr Pro Asn Pro Tyr Tyr Ser Asn Glu Ile Asp Glu Phe Ala Ile
        40                  45                  50
ccc gcg ctg caa gag acc gat cct gca ctt gtg gag aag gcc gct tta    247
Pro Ala Leu Gln Glu Thr Asp Pro Ala Leu Val Glu Lys Ala Ala Leu
    55                  60                  65
gta aaa gaa gtt gga act ttc ttc tgg att gat gtc gtc gcc aag gtc    295
Val Lys Glu Val Gly Thr Phe Phe Trp Ile Asp Val Val Ala Lys Val
70                  75                  80                  85
cca gat atc ggc cct tac ctg cag ggg atc caa gaa gca aac gcc gca    343
Pro Asp Ile Gly Pro Tyr Leu Gln Gly Ile Gln Glu Ala Asn Ala Ala
                90                  95                  100
ggc cag aat ccg ccg tac atc ggc gcg att gtt gtc tat gac ctc ccc    391
Gly Gln Asn Pro Pro Tyr Ile Gly Ala Ile Val Val Tyr Asp Leu Pro
            105                 110                 115
aac cgt gac tgc gct gcc gca gct tcc aac gga gag ttc agc ctc gag    439
Asn Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Leu Glu
        120                 125                 130
gat ggc ggc gag gag aag tac cgc ggt tat atc gac ggt atc cgg gag    487
Asp Gly Gly Glu Glu Lys Tyr Arg Gly Tyr Ile Asp Cly Ile Arg Glu
    135                 140                 145
caa att gag aaa tac cca gac gtc cgt gtc gcg ctg gtt atc gag ccc    535
Gln Ile Glu Lys Tyr Pro Asp Val Arg Val Ala Leu Val Ile Glu Pro
150                 155                 160                 165
gat tcg ctc gcg aac atg gtc acc aat ctc aat gtc ccc aag tgc gct    583
Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Pro Lys Cys Ala
                170                 175                 180
gag tcg gag cag gct tat cga gat ggc gtc gcg tat gca ctg aaa cag    631
Glu Ser Glu Gln Ala Tyr Arg Asp Gly Val Ala Tyr Ala Leu Lys Gln
            185                 190                 195
cta gac ctc ccc aac gtc tgg aca tat atc gat gct ggt cat tca ggt    679
Leu Asp Leu Pro Asn Val Trp Thr Tyr Ile Asp Ala Gly His Ser Gly
        200                 205                 210
tgg ctt ggc tgg ccc gcc aac atc gag cct gcc gca gaa att ttt gtt    727
Trp Leu Gly Trp Pro Ala Asn Ile Glu Pro Ala Ala Glu Ile Phe Val
    215                 220                 225
gag gtc tgg aat gca gct ggc agg cca aag tcc act cga ggg ttt gct    775
Glu Val Trp Asn Ala Ala Gly Arg Pro Lys Ser Thr Arg Gly Phe Ala
230                 235                 240                 245
acg aac gtt tcc aac tac aac ggt tat tcc ctc agc acc gct cct ccc    823
Thr Asn Val Ser Asn Tyr Asn Gly Tyr Ser Leu Ser Thr Ala Pro Pro
                250                 255                 260
tac act gag ccc aac ccc aat ttc gac gaa gtg cgt tat atc aat gca    871
Tyr Thr Glu Pro Asn Pro Asn Phe Asp Glu Val Arg Tyr Ile Asn Ala
            265                 270                 275
ttc cgc cca ctc ctc gag gca cgg ggt ttc cca gca tac ttc atc gtc    919
Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala Tyr Phe Ile Val
        280                 285                 290
gac caa ggc cgc agc ggt gtc cag ccc act gcg cag att gag caa gga    967
Asp Gln Gly Arg Ser Gly Val Gln Pro Thr Ala Gln Ile Glu Gln Gly
    295                 300                 305
cac tgg tgc aat gtg atc gac acc ggt ttt gga act cgc ccc act act   1015
His Trp Cys Asn Val lle Asp Thr Gly Phe Gly Thr Arg Pro Thr Thr
310                 315                 320                 325
gac act ggt aat gag tac gtt gac tcg atc gtg tgg gtg aag cct ggc      1063
Asp Thr Gly Asn Glu Tyr Val Asp Ser Ile Val Trp Val Lys Pro Gly
                330                 335                 340
ggc gaa tcg gac gga acc agc gat acc tct gct gag aga tat gac tac      1111
Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Glu Arg Tyr Asp Tyr
            345                 350                 355
cac tgc gga ctt gag gat gca ttg aag cca gct cct gaa gcg gga cag      1159
His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala Pro Glu Ala Gly Gln
        360                 365                 370
tgg ttc cag gcc tac ttc gag caa ctg ctc aga aat gcc aac ccc cca      1207
Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Arg Asn Ala Asn Pro Pro
    375                 380                 385
ttc taaatcagat gaaggacgga cccaattgat gacggcctgt cttcgtgatc           1260
Phe
390
cgacgaaagc aatgtcaggg tgaaaatgac cgagagattg gagagtcatg aggataggta    1320
gtcaatgatt tcacccgagt ttccacgttt tacccttctt gtacatagtt tggagtcgcc    1380
tgttggtttc agtagtacat cttatccgac agagtctatc gtttgattac cccagtcaaa    1440
agcgttattg caatcttttc ctagggattt attgtttgct gcggatgtcg tggctatggg    1500
cagctgactg aattaaactg gaactcttgg tatccaaaaa aaaaaaaaaa aaaaaaaaa     1559
<210>26
<211>390
<212>PRT
<213>Malbrancheae cinnamonea NP001045
<400>26
Met Arg Asp Ser Leu Phe Thr Leu Leu Ser Leu Ala Leu Gly Ser Ala
1               5                   10                  15
Ser Ala Ser Pro Phe Leu Leu Pro Arg Gln Ala Asn Ser Ser Asn Pro
            20                  25                  30
Phe Ala Gly His Thr Ile Tyr Pro Asn Pro Tyr Tyr Ser Asn Glu lle
        35                  40                  45
Asp Glu Phe Ala Ile Pro Ala Leu Gln Glu Thr Asp Pro Ala Leu Val
    50                  55                  60
Glu Lys Ala Ala Leu Val Lys Glu Val Gly Thr Phe Phe Trp Ile Asp
65                  70                  75                  80
Val Val Ala Lys Val Pro Asp Ile Gly Pro Tyr Leu Gln Gly Ile Gln
                85                  90                  95
Glu Ala Asn Ala Ala Gly Gln Asn Pro Pr0 Tyr Ile Gly Ala Ile Val
            100                 105                 110
Val Tyr Asp Leu Pro Asn Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly
        115                 120                 125
Glu Phe Ser Leu Glu Asp Gly Gly Glu Glu Lys Tyr Arg Gly Tyr Ile
    130                 135                 140
Asp Gly Ile Arg Glu Gln Ile Glu Lys Tyr Pro Asp Val Arg Val Ala
145                 150                 155                 160
Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn
                165                 170                 175
Val Pro Lys Cys Ala Glu Ser Glu Gln Ala Tyr Arg Asp Gly Val Ala
            180                 185                 190
Tyr Ala Leu Lys Gln Leu Asp Leu Pro Asn Val Trp Thr Tyr Ile Asp
        195                 200                 205
Ala Gly His Ser Gly Trp Leu Gly Trp Pro Ala Asn Ile Glu Pro Ala
    210                 215                 220
Ala Glu Ile Phe Val Glu Val Trp Asn Ala Ala Gly Arg Pro Lys Ser
225                 230                 235                 240
Thr Arg Gly Phe Ala Thr Asn Val Ser Asn Tyr Asn Gly Tyr Ser Leu
                245                 250                 255
Ser Thr Ala Pro Pro Tyr Thr Glu Pro Asn Pro Asn Phe Asp Glu Val
            260                 265                 270
Arg Tyr Ile Asn Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro
        275                 280                 285
Ala Tyr Phe Ile Val Asp Gln Gly Arg Ser Gly Val Gln Pro Thr Ala
    290                 295                 300
Gln Ile Glu Gln Gly His Trp Cys Asn Val Ile Asp Thr Gly Phe Gly
305                 310                 315                 320
Thr Arg Pro Thr Thr Asp Thr Gly Asn Glu Tyr Val Asp Ser Ile Val
                325                 330                 335
Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala
            340                 345                 350
Glu Arg Tyr Asp Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala
        355                 360                 365
Pro Glu Ala Gly Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Arg
    370                 375                 380
Asn Ala Asn Pro Pro Phe
385                 390
<210>27
<211>17
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(17)
<223>r是a或g
y是t或c
n是a,g,t,或c
<400>27
tggggncart gyggngg                                                         17
<210>28
<211>17
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)...(17)
<223> y是t或c
n是a,g,t,或c
<400>28
tggytnggnt ggccngc                                                         17
<210>29
<211>17
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(17)
<223>n是a,g,t,或c
r是a或g
<400>29
gcnggccanc cnarcca                                                    17
<210>30
<211>17
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(17)
<223>r是a或g
n是a,g,t,或c
<400>30
ttrcaccart cncccca                                                    17
<210>31
<211>17
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(17)
<223>r是a或g
y是t或c
n是a,g,t or c
<400>31
ggyt tnaccc anac raa                                                  17
<210>32
<211>17
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(17)
<223>r是a或g
y是t或c
n是a,g,t or c
<400>32
aartangcyt graacca                                                    17
<210>33
<211>25
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(25)
<400>33
gggtcatgag agactctttg ttcac                                           25
<210>34
<211>34
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(34)
<400>34
gggttaatta attagaatgg ggggttggca tttc                                 34
<210>35
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>35
actggattta ccatggccgg tcgattcttc c                                    31
<210>36
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>36
agtcacctct agttattaga aggcggggtt g                                    31

Claims (22)

1.一种具有纤维二糖水解酶II活性的多肽,选自:
(a)含有选自下述氨基酸序列的多肽:与SEQ ID NO:2的第1至477位氨基酸所示的氨基酸序列具有至少75%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:4的第1至82位氨基酸所示氨基酸序列的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:4的第1至420位氨基酸所示的部分氨基酸序列的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:6的第1至139位氨基酸所示的部分氨基酸序列的同一性至少80%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:8的第1至102位氨基酸所示的部分氨基酸序列的同一性至少95%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:10的第1至144位氨基酸所示的部分氨基酸序列的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:12的第1至99位氨基酸所示的部分氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:14的第1至140位氨基酸所示的部分氨基酸序列的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:16的第1至109位氨基酸所示的部分氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:16的第1至407位氨基酸所示的部分氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:18的第1至143位氨基酸所示的部分氨基酸序列的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:20的第1至71位氨基酸所示的部分氨基酸序列的同一性至少70%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:22的第1至220位氨基酸所示的氨基酸序列的同一性至少60%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:24的第1至458位氨基酸所示的氨基酸序列的同一性至少65%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:26的第1至390位氨基酸所示的氨基酸序列的同一性至少70%的氨基酸序列,
(b)含有选自下述的氨基酸序列的多肽:与由在Chaetomiumthermophilum中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述的氨基酸序列的多肽:与由在Mycellophtora thermophila中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少85%的氨基酸序列,
与由在Melanocarpus albomyces中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少80%的氨基酸序列,
与由在Acremonium thermophilum中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少80%的氨基酸序列,
与由在Melanocarpus sp.中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少95%的氨基酸序列,
与由在Thielavia microspora中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少85%的氨基酸序列,
与由在烟曲霉(Aspergillus fumigatus)中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少80%的氨基酸序列,
与由在曲霉属的种中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少75%的氨基酸序列,
与由在Thielavia australiensis中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少85%的氨基酸序列,
与由在塔宾曲霉中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少75%的氨基酸序列,
与由在密粘褶菌中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少75%的氨基酸序列,
与由在Meripilus giganteus中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少70%的氨基酸序列,
与由在Trichophaea saccata中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少60%的氨基酸序列,
与由在Stilbella annulata中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少65%的氨基酸序列,
与由在Malbrancheae cinnamomea中的纤维二糖水解酶II编码部分的核苷酸序列编码的多肽的同一性至少70%的氨基酸序列,
(c)含有选自下述氨基酸序列的多肽:与SEQ ID NO:1的第63至1493位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:3的第1至246位核苷酸编码的多肽的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:5的第1至417位核苷酸编码的多肽的同一性至少80%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:7的第1至306位核苷酸编码的多肽的同一性至少95%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:9的第1至432位核苷酸编码的多肽的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:11的第1至297位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:13的第1至420位核苷酸编码的多肽的同一性至少85%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:15的第1至330位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:15的第1至1221位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:17的第1至429位核苷酸编码的多肽的同一性至少75%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:19的第1至213位核苷酸编码的多肽的同一性至少70%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:21的第43至701位核苷酸编码的多肽的同一性至少60%的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:23的第21至1394位核苷酸编码的多肽的同一性至少65%的氨基酸序列,以及
含有选自下述氨基酸序列的多肽:与SEQ ID NO:25的第41至1210位核苷酸编码的多肽的同一性至少70%的氨基酸序列,
(d)由在高度严谨条件下能与选自下述的多核苷酸探针杂交的核苷酸序列编码的多肽:
(i)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-1493位核苷酸,
SEQ ID NO:3的第1-246位核苷酸,
SEQ ID NO:3的第1-1272位核苷酸,
SEQ ID NO:5的第1-417位核苷酸,
SEQ ID NO:7的第1-306位核苷酸,
SEQ ID NO:9的第1-432位核苷酸,
SEQ ID NO:11的第1-297位核苷酸,
SEQ ID NO:13的第1-420位核苷酸,
SEQ ID NO:15的第1-330位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-429位核苷酸,
SEQ ID NO:19的第1-213位核苷酸,
SEQ ID NO:21的第43-701位核苷酸,
SEQ ID NO:23的第21-1394位核苷酸,以及
SEQ ID NO:25的第41-1210位核苷酸,
(ii)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-563位核苷酸,
SEQ ID NO:21的第43-543位核苷酸,
SEQ ID NO:23的第21-521位核苷酸,以及
SEQ ID NO:25的第41-541位核苷酸,
(iii)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-263位核苷酸,
SEQ ID NO:3的第1-200位核苷酸,
SEQ ID NO:3的第1-1272位核苷酸,
SEQ ID NO:5的第1-200位核苷酸,
SEQ ID NO:5的第1-200位核苷酸,
SEQ ID NO:7的第1-200位核苷酸,
SEQ ID NO:9的第1-200位核苷酸,
SEQ ID NO:13的第1-200位核苷酸,
SEQ ID NO:11的第1-200位核苷酸,
SEQ ID NO:13的第1-200位核苷酸,
SEQ ID NO:15的第1-200位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-200位核苷酸,
SEQ ID NO:19的第1-200位核苷酸,
SEQ ID NO:21的第43-243位核苷酸,
SEQ ID NO:23的第21-221位核苷酸,以及
SEQ ID NO:25的第41-241位核苷酸,
(e)具有纤维二糖水解酶II活性的(a)、(b)或(c)所述多肽的片段。
2.如权利要求1所述的多肽,含有选自下述多肽的氨基酸序列:
含有选自下述氨基酸序列的多肽:与SEQ ID NO:2的第1至477位氨基酸所示的氨基酸序列有至少80%同一性,优选85%同一性,更优选85%同一性,甚至更优选至少90%,最优选至少95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:4的第1至82位氨基酸所示的部分氨基酸序列有至少90%同一性,优选95%同一性的的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:4的第1至420位氨基酸所示的氨基酸序列有至少90%同一性,优选95%同一性的的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:6的第1至156位氨基酸所示的部分氨基酸序列有至少85%同一性,优选90%同一性,更优选95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:6的第1至139位氨基酸所示的部分氨基酸序列有至少80%同一性,优选85%同一性,更优选85%同一性,甚至更优选90%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:8的第1至102位氨基酸所示的部分氨基酸序列有至少96%,优选97%,更优选98%,最优选99%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:10的第1至144位氨基酸所示的部分氨基酸序列有至少90%,优选95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:12的第1至99位氨基酸所示的部分氨基酸序列有至少80%,优选85%,更优选85%同一性,甚至更优选90%,最优选95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:14的第1至140位氨基酸所示的部分氨基酸序列有至少90%,优选95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:16的第1至109位氨基酸所示的部分氨基酸序列有至少80%,优选85%,更优选85%同一性,甚至更优选90%,最优选95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:16的第1至407位氨基酸所示的氨基酸序列有至少80%,优选85%,更优选85%同一性,甚至更优选90%,最优选95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:18的第1至143位氨基酸所示的部分氨基酸序列有至少80%,优选85%,更优选85%同一性,甚至更优选90%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:20的第1至71位氨基酸所示的部分氨基酸序列有至少75%,优选80%,更优选85%,甚至更优选至少85%同一性,最优选至少90%,还更优选至少95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:22的第1至220位氨基酸所示的部分氨基酸序列有至少60%,优选65%,更优选70%,甚至更优选75%,最优选80%,还更优选85%,例如甚至至少85%,或甚至至少90%,或至少95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:24的第1至458位氨基酸所示的氨基酸序列有至少65%,优选70%,更优选75%,甚至更优选80%,还更优选85%,例如甚至至少85%同一性,或至少90%,或至少95%同一性的氨基酸序列,
含有选自下述氨基酸序列的多肽:与SEQ ID NO:26的第1至390位氨基酸所示的氨基酸序列有至少75%,优选80%,更优选85%,甚至更优选85%的同一性,最优选至少90%,还更优选至少95%同一性的氨基酸序列。
3.如权利要求1或2的多肽,其中相对于选自下述氨基酸序列而言,所述多肽是包含了至少1个氨基酸取代、缺失和/或插入的氨基酸序列人工变体:
SEQ ID NO:2的第1-477位氨基酸,
SEQ ID NO:4的第1-82位氨基酸,
SEQ ID NO:4的第1-420位氨基酸,
SEQ ID NO:6的第1-139位氨基酸,
SEQ ID NO:8的第1-102位氨基酸,
SEQ ID NO:10的第1-144位氨基酸,
SEQ ID NO:12的第1-99位氨基酸,
SEQ ID NO:14的第1-140位氨基酸,
SEQ ID NO:16的第1-109位氨基酸,
SEQ ID NO:16的第1-407位氨基酸,
SEQ ID NO:18的第1-143位氨基酸,
SEQ ID NO:20的第1-71位氨基酸,
SEQ ID NO:22的第1-220位氨基酸,
SEQ ID NO:24的第1-458位氨基酸,或
SEQ ID NO:26的第1-390位氨基酸。
4.具有编码权利要求1-3中任一项的多肽核苷酸序列之多核苷酸。
5.一种核酸构建体,包括权利要求4的核苷酸序列,其可操作的连接于一或多个调控序列,以指导在合适的宿主中产生所述多肽。
6.含有权利要求5的核酸构建体的重组表达载体。
7.含有权利要求5的核酸构建体的重组宿主细胞。
8.制备权利要求1-3中任一项的多肽的方法,该方法包括:
(a)培养其在野生型即能产生所述多肽的菌株,以产生所述多肽,以及
(b)收获所述多肽。
9.制备权利要求1-3中任一项的多肽的方法,该方法包括:
(a)在能够诱导产生所述多肽的条件下培养权利要求7的重组宿主细胞,以及
(b)收获所述多肽
10.一种原位产生权利要求1-3任一项的多肽的方法,该方法包括:
(a)在能够诱导产生所述多肽的条件下培养权利要求7的重组宿主细胞,以及
(b)将多肽与预期底物接触,而不先进行多肽的回收。
11.含有与选自下述核苷酸有至少80%,优选至少85%,更优选90%同一性,最优选至少95%的同一性的核苷酸序列的多核苷酸:
SEQ ID NO:1的第63-1493位核苷酸,
SEQ ID NO:3的第1-246位核苷酸,
SEQ ID NO:3的第1-1272位核苷酸,
SEQ ID NO:5的第1-417位核苷酸,
SEQ ID NO:7的第1-306位核苷酸,
SEQ ID NO:9的第1-432位核苷酸,
SEQ ID NO:11的第1-297位核苷酸,
SEQ ID NO:15的第1-330位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-429位核苷酸,
SEQ ID NO:19的第1-213位核苷酸,
SEQ ID NO:21的第43-701位核苷酸,
SEQ ID NO:23的第21-1394位核苷酸,以及
SEQ ID NO:25的第41-1210位核苷酸。
12.编码具有纤维二糖水解酶II活性的多肽核苷酸序列之多核苷酸,其在高度严谨条件下可与选自下述的多核苷酸探针杂交:
(i)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-1493位核苷酸,
SEQ ID NO:3的第1-246位核苷酸,
SEQ ID NO:3的第1-1272位核苷酸,
SEQ ID NO:5的第1-417位核苷酸,
SEQ ID NO:7的第1-306位核苷酸,
SEQ ID NO:9的第1-432位核苷酸,
SEQ ID NO:11的第1-297位核苷酸,
SEQ ID NO:13的第1-420位核苷酸,
SEQ ID NO:15的第1-330位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-429位核苷酸,
SEQ ID NO:19的第1-213位核苷酸,
SEQ ID NO:21的第43-701位核苷酸,
SEQ ID NO:23的第21-1394位核苷酸,以及
SEQ ID NO:25的第41-1210位核苷酸,
(ii)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-563位核苷酸,
SEQ ID NO:21的第43-543位核苷酸,
SEQ ID NO:23的第21-521位核苷酸,以及
SEQ ID NO:25的第41-541位核苷酸,
(iii)选自下述核苷酸的互补链:
SEQ ID NO:1的第63-263位核苷酸,
SEQ ID NO:3的第1-200位核苷酸,
SEQ ID NO:5的第1-200位核苷酸,
SEQ ID NO:7的第1-200位核苷酸,
SEQ ID NO:9的第1-200位核苷酸,
SEQ ID NO:11的第1-200位核苷酸,
SEQ ID NO:13的第1-200位核苷酸,
SEQ ID NO:15的第1-200位核苷酸,
SEQ ID NO:15的第1-1221位核苷酸,
SEQ ID NO:17的第1-200位核苷酸,
SEQ ID NO:19的第1-200位核苷酸,
SEQ ID NO:21的第43-243位核苷酸,
SEQ ID NO:23的第21-221位核苷酸,以及
SEQ ID NO:25的第41-241位核苷酸,
13.含有选自下述修饰的序列的多核苷酸序列:
含有至少1个修饰的SEQ ID NO:1核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:2所示氨基酸序列的多肽,
含有至少1个修饰的SEQ ID NO:3的核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:4中第1-82位的部分氨基酸序列的多肽,
含有至少1个修饰的SEQ ID NO:3的核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:4所示氨基酸序列的多肽,
含有至少1个修饰的SEQ ID NO:5的核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:6所示的部分氨基酸序列的多肽,
含有至少1个修饰的SEQ ID NO:7的核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:8所示的部分氨基酸序列的多肽,
含有至少1个修饰的SEQ ID NO:9的核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:10所示的部分氨基酸序列的多肽,
含有至少1个修饰的SEQ ID NO:13的核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:14所示的部分氨基酸序列的多肽,
含有至少1个修饰的SEQ ID NO:11的核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:12所示的部分氨基酸序列的多肽,
含有至少1个修饰的SEQ ID NO:13的核苷酸序列,其中所述修饰的核苷酸序列编码含有SEQ ID NO:14所示的部分氨基酸序列的多肽,
SEQ ID NO:15的第1-330位核苷酸序列的含有至少1个修饰得到的修饰核苷酸序列,其编码含有SEQ ID NO:16所示第1-109位的部分氨基酸序列的多肽,
SEQ ID NO:15的核苷酸序列的含有至少1个修饰得到的修饰核苷酸序列,其编码含有SEQ ID NO:16所示氨基酸序列的多肽,
SEQ ID NO:17的核苷酸序列的含有至少1个修饰得到的修饰核苷酸序列,其编码了由SEQ ID NO:18所示第1-450位氨基酸序列组成的多肽,
SEQ ID NO:19的核苷酸序列的含有至少1个修饰得到的修饰核苷酸序列,其编码含有SEQ ID NO:20所示的部分氨基酸序列的多肽,
SEQ ID NO:21的核苷酸序列的含有至少1个修饰得到的修饰核苷酸序列,其编码含有SEQ ID NO:22所示的部分氨基酸序列的多肽,
SEQ ID NO:23的核苷酸序列的含有至少1个修饰得到的修饰核苷酸序列,其编码含有SEQ ID NO:24所示氨基酸序列的多肽,以及
SEQ ID NO:25的核苷酸序列的含有至少1个修饰得到的修饰核苷酸序列,其编码含有SEQ ID NO:26所示氨基酸序列的多肽。
14.具有纤维二糖水解酶II活性的多肽,由选自下述微生物中存在的纤维二糖水解酶II的编码部分的核苷酸序列所编码:
属于毛壳霉科的微生物,优选属于毛壳霉属,更优选属于Chaetomiumthermophilum种的微生物,
属于毁丝霉属的微生物,优选属于Myceliophthora thermophila种的微生物,
属于Acremonium thermophilum种的微生物,
属于毛壳霉科的微生物,优选属于草根霉属,更优选属于Thielaviaaustraliensis种的微生物,
属于曲霉属的微生物,优选属于black Aspergilli(circumdati亚属,nigri部)
属于毛壳霉科的微生物,优选属于草根霉属,更优选属于Thielaviamicrospore种的微生物,
属于曲霉属的微生物,优选属于black Aspergilli(黑曲霉),更优选属于塔宾曲霉,以及最优选属于A.neotubingensis Frisvad sp.nov.种的微生物,
属于Polyporales属的微生物,优选属于Fomitopsidacea科,更优选属于Gloeophyllum属,以及最优选属于密粘褶菌种的微生物,
属于Hymenochaetales的微生物,优选属于Rigidiporaceae科,更优选属于Meripilus属,以及更优选属于Meripilus giganteus种的微生物,
属于Pezizomycotina的微生物,优选属于Pezizales,更优选属于Pyronemataceae或Sarcosomataceae科,更优选属于Trichophaea或Pseudoplectania属,以及最优选属于Trichophaea saccata的微生物,
属于Stilbella annulata种的微生物,以及
属于Malbrancheae cinnamomea种的微生物。
15.含有应用权利要求4和11-13中任一项多核苷酸的DNA的改组方法。
16.编码由权利要求15的方法获得的具有纤维二糖酶活性多肽的多核苷酸。
17.由权利要求16的多核苷酸编码的具有纤维二糖酶活性的多肽。
18.权利要求4和11-13中任一项的多核苷酸在DNA改组中的应用。
19.一种从生物质制备乙醇的方法,包括将所述生物质与权利要求1-3中任一项的多肽接触。
20.权利要求1-3中任一项多肽在制备乙醇中的应用。
21.一种转基因植物,植物部分或植物细胞,其中已用编码如权利要求1-3中任一项的具有纤维二糖水解酶II活性多肽的核苷酸序列所转化。
22.清洁剂组合物,其含有表面活性剂和权利要求1-3中任一项的多肽。
CNA2003801069409A 2002-12-20 2003-12-19 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸 Pending CN1729287A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US43510002P 2002-12-20 2002-12-20
US60/435,100 2002-12-20

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNA2009101343116A Division CN101555472A (zh) 2002-12-20 2003-12-19 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸

Publications (1)

Publication Number Publication Date
CN1729287A true CN1729287A (zh) 2006-02-01

Family

ID=32682155

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2009101343116A Pending CN101555472A (zh) 2002-12-20 2003-12-19 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸
CNA2003801069409A Pending CN1729287A (zh) 2002-12-20 2003-12-19 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA2009101343116A Pending CN101555472A (zh) 2002-12-20 2003-12-19 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸

Country Status (9)

Country Link
US (3) US7348168B2 (zh)
EP (2) EP2128247A1 (zh)
CN (2) CN101555472A (zh)
AT (1) ATE438711T1 (zh)
AU (1) AU2003291962A1 (zh)
DE (1) DE60328715D1 (zh)
DK (1) DK1578964T4 (zh)
ES (1) ES2331067T5 (zh)
WO (1) WO2004056981A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103068976A (zh) * 2009-11-06 2013-04-24 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN101874109B (zh) * 2007-09-28 2013-07-10 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103517986A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103517985A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103620028A (zh) * 2011-01-26 2014-03-05 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN104169417A (zh) * 2009-12-01 2014-11-26 诺维信公司 具有葡糖淀粉酶活性的多肽及其编码多核苷酸

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7883872B2 (en) * 1996-10-10 2011-02-08 Dyadic International (Usa), Inc. Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
EA005682B1 (ru) * 1998-10-06 2005-04-28 Марк Аарон Эмалфарб Трансформированные грибы, в частности рода chrysosporium, способные к синтезу гетерологичных полипептидов
US7537826B2 (en) * 1999-06-22 2009-05-26 Xyleco, Inc. Cellulosic and lignocellulosic materials and compositions and composites made therefrom
US7645730B2 (en) * 2004-04-29 2010-01-12 Advanced Biocatalytics Corp. Surfactant composition with a reduction of surface tension, interfacial tension, and critical micelle concentration using a protein-based surfactant synergist
US7659237B2 (en) * 2004-04-29 2010-02-09 Advanced Biocatalytics Corp. Increasing surface-active properties of surfactants
EP1838849B1 (en) * 2004-12-30 2015-08-26 Danisco US Inc. Variant hypocrea jecorina cbh2 cellulases
US7220565B2 (en) 2005-01-06 2007-05-22 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US7708214B2 (en) 2005-08-24 2010-05-04 Xyleco, Inc. Fibrous materials and composites
US20150328347A1 (en) 2005-03-24 2015-11-19 Xyleco, Inc. Fibrous materials and composites
FI120045B (fi) * 2005-12-22 2009-06-15 Roal Oy Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit
US8017373B2 (en) * 2006-08-31 2011-09-13 Iogen Energy Corporation Process for enzymatic hydrolysis of pretreated lignocellulosic feedstocks
US7785854B2 (en) * 2006-08-31 2010-08-31 Iogen Energy Corporation Modified cellulases with increased thermostability, thermophilicity, and alkalophilicity
WO2008073914A2 (en) 2006-12-10 2008-06-19 Dyadic International Inc. Expression and high-throughput screening of complex expressed dna libraries in filamentous fungi
US9862956B2 (en) 2006-12-10 2018-01-09 Danisco Us Inc. Expression and high-throughput screening of complex expressed DNA libraries in filamentous fungi
WO2008086221A2 (en) * 2007-01-04 2008-07-17 Advanced Biocatalytics Corporation Enhanced oil recovery compositions comprising proteins and surfactants and methods of using the same
CA2674721C (en) * 2007-01-30 2018-04-03 Verenium Corporation Enzymes for the treatment of lignocellulosics, nucleic acids encoding them and methods for making and using them
US7923236B2 (en) * 2007-08-02 2011-04-12 Dyadic International (Usa), Inc. Fungal enzymes
BRPI0816177B1 (pt) * 2007-08-30 2018-07-17 Iogen Energy Corp processo para a conversão de uma matéria-prima lignocelulósica pré-tratada em açúcares solúveis
CA2736661A1 (en) * 2007-09-07 2009-03-12 Dyadic International, Inc. Novel fungal enzymes
WO2009133034A1 (en) * 2008-04-29 2009-11-05 Dsm Ip Assets B.V. Carbohydrate modifying polypeptide and uses thereof
ES2619902T3 (es) * 2008-06-06 2017-06-27 Danisco Us Inc. Composiciones y métodos que comprenden variantes de celulasa con afinidad reducida para materiales no celulósicos
BRPI0916767A2 (pt) 2008-07-16 2018-10-16 Iogen Energy Corp glicosidades bda família 6 modificadas com especificidade de substrato alterada
BRPI0917395A2 (pt) * 2008-08-01 2019-09-24 Iogen Energy Corp família 6 celulase com inativação diminuída por lignina
US8518684B2 (en) 2008-11-18 2013-08-27 Novozymes, Inc. Methods and compositions for degrading cellulosic material
WO2010066411A2 (en) * 2008-12-10 2010-06-17 Direvo Industrial Biotechnology Gmbh Polypeptides having cellobiohydrolase ii activity
US8338121B2 (en) 2008-12-19 2012-12-25 Novozymes, Inc. Methods for determining cellulolytic enhancing activity of a polypeptide
AR075240A1 (es) * 2009-02-06 2011-03-16 Syngenta Participations Ag Modificacion de enzima multidominio para la expresion en plantas
WO2010096931A1 (en) 2009-02-27 2010-09-02 Iogen Energy Corporation Novel lignin-resistant cellulase enzymes
JP2012522521A (ja) * 2009-04-06 2012-09-27 カリフォルニア インスティチュート オブ テクノロジー セルラーゼ活性を有するポリペプチド
US8278507B2 (en) 2009-06-02 2012-10-02 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
JP5597366B2 (ja) * 2009-07-22 2014-10-01 岩手県 新規セロビオヒドロラーゼ及びその製造方法
EP2473604B1 (en) 2009-09-04 2017-01-11 Codexis, Inc. Variant cbh2 cellulases and related polynucleotides
DK3222716T3 (da) 2009-11-06 2020-11-16 Novozymes Inc Sammensætninger til saccharificering af cellulosemateriale
FI122937B (fi) 2009-12-30 2012-09-14 Roal Oy Menetelmä selluloosamateriaalin käsittelemiseksi sekä tässä käyttökelpoiset CBH II/Cel6A entsyymit
US9206406B2 (en) 2010-02-11 2015-12-08 Iogen Energy Corporation Carbohydate binding modules with reduced binding to lignin
WO2012027282A2 (en) * 2010-08-23 2012-03-01 Codexis, Inc. Recombinant lignocellulose degradation enzymes for the production of soluble sugars from cellulosic biomass
WO2012103350A1 (en) 2011-01-26 2012-08-02 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US9322007B2 (en) 2011-07-22 2016-04-26 The California Institute Of Technology Stable fungal Cel6 enzyme variants
US20140234897A1 (en) * 2011-11-04 2014-08-21 Novozymes Inc. Polypeptides Having Cellobiohydrolase Activity and Polynucleotides Encoding Same
CA2855451A1 (en) * 2011-11-21 2013-08-15 Novozymes, Inc. Gh61 polypeptide variants and polynucleotides encoding same
WO2013096603A2 (en) * 2011-12-20 2013-06-27 Novozymes, Inc. Cellobiohydrolase variants and polynucleotides encoding same
US8778641B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8778640B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8771994B1 (en) * 2013-02-12 2014-07-08 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8993275B2 (en) * 2013-02-12 2015-03-31 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8975062B2 (en) * 2013-02-12 2015-03-10 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
WO2016145527A1 (en) 2015-03-16 2016-09-22 Iogen Corporation Process comprising acid pretreatment and enzymatic hydrolysis
CN108949726B (zh) * 2018-06-15 2021-11-16 河南农业大学 一种改组纤维素酶基因及其表达载体和应用
US11220699B1 (en) 2020-08-12 2022-01-11 Advanced Biocatalytics Corporation Compositions and methods for enhancing efficiencies of microbial-derived biosurfactants

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1296839A (zh) 1969-05-29 1972-11-22
GB1372034A (en) 1970-12-31 1974-10-30 Unilever Ltd Detergent compositions
GB1483591A (en) 1973-07-23 1977-08-24 Novo Industri As Process for coating water soluble or water dispersible particles by means of the fluid bed technique
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
FI841500A0 (fi) * 1984-04-13 1984-04-13 Valtion Teknillinen Foerfarande foer uppbygnande av cellulolytiska jaeststammar.
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
JPH0697997B2 (ja) 1985-08-09 1994-12-07 ギスト ブロカデス ナ−ムロ−ゼ フエンノ−トチヤツプ 新規の酵素的洗浄剤添加物
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US4810414A (en) 1986-08-29 1989-03-07 Novo Industri A/S Enzymatic detergent additive
NZ221627A (en) 1986-09-09 1993-04-28 Genencor Inc Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios
ES2076939T3 (es) 1987-08-28 1995-11-16 Novo Nordisk As Lipasa recombinante de humicola y procedimiento para la produccion de lipasas recombinantes de humicola.
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
EP0471265B1 (en) 1988-01-07 1995-10-25 Novo Nordisk A/S Specific protease
JP3079276B2 (ja) 1988-02-28 2000-08-21 天野製薬株式会社 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法
DE68911131T2 (de) 1988-03-24 1994-03-31 Novo Nordisk As Cellulosezubereitung.
US5776757A (en) 1988-03-24 1998-07-07 Novo Nordisk A/S Fungal cellulase composition containing alkaline CMC-endoglucanase and essentially no cellobiohydrolase and method of making thereof
GB8915658D0 (en) 1989-07-07 1989-08-23 Unilever Plc Enzymes,their production and use
NZ237549A (en) 1990-03-23 1993-06-25 Gist Brocades Nv Production of enhanced levels of enzymes in the seeds of transgenic plants and the use of these seeds
KR100236540B1 (ko) 1990-04-14 2000-01-15 레클로우크스 라우에르 알카리성 바실러스-리파제, 이를 코-딩하는 dna 서열 및 리파제를 생산하는 바실러스 균주
DE69107455T3 (de) 1990-05-09 2004-09-23 Novozymes A/S Eine ein endoglucanase enzym enthaltende zellulasezubereitung.
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
KR930702514A (ko) 1990-09-13 1993-09-09 안네 제케르 리파제 변체
ATE219136T1 (de) 1991-01-16 2002-06-15 Procter & Gamble Kompakte waschmittelzusammensetzungen mit hochaktiven cellulasen
CZ285148B6 (cs) 1991-04-30 1999-05-12 The Procter And Gamble Company Kapalné detergentní směsi s borito-polyolovým komplexem k inhibici proteolytického enzymu
EP0511456A1 (en) 1991-04-30 1992-11-04 The Procter & Gamble Company Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme
ES2121014T3 (es) 1991-05-01 1998-11-16 Novo Nordisk As Enzimas estabilizadas y composiciones detergentes.
DK72992D0 (da) 1992-06-01 1992-06-01 Novo Nordisk As Enzym
DK88892D0 (da) 1992-07-06 1992-07-06 Novo Nordisk As Forbindelse
EP0651794B1 (en) 1992-07-23 2009-09-30 Novozymes A/S MUTANT $g(a)-AMYLASE, DETERGENT AND DISH WASHING AGENT
EP0663950B1 (en) 1992-10-06 2004-03-17 Novozymes A/S Cellulase variants
ATE175235T1 (de) 1993-02-11 1999-01-15 Genencor Int Oxidativ stabile alpha-amylase
AU673078B2 (en) 1993-04-27 1996-10-24 Genencor International, Inc. New lipase variants for use in detergent applications
DK52393D0 (zh) 1993-05-05 1993-05-05 Novo Nordisk As
JP2859520B2 (ja) 1993-08-30 1999-02-17 ノボ ノルディスク アクティーゼルスカブ リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物
US5817495A (en) 1993-10-13 1998-10-06 Novo Nordisk A/S H2 O2 -stable peroxidase variants
JPH07143883A (ja) 1993-11-24 1995-06-06 Showa Denko Kk リパーゼ遺伝子及び変異体リパーゼ
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
JP3553958B2 (ja) 1994-02-22 2004-08-11 ノボザイムス アクティーゼルスカブ 脂質分解酵素の変異体の製造方法
DK1632557T3 (da) 1994-03-08 2011-05-16 Novozymes As Hidtil ukendte alkaliske cellulaser
DK0755442T3 (da) 1994-05-04 2003-04-14 Genencor Int Lipaser med forbedret resistens over for overfladeaktive midler
DE69523052T2 (de) 1994-06-03 2002-06-20 Novo Nordisk Biotech Inc Gereinigte myceliophthora laccasen und nukleinsäuren dafür kodierend
WO1995035381A1 (en) 1994-06-20 1995-12-28 Unilever N.V. Modified pseudomonas lipases and their use
WO1996000292A1 (en) 1994-06-23 1996-01-04 Unilever N.V. Modified pseudomonas lipases and their use
CN1151762A (zh) 1994-06-30 1997-06-11 诺沃诺尔迪斯克生物技术有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
EP1995303A3 (en) 1994-10-06 2008-12-31 Novozymes A/S Enzyme preparation with endoglucanase activity
BE1008998A3 (fr) 1994-10-14 1996-10-01 Solvay Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci.
JPH10507642A (ja) 1994-10-26 1998-07-28 ノボ ノルディスク アクティーゼルスカブ 脂肪分解活性を有する酵素
AR000862A1 (es) 1995-02-03 1997-08-06 Novozymes As Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del
JPH08228778A (ja) 1995-02-27 1996-09-10 Showa Denko Kk 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法
CN1182451A (zh) 1995-03-17 1998-05-20 诺沃挪第克公司 新的内切葡聚糖酶
EP0839186B1 (en) 1995-07-14 2004-11-10 Novozymes A/S A modified enzyme with lipolytic activity
AU6655196A (en) 1995-08-11 1997-03-12 Novo Nordisk A/S Novel lipolytic enzymes
CN1128875C (zh) 1995-08-11 2003-11-26 诺沃奇梅兹有限公司 制备多肽变异体的方法
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US5763385A (en) 1996-05-14 1998-06-09 Genencor International, Inc. Modified α-amylases having altered calcium binding properties
DE69738079D1 (de) * 1996-07-24 2007-10-11 Meiji Seika Kaisha Systeme zur massenherstellung von proteinen oder peptiden durch mikroorganismen der gattung humicola
AU3938997A (en) 1996-08-26 1998-03-19 Novo Nordisk A/S A novel endoglucanase
EP0937138B1 (en) 1996-09-17 2006-04-26 Novozymes A/S Cellulase variants
EP0963192B1 (en) 1996-10-08 2003-01-08 Novozymes A/S Diaminobenzoic acid derivatives as dye precursors
US5919697A (en) * 1996-10-18 1999-07-06 Novo Nordisk A/S Color clarification methods
CN1530443A (zh) 1996-11-04 2004-09-22 ŵ����÷�����޹�˾ 枯草杆菌酶变异体和组合物
EP2278001B1 (en) 1996-11-04 2013-10-23 Novozymes A/S Protease variants and compositions
FI964692A0 (fi) * 1996-11-25 1996-11-25 Primalco Ltd Foerbaettrad cellulassammansaettning foer bioefterbehandling av textilmaterial som innehaoller cellulosa
CN1208456C (zh) 1996-12-20 2005-06-29 诺维信公司 体内重组
US6159731A (en) 1997-02-12 2000-12-12 Massachusetts Institute Of Technology Daxx, a Fas-binding protein that activates JNK and apoptosis
JPH10242147A (ja) 1997-02-27 1998-09-11 Toshiba Corp 半導体装置およびその製造方法ならびに半導体記憶装置およびその製造方法
CA2284097A1 (en) 1997-03-18 1998-09-24 Novo Nordisk A/S Shuffling of heterologous dna sequences
US6159688A (en) 1997-03-18 2000-12-12 Novo Nordisk A/S Methods of producing polynucleotide variants
US6159687A (en) 1997-03-18 2000-12-12 Novo Nordisk A/S Methods for generating recombined polynucleotides
AU7908898A (en) 1997-07-04 1999-01-25 Novo Nordisk A/S Family 6 endo-1,4-beta-glucanase variants and cleaning composit ions containing them
US6114158A (en) * 1998-07-17 2000-09-05 University Of Georgia Research Foundation, Inc. Orpinomyces cellulase celf protein and coding sequences
DK2295544T3 (en) * 2001-06-26 2016-09-26 Novozymes As Polypeptides with cellobiohydrolase I activity and the same coding polynucleotides

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101874109B (zh) * 2007-09-28 2013-07-10 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103068976A (zh) * 2009-11-06 2013-04-24 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN104169417A (zh) * 2009-12-01 2014-11-26 诺维信公司 具有葡糖淀粉酶活性的多肽及其编码多核苷酸
CN104169417B (zh) * 2009-12-01 2020-05-08 诺维信公司 具有葡糖淀粉酶活性的多肽及其编码多核苷酸
CN103517986A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103517985A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103620028A (zh) * 2011-01-26 2014-03-05 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103517986B (zh) * 2011-01-26 2016-12-07 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103517985B (zh) * 2011-01-26 2016-12-07 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103620028B (zh) * 2011-01-26 2017-05-03 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN110628803A (zh) * 2011-01-26 2019-12-31 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸

Also Published As

Publication number Publication date
US7867744B2 (en) 2011-01-11
US7348168B2 (en) 2008-03-25
EP1578964A2 (en) 2005-09-28
US20110081696A1 (en) 2011-04-07
ATE438711T1 (de) 2009-08-15
DK1578964T3 (da) 2009-11-23
EP1578964B2 (en) 2013-09-04
US20060053514A1 (en) 2006-03-09
CN101555472A (zh) 2009-10-14
DK1578964T4 (da) 2013-12-02
ES2331067T5 (es) 2013-12-26
US20080213835A1 (en) 2008-09-04
EP1578964B1 (en) 2009-08-05
WO2004056981A2 (en) 2004-07-08
ES2331067T3 (es) 2009-12-21
AU2003291962A1 (en) 2004-07-14
US8497109B2 (en) 2013-07-30
AU2003291962A8 (en) 2004-07-14
EP2128247A1 (en) 2009-12-02
DE60328715D1 (de) 2009-09-17
WO2004056981A3 (en) 2004-11-11

Similar Documents

Publication Publication Date Title
CN1729287A (zh) 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸
CN1620501A (zh) 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸
CN1509330A (zh) 具有纤维二糖酶活性的多肽和编码其的多核苷酸
CN1902310A (zh) 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸
CN1234854C (zh) 具有碱性α-淀粉酶活性的多肽以及编码该多肽的核酸
CN1211483C (zh) 具有分支酶活性的多肽及其编码核酸
CN1426470A (zh) Talaromyces emersonii的β-葡聚糖酶
US9000138B2 (en) Expression constructs comprising a Terebella lapidaria nucleic acid encoding a cellulase, host cells, and methods of making the cellulase
CN101031643A (zh) 具有α-葡糖苷酶活性的多肽及编码其的多核苷酸
CN101052721A (zh) Botryosphaeria Rhodina的多肽
CN1816631A (zh) β-葡糖苷酶的变体
CN1842596A (zh) 用于淀粉加工的酶
CN1137994C (zh) 具有葡聚糖转移酶活性的多肽和编码该多肽的核酸
CN1930285A (zh) 脂环酸芽孢杆菌的多肽

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication