CN101970651A - 用于降解纤维素材料的组合物 - Google Patents
用于降解纤维素材料的组合物 Download PDFInfo
- Publication number
- CN101970651A CN101970651A CN2008801013711A CN200880101371A CN101970651A CN 101970651 A CN101970651 A CN 101970651A CN 2008801013711 A CN2008801013711 A CN 2008801013711A CN 200880101371 A CN200880101371 A CN 200880101371A CN 101970651 A CN101970651 A CN 101970651A
- Authority
- CN
- China
- Prior art keywords
- seq
- polypeptide
- mature polypeptide
- sequence
- amino acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 65
- 239000000463 material Substances 0.000 title claims abstract description 57
- 230000000593 degrading effect Effects 0.000 title abstract description 3
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 1014
- 229920001184 polypeptide Polymers 0.000 claims abstract description 1005
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 1004
- 108010047754 beta-Glucosidase Proteins 0.000 claims abstract description 264
- 102000006995 beta-Glucosidase Human genes 0.000 claims abstract description 233
- 229920002678 cellulose Polymers 0.000 claims abstract description 133
- 239000001913 cellulose Substances 0.000 claims abstract description 133
- 241000499912 Trichoderma reesei Species 0.000 claims abstract description 120
- 238000000034 method Methods 0.000 claims abstract description 41
- 108010084185 Cellulases Proteins 0.000 claims abstract description 23
- 102000004190 Enzymes Human genes 0.000 claims abstract description 23
- 108090000790 Enzymes Proteins 0.000 claims abstract description 23
- 108010091371 endoglucanase 1 Proteins 0.000 claims abstract description 23
- 102000005575 Cellulases Human genes 0.000 claims abstract description 22
- 230000001461 cytolytic effect Effects 0.000 claims abstract description 18
- 108091033319 polynucleotide Proteins 0.000 claims description 315
- 102000040430 polynucleotide Human genes 0.000 claims description 315
- 239000002157 polynucleotide Substances 0.000 claims description 315
- 125000003729 nucleotide group Chemical group 0.000 claims description 272
- 239000002773 nucleotide Substances 0.000 claims description 270
- 235000001014 amino acid Nutrition 0.000 claims description 152
- 150000001413 amino acids Chemical class 0.000 claims description 150
- 108010059892 Cellulase Proteins 0.000 claims description 144
- 239000000835 fiber Substances 0.000 claims description 140
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 126
- 108090000623 proteins and genes Proteins 0.000 claims description 102
- 239000012634 fragment Substances 0.000 claims description 100
- 230000003197 catalytic effect Effects 0.000 claims description 92
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 claims description 85
- 235000018102 proteins Nutrition 0.000 claims description 54
- 102000004169 proteins and genes Human genes 0.000 claims description 53
- 230000004927 fusion Effects 0.000 claims description 44
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 42
- 238000000354 decomposition reaction Methods 0.000 claims description 34
- 230000002538 fungal effect Effects 0.000 claims description 34
- 239000002299 complementary DNA Substances 0.000 claims description 30
- 238000009396 hybridization Methods 0.000 claims description 28
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 26
- 229940088598 enzyme Drugs 0.000 claims description 22
- 230000000295 complement effect Effects 0.000 claims description 20
- 108010091384 endoglucanase 2 Proteins 0.000 claims description 13
- 108010092413 endoglucanase V Proteins 0.000 claims description 13
- 239000002253 acid Substances 0.000 claims description 7
- 238000000855 fermentation Methods 0.000 claims description 7
- 230000004151 fermentation Effects 0.000 claims description 7
- 238000001814 protein method Methods 0.000 claims description 3
- 241001495429 Thielavia terrestris Species 0.000 claims description 2
- 108090000371 Esterases Proteins 0.000 claims 2
- 108010029541 Laccase Proteins 0.000 claims 2
- 108091005804 Peptidases Proteins 0.000 claims 2
- 102000035195 Peptidases Human genes 0.000 claims 2
- 102000003992 Peroxidases Human genes 0.000 claims 2
- 229940059442 hemicellulase Drugs 0.000 claims 2
- 108010002430 hemicellulase Proteins 0.000 claims 2
- 108040007629 peroxidase activity proteins Proteins 0.000 claims 2
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 137
- 229940024606 amino acid Drugs 0.000 description 118
- 210000004215 spore Anatomy 0.000 description 114
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 86
- 239000002853 nucleic acid probe Substances 0.000 description 86
- 241000894006 Bacteria Species 0.000 description 59
- 125000000539 amino acid group Chemical group 0.000 description 49
- 230000000968 intestinal effect Effects 0.000 description 46
- 239000013612 plasmid Substances 0.000 description 45
- 108020004414 DNA Proteins 0.000 description 24
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 24
- 108020001507 fusion proteins Proteins 0.000 description 23
- 102000037865 fusion proteins Human genes 0.000 description 23
- 239000000523 sample Substances 0.000 description 22
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 21
- 210000004027 cell Anatomy 0.000 description 21
- 244000005700 microbiome Species 0.000 description 21
- 240000006439 Aspergillus oryzae Species 0.000 description 19
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 19
- 241000233866 Fungi Species 0.000 description 17
- 241000223258 Thermomyces lanuginosus Species 0.000 description 16
- 241001494489 Thielavia Species 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 230000002068 genetic effect Effects 0.000 description 15
- 230000007062 hydrolysis Effects 0.000 description 15
- 238000006460 hydrolysis reaction Methods 0.000 description 15
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 14
- 241000589516 Pseudomonas Species 0.000 description 14
- 241000223259 Trichoderma Species 0.000 description 14
- 230000001580 bacterial effect Effects 0.000 description 14
- 102000039446 nucleic acids Human genes 0.000 description 14
- 108020004707 nucleic acids Proteins 0.000 description 14
- 150000007523 nucleic acids Chemical class 0.000 description 14
- 241000193830 Bacillus <bacterium> Species 0.000 description 13
- 241000223218 Fusarium Species 0.000 description 12
- 241000228215 Aspergillus aculeatus Species 0.000 description 11
- 241001225321 Aspergillus fumigatus Species 0.000 description 11
- 229940091771 aspergillus fumigatus Drugs 0.000 description 11
- 230000001276 controlling effect Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 241000228212 Aspergillus Species 0.000 description 10
- 241000228245 Aspergillus niger Species 0.000 description 10
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 10
- 238000011160 research Methods 0.000 description 10
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 241000123346 Chrysosporium Species 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 230000008521 reorganization Effects 0.000 description 8
- 239000010902 straw Substances 0.000 description 8
- 241000605909 Fusobacterium Species 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- 229920002488 Hemicellulose Polymers 0.000 description 7
- 102000004157 Hydrolases Human genes 0.000 description 7
- 108090000604 Hydrolases Proteins 0.000 description 7
- 241000235395 Mucor Species 0.000 description 7
- 241000228143 Penicillium Species 0.000 description 7
- 241000187747 Streptomyces Species 0.000 description 7
- 240000008042 Zea mays Species 0.000 description 7
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 7
- 230000008034 disappearance Effects 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 6
- 240000007594 Oryza sativa Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 6
- 235000019441 ethanol Nutrition 0.000 description 6
- 125000003147 glycosyl group Chemical group 0.000 description 6
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 6
- 229910052737 gold Inorganic materials 0.000 description 6
- 239000010931 gold Substances 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 235000009973 maize Nutrition 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- 235000009566 rice Nutrition 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 239000002023 wood Substances 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 241001344131 Magnaporthe grisea Species 0.000 description 5
- 241001655322 Streptomycetales Species 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- -1 methane amide Chemical class 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 241000222518 Agaricus Species 0.000 description 4
- 241000223600 Alternaria Species 0.000 description 4
- 241001513093 Aspergillus awamori Species 0.000 description 4
- 241001480052 Aspergillus japonicus Species 0.000 description 4
- 241000351920 Aspergillus nidulans Species 0.000 description 4
- 241000223651 Aureobasidium Species 0.000 description 4
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 4
- 241000193752 Bacillus circulans Species 0.000 description 4
- 241000193749 Bacillus coagulans Species 0.000 description 4
- 241000193422 Bacillus lentus Species 0.000 description 4
- 241000194108 Bacillus licheniformis Species 0.000 description 4
- 241000194107 Bacillus megaterium Species 0.000 description 4
- 241000193388 Bacillus thuringiensis Species 0.000 description 4
- 241000221198 Basidiomycota Species 0.000 description 4
- 239000002028 Biomass Substances 0.000 description 4
- 241000193764 Brevibacillus brevis Species 0.000 description 4
- 241000589876 Campylobacter Species 0.000 description 4
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 4
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 4
- 101100016206 Cellvibrio japonicus (strain Ueda107) celC gene Proteins 0.000 description 4
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 4
- 241001674001 Chrysosporium tropicum Species 0.000 description 4
- 241000235457 Chytridium Species 0.000 description 4
- 241000221760 Claviceps Species 0.000 description 4
- 241000228437 Cochliobolus Species 0.000 description 4
- 229920000742 Cotton Polymers 0.000 description 4
- 241001362614 Crassa Species 0.000 description 4
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 4
- 229920002307 Dextran Polymers 0.000 description 4
- 241000935926 Diplodia Species 0.000 description 4
- 241000194033 Enterococcus Species 0.000 description 4
- 241000221433 Exidia Species 0.000 description 4
- 241000589565 Flavobacterium Species 0.000 description 4
- 241000223195 Fusarium graminearum Species 0.000 description 4
- 241000235649 Kluyveromyces Species 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- 241000186660 Lactobacillus Species 0.000 description 4
- 241000194036 Lactococcus Species 0.000 description 4
- 101100166758 Magnaporthe oryzae (strain 70-15 / ATCC MYA-4617 / FGSC 8958) cel12A gene Proteins 0.000 description 4
- 241001184659 Melanocarpus albomyces Species 0.000 description 4
- 241000226677 Myceliophthora Species 0.000 description 4
- 241000221960 Neurospora Species 0.000 description 4
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 4
- 241000194109 Paenibacillus lautus Species 0.000 description 4
- 241000123526 Peziza Species 0.000 description 4
- 101100172078 Phanerodontia chrysosporium Eg5A gene Proteins 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- 241000235402 Rhizomucor Species 0.000 description 4
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 4
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 4
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 4
- 241001123227 Saccharomyces pastorianus Species 0.000 description 4
- 101100284150 Salipaludibacillus agaradhaerens cel5A gene Proteins 0.000 description 4
- 241000607142 Salmonella Species 0.000 description 4
- 241000222480 Schizophyllum Species 0.000 description 4
- 241000235346 Schizosaccharomyces Species 0.000 description 4
- 241000191940 Staphylococcus Species 0.000 description 4
- 241000194017 Streptococcus Species 0.000 description 4
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- 241000194054 Streptococcus uberis Species 0.000 description 4
- 241000228341 Talaromyces Species 0.000 description 4
- 241001136494 Talaromyces funiculosus Species 0.000 description 4
- 241001540751 Talaromyces ruber Species 0.000 description 4
- 241000202898 Ureaplasma Species 0.000 description 4
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 4
- 241001507667 Volvariella Species 0.000 description 4
- 241001523965 Xylaria Species 0.000 description 4
- 229940054340 bacillus coagulans Drugs 0.000 description 4
- 229940097012 bacillus thuringiensis Drugs 0.000 description 4
- 238000006555 catalytic reaction Methods 0.000 description 4
- 210000002421 cell wall Anatomy 0.000 description 4
- 229940106157 cellulase Drugs 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 210000004209 hair Anatomy 0.000 description 4
- 229940039696 lactobacillus Drugs 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 229920001282 polysaccharide Polymers 0.000 description 4
- 239000005017 polysaccharide Substances 0.000 description 4
- 150000004804 polysaccharides Chemical class 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 229940115922 streptococcus uberis Drugs 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 3
- 240000000073 Achillea millefolium Species 0.000 description 3
- 235000007754 Achillea millefolium Nutrition 0.000 description 3
- 241000220433 Albizia Species 0.000 description 3
- 241001112741 Bacillaceae Species 0.000 description 3
- 241000193747 Bacillus firmus Species 0.000 description 3
- 241000194103 Bacillus pumilus Species 0.000 description 3
- 229920000018 Callose Polymers 0.000 description 3
- 241001057137 Chaetomium fimeti Species 0.000 description 3
- 241001674013 Chrysosporium lucknowense Species 0.000 description 3
- 241000355696 Chrysosporium zonatum Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 241000222511 Coprinus Species 0.000 description 3
- 241001509964 Coptotermes Species 0.000 description 3
- 108010000912 Egg Proteins Proteins 0.000 description 3
- 102000002322 Egg Proteins Human genes 0.000 description 3
- 241000223924 Eimeria Species 0.000 description 3
- 241001063191 Elops affinis Species 0.000 description 3
- 235000002756 Erythrina berteroana Nutrition 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 241000223198 Humicola Species 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 241000222418 Lentinus Species 0.000 description 3
- 241000183011 Melanocarpus Species 0.000 description 3
- 241001451060 Poitrasia Species 0.000 description 3
- 240000005384 Rhizopus oryzae Species 0.000 description 3
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 3
- 241000190932 Rhodopseudomonas Species 0.000 description 3
- 241000223255 Scytalidium Species 0.000 description 3
- 241000194048 Streptococcus equi Species 0.000 description 3
- 241000187432 Streptomyces coelicolor Species 0.000 description 3
- 241000187392 Streptomyces griseus Species 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- 239000005864 Sulphur Substances 0.000 description 3
- 241000183053 Thielavia subthermophila Species 0.000 description 3
- 241000894525 Trichonympha Species 0.000 description 3
- 241000215642 Trichophaea Species 0.000 description 3
- 241000259813 Trichophaea saccata Species 0.000 description 3
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 3
- 229940005348 bacillus firmus Drugs 0.000 description 3
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 3
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 3
- 229960000846 camphor Drugs 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 235000019197 fats Nutrition 0.000 description 3
- 210000003495 flagella Anatomy 0.000 description 3
- 238000007834 ligase chain reaction Methods 0.000 description 3
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000010813 municipal solid waste Substances 0.000 description 3
- 210000004681 ovum Anatomy 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 238000004321 preservation Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 229920000936 Agarose Polymers 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 101100494262 Caenorhabditis elegans best-12 gene Proteins 0.000 description 2
- 241000259840 Chaetomidium Species 0.000 description 2
- 241000221955 Chaetomium Species 0.000 description 2
- 241000675108 Citrus tangerina Species 0.000 description 2
- 241000259811 Cladorrhinum foecundissimum Species 0.000 description 2
- 241001252397 Corynascus Species 0.000 description 2
- 108010062466 Enzyme Precursors Proteins 0.000 description 2
- 102000010911 Enzyme Precursors Human genes 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- 241001480714 Humicola insolens Species 0.000 description 2
- 241000006384 Jeotgalibacillus marinus Species 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 241000228456 Leptosphaeria Species 0.000 description 2
- 241000123315 Meripilus Species 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 101100112955 Podospora anserina (strain S / ATCC MYA-4624 / DSM 980 / FGSC 10383) CEL6C gene Proteins 0.000 description 2
- 241000222640 Polyporus Species 0.000 description 2
- 229920001131 Pulp (paper) Polymers 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000228178 Thermoascus Species 0.000 description 2
- 241000203780 Thermobifida fusca Species 0.000 description 2
- 241001100181 Thermothelomyces heterothallica Species 0.000 description 2
- 235000009754 Vitis X bourquina Nutrition 0.000 description 2
- 235000012333 Vitis X labruscana Nutrition 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 229920002000 Xyloglucan Polymers 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010364 biochemical engineering Methods 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000002361 compost Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005336 cracking Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 230000028023 exocytosis Effects 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000010893 paper waste Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000010908 plant waste Substances 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- JQFLYFRHDIHZFZ-RXMQYKEDSA-N (2s)-3,3-dimethylpyrrolidine-2-carboxylic acid Chemical compound CC1(C)CCN[C@@H]1C(O)=O JQFLYFRHDIHZFZ-RXMQYKEDSA-N 0.000 description 1
- CNPSFBUUYIVHAP-AKGZTFGVSA-N (2s)-3-methylpyrrolidine-2-carboxylic acid Chemical compound CC1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-AKGZTFGVSA-N 0.000 description 1
- VOYXMQFJDIVEQN-UHFFFAOYSA-N 1,3-thiazolidine-2-carboxylic acid Chemical compound S1C(NCC1)C(=O)O.S1C(NCC1)C(=O)O VOYXMQFJDIVEQN-UHFFFAOYSA-N 0.000 description 1
- OMGHIGVFLOPEHJ-UHFFFAOYSA-N 2,5-dihydro-1h-pyrrol-1-ium-2-carboxylate Chemical compound OC(=O)C1NCC=C1 OMGHIGVFLOPEHJ-UHFFFAOYSA-N 0.000 description 1
- IFBHRQDFSNCLOZ-UHFFFAOYSA-N 2-(hydroxymethyl)-6-(4-nitrophenoxy)oxane-3,4,5-triol Chemical compound OC1C(O)C(O)C(CO)OC1OC1=CC=C([N+]([O-])=O)C=C1 IFBHRQDFSNCLOZ-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- 241001134630 Acidothermus cellulolyticus Species 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241001507831 Aspergillus avenaceus Species 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241000122821 Aspergillus kawachii Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101150020139 CEL6B gene Proteins 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 241000146399 Ceriporiopsis Species 0.000 description 1
- 241001556045 Chrysosporium merdarium Species 0.000 description 1
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 1
- 241000233652 Chytridiomycota Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241001085790 Coprinopsis Species 0.000 description 1
- 241000221755 Cryphonectria Species 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101710178122 Endoglucanase 4 Proteins 0.000 description 1
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 206010016590 Fibrin deposition on lens postoperative Diseases 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 241000726221 Gemma Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 240000001080 Grifola frondosa Species 0.000 description 1
- 235000007710 Grifola frondosa Nutrition 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000223199 Humicola grisea Species 0.000 description 1
- 241000223200 Humicola grisea var. thermoidea Species 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 101150017040 I gene Proteins 0.000 description 1
- 101150062179 II gene Proteins 0.000 description 1
- 101150098499 III gene Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- 241000222342 Irpex Species 0.000 description 1
- 241000222344 Irpex lacteus Species 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- KKJQZEWNZXRJFG-UHFFFAOYSA-N L-trans-4-Methyl-2-pyrrolidinecarboxylic acid Chemical compound CC1CNC(C(O)=O)C1 KKJQZEWNZXRJFG-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000222435 Lentinula Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 229920002097 Lichenin Polymers 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241001072230 Oceanobacillus Species 0.000 description 1
- 241001496963 Penicillium brasilianum Species 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241000422444 Piromyces equi Species 0.000 description 1
- 241000383860 Pseudoplectania Species 0.000 description 1
- 241001497658 Pseudotrichonympha Species 0.000 description 1
- 241000959173 Rasamsonia emersonii Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 241001215623 Talaromyces cellulolyticus Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241000228182 Thermoascus aurantiacus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241000183057 Thielavia microspora Species 0.000 description 1
- 241000182980 Thielavia ovispora Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- 240000006794 Volvariella volvacea Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000000544 articulatio talocruralis Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 210000003323 beak Anatomy 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 1
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002478 diastatic effect Effects 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 150000002303 glucose derivatives Chemical class 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000010813 internal standard method Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 239000002029 lignocellulosic biomass Substances 0.000 description 1
- 239000012978 lignocellulosic material Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 125000001424 substituent group Chemical class 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000005418 vegetable material Substances 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- 150000008498 β-D-glucosides Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2445—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/16—Preparation of compounds containing saccharide radicals produced by the action of an alpha-1, 6-glucosidase, e.g. amylose, debranched amylopectin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
- C12P7/10—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01004—Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01021—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01091—Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Abstract
本发明涉及用于降解或转化含纤维素材料的纤维素分解组合物,和产生与使用所述组合物的方法。所述组合物包含(a)具有增强纤维素分解的活性的多肽(b)β-葡糖苷酶和(c)选自下组的一个或多个纤维素分解酶:里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II和里氏木霉内切葡聚糖酶I,和它们的变体。
Description
对于在联邦赞助的研究与开发下进行发明的权利声明
本发明在能源部授予的主合同DE-AC36-98GO10337、NREL分合同No.ZCO-30017-02下得到政府支持。政府对于本发明拥有一定的权利。
对序列表的引用
本申请包含计算机可读格式的序列表。在此通过提述将该序列表并入。
对生物材料的保藏物的引用
本申请包含对生物材料的保藏物的引用,在此通过提述将所述保藏物并入。
发明背景
发明领域
本发明涉及用于降解或转化含纤维素材料的纤维素分解蛋白质组合物和产生与使用所述组合物的方法。
相关领域描述
纤维素是简单糖类葡萄糖通过β-1,4-键共价键合的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(openingit)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将纤维素原料转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的合意性,和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物已被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖将容易地由酵母发酵成乙醇。
WO 2005/074647披露了来自土生梭孢霉(Thielavia terrestris)的具有增强纤维素分解的活性(celluolytic enhancing activity)的分离的多肽及其多核苷酸。WO 2005/074656披露了来自桔橙嗜热霉(Thermoascus auranticaus)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。美国公开的申请系列号2007/0077630披露了来自里氏木霉(Trichoderma reesei)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。
本领域中的一个优势是提高纤维素分解蛋白质组合物降解或转化纤维素材料的能力。
本发明涉及降解或转化纤维素材料的能力改进的纤维素分解蛋白质组合物。
发明简述
本发明涉及丝状真菌宿主细胞,其包含:(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸;(b)编码天然或异源β-葡糖苷酶的第二多核苷酸;和(c)编码选自下组的天然或异源纤维素分解酶的一个或多个(几个)第三多核苷酸:里氏木霉纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。
本发明还涉及产生纤维素分解蛋白质组合物的方法,其包括:(a)在有益于产生该纤维素分解组合物的条件下培养这些丝状真菌宿主细胞;和(b)回收所述纤维素分解蛋白质组合物。本发明还涉及由这种方法获得的纤维素分解蛋白质组合物。
本发明还涉及纤维素分解蛋白质组合物,其包含:(a)具有增强纤维素分解的活性的多肽;(b)β-葡糖苷酶;和(c)选自下组的一种或多种(几种)纤维素分解酶:里氏木霉纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。
本发明还涉及用于降解或转化纤维素材料的方法,其包括:用有效量的这种纤维素分解蛋白质组合物处理纤维素材料。
本发明进一步涉及产生发酵产物的方法,其包括:(a)用有效量的这种纤维素分解蛋白质组合物糖化纤维素材料;(b)用一种或多种(几种)发酵微生物发酵步骤(a)中经糖化的纤维素材料,以产生发酵产物;和(c)从发酵液回收所述发酵产物。
附图简述
图1显示pMJ04的限制图谱。
图2显示pCaHj527的限制图谱。
图3显示pMT2188的限制图谱。
图4显示pCaHj568的限制图谱。
图5显示pMJ05的限制图谱。
图6显示pSMai130的限制图谱。
图7显示米曲霉(Aspergillus oryzae)β-葡糖苷酶天然信号序列的DNA序列和氨基酸序列(SEQ ID NO:91和92)。
图8显示特异腐质霉(Humicola insolens)内切葡聚糖酶V信号序列的DNA序列和氨基酸序列(SEQ ID NO:95和96)。
图9显示pSMai135的限制图谱。
图10显示pSMai140的限制图谱。
图11显示pSaMe-F1的限制图谱。
图12显示pSaMe-FX的限制图谱。
图13显示pAlLo47的限制图谱。
图14显示pSaMe-FH的限制图谱。
定义
增强纤维素分解的活性:术语“增强纤维素分解的活性”在本文定义为增强具有纤维素分解活性的蛋白对含纤维素材料的水解的生物活性。就本发明而言,通过测量与使用相等总蛋白加样量但不含增强纤维素分解的活性的对照水解(1-50mg的纤维素分解蛋白/g PCS(经预处理的玉米秸秆)中的纤维素)相比,来自在如下条件下纤维素分解蛋白对含纤维素材料的水解的还原糖增加或总的纤维二糖和葡萄糖的增加来确定增强纤维素分解的活性:1-50mg的总蛋白/g PCS中的纤维素,其包含80-99.5%w/w纤维素分解蛋白和0.5-20%w/w增强纤维素分解活性的蛋白,在50℃进行1-7天。在一个优选的方面,在3%米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或3%烟曲霉β-葡糖苷酶(根据WO 02/095014的实施例22在米曲霉中重组产生)的存在下 1.5L(Novozymes A/S,Bagsvaerd,Denmark)的混合物的纤 维素酶蛋白质加样量用作纤维素分解活性的标准物。
具有增强纤维素分解的活性的多肽具有SEQ ID NO:2、4、6、8、10、12或14的成熟多肽的增强纤维素分解的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。
所述具有增强纤维素分解的活性的多肽通过下述方式增强由具有纤维素分解活性的蛋白质所催化的含纤维素材料的水解:将达到相同水解程度所需要的纤维素分解酶量降低优选至少0.1倍,更优选至少0.2倍、更优选至少0.3倍、更优选至少0.4倍、更优选至少0.5倍、更优选至少1倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、更优选至少10倍、更优选至少20倍、甚至更优选至少30倍、最优选至少50倍、并且甚至最优选至少100倍。
纤维素分解活性:术语“纤维素分解活性”在本文定义为水解含纤维素材料的纤维素酶活性(如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合)。纤维素分解蛋白可水解或水解羧甲基纤维素(CMC),由此降低温育混合物的粘度。可以通过振动粘度计(vibration viscosimeter)(如来自法国Sofraser的MIVI 3000)测定所产生的粘度降低。纤维素酶活性的测定按照纤维素酶粘度单位(CEVU)来测量,所述测定通过测量样品降低羧甲基纤维素(CMC)溶液粘度的能力来定量该样品中存在的催化活性的量。该测定法在适于纤维素分解蛋白质和底物的温度和pH进行。
就本发明而言,通过测量与不加入纤维素分解蛋白的对照水解相比,在以下条件下纤维素分解组合物对含纤维素材料的水解的增加来测定纤维素分解活性:1-50mg纤维素分解蛋白/g PCS中的纤维素,在50℃进行1-7天。
内切葡聚糖酶:术语“内切葡聚糖酶”在本文中的定义为内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-(1,3;1,4)-β-D-glucan4-glucanohydrolase)(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉、混合的β-1,3葡聚糖如谷类β-D-葡聚糖或木葡聚糖中的β-1,4键和其它含有纤维素成分的植物材料中1,4-β-D-糖苷键的内水解。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268中的方法使用羧甲基纤维素(CMC)水解测定内切葡聚糖酶的活性。
纤维二糖水解酶:术语“纤维二糖水解酶”在本文中的定义为1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖或任何包含β-1,4- 连接的葡萄糖的聚合物中1,4-β-D葡糖苷键的水解,从链的还原端或非还原端释放纤维二糖。就本发明而言,根据Lever等,1972,Anal.Biochem.47:273-279和van Tilbeurgh等,1982,FEBS Letters 149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288所描述的方法测定纤维二糖水解酶的活性。在本发明中,使用Lever等方法来评估玉米秸秆中纤维素的水解,同时使用van Tilbeurgh等的方法来测定对于荧光二糖衍生物的纤维二糖水解酶活性。
β-葡糖苷酶:术语“β-葡糖苷酶”在本文定义为β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,并且释放β-D-葡萄糖。就本发明而言,根据Venturi等,2002,J.Basic Microbiol.42:55-66描述的基本方法来测定β-葡糖苷酶活性,只是采用如本文所述的不同的条件。将1单位的β-葡糖苷酶活性定义为在50℃、pH 5,从100mM柠檬酸钠、0.01% 20中作为底物的4mM对硝基苯基-β-D-葡萄吡喃糖苷每分钟产生1.0微摩尔对硝基苯酚。
家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61,或家族74糖苷水解酶:术语“家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61,或家族74糖苷水解酶”或“家族GH1、家族GH3、家族GH5、家族GH6、家族GH7、家族GH9、家族GH12、家族GH45、家族GH61,或家族GH74”在本文中定义为根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,和Henrissat B.,和Bairoch A.,1996,Updating thesequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696分别归入糖苷水解酶家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61,或家族74的多肽。目前,Henrissat将GH61家族列为未分类,说明对于属于此家族的多肽而言,诸如机制、催化亲核体/碱、催化质子供体和3-D结构等性质是未知的。
含纤维素材料:生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的多糖是半纤维素,而第三是果胶。在细胞停止生长之后产生的次生细胞壁也含有多糖,并且其通过与半纤维素共价交联的聚合木质素强化。纤维素是无水纤维二糖的均聚物,并且因此是线性的β-(1-4)-D-葡聚糖,而半纤维素在具有一系列取代基的复杂分支结构中包括多种化合物,例如木聚糖、木葡聚 糖、阿拉伯木聚糖和甘露聚糖。尽管通常是多形态的,纤维素在植物组织中主要作为平行葡聚糖链的不溶晶体基质存在。半纤维素通常与纤维素以及与其它半纤维素通过氢键连接,其帮助稳定细胞壁基质。
含纤维素材料可以是任何含纤维素的材料。纤维素通常存在于例如植物的茎、叶、果/种壳(hulls)、果/种皮(husks)、和穗轴(cob)中,或树的叶、枝和木材中。含纤维素材料可以是但不限于草本材料、农业残余物、林业残余物、市政固体废物、废纸和纸浆及造纸厂残余物。含纤维素材料可以是任意类型的生物质,其包括但不限于木材资源、市政固体废物、废纸、作物和作物残余物(参见,例如,Wiselogel等,1995,于Handbook on Bioethanol(Charles E.Wyman编)中,105-118页,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier等,1999,Recent Progress in Bioconversionof Lignocellulosics,于Advances in Biochemical Engineering/Biotechnology,T.Scheper,managing编,Volume 65,23-40页,Springer-Verlag,New York)。在本文中可理解的是含纤维素材料优选为木素纤维素的形式,例如,在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。
在优选的方面,含纤维素材料是玉米秸秆。在另一个优选的方面,含纤维素材料是玉米纤维。在另一个优选的方面,含纤维素材料是玉米穗轴。在另一个优选的方面,含纤维素材料是柳枝稷(switch grass)。在另一个优选的方面,含纤维素材料是稻草(rice straw)。在另一优选的方面,含纤维素材料是纸和纸浆加工废料。在另一优选的方面,含纤维素材料是木本或草本植物。在另一优选的方面,纤维素材料是蔗渣。
可以按原样使用含纤维素材料或可使用本领域已知的常规方法对含纤维素材料进行预处理。例如,物理预处理技术可包括多种类型的磨制、照射、汽蒸/蒸汽爆炸和水热解(hydrothermolysis);化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳和pH控制的水热解;而生物预处理技术可包括应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatmentof biomass,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212;Ghosh,P.,和Singh,A.,1993,Physicochemical and biological treatments for enzymatic/microbial conversion oflignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994, Pretreating lignocellulosic biomass:a review,in Enzymatic Conversion of Biomassfor Fuels Production,Himmel,M.E.,Baker,J.O.,和Overend,R.P.编,ACSSymposium Series 566,American Chemical Society,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production fromrenewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson,L.,和Hahn-Hagerdal,B.,1996,Fermentation of lignocellulosic hydrolysates forethanol production,Enz.Microb.Tech.18:312-331;以及Vallander,L.,和Eriksson,K.-E.L.,1990,Production of ethanol from lignocellulosic materials:State of theart,Adv.Biochem.Eng./Biotechnol.42:63-95)。
预处理的玉米秸秆:术语“PCS”或“预处理的玉米秸秆”在本文中的定义为源自通过热和稀酸处理的玉米秸秆的含纤维素的材料。就本发明而言,PCS由本文所述方法产生。
全长多肽:术语“全长多肽”在本文定义为具有生物活性的多肽的前体形式,其中所述前体包含信号肽区域,或者还包含前肽区,其中一旦从细胞分泌,信号肽即被切割,或者前肽也被切割,得到具有生物活性的多肽。
信号肽:术语“信号肽”在本文定义为以符合读框的方式连接至多肽的氨基末端并指导编码的多肽进入细胞的分泌途径的肽。
信号肽编码序列:术语“信号肽编码序列”在本文定义为肽编码区,其编码以符合读框的方式连接至多肽的氨基末端并指导编码的多肽进入细胞的分泌途径的氨基酸序列。
前肽:术语“前肽”在本文定义为以符合读框的方式连接至多肽的氨基末端的肽。得到的多肽称作前酶或前多肽(或者在一些情况中为酶原)。前多肽通常没有活性,并且可以通过前肽的催化或自催化裂解由前多肽转化为成熟活性多肽。当多肽的氨基末端同时存在信号肽和前肽区时,前肽区以符合读框的方式连接至多肽的氨基末端,并且信号肽以符合读框的方式连接至前肽区的氨基末端。
前肽编码序列:术语“前肽编码序列”在本文定义为肽编码区,其编码以符合读框的方式连接至多肽的氨基末端的氨基酸序列,形成前酶或前多肽(或者在一些情况中为酶原)。
催化域:术语“催化域”在本文定义为β-葡糖苷酶或内切葡聚糖酶的氨 基序列的结构部分或区域,其具有β-葡糖苷酶或内切葡聚糖酶的催化活性。
β-葡糖苷酶融合蛋白:术语“β-葡糖苷酶融合蛋白”在本文定义为表现出β-葡糖苷酶活性并至少包含β-葡糖苷酶催化域和内切葡聚糖酶催化域的多肽。
β-葡糖苷酶融合蛋白的组件:术语“β-葡糖苷酶融合蛋白的组件”在本文定义为β-葡糖苷酶融合蛋白的个体(切割的)片段,其中每个片段都具有β-葡糖苷酶活性,并且包括内切葡聚糖酶和β-葡糖苷酶催化域或者融合蛋白的β-葡糖苷酶催化域。例如,在融合蛋白的内切葡聚糖酶和β-葡糖苷酶组件之间存在裂解位点,例如,Kex2位点,能够导致产生具有内切葡聚糖酶活性的多肽和另一个具有β-葡糖苷酶活性的多肽。
纤维素结合域:术语“纤维素结合域(CBD)”在本文定义为内切葡聚糖酶(纤维素酶)的部分氨基酸序列,其与内切葡聚糖酶的纤维素结合活性有关。纤维素结合域通常通过将内切葡聚糖酶非共价连接至纤维素、纤维素衍生物,或其多糖等同物而发挥作用。CBD通常独立于催化域发挥作用。
β-葡糖苷酶融合构建体:“术语β-葡糖苷酶融合构建体”指由可操作连接的不同基因或其部分组成的核酸构建体。组件从5’末端开始包括至少包含内切葡聚糖酶催化域的DNA分子,和至少包含β-葡糖苷酶催化域的DNA分子。
分离的多肽:术语“分离的多肽”用于本文中指的是从来源分离的多肽。在优选的方面,如通过SDS-PAGE测定的,多肽至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,以及最优选至少90%纯。
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的(associated)或重组结合的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式,即,所述多肽制备物基本上(essentially)不含与其天然结合的或重组结合的其它多肽材料。这能够通过以下方法实现, 例如,通过公知的重组方法或由经典纯化方法制备多肽。
成熟多肽:术语“成熟多肽”在本文中定义为具有生物活性(如酶活性)的多肽,所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码具有生物活性的成熟多肽的核苷酸序列。
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定,优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分(gap open penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记为“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且计算如下:
(相同的残基×100)/(比对的长度-比对中的缺口总数)
就本发明而言,两个脱氧核糖核酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定,优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分10,缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记为“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算:
(相同的脱氧核糖核苷酸×100)/(比对的长度-比对中的缺口总数)
同源序列:术语“同源序列”在本文定义为使用blastp(用于蛋白质数据库)或tblastn(用于核酸数据库)算法,及BLOSUM62矩阵、字长(wordsize)3、缺口存在分值(gap existence cost)11、缺口延伸分值(gap extension cost)1、无低复杂性过滤并且使用成熟蛋白序列作为查询对象时,E值(或期望得分(expectancy score))小于0.001的序列。参见Altschul等,1997,Nucleic Acids Res.25:3389-3402。
多肽片段:术语“多肽片段”在本文中定义为从成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽,或者其同源序列;其中所述片段具有其成熟多肽的活性。
亚序列:术语“亚序列(subsequence)”在本文中定义为从成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列,或其同源序列;其中所述亚序列编码具有其成熟多肽的活性的多肽片段。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸:术语“分离的多核苷酸”用于本文中指与来源分离的多核苷酸。在优选的方面,如通过琼脂糖电泳测定的,所述多核苷酸为至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,以及最优选至少90%纯。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式,即,所述多核苷酸制备物基本上不含与其天然结合的或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任意组合。
cDNA:术语“cDNA”在本文中定义为能够通过逆转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA 的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的或者合成的基因,或所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式被修饰以含有核酸的片段,或所述核酸分子是合成的。当所述核酸构建体含有表达本发明中的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”在本文定义为包括对于本发明中编码多肽的多核苷酸的表达是必需的所有组分。各调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的合适位置,使得调控序列指导多肽的编码序列的表达。
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框确定,所述开读框通常以ATG起始密码子或可选的起始密码子例如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于用包含多核苷酸的核酸构建体或表达载体的转化、转染、转 导等是易感的(susceptible)。
修饰:术语“修饰”在本文的意思是,对成熟多肽或其同源序列的任何化学修饰,以及对编码这种多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多个(几个)氨基酸侧链的取代。
人工变体:当用在本文时,术语“人工变体”的意思是由表达成熟多肽编码序列的修饰的核苷酸序列或其同源序列的生物体产生的多肽。所述修饰的核苷酸序列通过人为干预(human intervention),通过修饰多核苷酸序列或其同源序列来获得。
发明详述
本发明涉及丝状真菌宿主细胞,其包含:(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸;(b)编码天然或异源β-葡糖苷酶的第二多核苷酸;和(c)编码选自下组的天然或异源的一个或多个(几个)纤维素分解酶的一个或多个(几个)第三多核苷酸:里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。
本发明还涉及产生纤维素分解蛋白质组合物的方法,其包括:(a)有益于产生所述纤维素分解蛋白质组合物的条件下培养这样的丝状真菌宿主细胞;和(b)回收所述纤维素分解蛋白质组合物。本发明还涉及由这种方法获得的纤维素分解蛋白质组合物。
本发明还涉及纤维素分解蛋白质组合物,其包含:(a)具有增强纤维素分解的活性的多肽;(b)β-葡糖苷酶;和(c)选自下组的一个或多个(几个)纤维素分解酶:里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。
在优选的方面,丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。在优选的方面,丝状真菌宿主细胞是里氏木霉,特别是里氏木霉 RutC30。
在另一个优选的方面,丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步产生选自下组的一个或多个(几个)酶:SEQ ID NO:58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)。在另一个优选的方面,丝状真菌宿主细胞是里氏木霉,特别是里氏木霉RutC30。
在另一个优选的方面,丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且还产生SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。在另一个优选的方面,丝状真菌宿主细胞是里氏木霉,特别是里氏木霉RutC30。
在另一个优选的方面,丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步产生(1)选自下组的一个或多个(几个)酶:SEQ IDNO:58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A),和/或(2)还产生SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。在另一个优选的方面,丝状真菌宿主细胞是里氏木霉,特别是里氏木霉RutC30。
在另一个优选的方面,纤维素分解蛋白质组合物包含:SEQ ID NO:8的 成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。
在另一个优选的方面,纤维素分解蛋白质组合物包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步包含选自下组的一个或多个(几个)酶:SEQ ID NO:58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)。
在另一个优选的方面,纤维素分解蛋白质组合物包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步包含SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。
在另一个优选的方面,纤维素分解蛋白质组合物包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步包含(1)选自下组的一个或多个(几个)酶:SEQ ID NO:58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A),和/或(2)还包含SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。
具有增强纤维素分解的活性的多肽及其多核苷酸
用于处理含纤维素材料的具有增强纤维素分解的活性的任何多肽可以在 本发明的组合物中使用。编码具有增强纤维素分解的活性的这种多肽的多核苷酸能用于产生组合物。
在第一方面,具有增强纤维素分解的活性的分离的多肽包含以下基序(motif):
[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV],
其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸,并且X(4)是在4个邻接位置上的任何氨基酸。
包含上述基序的分离的多肽可进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸,并且X(2)是在2个邻接位置上的任何氨基酸。在上述基序中,采用公认的IUPAC单字母氨基酸缩写。
在优选的实施方案中,具有增强纤维素分解的活性的分离的多肽进一步包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]。在另一个优选的实施方案中,具有增强纤维素分解的活性的分离的多肽还包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一个优选的实施方案中,具有增强纤维素分解的活性的分离的多肽还包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。
在第二方面,具有增强纤维素分解的活性的分离的多肽包含以下基序:
[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ],
其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸,并且x(3)是在3个邻接位置上的任何氨基酸。在以上基序中,采用公认的IUPAC单字母氨基酸缩写。
在第三个方面,具有增强纤维素分解的活性的分离的多肽包含或组成为与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ IDNO:10,SEQ ID NO:12,或SEQ ID NO:14的成熟多肽具有优选至少60%, 更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度的氨基酸序列,其具有增强纤维素分解的活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽包含或组成为与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10,SEQ ID NO:12,或SEQ ID NO:14的成熟多肽相差十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸,并且甚至最优选一个氨基酸的氨基酸序列。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:2的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:2的成熟多肽。在另一个优选的方面,所述多肽包含SEQ IDNO:2的氨基酸20至326,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:2的氨基酸20至326。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸序列或其等位变体;或者由它们具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸20至326或其等位变体;或它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸20至326组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:4的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:4的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:4的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:4的氨基酸18至240,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:4的氨基酸18至240。在另一个优选的方面,所述多肽由SEQ ID NO:4的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:4的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:4的成熟多肽组成。在另一个优选的方 面,所述多肽由SEQ ID NO:4的氨基酸18至240或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:4的氨基酸18至240组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:6的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:6的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:6的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:6的氨基酸20至258,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:6的氨基酸20至258。在另一个优选的方面,所述多肽由SEQ ID NO:6的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:6的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:6的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:6的氨基酸20至258或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:6的氨基酸20至258组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:8的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:8的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:8的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:8的氨基酸19至226,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:8的氨基酸19至226。在另一个优选的方面,所述多肽由SEQ ID NO:8的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:8的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:8的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:8的氨基酸19至226或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:8的氨基酸19至226组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:10的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的 方面,所述多肽包含SEQ ID NO:10的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:10的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:10的氨基酸20至304,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:10的氨基酸20至304。在另一个优选的方面,所述多肽由SEQ ID NO:10的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:10的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:10的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:10的氨基酸20至304或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:10的氨基酸20至304组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:12的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:12的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:12的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:12的氨基酸23至250,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:12的氨基酸23至250。在另一个优选的方面,所述多肽由SEQ ID NO:12的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:12的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:12的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:12的氨基酸23至250或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:12的氨基酸23至250组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:14的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:14的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:14的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:14的氨基酸20至249,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:14的氨基酸20至249。在另一个优选的方面,所述多肽由SEQ ID NO:14的 氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:14的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:14的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:14的氨基酸20至249或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:14的氨基酸20至249组成。
优选地,SEQ ID NO:2的成熟多肽的片段包含至少277个氨基酸残基,更优选地至少287个氨基酸残基,并且最优选至少297个氨基酸残基。优选地,SEQ ID NO:4的成熟多肽的片段包含至少185个氨基酸残基,更优选地至少195个氨基酸残基,并且最优选至少205个氨基酸残基。优选地,SEQ IDNO:6的成熟多肽的片段包含至少200个氨基酸残基,并且优选地至少212个氨基酸残基,并且最优选至少224个氨基酸残基。优选地,SEQ ID NO:8的成熟多肽的片段包含至少175个氨基酸残基,更优选地至少185个氨基酸残基,并且最优选至少195个氨基酸残基。优选地,SEQ ID NO:10的成熟多肽的片段包含至少240个氨基酸残基,更优选地至少255个氨基酸残基,并且最优选至少270个氨基酸残基。优选地,SEQ ID NO:12的成熟多肽的片段包含至少175个氨基酸残基,更优选地至少190个氨基酸残基,并且最优选至少205个氨基酸残基。优选地,SEQ ID NO:14的成熟多肽的片段包含至少200个氨基酸残基,更优选地至少210个氨基酸残基,并且最优选至少220个氨基酸残基。
优选地,SEQ ID NO:1的成熟多肽编码序列的亚序列包含至少831个核苷酸,更优选地至少861个核苷酸,并且最优选至少891个核苷酸。优选地,SEQ ID NO:3的成熟多肽编码序列的亚序列包含至少555个核苷酸,更优选地至少585个核苷酸,并且最优选至少615个核苷酸。优选地,SEQ ID NO:5的成熟多肽编码序列的亚序列包含至少600个核苷酸,更优选地至少636个核苷酸,并且最优选至少672个核苷酸。优选地,SEQ ID NO:7的成熟多肽编码序列的亚序列包含至少525个核苷酸,更优选地至少555个核苷酸,并且最优选至少585个核苷酸。优选地,SEQ ID NO:9的成熟多肽编码序列的亚序列包含至少720个核苷酸,更优选地至少765个核苷酸,并且最优选至少810个核苷酸。优选地,SEQ ID NO:11的成熟多肽编码序列的亚序列包含至少525个核苷酸,更优选地至少570个核苷酸,并且最优选至少615个核 苷酸。优选地,SEQ ID NO:13的成熟多肽编码序列的亚序列包含至少600个核苷酸,更优选地至少630个核苷酸,并且最优选至少660个核苷酸。
在第四方面,具有增强纤维素分解的活性的分离的多肽由包含下述核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或者(iv)(i)、(ii)或(iii)的全长互补链(J J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,NewYork)。SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有增强纤维素分解的活性的多肽片段。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332、SEQ ID NO:3的核苷酸98至821、SEQ ID NO:5的核苷酸126至978、SEQ ID NO:7的核苷酸55至678、SEQ ID NO:9的核苷酸58至912、SEQ ID NO:11的核苷酸67至796,或SEQ ID NO:13的核苷酸77至766。
SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的核苷酸序列或其亚序列,以及SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的氨基酸序列或其片段,可以用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有增强纤维素分解的活性的多肽的DNA。尤其,这样的探针可用于根据标准Southern印迹程序与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中相应的目的基因。这样的探针可能比整个序列短很多,但是其长度应该是至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针的长度为至少100个核苷酸。例如,核酸探针的长度可为至少200个核苷酸, 优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以用更长的探针,例如,长度为至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针都可以使用。通常将探针加以标记用于检测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针都包含在本发明中。
因而,可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有增强纤维素分解的活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术来分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至并固定在硝化纤维素(nitrocellulose)或其它合适的载体材料上。为了鉴定与SEQ ID NO:1或其亚序列同源的克隆或DNA,优选将所述载体材料用在Sounthern印迹中。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,它的全长互补链或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与所述核酸探针杂交的分子。
在优选的方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:1的核苷酸388至1332。在另一优选的方面,核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:1。在另一优选的方面,核酸探针是包含于大肠杆菌(E.coli)NRRL B-30699中的质粒pEJG120所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30699中的质粒pEJG120所包含的成熟多肽编码区。
在另一优选的方面,核酸探针是SEQ ID NO:3的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:3的核苷酸98至821。在另一优选 的方面,核酸探针是编码SEQ ID NO:4的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:3。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30813中的质粒pTter61C所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30813中的质粒pTter61C所包含的成熟多肽编码区。
在另一优选的方面,核酸探针是SEQ ID NO:5的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:5的核苷酸126至978。在另一优选的方面,核酸探针是编码SEQ ID NO:6的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:5。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30812中的质粒pTter61D所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30812中的质粒pTter61D所包含的成熟多肽编码区。
在另一优选的方面,核酸探针是SEQ ID NO:7的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:7的核苷酸55至678。在另一个、优选的方面,核酸探针是编码SEQ ID NO:8的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:7。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30814中的质粒pTter61E所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30814中的质粒pTter61E所包含的成熟多肽编码区。
在另一优选的方面,核酸探针是SEQ ID NO:9的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:9的核苷酸58至912。在另一优选的方面,核酸探针是编码SEQ ID NO:10的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:9。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30811中的质粒pTter61G所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30811中的质粒pTter61G所包含的成熟多肽编码区。
在另一优选的方面,核酸探针是SEQ ID NO:11的成熟多肽编码序列。 在另一优选的方面,核酸探针是SEQ ID NO:11的核苷酸67至796。在另一优选的方面,核酸探针是编码SEQ ID NO:12的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:11。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选方面,核酸探针是包含于大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的成熟多肽编码区。
在另一优选的方面,核酸探针是SEQ ID NO:13的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:13的核苷酸77至766。在另一优选的方面,核酸探针是编码SEQ ID NO:14的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:13。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30878中的质粒pTr333所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30878中的质粒pTr333所包含的成熟多肽编码区。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42℃,在5X SSPE、0.3% SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2% SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比根据Bolton和McCarthy计算法(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5% NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasicphosphate),0.1mM ATP和0.2mg每ml的酵母RNA中,根据标准的Southern 印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在比计算的Tm低5℃至10℃的温度下在6×SSC加0.1% SDS中洗涤一次15分钟,并用6×SSC洗涤两次,每次15分钟。
在第五方面,具有增强纤维素分解的活性的分离的多肽由包含或组成为如下核苷酸序列的多核苷酸编码,所述核苷酸序列与SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQID NO:13的成熟多肽编码序列具有优选至少60%的序列同一性程度,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其编码具有增强纤维素分解的活性的活性多肽。
在优选的方面,成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332,SEQ ID NO:3的核苷酸98至821,SEQ ID NO:5的核苷酸126至978,SEQID NO:7的核苷酸55至678,SEQ ID NO:9的核苷酸58至912,SEQ ID NO:11的核苷酸67至796,或SEQ ID NO:13的核苷酸77至766。参见本文中多核苷酸部分。
在第六方面,具有增强纤维素分解的活性的分离的多肽是人工变体,所述人工变体在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽,或其同源序列中包含一个或多个(几个)氨基酸的取代、缺失和/或插入。优选氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸(如多组氨酸区(poly histidine tract)、抗原表位(antigenic epitope)或结合域(bindingdomain))。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。 通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20个标准氨基酸,可以以非标准的氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)取代野生型多肽的氨基酸残基。可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变导入到分子中的每个残基,并且测试所得突变分子的生物活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。也可通过分析与本发明多肽的相关多肽的同一性来推断必需氨基酸的身份。
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991, Biochem.30:10832-10837;美国专利No.5,223,409;WO 92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速确定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。
SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
具有增强纤维素分解的活性的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是由核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。
具有增强纤维素分解的活性的多肽可以是细菌多肽。例如,多肽可以是革兰氏阳性细菌的多肽,如具有增强纤维素分解的活性的芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus),或海洋芽孢菌属(Oceanobacillus)多肽,或革兰氏阴性细菌的多肽,如具有增强纤维素分解的活性的大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽。
在优选的方面,多肽是具有增强纤维素分解的活性的嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌 (Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis),或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。
在另一个优选的方面,多肽是具有增强纤维素分解的活性的似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。
在另一个优选的方面,多肽是具有增强纤维素分解的活性的不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus),或浅青紫链霉菌(Streptomyces lividans)多肽。
具有增强纤维素分解的活性的多肽还可以是具有增强纤维素分解的活性的真菌多肽,并且更优选是酵母多肽,如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选是具有增强纤维素分解的活性的丝状真菌多肽,如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑胶菌属(Exidia)、Filibasidium、镰孢属(Fusarium)、全鞭毛虫属(Holomastigotorides)、腐质霉属(Humicola)、耙菌属(Irpex)、香菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、亚灰树花菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱霉属(Scytalidium)、踝节菌属(Talaromyces)、嗜热霉属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、草菇属(Volvariella)或炭角菌属(Xylaria)多肽。
在优选的方面,多肽是具有增强纤维素分解的活性的卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽。
在另一优选的方面,多肽是具有增强纤维素分解的活性的解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、粪状金孢子菌(Chrysosporium merdarium)、Chrysosporium inops、Chrysosporium pannicola、昆士兰金孢子菌(Chrysosporium queenslandicum)、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusariumvenenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、乳白耙菌(Irpex lacteus)、米赫毛霉(Mucormiehie)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、微孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢霉、哈茨木霉 (Trichoderma harzianum)、康宁木霉(Trichoderma koningji)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉、绿色木霉(Trichoderma viride)或Trichophaea saccata多肽。
在更优选的方面,多肽是具有增强纤维素分解的活性的土生梭孢霉多肽。在最优选的实施方案中,多肽是具有增强纤维素分解的活性的土生梭孢霉NRRL 8126多肽,例如,SEQ ID NO:2、4、6、8或10的成熟多肽,或其具有增强纤维素分解的活性的片段。
在另一更优选的方面,多肽是具有增强纤维素分解的活性的桔橙嗜热霉(Thermoascus aurantiacus)多肽,例如,SEQ ID NO:12的成熟多肽。
在另一更优选的方面,多肽是具有增强纤维素分解的活性的里氏木霉多肽。在另一最优选的方面,多肽是具有增强纤维素分解的活性的里氏木霉RutC30(ATCC 56765)多肽,例如,SEQ ID NO:14的成熟多肽,或其具有增强纤维素分解的活性的片段。
可理解的是对于前述的物种,本发明包含完全和不完全阶段(perfect andimperfect states)两者,和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。
这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心,北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域公知的。然后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术来分离或克隆所述多核苷酸(参见,例如,Sambrook等,1989,见上文)。
具有增强纤维素分解的活性的多肽还可以包括融合多肽或可切割的融合多 肽,其中将另一种多肽融合到所述具有增强纤维素分解的活性的多肽或其片段的N末端或C末端。通过将编码另一种多肽的核苷酸序列(或其部分)融合于编码具有增强纤维素分解的活性的多肽的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。
关于具有增强纤维素分解的活性的多肽及其多核苷酸的详细信息,参见WO 2005/074647、WO 2005/074656,和美国公开申请系列号2007/0077630,所述文献通过提述并入本文。
可以分离包含核苷酸序列(其编码具有增强纤维素分解的活性的多肽)的多核苷酸并用于实施本发明的方法,如本文所述。
多核苷酸包含或组成为如下核苷酸序列,所述核苷酸序列与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的同一性程度,其编码具有增强纤维素分解的活性的多肽。
在优选的方面,核苷酸序列包含或组成为SEQ ID NO:1。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30699中的质粒pEJG120所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ IDNO:1的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30699中的质粒pEJG120所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:2的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:1。本发明还涉及SEQ ID NO:1的亚序列,其编码SEQ ID NO:2的具有增强纤维素分解的活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:3。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30813中的质粒pTter61C所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:3的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30813中的质粒pTter61C所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:4的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:3。本发明还涉及SEQ ID NO:3的亚序列,其编码SEQ ID NO:4的具有增强纤维素分解的活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:5。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30812中的质粒pTter61D所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:5的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30812中的质粒pTter61D所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:6的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:5。本发明还涉及SEQ ID NO:5的亚序列,其编码SEQ ID NO:6的具有增强纤维素分解的活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:7。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30814中的质粒pTter61E所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:7的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30814中的质粒pTter61E所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:8的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:7。本发明还涉及SEQ ID NO:7的亚序列,其编码SEQ ID NO:8的具有增强纤维素分解的活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:9。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30811中的质粒pTter61G所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:9的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30811中的质粒pTter61G所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:10的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:9。本发明还涉及SEQ ID NO:9的亚序列,其编码SEQ ID NO:10的具有增强纤维素分解的活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:11。在另一更 优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:11的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:12的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:11。本发明还涉及SEQ ID NO:11的亚序列,其编码SEQ ID NO:12的具有增强纤维素分解的活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:13。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30878中的质粒pTr3337所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:13的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30878中的质粒pTr3337所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:14的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:13。本发明还涉及SEQ ID NO:13的亚序列,其编码SEQ ID NO:14的具有增强纤维素分解的活性的片段。
本发明还涉及在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸20至326,SEQ ID NO:4的氨基酸18至240,SEQ ID NO:6的氨基酸20至258,SEQ ID NO:8的氨基酸19至226,或SEQID NO:10的氨基酸20至304,SEQ ID NO:12的氨基酸23至250,或SEQ IDNO:14的氨基酸20至249。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332、SEQ ID NO:3的核苷酸98至821、SEQID NO:5的核苷酸126至978、SEQ ID NO:7的核苷酸55至678、SEQ ID NO:9的核苷酸58至912、SEQ ID NO:11的核苷酸67至796,或SEQ ID NO:13的核苷酸77至766。
如前所述,用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知 的,并包括从基因组DNA分离,从cDNA制备,或其组合。
多肽还可以包含多核苷酸,所述多核苷酸包含或组成为核苷酸序列,所述核苷酸序列编码具有增强纤维素分解的活性的多肽,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中等严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高的严紧条件下,与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332,SEQ ID NO:3的核苷酸98至821,SEQ ID NO:5的核苷酸126至978,SEQ ID NO:7的核苷酸55至678,SEQ ID NO:9的核苷酸58至912,SEQ ID NO:11的核苷酸67至796,或SEQ ID NO:13的核苷酸77至766。
β-葡糖苷酶及其多核苷酸
用于处理含纤维素材料的具有β-葡糖苷酶活性的任何多肽可以是本发明的组合物的组件。编码这种具有β-葡糖苷酶活性的多肽的多核苷酸可以用于产生所述组合物。
在第一方面,具有β-葡糖苷酶活性的分离的多肽包含或组成为如下氨基酸序列,所述氨基酸序列与SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有β-葡糖苷酶活性(下文称作“同源多肽”)。在优选的方面,所述同源多肽包含或组成为如下氨基酸序列,所述氨基酸序列与SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ IDNO:28的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优 选相差一个氨基酸。
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:16的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:16的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:16的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:16的氨基酸20至861,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:16的氨基酸20至861。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:16的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸20至861或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸20至861组成。
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:18的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:18的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:18的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:18的氨基酸20至861,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:18的氨基酸20至861。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:18的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸20至861或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸20至861组成。
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:20的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:20的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:20的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:20的氨基酸20至863,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:20的氨基酸20至863。在另一优选的方面, 所述多肽由SEQ ID NO:20的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:20的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸20至863或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸20至863组成。
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:22的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:22的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:22的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:22的氨基酸37至878,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:22的氨基酸37至878。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸序列或其等位变体组成;或由它们的其具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:22的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸37至878或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸37至878组成。
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:24的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:24的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:24的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:24的氨基酸32至744,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:24的氨基酸32至744。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:24的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸32至744或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸32至744组成。
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:26的氨基酸序列或其等 位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:26的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:26的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:26的氨基酸20至860,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:26的氨基酸20至860。在另一优选的方面,所述多肽由SEQ ID NO:26的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:26的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:26的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:26的氨基酸20至860或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:26的氨基酸20至860组成。
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:28的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:28的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:28的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:28的氨基酸20至860,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:28的氨基酸20至860。在另一优选的方面,所述多肽由SEQ ID NO:28的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:28的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:28的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:28的氨基酸20至860或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:28的氨基酸20至860组成。
优选地,SEQ ID NO:16的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选地,SEQ ID NO:18的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选地,SEQ ID NO:20的成熟多肽的片段包含至少770个氨基酸残基,更优选地至少800个氨基酸残基,并且最优选至少830个氨基酸残基。优选地,SEQ ID NO:22的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选地,SEQ ID NO:24的成熟多肽的片段 包含至少620个氨基酸残基,更优选地至少650个氨基酸残基,并且最优选至少680个氨基酸残基。优选地,SEQ ID NO:26的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选地,SEQ ID NO:28的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。
优选地,SEQ ID NO:15的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。优选地,SEQ ID NO:17的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。优选地,SEQID NO:19的成熟多肽编码序列的亚序列包含至少2310个核苷酸,更优选地至少2400个核苷酸,并且最优选至少2490个核苷酸。优选地,SEQ ID NO:21的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。优选地,SEQ ID NO:23的成熟多肽编码序列的亚序列包含至少1860个核苷酸,更优选地至少1950个核苷酸,并且最优选至少2040个核苷酸。优选地,SEQ ID NO:25的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。优选地,SEQ ID NO:27的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。
在优选的方面,具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ ID NO:15的成熟多肽编码序列,其编码SEQ ID NO:16的成熟多肽。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶突变体基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ ID NO:17的成熟多肽编码序列,其编码SEQ ID NO:18的成熟多肽。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ IDNO:19的成熟多肽编码序列,其编码SEQ ID NO:20的成熟多肽。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自巴西青霉(Penicillium brasilianum)菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自巴西青霉菌株IBT20888β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ ID NO:21的成熟多肽编码序列,其编码SEQ ID NO:22的成熟多肽。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ ID NO:23的成熟多肽编码序列,其编码SEQ IDNO:24的成熟多肽(GenBankTM登录号U09580)。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得黑曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ IDNO:25的成熟多肽编码序列,其编码SEQ ID NO:26的成熟多肽(GenBankTM登录号AJ132386)。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得棘孢曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQID NO:27的成熟多肽编码序列,其编码SEQ ID NO:28的成熟多肽(GenBankTM登录号D64088)。
具有β-葡糖苷酶活性的米曲霉多肽可以根据WO 2002/095014获得。具有β-葡糖苷酶活性的米曲霉多肽变体可以根据WO 2004/099228获得。具有β-葡糖苷酶活性的烟曲霉多肽可以根据WO 2005/047499获得。具有β-葡糖苷酶活性的巴西青霉多肽可以根据WO 2007/019442获得。具有β-葡糖苷酶活性的里氏木霉菌株QM9414可以根据美国专利6,022,725获得。具有β-葡糖苷酶活性的黑曲霉多肽可以根据Dan等,2000,J.Biol.Chem.275:4973-4980获得。具有β-葡糖苷酶活性的棘孢曲霉多肽可以根据Kawaguchi等,1996,Gene173:287-288获得。
在优选的方面,SEQ ID NO:16的成熟多肽由包含在大肠杆菌DSM 14240的质粒中所包含的多核苷酸编码。在另一优选的方面,SEQ ID NO:20的成熟多肽由包含在大肠杆菌NRRL B-30695的质粒pEJG113中所包含的多核苷酸编 码。在另一优选的方面,SEQ ID NO:22的成熟多肽由包含在大肠杆菌NRRLB-30860的质粒pKKAB中所包含的多核苷酸编码。
在第二方面,具有β-葡糖苷酶活性的分离的多肽由多核苷酸编码,所述多核苷酸包含或组成为以下核苷酸序列,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列,(ii)包含在SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:15、SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或者(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989见上文)。SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有β-葡糖苷酶活性的多肽片段。
SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQID NO:23、SEQ ID NO:25、SEQ ID NO:27的核苷酸序列或其亚序列,以及SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22,或SEQ IDNO:24、SEQ ID NO:26,或SEQ ID NO:28的氨基酸序列或其片段,可以用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有β-葡糖苷酶活性的多肽的DNA,如上所述。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列,包含在SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO: 27的成熟多肽编码序列的基因组DNA序列,它的全长互补链或其亚序列。如上文所述。
在优选的方面,核酸探针是SEQ ID NO:15的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:15的核苷酸58至2584。在另一优选的方面,核酸探针是编码SEQ ID NO:16的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:15。在另一优选的方面,核酸探针是包含于大肠杆菌DSM 14240中的多核苷酸序列,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌DSM 14240中的成熟多肽编码区。
在另一优选的方面,核酸探针是SEQ ID NO:17的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:17的核苷酸58至2584。在另一优选的方面,核酸探针是编码SEQ ID NO:18的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:17。
在另一优选的方面,核酸探针是SEQ ID NO:19的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:19的核苷酸73至1413。在另一优选的方面,核酸探针是编码SEQ ID NO:20的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:19。在另一优选的方面,核酸探针是包含在质粒pEJG113中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30695中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在质粒pEJG113中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30695中。
在另一优选的方面,核酸探针是SEQ ID NO:21的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:21的核苷酸67至1377。在另一优选的方面,核酸探针是编码SEQ ID NO:22的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:21。在另一优选的方面,核酸探针是包含在质粒pKKAB中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30860中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在包含在大肠杆菌NRRL B-30860中的成熟多肽编码区。
在另一优选的方面,核酸探针是SEQ ID NO:23的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:23的核苷酸88至2232。在另一 优选的方面,核酸探针是编码SEQ ID NO:24的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:23。
在另一优选的方面,核酸探针是SEQ ID NO:25的成熟多肽编码序列。在另一个优选的方面,核酸探针是SEQ ID NO:25的核苷酸59至2580。在另一优选的方面,核酸探针是编码SEQ ID NO:26的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:25。
在另一优选的方面,核酸探针是SEQ ID NO:27的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:27的核苷酸59至2580。在另一优选的方面,核酸探针是编码SEQ ID NO:28的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:27。
对于长度至少100个核苷酸的长探针,非常低至非常高的严紧条件如在本文所定义。
对于长度为至少100个核苷酸的长探针,将载体材料进行最终洗涤,如在本文中定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧条件如本文所定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,经载体材料进行洗涤,如在本文中定义。
在第三方面,具有β-葡糖苷酶活性的多肽由包含或组成为如下核苷酸序列的多核苷酸编码,所述核苷酸序列与SEQ ID NO:15、SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其编码活性多肽。
在第六方面,具有β-葡糖苷酶活性的多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQID NO:28的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。
SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26,或SEQ ID NO:28的成熟多肽的氨基酸取代、缺 失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自家族1β-葡糖苷酶基因的多核苷酸编码。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自家族3β-葡糖苷酶基因的多核苷酸编码。
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自家族5β-葡糖苷酶基因的多核苷酸编码。
可用作本发明的多核苷酸来源的其它β-葡糖苷酶的实例包括,但不限于,米曲霉β-葡糖苷酶(WO 02/095014;WO 04/099228);棘孢曲霉β-葡糖苷酶(Kawaguchi等,1996,Gene 173:287-288);燕麦状曲霉(Aspergillus avenaceus)β-葡糖苷酶(GenBankTM登录号AY943971);烟曲霉β-葡糖苷酶(GenBankTM登录号XM745234);川地曲霉(Aspergillus kawachii)β-葡糖苷酶(GenBankTM登录号AB003470);黑曲霉β-葡糖苷酶(GenBankTM AJ132386);灰梨孢菌(Magnaporthegrisea)β-葡糖苷酶(GenBankTM登录号AY849670);黄孢平革菌β-葡糖苷酶(GenBankTM登录号AB253327);埃默森踝节菌(Talaromyces emersonii)β-葡糖苷酶(GenBankTM登录号AY072918);和里氏木霉β-葡糖苷酶(GenBankTM登录号U09580、AB003110、AY281374、AY281375、AY281377、AY281378,和AY281379)。β-葡糖苷酶的变体也可以用作多核苷酸的来源,如WO 04/099228中所述的那些。
使用根据Henrissat B.,1991,A classification of glycosyl hydrolases basedon amino-acid sequence similarities,Biochem.J.280:309-316,Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696的分类,公开了超过13个糖基水解酶家族的其它β-葡糖苷酶。
具有β-葡糖苷酶活性的多肽也可以获得自任何属的微生物。就本发明而言,术语“获得自”如本文所定义。在优选的方面,获得自给定来源的多肽是胞外分泌的。
具有β-葡糖苷酶活性的多肽可以是细菌多肽。例如,多肽可以是革兰氏阳性细菌的多肽,如具有β-葡糖苷酶活性的芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属, 或海洋芽孢杆菌属多肽,或者革兰氏阴性细菌的多肽,如具有β-葡糖苷酶活性的大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。
在优选的方面,多肽是具有β-葡糖苷酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌,或苏云金芽孢杆菌多肽。
在另一优选的方面,多肽是具有β-葡糖苷酶活性的似马链球菌、酿脓链球菌、乳房链球菌,或马链球菌兽疫亚种多肽。
在另一优选的方面,多肽是具有β-葡糖苷酶活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌,或浅青紫链霉菌多肽。
具有β-葡糖苷酶活性的多肽还可以是具有β-葡糖苷酶活性的真菌多肽,并且更优选是酵母多肽,如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽;或更优选是具有β-葡糖苷酶活性的丝状真菌多肽,如枝顶孢霉属、伞草属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属、毛壳菌属(Chaetomidium)、金孢子菌属、麦角属、旋孢腔菌属、鬼伞属、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌、隐球菌属、色二孢属、黑耳属(Exidia)、Filibasidium、镰孢属、赤霉属(Gibberella)、全鞭毛虫属、腐质霉属、耙菌属、香菇属、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、多孔菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属、根毛霉属、裂褶菌属、柱顶孢属(Scytalidium)、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属、Trichophaea、轮枝孢属、小包脚菇属(Volvariella)或炭角菌属多肽。
在优选的方面,多肽是具有β-葡糖苷酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。
在另一个优选的方面,多肽是具有β-葡糖苷酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、粪状金孢子菌、Chrysosporium inops、Chrysosporium pannicola、昆士兰金孢子菌、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾 本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、乳白耙菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳、Thielavia fimeti、微孢梭孢壳、卵孢梭孢壳、Thielavia peruviana、Thielavia spededonium、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata。
可理解的是对于前述的物种,本发明包含完全和不完全阶段两种,和其它分类学的等同物,例如无性型,无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。
这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心,北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽,如本文所述。
具有β-葡糖苷酶活性的多肽还包括融合多肽或可切割的融合多肽,其中别的多肽融合在具有β-葡糖苷酶活性的多肽或其片段的N-末端或C-末端。如本文所述产生融合多肽。
可以分离包含核苷酸序列或由其组成的多肽并用于实施本发明的方法,如本文所述,其中所述核苷酸序列编码具有β-葡糖苷酶活性的多肽。
多核苷酸包含以下核苷酸序列,或者由以下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的同一性程度,所述核苷酸序列编 码具有β-葡糖苷酶活性的多肽。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:15。在另一更优选的方面,核苷酸序列包含或组成为大肠杆菌DSM 14240中包含的核苷酸序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:15的成熟多肽编码序列。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:15的核苷酸58至2584。在另一优选的方面,核苷酸序列包含或组成为大肠杆菌DSM 14240中包含的成熟多肽编码区。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:16的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:15或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:15的亚序列,其编码SEQ ID NO:16的具有β-葡糖苷酶活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:17。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:17的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:17的核苷酸58至2584。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:18的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:17或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:17的亚序列,其编码SEQ ID NO:18的具有β-葡糖苷酶活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:19。在另一更优选的方面,核苷酸序列包含或组成为质粒pEJG113中的核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30695中。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:19的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:19的核苷酸58至2580。在另一优选的方面,核苷酸序列包含或组成为质粒pEJG113中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30695中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:20的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:19或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:19的亚序列,其编码SEQ ID NO:20的具有β-葡糖苷酶活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:21。在另一更优选的方面,核苷酸序列包含或组成为质粒pKKAB中的核苷酸序列,所述 质粒包含在大肠杆菌NRRL B-30860中。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:21的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:21的核苷酸109至2751。在另一优选的方面,核苷酸序列包含或组成为质粒pKKAB中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30860中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:22的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:21或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:21的亚序列,其编码SEQ IDNO:22的具有β-葡糖苷酶活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:23。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:23的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:23的核苷酸88至2232。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:24的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:23或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:23的亚序列,其编码SEQ ID NO:24的具有β-葡糖苷酶活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:25。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:25的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:25的核苷酸88至2232。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:26的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:25或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:25的亚序列,其编码SEQ ID NO:26的具有β-葡糖苷酶活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:27。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:27的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:27的核苷酸88至2232。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:28的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:27或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:27的亚序列,其编码SEQ ID NO:28的具有β-葡糖苷酶活性的片段。
本发明还涉及在SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的成熟多肽。
如早前所述,用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。
多核苷酸还可为包含或组成为如下核苷酸序列的多核苷酸,所述核苷酸序列编码具有β-葡糖苷酶活性的多肽,其在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中等严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高的严紧条件下,与以下杂交:(i)SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列,(ii)包含在SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。
在上述每一个优选的方面,所述成熟多肽是SEQ ID NO:16的氨基酸20至861,SEQ ID NO:18的氨基酸20至861,SEQ ID NO:22的氨基酸20至863,SEQ ID NO:22的氨基酸37至878,SEQ ID NO:24的氨基酸32至744,SEQ ID NO:26的氨基酸20至860,或SEQ ID NO:28的氨基酸20至860,并且所述成熟多肽编码序列是SEQ ID NO:15的核苷酸58至2584,SEQ IDNO:17的核苷酸58至2584,SEQ ID NO:19的核苷酸58至2580,SEQ ID NO:21的核苷酸109至2751,SEQ ID NO:23的核苷酸88至2232,SEQ ID NO:25的核苷酸59至2580,或SEQ ID NO:27的核苷酸59至2580。
β-葡糖苷酶融合多肽及其多核苷酸
β-葡糖苷酶还可以是β-葡糖苷酶融合蛋白的形式。通过将编码具有β-葡糖苷酶活性的多肽的核苷酸序列(或其部分)与编码具有内切葡聚糖酶活性的多肽的核苷酸序列(或其部分),以及编码信号肽的核苷酸融合而产生β-葡糖 苷酶融合多肽,其中所述编码信号肽的核苷酸与编码具有内切葡聚糖酶活性的多肽的核苷酸序列(或其部分)可操作连接。产生融合多肽的技术是本领域已知的,并且包括,例如,连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。还可以使用内蛋白技术构建融合蛋白,其中在翻译后产生融合蛋白(Cooper等,1993,EMBO J.12:2575-2583;Dawson等,1994,Science 266:776-779)。
与至少不存在内切葡聚糖酶的催化域的情况相比,具有β-葡糖苷酶活性的融合蛋白增加了融合蛋白的分泌,其中所述融合蛋白至少包含与信号肽以符合读框的方式连接的内切葡聚糖酶的催化域。与至少不存在内切葡聚糖酶的催化域的情况相比,具有β-葡糖苷酶活性的融合蛋白的分泌增加至少25%,优选至少50%,更优选至少100%,甚至更优选至少150%,甚至更优选至少200%,最优选至少500%,并且甚至最优选至少1000%。
在如下每个优选方面中,β-葡糖苷酶融合蛋白构建体的组件由5’末端可操作地连接至构建体的3’末端。
在优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列 的多核苷酸;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码内切葡聚糖酶的全长多肽(信号肽和成熟多肽)的序列的多核苷酸;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的催化域的序列的多核苷酸;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷 酶的催化域的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的催化域的序列的多核苷酸;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的催化域的序列的多核苷酸;,和任选的接头和/或纤维素结合域;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;,和任选的接头和/或纤维素结合域;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的催化域的序列的多核苷酸;,和任选的接头和/或纤维素结合域;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;,和任选的接头和/或纤维素结合域;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。
在上述每个优选的方面中,β-葡糖苷酶融合蛋白构建体的组件还包含启动子区域。
编码催化域、成熟多肽或全长多肽的具有β-葡糖苷酶活性或内切葡聚糖酶活性的多核苷酸可以获得自任何生物体。就本发明而言,术语“多肽”应理解为包括全长多肽、成熟多肽或催化域,或其具有β-葡糖苷酶或内切葡聚糖酶活性的部分。术语“获得自”如本文所定义的使用。
很多内切葡聚糖酶具有多域结构,所述结构由通过接头肽与纤维素结合域(CBD)分隔开的催化域组成(Suurnakki等,2000,Cellulose 7:189-209)。催化域包含活性位点,而CBD通过将酶与其结合而与纤维素反应(van Tilbeurgh等,1986,FEBS Letters 204:223-227;Tomme等,1988,European Journal ofBiochemistry 170:575-581)。
编码具有β-葡糖苷酶活性的多肽的多核苷酸如前所述。
编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码细菌多肽的基因。例如,多肽可以是革兰氏阳性细菌的多肽,包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属,或海洋芽孢杆菌属多肽,例如,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、苏云金芽孢杆菌、似马链球菌、酿脓链球菌、乳房链球菌,和马链球菌兽疫亚种,浅青紫链霉菌,或鼠灰链霉菌多肽;或者革兰氏阴性细菌的多肽,包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。
可用作本发明的方法中的多核苷酸来源的细菌内切葡聚糖酶的实例包括,但不限于,解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO91/05039;WO 93/15186;美国专利5,275,944;WO 96/02551;美国专利5,536,655;WO 00/70031,WO 05/093050);Thermobifida fusca内切葡聚糖酶III(WO 05/093050);和Thermobifida fusca内切葡聚糖酶V(WO 05/093050)。
编码具有内切葡聚糖酶活性的多肽的多核苷酸还可以获得自编码真菌多肽的基因,并且更优选是酵母多肽,如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽;或者更优选是丝状真菌多肽,如枝顶孢霉属、伞草属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属、拟蜡菌属、毛壳菌属、金孢子菌属、麦角属、旋孢腔菌属、鬼伞属、Coptotermes、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、Filibasidium、镰孢属、赤 霉属、全鞭毛虫属、腐质霉、耙菌属、香菇属、小球腔菌属、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属、根毛霉属、裂褶菌属、柱顶孢属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属、Trichophaea、轮枝孢属、小包脚菇属或炭角菌属多肽。
在优选的方面,编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码下述多肽的基因:卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。
在另一个优选的方面,编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码下述多肽的基因:解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、粪状金孢子菌、Chrysosporiuminops、Chrysosporium pannicola、昆士兰金孢子菌、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、乳白耙菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳、Thielavia fimeti、微孢梭孢壳、卵孢梭孢壳、Thielavia peruviana、Thielavia spededonium、毛梭孢壳、Thielaviasubthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。
能用作本发明的方法中多核苷酸的来源的真菌内切葡聚糖酶的实例包括,但不限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene 45:253-263;GenBankTM登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene 63:11-22;GenBankTM登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GenBankTM登录号AB003694);里氏木霉内切葡聚糖IV(Saloheimo等,1997,Eur.J.Biochem.249:584-591;GenBankTM登录号Y11113);和里氏木霉内切葡聚糖酶V(Saloheimo等,1994,Molecular Microbiology 13:219-228;GenBankTM登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acids Research 18:5884);川地曲霉内切葡聚 糖酶(Sakamoto等,1995,Current Genetics 27:435-439);金孢子菌属菌种C1(美国专利6,573,086;GenPept登录号AAQ38150);Corynascus heterothallicus(美国专利6,855,531;GenPept登录号AAY00844);胡萝卜软腐欧文氏菌(Erwiniacarotovara)内切葡聚糖酶(Saarilahti等,1990,Gene 90:9-14);尖镰孢内切葡聚糖酶(GenBankTM登录号L29381);灰腐质霉高温变种(Humicola grisea var.thermoidea)内切葡聚糖酶(GenBankTM登录号AB003107);Melanocarpusalbomyces内切葡聚糖酶(GenBankTM登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GenBankTM登录号XM 324477);马瘤胃壶菌(Piromyces equi)(Eberhardt等,2000,Microbiology 146:1999-2008;GenPept登录号CAB92325);米根霉(Rhizopus oryzae)(Moriya等,2003,J.Bacteriology 185:1749-1756;GenBankTM登录号AB047927,AB056667和AB056668);和土生梭孢霉(WO 2004/053039;EMBL登录号CQ827970)。
使用根据Henrissat B.,1991,A classification of glycosyl hydrolases basedon amino-acid sequence similarities,Biochem.J.280:309-316,Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696的分类,在超过13个糖基水解酶家族中公开了其它内切葡聚糖酶。
用于分离或克隆编码具有内切葡聚糖酶活性的多肽的多核苷酸的技术是本领域内已知的,并且包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选以检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA中克隆多核苷酸。参见,例如,Innis等,1990,PCR Protocols:A Guide to Methods andApplication,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR),连接活化转录(LAT)和基于核苷酸序列的扩增(NASBA)。
可理解的是对于前述的物种,本发明包含完全和不完全阶段两种,和其它分类学的等同物,例如无性型,而无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。
这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心 (Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心,北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
在优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶I基因的多核苷酸编码。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶II基因的多核苷酸编码。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶III基因的多核苷酸编码。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶IV基因的多核苷酸编码。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶V基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸编码,所述基因包含编码SEQ ID NO:30的多肽的SEQ ID NO:29。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶VI基因的多核苷酸编码。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族5内切葡聚糖酶基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:32的多肽的SEQ ID NO:31。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自担子菌CBS 495.95内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自担子菌CBS 495.95内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQID NO:34的多肽的SEQ ID NO:33。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自担子菌CBS 494.95内切葡聚糖酶 基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自担子菌CBS 494.95内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:36的多肽的SEQ ID NO:35。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族6内切葡聚糖酶基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126CEL6B内切葡聚糖酶基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:38的多肽的SEQ ID NO:37。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:40的多肽的SEQ ID NO:39。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族7内切葡聚糖酶基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126CEL7C内切葡聚糖酶基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:42的多肽的SEQ ID NO:41。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自NRRL 8126 CEL7E内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:44的多肽的SEQ ID NO:43。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自NRRL8126 CEL7F内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ IDNO:46的多肽的SEQ ID NO:45。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自Cladorrhinumfoecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:48的多肽的SEQ ID NO:47。
在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自里氏木霉菌株VTT-D-80133内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:50的多肽的SEQ ID NO:49(GenBankTM登录号M15665)。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族9内切葡聚糖酶基因的多核苷酸编码。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族12内切葡聚糖酶基因的多核苷酸编码。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族45内切葡聚糖酶基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族45内切葡聚糖酶基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸或其直向同源物和变体编码,所述基因包含编码SEQ ID NO:30的多肽的SEQ ID NO:29。其它优选的家族45内切葡聚糖酶及其多核苷酸获得子金孢霉菌种C1(美国专利6,573,086;GenPept登录号AAQ38150);Corynascus heterothallicus(美国专利6,855,531;GenPept登录号AAY00844);马瘤胃壶菌属(Eberhardt等,2000,Microbiology 146:1999-2008;GenPept登录号CAB92325);和米根霉(Moriya等,2003,J.Bacteriology 185:1749-1756;GenBankTM登录号AB047927、AB056667,和AB056668)。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族74内切葡聚糖酶基因的多核苷酸编码。
在优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自家族1β-葡糖苷酶基因的多核苷酸编码。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自家族3β-葡糖苷酶基因的多核苷酸编码。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由 获得自家族5β-葡糖苷酶基因的多核苷酸编码。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:16的多肽的SEQ ID NO:15,或者获得自米曲霉β-葡糖苷酶突变基因,所述基因包含编码SEQ ID NO:18的多肽的SEQ ID NO:17。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:20的多肽的SEQ ID NO:19。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自巴西青霉菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自巴西青霉菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQID NO:22的多肽的SEQ ID NO:21。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自里氏木霉菌株QM9414β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ IDNO:24的多肽的SEQ ID NO:23(GenBankTM登录号U09580)。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:26的多肽的SEQ ID NO:25。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:28的多肽的SEQ ID NO:27。
在另一个优选的方面,β-葡糖苷酶是天然分泌的。在另一个优选的方面,β-葡糖苷酶不是天然分泌的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自编码同源多肽的基因的多核苷酸编码,其中所述同源多肽包含以下氨基酸序列或由其组成,所述氨基酸序列与SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48,或SEQ ID NO:50的全长多肽、成熟多肽或催化域的氨基酸序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其具有内切葡聚糖酶活性。在优选的方面,同源多肽具有以下氨基酸序列,所述氨基酸序列与SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48,或SEQ ID NO:50的全长多肽、成熟多肽或催化域相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自编码同源多肽的基因的多核苷酸编码,其中所述同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的全长多肽、成熟多肽或催化域的氨基酸序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其具有内切葡聚糖酶活性。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的全长多肽、成熟多肽或催化域相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条 件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下序列杂交:(i)SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ ID NO:49,(ii)包含在SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ IDNO:49中的cDNA序列,或包含SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ ID NO:49的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(JJ.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ ID NO:49的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下杂交:(i)SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25,或SEQ ID NO:27,(ii)包含在SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25,或SEQ ID NO:27中的cDNA序列,或包含SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25,或SEQ ID NO:27的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25,或SEQ ID NO:27的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。
SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ ID NO:49的核苷酸序列,或其亚序列,以及SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48,或SEQ ID NO:50的氨基酸序列,或其用于内切葡聚糖酶的片段,和SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25,或SEQ ID NO:27的核苷酸序列,或其亚序列,以及SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的氨基酸序列,或其用于β-葡糖苷酶的片段,可用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有内切葡聚糖酶或β-葡糖苷酶活性的多肽的DNA,如上文所述。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与对应于上述核苷酸序列之一的标记的核酸探针杂交,如上文所述。
对于长度至少100个核苷酸的长探针,非常低至非常高的严紧条件如在本文所定义。
对于长度为至少100个核苷酸的长探针,将载体材料进行最终洗涤,如在本文中定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧条件如本文所定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将载体材料进行洗涤,如在本文中定义。
在另一个优选方面,也可以使用如“具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及其多核苷酸”部分所述的内切葡聚糖酶的全长多肽、成熟多肽,或催化域构建β-葡糖苷酶融合蛋白。
在优选的方面,β-葡糖苷酶融合蛋白包含或组成为SEQ ID NO:104。在另一优选的方面,β-葡糖苷酶融合蛋白由包含或组成为SEQ ID NO:103的多核苷酸编码。在另一优选的方面,β-葡糖苷酶融合蛋白包含或组成为SEQ IDNO:106。在另一优选的方面,β-葡糖苷酶融合蛋白由包含或组成为SEQ IDNO:105的多核苷酸编码。
如上所述,很多内切葡聚糖酶具有通过接头肽与纤维素结合域分隔开的催化域组成的多域结构。在本发明的方法中,β-葡糖苷酶融合构建体进一步 包含接头,所述接头位于包含内切葡聚糖酶催化域的序列3’,和包含β-葡糖苷酶催化域的序列5’。
接头可以获得自与内切葡聚糖酶催化域相同的基因,或者获得自不同的内切葡聚糖酶基因。另一方面,接头可以是合成来源的。
能用于本发明的方法中的接头的实例包括,但不限于,获得自下述酶的基因的接头:里氏木霉纤维二糖水解酶I(Srisodsuk等,1993,Journal of BiologicalChemistry 268:20765-20761);红褐肉座菌(Hypocrea jecorina)(以前为里氏木霉)Cel7A纤维二糖水解酶(Mulakala等,2005,Proteins 60:598-605);特异腐质霉内切葡聚糖酶V;和土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶。
在优选的方面,接头获得自特异腐质霉内切葡聚糖酶基因。在另一优选的方面,接头获得自里氏木霉内切葡聚糖酶基因。在更优选的方面,接头获得自特异腐质霉内切葡聚糖酶V(eg5)基因。
在另一个优选的方面,接头获得自土生梭孢霉内切葡聚糖酶基因。在另一更优选的方面,接头获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。
在优选的方面,接头至少为5个氨基酸残基。在更优选的方面,接头至少为15个氨基酸残基。在最优选的方面,接头至少为25个氨基酸残基。
在优选的方面,接头在约5至60个氨基酸残基之间。在更优选的方面,接头在约15至50个氨基酸残基之间。在最优选的方面,接头在约25至45个氨基酸残基之间。
尽管已经描述了很多类型的糖结合域,但是其中大部分通常称作纤维素结合域(CBD)。典型的纤维素结合域出现在纤维素酶中。相似地,CBD的其它亚类可包括,例如,几丁质结合域(通常出现在几丁质酶中的CBD)、甘露聚糖结合域(通常出现在甘露聚糖酶中的CBD)和淀粉结合域。
CBD作为大的多肽或蛋白质的整合部分存在,其中所述大的多肽或蛋白质由两个或多个多肽氨基酸序列区组成,特别是在水解酶中,其通常包含催化域和糖结合域(CBD),催化域包含用于底物水解的活性位点,而糖结合域用于结合所述的糖底物。这种酶包含多于一个催化域和一个、两个或三个CBD,任选地还包含一个或多个(几个)连接CBD与催化域的多肽氨基酸序列区,后一类型的区域通常称作“接头”。包含CBD的水解酶的实例为纤维素酶、木聚糖酶、甘露聚糖酶、阿拉伯呋喃糖苷酶、乙酰酯酶和几丁质酶(参见P.Tomme等,Cellulose-Binding Domains-Classification and Properties in Enzymatic Degradation of Insoluble Carbohydrates,John N.Saddler和Michael H.Penner(编),ACS Symposium Series,No.618,1996)。大多数已知的CBD源自纤维素酶和木聚糖酶。
CBD可以位于蛋白质或多肽的N或C末端,或者内部位置。多肽或蛋白质的构成CBD的区域通常由多于约30个并少于约250个氨基酸残基组成。例如依照Tomme等,1996,上文中列出并归类入家族I中的那些CBD,其由33-37个氨基酸残基组成;列出并归类入家族IIa类中的那些CBD,其由95-108个氨基酸残基组成;列出并归类入家族VI类中的那些CBD,其由85-92个氨基酸残基组成;和列出并归类入家族VII类中的一个CBD(源自来自热纤维梭菌(Clostridium thermocellum)的纤维素酶),其由240个氨基酸残基组成。因此,构成CBD的氨基酸序列的分子量通常在约4kDa至约40kDa的范围内,并通常低于约35kDa。
在本发明的方法中,可以使用任何CBD。CBD可以与内切葡聚糖酶天然相关,或者可以对于内切葡聚糖酶是异源的。
在优选的方面,CBD获得自里氏木霉内切葡聚糖酶(EG)基因。在更优选的方面,CBD获得自里氏木霉内切葡聚糖酶EGI基因。在另一更优选的方面,CBD获得自里氏木霉内切葡聚糖酶EGII基因。在另一更优选的方面,CBD获得自里氏木霉内切葡聚糖酶EGV。
在另一个优选的方面,CBD获得自里氏木霉纤维二糖水解酶(CBH)基因。在另一优选的方面,CBD获得自里氏木霉CBHI基因(Terri等,1987,Gene 51:42-52;Linder和Teeri,1996,Biochemistry 93:12251-12255)。在另一优选的方面,CBD获得自里氏木霉内切葡聚糖酶CBHII基因。
在另一个优选的方面,CBD获得自土生梭孢霉内切葡聚糖酶基因。在另一更优选的方面,CBD获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。
β-葡糖苷酶融合构建体可进一步包含切割位点。切割位点优选位于至少包含内切葡聚糖酶催化域的序列之后,并位于至少包含β-葡糖苷酶催化域的序列之前。通过β-葡糖苷酶融合蛋白的分泌,位点被切割以释放来自融合蛋白的有β-葡糖苷酶活性的多肽。
切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol. 76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991,Biotechnology 9:378-381),在精氨酸残基之后被因子Xa蛋白酶切割的Ile-(Glu或Asp)-Gly-Arg位点(Eaton等,1986,Biochem.25:505-512);在赖氨酸之后被肠激酶切割的Asp-Asp-Asp-Asp-Lys位点(Collins-Racie等,1995,Biotechnology 13:982-987);被Genenase I切割的His-Tyr-Glu或His-Tyr-Asp位点(Carte等,1989,Proteins:Structure,Function and Genetics 6:240-248);在Arg之后被凝血酶切割的Leu-Val-Pro-Arg-Gly-Ser位点(Stevens,2003,Drug Discovery World 4:35-48);在Gln之后被TEV蛋白酶切割的Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点(Stevens,2003,见上文);和在Gln之后被遗传工程化形式的人鼻病毒3C蛋白酶切割的Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点(Stevens,2003,见上文)。
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及其多核苷酸
在本发明中,具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及它们的多核苷酸优选选自下组:里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),及其直向同源物或变体,还选自下组:里氏木霉内切葡聚糖酶II(CEL5A),里氏木霉内切葡聚糖酶III(CEL12A),和里氏木霉内切葡聚糖酶V(CEL45A),及其直向同源物或变体。
在第一方面,具有纤维二糖水解酶I活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:52(里氏木霉纤维二糖水解酶I;CEL7A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有纤维二糖水解酶I活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:52的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
具有纤维二糖水解酶I活性的多肽优选包含SEQ ID NO:52的氨基酸序列或其等位变体;或其具有纤维二糖水解酶I活性的片段。在优选的方面, 多肽包含SEQ ID NO:52的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:52的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:52的氨基酸18至514,或其等位变体;或其具有纤维二糖水解酶I活性的片段。在另一优选的方面,多肽包含SEQ ID NO:52的氨基酸18至514。在另一优选的方面,多肽由SEQ ID NO:52的氨基酸序列或其等位变体;或其具有纤维二糖水解酶I活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:52的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:52的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:52的氨基酸18至514或其等位变体;或其具有纤维二糖水解酶I活性的片段组成。在另一优选的方面,多肽由SEQID NO:52的氨基酸18至514组成。
在另一个第一方面,具有纤维二糖水解酶II活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:54(里氏木霉纤维二糖水解酶II;CEL6A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有纤维二糖水解酶I活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为氨基酸序列,所述氨基酸序列与SEQ IDNO:54的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
具有纤维二糖水解酶II活性的多肽优选包含SEQ ID NO:54的氨基酸序列或其等位变体;或其具有纤维二糖水解酶II活性的片段。在优选的方面,多肽包含SEQ ID NO:54的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:54的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:54的氨基酸25至471,或其等位变体;或其具有纤维二糖水解酶II活性的片段。在另一优选的方面,多肽包含SEQ ID NO:54的氨基酸25至471。在另一优选的方面,多肽由SEQ ID NO:54的氨基酸序列或其等位变体;或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:54的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:54的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:54的氨基酸25至471或其等位变体;或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:54的氨基酸25至471组成。
在另一个第一方面,具有内切葡聚糖酶I活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:56(里氏木霉内切葡聚糖酶I;CEL7B)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有内切葡聚糖酶I活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ IDNO:56的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
具有内切葡聚糖酶I活性的多肽优选包含SEQ ID NO:56的氨基酸序列或其等位变体;或其具有内切葡聚糖酶I活性的片段。在优选的方面,多肽包含SEQ ID NO:56的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:56的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:56的氨基酸23至459,或其等位变体;或其具有内切葡聚糖酶I活性的片段。在另一优选的方面,多肽包含SEQ ID NO:56的氨基酸23至459。在另一优选的方面,多肽由SEQ ID NO:56的氨基酸序列或其等位变体;或其具有内切葡聚糖酶I活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:56的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:56的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:56的氨基酸23至459或其等位变体;或其具有内切葡聚糖酶I活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:56的氨基酸23至459组成。
在另一个第一方面,具有内切葡聚糖酶II活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:58(里氏木霉内切葡聚糖酶II;CEL5A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有内切葡聚糖酶II活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ IDNO:58的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个 氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
具有内切葡聚糖酶II活性的多肽优选包含SEQ ID NO:58的氨基酸序列或其等位变体;或其具有内切葡聚糖酶II活性的片段。在优选的方面,多肽包含SEQ ID NO:58的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:58的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:58的氨基酸22至418,或其等位变体;或其具有内切葡聚糖酶II活性的片段。在另一优选的方面,多肽包含SEQ ID NO:58的氨基酸22至418。在另一优选的方面,多肽由SEQ ID NO:58的氨基酸序列或其等位变体;或其具有内切葡聚糖酶II活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:58的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:52的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:58的氨基酸22至418或其等位变体;或其具有内切葡聚糖酶II活性的片段组成。在另一优选的方面,多肽由SEQ IDNO:58的氨基酸22至418组成。
在另一个第一方面,具有内切葡聚糖酶III活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:60(里氏木霉内切葡聚糖酶III;CEL12A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有内切葡聚糖酶III活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:60的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
具有内切葡聚糖酶III活性的多肽优选包含SEQ ID NO:60的氨基酸序列或其等位变体;或其具有内切葡聚糖酶III活性的片段。在优选的方面,多肽包含SEQ ID NO:60的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:60的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:60的氨基酸17至234,或其等位变体;或其具有内切葡聚糖酶III活性的片段。在另一优选的方面,多肽包含SEQ ID NO:60的氨基酸17至234。在另一优选的方面,多肽由SEQ ID NO:60的氨基酸序列或其等位变体;或其具有内切葡聚糖酶 III活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:60的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:60的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:60的氨基酸17至234或其等位变体;或其具有内切葡聚糖酶III活性的片段组成。在另一优选的方面,多肽由SEQ IDNO:60的氨基酸17至234组成。
在另一个第一方面,具有内切葡聚糖酶V活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:62(内切葡聚糖酶V;CEL45A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有内切葡聚糖酶V活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:62的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
具有内切葡聚糖酶V活性的多肽优选包含SEQ ID NO:62的氨基酸序列或其等位变体;或其具有内切葡聚糖酶V活性的片段。在优选的方面,多肽包含SEQ ID NO:62的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:62的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:62的氨基酸18至242,或其等位变体;或其具有内切葡聚糖酶V活性的片段。在另一优选的方面,多肽包含SEQ ID NO:62的氨基酸18至242。在另一优选的方面,多肽由SEQ ID NO:62的氨基酸序列或其等位变体;或其具有内切葡聚糖酶V活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:62的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:62的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:62的氨基酸18至242或其等位变体;或其具有内切葡聚糖酶V活性的片段组成。在另一优选的方面,多肽由SEQ IDNO:62的氨基酸18至242组成。
在另一个第一方面,具有纤维二糖水解酶II活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:64(土生梭孢霉纤维二糖水解酶II;CEL6A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚 至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有纤维二糖水解酶II活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:64的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
具有纤维二糖水解酶II活性的多肽优选包含SEQ ID NO:64的氨基酸序列或其等位变体;或其具有纤维二糖水解酶II活性的片段。在优选的方面,多肽包含SEQ ID NO:64的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:64的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:64的氨基酸18至481,或其等位变体;或其具有纤维二糖水解酶II活性的片段。在另一优选的方面,多肽包含SEQ ID NO:64的氨基酸18至481。在另一优选的方面,多肽由SEQ ID NO:64的氨基酸序列或其等位变体;或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:64的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:64的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:64的氨基酸18至481或其等位变体;或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面,多肽由SEQID NO:64的氨基酸18至481组成。
优选地,SEQ ID NO:52的成熟多肽的片段包含至少425个氨基酸残基,更优选地至少450个氨基酸残基,并且最优选至少475个氨基酸残基。优选地,SEQ ID NO:54的成熟多肽的片段包含至少390个氨基酸残基,更优选地至少410个氨基酸残基,并且最优选至少430个氨基酸残基。优选地,SEQ ID NO:56的成熟多肽的片段包含至少370个氨基酸残基,更优选地至少390个氨基酸残基,并且最优选至少410个氨基酸残基。优选地,SEQ ID NO:58的成熟多肽的片段包含至少340个氨基酸残基,更优选地至少360个氨基酸残基,并且最优选至少380个氨基酸残基。优选地,SEQ ID NO:60的成熟多肽的片段包含至少190个氨基酸残基,更优选地至少200个氨基酸残基,并且最优选至少210个氨基酸残基。优选地,SEQ ID NO:62的成熟多肽的片段包含至少190个氨基酸残基,更优选地至少200个氨基酸残基,并且最优选至少210个氨基酸残基。优选地,SEQ ID NO:64的成熟多肽的片段包含至少400个氨基酸残基,更优选地至少420个氨基酸残基,并且最优选至少440个氨基酸残基。
优选地,SEQ ID NO:51的成熟多肽编码序列的亚序列包含至少1275个核苷酸,更优选地至少1350个核苷酸,并且最优选至少1425个核苷酸。优选地,SEQ ID NO:53的成熟多肽编码序列的亚序列包含至少1170个核苷酸,更优选地至少1230个核苷酸,并且最优选至少1290个核苷酸。优选地,SEQ ID NO:55的成熟多肽编码序列的亚序列包含至少1110个核苷酸,更优选地至少1170个核苷酸,并且最优选至少1230个核苷酸。优选地,SEQ ID NO:57的成熟多肽编码序列的亚序列包含至少1020个核苷酸,更优选地至少1080个核苷酸,并且最优选至少1140个核苷酸。优选地,SEQ ID NO:59的成熟多肽编码序列的亚序列包含至少570个核苷酸,更优选地至少600个核苷酸,并且最优选至少630个核苷酸。优选地,SEQ ID NO:61的成熟多肽编码序列的亚序列包含至少570个核苷酸,更优选地至少600个核苷酸,并且最优选至少630个核苷酸。优选地,SEQ ID NO:63的成熟多肽编码序列的亚序列包含至少1200个核苷酸,更优选地至少1260个核苷酸,并且最优选至少1320个核苷酸。
在第二方面,具有纤维二糖水解酶I活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:51的成熟多肽编码序列,(ii)包含在SEQ ID NO:51的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:51的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:51的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维二糖水解酶I活性的多肽片段。
在另一个第二方面,具有纤维二糖水解酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:53的成熟多肽编码序列,(ii)包含在SEQID NO:53的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:53的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。 SEQ ID NO:53的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。
在另一个第二方面,具有内切葡聚糖酶I活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:55的成熟多肽编码序列,(ii)包含在SEQID NO:55的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:55的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:55的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。
在另一个第二方面,具有内切葡聚糖酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:57的成熟多肽编码序列,(ii)包含在SEQID NO:57的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:57的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:57的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶II活性的多肽片段。
在另一个第二方面,具有内切葡聚糖酶III活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:59的成熟多肽编码序列,(ii)包含在SEQID NO:59的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:59的成 熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:59的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶III活性的多肽片段。
在另一个第二方面,具有内切葡聚糖酶V活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:61的成熟多肽编码序列,(ii)包含在SEQID NO:61的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:61的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:61的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶V活性的多肽片段。
在另一个第二方面,具有纤维二糖水解酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:63的成熟多肽编码序列,(ii)包含在SEQID NO:63的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:63的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:63的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:51的核苷酸52至1542、SEQ ID NO:53的核苷酸73至1413、SEQ ID NO:55的核苷酸67至1377、SEQ ID NO:57的核苷酸64至1254、SEQ ID NO:59的核苷酸49至702、SEQID NO:61的核苷酸52至726,或SEQ ID NO:63的核苷酸52至1443。
SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQID NO:59、SEQ ID NO:61,或SEQ ID NO:63的核苷酸序列或其亚序列,以及SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58,或SEQID NO:60、SEQ ID NO:62,或SEQ ID NO:64的氨基酸序列或其片段,可用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽的DNA,如上所述。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ IDNO:63的成熟多肽编码序列,包含在SEQ ID NO:51、SEQ ID NO:53、SEQ IDNO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列的基因组DNA序列,它的全长互补链,或它们的亚序列,如上文所述。
在优选的方面,核酸探针是SEQ ID NO:51的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:51的核苷酸52至1542。在另一优选的方面,核酸探针是编码SEQ ID NO:52的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:51。
在另一优选的方面,核酸探针是SEQ ID NO:53的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:53的核苷酸73至1413。在另一优选的方面,核酸探针是编码SEQ ID NO:54的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:53。
在另一优选的方面,核酸探针是SEQ ID NO:55的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:55的核苷酸67至1377。在另一优选的方面,核酸探针是编码SEQ ID NO:56的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:55。
在另一优选的方面,核酸探针是SEQ ID NO:57的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:57的核苷酸64至1254。在另一优选的方面,核酸探针是编码SEQ ID NO:58的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:57。
在另一优选的方面,核酸探针是SEQ ID NO:59的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:59的核苷酸49至702。在另一优选的方面,核酸探针是编码SEQ ID NO:60的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:59。
在另一优选的方面,核酸探针是SEQ ID NO:61的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:61的核苷酸52至726。在另一优选的方面,核酸探针是编码SEQ ID NO:62的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:61。
在另一优选的方面,核酸探针是SEQ ID NO:63的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:63的核苷酸52至1443。在另一优选的方面,核酸探针是编码SEQ ID NO:64的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:63。在另一优选的方面,核酸探针是质粒pTter6A中包含的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30802中,其中它的多核苷酸序列编码具有纤维二糖水解酶活性的多肽。在另一优选的方面,核酸探针是质粒pTter6A中包含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30802中。
对于长度至少100个核苷酸的长探针,非常低至非常高的严紧条件如本文所定义。
对于长度为至少100个核苷酸的长探针,将载体材料进行最终洗涤,如在本文中定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧条件如本文所定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将载体材料进行洗涤,如在本文中定义。
在第三方面,具有纤维二糖水解酶或内切葡聚糖酶活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列与SEQ IDNO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57,或SEQ ID NO:59,SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其编码活性多肽。
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:51的核苷酸52至1542,SEQ ID NO:53的核苷酸73至1413,SEQ ID NO:55的核苷酸67至1377,SEQ ID NO:57的核苷酸64至1254,SEQ ID NO:59的核苷酸49至702,SEQ ID NO:61的核苷酸52至726,或SEQ ID NO:63的核苷酸52至1443。参见本文中的多核苷酸部分。
在第六方面,具有纤维二糖水解酶或内切葡聚糖酶活性的分离的多肽是人工变体,所述人工变体在SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62,或SEQ ID NO:64的成熟多肽或其同源序列中包含取代、缺失和/或插入一个或多个(或几个)氨基酸。制备这样的人工变体的方法如上文所述。
SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQID NO:60、SEQ ID NO:62,或SEQ ID NO:64的成熟多肽中氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽可以获得自任何属的微生物。就本发明而言,如本文所定义的使用术语“获得自”。在优选的方面,获得自给定来源的多肽是胞外分泌的。
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽可以是细菌多肽。例如,多肽可以是具有纤维二糖水解酶或内切葡聚糖酶活性的革兰氏阳性细菌多肽,如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属,或海洋芽孢杆菌属多肽,或者具有纤维二糖水解酶或内切葡聚糖酶活性的革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。
在优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌,或苏云金芽孢杆菌多肽。
在另一个优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的似马链球菌、酿脓链球菌、乳房链球菌,或马链球菌兽疫亚种多肽。
在另一个优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌,或浅青紫链霉菌多肽。
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽还可以是具有纤维二糖水解酶或内切葡聚糖酶活性的真菌多肽,并且更优选是酵母多肽,如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽;或者更优选是具有纤维二糖水解酶或内切葡聚糖酶活性的丝状真菌多肽,如枝顶孢霉属、曲霉属、短梗霉属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、瘤胃壶菌属、裂褶菌属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属多肽。
在优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。
在另一个优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、灰盖鬼伞(Coprinus cinereus)、Diplodia gossyppina、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、灰梨孢菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、Pseudoplectania nigrella、桔橙嗜热霉、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。
在更优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的里氏木霉多肽。在另一最优选的实施方案中,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的里氏木霉RutC30(ATCC 56765)多肽,例如,SEQ ID NO:52或54的成熟多肽,或其具有纤维二糖水解酶活性的片段,和SEQ ID NO:56、58、60或62的成熟多肽,或其具有内切葡聚糖酶活性的片段
在另一更优选的方面,多肽是具有纤维二糖水解酶活性的土生梭孢霉多肽。在另一最优选的方面,多肽是具有纤维二糖水解酶II活性的土生梭孢霉(NRRL 8126)多肽,例如,SEQ ID NO:64的成熟多肽,或其具有纤维二糖水 解酶活性的片段。
可理解的是对于前述的物种,本发明包含完全和不完全阶段两种,和其它分类学的等同物,例如无性型,无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。
这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心,北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽,如本文所述。
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽还包括融合多肽或可切割的融合多肽,其中将另一种多肽融合到具有纤维二糖水解酶或内切葡聚糖酶活性的多肽或其片段的N末端或C末端。如本文所述产生融合多肽。
可以分离包含或组成为核苷酸序列(其编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽)的多核苷酸并将其用于实施本发明的方法,如本文所述。
多核苷酸包含或组成为以下核苷酸序列,所述核苷酸序列与SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQID NO:61,或SEQ ID NO:63的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的同一性程度,其编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽。
在优选的方面,核苷酸序列包含或组成为SEQ ID NO:51。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:51的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:52的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:51。本发明还涉及SEQ ID NO:51的亚序列,其编码SEQ ID NO:52的具有纤维二糖水解酶I活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:53。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:53的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:54的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:53。本发明还涉及SEQ ID NO:53的亚序列,其编码SEQ IDNO:54的具有纤维二糖水解酶II活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:55。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:55的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:56的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:55。本发明还涉及SEQ ID NO:55的亚序列,其编码SEQ IDNO:56的具有内切葡聚糖酶I活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:57。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:57的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:58的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:57。本发明还涉及SEQ ID NO:57的亚序列,其编码SEQ IDNO:58的具有内切葡聚糖酶II活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:59。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:59的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:60的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:59。本发明还涉及SEQ ID NO:59的亚序列,其编码SEQ IDNO:60的具有内切葡聚糖酶III活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:61。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:61的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:62的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:61。本发明还涉及SEQ ID NO:61的亚序列,其编码SEQ IDNO:62的具有内切葡聚糖酶V活性的片段。
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:63。在另一更 优选的方面,核苷酸序列包含或组成为质粒pTter6A所包含的序列,所述质粒包含在大肠杆菌NRRL B-30802中。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:63的成熟多肽编码序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:63的核苷酸52至1443。在另一更优选的方面,核苷酸序列包含或组成为质粒pTter6A所包含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30802中。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:64的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:63或其成熟多肽编码序列。本发明还涉及SEQ ID NO:63的亚序列,其编码SEQ ID NO:64的具有纤维二糖水解酶II活性的片段。
本发明还涉及在SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58,或SEQID NO:60、SEQ ID NO:62,或SEQ ID NO:64的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:52的氨基酸18至541,SEQ ID NO:54的氨基酸25至471,SEQ ID NO:56的氨基酸23至459,SEQ ID NO:58的氨基酸22至418,SEQ ID NO:60的氨基酸17至234,SEQ ID NO:62的氨基酸18至242,或SEQ ID NO:64的氨基酸18至481。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:51的核苷酸52至1542、SEQ ID NO:53的核苷酸73至1413、SEQ ID NO:55的核苷酸67至1377、SEQ ID NO:57的核苷酸64至1254、SEQ ID NO:59的核苷酸49至702、SEQ ID NO:61的核苷酸52至726,或SEQ ID NO:63的核苷酸52至1443。
如前所述,用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。
多肽还可以包含多核苷酸,所述多核苷酸包含或组成为以下核苷酸序列,所述核苷酸序列编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽,所述多肽在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中等严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高的严紧条件下,与以下杂交:(i)SEQ ID NO:51、SEQ ID NO:53、SEQ IDNO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63 的成熟多肽编码序列,(ii)包含在SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:51、SEQ ID NO:53、SEQID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:51的核苷酸52至1542,SEQ ID NO:53的核苷酸73至1413,SEQ ID NO:55的核苷酸67至1377,SEQID NO:57的核苷酸64至1254,SEQ ID NO:59的核苷酸49至702,SEQ ID NO:61的核苷酸52至726,或SEQ ID NO:63的核苷酸52至1443。
核酸构建体
分离的多核苷酸,其编码具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽,β-葡糖苷酶融合多肽,具有内切葡聚糖酶活性的多肽,具有纤维二糖水解酶活性的多肽,或具有其它纤维素分解酶活性的多肽,可以用许多方式操作所述分离的多核苷酸,从而通过构建核酸构建体来提供所述多肽的表达,所述核酸构建体包含编码多肽的分离的多核苷酸,其与一个或多个(几个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是合适的启动子序列,其是由宿主细胞识别用于表达编码这种多肽的多核苷酸的核苷酸序列。启动子序列含有介导所述多肽表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从编码下述酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀 粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变、截短和杂合的启动子。
调控序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子获得自下述基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列获得自下述的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞的分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列是外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信 号肽编码区时可能是必需的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码区可在本发明中使用。
对于丝状真菌宿主细胞有效的信号肽编码区是从如下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。
在优选的方面,信号肽包含SEQ ID NO:2的氨基酸1至19,或由SEQ IDNO:2的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQID NO:1的核苷酸330至387或由SEQ ID NO:1的核苷酸330至387组成。
在另一优选的方面,信号肽包含SEQ ID NO:4的氨基酸1至17或由SEQID NO:4的氨基酸1至17组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:3的核苷酸47至97或由SEQ ID NO:3的核苷酸47至97组成。
在另一优选的方面,信号肽包含SEQ ID NO:6的氨基酸1至19或由SEQID NO:6的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:5的核苷酸69至125或由SEQ ID NO:5的核苷酸69至125组成。
在另一优选的方面,信号肽包含SEQ ID NO:8的氨基酸1至18或由SEQID NO:8的氨基酸1至18组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:7的核苷酸1至54或由SEQ ID NO:7的核苷酸1至54组成。
在另一优选的方面,信号肽包含SEQ ID NO:10的氨基酸1至19或由SEQID NO:10的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:9的核苷酸1至57或由SEQ ID NO:9的核苷酸1至57组成。
在另一优选的方面,信号肽包含SEQ ID NO:12的氨基酸1至22或由SEQID NO:12的氨基酸1至22组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:11的核苷酸1至66或由SEQ ID NO:11的核苷酸1至66组成。
在另一优选的方面,信号肽包含SEQ ID NO:14的氨基酸1至19或由SEQID NO:14的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:13的核苷酸20至76或由SEQ ID NO:13的核苷酸20至76组成。
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化 切割从前多肽转化为成熟活性多肽。前肽编码区可以从酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得。
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(next to)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。
表达载体
可以将本文描述的多种核酸和调控序列结合在一起以产生重组表达载体,其包含编码具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽、β-葡糖苷酶融合多肽、具有内切葡聚糖酶活性的多肽、具有纤维二糖水解酶活性的多肽,或具有其它纤维素分解酶活性的多肽的多核苷酸,启动子,和转录和翻译的终止信号。所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码所述多肽的核苷酸序列。可供选择的是,可以通过将所述核苷酸序列或包含该序列的核酸构建体插入用于表达的适当载体中从而表达编码这样的多肽的多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的用于表达的调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将导入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有用于确保自复制的任何手段(means)。或者,载体可以是一种当被导入宿主细胞中时,整合到基因组中并 且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多的载体或质粒,其共同含有待导入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
所述载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶),argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
所述载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应该优选含有足够数目的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的靶序列具有高同一性程度以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以通过非同源重组将载体整合到宿主细胞基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体在体内复制的核苷酸序列。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公 开于WO 00/24883中的方法完成。
可以将多于一个拷贝的编码这样的多肽的多核苷酸插入宿主细胞以增加该多肽的产生。多核苷酸拷贝数的增加可通过如下获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或使所述多核苷酸包括可扩增选择性标记基因,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝并且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建所述重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
重组丝状真菌宿主细胞,其包含多核苷酸,所述多核苷酸编码具有增强纤维素分解的活性的多肽,具有β-葡糖苷酶活性的多肽,β-葡糖苷酶融合多肽,具有内切葡聚糖酶活性的多肽,具有纤维二糖水解酶活性,或具有其它纤维素分解酶活性的多肽,可将所述重组宿主细胞有利地用于所述多肽的重组产生。将包含这种多核苷酸的载体导入宿主细胞,从而保留该载体作为染色体整合体(chromosomal integrant)或作为自复制的染色体外载体,如前所述。术语“宿主细胞”包含亲本细胞的任何子代,其由于复制过程中发生的突变而与亲本细胞不同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。
“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门(如Hawksworth等,1995,见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、栓菌属(Trametes),或木霉属(Trichoderma)细胞。
在更优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日 本曲霉、构巢曲霉、黑曲霉或米曲霉,Bjerkandera adusta,干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、浅黄拟蜡菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、Chrysosporiumlucknowense、灰盖鬼伞、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、杂色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
在最优选的方面,丝状真菌宿主细胞是米曲霉。在另一最优选的方面,丝状真菌宿主细胞是里氏木霉细胞。在另一最优选的方面,丝状真菌宿主细胞是镶片镰孢细胞。在另一最优选的方面,丝状真菌宿主细胞是Chrysosporium lucknowense细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journalof Bacteriology 153:163;和Hinnen等,1978,Proceedings of the NationalAcademy of Sciences USA 75:1920。
产生方法
用于产生本发明的纤维素分解蛋白质组合物的方法,包括(a)在有益于产生所述多肽的条件下培养丝状真菌细胞,所述细胞以其野生型形式能产生所述多肽的;和(b)回收所述多肽。
或者,用于产生本发明的纤维素分解蛋白质组合物的方法,包括(a)在有益于产生所述多肽的条件下培养重组丝状真菌宿主细胞;和(b)回收所述多肽。
在所述产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养丝状真菌细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果蛋白质组分分泌到营养培养基中,则能够从所述培养基中直接回收该蛋白质组分。如果蛋白质组分不分泌到培养基中,其能够从细胞裂解物(lysate)回收。
可以使用本文所述或本领域已知的方法来检测所述组合物中的蛋白质组分。
可以使用本领域已知的方法回收所得纤维素分解蛋白质组合物。例如,可以通过常规方法从营养培养基中回收纤维素分解蛋白质组合物,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
可以通过多种本领域已知的方法纯化组合物的蛋白质组分,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989),以获得基本上纯的多肽。
加工含纤维素材料的方法
本发明还涉及用于降解或转化含纤维素材料的方法,其包括用有效量的本发明的纤维素分解蛋白质组合物处理含纤维素材料。
本发明还涉及用于产生发酵产物的方法,其包括:(a)用有效量的本发明的纤维素分解蛋白质糖化含纤维素材料;(b)用一种或多种(几种)发酵微生物发酵步骤(a)中糖化的含纤维素材料,以产生发酵产物;和(c)从发酵中回收发酵产物。
本发明的方法可以用于将含纤维素材料(例如,木素纤维素)水解(糖化)成可发酵糖并将可发酵糖转换成许多有用的物质,例如化学品和燃料。由含纤维素材料生产期望的发酵产物通常包括预处理、酶水解(糖化)和发酵。
依照本发明,含纤维素材料的加工可以使用本领域已知的方法来完成。而且,可以使用设置为按照本发明来操作的任何生物质加工设备来实施本发明的方法。
水解(糖化)和发酵,分别或同时包括但不限于分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和发酵)和直接微生物转化(DMC)。在本文中可理解的是本领域已知任何方法包括预处理、酶水解(糖化)、发酵或其组合可以用在本发明的方法实施中。
常规设备可以包括补料分批搅拌反应器(fed-batch stirred reactor)、分批搅拌反应器(batch-stirred reactor)、带有超滤的连续流搅拌反应器(continuous flowstirred reactor with ultrafiltration)和/或连续活塞流柱式反应器(continuousplug-flow column reactor)(Fernanda de Castilhos Corazza,Flávio Faria deMoraes,Gisella Maria Zanin和Ivo Neitzel,2003,Optimal control in fed-batchreactor for the cellobiose hydrolysis,Acta Scientiarum.Technology 25:33-38;Gusakov,A.V.,和Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis ofcellulose:1.A mathematical model for a batch reactor process,Enz.Microb.Technol.7:346-352)、研磨反应器(attrition reactor)(Ryu,S.K.,和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65)或具有由电磁场引起的强力搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancementof enzymatic cellulose hydrolysis using a novel type of bioreactor with intensivestirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。用于水解和/或发酵的其他反应器类型包括,例如,流化床(fluidizedbed)、上流式床(upflow blanket)、固定化的、和挤出机型反应器。
预处理:在实施本发明的方法中,本领域已知的任何预处理方法都可以用于破坏含纤维素材料的植物细胞壁组分。在预处理之前,也可以用本领域已知的方法对含纤维素材料进行预浸泡、湿润或调理(conditioning)。常规的预处理包括而不限于蒸汽预处理(带有或不带有爆炸)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿式爆炸(wet explosion)、氨纤维爆炸、有机溶剂预处理和生物学预处理。另外的预处理包括超声、电穿孔、微波、超临界CO2、超临界H2O和氨渗滤法。
在水解和/或发酵作用之前可以预处理含纤维素材料。预处理优选在水解之前进行。或者,预处理可以与水解同时进行,例如与用一种或多种纤维素分解酶或其他酶活性处理含纤维素材料同时进行,以释放可发酵糖,如葡萄糖和/或麦芽糖。在大多数情况下预处理步骤本身导致生物质转化成可发酵糖(甚至在酶不存在的情况下)。
蒸汽预处理:在蒸汽预处理中,加热含纤维素材料以破坏植物细胞壁组分(包括木质素、半纤维素和纤维素),从而使纤维素和其它级分(如半纤维素)更易于让酶接近。将纤维素材料传送至或穿过反应容器,在所述反应容器中注入蒸汽将温度升高到所需的温度和压强,并且将其在预期的反应时间里保持在其中。蒸汽预处理优选在140-230℃,更优选160-200℃,并且最优选170-190℃完成,其中最适温度范围取决于化学催化剂的加入。蒸汽预处理的停留时间(residence time)优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最适停留时间取决于温度范围和化学催化剂的加入。蒸汽预处理允许相对高的固体加样量(loading),从而使得含纤维素材料一般仅在预处理时湿润。所述蒸汽预处理经常与预处理后材料的爆炸性卸载,其称作蒸汽爆炸,即,快速闪蒸(rapid flashing)至大气压及材料的湍流组合以通过片段化增加可接近表面积(Duff和Murray,1996,Bioresource Technology 855:1-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美国专利申请No.20020164730)。
在蒸汽预处理之前常常加入催化剂如H2SO4或SO2(通常0.3至3%w/w),其能减少时间和降低温度,增加回收率以及改善酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等,2006,Enzyme Microb.Technol.39:756-762)。
化学预处理:术语“化学处理”指的是促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。适当的化学预处理方法的实例包括,例如,稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(ammonia fiber/freezeexplosion)(AFEX)、氨渗透(ammonia percolation)(APR)或有机溶剂预处理。
在稀酸预处理中,将含纤维素材料与稀酸(通常为H2SO4)和水混合以形成浆料,通过蒸汽加热到所需的温度,并在一段停留时间后,闪蒸至大气压。可以在多个反应器设计中进行稀酸预处理,例如,活塞流反应器、逆流反应器或连续逆流收缩床反应器(counter-current shrinking bed reactors)(Duff和 Murray,1996,见上文;Schell等,2004,Bioresource Technol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。
也可以使用在碱性条件下的几种预处理方法。这些碱预处理包括,但不限于,石灰预处理、湿氧化、氨渗透(APR),和氨纤维/冷冻爆炸(AFEX)。
在85-150℃的低温下用碳酸钙、氢氧化钠或氨进行石灰预处理,并且停留时间为1小时至几天(Wyman等,2005,Bioresource Technol.96:1959-1966;Mosier等,2005,Bioresource Technol.96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900和WO 2006/110901披露了使用氨的预处理方法。
湿氧化为通常在加入氧化剂(例如过氧化氢或超压氧)的条件下在180-200℃进行5-15分钟的热预处理(Schmidt和Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。以优选1-40%的干物质,更优选2-30%的干物质,并且最优选5-20%的干物质进行预处理,并且通常初始pH值随着碱(例如碳酸钠)的加入而增加。
已知的湿氧化预处理方法的改进方法为湿爆炸(湿氧化和蒸汽爆炸的组合),其可以处理干物质高达30%。在湿爆炸中,在经过一定的驻留时间后在预处理过程中引入氧化剂。然后,通过闪蒸至大气压来结束预处理(WO 2006/032282)。
氨纤维爆炸(AFEX)包括在合适的温度(例如90-100℃)和高压(例如17-20bar)用液态或气态氨处理含纤维素材料5-10分钟,其中干物质含量可以高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,Bioresource Technol.96:2014-2018)。
通过在160-200℃使用乙醇水溶液(40-60%乙醇)萃取30-60分钟,有机溶剂预处理使含纤维素材料脱木素(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中,大部分的半纤维素被除去。
Schell等,2003,Appl.Biochem.and Biotechnol.Vol.105-108,p.69-85和Mosier等,2005,Bioresource Technology 96:673-686和公开的美国申请2002/0164730描述了合适的预处理方法的其它实例。
在一个方面,优选以酸处理,并且更优选以连续稀酸和/或弱酸处理进行所述化学预处理。所述酸通常是硫酸,但是也可以使用其它酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。在优选1-5,更优选1-4,并且最优选1-3的pH范围进行弱酸处理。在一个方面,所述酸浓度在优选0.01至20wt%酸,更优选0.05至10wt%酸,甚至更优选0.1至5wt%酸,并且最优选0.2至2.0wt%酸的范围内。使所述酸与含纤维素材料接触,并在一定的温度(例如在160-220℃,优选165-195℃的范围)保持数秒至数分钟(例如1秒至60分钟)的时间。
在另一方面,以氨纤维爆炸步骤(AFEX预处理步骤)进行预处理。
在另一方面,在含水浆料中进行预处理。在优选的方面,在预处理过程中,含纤维素材料以优选10-80wt%,更优选20-70wt%,并且最优选30-60wt%,如大约50wt%的量存在。所述预处理的含纤维素材料可以是未经洗涤的,或者是使用本领域内已知的任何方法洗涤的,例如用水洗涤。
机械预处理:术语“机械预处理”指的是各种类型的研磨或磨制(例如干磨、湿磨或振动球磨)。
物理预处理:术语“物理预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何预处理。例如,物理预处理可涉及辐照(例如,微波辐照)、汽蒸/蒸汽爆炸、水热解(hydro thermolysis)及其组合。
物理预处理可涉及高压和/或高温(蒸汽爆炸)。在一个方面,高压指的是范围在优选约300至约600psi,更优选为约350至约550psi,并且最优选为约400至约500psi,例如大约450psi的压力。在另一方面,高温指的是范围在大约100至大约300℃,优选大约140至大约235℃的温度。在优选的方面,在使用如上所限定的高压和高温的蒸汽枪水解仪系统(例如,Sunds Hydrolyzer,可由Sunds Defibrator AB,Sweden获得)中以分批法进行机械预处理。
组合的物理和化学预处理:含纤维素材料可以同时进行物理和化学预处理。例如,预处理步骤可以涉及稀酸或弱酸处理和高温和/或高压处理。可以根据需要依次或同时进行物理和化学预处理。也可以包括机械预处理。
因此,在优选的方面,使含纤维素材料进行机械、化学或物理预处理或者其任意组合以促进纤维素、半纤维素和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何生物学预处理。生物预处理技术可 涉及应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatment ofbiomass,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemicaland biological treatments for enzymatic/microbial conversion of lignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreatinglignocellulosic biomass;a review,于Enzymatic Conversion of Biomass for FuelsProduction,Himmel,M.E.,Baker,J.O.和Overend,R.P.编,ACS Symposium Series566,American Chemical Society,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-VerlagBerlin Heidelberg,Germany,65:207-241;Olsson和Hahn-Hagerdal,1996,Fermentation of lignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;及Vallander和Eriksson,1990,Production of ethanol fromlignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
糖化:在也称为糖化的水解步骤中,将经预处理的含纤维素材料水解以将纤维素以及可选地还有半纤维素分解成可发酵的糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或可溶的寡糖。使用本发明的纤维素分解蛋白质组合物进行酶水解。也可以依次加入组合物的酶组分。
优选在本领域的技术人员能够容易地确定的条件下,在合适的含水环境中进行酶水解。在优选的方面,在适于酶活性的条件(即,对酶最佳的条件)下进行水解。可以以补料分批或连续方法进行水解,在连续方法中将经预处理的含纤维素材料(底物)逐渐加入到例如包含酶的水解溶液中。
糖化通常在受控的pH、温度和混合条件下,在搅拌釜式反应器或发酵罐中进行。合适的过程时间、温度和pH条件能够由本领域技术人员容易地确定。例如,糖化可以持续多至200小时,但是通常进行优选大约12至大约96小时,更优选大约16至大约72小时,并且最优选大约24至大约48小时。所述温度在优选大约25℃至大约70℃,更优选大约30℃至大约65℃,并且更优选大约40℃至60℃的范围内,特别地为大约50℃。所述pH在优选大约3至大约8,更优选大约3.5至大约7,并且最优选大约4至大约6的范围内,特别地为大约pH 5。干固体的含量在优选大约5至大约50wt%,更优选大约10至大约40wt%并且最优选大约20至大约30wt%的范围内。
具有增强纤维素分解的活性的多肽和酶的最优量依赖于几个因素,所述因素包括但不限于组分纤维素分解蛋白质的混合物、纤维素底物、纤维素底物浓度、纤维素底物的预处理、温度、时间、pH和发酵微生物(例如,用于同时糖化和发酵的酵母)的内含物(inclusion)。
在优选的方面,纤维素分解蛋白对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,甚至更优选大约0.5至大约10mg,并且最优选大约2.5至大约10mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,甚至更优选大约0.5至大约10mg,并且最优选大约2.5至大约10mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.01至大约50.0mg,优选大约0.01至大约40mg,更优选大约0.01至大约30mg,更优选大约0.01至大约20mg,更优选大约0.01至大约10mg,更优选大约0.01至大约5mg,更优选大约0.025至大约1.5mg,更优选大约0.05至大约1.25mg,更优选大约0.075至大约1.25mg,更优选大约0.1至大约1.25mg,甚至更优选大约0.15至大约1.25mg,并且最优选大约0.25至大约1.0mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于纤维素分解蛋白的有效量是每克纤维素分解蛋白大约0.005至大约1.0g,优选大约0.01至大约1.0g,更优选大约0.15至大约0.75g,更优选大约0.15至大约0.5g,更优选大约0.1至大约0.5g,甚至更优选大约0.1至大约0.5g,并且最优选大约0.05至大约0.2g。
发酵.通过一种或多种能够直接或间接将糖发酵成期望的发酵产物的发酵微生物可以发酵从经预处理和水解的含纤维素材料得到的可发酵的糖。“发酵”或“发酵方法”指任何发酵方法或任何包括发酵步骤的方法。发酵方法还包括在生物燃料工业、可消费醇工业(例如,啤酒和葡萄酒(wine))、乳品工业(例如,发酵乳制品)、皮革工业和烟草工业中使用的发酵方法。发酵的条件依赖于期望的发酵产物和发酵生物,并且可由本领域的技术人员容易地确定。
在发酵步骤中,将作为预处理和酶水解步骤的结果从含纤维素材料释放的糖通过发酵生物例如酵母发酵成产物,例如乙醇。水解(糖化)和发酵可以是分别的或同时的。这些方法包括,但不限于,分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和共发酵)和直接微生物转化(DMC)。
在实施本发明时,任何合适的经水解的含纤维素材料可以用于发酵步骤中。所述材料通常基于期望的发酵产物(即,要从发酵获得的物质)和采用的方法来进行选择,如本领域内所熟知的。
术语“发酵培养基”在本文中应理解为指在加入发酵微生物之前的培养基,例如,糖化处理产生的培养基,以及例如在同时糖化和发酵方法(SSF)中使用的培养基。
“发酵微生物”指适用于期望的发酵方法以产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是C6和/或C5发酵生物体,或者其组合。C6和C5发酵生物都是本领域内熟知的。合适的发酵生物能够发酵,即,能够直接或间接地将糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖转化成期望的发酵产物。
Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642描述了生产乙醇的细菌和真菌发酵生物的实例。
可以发酵C6糖的发酵微生物的实例包括细菌和真菌生物,如酵母。优选的酵母包括酵母属(Saccharomyces)菌种,优选为酿酒酵母的菌株。
可以发酵C5糖的发酵生物的实例包括细菌和真菌生物,如酵母。优选的发酵C5的酵母包括毕赤酵母属,优选为树干毕赤酵母(Pichia stipitis)的菌株,如树干毕赤酵母CBS 5773;念珠菌属,优选博伊丁念珠菌(Candida boidinii)、芸苔念珠菌(Candida brassicae)、休哈塔念珠菌(Candida sheatae)、迪丹斯念珠菌(Candida diddensii)、假热带念珠菌(Candida pseudotropicalis)或产朊念珠菌(Candida utilis)的菌株。
其它发酵生物包括发酵单孢菌属(Zymomonas),如运动发酵单孢菌(Zymomonas mobilis)的菌株;汉逊酵母属,如异常汉逊酵母(Hansenula anomala)的菌株;克鲁维酵母属,如脆壁克鲁维酵母(K.fragilis)的菌株;裂殖酵母属(Schizosaccharomyces),如粟酒裂殖酵母(S.pombe)的菌株;和大肠杆菌,特别是已经进行了遗传修饰以改进乙醇产率的大肠杆菌菌株。
在优选的方面,酵母是酵母属菌种。在更优选的方面,酵母是酿酒酵母。在另一更优选的方面,酵母是糖化酵母(Saccharomyces distaticus)。在另一更优选的方面,酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一优选的方面,酵母是克鲁维酵母属。在另一更优选的方面,酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一更优选的方面,酵母是脆壁克鲁维酵母。在另一优选的方面,酵母是念珠菌属。在另一更优选的方面,酵母是博伊丁念珠菌。在另一更优选的方面,酵母是芸苔念珠菌。在另一更优选的方面,酵母是迪丹斯念珠菌。在另一更优选的方面,酵母是假热带念珠菌。在另一更优选的方面,酵母是产朊念珠菌。在另一优选的方面,酵母是棒孢酵母属(Clavispora)。在另一更优选的方面,酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一更优选的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一优选的方面,酵母是管囊酵母属(Pachysolen)。在另一更优选的方面,酵母是嗜鞣管囊酵母(Pachysolen tannophilus)。在另一个更优选的方面,酵母是毕赤酵母属。在另一更优选的方面,酵母是树干毕赤酵母。在另一优选的方面,酵母是酒香酵母属(Bretannomyces)。在另一更优选的方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Production andUtilization,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212)。
能够有效地将己糖和戊糖发酵成乙醇的细菌包括例如运动发酵单孢菌和热纤维梭菌(Philippidis,1996,见上文)。
在优选的方面,细菌是发酵单孢菌属。在更优选的方面,细菌是运动发酵单孢菌。在另一优选的方面,细菌是梭菌属。在另一更优选的方面,细菌是热纤维梭菌。
商业上可得到的适合于乙醇生产的酵母包括,例如,ETHANOL REDTM酵母(可得自Fermentis/Lesaffre,USA)、FALITM(可得自Fleischmann’s Yeast,USA)、SUPERSTARTTM和THERMOSACCTM新鲜酵母(可得自EthanolTechnology,WI,USA)、BIOFERMTM AFT和XR(可得自NABC-North AmericanBioproducts Corporation,GA,USA)、GERT STRANDTM(可得自Gert Strand AB,Sweden)和FERMIOLTM(购自DSM Specialties)。
在优选的方面,发酵微生物已被遗传修饰以提供发酵戊糖的能力,例如,利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物(xylose and arabinose co-utilizing microorganism)。
将异源基因克隆至多种发酵微生物中已经导致构建了能够将己糖和戊糖转化为乙醇的生物(共发酵)(Chen和Ho,1993,Cloning and improving the expressionof Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,Genetically engineered Saccharomycesyeast capable of effectively cofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859;Kotter和Ciriacy,1993,Xylose fermentation bySaccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizing Saccharomyces cerevisiae strains overexpressing theTKL1 and TAL1 genes encoding the pentose phosphate pathway enzymestransketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,Minimal metabolic engineering of Saccharomyces cerevisiae for efficientanaerobic xylose fermentation:a proof of principle,FEMS Yeast Research 4:655-664;Beall等,1991,Parametric studies of ethanol production from xylose andother sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214;Zhang等,1995,Metabolic engineering of a pentosemetabolism pathway in ethanologenic Zymomonas mobilis,Science 267:240-243;Deanda等,1996,Development of an arabinose-fermenting Zymomonas mobilisstrain by metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470)。
在优选的方面,经遗传修饰的发酵微生物是酿酒酵母。在另一优选的方面,经遗传修饰的发酵微生物是运动发酵单孢菌。在另一优选的方面,经遗传修饰的发酵微生物是大肠杆菌。在另一优选的实施方式中,经遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。
通常加入发酵微生物以降解纤维素或水解产物,并且发酵进行大约8到大约96小时,例如大约24至大约60小时。温度通常为大约26℃至大约60℃,特别是大约32℃或50℃,并且在大约pH 3至大约pH 8,如大约pH4-5、6或7。
在优选的方面,将发酵微生物应用于降解的纤维素或水解产物,并且发酵进行大约12至大约96小时,如通常为24-60小时。在优选的方面,温度优选在大约20℃至大约60℃,更优选大约25℃至大约50℃,并且最优选大约32℃至大约50℃,特别是大约32℃或50℃,并且pH通常从大约pH 3至大约pH 7, 优选大约pH 4-7。然而,例如,一些细菌发酵生物具有更高的最佳发酵温度。发酵微生物优选以每毫升的发酵液大约105至1012,优选大约107至1010,特别是大约2×108的活细胞计数的量应用。有关使用酵母发酵的其它指导可参见例如“The Alcohol Textbook”(K.Jacques,T.P.Lyons和D.R.Kelsall编,Nottingham University Press,United Kingdom 1999),将其通过提述并入本文。
对于乙醇产生,在发酵之后蒸馏发酵浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作例如燃料乙醇、饮用乙醇,即,可饮用中性酒精(potableneutral spirits);或工业乙醇。
可以将发酵刺激物(fermentation stimulator)与本文描述的任何酶方法组合使用以进一步改进发酵方法,特别是改进发酵微生物的性能,如,速率增益和乙醇产率。“发酵刺激物”指用于发酵微生物,特别是酵母的生长的刺激物。优选的用于生长的发酵刺激物包括维生素和矿物。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等,Improvingethanol production and viability of Saccharomyces cerevisiae by a vitamin feedingstrategy during fed-batch process,Springer-Verlag(2002),将其通过提述并入本文。矿物的实例包括能够提供营养物的矿物和矿物盐,所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
发酵产物:发酵产物可以为源自发酵的任何物质。所述发酵产物可以是,但不限于,醇(例如,阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇和木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、延胡索酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸);酮类(例如,丙酮);醛类(例如,甲醛);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵产物还可以为蛋白质作为有高价值产物。
在优选的方面,所述发酵产物是醇。应该理解术语“醇”包含含有一个或多个羟基的物质。在更优选的方面,所述醇是阿拉伯糖醇。在另一更优选的方面,所述醇是丁醇。在另一更优选的方面,所述醇是乙醇。在另一更优选的方面,所述醇是甘油。在另一更优选的方面,所述醇是甲醇。在另一更优选的方面,所述醇是1,3-丙二醇。在另一更优选的方面,所述醇是山梨糖醇。 在另一个更优选的方面,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.和Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.和Singh,D.,1995,Processes for fermentativeproduction of xylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanoland ethanol by Clostridium beijerinckii BA101 and in situ recovery by gasstripping,World Journal of Microbiology and Biotechnology 19(6):595-603。
另一个优选的方面,所述发酵产物是有机酸。在另一更优选的方面,所述有机酸是乙酸。在另一更优选的方面,所述有机酸是醋酮酸。在另一更优选的方面,所述有机酸是己二酸。在另一更优选的方面,所述有机酸是抗坏血酸。在另一更优选的方面,所述有机酸是柠檬酸。在另一更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一更优选的方面,所述有机酸是甲酸。在另一更优选的方面,所述有机酸是延胡索酸。在另一更优选的方面,所述有机酸是葡糖二酸。在另一更优选的方面,所述有机酸是葡糖酸。在另一更优选的方面,所述有机酸是葡糖醛酸。在另一更优选的方面,所述有机酸是戊二酸。在另一优选的方面,所述有机酸是3-羟基丙酸。在另一更优选的方面,所述有机酸是衣康酸。在另一更优选的方面,所述有机酸是乳酸。在另一更优选的方面,所述有机酸是苹果酸。在另一更优选的方面,所述有机酸是丙二酸。在另一更优选的方面,所述有机酸是草酸。在另一更优选的方面,所述有机酸是丙酸。在另一更优选的方面,所述有机酸是琥珀酸。在另一更优选的方面,所述有机酸是木糖酸。参见,例如,Chen,R.和Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一优选的方面,所述发酵产物是酮。应该理解的是术语“酮”涵盖含有一个或多个酮基的物质。在另一更优选的方面,所述酮是丙酮。参见,例如,Qureshi和Blaschek,2003,见上文。
在另一优选的方面,所述发酵产物是醛。在另一更优选的方面,所述醛为甲醛。
在另一优选的方面,所述发酵产物是氨基酸。在另一更优选的方面,所述有机酸是天冬氨酸。在另一更优选的方面,所述氨基酸是谷氨酸。在另一更优选的方面,所述氨基酸是甘氨酸。在另一更优选的方面,所述氨基酸是赖氨酸。在另一更优选的方面,所述氨基酸是丝氨酸。在另一更优选的方面,所述氨基酸是苏氨酸。参见,例如,Richard,A.和Margaritis,A.,2004,Empiricalmodeling of batch fermentation kinetics for poly(glutamic acid)production andother microbial biopolymers,Biotechnology and Bioengineering 87(4):501-515。
在另一优选的方面,所述发酵产物是气体。在另一更优选的方面,所述气体是甲烷。在另一更优选的方面,所述气体是H2。在另一更优选的方面,所述气体是CO2。在另一更优选的方面,所述气体是CO。参见,例如,Kataoka,N.,A.Miya和K.Kiriyama,1997,Studies on hydrogen production by continuous culturesystem of hydrogen-producing anaerobic bacteria,Water Science and Technology 36(6-7):41-47;和Gunaseelan V.N.于Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion of biomass for methane production:A review。
回收:使用本领域已知的方法可以从发酵培养基中任选地回收发酵产物,所述方法包括,但不限于,层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、蒸馏或提取。例如,从发酵的含纤维素材料中分离乙醇,并通过常规的蒸馏方法纯化。可以获得纯度高至大约96vol.%的乙醇,其可以用作,例如燃料乙醇、饮用乙醇,即,可饮用中性酒精(potable neutral spirits);或工业乙醇。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
用作缓冲液和底物的化学品为至少试剂级的商业产品。
DNA测序
使用Applied Biosystems Model 3130X Genetic Analyzer(3130X型遗传分析仪)(Applied Biosystems,Foster City,CA,USA),利用染料终止子化学(Giesecke等,1992,Journal of Virol.Methods 38:47-60)进行DNA测序。使用phred/phrap/consed(University of Washington,Seattle,WA,USA)用序列特异性引物组装序列。
培养基与溶液
YP培养基由每升10g酵母提取物和20g细菌用胰蛋白胨组成。
纤维素酶-诱导培养基由每升20g纤维素、10g玉米浆固体、1.45g(NH4)2SO4、2.08g KH2PO4、0.28g CaCl2、0.42g MgSO4·7H2O和0.42ml痕量金属溶液组成。
痕量金属溶液由每升216g FeCl3·6H2O、58g ZnSO4·7H2O、27gMnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3和336g柠檬酸组成。
STC由1M山梨醇、10mM CaCl2和10mM Tris-HCl,pH 7.5组成。
COVE平板由每升342g蔗糖、10ml COVE盐溶液、10ml 1M乙酰胺、10ml 1.5M CsCl,和25g Noble琼脂组成。
COVE盐溶液由每升26g KCl、26g MgSO4、76g KH2PO4和50ml COVE痕量金属溶液组成。
COVE痕量金属溶液由每升0.04g Na2B4O7·10H2O、0.4g CuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·H2O和10g ZnSO4·7H2O组成。
COVE2平板由每升30g蔗糖、20ml COVE盐溶液、25g Noble琼脂和10ml 1M乙酰胺组成。
PDA平板由每升39克马铃薯葡萄糖琼脂组成。
LB培养基由每升10g胰蛋白胨、5g酵母提取物和5gNaCl组成。
2X YT-Amp平板由每升10g胰蛋白胨、5g酵母提取物、5g氯化钠和15g细菌用琼脂组成,在高压灭菌后加入2ml过滤灭菌的50mg/ml氨苄青霉素溶液。
MDU2BP培养基由每升45g麦芽糖、1g MgSO4·7H2O、1g NaCl、2gK2HSO4、12g KH2PO4、2g脲和500μl AMG痕量金属溶液,pH调至5.0,然后用0.22μm过滤装置过滤除菌。
AMG痕量金属溶液由每升14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、0.5gNiCl2·6H2O、13.8g FeSO4·H2O、8.5g MnSO4·7H2O和3g柠檬酸组成。
矿物质培养基平板由每升6g NaNO3、0.52g KCl、1.52g KH2PO4、1mlCOVE痕量金属溶液、20g Noble琼脂、20ml 50%葡萄糖、2.5ml 20%MgSO4·7H2O,和20ml生物素保存溶液组成。
生物素保存溶液由每升0.2g生物素组成。
SOC培养基由2%胰蛋白胨、0.5%酵母提取物、10mM NaCl、2.5mM KCl、10mM MgCl2和10mM MgSO4组成,然后在高压灭菌后加入过滤除菌的葡萄糖至20mM。
孟德尔培养基由每升1.4g(NH4)2SO4、2.0g KH2PO4、0.3g脲、0.3gCaCl2、0.3g MgSO4.7H2O、5mg FeSO4.7H2O、1.6mg MnSO4.H2O、1.4mgZnSO4.H2O和2mg CoCl2组成。
实施例1:pMJ04表达载体的构建
通过使用下述所示的引物993429(反义)和993428(有义)从里氏木霉RutC30基因组DNAPCR扩增里氏木霉纤维二糖水解酶I基因(cbh1,CEL7A)终止子而构建表达载体pMJ04。工程改造反义引物,使其在5’末端包含Pac I位点,并在有义引物的3’末端包含Spe I位点。
引物993429(反义):
5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO:65)
引物993428(有义):
5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO:66)
使用 Plant Maxi Kit(QIAGEN Inc.,Valencia,CA,USA)分离里氏木霉RutC30基因组DNA。
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液(New EnglandBiolabs,Beverly,MA,USA),0.3mM dNTP,100ng里氏木霉RutC30基因组DNA,0.3μM引物993429,0.3μM引物993428和2单位Vent DNA聚合酶(NewEngland Biolabs,Beverly,MA,USA)。在 5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中温育反应物,程序为94℃30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液分离反应产物,其中从凝胶切下229bp的产物条带,并使用 Gel ExtractionKit(QIAGEN Inc.,Valencia,CA,USA),根据生产商的说明纯化。
用Pac I和Spe I消化得到的PCR片段,并使用快速连接试剂盒(Roche,Indianapolis,IN,USA)连接入用相同的限制性酶消化的pAlLo1(WO05/067531)中,以产生pMJ04(图1)。
实施例2:pCaHj568的构建
由pCaHj170(美国专利No.5,763,254)和pMT2188构建质粒pCaHj568。质粒pCaHj170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQID NO:15,其编码SEQ ID NO:16的氨基酸序列)。pMT2188的构建由使用下述所示引物142779和142780从pCaHj483(WO 98/00529)PCR扩增pUC19的复制起点而开始。引物142780在PCR片段中引入Bbu I位点。
引物142779:
5’-TTGAATTGAAAATAGATTGATTTAAAACTTC-3’(SEQ ID NO:67)
引物142780
5’-TTGCATGCGTAATCATGGTCATAGC-3’(SEQ ID NO:68)
使用 PCR系统(Roche Molecular Biochemicals,Basel,Switzerland),按照生产商的说明进行此扩增。在琼脂糖凝胶上分离PCR产物,并使用Jetquick Gel Extraction Spin Kit(Genomed,Wielandstr,Germany)分离和纯化1160bp片段。
使用 PCR系统,用下述所示引物140288和142778,从常用的酿酒酵母克隆载体pYES2(Invitrogen,Carlsbad,CA,USA)扩增URA3基因。引物140288在PCR片段中引入Eco RI位点。
引物 140288:
5’-TTGAATTCATGGGTAATAACTGATAT-3’(SEQ ID NO:69)
引物142778:
5’-AAATCAATCTATTTTCAATTCAATTCATCATT-3’(SEQ ID NO:70)
在琼脂糖凝胶上分离PCR产物,并使用Jetquick Gel Extraction Spin Kit分离和纯化1126bp片段。
通过混合将两个PCR片段融合,并通过重叠剪接方法(Horton等,1989,Gene77:61-68)用上述所示引物142780和140288进行扩增。在琼脂糖凝胶上分离PCR产物,并使用Jetquick Gel Extraction Spin Kit分离和纯化2263bp片段。
用Eco RI和Bbu I消化得到的片段,并使用标准规程连接至用相同的限制性酶消化的pCaHj483的最大片段。将连接混合物转化入由Mandel和Higa,1970,J.Mol.Biol.45:154方法制成感受态的pyrF-阴性大肠杆菌菌株DB6507(ATCC 35673)。在每升补加1g酪蛋白氨基酸、500μg硫胺素和10mg卡那 霉素的固体M9培养基(Sambrook等,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor Laboratory Press)上筛选转化体。从一个转化体分离质粒并命名为pCaHj527(图2)。
将pCaHj527上存在的NA2-tpi启动子通过使用 PCR系统根据生产商的说明进行定点突变。使用下述所示突变引物141223将核苷酸134-144从GTACTAAAACC(SEQ ID NO:71)转变成CCGTTAAATTT(SEQID NO:72)。
引物141223:
5’-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3’(SEQ ID NO:73)
使用下述所示突变引物141222将核苷酸423-436从ATGCAATTTAAACT(SEQ ID NO:74)转变成CGGCAATTTAACGG(SEQ ID NO:75)。
引物141222:
5’-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3’(SEQ ID NO:76)
将得到的质粒命名为pMT2188(图3)。
将特异腐质霉内切葡聚糖酶V编码区从pCaHj170作为Bam HI-Sal I片段转入用Bam HI和Xho I消化的pMT2188,以产生pCaHj568(图4)。质粒pCaHj568包含突变的NA2-tpi启动子,其与特异腐质霉内切葡聚糖酶V全长编码序列可操作连接。
实施例3:pMJ05的构建
通过使用下述所示引物HiEGV-F和HiEGV-R,由pCaHj568 PCR扩增915bp特异腐质霉内切葡聚糖酶V全长编码区而构建质粒pMJ05。
引物HiEGV-F(有义):
5’-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO:77)
引物HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:78)
扩增反应液(50μl)由下述组成:1X ThermoPol反应缓冲液(New EnglandBiolabs,Beverly,MA,USA),0.3mM dNTP,10ng/μl pCaHj568,0.3μMHiEGV-F引物,0.3μM HiEGV-R引物,和2单位Vent DNA聚合酶(New England Biolabs,Beverly,MA,USA)。在 5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中温育反应物,程序为94℃ 30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下937bp的产物条带,并使用 凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA),根据生产商的说明纯化。
将937bp纯化的片段用作使用下述引物的后续扩增的模板DNA:
引物HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:79)
引物HiEGV-F-重叠(有义):
5’-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3’(SEQ IDNO:80)
斜体表示的引物序列与里氏木霉纤维二糖水解酶I基因(cbh1)启动子的17bp同源,并且加下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间的36bp重叠允许将包含里氏木霉cbh1启动子的994bp片段精确融合至包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液,0.3mMdNTP,1μl纯化的937bp PCR片段,0.3μM HiEGV-F-重叠引物,0.3μMHiEGV-R引物,和2单位Vent DNA聚合酶。在 5333中温育反应物,程序为94℃ 30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下945bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
使用下述所示引物进行单独的PCR,以从里氏木霉RutC30基因组DNA扩增从基因的ATG起始密码子的994bp上游延伸的里氏木霉cbh1启动子序列(有义引物进行工程改造以在5’末端包含Sal I限制性位点)。使用 Plant Maxi Kit分离里氏木霉RutC30基因组DNA。
引物TrCBHIpro-F(有义):
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:81)
引物TrCBHIpro-R(反义):
5’-GATGCGCAGTCCGCGGT-3’(SEQ ID NO:82)
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液,0.3mMdNTP,100ng/μl里氏木霉RutC30基因组DNA,0.3μM TrCBHIpro-F引物,0.3μM TrCBHIpro-R引物,和2单位Vent DNA聚合酶。在 5333中温育反应物,程序为94℃ 30秒,55℃ 30秒,和72℃ 120秒的30个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下998bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
将998bp纯化的片段用作使用下述引物的后续扩增的模板DNA。
引物TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:83)
引物TrCBHIpro-R-重叠:
5’-GGAGGGGGGAGGAACGCATGATGCGCAGTCCGCGGT-3’(SEQ IDNO:84)
斜体表示的引物序列与里氏木霉cbh1启动子的17bp同源,并且加下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠允许将包含里氏木霉cbh1启动子的994bp片段精确融合至包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液,0.3mMdNTP,1μl纯化的998bp PCR片段,0.3μM TrCHB1pro-F引物,0.3μMTrCBH1pro-R-重叠引物,和2单位Vent DNA聚合酶。在 5333中温育反应物,程序为94℃ 30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下1017bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
使用下述引物,用1017bp里氏木霉cbh1启动子PCR片段和945bp特异腐质霉内切葡聚糖酶V PCR片段作为后续扩增的模板DNA,利用重叠PCR将994bp cbh1启动子精确融合至918bp内切葡聚糖酶V全长编码区。
引物TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:85)
引物HiEGV-R:
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:86)
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液,0.3mMdNTP,0.3μM TrCHB1pro-F引物,0.3μM HiEGV-R引物,和2单位Vent DNA聚合酶。在 5333中温育反应物,程序为94℃ 30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下1926bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
使用 PCR克隆试剂盒(Invitrogen,Carlsbad,CA,USA),按照生产商的说明,将得到的1926bp片段克隆入 -Blunt-II- 载体(Invitrogen,Carlsbad,CA,USA)。用Not I和Sal I消化得到的质粒,使用 凝胶提取试剂盒将1926bp片段凝胶纯化,并使用T4 DNA连接酶(Roche,Indianapolis,IN,USA)连接入也用相同的两个限制性酶消化的pMJ04,以产生pMJ05(图5)。质粒pMJ05包含里氏木霉纤维二糖水解酶I启动子和终止子,其与特异腐质霉内切葡聚糖酶V全长编码序列可操作连接。
实施例4:pSMai130表达载体的构建
用下述所示引物993467(有义)和993456(反义),从作为模板的pJaL660(WO 2002/095014)PCR扩增2586bp DNA片段,所述片段从ATG起始密码子到TAA终止密码子,跨越米曲霉β-葡糖苷酶全长编码序列(cDNA序列为SEQ ID NO:15,而SEQ ID NO:16为推定的氨基酸序列;大肠杆菌DSM14240)。Spe I位点经工程改造位于反义引物的5’末端以促进连接。斜体表示的引物序列与里氏木霉cbh1启动子的24bp同源,并且加下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。
引物993467:
5’-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATCGAGG-3’(SEQ ID NO:87)
引物993456
5’-ACTAGTTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:88)
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),0.25mM dNTP,10ng pJaL660,6.4μM引物993467,3.2μM引物993456,1mM MgCl2,和2.5单位Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)。在 5333中温育反应物,程序为94℃ 1分钟,55℃ 1分钟,和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下2586bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
使用如下所示的引物993453(有义)和引物993463(反义)进行单独的PCR,以扩增里氏木霉cbh1启动子序列,所述序列从基因的ATG起始密码子的1000bp上游延伸,从而产生1000bp PCR片段。
引物993453:
5’-GTCGACTCGAAGCCCGAATGTAGGAT-3’(SEQ ID NO:89)
引物993463:
5’-CCTCGATCCAACCAAGCTTCATGATGCGCAGTCCGCGGTTGACTA-3’(SEQ ID NO:90)
斜体表示的引物序列与里氏木霉cbh1启动子的24bp同源,并且加下划线的引物序列与米曲霉β-葡糖苷酶全长编码区的22bp同源。启动子和编码序列之间46bp的重叠允许将包含里氏木霉cbh1启动子的1000bp片段精确融合至包含米曲霉β-葡糖苷酶编码区的2586bp片段。
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,100ng里氏木霉RutC30基因组DNA,6.4μM引物993453,3.2μM引物993463,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 5333中温育反应物,程序为94℃ 1分钟,55℃ 1分钟,和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下1000bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
使用上述所示引物993453(有义)和引物993456(反义),通过重叠PCR,将纯化的片段用作后续扩增的模板DNA,将包含里氏木霉cbh1启动子的1000bp片段精确融合至包含米曲霉β-葡糖苷酶全长编码区的2586bp片段。
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,6.4μM引物993453,3.2μM引物993456,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 5333中温育反应物,程序为94℃ 1分钟,60℃ 1分钟,和72℃ 4分钟的30个循环(15分钟的最后延伸)。
用Sal I和Spe I消化得到的3586bp片段并连接入用相同的两个限制性酶消化的pMJ04,以产生pSMai130(图6)。质粒pSMAi130包含里氏木霉纤维二糖水解酶I基因启动子和终止子,其与米曲霉天然β-葡糖苷酶信号序列和编码序列(即,全长米曲霉β-葡糖苷酶编码序列)可操作连接。
实施例5:pSMai135的构建
用下述引物993728(有义)和993727(反义),从作为模板的pJaL660 PCR扩增从Lys-20到TAA终止密码子的米曲霉β-葡糖苷酶成熟编码区(不包含天然信号序列,参见图7;SEQ ID NO:91和92是其信号肽和编码序列)。
引物993728:
5’-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3’(SEQ ID NO:93)
引物993727:
5’-GACTAGTCTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:94)
斜体表示的序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,并且加下划线的序列与米曲霉β-葡糖苷酶编码区的22bp同源。Spe I位点经工程改造入反义引物的5’末端。
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,10ng/μl pJaL660,6.4μM引物993728,3.2μM引物993727,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 5333中温育反应物,程序为94℃ 1分钟,55℃ 1分钟,和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下2523bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
使用如下所示的引物993724(有义)和引物993729(反义),进行单独的PCR扩增,以扩增1000bp里氏木霉cbh1启动子和63bp特异腐质霉内切葡聚糖酶V信号序列(ATG起始密码子到Ala-21,图8,SEQ ID NO:95和96)。
引物993724:
5’-ACGCGTCGACCGAATGTAGGATTGTTATCC-3’(SEQ ID NO:97)
引物993729:
5’-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3’(SEQ ID NO:98)
斜体表示的引物序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,并且加下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。
使用质粒pMJ05作为模板产生包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段,所述质粒pMJ05包含在cbh1启动子控制下的特异腐质霉内切葡聚糖酶V编码区。里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列之间共有42bp重叠,从而在2523bp米曲霉β-葡糖苷酶编码区的启动子和ATG起始密码子之间提供完美的连接。
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,100ng/μl pMJ05,6.4μM引物993728,3.2μM引物993727,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 5333中温育反应物,程序为94℃ 1分钟,60℃ 1分钟,和72℃ 4分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下1063bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
使用上述引物993724(有义)和引物993727(反义),通过重叠PCR,将纯化的重叠片段用作扩增模板,从而将包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确融合至包含米曲霉β-葡糖苷酶成熟编码区框的2523bp片段。
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,6.4μM引物993724,3.2μM引物993727,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 5333中温育反应物,程序为94℃ 1分钟,60℃ 1分钟,和72℃ 4分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下3591bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
用Sal I和Spe I消化得到的3591bp片段并连接入用相同的限制性酶消化的pMJ04,以产生pSMai135(图9)。质粒pSMAi135包含里氏木霉纤维二糖水解酶I基因启动子和终止子,其与特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列可操作连接。
实施例6:米曲霉β-葡糖苷酶与特异腐质霉内切葡聚糖酶V分泌信号的表达
将编码与特异腐质霉内切葡聚糖酶V分泌信号连接的成熟米曲霉β-葡糖苷酶的质粒pSMai135(图8)通过PEG介导的转化(Penttila等,1987,Gene 61155-164)导入里氏木霉RutC30。该质粒包含构巢曲霉amdS基因,以使转化子能以乙酰胺为唯一氮源生长。
在27℃和90rpm,在补加2%(w/v)葡萄糖和10mM尿苷的25ml YP培养基中将里氏木霉RutC30培养17小时。使用真空驱动一次性过滤系统(Millipore,Bedford,MA,USA),通过过滤收集菌丝体,并用去离子水洗涤两次,用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于包含15mg (Novozymes A/S, Denmark)每ml和0.36单位壳多糖酶(Sigma ChemicalCo.,St.Louis,MO,USA)每ml的20ml 1.2M山梨醇中,并在34℃以90rpm轻轻震荡温育15-25分钟,以产生原生质体。通过在400xg离心7分钟而收集原生质体,并用冰冷的1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数,并重悬于STC中至终浓度为1X108原生质体每ml。过量的原生质体在-80℃储存在Cryo 1℃ Freezing Container(Nalgene,Rochester,NY,USA)中。
将约7μg用Pme I消化的pSMai135加入100μl原生质体溶液并轻轻混合,然后加入260μl PEG缓冲液,混合,并在室温温育30分钟。然后加入STC(3ml)并混合,并将转化溶液涂布在使用构巢曲霉amdS筛选的COVE平板上。将平板在28℃温育5-7天。将转化体在COVE2平板上传代培养并在28℃生长。
将用pSMai135获得的命名为SMA135的六十七个转化体在含乙酰胺的新鲜平板上传代培养,并使其在28℃培养7天形成孢子。
将67个SMA135里氏木霉转化子在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中在pH 6.0培养,接种转化子的孢子,并在28℃和200rpm培养7天。使用里氏木霉RutC30作为对照。在第7天移出培养液样品。在微 型离心机中在15,700xg将一ml每种培养液离心5分钟,并将上清液转移至新管中。样品在进行酶试验前于4℃保存。使用对硝基苯基-β-D-葡萄吡喃糖苷作为底物测试上清液的β-葡糖苷酶活性,如下所述。
使用在50mM琥珀酸pH 5.0中以1∶10稀释的培养物上清液的25μl等分试样,在溶于50mM琥珀酸pH 5.0中的200μl 0.5mg/ml作为底物的对硝基苯基-β-D-葡萄吡喃糖苷中,在环境温度确定β-葡糖苷酶活性。在15分钟温育后,通过加入100μl 1M Tris-HCl pH 8.0而终止反应,并用分光光度计读取405nm处的吸光度。一单位的β-葡糖苷酶活性对应于在pH 5.0、环境温度,每升每分钟产生1微摩尔对硝基苯(p-nitrophenyl)。使用黑曲霉β-葡糖苷酶(NOVOZYMTM188,Novozymes A/S, Denmark)作为酶标准。
很多SMA135转化体产生的β-葡糖苷酶活性是由里氏木霉RutC30分泌的酶活性的几倍高。在筛选的SMA135转化体中,转化体SMA135-04产生最高的β-葡糖苷酶活性。
用 系统(Bio-Rad,Hercules,CA,USA),使用 Tris-HCl(5%解析)凝胶进行SDS-PAGE。将五微升第7天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液(Bio-Rad,Hercules,CA,USA)中,并在存在5%β-巯基乙醇的情况下煮沸3分钟。将上清液样品上样于聚丙烯酰胺凝胶并用1XTris/甘氨酸/SDS作为电泳缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。将得到的凝胶用BIO- 考马斯染料(Bio-Rad,Hercules,CA,USA)染色。
在通过SDS-PAGE分析的38个里氏木霉SMA135转化体中,26个产生约110kDa的蛋白质,其在作为对照的里氏木霉RutC30中见不到。转化体里氏木霉SMA135-04产生最高水平的β-葡糖苷酶,如通过由SDS-PAGE所见的110kDa条带的丰度(abundance)所证明的。
实施例7:表达载体pSMai140的构建
通过用Nco I消化质粒pSATe111BG41(WO 04/099228),其携带米曲霉β-葡糖苷酶变体BG41全长编码区(SEQ ID NO:17,其编码SEQ ID NO:18的氨基酸序列),构建表达载体pSMai140。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离得到的1243bp片段,并使用 凝胶提取试剂盒,根据生产商的说明纯化。
用Nco I消化表达载体pSMai135,并通过1.0%琼脂糖凝胶电泳,使用TAE 缓冲液分离8286bp片段,并使用 凝胶提取试剂盒,根据生产商的说明纯化。然后使用T4 DNA连接酶(Roche,Indianapolis,IN,USA),根据生产商的规程,将1243bp由Nco I消化的米曲霉β-葡糖苷酶变体BG41片段连接至8286bp载体片段,以产生表达载体pSMai140(图10)。质粒pSMai140包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子,其与特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶变体成熟编码序列可操作连接。
实施例8:用pSMai140转化里氏木霉RutC30
用Pme I将质粒pSMai140线性化,并转化入如实施例6所述的里氏木霉RutC30菌株。从四次独立的转化实验获得共100个转化体,所有转化体在摇瓶中以纤维素酶诱导培养基培养,并如实施例6所述由转化体的培养基测定β-葡糖苷酶活性。很多里氏木霉SMA140转化体显示出的β-葡糖苷酶活性为里氏木霉RutC30的几倍高。
通过如实施例6所述的SDS-聚丙烯酰胺凝胶电泳和对相同的13份培养物上清液考马斯染色(由此分析酶活),检测培养基中是否存在米曲霉β-葡糖苷酶变体BG41蛋白质。具有高β-葡糖苷酶活性的全部十三个转化体还以不同的产率表达约110KDa米曲霉β-葡糖苷酶变体BG41。
将如通过β-葡糖苷酶活性试验和SDS-聚丙烯酰胺凝胶电泳评价的,最高β-葡糖苷酶变体表达的转化体,命名为里氏木霉SMA140-43。
实施例9:表达载体pSaMe-F1的构建
用pMJ05为模板和下述所示引物,PCR扩增包含里氏木霉纤维二糖水解酶I基因启动子的209bp和特异腐质霉内切葡聚糖酶V基因的核心区(SEQ IDNO:15的核苷酸1至702,其编码SEQ ID NO:16的氨基酸1至234;WO91/17243)的DNA片段。
引物995103:
5’-cccaagcttagccaagaaca-3’(SEQ ID NO:99)
引物995137:
5’-gggggaggaacgcatgggatctggacggc-3’(SEQ ID NO:100)
扩增反应液(50μl)由下述物质组成:1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,10ng/μl pMJ05,50皮摩尔995103引物,50皮摩尔995137 引物,和2单位Pfx DNA聚合酶。在 5333中温育反应物,程序为94℃ 30秒,55℃ 30秒,和72℃ 60秒的30个循环(3分钟的最后延伸)。
使用如下所示的引物,以pSMai140为模板,PCR扩增包含米曲霉β-葡糖苷酶变体BG41基因的806bp的DNA片段。
引物995133:
5’-gccgtccagatccccatgcgttcctccccc-3’(SEQ ID NO:101)
引物995111:
5’-ccaagcttgttcagagtttc-3’(SEQ ID NO:102)
扩增反应液(50μl)由下述物质组成:1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,100ng pSMai140,50皮摩尔995133引物,50皮摩尔995111引物,和2单位Pfx DNA聚合酶。在 5333中温育反应物,程序为94℃ 30秒,55℃ 30秒,和72℃ 120秒的30个循环(3分钟的最后延伸)。
然后将上述两个PCR片段进行重叠PCR。使用上述引物995103(有义)和引物995111(反义),将纯化的重叠片段用作扩增模板,通过重叠PCR将包含里氏木霉纤维二糖水解酶I基因启动子的209bp和特异腐质霉内切葡聚糖酶V核心序列的702bp片段精确融合至包含米曲霉β-葡糖苷酶变体BG41编码区部分的806bp片段。
扩增反应液(50μl)由下述物质组成:1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,2.5μl每个片段(20ng/μl),50皮摩尔995103引物,50皮摩尔995111引物,和2单位高保真Pfx DNA聚合酶。在 5333中温育反应物,程序为95℃ 3分钟的初始变性,然后是30个循环的1分钟变性,60℃ 1分钟退火,和72℃ 3分钟延伸。
根据生产商说明,将1.7kb片段连接入 4 Blunt载体(Invitrogen,Carlsbad,CA,USA)。然后根据生产商的快速化学转化方法,将构建体转化入ONE TOP10化学感受态大肠杆菌细胞(Invitrogen,Carlsbad,CA,USA)。选择菌落并通过质粒分离进行分析,并用HindIII消化以释放1.7kb重叠PCR片段。
用Hind III消化质粒pSMai140以使质粒线性化。使用快速DNA连接试剂盒,按照生产商的说明,将两个经消化的片段合并在连接反应物中,以产生pSaMe-F1(图11)。
用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene,LaJolla,CA,USA)。通过对来自由已转化大肠杆菌纯化的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶变体BG41,和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序,确认构建体的身份。将包含重组质粒的一个克隆命名为pSaMe-F1。质粒pSaMe-F1包含里氏木霉纤维二糖水解酶I基因启动子和终止子,和与特异腐质霉内切葡聚糖酶V核心多肽直接连接的特异腐质霉内切葡聚糖酶V信号肽序列,它们直接融合至与米曲霉β-葡糖苷酶变体BG41成熟编码序列直接连接的特异腐质霉内切葡聚糖酶V信号肽。米曲霉β-葡糖苷酶变体BG融合蛋白的DNA序列和推定的氨基酸序列分别如SEQ ID NO:103和104所示。
实施例10:用pSaMe-F1转化里氏木霉RutC30
用5X107个里氏木霉RutC30孢子接种包含补加2%葡萄糖和10mM尿苷的25mlYP培养基的摇瓶。在27℃和90rpm过夜培养约16小时后,使用真空驱动一次性过滤系统收集菌丝体,将菌丝体在100ml去离子水中和1.2M山梨醇中各洗涤两次。如实施例6中所述产生原生质体。
将用Pme I线性化的两微克pSaMe-F1 DNA,100μl里氏木霉RutC30原生质体,和50% PEG(4000)混合并在室温温育30分钟。然后加入3m1 STC并将内容物倒在补加10mM尿苷的COVE平板上。然后在28℃温育平板。到第6天开始出现转化体,并将转化体挑取到COVE2平板,28℃生长6天。回收了22个里氏木霉转化体。
在摇瓶中以纤维素酶诱导培养基培养转化体,并如实施例6所述测定β-葡糖苷酶活性。很多pSaMe-F1转化体产生β-葡糖苷酶活性。一个命名为里氏木霉SaMeF1-9的转化体产生的β-葡糖苷酶量最高,并且活性是表达米曲霉β-葡糖苷酶变体的菌株(实施例9)的两倍。
根据Beguin,1983,Analytical Biochem.131(2):333-336,使用羧甲基纤维素(CMC)覆盖试验测定内切葡聚糖酶活性。将来自五个培养液样品(具有最高的β-葡糖苷酶活性的那些)的五微克总蛋白质在天然样品缓冲液(Bio-Rad,Hercules,CA,USA)中稀释,并在 8-16% Tris-HCl凝胶(Bio-Rad,Hercules,CA,USA)上使用10X Tris/甘氨酸电泳缓冲液(Bio-Rad,Hercules,CA,USA)跑胶,然后将凝胶放在包含1%羧甲基纤维素酶(CMC)的平板顶部。在37℃温育1小时后,用0.1%刚果红将凝胶染色20分钟。然后使用1M NaCl将平板脱色,以鉴定指示内切葡聚糖酶活性的澄清区域。可见两个澄清区,上面的区域约110kDa,下面的区域约25kDa。如果两个蛋白质未剪切并且仍为单一的多肽,特异腐质霉内切葡聚糖酶V和米曲霉β-葡糖苷酶变体BG41融合体的预计蛋白质大小为118kDa,单个内切葡聚糖酶V核心域和β-葡糖苷酶的糖基化会导致每个蛋白质迁移到比由一级序列预计的值更高的mw。如果两个蛋白质被剪切,那么特异腐质霉内切葡聚糖酶V核心域的预计大小为24kDa,而米曲霉β-葡糖苷酶变体BG41的预计大小为94kDa。因为有110kDa的澄清区,这一结果说明内切葡聚糖酶和β-葡糖苷酶融合蛋白的群体作为单个的大蛋白质最低限度地保持完整。下面的澄清区最可能代表内源的内切葡聚糖酶活性,并且可能额外由于特异腐质霉内切葡聚糖酶V核心域从米曲霉β-葡糖苷酶部分剪切而产生。
结果证明特异腐质霉内切葡聚糖酶V核心即使与米曲霉β-葡糖苷酶连接也是有活性的。此外,β-葡糖苷酶活性的增加看来是由于与非融合β-葡糖苷酶分泌效率相比,蛋白质分泌增加。通过将米曲霉β-葡糖苷酶变体BG41序列连接至有效分泌的特异腐质霉内切葡聚糖酶V核心,分泌了更多的β-葡糖苷酶。
实施例11:载体pSaMe-FX的构建
通过修饰pSaMe-F1而构建质粒pSaMe-FX。用Bst Z17和Eco RI消化质粒pSaMe-F1,产生包含β-葡糖苷酶变体BG41变体编码序列的1kb片段和包含质粒剩余部分的9.2kb片段。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液 分离片段,其中从凝胶切下9.2kb的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。质粒pSMai135也用Bst Z17和Eco RI消化,产生包含与米曲霉β-葡糖苷酶变体BG41编码序列同源的碱基的1kb片段和包含质粒剩余部分的8.5kb片段。如上分离并纯化1kb片段。
使用快速DNA连接试剂盒,根据生产商的说明将9.2kb和1kb片段合并在连接反应中,产生pSaMe-FX,其除了包含野生型β-葡糖苷酶成熟编码序列而不是变体成熟编码序列之外,与pSaMe-F1相同。
用连接产物转化大肠杆菌 感受态细胞(Stratagene,La Jolla,CA,USA)。通过对来自由已转化大肠杆菌纯化的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列,和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序,确认构建体的身份。将包含重组质粒的一个克隆命名为pSaMe-FX(图12)。米曲霉β-葡糖苷酶融合蛋白的DNA序列和推定的氨基酸序列分别如SEQ IDNO:105和106所示。
实施例12:木霉属转化体的转化和表达
用Pme I将pSaMe-FX线性化并如实施例10所述转化入里氏木霉RutC30菌株。一次转化获得共63个转化体。在摇瓶中以纤维素酶诱导培养基培养转化体,并如实施例6所述测定β-葡糖苷酶活性。很多pSaMe-FX转化体产生β-葡糖苷酶活性。一个命名为SaMe-FX16的转化体产生的β-葡糖苷酶活性的量是里氏木霉SaMeF1-9(实施例10)的两倍。
实施例13:里氏木霉转化体的分析
通过将特异腐质霉内切葡聚糖酶V核心(包含其本身的天然信号序列)和与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉β-葡糖苷酶变体BG41成熟编码序列融合,如实施例9所述构建融合蛋白。这个融合构建体和与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉β-葡糖苷酶变体BG41成熟编码序列相比,分泌的β-葡糖苷酶活性增加两倍。如实施例11所述制备由如下组成的第二个融合构建体:融合于与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉野生型β-葡糖苷酶编码序列的特异腐质霉内切葡聚糖酶V核心 (包含其本身的信号序列)组成,这进一步改善β-葡糖苷酶活性。用野生型融合体转化的菌株相对于用β-葡糖苷酶变体BG41融合体转化的菌株,具有两倍的分泌的β-葡糖苷酶活性。
实施例14:将β-葡糖苷酶融合蛋白编码序列克隆入米曲霉表达载体
设计两个合成寡核苷酸引物,如下所示,从编码β-葡糖苷酶融合蛋白的pSaMeFX PCR扩增全长开放阅读框。
PCR正向引物:
5’-GGACTGCGCAGCATGCGTTC-3’(SEQ ID NO:107)
PCR反向引物:
5’-AGTTAATTAATTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:108)
黑体字代表编码序列。正向引物中加下划线的“G”代表引入而产生SphI限制性位点的碱基变化。其余序列包含与pSaMeFX的插入位点相比的序列同一性。反向引物中加下划线的序列代表加入以促进克隆入表达载体pAlLo2(WO 04/099228)的Pac I限制性位点。
在PCR反应中使用上述引物各五十皮摩尔,反应物在50μl终体积中包含50ng pSaMeFX DNA,1X Pfx扩增缓冲液,6μl 10mM dATP、dTTP、dGTP和dCTP的混合物,2.5单位 Pfx DNA聚合酶,和1μl 50mMMgSO4。使用 5333扩增片段,程序为98℃ 2分钟的1个循环;和96℃ 30秒,61℃ 30秒,和68℃ 3分钟的35个循环。在35个循环后,在68℃温育反应物10分钟,然后在10℃冷却,直至进一步处理。使用TAE缓冲液和0.1μg溴化乙锭每ml,在0.8% GTG-琼脂糖凝胶(Cambrex Bioproducts One Meadowlands Plaza East Rutherford,NJ,USA)上分离3.3kb PCR反应产物。在DARK READERTM(Clare Chemical Research,Dolores,CO,USA)辅助下显示DNA,以避免UV诱导的突变。用一次性剃刀片剪切3.3kb DNA条带,并用 -DA旋转杯(Millipore,Billerica,MA,USA),根据生产商的说明纯化。
将纯化的3.3kb PCR产物克隆入 4Blunt- 载体(Invitrogen,Carlsbad,CA,USA)。将四微升纯化的PCR产物与1μl 2M氯化钠溶液和1μl 载体混合。在室温温育反应物15分钟,然后使用2μl反应物,根据生产商的说明,转化One TOP10化学感受态大肠杆菌细胞。将83μl 各转化反应物的三份等分试样涂布在三个补加100μg氨苄青霉素每ml的150mm 2X YT平板上,并在37℃过夜温育。
使用八个重组菌落,接种于包含3ml LB培养基的液体培养基中,所述LB培养基补加100μg氨苄青霉素每ml。使用 9600(QIAGEN Inc.,Valencia,CA,USA)由这些培养基制备质粒DNA。通过用Pac I限制性酶消化而分析克隆。用Pac I消化来自每个克隆的质粒DNA,并使用TAE缓冲液通过1.0%琼脂糖凝胶电泳进行分析。所有八个克隆都具有期望的限制性消化模式,并且选择克隆5、6、7和8测序,确认克隆的插入物中没有突变。它们5’和3’末端的序列分析表明所有4个克隆都具有正确的序列。选择克隆5和7进行进一步测序。两个克隆测序的Phred Q数值大于40,确保没有PCR诱导的错误。克隆5和7显示出具有期望的序列,并且选择克隆5重新克隆入pAILo2中。
通过用Sph I消化而将来自克隆5的质粒DNA线性化。然后通过加入1.2μl 10mM dATP、dTTP、dGTP和dCTP的混合物和6单位T4 DNA聚合酶(NewEngland Bioloabs,Inc.,Ipswich,MA,USA)而将线性化的克隆平端化。在12℃温育混合物20分钟,然后通过加入1μl 0.5M EDTA并在75℃加热20分钟使酶失活以终止反应。如上所述通过凝胶电泳和超滤而纯化编码β-葡糖苷酶融合蛋白的3.3kb片段。
通过用Nco I消化而将载体pAILo2线性化。然后通过加入0.5μl 10mMdATP、dTTP、dGTP和dCTP的混合物和一单位DNA聚合酶I而使线性化的载体平端化。在25℃温育混合物15分钟,然后通过加入1μl 0.5M EDTA并在75℃加热15分钟使酶失活而终止反应。然后用Pac I消化载体。如上所述通过凝胶电泳和超滤而纯化平端化的载体。
用快速连接试剂盒将编码β-葡糖苷酶融合蛋白的3.3kb片段克隆入线性化并纯化的pAILo2载体。使用1μl反应样品根据生产商的说明转化大肠杆菌XL10 Gold细胞(Stratagene,La Jolla,CA,USA)。在恢复期(recovery period)后,将来自转化反应物的两份100μl等分试样涂布在两个补加100μg氨苄青霉素每ml的150mm 2X YT平板上,并在37℃过夜温育。随机从选择平板上选择一组八个推定的重组克隆,并使用 9600由每个克隆制备质粒DNA。选择克隆1-4,用pAILo2-特异性引物测序,以确认接合载体/插入物具有正确的序列。克隆3具有完美的载体/插入物接合,并命名为pAILo47(图13)。
为了产生无标记物的表达菌株,进行限制性内切酶消化以将blaA基因与表达构建体其余部分分离,所述blaA基因赋予对抗生素氨苄青霉素的抗性。用Pme I消化三十微克pAILo47。然后通过如上所述琼脂糖电泳纯化消化的DNA。用剃刀片切下包含表达构建体但缺乏blaA基因的6.4kb DNA,并用 凝胶提取试剂盒纯化。
实施例15:特异腐质霉/米曲霉cel45Acore-cel3A融合基因在米曲霉JaL355中的表达
根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉JaL355(WO 00/240694)原生质体。使用十微升纯化的实施例14的表达构建体转化米曲霉JaL355原生质体。米曲霉JaL355的转化得到约90个转化体。将五十个转化体分离到单独的PDA平板,并在34℃温育五天。
用3ml 0.01% 80洗涤四十八块汇合的孢子平板,并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。在34℃以200rpm恒定震荡温育转化体培养物。5天后,将每个培养物的1ml等分试样以12,000xg离心并收集上清液。将每份上清液的五微升与相等体积的2X上样缓冲液(10%β-巯基乙醇)混合,并载于1.5mm 8%-16% Tris-甘氨酸SDS-PAGE凝胶上,并用BIO- 考马斯蓝G250蛋白质染料(Bio-Rad,Hercules,CA,USA)染色。培养液的SDS-PAGE谱表明48个转化体中有33个能表达新蛋白质,所述蛋白质的表观分子量与期望的118kDa非常接近。转化体21产量最大,选择它进行进一步的研究。
实施例16:米曲霉JaL355转化体21的单孢子分离
将米曲霉JaL355转化体21孢子涂布在PDA平板上,并在34℃温育5天。用0.5ml 0.01% 80洗涤汇合的孢子平板其中一小部分,以重悬孢子。用0.01% 80将孢子悬浮液的100μl等分试样稀释至终体积5ml。在血球计数器的帮助下,确定孢子浓度,并稀释至终浓度为0.1孢子每微升。将孢子稀释液的200μl等分试样涂布在150mm基本培养基平板并在34℃温育2-3天。从平板切下出现的菌落并转移至PDA平板,并在34℃温育3天。然后将孢子涂布在平板上,并在34℃再温育5天。
用3ml 0.01% 80洗涤汇合的孢子平板,并使用孢子悬浮液接 种125ml玻璃摇瓶中的25ml MDU2BP培养基。在34℃以200rpm恒定震荡温育单孢子培养物。5天后,在12,000xg将每种培养物的1ml等分试样离心,并收集它们的上清液。将五微升每份上清液与等体积的2X上样缓冲液(10%β-巯基乙醇)混合,并载于1.5mm 8%-16% Tris-甘氨酸SDS-PAGE凝胶上,并用BIO- 考马斯蓝G250蛋白质染料染色。培养液的SDS-PAGE谱显示所有8个转化体都能以非常高的水平表达β-葡糖苷酶融合蛋白,并且一种命名为米曲霉JaL355AILo47的培养物能产生最大的产量。
实施例17:pCW087的构建
设计如下所示的两个合成寡核苷酸引物,以从质粒pDZA2-7PCR扩增桔橙嗜热霉GH61A多肽基因(WO 2005/074656)。正向引物具有平端5’末端,并且反向引物在3’末端并入Pac I位点。
正向引物:
5’-ATGTCCTTTTCCAAGATAATTGCTACTG-3’(SEQ ID NO:109)
反向引物:
5’-GCTTAATTAACCAGTATACAGAGGAG-3’(SEQ ID NO:110)
在PCR反应中使用上述引物各五十皮摩尔,反应物在50μl终体积中包含50ng pDZA2-7,1μl 10mM dATP、dTTP、dGTP和dCTP的混合物,5μl10X ACCUTAQTM DNA聚合酶缓冲液(Sigma-Aldrich,St.Louis,MO,USA),和5单位ACCUTAQTM DNA聚合酶(Sigma-Aldrich,St.Louis,MO,USA)。使用 5333扩增DNA片段,程序为95℃3分钟的1个循环;94℃ 45秒,55℃ 60秒,和72℃ 1分钟的30个循环。在25个循环后,在72℃温育反应物10分钟,然后在4℃冷却,直至进一步处理。使用Pac I消化桔橙嗜热霉GH61APCR片段的3’末端。根据生产商的说明,使用MINELUTETM Reaction Cleanup试剂盒(QIAGEN Inc.,Valencia,CA,USA)纯化消化产物。
用5’末端的平端Nco I位点和3’末端的Pac I位点,将纯化的GH61A片段直接克隆入pSMai155(WO 2005/074647)。用Nco I和Pac I消化质粒pSMai155。然后使用Klenow酶填充进5’凹陷的Nco I位点而使Nco I位点补平。Klenow反应物由20μl pSma155消化反应混合物加1mM dNTP和1μlKlenow酶组成,一起在室温简单温育。根据生产商的说明,使用MINELUTETM Reaction Cleanup试剂盒纯化刚刚线性化的pSMai155质粒。这些反应导致产生与新产生的GH61A片段相容的5’平末端和3’Pac I位点。然后使用快速DNA连接试剂盒(Roche,Indianapolis,IN,USA),按照生产商的说明,将GH61片段克隆入pSMai155表达载体。用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene,La Jolla,CA,USA)。通过将来自纯化自转化的大肠杆菌的质粒的GH61A编码序列进行DNA测序而确认构建体的身份。将包含重组质粒的一个大肠杆菌克隆命名为pCW087-8。
实施例18:pSaMe-Ta61A的构建
通过用Nsi I消化携带amdS选择性标记的质粒pMJ09而构建表达载体pSaMe-Ta61(WO 2005/056772),其释放了2.7kb的amdS片段。然后使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离2.7kb amdS片段,并使用 凝胶提取试剂盒纯化。
用Nsi I消化表达载体pCW087,使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离4.7kb片段,并使用 凝胶提取试剂盒纯化。然后使用T4 DNA连接酶(Roche,Indianapolis,IN,USA),根据生产商的规程,将2.7kb amdS片段连接至4.7kb载体片段,产生表达载体pSaMe-Ta61A。质粒pSaMe-Ta61包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子,其与桔橙嗜热霉GH61A成熟编码序列可操作地连接。
实施例19:里氏木霉菌株SaMe-MF268的构建
使用共转化将质粒pSaMe-FX和pSaMe-Ta61A导入里氏木霉RutC30。将质粒pSaMe-FX和pSaMe-Ta61A通过PEG介导的转化导入里氏木霉RutC30(Penttila等,1987,见上文)。每个质粒包含构巢曲霉amdS基因,以使转化体能以乙酰胺为唯一氮源而生长。
在27℃和90rpm,在补加2%(w/v)葡萄糖和10mM尿苷的25ml YP培养基中培养里氏木霉RutC30 17小时。使用真空驱动一次性过滤系统过滤而收集菌丝体,并用去离子水洗涤两次,用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于20ml 1.2M山梨醇中而产生原生质体,所述山梨醇包含15mg (Novozymes A/S, Denmark)每ml和0.36单位壳多糖酶(Sigma Chemical Co.,St.Louis,MO,USA)每ml,并在34℃以90rpm 温和震荡温育15-25分钟。通过在400xg离心7分钟而收集原生质体,并用冷1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数,并将其重悬于STC中至终浓度为1X108原生质体每ml。将过量的原生质体于-80℃保存在Cryo 1℃ Freezing Container(Nalgene,Rochester,NY,USA)中。
用Pme I消化约各4μg质粒pSaMe-FX和pSaMe-Ta61A,以促进去除抗生素抗性标记ampR。在用Pme I消化后,使用TAE缓冲液在1%琼脂糖凝胶上将线性片段跑胶,以分离各个片段。从凝胶切下来自pSaMe-FX的7.5kb片段和来自pSaMe-Ta61A的4.7kb片段,并根据生产商的说明,使用QIAquick凝胶提取试剂盒纯化。这些纯化的片段包含amdS选择性标记盒,里氏木霉cbh1基因启动子和终止子;此外,片段包括特异腐质霉EGV核心/米曲霉BG融合编码序列或桔橙嗜热霉GH61A编码序列。转化中使用的片段不包含抗生素标记,因为这个凝胶纯化步骤去除了ampR片段。然后向100μl原生质体溶液加入纯化片段,并温和混合,之后加入260μl PEG缓冲液,混合,并在室温温育30分钟。然后加入STC(3ml)并混合,并将转化溶液涂布在使用amdS选择的COVE平板上。在28℃温育平板5-7天。将转化体在COVE2平板上传代培养,并在28℃生长。
将超过400个转化体在包含乙酰胺的新鲜平板上传代培养,并在28℃ 7天产生孢子。
在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养里氏木霉转化体,所述培养基在pH 6.0接种转化体的孢子,并在28℃和200rpm培养5天。将里氏木霉RutC30作为对照。在第5天移出培养液样品。将各一毫升培养液在微型离心机中以15,700xg离心5分钟,并将上清液转移至新管。
使用 Tris-HCl(5%解析)凝胶,用 系统进行SDS-PAGE。将五微升第5天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液(Bio-Rad,Hercules,CA,USA)中,并在存在5%β-巯基乙醇的情况下煮沸3分钟。将上清液样品载于聚丙烯酰胺凝胶上,并用1X Tris/甘氨酸/SDS作为电泳缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。将得到的凝胶用BIO- 考马斯染料染色。然后在PCS水解反应中测试转化体以鉴定产生最佳水解培养液的菌株,所述转化体显示桔橙嗜热霉GH61A多肽和融合蛋白表达,该融合蛋白由与米曲霉β-葡糖苷酶融合的特异腐质霉内切葡聚糖酶V核心(Cel45A)组成,如通过观察SDS-PAGE凝胶上的条带所见。
实施例20:里氏木霉菌株SaMe-MF268的鉴定
在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养显示桔橙嗜热霉GH61A多肽和米曲霉β-葡糖苷酶融合蛋白的表达的转化体,所述培养基在pH 6.0接种转化体的孢子,并在28℃和200rpm温育5天。
在6000xg离心摇瓶培养液,并使用STERICUPTM EXPRESSTM(Millipore,Bedford,MA,USA)在水解前过滤至0.22μm。通过水解PCS并产生糖的能力来测定培养液的活性,所述糖可通过对其还原末端进行化学测定来检测。
在美国能源部国家可再生能源实验室(U.S.Department of Energy NationalRenewable Energy Laboratory(NREL),Boulder,CO,USA)使用稀硫酸预处理玉米秸秆。使用下述条件预处理:0.048g硫酸/g干燥生物质,在190℃,重量百分比为25%干燥固体,约1分钟。经预处理的玉米秸秆(PCS)中不溶于水的固体包含59.2%纤维素,如通过有限消化PCS以释放葡萄糖和纤维二糖而确定的。在酶水解前,用大体积双去离子水洗涤PCS;水洗PCS的干重为17.73%。
将1kg量的PCS悬浮于约20升双去离子水中并且,在PCS沉淀后,将水倾析。重复这个过程直至洗涤水为pH 4.0以上,此时还原糖低于0.06g每升。对于小体积实验(例如,1ml),通过100目筛子筛沉淀的浆料,确保能移取。经洗涤的PCS的百分比干重含量通过将样品在105℃烘箱干燥至少24小时(至恒重)并与湿重相比而确定。
在由ALPS 300TM自动实验室封板仪(ABgene Inc.,Rochester,NY,USA)加热密封的96孔深孔板中,以1ml体积进行PCS水解。在50mM乙酸钠pH 5.0中的PCS浓度为10g每升。在50℃进行PCS水解,除了在所述取样过程中之外无其它搅拌。每个反应重复进行三次。通过对-羟基苯甲酸酰肼(PHBAH)试剂,如下所述分析释放的还原糖。
将体积为0.8ml的PCS(12.5g每升水中)移取到96孔深孔板的每个孔中,然后加入0.10ml 0.5M乙酸钠pH 5.0,并且然后加入0.10ml稀释的酶溶液以启动反应,最终反应体积为10ml,PCS浓度为10g每升。将板密封。通过在水解开始时和每次取样时间点前倒置深孔板而使反应混合物混合。在每个取样时间点,将板混合,然后在2000rpm将深孔板离心(Sorvall RT7,配备RTH-250转子)10分钟,然后移出20μl水解物(上清液),并加入96孔微孔板中的180μl 0.4% NaOH中。必要时,可将这个终止溶液进一步稀释至还原糖 的正确范围。通过对-羟基苯甲酸酰肼试剂(PHBAH,Sigma,4-羟基苯甲酰肼)分析释放的还原糖:将50μl PHBAH试剂(1.5%)与100μl样品在V型底96孔THERMOWELLTM板(Costar 6511)中混合,在板加热块上在95℃温育10分钟,然后向每个孔加入50μl双去离子水,混合并将100μl转移至另一块平底96孔板(Costar 9017),并在410nm处读取吸收值。使用葡萄糖校准曲线在相同条件下计算还原糖。纤维素转化成还原糖的百分比转化率计算为:
%转化率=还原糖(mg/ml)/(加入的纤维素(mg/ml)x1.11)
因子1.11修正将纤维素水解成葡萄糖中的重量增加。
在1ml PCS水解测试后,将最好的候选菌株在2升发酵罐中生长,重复两次(in duplicate)。
摇瓶培养基由每升20g葡萄糖,10g玉米浆固体,1.45g(NH4)2SO4,2.08g KH2PO4,0.36g CaCl2,0.42g MgSO4·7H2O,和0.42ml痕量金属溶液组成。痕量金属溶液由每升216g FeCl3·6H2O,58g ZnSO4·7H2O,27g MnSO4·H2O,10g CuSO4·5H2O,2.4g H3BO3,和336g柠檬酸组成。
向500ml摇瓶中加入十毫升摇瓶培养基。用来自固体平板培养物的两块琼脂块接种摇瓶,并在28℃在定轨摇床上以200rpm温育48小时。使用五十毫升摇瓶培养液接种3升发酵容器。
发酵分批培养基由每升30g纤维素,4g葡萄糖,10g玉米浆固体,3.8g(NH4)2SO4,2.8g KH2PO4,2.64g CaCl2,1.63g MgSO4·7H2O,1.8ml消泡剂,和0.66ml痕量金属溶液组成。痕量金属溶液由每升216g FeCl3·6H2O,58gZnSO4·7H2O,27g MnSO4·H2O,10g CuSO4·5H2O,2.4g H3BO3,和336g柠檬酸组成。发酵补料培养基由葡萄糖和纤维素组成。
向3升发酵罐中加入共1.8升的发酵批式培养基。以0至4g/l/小时的速率在165小时的期间内补加发酵补料培养基。发酵容器保持在28℃的温度,并且pH控制在4.75+/-0.1的设置点。以1vvm的速率向容器加入空气,并通过Ruston叶轮在1100至1300rpm旋转而搅拌培养液。在发酵结束时,从容器收获全部培养液,并以3000rpm xg离心去除生物质。将上清液无菌过滤并在35至40℃保存。
确定总蛋白质浓度,并如下所述在50g PCS水解反应中重复测试培养液。在每次实验前,由保存于4℃的储备酶溶液新鲜制备酶稀释液。
根据NREL实验室分析规程#008,使用50g的总反应物质量,使用带螺旋 盖的125ml Erlenmeyer三角瓶(VWR,West Chester,PA,USA)进行PCS的水解。在这个规程中,使用不同蛋白质加载量(用mg蛋白质每克纤维素表示)的2升发酵培养液样品进行PCS(在50mM乙酸钠pH 5.0缓冲水溶液中约11.4的PCS和6.8%的纤维素)的水解。在50℃使用 4080培养箱(New BrunswickScientific,Edison,NJ,USA)以150rpm的定轨振荡进行PCS水解能力的测试。在水解过程中,在72、120和168小时取等分试样并离心,并且使用 HV 0.45μm膜(Millipore,Billerica,MA,USA)通过 RT7板离心机(Thermo Fisher Scientific,Waltham,MA,USA)在2000rpm离心10分钟过滤上清液。在不立即使用时,将过滤的含糖等分试样在-20℃冷冻。通过0.005M H2SO4以0.4ml每分钟的流速在65℃从4.6x250mm HPX-87H柱(Bio-Rad,Hercules,CA,USA)洗脱,并使用以纯糖样品校准的 1100 HPLC(Agilent Technologies,SantaClara,CA,USA),由折射系数检测通过积分葡萄糖和纤维二糖信号而定量后,测量稀释于0.005M H2SO4的样品的糖浓度。所得的等同物用于计算每个反应的纤维素转化的百分数。
使用下述等式计算纤维素转化成葡萄糖与纤维二糖的程度(转化率,%):
转化率(%)=(葡萄糖+纤维二糖x1.053)(mg/ml)x100x162/(纤维素(mg/ml)x180)=(葡萄糖+纤维二糖x1.053)(mg/ml)x100/(纤维素(mg/ml)x1.111)
在这个等式中,因子1.111反映在将纤维素转化成葡萄糖的过程中的重量增加,而因子1.053反映将纤维二糖转化成葡萄糖的过程中的重量增加。
在上述50g三角瓶实验中PCS水解反应的结果如表1所示。将产生最佳性能的培养液的一株菌命名为里氏木霉SaMe-MF268。
表1:在168小时的时间点转化为糖的百分比
实施例21:载体pSaMe-FH的构建
通过用Bsp 120I和Pac I消化质粒pSMai155(WO 2005/074647)和质粒pSaMe-FX(实施例11)而构建表达载体pSaMe-FH(图14)。然后使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离来自pSMai155的5.5kb片段和来自pSaMeFX的3.9kb片段,并使用 凝胶提取试剂盒纯化。然后使用T4 DNA连接酶,根据生产商的规程连接两个片段。用连接产物转化大肠杆菌 感受态细胞。通过对来自纯化自已转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列,和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序而确认构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-FH。质粒pSaMe-FH包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子,其与特异腐质霉Cel45A核心/米曲霉β-葡糖苷酶的基因融合体可操作地连接。质粒pSaMe-FH与pSaMe-FX相同,除了amdS选择性标记已去除,并用潮霉素抗性选择性标记代替。
实施例22:纤维素酶产生增加并且降解经预处理的玉米秸秆(PCS)能力增强的里氏木霉SMA135-04的突变体的分离
使用PCS(实施例20)作为纤维素底物,进行纤维素分解酶实验并用于选择平板。在实验前,用大体积蒸馏去离子水洗涤PCS,直至过滤液pH大于pH 4.0。此外,使用100MF金属过滤器筛PCS以去除颗粒。将已洗涤和过滤的PCS重悬于蒸馏水中,至浓度为60mg/ml的悬浮液,并在4℃保存。
用N-甲基-N-硝基-N-硝基胍(NTG)(Sigma Chemical Co.,St.Louis,MO,USA)对里氏木霉菌株SMA135-04(实施例6)进行诱变处理,NTG是一种主要诱导碱基取代和某些缺失的化学诱变剂(Rowlands,1984,Enzyme Microb.Technol.6:3-10)。完成了恒定处理时间和不同NTG剂量,及恒定NTG浓度和不同处理时间的存活曲线,得到10%的存活水平。为了获得这个存活率,用0.2mg/ml NTG在37℃及温和旋转下处理分生孢子悬浮液20分钟。每次实验以不用NTG处理分生孢子为对照进行,并且将其作为突变体相对于未诱变培养物的竞争性生长的对照。
在NTG处理后进行突变体的初选。将诱变后存活的共8x106个分生孢子在包含0.5%胰蛋白胨、0.1% Triton X-100和1.5g琼脂的30ml孟德尔培养基中混合。然后向深板(直径150mm,深25mm;Corning Inc,NY,USA)加入这个悬浮液,而琼脂使其在室温硬化。在硬化琼脂后,加入包含0.5%胰蛋白胨、0.1% Triton X-100、1.5%琼脂和1.0% PCS的200ml孟德尔培养基。在硬化琼脂后在28℃温育板。在温育3-5天后,使用在未处理对照菌株之前渗透过PCS选择层的700个菌落进行二次选择。
对于二次筛选,向包含25ml纤维素酶诱导培养基的125ml摇瓶加入来自每个分离物的三满环分生孢子,并在28℃和200rpm温育5天,以诱导纤维素酶的表达和分泌。在微型离心机中将每份培养液中的一毫升以400xg离心5分钟,并测试上清液的PCS水解活性和总蛋白质收率。
通过将摇瓶培养液样品以1∶20在50mM乙酸钠pH 5.0中稀释而进行“机械化(robotic)”PCS水解试验。在稀释前,以400μl样品每g PCS向实验板(96孔平底板)加入稀释样品。使用 FX(Beckman Coulter,Fullerton,CA),以10g PCS每升加入PCS,然后加入50mM乙酸钠pH 5.0至总体积180μl。在潮湿的盒子中在30℃温育实验板5天,250rpm震荡。为了增加实验的统计精确性,每个样品进行6次重复。然而,对于1∶20样品稀释液使用2个重复。5天温育后,使用PHBAH实验测定水解PCS样品中还原糖(RS)的浓度,所述方法经修改并适于96孔微孔板形式。使用ORCATM Robot(Beckman Coulter,Fullerton,CA,USA),将生长板传递至 FX,并从实验板移出9μl培养液样品并分装于96孔V型底板(MJ Research,Waltham,MA,USA)中。通过加入135μl 0.533% PHBAH于2%氢氧化钠中的溶液而启动反应。在 Thermal Cycler(MJ Research,Waltham,MA,USA)上在95℃将每块实验板加热10分钟,并冷却至室温。温育后,用160μl去离子水稀释40μl反应样品,并转移至96孔平底板中。然后,使用 250(Molecular Devices,Sunnyvale,CA)测定样品在405nm处的吸光度。使用由六个葡萄糖标准物(0.000、0.040、0.800、0.120、0.165和0.200mg/ml去离子水)产生的标准曲线将A405值换算成葡萄糖当量,对所述标准品进行与样品类似的处理。标准曲线的平均关联系数大于0.98。使用实施例20中所述等式计算纤维素转化成还原糖的程度(RS得率,%)。
使用二金鸡纳酸(bicinchoninic acid,BCA)实验测定总蛋白质产率。用水 1∶8稀释样品,使浓度在合适的范围中。将白蛋白标准(BSA)稀释为不同水平,在水中的浓度由2.0mg/ml浓度开始,到0.25mg/ml结束。使用 FX,将包括标准的共20μl每种稀释液转移至96孔平底板中。向每个孔加入两百微升BCA底物溶液(BCA蛋白质实验试剂盒,Pierce,Rockford,IL,USA),然后在37℃温育45分钟。一旦温育完成,使用 250获得96孔板的562nm光密度。用Microsoft Excel(Microsoft Corporation,Redmond,WA),通过由产生的标准曲线外推而确定样品浓度。
在挑选的初步分离物中,二十个产生的培养液与来自菌株SMA135-04的培养液相比,显示PCS的水解活性改善。这些分离物产生的纤维素分解培养液相对于亲本菌株,产生的还原糖水平高5-15%。一些分离物,例如,SMai-M104显示出纤维素PCS每体积培养液的水解性能增加,此外分泌总蛋白质的水平更高。
通过评价发酵产生的培养液的纤维素酶性能,选择性能最佳的里氏木霉突变体菌株SMai-M104。发酵如实施例20中所述进行7天。在带螺旋盖的125-ml Erlenmeyer三角瓶(VWR,West Chester,PA,USA)中在50g PCS水解中测试发酵样品。反应条件包括:6.7%的纤维素加载;6和12mg/g纤维素的酶加载;总反应物50g;50℃和pH 5.0。开始实验,将每个摇瓶和盖称重,并记录向摇瓶加入的PCS的期望量和总重量。向每个摇瓶加入十毫升蒸馏水,然后将所有摇瓶在121℃高压灭菌30分钟。高压灭菌后,将摇瓶冷却至室温。为了使每个摇瓶的总重量达到50克,加入5ml 0.5M乙酸钠pH 5.0,然后加入纤维素酶培养液,以实现期望的加载,然后加入适量的蒸馏水,以达到理想的最终50g重量。然后将摇瓶放在50℃和130rpm的温育摇床(NewBrunswick Scientific,Edison,NJ,USA)中。在第3、5和7天,从每个摇瓶取1ml样品,并加入到96孔深孔板(总体积2.0ml)中。然后使用 RT7板离心机(Thermo Fisher Scientific,Waltham,MA,USA)在3000rpm将96孔板离心15分钟。离心后,将200μl上清液转移至96孔0.45μm孔尺寸过滤板(Millipore,Bedford,MA,USA),并施加真空以收集滤液。然后用0.4% NaOH将滤液稀释至还原糖的正确范围,并使用PHBAH试剂(1.5%)如下测定:向V型底96孔板加入50μl PHBAH试剂和100μl样品,并在95℃温育10分钟。为了完成反应,向每个孔加入50μl蒸馏水,并且在将样品混合后,将100μl混合物转移至另一个平底96孔板中,以获得A410处的分光光度读数。使用 葡萄糖校准曲线计算还原糖量,并如下计算消化百分比:
%消化=还原糖(mg/ml)/(加入的纤维素(mg/ml)×1.11),其中因子1.11反映将纤维素转化成葡萄糖的过程中的重量增加。
PCS水解实验结果表明,一个命名为SMai-M104的突变体,性能略优于(增加约5%葡萄糖)亲本菌株SMA135-04,特别是在高加载时(12mg/g纤维素)。
实施例23:里氏木霉菌株SMai26-30的构建
使用共转化将质粒pCW085(WO 2006/074435)、pSaMe-FX和pCW087(实施例17)导入里氏木霉SMai-M104。质粒pCW085是土生梭孢霉NRRL 8126纤维二糖水解酶(CEL6A)的表达载体。将所有三个质粒通过PEG介导的转化(Penttila等,1987,见上文)导入里氏木霉SMai-M104。每个质粒包含大肠杆菌潮霉素B磷酸转移酶(hph)基因,使转化体能在潮霉素B上生长。
在27℃和90rpm,在补加2%(w/v)葡萄糖和10mM尿苷的25ml YP培养基中培养里氏木霉SMai-M104 17小时。使用真空驱动一次性过滤系统过滤而收集菌丝体,并用去离子水洗涤两次,用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于20ml 1.2M山梨醇中而产生原生质体,所述山梨醇包含15mg 每ml和0.36单位壳多糖酶每ml,并在34℃以90rpm温和震荡而温育15-25分钟。通过在400xg离心7分钟而收集原生质体,并用冷1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数,并重悬于STC中至终浓度为1X108原生质体每ml。将过量的原生质体于-80℃保存在Cryo1℃ Freezing Container中。
用Pme I消化约各10μg质粒pCW085、pSaMe-FX和pCW087,并将其加入100μl原生质体溶液并温和混合,然后加入260μl PEG缓冲液,混合,并在室温温育30分钟。然后加入STC(3ml)并混合,并将转化溶液涂布在包含1M蔗糖(sucose)和10mM尿苷的PDA上。在28℃温育平板16小时,然后加入包含潮霉素B(30μg/ml终浓度)的琼脂覆盖物并继续温育4-6天。将八十个转化体在PDA平板上传代培养,并在28℃生长。
在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养里氏木霉转化体,所述培养基在pH 6.0接种转化体的孢子,并在28℃和200rpm培养5天。使用里氏木霉SMai-M104作为对照。在第5天移出培养液样品。将各一毫升培养液在微型离心机中以15,700xg离心5分钟,并将上清液转移至新管。
使用 Tris-HCl(5%解析)凝胶,用 系统进行SDS-PAGE。将五微升第5天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液中,并在存在5%β-巯基乙醇的情况下煮沸3分钟。将上清液样品加载于聚丙烯酰胺凝胶上,并用1X Tris/甘氨酸/SDS作为电泳缓冲液进行电泳。将得到的凝胶用BIO- 考马斯染料染色。然后如实施例20所述在PCS水解反应中测试转化体,以鉴定产生最优水解培养液的菌株,所述转化体显示桔橙嗜热霉GH61A多肽和融合蛋白的表达,所述融合蛋白由与米曲霉β-葡糖苷酶和土生梭孢霉纤维二糖水解酶II融合的特异腐质霉内切葡聚糖酶V核心(Cel45A)组成,如通过观察SDS-PAGE凝胶上的条带所见。
如实施例20所述及如下修改,进行里氏木霉菌株SMai26-30培养液的PCS水解。这批PCS不同于实施例20中使用的,但是在相似条件下制备。在此规程中,使用里氏木霉菌株SMai26-30发酵培养液的不同蛋白质加载量(用mg蛋白质每克纤维素表示)进行PCS(在50mM乙酸钠pH 5.0缓冲水溶液中约11.3% PCS和6.7%纤维素)的水解。在水解过程中在48、120和168小时取等分试样。在上述50g摇瓶实验中PCS水解反应的结果如表2所示。
表2:在48、72和168小时时间点的百分比转化率
生物材料的保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection),北区研究中心(Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,并给出了下述的登录号:
保藏物 登录号 保藏日期
大肠杆菌菌株pEJG120 NRRL B-30699 2003年12月19日
大肠杆菌菌株pTter61C NRRL B-30813 2005年1月21日
大肠杆菌菌株pTter61D NRRL B-30812 2005年1月21日
大肠杆菌菌株pTter61E NRRL B-30814 2005年1月21日
大肠杆菌菌株pTter61G NRRL B-30811 2005年1月21日
大肠杆菌菌株pDZA2-7 NRRL B-30704 2004年1月30日
大肠杆菌菌株pTr3337 NRRL B-30878 2005年9月20日
大肠杆菌TOP10(pEJG113) NRRL B-30695 2003年10月17日
大肠杆菌TOP10 pKKAB NRRL B-30860 2005年7月8日
NN049573 DSM 14240 2001年4月19日
所述菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37 C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
本发明中所描述的和要求的并非是要用本文所公开的具体方面来限定范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。事实上,从前面的说明中,对于本领域技术人员来说,除本文所显示和描述的之外,本发明的多种修改是显而易见的。这些修改也意欲落入所附的权利要求的范围之内。在冲突的情况下,将以包括定义部分的本公开为准。
本文引用了许多参考文献,将其公开的全部内容通过提述并入。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
<120>用于降解纤维素材料的组合物
<130>11250.204-WO
<150>60/941,251
<151>2007-05-31
<160>110
<170>PatentIn version 3.5
<210>1
<211>1846
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>1
aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga 60
tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg 120
gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg 180
ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc 240
atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac 300
gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc 360
ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc 420
acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg 480
caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac 540
ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc 600
cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc 660
tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac 720
gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc 780
gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc 840
gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc 900
ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc 960
atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac 1020
gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg 1080
gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc 1140
gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc 1200
ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg 1260
tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct 1320
ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga 1380
gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata 1440
tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt 1500
ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg 1560
ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg 1620
gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg 1680
agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc 1740
atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg 1800
ggatcgaacc cgagacctcg cacatgactt atttcaagtc aggggt 1846
<210>2
<211>326
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>2
Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu
1 5 10 15
Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp
20 25 30
Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr
35 40 45
Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro
50 55 60
Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met
65 70 75 80
His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly
85 90 95
Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala
100 105 110
Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser
115 120 125
Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly
130 135 140
Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro
145 150 155 160
Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala
165 170 175
Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys
180 185 190
Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val
195 200 205
Asn Phe Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn
210 215 220
Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr
225 230 235 240
Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu
245 250 255
Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro
260 265 270
Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly
275 280 285
Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly
290 295 300
Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro
305 310 315 320
Tyr Tyr Ser Gln Cys Leu
325
<210>3
<211>880
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>3
accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc 60
cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat 120
catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac 180
gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg 240
ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac 300
ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg 360
ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct 420
gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac 480
cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca 540
cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct 600
ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt 660
ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct 720
ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct 780
acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg 840
gctacgaggg gaaggcatct gttcgcatga gcgtgggtac 880
<210>4
<211>478
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>4
Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala
1 5 10 15
Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro
20 25 30
Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr
35 40 45
Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met
50 55 60
Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala
65 70 75 80
Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly
85 90 95
Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser
100 105 110
His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp
115 120 125
Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys
130 135 140
Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn
145 150 155 160
Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro
165 170 175
Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser
180 185 190
Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro
195 200 205
Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr
210 215 220
Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe Met
225 230 235 240
Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala Gly
245 250 255
His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro Gly
260 265 270
Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr Gln
275 280 285
Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met Arg
290 295 300
Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala Gly
305 310 315 320
Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly Pro
325 330 335
Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser His
340 345 350
Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp Gly
355 360 365
Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys Thr
370 375 380
Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr
385 390 395 400
Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro Gln
405 410 415
Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser Ala
420 425 430
Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro Gln
435 440 445
Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr Ser
450 455 460
Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe
465 470 475
<210>5
<211>1000
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>5
ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag 60
agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg 120
cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag 180
ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc 240
agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac 300
tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc 360
accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg 420
cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt 480
gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc 540
aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc 600
aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc 660
cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag 720
gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc 780
ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac 840
tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc 900
atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag 960
gcccgggact tcaccgcctg aagttgttga atcgatggag 1000
<210>6
<211>516
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>6
Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly
1 5 10 15
Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn
20 25 30
Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile
35 40 45
Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser
50 55 60
Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala
65 70 75 80
Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser
85 90 95
Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser
100 105 110
Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly
115 120 125
Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser
130 135 140
Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser
145 150 155 160
Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu
165 170 175
Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys
180 185 190
Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser
195 200 205
Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile
210 215 220
Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro
225 230 235 240
Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe
245 250 255
Thr Ala Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala
260 265 270
Ser Gly Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly
275 280 285
Lys Asn Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn
290 295 300
Val Ile Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser
305 310 315 320
Asp Ser Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala
325 330 335
Thr Ala Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr
340 345 350
His Ser Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser
355 360 365
Phe Ser Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu
370 375 380
Ala Gly Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn
385 390 395 400
Pro Ser Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp
405 410 415
Ser Ser Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg
420 425 430
His Glu Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro
435 440 445
Glu Cys Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp
450 455 460
Ala Ser Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro
465 470 475 480
Asn Ile Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys
485 490 495
Ile Pro Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg
500 505 510
Asp Phe Thr Ala
515
<210>7
<211>681
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>7
atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac 60
acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg 120
caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc 180
ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc 240
aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc 300
gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat 360
cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc 420
atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac 480
gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc 540
ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg 600
gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc 660
ccggccgtct tcagctgctg a 681
<210>8
<211>452
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>8
Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val
1 5 10 15
Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln
20 25 30
Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp
35 40 45
Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala
50 55 60
Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala
65 70 75 80
Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg
85 90 95
Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val
100 105 110
Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr
115 120 125
Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys
130 135 140
Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His
145 150 155 160
Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala
180 185 190
Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile
195 200 205
Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe
210 215 220
Ser Cys Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu
225 230 235 240
Gly Val Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp
245 250 255
Trp Gln Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val
260 265 270
Gly Asp Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser
275 280 285
Pro Ala Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr
290 295 300
Trp Ala Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met
305 310 315 320
Ala Arg Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly
325 330 335
Ala Val Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln
340 345 350
Leu Thr Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro
355 360 365
Pro Cys Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly
370 375 380
Leu His Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys
385 390 395 400
Ala Gln Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys
405 410 415
Val Ala Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile
420 425 430
Asn Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala
435 440 445
Val Phe Ser Cys
450
<210>9
<211>960
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>9
atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat 60
tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc 120
aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat 180
gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc 240
ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc 300
ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc 360
ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac 420
atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac 480
aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc 540
ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc 600
gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg 660
gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg 720
cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg 780
acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg 840
tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac 900
tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc 960
<210>10
<211>608
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>10
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
1 5 10 15
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
20 25 30
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
35 40 45
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
50 55 60
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
65 70 75 80
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
85 90 95
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
100 105 110
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
115 120 125
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
130 135 140
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
145 150 155 160
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
180 185 190
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
195 200 205
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
210 215 220
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
225 230 235 240
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
245 250 255
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
260 265 270
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
275 280 285
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
290 295 300
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
305 310 315 320
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
325 330 335
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
340 345 350
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
355 360 365
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
370 375 380
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
385 390 395 400
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
405 410 415
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
420 425 430
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
435 440 445
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
450 455 460
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
465 470 475 480
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
485 490 495
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
500 505 510
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
515 520 525
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
530 535 540
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
545 550 555 560
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
565 570 575
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
580 585 590
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
595 600 605
<210>11
<211>799
<212>DNA
<213>桔橙嗜热霉(Thermoascus aurantiacus)
<400>11
atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60
ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120
acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180
atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240
tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300
agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360
tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420
tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480
caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540
caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600
tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660
cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720
cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780
tcctctgtat actggttaa 799
<210>12
<211>250
<212>PRT
<213>桔橙嗜热霉(Thermoascus aurantiacus)
<400>12
Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
20 25 30
Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser
35 40 45
Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly
50 55 60
Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg
65 70 75 80
Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr
85 90 95
Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val
100 105 110
Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys
115 120 125
Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp
130 135 140
Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn
145 150 155 160
Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly
195 200 205
Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp
210 215 220
Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr
225 230 235 240
Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly
245 250
<210>13
<211>1172
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>13
ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc 60
cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca 120
gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc 180
tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc 240
cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg 300
cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt 360
tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg 420
ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct 480
gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta 540
tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa 600
ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg 660
aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac 720
aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta 780
cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag 840
gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga 900
acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac 960
cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga 1020
atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac 1080
atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa 1140
acactacatg taaaaaaaaa aaaaaaaaaa aa 1172
<210>14
<211>249
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>14
Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser
1 5 10 15
Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr
20 25 30
Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly
35 40 45
His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly
50 55 60
Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys
65 70 75 80
Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn
85 90 95
Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro
100 105 110
Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn
115 120 125
Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr
130 135 140
Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys
145 150 155 160
Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe
165 170 175
Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met
180 185 190
Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr
195 200 205
Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr
210 215 220
Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr
225 230 235 240
Ile Pro Gly Pro Ala Leu Trp Gln Gly
245
<210>15
<211>2771
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>15
ctgttctgct ggttacctgc cacgttatca tgaagcttgg ttggatcgag gtggccgcat 60
tggcggctgc ctcagtagtc agtgccaagg atgatctcgc gtactcccct cctttctacc 120
cttccccatg ggcagatggt cagggtgaat gggcggaagt atacaaacgc gctgtagaca 180
tagtttccca gatgacgttg acagagaaag tcaacttaac gactggaaca ggatggcaac 240
tagagaggtg tgttggacaa actggcagtg ttcccagact caacatcccc agcttgtgtt 300
tgcaggatag tcctcttggt attcgtttct cggactacaa ttcagctttc cctgcgggtg 360
ttaatgtcgc tgccacctgg gacaagacgc tcgcctacct tcgtggtcag gcaatgggtg 420
aggagttcag tgataagggt attgacgttc agctgggtcc tgctgctggc cctctcggtg 480
ctcatccgga tggcggtaga aactgggaag gtttctcacc agatccagcc ctcaccggtg 540
tactttttgc ggagacgatt aagggtattc aagatgctgg tgtcattgcg acagctaagc 600
attatatcat gaacgaacaa gagcatttcc gccaacaacc cgaggctgcg ggttacggat 660
tcaacgtaag cgacagtttg agttccaacg ttgatgacaa gactatgcat gaattgtacc 720
tctggccctt cgcggatgca gtacgcgctg gagtcggtgc tgtcatgtgc tcttacaacc 780
aaatcaacaa cagctacggt tgcgagaata gcgaaactct gaacaagctt ttgaaggcgg 840
agcttggttt ccaaggcttc gtcatgagtg attggaccgc tcatcacagc ggcgtaggcg 900
ctgctttagc aggtctggat atgtcgatgc ccggtgatgt taccttcgat agtggtacgt 960
ctttctgggg tgcaaacttg acggtcggtg tccttaacgg tacaatcccc caatggcgtg 1020
ttgatgacat ggctgtccgt atcatggccg cttattacaa ggttggccgc gacaccaaat 1080
acacccctcc caacttcagc tcgtggacca gggacgaata tggtttcgcg cataaccatg 1140
tttcggaagg tgcttacgag agggtcaacg aattcgtgga cgtgcaacgc gatcatgccg 1200
acctaatccg tcgcatcggc gcgcagagca ctgttctgct gaagaacaag ggtgccttgc 1260
ccttgagccg caaggaaaag ctggtcgccc ttctgggaga ggatgcgggt tccaactcgt 1320
ggggcgctaa cggctgtgat gaccgtggtt gcgataacgg tacccttgcc atggcctggg 1380
gtagcggtac tgcgaatttc ccatacctcg tgacaccaga gcaggcgatt cagaacgaag 1440
ttcttcaggg ccgtggtaat gtcttcgccg tgaccgacag ttgggcgctc gacaagatcg 1500
ctgcggctgc ccgccaggcc agcgtatctc tcgtgttcgt caactccgac tcaggagaaa 1560
gctatcttag tgtggatgga aatgagggcg atcgtaacaa catcactctg tggaagaacg 1620
gcgacaatgt ggtcaagacc gcagcgaata actgtaacaa caccgtggtc atcatccact 1680
ccgtcggacc agttttgatc gatgaatggt atgaccaccc caatgtcact ggtattctct 1740
gggctggtct gccaggccag gagtctggta actccatcgc cgatgtgctg tacggtcgtg 1800
tcaaccctgg cgccaagtct cctttcactt ggggcaagac ccgggagtcg tatggttctc 1860
ccttggtcaa ggatgccaac aatggcaacg gagcgcccca gtctgatttc acccagggtg 1920
ttttcatcga ttaccgccat ttcgataagt tcaatgagac ccctatctac gagtttggct 1980
acggcttgag ctacaccacc ttcgagctct ccgacctcca tgttcagccc ctgaacgcgt 2040
cccgatacac tcccaccagt ggcatgactg aagctgcaaa gaactttggt gaaattggcg 2100
atgcgtcgga gtacgtgtat ccggaggggc tggaaaggat ccatgagttt atctatccct 2160
ggatcaactc taccgacctg aaggcatcgt ctgacgattc taactacggc tgggaagact 2220
ccaagtatat tcccgaaggc gccacggatg ggtctgccca gccccgtttg cccgctagtg 2280
gtggtgccgg aggaaacccc ggtctgtacg aggatctttt ccgcgtctct gtgaaggtca 2340
agaacacggg caatgtcgcc ggtgatgaag ttcctcagct gtacgtttcc ctaggcggcc 2400
cgaatgagcc caaggtggta ctgcgcaagt ttgagcgtat tcacttggcc ccttcgcagg 2460
aggccgtgtg gacaacgacc cttacccgtc gtgaccttgc aaactgggac gtttcggctc 2520
aggactggac cgtcactcct taccccaaga cgatctacgt tggaaactcc tcacggaaac 2580
tgccgctcca ggcctcgctg cctaaggccc agtaaggggc aagtcctgat tgtacagagc 2640
atttcgagat ttatgatgta catgtttatg aatgacctag ggtagggtaa tacttagtag 2700
ggttagttct aattcttgga gtcaagtatt gactcactgg gccgataaaa aaaaaaaaaa 2760
aaaaaaaaaa a 2771
<210>16
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>16
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Ser Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>17
<211>5172
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>17
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat tacttcgaac caacctagct 120
ccaccggcgt aaccgccgac ggagtcatca gtcacggttc ctactagagc gcatgagggg 180
aggaaagatg ggaaggggta gggcagatgg tcagggtgaa tgggcggaag tatacaaacg 240
cgctgtagac atagtttccc agatgacgtt gacagagaaa gtcaacttaa cgactggaac 300
cccgtctacc agtcccactt acccgccttc atatgtttgc gcgacatctg tatcaaaggg 360
tctactgcaa ctgtctcttt cagttgaatt gctgaccttg aggatggcaa ctagagaggt 420
gtgttggaca aactggcagt gttcccagac tcaacatccc cagcttgtgt ttgcaggata 480
gtcctcttgg tattcgtttc tcctaccgtt gatctctcca cacaacctgt ttgaccgtca 540
caagggtctg agttgtaggg gtcgaacaca aacgtcctat caggagaacc ataagcaaag 600
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 660
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca agcctgatgt taagtcgaaa 720
gggacgccca caattacagc gacggtggac cctgttctgc gagcggatgg aagcaccagt 780
ccgttaccca ctcctcaagt gtgataaggg tattgacgtt cagctgggtc ctgctgctgg 840
ccctctcggt gctcatccgg atggcggtag aaactgggaa ggtttctcac cagatccagc 900
cactattccc ataactgcaa gtcgacccag gacgacgacc gggagagcca cgagtaggcc 960
taccgccatc tttgaccctt ccaaagagtg gtctaggtcg cctcaccggt gtactttttg 1020
cggagacgat taagggtatt caagatgctg gtgtcattgc gacagctaag cattatatca 1080
tgaacgaaca agagcatttc ggagtggcca catgaaaaac gcctctgcta attcccataa 1140
gttctacgac cacagtaacg ctgtcgattc gtaatatagt acttgcttgt tctcgtaaag 1200
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 1260
gttgatgaca agactatgca tgaattgtac ctctggccct gcggttgttg ggctccgacg 1320
cccaatgcct aagttgcatt cgctgtcaaa ctcaaggttg caactactgt tctgatacgt 1380
acttaacatg gagaccggga tcgcggatgc agtacgcgct ggagtcggtg ctgtcatgtg 1440
ctcttacaac caaatcaaca acagctacgg ttgcgagaat agcgaaactc tgaacaagct 1500
agcgcctacg tcatgcgcga cctcagccac gacagtacac gagaatgttg gtttagttgt 1560
tgtcgatgcc aacgctctta tcgctttgag acttgttcga tttgaaggcg gagcttggtt 1620
tccaaggctt cgtcatgagt gattggaccg ctcatcacag cggcgtaggc gctgctttag 1680
caggtctgga tatgtcgatg aaacttccgc ctcgaaccaa aggttccgaa gcagtactca 1740
ctaacctggc gagtagtgtc gccgcatccg cgacgaaatc gtccagacct atacagctac 1800
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 1860
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca gggccactac aatggaagct 1920
atcaccatgc agaaagaccc cacgtttgaa ctgccagcca caggaattgc catgttaggg 1980
ggttaccgca caactactgt tggctgtccg tatcatggcc gcttattaca aggttggccg 2040
cgacaccaaa tacacccctc ccaacttcag ctcgtggacc agggacgaat atggtttcgc 2100
accgacaggc atagtaccgg cgaataatgt tccaaccggc gctgtggttt atgtggggag 2160
ggttgaagtc gagcacctgg tccctgctta taccaaagcg gcataaccat gtttcggaag 2220
gtgcttacga gagggtcaac gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc 2280
gtcgcatcgg cgcgcagagc cgtattggta caaagccttc cacgaatgct ctcccagttg 2340
cttaagcacc tgcacgttgc gctagtacgg ctggattagg cagcgtagcc gcgcgtctcg 2400
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 2460
cttctgggag aggatgcggg ttccaactcg tggggcgcta tgacaagacg acttcttgtt 2520
cccacggaac gggaactcgg cgttcctttt cgaccagcgg gaagaccctc tcctacgccc 2580
aaggttgagc accccgcgat acggctgtga tgaccgtggt tgcgataacg gtacccttgc 2640
catggcctgg ggtagcggta ctgcgaattt cccatacctc gtgacaccag agcaggcgat 2700
tgccgacact actggcacca acgctattgc catgggaacg gtaccggacc ccatcgccat 2760
gacgcttaaa gggtatggag cactgtggtc tcgtccgcta tcagaacgaa gttcttcagg 2820
gccgtggtaa tgtcttcgcc gtgaccgaca gttgggcgct cgacaagatc gctgcggctg 2880
cccgccaggc cagcgtatct agtcttgctt caagaagtcc cggcaccatt acagaagcgg 2940
cactggctgt caacccgcga gctgttctag cgacgccgac gggcggtccg gtcgcataga 3000
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 3060
gatcgtaaca acatcactct gtggaagaac ggcgacaatg gagcacaagc agttgaggct 3120
gagtcctctt ccgatagaat cacacctacc tttactcccg ctagcattgt tgtagtgaga 3180
caccttcttg ccgctgttac tggtcaagac cgcagcgaat aactgtaaca acaccgttgt 3240
catcatccac tccgtcggac cagttttgat cgatgaatgg tatgaccacc ccaatgtcac 3300
accagttctg gcgtcgctta ttgacattgt tgtggcaaca gtagtaggtg aggcagcctg 3360
gtcaaaacta gctacttacc atactggtgg ggttacagtg tggtattctc tgggctggtc 3420
tgccaggcca ggagtctggt aactccattg ccgatgtgct gtacggtcgt gtcaaccctg 3480
gcgccaagtc tcctttcact accataagag acccgaccag acggtccggt cctcagacca 3540
ttgaggtaac ggctacacga catgccagca cagttgggac cgcggttcag aggaaagtga 3600
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 3660
ggagcgcccc agtctgattt cacccagggt gttttcatcg accccgttct gggccctcag 3720
cataccaaga gggaaccagt tcctacggtt gttaccgttg cctcgcgggg tcagactaaa 3780
gtgggtccca caaaagtagc attaccgcca tttcgataag ttcaatgaga cccctatcta 3840
cgagtttggc tacggcttga gctacaccac cttcgagctc tccgacctcc atgttcagcc 3900
taatggcggt aaagctattc aagttactct ggggatagat gctcaaaccg atgccgaact 3960
cgatgtggtg gaagctcgag aggctggagg tacaagtcgg cctgaacgcg tcccgataca 4020
ctcccaccag tggcatgact gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg 4080
agtacgtgta tccggagggg ggacttgcgc agggctatgt gagggtggtc accgtactga 4140
cttcgacgtt tcttgaaacc actttaaccg ctacgcagcc tcatgcacat aggcctcccc 4200
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 4260
tctgacgatt ctaactacgg ctgggaagac tccaagtata gacctttcct aggtactcaa 4320
atagataggg acctagttga gatggctgga cttccgtagc agactgctaa gattgatgcc 4380
gacccttctg aggttcatat ttcccgaagg cgccacggat gggtctgccc agccccgttt 4440
gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac gaggatcttt tccgcgtctc 4500
aagggcttcc gcggtgccta cccagacggg tcggggcaaa cgggcgatca ccaccacggc 4560
ctcctttggg gccagacatg ctcctagaaa aggcgcagag tgtgaaggtc aagaacacgg 4620
gcaatgtcgc cggtgatgaa gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc 4680
ccaaggtggt actgcgcaag acacttccag ttcttgtgcc cgttacagcg gccactactt 4740
caaggagtcg acatgcaaag ggatccgccg ggcttactcg ggttccacca tgacgcgttc 4800
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 4860
cgtgaccttg caaactggga cgtttcggct caggactgga aaactcgcat aagtgaaccg 4920
gggaagcgtc ctccggcaca cctgttgctg ggaatgggca gcactggaac gtttgaccct 4980
gcaaagccga gtcctgacct ccgtcactcc ttaccccaag acgatctacg ttggaaactc 5040
ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc cagtaaggca gtgaggaatg 5100
gggttctgct agatgcaacc tttgaggagt gcctttgacg gcgaggtccg gagcgacgga 5160
ttccgggtca tt 5172
<210>18
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>18
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>19
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>19
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210>20
<211>863
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<400>20
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala AsnTrp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210>21
<211>2800
<212>DNA
<213>巴西青霉(Penicillium brasilianum)
<400>21
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220
caccttccat cggacagcca cctagccaga acctggatac etacaagttc cctgctacat 2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800
<210>22
<211>878
<212>PRT
<213>巴西青霉(Penicillium brasilianum)
<400>22
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1 5 10 15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
20 25 30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
35 40 45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
50 55 60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65 70 75 80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
85 90 95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
100 105 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
115 120 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
130 135 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145 150 155 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
165 170 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
180 185 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
195 200 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
210 215 220
Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp
225 230 235 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
245 250 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
260 265 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
275 280 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
290 295 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305 310 315 320
Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
325 330 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
340 345 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
355 360 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
370 375 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385 390 395 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
405 410 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
420 425 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
435 440 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
450 455 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465 470 475 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
485 490 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
500 505 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
515 520 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
530 535 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545 550 555 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
565 570 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
580 585 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
595 600 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
610 615 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625 630 635 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
645 650 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
660 665 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
675 680 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
690 695 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705 710 715 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
725 730 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
740 745 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
755 760 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
770 775 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785 790 795 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
805 810 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
820 825 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
835 840 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
850 855 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865 870 875
<210>23
<211>2235
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>23
atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60
agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120
ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180
ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240
tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300
acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360
atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420
cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480
ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540
tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600
gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660
gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720
acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780
ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840
gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900
gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960
actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020
aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080
ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140
gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200
gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260
ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320
gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380
gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440
gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500
gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560
cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620
agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680
tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740
agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800
cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860
ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920
ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980
gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040
cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100
aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160
tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220
ctgtcggtag cgtag 2235
<210>24
<211>744
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>24
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1 5 10 15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
20 25 30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
35 40 45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
50 55 60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65 70 75 80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
85 90 95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
100 105 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
115 120 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
130 135 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
165 170 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
195 200 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
210 215 220
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225 230 235 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
245 250 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
260 265 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
275 280 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
290 295 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305 310 315 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
325 330 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
340 345 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
355 360 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
370 375 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385 390 395 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
405 410 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
420 425 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
435 440 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
450 455 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465 470 475 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
485 490 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
500 505 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
515 520 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
530 535 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545 550 555 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
565 570 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
580 585 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
595 600 605
Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
610 615 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625 630 635 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
645 650 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
660 665 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
675 680 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
690 695 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705 710 715 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
725 730 735
Leu Thr Ser Thr Leu Ser Val Ala
740
<210>25
<211>2583
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>25
atgaggttca ctttgatcga ggcggtggct ctgactgccg tctcgctggc cagcgctgat 60
gaattggcct actccccacc gtattaccca tccccttggg ccaatggcca gggcgactgg 120
gcgcaggcat accagcgcgc tgttgatatt gtctcgcaaa tgacattgga tgagaaggtc 180
aatctgacca caggaactgg atgggaattg gaactatgtg ttggtcagac tggcggtgtt 240
ccccgattgg gagttccggg aatgtgttta caggatagcc ctctgggcgt tcgcgactcc 300
gactacaact ctgctttccc tgccggcatg aacgtggctg caacctggga caagaatctg 360
gcataccttc gcggcaaggc tatgggtcag gaatttagtg acaagggtgc cgatatccaa 420
ttgggtccag ctgccggccc tctcggtaga agtcccgacg gtggtcgtaa ctgggagggc 480
ttctccccag accctgccct aagtggtgtg ctctttgccg agaccatcaa gggtatccaa 540
gatgctggtg tggttgcgac ggctaagcac tacattgctt acgagcaaga gcatttccgt 600
caggcgcctg aagcccaagg ttttggattt aatatttccg agagtggaag tgcgaacctc 660
gatgataaga ctatgcacga gctgtacctc tggcccttcg cggatgccat ccgtgcaggt 720
gctggcgctg tgatgtgctc ctacaaccag atcaacaaca gttatggctg ccagaacagc 780
tacactctga acaagctgct caaggccgag ctgggcttcc agggctttgt catgagtgat 840
tgggctgctc accatgctgg tgtgagtggt gctttggcag gattggatat gtctatgcca 900
ggagacgtcg actacgacag tggtacgtct tactggggta caaacttgac cattagcgtg 960
ctcaacggaa cggtgcccca atggcgtgtt gatgacatgg ctgtccgcat catggccgcc 1020
tactacaagg tcggccgtga ccgtctgtgg actcctccca acttcagctc atggaccaga 1080
gatgaatacg gctacaagta ctactacgtg tcggagggac cgtacgagaa ggtcaaccag 1140
tacgtgaatg tgcaacgcaa ccacagcgaa ctgattcgcc gcattggagc ggacagcacg 1200
gtgctcctca agaacgacgg cgctctgcct ttgactggta aggagcgcct ggtcgcgctt 1260
atcggagaag atgcgggctc caacccttat ggtgccaacg gctgcagtga ccgtggatgc 1320
gacaatggaa cattggcgat gggctgggga agtggtactg ccaacttccc atacctggtg 1380
acccccgagc aggccatctc aaacgaggtg cttaagcaca agaatggtgt attcaccgcc 1440
accgataact gggctatcga tcagattgag gcgcttgcta agaccgccag tgtctctctt 1500
gtctttgtca acgccgactc tggtgagggt tacatcaatg tggacggaaa cctgggtgac 1560
cgcaggaacc tgaccctgtg gaggaacggc gataatgtga tcaaggctgc tgctagcaac 1620
tgcaacaaca caatcgttgt cattcactct gtcggaccag tcttggttaa cgagtggtac 1680
gacaacccca atgttaccgc tatcctctgg ggtggtttgc ccggtcagga gtctggcaac 1740
tctcttgccg acgtcctcta tggccgtgtc aaccccggtg ccaagtcgcc ctttacctgg 1800
ggcaagactc gtgaggccta ccaagactac ttggtcaccg agcccaacaa cggcaacgga 1860
gcccctcagg aagactttgt cgagggcgtc ttcattgact accgtggatt tgacaagcgc 1920
aacgagaccc cgatctacga gttcggctat ggtctgagct acaccacttt caactactcg 1980
aaccttgagg tgcaggtgct gagcgcccct gcatacgagc ctgcttcggg tgagaccgag 2040
gcagcgccaa ccttcggaga ggttggaaat gcgtcggatt acctctaccc cagcggattg 2100
cagagaatta ccaagttcat ctacccctgg ctcaacggta ccgatctcga ggcatcttcc 2160
ggggatgcta gctacgggca ggactcctcc gactatcttc ccgagggagc caccgatggc 2220
tctgcgcaac cgatcctgcc tgccggtggc ggtcctggcg gcaaccctcg cctgtacgac 2280
gagctcatcc gcgtgtcagt gaccatcaag aacaccggca aggttgctgg tgatgaagtt 2340
ccccaactgt atgtttccct tggcggtccc aatgagccca agatcgtgct gcgtcaattc 2400
gagcgcatca cgctgcagcc gtcggaggag acgaagtgga gcacgactct gacgcgccgt 2460
gaccttgcaa actggaatgt tgagaagcag gactgggaga ttacgtcgta tcccaagatg 2520
gtgtttgtcg gaagctcctc gcggaagctg ccgctccggg cgtctctgcc tactgttcac 2580
taa 2583
<210>26
<211>860
<212>PRT
<213>黑曲霉(Aspergillus niger)
<400>26
Met Arg Phe Thr Leu Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu
1 5 10 15
Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Asp Trp Ala Gln Ala Tyr Gln Arg Ala Val
35 40 45
Asp Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Gly Val Pro Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
85 90 95
Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Met Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Lys Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Phe
195 200 205
Gly Phe Asn Ile Ser Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr
210 215 220
Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly
225 230 235 240
Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val
275 280 285
Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp
290 295 300
Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Tyr Lys Tyr Tyr
355 360 365
Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Tyr Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly
435 440 445
Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Ser Asn Glu Val Leu Lys His Lys Asn Gly Val Phe Thr Ala
465 470 475 480
Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile
500 505 510
Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg
515 520 525
Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr
530 535 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr
545 550 555 560
Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln
595 600 605
Asp Tyr Leu Val Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu
610 615 620
Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Asn Leu Glu Val Gln Val Leu Ser Ala Pro Ala Tyr
660 665 670
Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val
675 680 685
Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Ser Gly Leu Gln Arg Ile Thr
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Gly Thr Asp Leu Glu Ala Ser Ser
705 710 715 720
Gly Asp Ala Ser Tyr Gly Gln Asp Ser Ser Asp Tyr Leu Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Pro
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe
785 790 795 800
Glu Arg Ile Thr Leu Gln Pro Ser Glu Glu Thr Lys Trp Ser Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Lys Gln Asp Trp
820 825 830
Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Val Gly Ser Ser Ser Arg
835 840 845
Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His
850 855 860
<210>27
<211>2583
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>27
atgaagctca gttggcttga ggcggctgcc ttgacggctg cttcagtcgt cagcgctgat 60
gaactggcgt tctctcctcc tttctacccc tctccgtggg ccaatggcca gggagagtgg 120
gcggaagcct accagcgtgc agtggccatt gtatcccaga tgactctgga tgagaaggtc 180
aacctgacca ccggaactgg atgggagctg gagaagtgcg tcggtcagac tggtggtgtc 240
ccaagactga acatcggtgg catgtgtctt caggacagtc ccttgggaat tcgtgatagt 300
gactacaatt cggctttccc tgctggtgtc aacgttgctg cgacatggga caagaacctt 360
gcttatctac gtggtcaggc tatgggtcaa gagttcagtg acaaaggaat tgatgttcaa 420
ttgggaccgg ccgcgggtcc cctcggcagg agccctgatg gaggtcgcaa ctgggaaggt 480
ttctctccag acccggctct tactggtgtg ctctttgcgg agacgattaa gggtattcaa 540
gacgctggtg tcgtggcgac agccaagcat tacattctca atgagcaaga gcatttccgc 600
caggtcgcag aggctgcggg ctacggattc aatatctccg acacgatcag ctctaacgtt 660
gatgacaaga ccattcatga aatgtacctc tggcccttcg cggatgccgt tcgcgecggc 720
gttggcgcca tcatgtgttc ctacaaccag atcaacaaca gctacggttg ccagaacagt 780
tacactctga acaagcttct gaaggccgag ctcggcttcc agggctttgt gatgtctgac 840
tggggtgctc accacagtgg tgttggctct gctttggccg gcttggatat gtcaatgcct 900
ggcgatatca ccttcgattc tgccactagt ttctggggta ccaacctgac cattgctgtg 960
ctcaacggta ccgtcccgca gtggcgcgtt gacgacatgg ctgtccgtat catggctgcc 1020
tactacaagg ttggccgcga ccgcctgtac cagccgccta acttcagctc ctggactcgc 1080
gatgaatacg gcttcaagta tttctacccc caggaagggc cctatgagaa ggtcaatcac 1140
tttgtcaatg tgcagcgcaa ccacagcgag gttattcgca agttgggagc agacagtact 1200
gttctactga agaacaacaa tgccctgccg ctgaccggaa aggagcgcaa agttgcgatc 1260
ctgggtgaag atgctggatc caactcgtac ggtgccaatg gctgctctga ccgtggctgt 1320
gacaacggta ctcttgctat ggcttggggt agcggcactg ccgaattccc atatctcgtg 1380
acccctgagc aggctattca agccgaggtg ctcaagcata agggcagcgt ctacgccatc 1440
acggacaact gggcgctgag ccaggtggag accctcgcta aacaagccag tgtctctctt 1500
gtatttgtca actcggacgc gggagagggc tatatctccg tggacggaaa cgagggcgac 1560
cgcaacaacc tcaccctctg gaagaacggc gacaacctca tcaaggctgc tgcaaacaac 1620
tgcaacaaca ccatcgttgt catccactcc gttggacctg ttttggttga cgagtggtat 1680
gaccacccca acgttactgc catcctctgg gcgggcttgc ctggccagga gtctggcaac 1740
tccttggctg acgtgctcta cggccgcgtc aacccgggcg ccaaatctcc attcacctgg 1800
ggcaagacga gggaggcgta cggggattac cttgtccgtg agctcaacaa cggcaacgga 1860
gctccccaag atgatttctc ggaaggtgtt ttcattgact accgcggatt cgacaagcgc 1920
aatgagaccc cgatctacga gttcggacat ggtctgagct acaccacttt caactactct 1980
ggccttcaca tccaggttct caacgcttcc tccaacgctc aagtagccac tgagactggc 2040
gccgctccca ccttcggaca agtcggcaat gcctctgact acgtgtaccc tgagggattg 2100
accagaatca gcaagttcat ctatccctgg cttaattcca cagacctgaa ggcctcatct 2160
ggcgacccgt actatggagt cgacaccgcg gagcacgtgc ccgagggtgc tactgatggc 2220
tctccgcagc ccgttctgcc tgccggtggt ggctctggtg gtaacccgcg cctctacgat 2280
gagttgatcc gtgtttcggt gacagtcaag aacactggtc gtgttgccgg tgatgctgtg 2340
cctcaattgt atgtttccct tggtggaccc aatgagccca aggttgtgtt gcgcaaattc 2400
gaccgcctca ccctcaagcc ctccgaggag acggtgtgga cgactaccct gacccgccgc 2460
gatctgtcta actgggacgt tgcggctcag gactgggtca tcacttctta cccgaagaag 2520
gtccatgttg gtagctcttc gcgtcagctg ccccttcacg cggcgctccc gaaggtgcaa 2580
tga 2583
<210>28
<211>860
<212>PRT
<213>棘孢曲霉(Aspergillus aculeatus)
<400>28
Met Lys Leu Ser Trp Leu Glu Ala Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Val Ser Ala Asp Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Glu Trp Ala Glu Ala Tyr Gln Arg Ala Val
35 40 45
Ala Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Lys Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Asn Ile Gly Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
85 90 95
Ile Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu His Phe Arg Gln Val Ala Glu Ala Ala Gly Tyr
195 200 205
Gly Phe Asn Ile Ser Asp Thr Ile Ser Ser Asn Val Asp Asp Lys Thr
210 215 220
Ile His Glu Met Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly
225 230 235 240
Val Gly Ala Ile Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser Gly Val
275 280 285
Gly Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Thr
290 295 300
Phe Asp Ser Ala Thr Ser Phe Trp Gly Thr Asn Leu Thr Ile Ala Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val AsP Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Tyr Gln Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Phe
355 360 365
Tyr Pro Gln Glu Gly Pro Tyr Glu Lys Val Asn His Phe Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Val Ile Arg Lys Leu Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asn Asn Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Lys Val Ala Ile Leu Gly Glu Asp Ala Gly Ser Asn Ser Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala
435 440 445
Trp Gly Ser Gly Thr Ala Glu Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Gln Ala Glu Val Leu Lys His Lys Gly Ser Val Tyr Ala Ile
465 470 475 480
Thr Asp Asn Trp Ala Leu Ser Gln Val Glu Thr Leu Ala Lys Gln Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ser Asp Ala Gly Glu Gly Tyr Ile
500 505 510
Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Leu Thr Leu Trp Lys
515 520 525
Asn Gly Asp Asn Leu Ile Lys Ala Ala Ala Asn Asn Cys Asn Asn Thr
530 535 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asp Glu Trp Tyr
545 550 555 560
Asp His Pro Asn Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gly
595 600 605
Asp Tyr Leu Val Arg Glu Leu Asn Asn Gly Asn Gly Ala Pro Gln Asp
610 615 620
Asp Phe Ser Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Gly Leu His Ile Gln Val Leu Asn Ala Ser Ser Asn
660 665 670
Ala Gln Val Ala Thr Glu Thr Gly Ala Ala Pro Thr Phe Gly Gln Val
675 680 685
Gly Asn Ala Ser Asp Tyr Val Tyr Pro Glu Gly Leu Thr Arg Ile Ser
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ser
705 710 715 720
Gly Asp Pro Tyr Tyr Gly Val Asp Thr Ala Glu His Val Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Pro Gln Pro Val Leu Pro Ala Gly Gly Gly Ser
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Val Lys Asn Thr Gly Arg Val Ala Gly Asp Ala Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe
785 790 795 800
Asp Arg Leu Thr Leu Lys Pro Ser Glu Glu Thr Val Trp Thr Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Ala Ala Gln Asp Trp
820 825 830
Val Ile Thr Ser Tyr Pro Lys Lys Val His Val Gly Ser Ser Ser Arg
835 840 845
Gln Leu Pro Leu His Ala Ala Leu Pro Lys Val Gln
850 855 860
<210>29
<211>918
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>29
atgcgttcct cccccctcct cccgtccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct 720
ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca 780
gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat 840
ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg 900
taccatcagt gcctgtag 918
<210>30
<211>305
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>30
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser
225 230 235 240
Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr
245 250 255
Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu
260 265 270
Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys
275 280 285
Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys
290 295 300
Leu
305
<210>31
<211>1188
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>31
cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc 60
gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac 120
tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc 180
gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc 240
cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag 300
tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc 360
ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac 420
ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc 480
cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac 540
ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc 600
ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac 660
aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac 720
ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc 780
ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac 840
aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag 900
tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc 960
aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag 1020
gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc 1080
tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc 1140
accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa 1188
<210>32
<211>389
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>32
Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala
1 5 10 15
Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser
20 25 30
Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr
35 40 45
Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr
50 55 60
Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr
65 70 75 80
Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly
85 90 95
Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe
100 105 110
Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr
115 120 125
Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln
130 135 140
Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val
145 150 155 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His
165 170 175
Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe
180 185 190
Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu
195 200 205
Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu
210 215 220
Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly
225 230 235 240
Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala
245 250 255
Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro
260 265 270
Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser
275 280 285
Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg
290 295 300
Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val
305 310 315 320
Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val
325 330 335
Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly
340 345 350
Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser
355 360 365
Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu
370 375 380
Lys Lys Tyr Leu Pro
385
<210>33
<211>1232
<212>DNA
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>33
ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac 60
ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg 120
gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca 180
acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta 240
gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca 300
gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga 360
acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct 420
tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc 480
ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg 540
tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct 600
acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag 660
gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc 720
ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg 780
cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga 840
cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc 900
agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca 960
ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg 1020
gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg 1080
cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc 1140
cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga 1200
tcctcccgca ggccctgctg ccgttcgcgt aa 1232
<210>34
<211>397
<212>PRT
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>34
Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser
1 5 10 15
Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe
20 25 30
Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn
35 40 45
Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala
50 55 60
Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro
65 70 75 80
Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly
85 90 95
Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val
100 105 110
Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe
115 120 125
Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg
130 135 140
Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr
145 150 155 160
Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly
165 170 175
Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr
180 185 190
Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly
195 200 205
Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro
210 215 220
His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val
225 230 235 240
Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu
245 250 255
Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser
260 265 270
Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln
275 280 285
Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys
290 295 300
Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp
305 310 315 320
Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly
325 330 335
Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met
340 345 350
Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro
355 360 365
Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala
370 375 380
Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala
385 390 395
<210>35
<211>1303
<212>DNA
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>35
ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc 60
ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc 120
cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt 180
gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc 240
tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac 300
aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg 360
ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg 420
gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt 480
ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat 540
gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac 600
caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt 660
catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa 720
tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta 780
cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc 840
cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac 900
gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac 960
ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt 1020
ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg 1080
actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt 1140
gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg 1200
ggctgcgggt ccctggtggg gcacgtacatttactcgatt gaacctccga gcggtgccgc 1260
tatcccagaa gtccttcctc agggtctcgc tccattcctc tag 1303
<210>36
<211>429
<212>PRT
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>36
Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala
1 5 10 15
Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly
20 25 30
Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu
35 40 45
Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr
50 55 60
Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val
65 70 75 80
Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr
85 90 95
Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser
100 105 110
Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val
115 120 125
Asn Glu Ser Gly Ala Glu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu
130 135 140
Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met
145 150 155 160
Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met
165 170 175
Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu
180 185 190
Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr
195 200 205
Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile
210 215 220
Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val
225 230 235 240
Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr
245 250 255
Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn
260 265 270
Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly
275 280 285
Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala
290 295 300
Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met
305 310 315 320
His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val
325 330 335
Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu
340 345 350
Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser
355 360 365
Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln
370 375 380
Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro
385 390 395 400
Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala
405 410 415
Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu
420 425
<210>37
<211>1580
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>37
agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa 60
gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc 120
cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga 180
cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga 240
ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt 300
ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc 360
ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg 420
ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta 480
caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa 540
agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca 600
caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc 660
aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac 720
gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc 780
tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag 840
aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc 900
tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag 960
ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc 1020
gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa 1080
gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat 1140
gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg 1200
gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt 1260
tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga 1320
tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg 1380
gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg 1440
tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc 1500
ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa 1560
gacggtccag catcatccgg 1580
<210>38
<211>396
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>38
Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala
1 5 10 15
Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser
20 25 30
Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp
35 40 45
Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu
50 55 60
Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys
65 70 75 80
Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn
85 90 95
Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile
100 105 110
Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys
115 120 125
Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr
130 135 140
Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr
145 150 155 160
Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr
165 170 175
Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu
180 185 190
Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met
195 200 205
Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu
210 215 220
Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser
225 230 235 240
Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser
245 250 255
Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr
260 265 270
Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala
275 280 285
Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg
290 295 300
Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val
305 310 315 320
Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu
325 330 335
Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp
355 360 365
Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr
370 375 380
Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe
385 390 395
<210>39
<211>1203
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>39
atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca 60
cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt 120
attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac 180
cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg 240
gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct 300
cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc 360
tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag 420
aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt 480
gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg 540
tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc 600
aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac 660
aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac 720
cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct 780
gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac 840
gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga 900
cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct 960
gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg 1020
attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg 1080
tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg 1140
ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg 1200
taa 1203
<210>40
<211>400
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>40
Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu
1 5 10 15
Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro
20 25 30
Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu
35 40 45
Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala
50 55 60
Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser
65 70 75 80
Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu
85 90 95
Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val
100 105 110
Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu
115 120 125
Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn
130 135 140
Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe
145 150 155 160
Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala
165 170 175
Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile
180 185 190
Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile
195 200 205
Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro
210 215 220
Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn
225 230 235 240
Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn
245 250 255
Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala
260 265 270
Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala
275 280 285
Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys
290 295 300
Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala
305 310 315 320
Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro
325 330 335
Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro
355 360 365
Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr
370 375 380
Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp
385 390 395 400
<210>41
<211>1501
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>41
gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt 60
ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg 120
ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc 180
gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc 240
ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa 300
ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag 360
tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc 420
tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat 480
ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc 540
ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc 600
cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc 660
tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc 720
tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac 780
aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc 840
cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat 900
gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc 960
ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg 1020
ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac 1080
agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac 1140
tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc 1200
caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg 1260
acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc 1320
ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg 1380
cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac 1440
ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg 1500
g 1501
<210>42
<211>464
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>42
Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val
1 5 10 15
Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val
20 25 30
His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val
35 40 45
Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His
50 55 60
Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His
65 70 75 80
Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu
85 90 95
Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu
100 105 110
Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val
115 120 125
Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu
130 135 140
Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu
145 150 155 160
Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr
165 170 175
Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly
180 185 190
Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu
195 200 205
Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu
210 215 220
Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly
225 230 235 240
Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr
245 250 255
Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe
260 265 270
Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr
275 280 285
Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala
290 295 300
Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser
305 310 315 320
Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg
325 330 335
Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met
340 345 350
Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly
355 360 365
Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe
370 375 380
Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly
385 390 395 400
Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg
405 410 415
Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His
420 425 430
Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu
435 440 445
Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu
450 455 460
<210>43
<211>1368
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>43
accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc 60
gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac 120
gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc 180
gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga 240
cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc 300
ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc 360
cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa 420
ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct 480
cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag 540
cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa 600
gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt 660
tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca 720
acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca 780
acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt 840
gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc 900
gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca 960
acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg 1020
tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct 1080
tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg 1140
ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga 1200
actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga 1260
tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg 1320
gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt 1368
<210>44
<211>423
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>44
Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu
1 5 10 15
Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys
20 25 30
Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg
35 40 45
Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly
50 55 60
Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala
65 70 75 80
Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala
85 90 95
His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu
100 105 110
Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu
115 120 125
Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala
130 135 140
Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn
145 150 155 160
Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro
165 170 175
Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln
180 185 190
Cys Pro Lys Leu Asp Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr
195 200 205
Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu
210 215 220
Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys
225 230 235 240
Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu
245 250 255
Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr
260 265 270
Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr
275 280 285
Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile
290 295 300
Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val
305 310 315 320
Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn
325 330 335
Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly
340 345 350
Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp
355 360 365
Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys
370 375 380
Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp
385 390 395 400
Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr
405 410 415
Tyr Lys Ser Glu Cys Ser His
420
<210>45
<211>1011
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>45
atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc 60
gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc 120
tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc 180
gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc 240
gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc 300
tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg 360
gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag 420
atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc 480
cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg 540
acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac 600
gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc 660
accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac 720
atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct 780
tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg 840
agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct 900
tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc 960
gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g 1011
<210>46
<211>336
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>46
Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala
1 5 10 15
Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr
20 25 30
Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val
35 40 45
Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg
50 55 60
Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala
65 70 75 80
Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala
85 90 95
Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met
100 105 110
Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu
115 120 125
Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp
130 135 140
Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys
145 150 155 160
Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met
165 170 175
Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg
180 185 190
Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr
195 200 205
Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr
210 215 220
Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr
225 230 235 240
Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys
245 250 255
Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu
260 265 270
Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln
275 280 285
Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly
290 295 300
Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val
305 310 315 320
Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn
325 330 335
<210>47
<211>1480
<212>DNA
<213>Cladorrhinum foecundissimum
<400>47
gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca 60
caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac 120
cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg 180
ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg 240
cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc 300
tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga 360
cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac 420
tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct 480
ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc 540
tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc 600
cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga 660
ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa 720
ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga 780
aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa 840
cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc 900
ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt 960
cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat 1020
ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc 1080
ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat 1140
ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga 1200
gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc 1260
ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc 1320
gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg 1380
gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt 1440
agagcgggtt ggttggatat gaatacgttg aattggatgt 1480
<210>48
<211>440
<212>PRT
<213>Cladorrhinum foecundissimum
<400>48
Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala
1 5 10 15
Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu
20 25 30
Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr
35 40 45
Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp
50 55 60
Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys
65 70 75 80
Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp
85 90 95
Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro
100 105 110
Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr
115 120 125
Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala
130 135 140
Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met
145 150 155 160
Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly
165 170 175
Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln
195 200 205
Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser
210 215 220
Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr
225 230 235 240
Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp
245 250 255
Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe
260 265 270
Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr
275 280 285
Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu
290 295 300
Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn
305 310 315 320
Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr
325 330 335
Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu
340 345 350
Lys Ala Met Gly Glu Ala Ile Gly Arg Gly Met Val Leu Val Phe Ser
355 360 365
Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly
370 375 380
Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys
385 390 395 400
Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu
405 410 415
Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg
420 425 430
Val Ala Arg Gly Leu Thr Ala Ser
435 440
<210>49
<211>1380
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>49
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag 1380
<210>50
<211>459
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>50
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210>51
<211>1542
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>51
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60
tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120
acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180
acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240
aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300
gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360
gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420
ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480
ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540
ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600
aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660
ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720
gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780
ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840
aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900
accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960
tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020
aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080
tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140
atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200
aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260
cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320
ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380
ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440
tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500
acaacttgcc aggtcctgaa cccttactac tctcagtgcc tg 1542
<210>52
<211>514
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>52
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
450 455 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465 470 475 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
485 490 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
500 505 510
Cys Leu
<210>53
<211>1413
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>53
atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct 60
ctagaggagc ggcaagcttg ctcaagcgtc tggggccaat gtggtggcca gaattggtcg 120
ggtccgactt gctgtgcttc cggaagcaca tgcgtctact ccaacgacta ttactcccag 180
tgtcttcccg gcgctgcaag ctcaagctcg tccacgcgcg ccgcgtcgac gacttctcga 240
gtatccccca caacatcccg gtcgagctcc gcgacgcctc cacctggttc tactactacc 300
agagtacctc cagtcggatc gggaaccgct acgtattcag gcaacccttt tgttggggtc 360
actccttggg ccaatgcata ttacgcctct gaagttagca gcctcgctat tcctagcttg 420
actggagcca tggccactgc tgcagcagct gtcgcaaagg ttccctcttt tatgtggcta 480
gatactcttg acaagacccc tctcatggag caaaccttgg ccgacatccg caccgccaac 540
aagaatggcg gtaactatgc cggacagttt gtggtgtatg acttgccgga tcgcgattgc 600
gctgcccttg cctcgaatgg cgaatactct attgccgatg gtggcgtcgc caaatataag 660
aactatatcg acaccattcg tcaaattgtc gtggaatatt ccgatatccg gaccctcctg 720
gttattgagc ctgactctct tgccaacctg gtgaccaacc tcggtactcc aaagtgtgcc 780
aatgctcagt cagcctacct tgagtgcatc aactacgccg tcacacagct gaaccttcca 840
aatgttgcga tgtatttgga cgctggccat gcaggatggc ttggctggcc ggcaaaccaa 900
gacccggccg ctcagctatt tgcaaatgtt tacaagaatg catcgtctcc gagagctctt 960
cgcggattgg caaccaatgt cgccaactac aacgggtgga acattaccag ccccccatcg 1020
tacacgcaag gcaacgctgt ctacaacgag aagctgtaca tccacgctat tggacctctt 1080
cttgccaatc acggctggtc caacgccttc ttcatcactg atcaaggtcg atcgggaaag 1140
cagcctaccg gacagcaaca gtggggagac tggtgcaatg tgatcggcac cggatttggt 1200
attcgcccat ccgcaaacac tggggactcg ttgctggatt cgtttgtctg ggtcaagcca 1260
ggcggcgagt gtgacggcac cagcgacagc agtgcgccac gatttgactc ccactgtgcg 1320
ctcccagatg ccttgcaacc ggcgcctcaa gctggtgctt ggttccaagc ctactttgtg 1380
cagcttctca caaacgcaaa cccatcgttc ctg 1413
<210>54
<211>471
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>54
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1 5 10 15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
50 55 60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65 70 75 80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
85 90 95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
100 105 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
115 120 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
130 135 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145 150 155 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
165 170 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
180 185 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
195 200 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
210 215 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225 230 235 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
245 250 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
260 265 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
275 280 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
290 295 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305 310 315 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
325 330 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
340 345 350
Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn
355 360 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
370 375 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385 390 395 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
405 410 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
420 425 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
435 440 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
450 455 460
Asn Ala Asn Pro Ser Phe Leu
465 470
<210>55
<211>1377
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>55
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctt 1377
<210>56
<211>459
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>56
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210>57
<211>1254
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>57
atgaacaagt ccgtggctcc attgctgctt gcagcgtcca tactatatgg cggcgccgtc 60
gcacagcaga ctgtctgggg ccagtgtgga ggtattggtt ggagcggacc tacgaattgt 120
gctcctggct cagcttgttc gaccctcaat ccttattatg cgcaatgtat tccgggagcc 180
actactatca ccacttcgac ccggccacca tccggtccaa ccaccaccac cagggctacc 240
tcaacaagct catcaactcc acccacgagc tctggggtcc gatttgccgg cgttaacatc 300
gcgggttttg actttggctg taccacagat ggcacttgcg ttacctcgaa ggtttatcct 360
ccgttgaaga acttcaccgg ctcaaacaac taccccgatg gcatcggcca gatgcagcac 420
ttcgtcaacg aggacgggat gactattttc cgcttacctg tcggatggca gtacctcgtc 480
aacaacaatt tgggcggcaa tcttgattcc acgagcattt ccaagtatga tcagcttgtt 540
caggggtgcc tgtctctggg cgcatactgc atcgtcgaca tccacaatta tgctcgatgg 600
aacggtggga tcattggtca gggcggccct actaatgctc aattcacgag cctttggtcg 660
cagttggcat caaagtacgc atctcagtcg agggtgtggt tcggcatcat gaatgagccc 720
cacgacgtga acatcaacac ctgggctgcc acggtccaag aggttgtaac cgcaatccgc 780
aacgctggtg ctacgtcgca attcatctct ttgcctggaa atgattggca atctgctggg 840
gctttcatat ccgatggcag tgcagccgcc ctgtctcaag tcacgaaccc ggatgggtca 900
acaacgaatc tgatttttga cgtgcacaaa tacttggact cagacaactc cggtactcac 960
gccgaatgta ctacaaataa cattgacggc gccttttctc cgcttgccac ttggctccga 1020
cagaacaatc gccaggctat cctgacagaa accggtggtg gcaacgttca gtcctgcata 1080
caagacatgt gccagcaaat ccaatatctc aaccagaact cagatgtcta tcttggctat 1140
gttggttggg gtgccggatc atttgatagc acgtatgtcc tgacggaaac accgactagc 1200
agtggtaact catggacgga cacatccttg gtcagctcgt gtctcgcaag aaag 1254
<210>58
<211>418
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>58
Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr
1 5 10 15
Gly Gly Ala Val Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr
35 40 45
Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr
50 55 60
Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
65 70 75 80
Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala
85 90 95
Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
100 105 110
Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser
115 120 125
Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Glu
130 135 140
Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
145 150 155 160
Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr
165 170 175
Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val
180 185 190
Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
195 200 205
Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
210 215 220
Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
225 230 235 240
His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val
245 250 255
Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro
260 265 270
Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala
275 280 285
Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
290 295 300
Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
305 310 315 320
Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala
325 330 335
Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
340 345 350
Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln
355 360 365
Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly
370 375 380
Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Ser
385 390 395 400
Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala
405 410 415
Arg Lys
<210>59
<211>702
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>59
atgaagttcc ttcaagtcct ccctgccctc ataccggccg ccctggccca aaccagctgt 60
gaccagtggg caaccttcac tggcaacggc tacacagtca gcaacaacct ttggggagca 120
tcagccggct ctggatttgg ctgcgtgacg gcggtatcgc tcagcggcgg ggcctcctgg 180
cacgcagact ggcagtggtc cggcggccag aacaacgtca agtcgtacca gaactctcag 240
attgccattc cccagaagag gaccgtcaac agcatcagca gcatgcccac cactgccagc 300
tggagctaca gcgggagcaa catccgcgct aatgttgcgt atgacttgtt caccgcagcc 360
aacccgaatc atgtcacgta ctcgggagac tacgaactca tgatctggct tggcaaatac 420
ggcgatattg ggccgattgg gtcctcacag ggaacagtca acgtcggtgg ccagagctgg 480
acgctctact atggctacaa cggagccatg caagtctatt cctttgtggc ccagaccaac 540
actaccaact acagcggaga tgtcaagaac ttcttcaatt atctccgaga caataaagga 600
tacaacgctg caggccaata tgttcttagc taccaatttg gtaccgagcc cttcacgggc 660
agtggaactc tgaacgtcgc atcctggacc gcatctatca ac 702
<210>60
<211>234
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>60
Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala
1 5 10 15
Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr
20 25 30
Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys
35 40 45
Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp
50 55 60
Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln
65 70 75 80
Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro
85 90 95
Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val
100 105 110
Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser
115 120 125
Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly
130 135 140
Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp
145 150 155 160
Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val
165 170 175
Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe
180 185 190
Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val
195 200 205
Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu
210 215 220
Asn Val Ala Ser Trp Thr Ala Ser Ile Asn
225 230
<210>61
<211>726
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>61
atgaaggcaa ctctggttct cggctccctc attgtaggcg ccgtttccgc gtacaaggcc 60
accaccacgc gctactacga tgggcaggag ggtgcttgcg gatgcggctc gagctccggc 120
gcattcccgt ggcagctcgg catcggcaac ggagtctaca cggctgccgg ctcccaggct 180
ctcttcgaca cggccggagc ttcatggtgc ggcgccggct gcggtaaatg ctaccagctc 240
acctcgacgg gccaggcgcc ctgctccagc tgcggcacgg gcggtgctgc tggccagagc 300
atcatcgtca tggtgaccaa cctgtgcccg aacaatggga acgcgcagtg gtgcccggtg 360
gtcggcggca ccaaccaata cggctacagc taccatttcg acatcatggc gcagaacgag 420
atctttggag acaatgtcgt cgtcgacttt gagcccattg cttgccccgg gcaggctgcc 480
tctgactggg ggacgtgcct ctgcgtggga cagcaagaga cggatcccac gcccgtcctc 540
ggcaacgaca cgggctcaac tcctcccggg agctcgccgc cagcgacatc gtcgagtccg 600
ccgtctggcg gcggccagca gacgctctat ggccagtgtg gaggtgccgg ctggacggga 660
cctacgacgt gccaggcccc agggacctgc aaggttcaga accagtggta ctcccagtgt 720
cttcct 726
<210>62
<211>242
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>62
Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser
1 5 10 15
Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala
20 25 30
Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile
35 40 45
Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr
50 55 60
Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu
65 70 75 80
Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala
85 90 95
Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn
100 105 110
Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly
115 120 125
Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp
130 135 140
Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala
145 150 155 160
Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro
165 170 175
Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser
180 185 190
Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr
195 200 205
Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys
210 215 220
Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys
225 230 235 240
Leu Pro
<210>63
<211>1446
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>63
atggctcaga agctccttct cgccgccgcc cttgcggcca gcgccctcgc tgctcccgtc 60
gtcgaggagc gccagaactg cggttccgtc tggagccaat gcggcggcat tggctggtcc 120
ggcgcgacct gctgcgcttc gggcaatacc tgcgttgagc tgaacccgta ctactcgcag 180
tgcctgccca acagccaggt gactacctcg accagcaaga ccacctccac caccaccagg 240
agcagcacca ccagccacag cagcggtccc accagcacga gcaccaccac caccagcagt 300
cccgtggtca ctaccccgcc gagtacctcc atccccggcg gtgcctcgtc aacggccagc 360
tggtccggca acccgttctc gggcgtgcag atgtgggcca acgactacta cgcctccgag 420
gtctcgtcgc tggccatccc cagcatgacg ggcgccatgg ccaccaaggc ggccgaggtg 480
gccaaggtgc ccagcttcca gtggcttgac cgcaacgtca ccatcgacac gctgttcgcc 540
cacacgctgt cgcagatccg cgcggccaac cagaaaggcg ccaacccgcc ctacgcgggc 600
atcttcgtgg tctacgacct tccggaccgc gactgcgccg ccgccgcgtc caacggcgag 660
ttctccatcg cgaacaacgg ggcggccaac tacaagacgt acatcgacgc gatccggagc 720
ctcgtcatcc agtactcaga catccgcatc atcttcgtca tcgagcccga ctcgctggcc 780
aacatggtga ccaacctgaa cgtggccaag tgcgccaacg ccgagtcgac ctacaaggag 840
ttgaccgtct acgcgctgca gcagctgaac ctgcccaacg tggccatgta cctggacgcc 900
ggccacgccg gctggctcgg ctggcccgcc aacatccagc cggccgccaa cctcttcgcc 960
gagatctaca cgagcgccgg caagccggcc gccgtgcgcg gcctcgccac caacgtggcc 1020
aactacaacg gctggagcct ggccacgccg ccctcgtaca cccagggcga ccccaactac 1080
gacgagagcc actacgtcca ggccctcgcc ccgctgctca ccgccaacgg cttccccgcc 1140
cacttcatca ccgacaccgg ccgcaacggc aagcagccga ccggacaacg gcaatgggga 1200
gactggtgca acgttatcgg aactggcttc ggcgtgcgcc cgacgacaaa caccggcctc 1260
gacatcgagg acgccttcgt ctgggtcaag cccggcggcg agtgcgacgg cacgagcaac 1320
acgacctctc cccgctacga ctaccactgc ggcctgtcgg acgcgctgca gcctgctccg 1380
gaggccggca cttggttcca ggcctacttc gagcagctcc tgaccaacgc caacccgccc 1440
ttttaa 1446
<210>64
<211>481
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>64
Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu
1 5 10 15
Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser
20 25 30
Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly
35 40 45
Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg
65 70 75 80
Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr
85 90 95
Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro
100 105 110
Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly
115 120 125
Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu
130 135 140
Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val
145 150 155 160
Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp
165 170 175
Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys
180 185 190
Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro
195 200 205
Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala
210 215 220
Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser
225 230 235 240
Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro
245 250 255
Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala
260 265 270
Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln
275 280 285
Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly
290 295 300
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala
305 310 315 320
Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala
325 330 335
Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser
340 345 350
Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala
355 360 365
Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr
370 375 380
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly
385 390 395 400
Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr
405 410 415
Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly
420 425 430
Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr
435 440 445
His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr
450 455 460
Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro
465 470 475 480
Phe
<210>65
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>65
aacgttaatt aaggaatcgt tttgtgttt 29
<210>66
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>66
agtactagta gctccgtggc gaaagcctg 29
<210>67
<211>31
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>67
ttgaattgaa aatagattga tttaaaactt c 31
<210>68
<211>25
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>68
ttgcatgcgt aatcatggtc atagc 25
<210>69
<211>26
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>69
ttgaattcat gggtaataac tgatat 26
<210>70
<211>32
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>70
aaatcaatct attttcaatt caattcatca tt 32
<210>71
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>71
gtactaaaac c 11
<210>72
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>72
ccgttaaatt t 11
<210>73
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>73
ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc 45
<210>74
<211>14
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>74
atgcaattta aact 14
<210>75
<211>14
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>75
cggcaattta acgg 14
<210>76
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>76
ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc 44
<210>77
<211>29
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>77
aagcttaagc atgcgttect cccccctcc 29
<210>78
<211>32
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>78
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>79
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>79
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>80
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>80
accgcggact gcgcatcatg cgttcctccc ccctcc 36
<210>81
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>81
aaacgtcgac cgaatgtagg attgttatc 29
<210>82
<211>17
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>82
gatgcgcagt ccgcggt 17
<210>83
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>83
aaacgtcgac cgaatgtagg attgttatc 29
<210>84
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>84
ggagggggga ggaacgcatg atgcgcagtc cgcggt 36
<210>85
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>85
aaacgtcgac cgaatgtagg attgttatc 29
<210>86
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>86
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>87
<211>46
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>87
atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg 46
<210>88
<211>26
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>88
actagtttac tgggccttag gcagcg 26
<210>89
<211>26
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>89
gtcgactcga agcccgaatg taggat 26
<210>90
<211>45
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>90
cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta 45
<210>91
<211>57
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>91
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgcc 57
<210>92
<211>19
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>92
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala
<210>93
<211>42
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>93
tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc 42
<210>94
<211>28
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>94
gactagtctt actgggcctt aggcagcg 28
<210>95
<211>63
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>95
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gcc 63
<210>96
<211>21
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>96
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala
20
<210>97
<211>30
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>97
acgcgtcgac cgaatgtagg attgttatcc 30
<210>98
<211>42
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>98
gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca 42
<210>99
<211>20
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>99
cccaagctta gccaagaaca 20
<210>100
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>100
gggggaggaa cgcatgggat ctggacggc 29
<210>101
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>101
gccgtccaga tccccatgcg ttcctccccc 30
<210>102
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>102
ccaagcttgt tcagagtttc 20
<210>103
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>103
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>104
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>104
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
<210>105
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>105
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>106
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>106
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
<210>107
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>107
ggactgcgca gcatgcgttc 20
<210>108
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>108
agttaattaa ttactgggcc ttaggcagcg 30
<210>109
<211>28
<212>DNA
<213>桔橙嗜热霉(Thermoascus aurantiacus)
<400>109
atgtcctttt ccaagataat tgctactg 28
<210>110
<211>26
<212>DNA
<213>桔橙嗜热霉(Thermoascus aurantiacus)
<400>110
gcttaattaa ccagtataca gaggag 26
Claims (51)
1.丝状真菌宿主细胞,其包含:(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸;(b)编码天然或异源β-葡糖苷酶的第二多核苷酸;和(c)编码选自下组的天然或异源纤维素分解酶的一个或多个(几个)第三多核苷酸:里氏木霉(Trichoderma reesei)纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。
2.权利要求1的丝状真菌宿主细胞,其中具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是4或5个邻接位置上的任何氨基酸,并且X(4)是4个邻接位置上的任何氨基酸;和
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]的具有增强纤维素分解的活性的多肽,其中x是任何氨基酸,x(4,5)是4或5个邻接位置上的任何氨基酸,并且x(3)是3个邻接位置上的任何氨基酸;
其中包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽可选地进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是1个位置或2个邻接位置上的任何氨基酸,X(3)是3个邻接位置上的任何氨基酸,并且X(2)是2个邻接位置上的任何氨基酸。
3.权利要求1的丝状真菌宿主细胞,其中具有增强纤维素分解的活性的多肽选自下组:
(a)多肽,其包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,和甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQ ID NO:13的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体;和
(e)具有增强纤维素分解的活性的多肽,其包含或组成为SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽,或者其具有增强纤维素分解的活性的片段。
4.权利要求1的丝状真菌宿主细胞,其中所述β-葡糖苷酶是β-葡糖苷酶融合蛋白。
5.权利要求4的丝状真菌宿主细胞,其中所述β-葡糖苷酶融合蛋白包含:(a)包含信号肽的第一氨基酸序列;(b)至少包含内切葡聚糖酶的催化域的第二氨基酸序列;和(c)至少包含β-葡糖苷酶的催化域的第三氨基酸序列;其中第一氨基酸序列的C-末端以符合读框的方式连接至第二氨基酸序列的N-末端,并且第二氨基酸序列的C-末端以符合读框的方式连接至第三氨基酸序列的N-末端。
6.权利要求5的丝状真菌宿主细胞,其中所述β-葡糖苷酶融合蛋白包含或组成为SEQ ID NO:103或SEQ ID NO:105。
7.权利要求1的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:52的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:51的成熟多肽编码序列,(ii)包含在SEQ ID NO:51的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:51的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:51的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:52的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
8.权利要求1的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶I(CEL7A)包含或组成为SEQ ID NO:52的成熟多肽。
9.权利要求1的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:54的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:53的成熟多肽编码序列,(ii)包含在SEQ ID NO:53的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:53的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:53的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:54的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
10.权利要求1的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶II(CEL6A)包含或组成为SEQ ID NO:54的成熟多肽。
11.权利要求1的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:56的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:55的成熟多肽编码序列,(ii)包含在SEQ ID NO:55的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:55的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:55的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:56的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
12.权利要求1的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶I(CEL7B)包含或组成为SEQ ID NO:56的成熟多肽。
13.权利要求1-12中任一项的丝状真菌宿主细胞,其进一步包含一个或多个(几个)第四多核苷酸,其编码选自下组的纤维素分解酶:里氏木霉内切葡聚糖酶II(CEL5A)、里氏木霉内切葡聚糖酶III(CEL12A),和里氏木霉内切葡聚糖酶V(CEL45A),和它们的直向同源物或变体。
14.权利要求13的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:58的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,和最优选至少高严紧条件下与以下杂交:(i)SEQID NO:57的成熟多肽编码序列,(ii)包含在SEQ ID NO:57的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:57的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:57的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:58的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
15.权利要求13的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶II(CEL5A)包含或组成为SEQ ID NO:58的成熟多肽。
16.权利要求13的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:60的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:59的成熟多肽编码序列,(ii)包含在SEQ ID NO:59的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:59的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:59的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:60的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
17.权利要求13的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶III(CEL12A)是包含或组成为SEQ ID NO:60的成熟多肽。
18.权利要求13的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:62的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:61的成熟多肽编码序列,(ii)包含在SEQ ID NO:61的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:61的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:61的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:62的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
19.权利要求13的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶V (CEL45A)是包含或组成为SEQ ID NO:61的成熟多肽。
20.权利要求1的丝状真菌宿主细胞,其产生纤维素分解蛋白质组合物,所述组合物包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。
21.权利要求1-20中任一项的丝状真菌宿主细胞,其还产生选自下组的一个或多个(几个)酶:SEQ ID NO:58的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的里氏木霉内切葡聚糖酶III(CEL12A)。
22.权利要求1-21中任一项的丝状真菌宿主细胞,其还产生SEQ ID NO:64的成熟多肽的土生梭孢霉(Thielavia terrestris)纤维二糖水解酶。
23.产生纤维素分解蛋白质组合物的方法,其包含:(a)在有益于产生所述多肽的条件下培养权利要求1-22中任一项的宿主细胞;和(b)回收所述多肽。
24.通过权利要求23的方法获得的纤维素分解蛋白质组合物。
25.纤维素分解蛋白质组合物,其包含:(a)具有增强纤维素分解的活性的多肽;(b)β-葡糖苷酶;和(c)一个或多个(几个)选自下组的纤维素分解酶:里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。
26.权利要求25的纤维素分解蛋白质组合物,其中具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是4或5个邻接位置上的任何氨基酸,并且X(4)是4个邻接位置上的任何氨基酸;和
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]的具有增强纤维素分解的活性的多肽,其中x是任何氨基酸,x(4,5)是4或5个邻接位置上的任何氨基酸,并且x(3)是3个邻接位置上的任何氨基酸;
其中包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽还包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是1个位置或2个邻接位置上的任何氨基酸,X(3)是3个邻接位置上的任何氨基酸,并且X(2)是2个邻接位置上的任何氨基酸。
27.权利要求25的纤维素分解蛋白质组合物,其中具有增强纤维素分解的活性的多肽选自下组:
(a)多肽,其包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8,或SEQ ID NO:10,SEQ ID NO:12,或SEQ ID NO:14的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:7、SEQ ID NO:9,或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体;和
(e)具有增强纤维素分解的活性的多肽,所述多肽包含或组成为SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽;或者其具有增强纤维素分解的活性的片段。
28.权利要求25的纤维素分解蛋白质组合物,其中所述β-葡糖苷酶是β-葡糖苷酶融合蛋白。
29.权利要求28的纤维素分解蛋白质组合物,其中所述β-葡糖苷酶融合蛋白包含:(a)包含信号肽的第一氨基酸序列;(b)至少包含内切葡聚糖酶的催化域的第二氨基酸序列;和(c)至少包含β-葡糖苷酶的催化域的第三氨基酸序列;其中第一氨基酸序列的C-末端以符合读框的方式连接至第二氨基酸序列的N-末端,并且第二氨基酸序列的C-末端以符合读框的方式连接至第三氨基酸序列的N-末端。
30.权利要求29的纤维素分解蛋白质组合物,其中所述β-葡糖苷酶融合蛋白包含或组成为SEQ ID NO:103或SEQ ID NO:105。
31.权利要求25的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:52的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:51的成熟多肽编码序列,(ii)包含在SEQ ID NO:51的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:51的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:51的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:52的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
32.权利要求25的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶I(CEL7A)包含或组成为SEQ ID NO:52的成熟多肽。
33.权利要求25的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:54的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:53的成熟多肽编码序列,(ii)包含在SEQ ID NO:53的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:53的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:53的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:54的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
34.权利要求25的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶II(CEL6A)包含或组成为SEQ ID NO:54的成熟多肽。
35.权利要求25的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:56的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:55的成熟多肽编码序列,(ii)包含在SEQ ID NO:55的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:55的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:55的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:56的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
36.权利要求25的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶I(CEL7B)包含或组成为SEQ ID NO:56的成熟多肽。
37.权利要求25-36中任一项的纤维素分解蛋白质组合物,其进一步包含一个或多个(几个)第四多核苷酸,其编码选自下组的纤维素分解酶:里氏木霉内切葡聚糖酶II(CEL5A)、里氏木霉内切葡聚糖酶III(CEL12A),和里氏木霉内切葡聚糖酶V(CEL45A),和它们的直向同源物或变体。
38.权利要求37的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:58的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:57的成熟多肽编码序列,(ii)包含在SEQ ID NO:57的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:57的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:57的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:58的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
39.权利要求37的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶II(CEL5A)包含或组成为SEQ ID NO:58的成熟多肽。
40.权利要求37的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:60的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:59的成熟多肽编码序列,(ii)包含在SEQ ID NO:59的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:59的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:59的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:60的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
41.权利要求37的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶III(CEL12A)是包含或组成为SEQ ID NO:60的成熟多肽。
42.权利要求37的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:62的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件下,更优选至少中-高严紧条件下,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:61的成熟多肽编码序列,(ii)包含在SEQ ID NO:61的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:61的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:61的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,并且甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:62的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
43.权利要求37的纤维素分解蛋白质组合物,其中里氏木霉内切葡聚糖酶V(CEL45A)是包含或组成为SEQ ID NO:61的成熟多肽。
44.权利要求25的纤维素分解蛋白质组合物,其包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。
45.权利要求25-44中任一项的纤维素分解蛋白质组合物,其进一步包含选自下组的一个或多个(几个)酶:SEQ ID NO:58的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ IDNO:60的里氏木霉内切葡聚糖酶III(CEL12A)。
46.权利要求25-45中任一项的纤维素分解蛋白质组合物,其进一步包含SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。
47.用于降解或转化含纤维素材料的方法,其包括用有效量的权利要求25-46中任一项的纤维素分解蛋白质组合物处理所述含纤维素材料。
48.权利要求47的方法,其进一步包括用有效量的选自下组的一种或多种(几种)酶处理含纤维素材料:半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶,或它们的混合物。
49.权利要求47或48的方法,其进一步包括回收降解的含纤维素材料。
50.用于产生发酵产物的方法,其包括:(a)用有效量的权利要求25-46中任一项的纤维素分解蛋白质组合物糖化含纤维素材料;(b)用一种或多种(几种)发酵微生物发酵步骤(a)的经糖化的含纤维素材料以产生发酵产物;和(c)从发酵回收所述发酵产物。
51.权利要求50的方法,其进一步包括用有效量的选自下组的一种或多种(几种)酶处理所述含纤维素材料:半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶,或它们的混合物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US94125107P | 2007-05-31 | 2007-05-31 | |
US60/941,251 | 2007-05-31 | ||
PCT/US2008/065417 WO2008151079A2 (en) | 2007-05-31 | 2008-05-30 | Compositions for degrading cellulosic material |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101970651A true CN101970651A (zh) | 2011-02-09 |
CN101970651B CN101970651B (zh) | 2013-10-09 |
Family
ID=40088716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801013711A Expired - Fee Related CN101970651B (zh) | 2007-05-31 | 2008-05-30 | 用于降解纤维素材料的组合物 |
Country Status (8)
Country | Link |
---|---|
US (2) | US9969993B2 (zh) |
JP (1) | JP2010528624A (zh) |
KR (1) | KR20100029088A (zh) |
CN (1) | CN101970651B (zh) |
BR (1) | BRPI0812267A2 (zh) |
MX (1) | MX2009012844A (zh) |
NZ (1) | NZ581257A (zh) |
RU (1) | RU2494146C2 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103890180A (zh) * | 2011-08-24 | 2014-06-25 | 诺维信股份有限公司 | 在丝状真菌宿主细胞中产生多种重组多肽的方法 |
CN107988127A (zh) * | 2017-11-02 | 2018-05-04 | 南京农业大学 | 里氏木霉木质纤维素酶基因工程乳酸菌组合在调制优质苜蓿青贮饲料中的应用 |
CN108048430A (zh) * | 2018-01-08 | 2018-05-18 | 中国农业科学院饲料研究所 | 内切葡聚糖酶NfEG12A突变体及其编码基因和应用 |
CN109371002A (zh) * | 2011-03-17 | 2019-02-22 | 丹尼斯科美国公司 | 纤维素酶组合物和使用相同组合物用于改善木质纤维素生物质转化成可发酵糖的方法 |
CN111836625A (zh) * | 2017-11-22 | 2020-10-27 | 慕尼黑工业大学 | 制备木葡聚糖-寡糖的方法 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0812267A2 (pt) * | 2007-05-31 | 2014-10-14 | Novozymes Inc | Célula hospedeira fúngica filamentosa, método para produzir uma composição de proteína celulolítica, composição de proteína celulolítica, e, métodos para degradar ou converter um material, contendo celulose e para produzir um produto de fermentação |
US20090246844A1 (en) * | 2007-10-26 | 2009-10-01 | Arbor Fuel Inc. | Methods for the production of ethanol |
US8338121B2 (en) * | 2008-12-19 | 2012-12-25 | Novozymes, Inc. | Methods for determining cellulolytic enhancing activity of a polypeptide |
JP5618478B2 (ja) * | 2008-12-25 | 2014-11-05 | Meiji Seikaファルマ株式会社 | 新規セルラーゼ遺伝子 |
WO2010096488A1 (en) * | 2009-02-17 | 2010-08-26 | The Regents Of The University Of California | Method of reducing acetylation in plants to improve biofuel production |
US20100233775A1 (en) * | 2009-03-13 | 2010-09-16 | Tech V, LLC | System for the production of methane and other useful products and method of use |
WO2010110773A1 (en) * | 2009-03-27 | 2010-09-30 | Tech V. Llc | Methanogenic reactor |
US20100248344A1 (en) * | 2009-03-27 | 2010-09-30 | Tech V, LLC | Methanogenic reactor |
WO2010129287A2 (en) | 2009-04-27 | 2010-11-11 | The Board Of Trustees Of The University Of Illinois | Hemicellulose-degrading enzymes |
EP2478096B1 (en) | 2009-09-17 | 2017-05-24 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
RU2012116081A (ru) | 2009-09-23 | 2013-10-27 | ДАНИСКО ЮЭс ИНК. | Новые гликозилгидролазные ферменты и их применения |
MX2012003473A (es) | 2009-09-29 | 2012-05-22 | Novozymes Inc | Polipeptidos que tienen actividad celulitica mejorada y polinucleotidos que codifican para los mismos. |
BR112012013468A2 (pt) * | 2009-12-04 | 2016-05-17 | Georgia Tech Res Inst | processo para tratar uma carga de alimentação compreendendo holocelulose, e, composição adequada para reduzir a cristalinidade da celulose |
EP2516663B1 (en) | 2009-12-23 | 2020-02-12 | Danisco US Inc. | Methods for improving the efficiency of simultaneous saccharification and fermentation reactions |
US20120058534A1 (en) * | 2010-03-09 | 2012-03-08 | Stover & Associates, Inc. | Optimized biogas (biomethane) production process |
CN102939376B (zh) | 2010-03-31 | 2016-07-06 | 明治制果药业株式会社 | 新纤维素酶基因 |
CN107435058A (zh) * | 2010-08-06 | 2017-12-05 | 诺维信公司 | 降解或水解多糖的方法 |
MX2013003102A (es) * | 2010-09-29 | 2013-06-28 | Beta Renewables Spa | Biomasa pretratada que tiene accesibilidad enzimatica potenciada. |
BR112013023737A2 (pt) * | 2011-03-17 | 2016-12-13 | Danisco Us Inc | enzimas de glicosil hidrolase e utilização das mesmas para a hidrólise de biomassa |
CA2830508A1 (en) | 2011-03-17 | 2012-09-20 | Danisco Us Inc. | Method for reducing viscosity in saccharification process |
BR112014007651A2 (pt) * | 2011-09-30 | 2017-04-11 | Novozymes Inc | polipeptídeo quimérico isolado, polinucleotídeo isolado, métodos para produzir um polipeptídeo quimérico e um produto de fermentação, para degradar ou converter um material celulósico, e para fermentar um material celulósico, planta, parte de planta ou célula de planta transgênica, e, formulação de caldo inteiro ou composição de cultura de células |
US9611462B2 (en) * | 2011-12-20 | 2017-04-04 | Codexis, Inc. | Endoglucanase 1B (EG1B) variants |
US9938551B2 (en) | 2012-12-12 | 2018-04-10 | Danisco Us Inc | Variants of cellobiohydrolases |
CN106190874B (zh) * | 2015-05-06 | 2020-06-26 | 中国科学院天津工业生物技术研究所 | 一种强化丝状真菌蛋白质生产的方法 |
AU2019200694B2 (en) * | 2018-02-09 | 2019-10-10 | Department Of Biotechnology | Additive composition useful for improved production of fermentable sugars from lignocellulosic biomass |
RU2696074C1 (ru) * | 2018-11-16 | 2019-07-30 | Федеральное государственное бюджетное учреждение науки Федеральный исследовательский центр питания, биотехнологии и безопасности пищи | Штамм мицелиального гриба trichoderma reesei - продуцент комплекса эндоглюканазы, ксиланазы и пектиназ для получения белковых добавок на основе зернового и зернобобового сырья для применения в кормопроизводстве |
CN110819582B (zh) * | 2019-11-28 | 2021-04-06 | 华派生物工程集团有限公司 | 大肠杆菌表达口蹄疫病毒样颗粒抗原的发酵培养基及培养方法 |
CN112062616A (zh) * | 2020-09-29 | 2020-12-11 | 东北农业大学 | 一种促进农作物秸秆原位还田的腐熟剂及其应用 |
WO2023225459A2 (en) | 2022-05-14 | 2023-11-23 | Novozymes A/S | Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1505682A (zh) * | 2000-06-26 | 2004-06-16 | ��ѧ�о��� | 用于同时糖化发酵的方法和组合物 |
WO2005074656A2 (en) * | 2004-02-06 | 2005-08-18 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5275944A (en) * | 1989-09-26 | 1994-01-04 | Midwest Research Institute | Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068 |
EP0976838A1 (en) * | 1998-05-06 | 2000-02-02 | Rhone-Poulenc Nutrition Animale | Enzymes mixture |
US7375197B2 (en) | 2002-01-14 | 2008-05-20 | Midwest Research Institute | Cellobiohydrolase I gene and improved variants |
DK2295559T3 (en) * | 2002-08-16 | 2015-12-14 | Danisco Us Inc | Hitherto UNKNOWN HYPROCREA JECORINA CBH1 CELLULASE VARIETY WITH INCREASED THERMAL STABILITY COMPREHENSIVE SUBSTITUTION OR DELETION AT POSITION T255 |
US7413888B2 (en) * | 2003-05-02 | 2008-08-19 | Novozymes, Inc. | Variants of beta-glucosidases |
EP1660637A4 (en) * | 2003-08-25 | 2009-10-21 | Novozymes Inc | VARIANTS OF GLYCOSIDE HYDROLASES |
JP4842834B2 (ja) | 2003-12-09 | 2011-12-21 | ノボザイムス,インコーポレイティド | 糸状菌株における遺伝子の発現を排除するか又は低めるための方法 |
CN104726431B (zh) | 2004-01-30 | 2018-06-01 | 诺维信股份有限公司 | 具有分解纤维增强活性的多肽及其编码多核苷酸 |
CN101321857A (zh) * | 2005-09-30 | 2008-12-10 | 诺维信股份有限公司 | 用于增强纤维素材料降解或转化的方法 |
BRPI0812267A2 (pt) * | 2007-05-31 | 2014-10-14 | Novozymes Inc | Célula hospedeira fúngica filamentosa, método para produzir uma composição de proteína celulolítica, composição de proteína celulolítica, e, métodos para degradar ou converter um material, contendo celulose e para produzir um produto de fermentação |
-
2008
- 2008-05-30 BR BRPI0812267-9A2A patent/BRPI0812267A2/pt not_active Application Discontinuation
- 2008-05-30 MX MX2009012844A patent/MX2009012844A/es active IP Right Grant
- 2008-05-30 CN CN2008801013711A patent/CN101970651B/zh not_active Expired - Fee Related
- 2008-05-30 US US12/130,838 patent/US9969993B2/en not_active Expired - Fee Related
- 2008-05-30 NZ NZ581257A patent/NZ581257A/en not_active IP Right Cessation
- 2008-05-30 JP JP2010510535A patent/JP2010528624A/ja active Pending
- 2008-05-30 KR KR1020097025755A patent/KR20100029088A/ko not_active Application Discontinuation
- 2008-05-30 RU RU2009149633/10A patent/RU2494146C2/ru not_active IP Right Cessation
-
2018
- 2018-04-17 US US15/955,162 patent/US20180237759A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1505682A (zh) * | 2000-06-26 | 2004-06-16 | ��ѧ�о��� | 用于同时糖化发酵的方法和组合物 |
WO2005074656A2 (en) * | 2004-02-06 | 2005-08-18 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109371002A (zh) * | 2011-03-17 | 2019-02-22 | 丹尼斯科美国公司 | 纤维素酶组合物和使用相同组合物用于改善木质纤维素生物质转化成可发酵糖的方法 |
CN103890180A (zh) * | 2011-08-24 | 2014-06-25 | 诺维信股份有限公司 | 在丝状真菌宿主细胞中产生多种重组多肽的方法 |
US9493790B2 (en) | 2011-08-24 | 2016-11-15 | Novozymes, Inc. | Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell |
CN109136114A (zh) * | 2011-08-24 | 2019-01-04 | 诺维信股份有限公司 | 在丝状真菌宿主细胞中产生多种重组多肽的方法 |
US10301610B2 (en) | 2011-08-24 | 2019-05-28 | Novozymes, Inc. | Filamentous fungal host cell for producing multiple recombinant polypeptides |
US10822601B2 (en) | 2011-08-24 | 2020-11-03 | Novozymes, Inc. | Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell |
CN107988127A (zh) * | 2017-11-02 | 2018-05-04 | 南京农业大学 | 里氏木霉木质纤维素酶基因工程乳酸菌组合在调制优质苜蓿青贮饲料中的应用 |
CN107988127B (zh) * | 2017-11-02 | 2021-09-03 | 南京农业大学 | 里氏木霉木质纤维素酶基因工程乳酸菌组合在调制优质苜蓿青贮饲料中的应用 |
CN111836625A (zh) * | 2017-11-22 | 2020-10-27 | 慕尼黑工业大学 | 制备木葡聚糖-寡糖的方法 |
CN108048430A (zh) * | 2018-01-08 | 2018-05-18 | 中国农业科学院饲料研究所 | 内切葡聚糖酶NfEG12A突变体及其编码基因和应用 |
Also Published As
Publication number | Publication date |
---|---|
BRPI0812267A2 (pt) | 2014-10-14 |
MX2009012844A (es) | 2009-12-15 |
US20180237759A1 (en) | 2018-08-23 |
JP2010528624A (ja) | 2010-08-26 |
NZ581257A (en) | 2012-03-30 |
US9969993B2 (en) | 2018-05-15 |
RU2009149633A (ru) | 2011-07-10 |
KR20100029088A (ko) | 2010-03-15 |
CN101970651B (zh) | 2013-10-09 |
RU2494146C2 (ru) | 2013-09-27 |
US20080299613A1 (en) | 2008-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101970651B (zh) | 用于降解纤维素材料的组合物 | |
CN101809150B (zh) | 提高多肽的纤维素分解增强活性的方法 | |
CN101516906B (zh) | 提高具有生物学活性之多肽的分泌的方法 | |
CN105886485B (zh) | β-葡糖苷酶变体及其编码多核苷酸 | |
CN103282489B (zh) | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 | |
CN101784659A (zh) | 具有纤维素分解增强活性的多肽和编码它的多核苷酸 | |
CN103890165A (zh) | 纤维素分解酶组合物及其用途 | |
CN103270165A (zh) | 包含具有纤维素分解增强活性的多肽和醌化合物的组合物及其用途 | |
CN101910405A (zh) | 降低鞣质对酶促水解纤维素材料的抑制作用的方法 | |
CN102947442A (zh) | 用于糖化纤维素材料的组合物 | |
CN101855345A (zh) | 用于增强含纤维素材料的降解或转化的组合物和方法 | |
CN107190030A (zh) | 在纤维二糖脱氢酶存在下增加纤维素材料水解的方法 | |
CN110079558A (zh) | 用家族61多肽预处理纤维素材料的方法 | |
CN104540955A (zh) | 用于增加纤维素材料的酶水解的方法 | |
CN101910406A (zh) | 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法 | |
CN107345226A (zh) | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 | |
CN103339252A (zh) | 具有纤维素分解增强活性的嵌合多肽及其编码多核苷酸 | |
US8586828B2 (en) | Polypeptides having beta-glucosidase activity and polynucleotides encoding same | |
CN103930438A (zh) | 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸 | |
AU2012205191B2 (en) | Compositions for degrading cellulosic material | |
CN109022394A (zh) | 具有β-木糖苷酶活性的多肽和编码该多肽的多核苷酸 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20131009 Termination date: 20190530 |
|
CF01 | Termination of patent right due to non-payment of annual fee |