CN101855345A - 用于增强含纤维素材料的降解或转化的组合物和方法 - Google Patents
用于增强含纤维素材料的降解或转化的组合物和方法 Download PDFInfo
- Publication number
- CN101855345A CN101855345A CN200880024110A CN200880024110A CN101855345A CN 101855345 A CN101855345 A CN 101855345A CN 200880024110 A CN200880024110 A CN 200880024110A CN 200880024110 A CN200880024110 A CN 200880024110A CN 101855345 A CN101855345 A CN 101855345A
- Authority
- CN
- China
- Prior art keywords
- seq
- polypeptide
- sequence
- mature polypeptide
- amino acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229920002678 cellulose Polymers 0.000 title claims abstract description 207
- 239000001913 cellulose Substances 0.000 title claims abstract description 207
- 239000000203 mixture Substances 0.000 title claims abstract description 115
- 239000000463 material Substances 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000002708 enhancing effect Effects 0.000 title abstract description 3
- 238000006243 chemical reaction Methods 0.000 title description 8
- 230000015556 catabolic process Effects 0.000 title 1
- 238000006731 degradation reaction Methods 0.000 title 1
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 1185
- 229920001184 polypeptide Polymers 0.000 claims abstract description 1181
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 1179
- 230000000694 effects Effects 0.000 claims abstract description 462
- 108010059892 Cellulase Proteins 0.000 claims abstract description 234
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 claims abstract description 161
- 102000004190 Enzymes Human genes 0.000 claims abstract description 130
- 108090000790 Enzymes Proteins 0.000 claims abstract description 130
- 230000001461 cytolytic effect Effects 0.000 claims abstract description 109
- 230000000593 degrading effect Effects 0.000 claims abstract description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 214
- 239000002773 nucleotide Substances 0.000 claims description 213
- 235000001014 amino acid Nutrition 0.000 claims description 207
- 150000001413 amino acids Chemical class 0.000 claims description 206
- 108091033319 polynucleotide Proteins 0.000 claims description 180
- 239000002157 polynucleotide Substances 0.000 claims description 180
- 102000040430 polynucleotide Human genes 0.000 claims description 180
- 239000000835 fiber Substances 0.000 claims description 170
- 229940088598 enzyme Drugs 0.000 claims description 128
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 115
- 239000012634 fragment Substances 0.000 claims description 101
- 108010047754 beta-Glucosidase Proteins 0.000 claims description 71
- 102000006995 beta-Glucosidase Human genes 0.000 claims description 71
- 238000009396 hybridization Methods 0.000 claims description 48
- 238000000354 decomposition reaction Methods 0.000 claims description 46
- 239000013612 plasmid Substances 0.000 claims description 41
- 230000000295 complement effect Effects 0.000 claims description 40
- 239000002299 complementary DNA Substances 0.000 claims description 36
- 241000894006 Bacteria Species 0.000 claims description 35
- 230000000968 intestinal effect Effects 0.000 claims description 32
- 230000008034 disappearance Effects 0.000 claims description 30
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 27
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 16
- 238000000855 fermentation Methods 0.000 claims description 12
- 230000004151 fermentation Effects 0.000 claims description 12
- 108091005804 Peptidases Proteins 0.000 claims description 5
- 102000035195 Peptidases Human genes 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 108090000371 Esterases Proteins 0.000 claims description 4
- 108010029541 Laccase Proteins 0.000 claims description 4
- 102000003992 Peroxidases Human genes 0.000 claims description 4
- 229940106157 cellulase Drugs 0.000 claims description 4
- 108010002430 hemicellulase Proteins 0.000 claims description 4
- 229940059442 hemicellulase Drugs 0.000 claims description 4
- 108040007629 peroxidase activity proteins Proteins 0.000 claims description 4
- 150000007524 organic acids Chemical class 0.000 claims description 2
- 150000001299 aldehydes Chemical class 0.000 claims 1
- 150000002576 ketones Chemical class 0.000 claims 1
- 229940024606 amino acid Drugs 0.000 description 158
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 56
- 239000002853 nucleic acid probe Substances 0.000 description 56
- 125000000539 amino acid group Chemical group 0.000 description 52
- 210000004215 spore Anatomy 0.000 description 24
- 239000000523 sample Substances 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 20
- 230000008859 change Effects 0.000 description 15
- 230000007062 hydrolysis Effects 0.000 description 15
- 238000006460 hydrolysis reaction Methods 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 14
- 230000008521 reorganization Effects 0.000 description 13
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 12
- 102000039446 nucleic acids Human genes 0.000 description 12
- 108020004707 nucleic acids Proteins 0.000 description 12
- 150000007523 nucleic acids Chemical class 0.000 description 12
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 11
- 230000001276 controlling effect Effects 0.000 description 11
- 244000005700 microbiome Species 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 240000006439 Aspergillus oryzae Species 0.000 description 9
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 8
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 235000018102 proteins Nutrition 0.000 description 8
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- 229920002488 Hemicellulose Polymers 0.000 description 7
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 7
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 7
- 235000019441 ethanol Nutrition 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- 239000010902 straw Substances 0.000 description 7
- 241000193830 Bacillus <bacterium> Species 0.000 description 6
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 5
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 5
- 102000004157 Hydrolases Human genes 0.000 description 5
- 108090000604 Hydrolases Proteins 0.000 description 5
- 240000008042 Zea mays Species 0.000 description 5
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 5
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 235000009973 maize Nutrition 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- -1 methane amide Chemical class 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- 241000235349 Ascomycota Species 0.000 description 4
- 241001225321 Aspergillus fumigatus Species 0.000 description 4
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 241000499912 Trichoderma reesei Species 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 229940091771 aspergillus fumigatus Drugs 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000002421 cell wall Anatomy 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 3
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 3
- 241000228212 Aspergillus Species 0.000 description 3
- 241000223218 Fusarium Species 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 241000605909 Fusobacterium Species 0.000 description 3
- 229920001503 Glucan Polymers 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- 241001344131 Magnaporthe grisea Species 0.000 description 3
- 241000235395 Mucor Species 0.000 description 3
- 241000226677 Myceliophthora Species 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- 241000589516 Pseudomonas Species 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- 241000223258 Thermomyces lanuginosus Species 0.000 description 3
- 241000223259 Trichoderma Species 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 239000012620 biological material Substances 0.000 description 3
- 229960000846 camphor Drugs 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 238000007834 ligase chain reaction Methods 0.000 description 3
- 229920005610 lignin Polymers 0.000 description 3
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 239000010813 municipal solid waste Substances 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 150000004804 polysaccharides Chemical class 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 229920000936 Agarose Polymers 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 241000228215 Aspergillus aculeatus Species 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241000193752 Bacillus circulans Species 0.000 description 2
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 241000193747 Bacillus firmus Species 0.000 description 2
- 241000193422 Bacillus lentus Species 0.000 description 2
- 241000194108 Bacillus licheniformis Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 241000194103 Bacillus pumilus Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 101100494262 Caenorhabditis elegans best-12 gene Proteins 0.000 description 2
- 229920000018 Callose Polymers 0.000 description 2
- 241000589876 Campylobacter Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 241000123346 Chrysosporium Species 0.000 description 2
- 244000251987 Coprinus macrorhizus Species 0.000 description 2
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 241000194033 Enterococcus Species 0.000 description 2
- 241000589565 Flavobacterium Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241000194036 Lactococcus Species 0.000 description 2
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 2
- 241000194109 Paenibacillus lautus Species 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 229920001131 Pulp (paper) Polymers 0.000 description 2
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241000222480 Schizophyllum Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000194054 Streptococcus uberis Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241000187392 Streptomyces griseus Species 0.000 description 2
- 241001655322 Streptomycetales Species 0.000 description 2
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 2
- 241000228341 Talaromyces Species 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 241000228178 Thermoascus Species 0.000 description 2
- 241001494489 Thielavia Species 0.000 description 2
- 241001495429 Thielavia terrestris Species 0.000 description 2
- 241000202898 Ureaplasma Species 0.000 description 2
- 229920002000 Xyloglucan Polymers 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 229940054340 bacillus coagulans Drugs 0.000 description 2
- 229940005348 bacillus firmus Drugs 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 238000010364 biochemical engineering Methods 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000001768 carboxy methyl cellulose Substances 0.000 description 2
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 2
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 229930182470 glycoside Natural products 0.000 description 2
- 125000003147 glycosyl group Chemical group 0.000 description 2
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 239000002029 lignocellulosic biomass Substances 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000010893 paper waste Substances 0.000 description 2
- 239000010908 plant waste Substances 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 229940115922 streptococcus uberis Drugs 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 239000002023 wood Substances 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- TWNIBLMWSKIRAT-RWOPYEJCSA-N (1r,2s,3s,4s,5r)-6,8-dioxabicyclo[3.2.1]octane-2,3,4-triol Chemical compound O1[C@@]2([H])OC[C@]1([H])[C@@H](O)[C@H](O)[C@@H]2O TWNIBLMWSKIRAT-RWOPYEJCSA-N 0.000 description 1
- JQFLYFRHDIHZFZ-RXMQYKEDSA-N (2s)-3,3-dimethylpyrrolidine-2-carboxylic acid Chemical compound CC1(C)CCN[C@@H]1C(O)=O JQFLYFRHDIHZFZ-RXMQYKEDSA-N 0.000 description 1
- CNPSFBUUYIVHAP-AKGZTFGVSA-N (2s)-3-methylpyrrolidine-2-carboxylic acid Chemical compound CC1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-AKGZTFGVSA-N 0.000 description 1
- VOYXMQFJDIVEQN-UHFFFAOYSA-N 1,3-thiazolidine-2-carboxylic acid Chemical compound S1C(NCC1)C(=O)O.S1C(NCC1)C(=O)O VOYXMQFJDIVEQN-UHFFFAOYSA-N 0.000 description 1
- OMGHIGVFLOPEHJ-UHFFFAOYSA-N 2,5-dihydro-1h-pyrrol-1-ium-2-carboxylate Chemical compound OC(=O)C1NCC=C1 OMGHIGVFLOPEHJ-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- BTJIUGUIPKRLHP-UHFFFAOYSA-N 4-nitrophenol Chemical class OC1=CC=C([N+]([O-])=O)C=C1 BTJIUGUIPKRLHP-UHFFFAOYSA-N 0.000 description 1
- 240000000073 Achillea millefolium Species 0.000 description 1
- 235000007754 Achillea millefolium Nutrition 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 241000220433 Albizia Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241001112741 Bacillaceae Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241000235457 Chytridium Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241001362614 Crassa Species 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 241000935926 Diplodia Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241001063191 Elops affinis Species 0.000 description 1
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 235000002756 Erythrina berteroana Nutrition 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 241000726221 Gemma Species 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- 239000004354 Hydroxyethyl cellulose Substances 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- KKJQZEWNZXRJFG-UHFFFAOYSA-N L-trans-4-Methyl-2-pyrrolidinecarboxylic acid Chemical compound CC1CNC(C(O)=O)C1 KKJQZEWNZXRJFG-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 229920002097 Lichenin Polymers 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 241001072230 Oceanobacillus Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001496963 Penicillium brasilianum Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000383853 Pseudoplectania nigrella Species 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000194048 Streptococcus equi Species 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241000228182 Thermoascus aurantiacus Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 241000259813 Trichophaea saccata Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 229920003090 carboxymethyl hydroxyethyl cellulose Polymers 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- CEYULKASIQJZGP-UHFFFAOYSA-L disodium;2-(carboxymethyl)-2-hydroxybutanedioate Chemical compound [Na+].[Na+].[O-]C(=O)CC(O)(C(=O)O)CC([O-])=O CEYULKASIQJZGP-UHFFFAOYSA-L 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 150000002303 glucose derivatives Chemical class 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 235000019447 hydroxyethyl cellulose Nutrition 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000012978 lignocellulosic material Substances 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000027272 reproductive process Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229940081969 saccharomyces cerevisiae Drugs 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 125000001424 substituent group Chemical class 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- 150000008498 β-D-glucosides Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/20—Aspartic acid; Asparagine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2445—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
- C12P5/023—Methane
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
- C12P7/10—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/14—Multiple stages of fermentation; Multiple types of microorganisms or re-use of microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
- C12P7/26—Ketones
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01004—Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01021—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01091—Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P2201/00—Pretreatment of cellulosic or lignocellulosic material for subsequent enzymatic treatment or hydrolysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P2203/00—Fermentation products obtained from optionally pretreated or hydrolyzed cellulosic or lignocellulosic material as the carbon source
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/30—Fuel from waste, e.g. synthetic alcohol or diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Abstract
本发明涉及用于降解或转化含纤维素材料的方法,其包括:用有效量的纤维素分解酶组合物处理含纤维素材料,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组份:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。本发明还涉及这类纤维素分解酶组合物。
Description
序列表参考
本申请包括计算机可读形式的序列表。在此将该序列表引入作为参考。
生物材料保藏参考
本申请包括生物材料保藏参考,并在将其引入作为参考。
发明背景
发明领域
本发明涉及用于降解或转化含纤维素材料和用于从含纤维素材料生产物质的组合物和方法。
相关领域描述
纤维素是简单糖类葡萄糖通过β-1,4-键共价键合的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(openingit)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将纤维素原料转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的愿望,和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物已被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖将容易地由酵母发酵成乙醇。
市售可得多种商品化的纤维素分解酶制剂,但是其在降解和转化含纤维素材料方面具有有限的功效。改进这些商品化的酶制剂降解和转化纤维素原料的能力在本领域中将是有利的。
在WO 2005/074647中披露了来自土生羧孢霉(Thielavia terrestris)的具有增强纤维素分解的活性(celluolytic enhancing activity)的分离的多肽及其多核苷酸。
在WO 2005/074656中披露了来自嗜热子囊菌(Thermoascus auranticaus)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。
美国公开的申请第2007/0077630号披露了来自里氏木霉(Trichodermareesei)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。
在WO 1995/024471中披露了具有内切葡聚糖酶活性的CEL7多肽及其多核苷酸。
在WO 2001/79507中披露了具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽及其多核苷酸。
在WO 2003/000941中披露了具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽及其多核苷酸。
在WO 2001/25468中披露了具有内切葡聚糖酶活性的CEL12多肽及其多核苷酸。
在WO 2000/20555中披露了具有内切葡聚糖酶活性的CEL45多肽及其多核苷酸。
本发明涉及用于改进纤维素分解酶组合物降解和转化纤维素原料的能力的方法。
发明简述
本发明涉及用于降解或转化含纤维素材料的方法,其包括:用有效量的纤维素分解酶组合物处理含纤维素材料,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几)组份:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含SEQ IDNO:9的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;和
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加。
本发明还涉及用于产生物质的方法,包括:
(A)用有效量的纤维素分解酶组合物将含纤维素材料糖化,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽;和一种或多种(几种)选自下组中组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几)氨基酸的SEQ ID NO:10的成熟多肽;并且
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加;
(B)用一种或多种(几种)发酵微生物发酵步骤(a)中的糖化的含纤维素材料以产生发酵产物;和
(C)回收发酵产物。
本发明也涉及这样的纤维素分解酶组合物,其包含有效量的具有增强纤维素分解的活性的多肽。
附图简述
定义
增强纤维素分解的活性:术语“增强纤维素分解的活性”在本文定义为增强具有纤维素分解活性的蛋白对含纤维素材料的水解的生物活性。就本发明而言,通过在以下条件下测量来自含纤维素材料通过纤维素分解蛋白的水解的还原糖的增加或总纤维二糖和葡萄糖的增加来测定增强纤维素分解的活性:1-50mg含80-99.5%w/w纤维素分解蛋白的总蛋白/g PCS中的纤维素和0.5-20%w/w增强纤维素分解活性的蛋白,在50℃下持续1-7天,与使用相等总蛋白加样量的不含增强纤维素分解的活性的对照水解比较(1-50mg纤维素分解蛋白/g PCS中的纤维素)。在优选的方面,在纤维素酶蛋白加样量为3%的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或3%的烟曲霉(Aspergilus fumigatus)β-葡糖苷酶(根据WO 02/095014的实施例22在米曲霉中重组产生)的存在下,使用1.5L(Novozymes A/S,Denmark)的混合物作为纤维素分解活性的标准。
具有增强纤维素分解的活性的多肽具有SEQ ID NO:12、14、16、18、20、22或24的成熟多肽的增强纤维素分解的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且最优选至少100%。
所述具有增强纤维素分解的活性的多肽以下述方式增强由具有纤维素分解活性的蛋白质所进行的含纤维素材料的水解:将为达到同样水解程度所需的纤维素分解酶的量减少优选至少0.1倍,更优选至少0.2倍、更优选至少0.3倍、更优选至少0.4倍、更优选至少0.5倍、更优选至少1倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、更优选至少10倍、更优选至少20倍、进一步更优选至少30倍、最优选至少50倍、进一步最优选至少100倍。
纤维素分解活性:术语“纤维素分解活性”在本文定义为水解含纤维素材料的纤维素酶活性(如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合)。纤维素分解蛋白可以水解羧甲基纤维素(CMC),由此降低温育混合物的粘度。可以通过振动粘度计(vibration viscosimeter)(如源于法国Sofraser的MIVI 3000)测定所产生的粘度上的降低。纤维素酶活性的测定按照纤维素酶粘度单位(CEVU)来测量,所述测定通过测量样品降低羧甲基纤维素(CMC)溶液粘度的能力来定量该样品中存在的催化活性的量。本测定是在适合于纤维素分解蛋白和底物的温度和pH值下进行的。
就本发明而言,通过在以下条件下测量纤维素分解组合物对含纤维素材料的水解相对于不加入纤维素分解蛋白的对照水解的增加来测定纤维素分解活性:1-50mg纤维素分解蛋白/g PCS中的纤维素,在50℃持续1-7天。
内切葡聚糖酶:术语“内切葡聚糖酶”在本文中的定义为内切-1,4-(1,3;1,4)-β-D葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan4-glucanohydrolase)(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉、混合的β-1,3葡聚糖如谷物β-D-葡聚糖或木葡聚糖中的β-1,4键和其它含有纤维素成分的生物材料中1,4-β-D-糖苷键的水解。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268中的方法使用羧甲基纤维素(CMC)水解作用测定内切葡聚糖酶的活性。
具有内切葡聚糖酶活性的多肽具有SEQ ID NO:2、4或6的成熟多肽的内切葡聚糖酶的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%的活性。
纤维二糖水解酶:术语“纤维二糖水解酶”在本文中的定义为1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖或任何包含β-1,4-连接的葡萄糖的聚合物中1,4-β-D葡糖苷键的水解,从链的还原端或非还原端释放的纤维二糖。就本发明而言,根据Lever等人,1972,Anal.Biochem.47:273-279和van Tilbeurgh等人,1982,FEBS Letters 149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288所描述的程序测定纤维二糖水解酶的活性。在本发明中,使用Lever等人方法来评估玉米秸秆中纤维素的水解,同时使用van Tilbeurgh等人的方法来测定对于荧光二糖衍生物的纤维二糖水解酶活性。
具有纤维二糖水解酶的活性的多肽具有SEQ ID NO:8或10的成熟多肽的纤维二糖水解酶的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%的活性。
β-葡糖苷酶:术语“β-葡糖苷酶”在本文定义为β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,并且释放β-D-葡萄糖。就本发明而言,根据Venturi等人,2002,J.Basic Microbiol.42:55-66描述的基本程序来测定β-葡糖苷酶活性,但是采用如本文所述的不同的条件。将1单位的β-葡糖苷酶活性定义为在50℃、pH 5,从100mM柠檬酸钠、0.01%中作为底物的4mM对硝基苯基-β-D-吡喃型葡糖苷每分钟产生1.0微摩尔对硝基苯酚。
具有β-葡糖苷酶的活性的多肽具有SEQ ID NO:26、28或30的成熟多肽的β-葡糖苷酶的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%的活性。
家族7,12,45或61糖苷水解酶:术语“家族7糖苷水解酶”或“家族GH7”,“家族12糖苷水解酶”或“家族GH12”,“家族45糖苷水解酶”或“家族GH45”,和“家族61糖苷水解酶”或“家族GH61”在本文中定义为根据Henrissat,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,和Henrissat B和Bairoch A.,1996,Updating thesequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696分别归入糖苷水解酶家族7、家族12、家族45、家族61的多肽。目前,Henrissat将GH61家族列为未分类,说明就属于此家族的多肽而言,诸如机制、催化性亲核体/碱、催化性质子供体和3-D结构等性质是未知的。GH7、GH12或GH45蛋白也分别称作CEL7、CEL12或CEL45。
含纤维素材料:生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的多糖是半纤维素,而第三是果胶。在细胞停止生长之后产生的次生细胞壁也含有多糖,并且其通过与半纤维素共价交联的聚合木质素强化。纤维素是无水纤维二糖的均聚物,并且因此是支链的β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,例如具有带有一系列取代基的复杂分支结构的木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖。尽管通常是多形态的,纤维素在植物组织中主要作为由平行葡聚糖链构成的不溶晶体基质存在。半纤维素通常与纤维素以及与其它半纤维素通过氢键连接,其辅助稳定细胞壁基质。
含纤维素材料可以是任何含纤维素的材料。纤维素通常存在于例如植物的茎、叶、果/种壳(hulls)、果/种皮(husks)、和穗轴(cob)中,或树的叶、枝和木材中。含纤维素材料可以是但不限于草本材料、农业残余物、林业残余物、市政固体废物、废纸和纸浆及造纸厂残余物。含纤维素材料可以是任意类型的生物质包括但不限于木材资源、市政固体废物、废纸、作物和作物残余物(参见,例如,Wiselogel等人,1995,在Handbook on Bioethanol(Charles E.Wyman,editor)中,105-118页,Taylor&Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier等人,1999,Recent Progress inBioconversion of Lignocellulosics,在Advances in BiochemicalEngineering/Biotechnology,T.Scheper,managing editor,Volume 65,23-40页,Springer-Verlag,New York)。在本文中可理解的是含纤维素材料优选为木素纤维素的形式,例如,在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。
在优选的方面,含纤维素材料是玉米秸秆。在另一优选的方面,含纤维素材料是玉米纤维。在另一优选的方面,含纤维素材料是柳枝稷(switch grass)。在另一优选的方面,含纤维素材料是稻草(rice straw)。在另一优选的方面,含纤维素材料是造纸和纸浆加工废料。在另一优选的方面,含纤维素材料是木本或草本植物。在另一优选的方面,纤维素材料是蔗渣。
可以按原样使用含纤维素材料或可使用本领域已知的常规方法对含纤维素材料进行预处理。例如,物理预处理技术可包括多种类型的磨制、照射、蒸煮/蒸汽爆炸和水热分解(hydrothermolysis);化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳和pH控制的水热分解;而生物预处理技术可包括应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatment of biomass,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor&Francis,Washington,DC,179-212;Ghosh,P.,和Singh,A.,1993,Physicochemical and biological treatments forenzymatic/microbial conversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,in Enzymatic Conversion of Biomass for Fuels Production,Himmel,M.E.,Baker,J.O.,和Overend,R.P.,eds.,ACS Symposium Series 566,American ChemicalSociety,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production from renewable resources,in Advances in BiochemicalEngineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson,L.,和Hahn-Hagerdal,B.,1996,Fermentation oflignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;以及Vallander,L.,和Eriksson,K.-E.L.,1990,Production of ethanolfrom lignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
预处理的玉米秸秆:术语“PCS”或“预处理的玉米秸秆”在本文中的定义为源自通过加热和稀酸处理的玉米秸秆的含纤维素的材料。就本发明而言,PCS通过实施例1中所述方法,或者改变时间、温度和酸量的该方法的变化形式来制备。
分离的多肽:术语“分离的多肽”用于本文中指的是从来源分离的多肽。在优选的方面,如通过SDS-PAGE测定的,多肽至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,以及最优选至少90%纯。
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的(associated)或重组结合的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式,即,所述多肽制备物基本上(essentially)不含与其天然结合的或重组结合的其它多肽材料。这能够通过以下方法实现,例如,通过公知的重组方法或由经典纯化方法制备多肽。
成熟多肽:术语“成熟多肽”在本文中定义为具有生物活性(如酶活性)的多肽,所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在,所述修饰例如N-末端加工、C-末端截断、糖基化、磷酸化等。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码成熟多肽的核苷酸序列,所述成熟多肽具有生物活性。
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,Trends in Genetics 16:276-277)的Needle程序中执行的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453)来测定,优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分(gap open penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算:
(相同的残基×100)/(比对的长度-比对中的缺口总数)
就本发明而言,两个脱氧核糖核酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,supra)的Needle程序中执行的Needleman-Wunsch算法(Needlemanand Wunsch,1970,见上文)来测定,优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分10,缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算:
(相同的脱氧核糖核苷酸×100)/(比对的长度-比对中的缺口总数)
同源序列:术语“同源序列”在本文定义为使用blastp(用于蛋白质数据库)或tblastn(用于核酸数据库)算法,使用BLOSUM62矩阵、字长(wordsize)3、缺口存在分值(gap existence cost)11、缺口延伸分值(gap extension cost)1、无低复杂性过滤并且使用成熟的GH61、GH7、GH12或GH45蛋白序列作为查询对象时,E值(或预期得分(expectancy score))小于0.001的序列。参见Altschul等人,1997,Nucleic Acids Res.25:3389-3402。
多肽片段:术语“多肽片段”在本文中定义为从SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽,或者其同源序列;其中所述片段具有其成熟多肽的活性。优选的,SEQ ID NO:2的成熟多肽的片段含有至少340个氨基酸残基,更优选至少370个氨基酸残基,并且最优选至少400个氨基酸残基。优选的,SEQ ID NO:4的成熟多肽的片段含有至少200个氨基酸残基,更优选至少210个氨基酸残基,并且最优选至少220个氨基酸残基。优选的,SEQ ID NO:6的成熟多肽的片段含有至少175个氨基酸残基,更优选至少185个氨基酸残基,并且最优选至少195个氨基酸残基。优选的,SEQ ID NO:8的成熟多肽的片段含有至少425个氨基酸残基,更优选至少450个氨基酸残基,并且最优选至少475个氨基酸残基。优选的,SEQ ID NO:10的成熟多肽的片段含有至少370个氨基酸残基,更优选至少390个氨基酸残基,并且最优选至少410个氨基酸残基。优选的,SEQ IDNO:12的成熟多肽的片段含有至少277个氨基酸残基,更优选至少287个氨基酸残基,并且最优选至少297个氨基酸残基。优选的,SEQ ID NO:14的成熟多肽的片段含有至少185个氨基酸残基,更优选至少195个氨基酸残基,并且最优选至少205个氨基酸残基。优选的,SEQ ID NO:16的成熟多肽的片段含有至少200个氨基酸残基,更优选至少212个氨基酸残基,并且最优选至少224个氨基酸残基。优选的,SEQ ID NO:18的成熟多肽的片段含有至少175个氨基酸残基,更优选至少185个氨基酸残基,并且最优选至少195个氨基酸残基。优选的,SEQ ID NO:20的成熟多肽的片段含有至少240个氨基酸残基,更优选至少255个氨基酸残基,并且最优选至少270个氨基酸残基。优选的,SEQ ID NO:22的成熟多肽的片段含有至少175个氨基酸残基,更优选至少190个氨基酸残基,并且最优选至少205个氨基酸残基。优选的,SEQID NO:24的成熟多肽的片段含有至少200个氨基酸残基,更优选至少210个氨基酸残基,并且最优选至少220个氨基酸残基。优选的,SEQ ID NO:26的成熟多肽的片段含有至少720个氨基酸残基,更优选至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选的,SEQ ID NO:28的成熟多肽的片段含有至少720个氨基酸残基,更优选至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选的,SEQ ID NO:30的成熟多肽的片段含有至少720个氨基酸残基,更优选至少760个氨基酸残基,并且最优选至少800个氨基酸残基。
亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列;或其同源序列,其中所述亚序列编码具有其成熟多肽的活性的多肽片段。优选的,SEQ ID NO:1的成熟多肽编码序列的亚序列含有至少1020个核苷酸,更优选至少1110个核苷酸,并且最优选至少1200个核苷酸。优选的,SEQ ID NO:3的成熟多肽编码序列的亚序列含有至少600个核苷酸,更优选至少630个核苷酸,并且最优选至少660个核苷酸。优选的,SEQ ID NO:5的成熟多肽编码序列的亚序列含有至少525个核苷酸,更优选至少555个核苷酸,并且最优选至少585个核苷酸。优选的,SEQ ID NO:7的成熟多肽编码序列的亚序列含有至少1275个核苷酸,更优选至少1350个核苷酸,并且最优选至少1425个核苷酸。优选的,SEQ ID NO:9的成熟多肽编码序列的亚序列含有至少1110个核苷酸,更优选至少1170个核苷酸,并且最优选至少1230个核苷酸。优选的,SEQ ID NO:11的成熟多肽编码序列的亚序列含有至少831个核苷酸,更优选至少861个核苷酸,并且最优选至少891个核苷酸。优选的,SEQ ID NO:13的成熟多肽编码序列的亚序列含有至少555个核苷酸,更优选至少585个核苷酸,并且最优选至少615个核苷酸。优选的,SEQ ID NO:15的成熟多肽编码序列的亚序列含有至少600个核苷酸,更优选至少636个核苷酸,并且最优选至少672个核苷酸。优选的,SEQ ID NO:17的成熟多肽编码序列的亚序列含有至少525个核苷酸,更优选至少555个核苷酸,并且最优选至少585个核苷酸。优选的,SEQ ID NO:19的成熟多肽编码序列的亚序列含有至少720个核苷酸,更优选至少765个核苷酸,并且最优选至少810个核苷酸。优选的,SEQ ID NO:21的核苷酸67至796的成熟多肽编码序列的亚序列含有至少525个核苷酸,更优选至少570个核苷酸,并且最优选至少615个核苷酸。优选的,SEQ ID NO:23的成熟多肽编码序列的亚序列含有至少600个核苷酸,更优选至少630个核苷酸,并且最优选至少660个核苷酸。优选的,SEQ ID NO:25的成熟多肽编码序列的亚序列含有至少2160个核苷酸,更优选至少2280个核苷酸,并且最优选至少2400个核苷酸。优选的,SEQ ID NO:27的成熟多肽编码序列的亚序列含有至少2160个核苷酸,更优选至少2280个核苷酸,并且最优选至少2400个核苷酸。优选的,SEQ ID NO:29的成熟多肽编码序列的亚序列含有至少2160个核苷酸,更优选至少2280个核苷酸,并且最优选至少2400个核苷酸。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸:术语“分离的多核苷酸”用于本文中指与来源分离的多核苷酸。在优选的方面,如通过琼脂糖电泳测定的,所述多核苷酸为至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,以及最优选至少90%纯。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式,即,所述多核苷酸制备物基本上不含与其天然结合的或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任意组合。
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可选的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。
cDNA:术语“cDNA”在本文中定义为能够通过逆转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含亚序列。因而源自mRNA的cDNA没有任何内含子序列。
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的或者合成的基因,或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的片段。当所述核酸构建体含有表达本发明中的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”在本文定义为包括对于本发明中编码多肽的多核苷酸的表达是必需的所有成分。各调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于用包含本发明中的多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。
修饰:术语“修饰”在本文的意思是,对由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽或其同源序列组成的多肽的任何化学修饰;以及对编码这种多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多个(几个)氨基酸侧链的取代。
人工变体:当用在本文时,术语“人工变体”的意思是由表达SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQIDNO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列的修饰的核苷酸序列或其同源序列的生物体产生的多肽。所述修饰的多核苷酸序列通过人为干预(human intervention),通过修饰公开于SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ IDNO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27或SEQ ID NO:29的多核苷酸序列或其同源序列的核苷酸序列来获得。
发明详述
本发明涉及用于降解或转化含纤维素材料的方法,其包括:用有效量的纤维素分解酶组合物处理所述含纤维素材料,其中所述纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽,以及一种或多种(几种)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽,其中与缺乏所述具有增强纤维素分解的活性的多肽时相比,具有增强纤维素分解的活性的多肽的存在使通过纤维素分解酶组合物进行的对纤维素材料的降解增加。
本发明进一步包括回收降解或转化的含纤维素材料。可使用本领域熟知的技术例如离心、过滤和重力沉降,将含纤维素材料的降解或转化的可溶产物与不溶的含纤维素材料分离。
本发明还涉及产生物质的方法,包括:(a)用有效量的纤维素分解酶组合物糖化含纤维素材料,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和一种或多种(几种)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽,和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽,其中与缺乏具有增强纤维素分解的活性的多肽时相比,具有增强纤维素分解的活性的多肽的存在使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加;(b)用一种或多种(几种)发酵微生物发酵步骤(a)中的糖化的含纤维素材料以产生发酵产物;和(c)回收发酵产物。
本发明还涉及这些包含有效量的具有增强纤维素分解的活性的多肽的纤维素分解酶组合物。
纤维素分解酶组合物
本发明还涉及纤维素分解酶组合物,其包含具有增强纤维素分解的活性的多肽和一种或多种(几中)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
第一方面,具有内切葡聚糖酶活性的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO:2的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的序列同一性程度,所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:2的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有内切葡聚糖酶活性的CEL7多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:2的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:2的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:2的氨基酸21至456,或其等位变体;或者其具有内切葡聚糖酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:2的氨基酸21至456。在另一优选的方面,多肽由SEQ ID NO:2的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:2的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:2的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:2的氨基酸21至456或其等位变体,或其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:2的氨基酸21至456组成。
根据WO 1995/024471可以获得具有内切葡聚糖酶活性的CEL7多肽。
在另一第一方面,具有内切葡聚糖酶活性的分离的CEL12多肽包含的氨基酸序列与SEQ ID NO:4的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:4的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有内切葡聚糖酶活性的CEL12多肽优选包含SEQ ID NO:4的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:4的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:4的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:4的氨基酸16至247,或其等位变体,或者其具有内切葡聚糖酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:4的氨基酸16至247。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:4的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸16至247,或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸16至247组成。
根据WO 2001/25468可以获得具有内切葡聚糖酶活性的CEL12多肽。
在另一第一方面,具有内切葡聚糖酶活性的分离的CEL45多肽包含的氨基酸序列与SEQ ID NO:6的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:6的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有葡聚糖分解酶活性的CEL45多肽优选包含SEQ ID NO:6的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:6的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:6的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:6的氨基酸19至225,或其等位变体,或者其具有内切葡聚糖酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:6的氨基酸19至225。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:6的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸19至225或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸19至225组成。
根据WO 2000/20555可以获得具有内切葡聚糖酶活性的CEL45多肽。
在另一第一方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO:8的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有纤维二糖水解酶活性(以下称“同源多肽”)。在优选的方面,同源多肽包含的氨基酸序列与SEQ ID NO:8的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽优选包含SEQ IDNO:8的氨基酸序列或其等位变体,或者其具有纤维二糖水解酶活性的片段。在优选的方面,多肽包含SEQ ID NO:8的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:8的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:8的氨基酸18至526,或其等位变体,或者其具有纤维二糖水解酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:8的氨基酸18至526。在另一优选的方面,多肽由SEQ ID NO:8的氨基酸序列或其等位变体,或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:8的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:8的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:8的氨基酸18至526或其等位变体,或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:8的氨基酸18至526组成。
根据WO 2001/79507可以获得具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一第一方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO:10的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有纤维二糖水解酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ IDNO:10的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽优选包含SEQ ID NO:10的氨基酸序列或其等位变体,或者其具有纤维二糖水解酶活性的片段。在优选的方面,多肽包含SEQ ID NO:10的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:10的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:10的氨基酸21至450,或其等位变体,或者其具有纤维二糖水解酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:10的氨基酸21至450。在另一优选的方面,多肽由SEQ ID NO:10的氨基酸序列或其等位变体,或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:10的氨基酸序列组成。在另一优选的方面,多肽由SEQ IDNO:10的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:10的氨基酸21至450或其等位变体,或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:10的氨基酸21至450组成。
根据WO 2003/000941可以获得具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在第二方面,具有内切葡聚糖酶活性的分离的CEL7多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,ColdSpring Harbor,New York)。在优选的方面,所述成熟多肽编码序列为SEQ IDNO:1的核苷酸61至1368。
在另一第二方面,具有内切葡聚糖酶活性的分离的CEL12多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。在优选的方面,所述成熟多肽编码序列为SEQ ID NO:3的核苷酸46至741。
在另一第二方面,具有内切葡聚糖酶活性的分离的CEL45多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸55至675。
在另一第二方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。在优选的方面,成熟多肽编码序列是SEQ ID NO:7的核苷酸52至1645。
在另一第二方面,具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQ ID NO:9的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。在优选的方面,成熟多肽编码序列是SEQ ID NO:9的核苷酸61至1350。
SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ IDNO:9的核苷酸序列或其亚序列;以及SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的氨基酸序列或其片段,可以用于设计核酸探针,以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码这些多肽的DNA。尤其,这样的探针可用于与目的属或种的基因组或cDNA杂交,接着是标准Southern印迹程序以鉴定和分离其中相应的目的基因。这样的探针可能比整个序列短很多,但是其长度应该是至少14,优选至少25,更优选至少35以及最优选至少70个核苷酸。然而,核酸探针的长度优选为至少100个核苷酸。例如,核酸探针的长度可以至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以用更长的探针,例如,长度为至少600个核苷酸,至少优选至少700个氨基酸,更优选至少800个氨基酸,或最优选至少900个氨基酸的核酸探针。DNA和RNA探针都可以利用。通常将探针加以标记用于检测相应的基因(例如,用32p、3H、35S、生物素或抗生物素蛋白标记)。这样的探针都包含在本发明中。
因而,可从由这些其它生物体制备的基因组DNA或cDNA文库中筛选与上述探针杂交并且编码这些多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术来分离来自这些其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移并固定在硝酸纤维素(nitrocellulose)或其它合适的载体材料上。为了鉴定与SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、或SEQ ID NO:9、或其亚序列同源的克隆或DNA,优选将所述载体材料用在Southern印迹中。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列或包含在SEQ ID NO:5或SEQ IDNO:7的成熟多肽编码序列中的cDNA序列;它的全长互补链或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与所述核酸探针杂交的分子。
在优选的方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:1的核苷酸61至1368。在另一优选的方面,核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:1。
在另一优选的方面,核酸探针是SEQ ID NO:3的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:3的核苷酸46至741。在另一优选的方面,核酸探针是编码SEQ ID NO:4的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:3。
在另一优选的方面,核酸探针是SEQ ID NO:5的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:5的核苷酸55至675。在另一优选的方面,核酸探针是编码SEQ ID NO:6的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:5。
在另一优选的方面,核酸探针是SEQ ID NO:7的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:7的核苷酸52至1645。在另一优选的方面,核酸探针是编码SEQ ID NO:8的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:7。
在另一优选的方面,核酸探针是SEQ ID NO:9的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:9的核苷酸61至1350。在另一优选的方面,核酸探针是编码SEQ ID NO:10的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:9。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺,对于中和中-高严紧性为35%的甲酰胺,或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2%SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比采用根据Bolton和McCarthy计算法(1962,Proceedings of theNational Academy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasic phosphate),0.1mM ATP和0.2mg/ml的酵母RNA中,根据标准的Southern印迹程序进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6X SSC加0.1%SDS中洗涤一次15分钟,并用6X SSC在比计算的Tm低5℃至10℃的温度下洗涤两次,每次15分钟。
在第三方面,具有内切葡聚糖酶活性的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQID NO:1的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在另一第三方面,具有内切葡聚糖酶活性的分离的CEL12多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在另一第三方面,具有内切葡聚糖酶活性的分离的CEL45多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在另一第三方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:7的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在另一第三方面,具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:9的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在优选的方面,成熟多肽编码序列是SEQ ID NO:1的核苷酸61至1368、SEQ ID NO:3的核苷酸46至741、SEQ ID NO:5的核苷酸55至675,SEQ IDNO:7的核苷酸52至1645,或SEQ ID NO:9的核苷酸61至1350。参见文中多核苷酸部分。
在第四方面,具有内切葡聚糖酶活性的分离的CEL7多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ IDNO:2的成熟多肽;或者其同源序列。
在另一第四方面,具有内切葡聚糖酶活性的CEL12多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;或者其同源序列。
在另一第四方面,具有内切葡聚糖酶活性的分离的CEL45多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQID NO:6的成熟多肽;或其同源序列。
在另一第四方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;或其同源序列。
在另一第四方面,具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;或其同源序列。
优选氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,例如多组氨酸序列(poly histidine tract)、抗原表位(antigenicepitope)或结合域(binding domain))。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20个标准氨基酸,可以用非标准的氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)取代野生型多肽的氨基酸残基。可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于标准氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定点诱变或丙氨酸分区诱变法(Cunningham and Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,内切葡聚糖酶或纤维二糖水解酶的活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等人,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如deVos等人,1992,Science 255:306-312;Smith等人,1992,J.Mol.Biol.224:899-904;Wlodaver等人,1992,FEBS Lett.309:59-64。也可以分析与本发明多肽之亲缘多肽的同一性,据此推测关键氨基酸的身份。
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson and Sauer,1988,Science 241:53-57;Bowieand Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等人,1991,Biochem.30:10832-10837;美国专利No.5,223,409;WO 92/06204)和区域定向的诱变(Derbyshire等人,1986,Gene 46:145;Ner等人,1988,DNA7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域的标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。
SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ IDNO:10的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
以优选固体的约0.001%至10.0%重量,更优选固体的约0.01%至5.0%重量,甚至更优选固体的约0.025%至4.0%重量,和最优选固体的约0.005%至2.0%重量的有效量加入纤维素分解酶组物。
如在此所述,本发明中的纤维素分解酶组合物可以由微生物菌株(野生型或重组宿主细胞)的发酵或几种单独的微生物菌株(野生型和/或重组型宿主细胞)的发酵产生,并回收。
如在此所述,纤维素分解酶组合物也可以包含其它与含纤维素材料的降解有关的酶组分。
在优选的方面,组合物还包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。
在优选的方面,从米曲霉中获得具有β-葡糖苷酶活性的多肽。参见WO2002/095014。在另一优选的方面,从烟曲霉中获得具有β-葡糖苷酶活性的多肽。参见WO 2005/047499。在另一优选的方面,从巴西青霉(Penicilliumbrasilianum)例如巴西青霉菌株IBT 20888中获得具有β-葡糖苷酶活性的多肽。参见WO 2007/019442。
根据WO 2002/095014可以获得具有β-葡糖苷酶活性的米曲霉多肽。根据WO 2005/047499可以获得具有β-葡糖苷酶活性的烟曲霉多肽。根据WO2007/019442可获得具有β-葡糖苷酶活性的巴西青霉多肽。
在第一方面,具有β-葡糖苷酶活性的分离的多肽包含的氨基酸序列与SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的序列同一性程度,所述多肽具有β-葡糖苷酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有β-葡糖苷酶活性的多肽优选包含或其组成为SEQ ID NO:26、SEQ IDNO:28或SEQ ID NO:30的氨基酸序列或其等位变体,或者其具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含或其组成为SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的氨基酸序列。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:26的氨基酸20至861,或其等位变体;或其具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:28的氨基酸20至863,或其等位变体;或其具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:30的氨基酸37至878,或其等位变体;或其具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:26的氨基酸20至861。在另一优选的方面,多肽包含或者其组成为SEQ ID NO:28的氨基酸20至863。在另一优选的方面,多肽包含或者其组成为SEQ ID NO:30的氨基酸37至878。
在第二方面,具有β-葡糖苷酶活性的分离的多肽由多核苷酸编码,该多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列,(ii)包含在SEQ ID NO:25、SEQ IDNO:27或SEQ ID NO:29的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:25的核苷酸87至2612、SEQ ID NO:27的核苷酸58至2580、SEQ ID NO:29的核苷酸171至2753。
如上所述,SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的核苷酸序列或其亚序列;和SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的氨基酸序列或其片段可以用来设计核酸探针以从不同属和种的菌株鉴定和克隆编码具有β-葡糖苷酶活性的多肽的DNA。
如上所述,就本发明而言,杂交表示核苷酸序列在非常低到非常高严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:25、SEQ IDNO:27或SEQ ID NO:29的成熟多肽编码序列、包含在SEQ ID NO:25、SEQID NO:27或SEQ ID NO:29的成熟多肽编码序列中的cDNA序列、它的互补链或其亚序列。
在优选的方面,核酸探针是SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:25的核苷酸87至2612、SEQ ID NO:27的核苷酸58至2580、SEQ ID NO:29的核苷酸171至2753。在另一优选的方面,核酸探针是编码SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的多肽的多核苷酸序列或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29。在另一优选的方面,核酸探针是包含在质粒中的多核苷酸序列,该质粒包含在大肠杆菌DSM 14240中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在质粒pEJG113中的多核苷酸序列,该质粒包含在大肠杆菌NRRL B-30695中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在质粒pKKAB中的多核苷酸序列,该质粒包含在大肠杆菌NRRL B-30860中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在质粒中的成熟多肽编码区,该质粒包含在大肠杆菌DSM14240中。在另一优选的方面,核酸探针是包含在质粒pEJG113中的成熟多肽编码区,该质粒包含在大肠杆菌NRRL B-30695中。在另一优选的方面,核酸探针是包含在质粒pKKAB中的成熟多肽编码区,该质粒包含在大肠杆菌NRRL B-30860中。
对于长度至少100个核苷酸的长探针,非常低至非常高严紧性条件如本文所限定。
对于长度至少100个核苷酸的长探针,最终如本文所限定洗涤载体材料。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧性条件如本文所限定。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,最终如本文所限定洗涤载体材料。
在第三方面。具有β-葡糖苷酶活性的多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:25、SEQID NO:27或SEQ ID NO:29的成熟多肽序列具有优选至少70%的序列同一性程度,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选90%,最优选至少95%,以及甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽。
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:25的核苷酸87至2612、SEQ ID NO:27的核苷酸58至2580或SEQ ID NO:29的核苷酸171至2753。
在第四方面,具有β-葡糖苷酶活性的多肽是人工变体,该人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。
SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
在另一优选的方面,纤维素分解酶组合物进一步包含一种或多种选自下组的额外的酶活性:半纤维素酶、酯酶(如脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶和过氧化物酶。在本发明的方法中,可以在发酵之前或过程中,包括发酵的微生物的繁殖过程中或繁殖之后加入所述额外的酶。
所述酶可以源自或获得自任何合适得来源,包括细菌、真菌、酵母、植物或哺乳动物来源,如本文所述。术语“获得”在此表示可能已经将所述酶从天然产生该酶作为天然酶的生物中分离。术语“获得”在此还表示所述酶可能已经采用本文所述的方法在宿主生物中重组产生,其中所述重组产生的酶对于该宿主生物是天然的或外源的,或具有修饰的氨基酸序列,例如缺失、插入和/或取代一个或多个氨基酸,即重组产生的酶是天然氨基酸序列的突变体和/或片段,或通过本领域已知的核酸改组方法产生的酶。天然酶的意思中包含天然变体,而外源酶的意思中包含重组获得的变体,例如通过定点诱变或改组获得的变体。
本发明中使用的酶可以是适合用于本文描述的方法中的任何形式,例如,含有或不含细胞的粗发酵液或基本上纯的多肽。所述酶可以是干粉或颗粒、无尘颗粒、液体、稳定化的液体或受保护的酶(protected enzyme)。例如,颗粒可以如美国专利Nos.4,106,991和4,661,452所公开的来产生,并且可以任选地通过本领域内已知的方法来涂覆。例如,液体酶制备物可以根据已经建立的方法通过添加稳定剂来稳定化,所述稳定剂例如糖、糖醇或其它多元醇,和/或乳酸或其它有机酸。受保护的酶可以根据EP 238,216中公开的方法制备。
在优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和一种或多种(几种)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽和一种或多种(几种)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL 12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL12多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL45多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素水解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素水解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有内切葡聚糖酶活性的CEL12多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有内切葡聚糖酶活性的CEL45多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有内切葡聚糖酶活性的CEL45多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有内切葡聚糖酶活性的CEL45多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
具有内切葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶活性的多肽的来源
具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽、以及具有β-葡糖苷酶活性的多肽,可以获得自任何属的微生物。就本发明而言,如用于本文与给定的来源有关的术语“获得自”的意思应为核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是细胞外分泌的。
具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和/或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽可以从LDI,LBR或150L(Dyadic International,Inc.,Jupiter,FL,USA)中获得。
具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽或具有β-葡糖苷酶活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌的多肽如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢菌属(Oceanobacillus)多肽,或革兰氏阴性细菌的多肽如大肠杆菌、假单孢菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽。
在优选的方面,多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。
在另一优选的方面,多肽是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。
在另一优选的方面,多肽是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)多肽。
具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽或具有β-葡糖苷酶活性的多肽还可以是真菌多肽,并且更优选是酵母多肽例如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选是丝状真菌多肽例如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、金孢子菌属(Chrysosporium)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霉属(Trichoderma)多肽。
在优选的方面,多肽是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽。
在另一优选的方面,多肽是棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillusniger)、米曲霉、Chrysosporium lucknowense、灰盖鬼伞(Coprinus cinereus)、棉色二孢(Diplodia gossyppina)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicola lanuginosa)、灰梨孢菌(Magnaporthegrisea)、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophla)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、淡黑假黑盘菌(Pseudoplectanianigrella)、橙色嗜热子囊菌(Thermoascus aurantiacus)、土生梭孢霉(Thielaviaterrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)或Trichophaea saccata多肽。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states)两种,和其它分类学的等同物(equivalent),例如无性型(anamorph),无论它们已知的种名。本领域熟练技术人员将轻易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心,北方区研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术来分离或克隆所述多核苷酸(参见,例如,Sambrook等人,1989,见上文)。
多肽还可以包括融合多肽或可切割的融合多肽,其中将另一种多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一种多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。
融合多肽可进一步包含切割位点。通过融合蛋白的分泌,位点被切割以释放来自融合蛋白的有活性的多肽。切割位点的例子包括,而不局限于,编码赖氨酸-精氨酸二肽的Kex2位点(Martin等人,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等人,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等人,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等人,1995,Biotechnology 13:498-503和Contreras等人,1991,Biotechnology9:378-381),在精氨酸残基之后被因子Xa蛋白酶切割的异亮氨酸-(谷氨酸或天冬氨酸)-甘氨酸-精氨酸位点(Eaton等人,1986,Biochem.25:505-512);在赖氨酸之后被肠激酶切割的天冬氨酸-天冬氨酸-天冬氨酸-天冬氨酸-赖氨酸位点(Collins-Racie等人,1995,Biotechnology 13:982-987);被Genenase I切割的组氨酸-酪氨酸-谷氨酸或组氨酸-酪氨酸-天冬氨酸位点(Carte等人,1989,Proteins:Structure,Function and Genetics 6:240-248);在精氨酸之后被凝血酶切割的亮氨酸-缬氨酸-脯氨酸-精氨酸-甘氨酸-丝氨酸位点(Stevens,2003,DrugDiscovery World 4:35-48);在谷氨酰胺之后被TEV蛋白酶切割的谷氨酸-天冬酰胺-亮氨酸-酪氨酸-苯丙氨酸-谷氨酰胺-甘氨酸位点(Stevens,2003,见上文);和在谷氨酰胺之后被遗传工程化的来自人鼻病毒的3C蛋白酶切割的亮氨酸-谷氨酸-缬氨酸-亮氨酸-苯丙氨酸-谷氨酰胺-甘氨酸-脯氨酸位点(Stevens,2003,见上文)。
编码具有内切葡聚糖酶或纤维二糖水解酶活性的多肽的多核苷酸
如在本文中所述,包含或其组成为编码具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的核苷酸序列的多核苷酸能够被分离和利用以实施本发明的方法。
所述多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQID NO:9的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%同一性,其编码具有酶活性的多肽。
在优选的方面,编码具有内切葡聚糖酶活性的CEL7多肽的核酸序列包含SEQ ID NO:1或由SEQ ID NO:1组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:1的成熟多肽编码区或由SEQ ID NO:1的成熟多肽编码区组成。本发明还包括核苷酸序列,其编码包含SEQ ID NO:2的氨基酸序列或其成熟多肽或由SEQ ID NO:2的氨基酸序列或其成熟多肽组成的多肽,其由于遗传密码的简并性而与SEQ ID NO:1不同。本发明还涉及SEQ ID NO:1的亚序列,该亚序列编码具有CEL7内切葡聚糖酶活性的SEQ ID NO:2的片段。
在另一优选的方面,编码具有内切葡聚糖酶活性的CEL12多肽的核苷酸序列包含SEQ ID NO:3或由SEQ ID NO:3组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:3的成熟多肽编码区或由SEQ ID NO:3的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO:4的氨基酸序列或其成熟多肽或由SEQ ID NO:4的氨基酸序列或其成熟多肽组成的多肽的核酸序列,其由于遗传密码的简并性而与SEQ ID NO:3不同。本发明还涉及SEQ IDNO:3的亚序列,该亚序列编码具有CEL12内切葡聚糖酶活性的SEQ ID NO:4的片段。
在另一优选的方面,编码具有内切葡聚糖酶活性的CEL45多肽的核苷酸序列包含SEQ ID NO:5或由SEQ ID NO:5组成。在另一优选的方面,所述核苷酸序列是SEQ ID NO:5的成熟多肽编码区。本发明还包括编码包含SEQIDNO:6的氨基酸序列或其成熟多肽或由SEQ ID NO:6的氨基酸序列或其成熟多肽组成的多肽的核酸序列,其由于遗传密码的简并性而与SEQ ID NO:5不同。本发明还涉及SEQ ID NO:5的亚序列,其编码具有CEL45内切葡聚糖酶活性的SEQ ID NO:6的片段。
在另一优选的方面,编码具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽的核苷酸序列包含SEQ ID NO:7或由SEQ ID NO:7组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:7的成熟多肽编码区或由SEQIDNO:7的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO:8的氨基酸序列或其成熟多肽或由SEQ ID NO:8的氨基酸序列或其成熟多肽组成的多肽的核酸序列,其由于遗传密码的简并性而与SEQ ID NO:7不同。本发明还涉及SEQ ID NO:7的亚序列,其编码具有CEL7纤维二糖水解酶活性的SEQ ID NO:16的片段。
在另一优选的方面,编码具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的核苷酸序列包含SEQ ID NO:9或由SEQ ID NO:9组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:9的成熟多肽编码区或由SEQ ID NO:9的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO:10的氨基酸序列或其成熟多肽或由SEQ ID NO:10的氨基酸序列或其成熟多肽组成的多肽的核苷酸序列,其由于遗传密码的简并性而与SEQ ID NO:9不同。本发明也涉及SEQ ID NO:9的亚序列,其编码具有CEL7纤维二糖水解酶活性的SEQ ID NO:18的片段。
本发明还涉及在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7或SEQ ID NO:9的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸21至456、SEQ ID NO:4的氨基酸16至247、SEQ ID NO:6的氨基酸19至225、SEQ ID NO:8的氨基酸18至526、或SEQIDNO:10的氨基酸21至450。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸61至1368、SEQ ID NO:3的核苷酸46至741、SEQIDNO:5的核苷酸55至675、SEQ ID NO:7的核苷酸52至1645、SEQ ID NO:9的核苷酸61至1350。
用于分离或克隆编码这种多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆多核苷酸。参见,例如,Innis等人,1990,PCR:A Guide to Methods and Application,Academic Press,NewYork。可以使用其它核酸扩增方法,例如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。多核苷酸可以是所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。
所述多核苷酸也可以是编码具有内切葡聚糖酶或纤维二糖水解酶活性的多肽的多核苷酸,其在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列或包含在SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等人,1989,见上文),如本文所定义的。
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸61至1368、SEQ ID NO:3的核苷酸46至741、SEQ ID NO:5的核苷酸55至675、SEQ ID NO:7的核苷酸52至1645或SEQ ID NO:9的核苷酸61至1350。
编码具有β-葡糖苷酶活性的多肽的多核苷酸
多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列编码具有β-葡糖苷酶活性的多肽,可分离所述多核苷酸并且用于实施本发明的方法,如本文所述。
所述多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:25,SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码具有酶活性的多肽。
在优选的方面,编码具有β-葡糖苷酶活性的核苷酸序列包含SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29或由SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码区或由SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码区组成。本发明也包括编码如下多肽的核苷酸序列,该多肽包含或其组成为SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的氨基酸序列或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列分别不同于SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29。本发明也涉及SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的亚序列,其编码具有β-葡糖苷酶活性的SEQ ID NO:26、SEQ ID NO:28或SEQ IDNO:30的片段。
本发明还涉及在SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:26的氨基酸20至861、SEQ ID NO:28的氨基酸20至863或SEQ ID NO:30的氨基酸37至878。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:25的核苷酸87至2612、SEQ IDNO:27的核苷酸58至2580或SEQ ID NO:29的核苷酸171至2753。
用于分离或克隆编码这种多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合,如上所述。
所述多核苷酸也可以是编码具有β-葡糖苷酶活性的多肽的多核苷酸,其在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:25、SEQ ID NO:27或SEQ IDNO:29的成熟多肽编码序列,(ii)包含在SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列,如本文所定义的。
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:25的核苷酸87至2612、SEQ ID NO:27的核苷酸58至2580或SEQ ID NO:29的核苷酸171至2753。
具有增强纤维素分解的活性的多肽
在第一方面,具有增强纤维素分解的活性的分离的多肽包含以下基序(motif):
[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV],
其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸并且X(4)是在4个连邻接位置上的任何氨基酸。
包含上述基序的分离的多肽可进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸并且X(2)是在2个邻接位置上的任何氨基酸。在以上基序中,采用公认的IUPAC单字母氨基酸缩写。
在优选的方面,具有增强纤维素分解的活性的分离的多肽进一步包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]。在另一优选的方面,具有增强纤维素分解的活性的分离的多肽还包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一优选的方面,具有增强纤维素分解的活性的分离的多肽还包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。
在第二方面,具有增强纤维素分解的活性的分离的多肽包含以下基序:
[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ],
其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸以及x(3)是在3个邻接位置上的任何氨基酸。在以上基序中,采用公认的IUPAC单字母氨基酸缩写。
在第三个方面,具有增强纤维素分解的活性的分离的多肽包含的氨基酸序列与SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽具有优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有增强纤维素分解的活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸的不同。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:12的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:12的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:12的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:12的氨基酸20至326,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:12的氨基酸20至326。在另一优选的方面,所述多肽由SEQ ID NO:12的氨基酸序列或其等位变体组成;或者由它们具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:12的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:12的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:12的氨基酸20至326或其等位变体组成;或者由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:12的氨基酸20至326组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:14的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:14的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:14的成熟多肽。在另一优选的方面,所述多肽包含SEQ IDNO:14的氨基酸18至240,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:14的氨基酸18至240。在另一优选的方面,所述多肽由SEQ ID NO:14的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:14的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:14的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:14的氨基酸18至240或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ IDNO:14的氨基酸18至240组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:16的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:16的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:16的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:16的氨基酸20至258,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:16的氨基酸20至258。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:16的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸20至258或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸20至258组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:18的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:18的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:18的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:18的氨基酸19至226,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:18的氨基酸19至226。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:18的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸19至226或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸19至226组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:20的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:20的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:20的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:20的氨基酸20至304,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:20的氨基酸20至304。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:20的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸20至304或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸20至304组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:22的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:22的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:22的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:22的氨基酸23至250,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:22的氨基酸23至250。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:22的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸23至250或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸23至250组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:24的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:24的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:24的成熟多肽。在另一优选的方面,所述多肽包含SEQIDNO:24的氨基酸20至249,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:24的氨基酸20至249。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:24的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸20至249或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸20至249组成。
在第四方面,具有增强纤维素分解的活性的分离的多肽由如下多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQIDNO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:17、SEQ ID NO:19或SEQ ID NO:23的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。在优选的方面。成熟多肽编码序列是SEQ ID NO:11的核苷酸388至1332、SEQ IDNO:13的核苷酸98至821、SEQ ID NO:15的核苷酸126至978、SEQ ID NO:17的核苷酸55至678、SEQ ID NO:19的核苷酸58至912、SEQ ID NO:21的核苷酸67至796、或SEQ ID NO:23的核苷酸77至766。
SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21或SEQ ID NO:23的核苷酸序列或其亚序列;以及SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQID NO:20、SEQ ID NO:22或SEQ ID NO:24的氨基酸序列或其片段,可以用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有增强纤维素分解的活性的多肽的DNA,如上所述。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ IDNO:23的成熟多肽编码序列、包含在SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列、或包含SEQIDNO:17、SEQ ID NO:19或SEQ ID NO:23的成熟多肽编码序列的基因组DNA序列、它的互补链或其亚序列,如上文所述。
在优选的方面,核酸探针是SEQ ID NO:11的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:11的核苷酸388至1332。在另一优选的方面,核酸探针是编码SEQ ID NO:12的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:11。在另一优选的方面,核酸探针是包含在质粒pEJG120中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30699中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pEJG120中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30699中。
在另一优选的方面,核酸探针是SEQ ID NO:13的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:13的核苷酸98至821。在另一优选的方面,核酸探针是编码SEQ ID NO:14的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:13。在另一优选的方面,核酸探针是包含在质粒pTter61C中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30813中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTter61C中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30813中。
在另一优选的方面,核酸探针是SEQ ID NO:15的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:15的核苷酸126至978。在另一优选的方面,核酸探针是编码SEQ ID NO:16的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:15。在另一优选的方面,核酸探针是包含在质粒pTter61D中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30812中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTter61D中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30812中。
在另一优选的方面,核酸探针是SEQ ID NO:17的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:17的核苷酸55至678。在另一优选的方面,核酸探针是编码SEQ ID NO:18的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:17。在另一优选的方面,核酸探针是包含在质粒pTter61E中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30814中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTter61E中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30814中。
在另一优选的方面,核酸探针是SEQ ID NO:19的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:19的核苷酸58至912。在另一优选的方面,核酸探针是编码SEQ ID NO:20的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:19。在另一优选的方面,核酸探针是包含在质粒pTter61G中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30811中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTter61G中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30811中。
在另一优选的方面,核酸探针是SEQ ID NO:21的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:21的核苷酸67至796。在另一优选的方面,核酸探针是编码SEQ ID NO:22的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:21。在另一优选的方面,核酸探针是包含在质粒pDZA2-7中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30704中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pDZA2-7中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30704中。
在另一优选的方面,核酸探针是SEQ ID NO:23的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:23的核苷酸77至766。在另一优选的方面,核酸探针是编码SEQ ID NO:24的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:23。在另一优选的方面,核酸探针是包含在质粒pTr333中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30878中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTr333中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30878中。
对于长度至少100个核苷酸的长探针,非常低至非常高的严紧条件如在本文中所定义。
对于长度至少100个核苷酸的长探针,载体材料的最终洗涤如在本文中定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧条件如本文所定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,载体材料的最终洗涤如在本文中定义。
在第五方面,具有增强纤维素分解的活性的多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽。
在优选的方面,成熟多肽编码序列是SEQ ID NO:11的核苷酸388至1332、SEQ ID NO:13的核苷酸98至821、SEQ ID NO:15的核苷酸126至978、SEQ ID NO:17的核苷酸55至678、SEQ ID NO:19的核苷酸58至912、SEQ ID NO:21的核苷酸67至796、SEQ ID NO:23的核苷酸77至766。参见本文中的多核苷酸部分。
在第六方面,具有增强纤维素分解的活性的多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ IDNO:22或SEQ ID NO:24的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。
SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQIDNO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
具有增强纤维素分解的活性的多肽的来源
具有增强纤维素分解的活性的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”的意思应为核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。
具有增强纤维素分解的活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽,例如具有增强纤维素分解的活性的芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属多肽;或者可以是革兰氏阴性细菌多肽,例如具有增强纤维素分解的活性的大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。
在优选的方面,所述多肽是具有增强纤维素分解的活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽。
在另一优选的方面,所述多肽是具有增强纤维素分解的活性的似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种多肽。
在另一优选的方面,所述多肽是具有增强纤维素分解的活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌或浅青紫链霉菌多肽。
具有增强纤维素分解的活性的多肽还可以是真菌多肽,并且更优选是酵母多肽例如具有增强纤维素分解的活性的念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽;或更优选是丝状真菌多肽例如具有增强纤维素分解的活性的枝顶孢霉属、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳菌属(Chaetomidium)、金孢子菌属、麦角属(Claviceps)、旋孢腔菌属(Cochliobolus)、Coprinopsis、Coptotermes、棒囊壳属(Corynascus)、栗疫病菌属(Cryphonectria)、隐球菌属、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属、耙菌属(Irpex)、香菇属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、多孔菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、瘤胃壶菌属、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属、柱顶孢属(Scytalidium)、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属或木霉属、Trichophaea、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。
在优选的方面,所述多肽是具有增强纤维素分解的活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。
在另一个优选的方面,所述多肽是具有增强纤维素分解的活性的解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉黑曲霉、米曲霉、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporiumpannicola、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉(Humicolagrisea)、特异腐质霉、疏棉状腐质霉、乳白耙菌(Irpex lacteus)、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉(Penicillium funiculosum)、产紫青霉、黄孢原毛平革菌、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、小孢子梭孢壳(Thielavia microspora)、Thielavia ovispora、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。
在更优选的方面,多肽是具有增强纤维素分解的活性的土生梭孢霉多肽。在最优选的方面。多肽是具有增强纤维素分解的活性的土生梭孢霉NRRL8126多肽,例如,SEQ ID NO:12、14、16、18或20的成熟多肽或其具有增强纤维素分解的活性的片段。
在另一更优选的方面,多肽是橙色嗜热子囊菌多肽,例如,SEQ ID NO:22的成熟多肽。
在另一更优选的方面,多肽是具有增强纤维素分解的活性的里氏木酶多肽。在另一最优选的方面,多肽是具有增强纤维素分解的活性的里氏木酶RutC30(ATCC 56765)多肽,例如,SEQ ID NO:24的成熟多肽或其具有增强纤维素分解的活性的片段。
可理解的是对于前述的种,本发明包含完全和不完全阶段两种,和其它分类学的等同物,例如无性型,无论它们已知的种名。本领域熟练技术人员将轻易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心,北方区研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术来分离或克隆所述多核苷酸(参见,例如,Sambrook等人,1989,见上文)。
具有增强纤维素分解的活性的多肽还包括融合多肽或可切割的融合多肽,其中将另一种多肽融合到所述多肽或其具有增强纤维素分解的活性的片段的N末端或C末端。生产融合多肽的方法如上所述。
关于具有增强纤维素分解的活性的多肽和其多核苷酸的更多细节参见WO 2005/074647、WO 2005/074656或公开的美国申请流水号2007/0077630,将其通过引用并入本文。
编码具有增强纤维素分解的活性的多肽的多核苷酸
多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列编码具有增强纤维素分解的活性的多肽,可分离所述多核苷酸并且用于实施本发明的方法,如本文所述。
分离的多肽包含如下多核苷酸序列或由如下多核苷酸序列组成,所述多核苷酸序列与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,以及甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码具有增强纤维素分解的活性的多肽。
在优选的方面,所述核苷酸序列包含SEQ ID NO:11或由SEQ ID NO:11组成。在另一个更优选的方面,所述核苷酸序列包含质粒pEJG120中包含的序列,所述质粒包含在大肠杆菌NRRL B-30699中。在另一个优选的方面,所述核苷酸序列包含或其组成为SEQ ID NO:11的成熟多肽编码区。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pEJG120中包含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30699中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:12的氨基酸序列或其成熟多肽或由SEQ ID NO:12的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:11。本发明还涉及SEQ ID NO:11的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQID NO:12的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:13或由SEQ ID NO:13组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTter61C中包含的序列,所述质粒包含在大肠杆菌NRRL B-30813中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:13的成熟多肽编码区或由SEQ ID NO:13的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTter61C中包含的成熟多肽编码区或由质粒pTter61C中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30813中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:14的氨基酸序列或其成熟多肽或由SEQ ID NO:14的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:13。本发明还涉及SEQ ID NO:13的亚序列,所述亚序列编码具有增强纤维素分解的活生的SEQ ID NO:14的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:15或由SEQ ID NO:15组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTter61D中包含的序列,所述质粒包含在大肠杆菌NRRL B-30812中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:15的成熟多肽编码区或由SEQ ID NO:15的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTter61D中包含的成熟多肽编码区或由质粒pTter61D中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30812中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:16的氨基酸序列或其成熟多肽或由SEQ ID NO:16的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:15。本发明还涉及SEQ ID NO:15的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:16的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:17或由SEQ ID NO:17组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTter61E中包含的序列,所述质粒包含在大肠杆菌NRRL B-30814中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:17的成熟多肽编码区或由SEQ ID NO:17的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTter61E中包含的成熟多肽编码区或由质粒pTter61E中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30814中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:18的氨基酸序列或其成熟多肽或由SEQ ID NO:18的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:17。本发明还涉及SEQ ID NO:17的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:18的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:19或由SEQ ID NO:19组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTter61G中包含的序列,所述质粒包含在大肠杆菌NRRL B-30811中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:19的成熟多肽编码区或由SEQ ID NO:19的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTter61G中包含的成熟多肽编码区或由质粒pTter61G中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30811中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:20的氨基酸序列或其成熟多肽或由SEQ ID NO:20的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:19。本发明还涉及SEQ ID NO:19的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:20的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:21或由SEQ ID NO:21组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pDZA2-7中包含的序列,所述质粒包含在大肠杆菌NRRL B-30704中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:21的成熟多肽编码区或由SEQ ID NO:21的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pDZA2-7中包含的成熟多肽编码区或由质粒pDZA2-7中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30704中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:22的氨基酸序列或其成熟多肽或由SEQ ID NO:22的氨基酸序列或其成熟多肽组成,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:21。本发明还涉及SEQ ID NO:21的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:22的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:23或由SEQ ID NO:23组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTr3337中包含的序列,所述质粒包含在大肠杆菌NRRL B-30878中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:23的成熟多肽编码区或由SEQ ID NO:23的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTr3337中包含的成熟多肽编码区或由质粒pTr3337中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30878中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:24的氨基酸序列或其成熟多肽或由SEQ ID NO:24的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:23或其成熟多肽编码序列。本发明还涉及SEQ ID NO:23的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:24的片段。
本发明还涉及在SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQIDNO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ IDNO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:12的氨基酸20至326,SEQ ID NO:14的氨基酸18至240,SEQ ID NO:16的氨基酸20至258,SEQ ID NO:18的氨基酸19至226或SEQ ID NO:20的氨基酸20至304,SEQ ID NO:22的氨基酸23至250或SEQ ID NO:24的氨基酸20至249。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:11的核苷酸388至1332,SEQ ID NO:13的核苷酸98至821,SEQ ID NO:15的核苷酸126至978,SEQ ID NO:17的核苷酸55至678,SEQ ID NO:19的核苷酸58至912,SEQ ID NO:21的核苷酸67至796,SEQ ID NO:23的核苷酸77至766。
如早前所述,用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。
所述分离的多核苷酸也可以是编码具有增强纤维素分解的活性的多肽的多核苷酸,所述多核苷酸在至少极低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQID NO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:17、SEQ ID NO:19或SEQ ID NO:23的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或其等位变体和亚序列,如本文所定义。在优选的方面,成熟多肽编码序列是SEQ ID NO:11的核苷酸388至1332,SEQ ID NO:13的核苷酸98至821,SEQ ID NO:15的核苷酸126至978,SEQ ID NO:17的核苷酸55至678,SEQ ID NO:19的核苷酸58至912,SEQ ID NO:21的核苷酸67至796,或SEQ ID NO:23的核苷酸77至766。
核酸构建体
分离的多核苷酸,其编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽,和/或具有β-葡糖苷酶活性的多肽,可以用许多方式操作所述分离的多核苷酸,从而通过构建核酸构建体来提供所述多肽的表达,所述核酸构建体包含一个或多个(几)所述分离的多核苷酸,其与一个或多个(几)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是合适的启动子序列,其是由宿主细胞识别用于表达编码这种多肽的多核苷酸的核苷酸序列。启动子序列含有介导所述多肽表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截断的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导所述核酸构建体的转录,特别是在细菌宿主细胞中的转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731),以及tac启动子(DeBoer等人,1983,Proceedings of the National Academy of SciencesUSA 80:21-25)。另外的启动子在″Useful proteins from recombinant bacteria″inScientific American,1980,242:74-94中;和在Sambrook等人,1989,见上文中有所描述。
用于指导所述核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下述酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截断的和杂合的启动子。
在酵母宿主中,有用的启动子从下述蛋白的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等人,1992,Yeast 8:423-488描述。
调控序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下蛋白的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下蛋白的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等人,1992,见上文描述。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
对于酵母宿主细胞合适的前导序列从如下蛋白的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下蛋白的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo and Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端连接的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列是外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信号肽编码区时可能是需要的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码区可在本发明中使用。
对于细菌宿主细胞有效的信号肽编码区是从如下蛋白的基因获得的信号肽编码区:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen and Palva,1993,Microbiological Reviews 57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码区是从如下蛋白的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。
在优选的方面,信号肽包含SEQ ID NO:2的氨基酸1至20或由SEQ IDNO:2的氨基酸1至20组成。在另一个优选的方面,信号肽编码区包含SEQID NO:1的核苷酸1至60或由SEQ ID NO:1的核苷酸1至60组成。
在另一优选的方面,信号肽包含SEQ ID NO:4的氨基酸1至15或由SEQID NO:4的氨基酸1至15组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:3的核苷酸1至45或由SEQ ID NO:3的核苷酸1至45组成。
在另一优选的方面,信号肽包含SEQ ID NO:6的氨基酸1至18或由SEQID NO:6的氨基酸1至18组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:5的核苷酸1至54或由SEQ ID NO:5的核苷酸1至54组成。
在另一优选的方面,信号肽包含SEQ ID NO:8的氨基酸1至17或由SEQID NO:8的氨基酸1至17组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:7的核苷酸1至51或由SEQ ID NO:7的核苷酸1至51组成。
在另一优选的方面,信号肽包含SEQ ID NO:10的氨基酸1至20或由SEQID NO:10的氨基酸1至20组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:9的核苷酸1至60或由SEQ ID NO:9的核苷酸1至60组成。
在另一优选的方面,信号肽包含SEQ ID NO:12的氨基酸1至19或由SEQ ID NO:12的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:11的核苷酸330至387或由SEQ ID NO:7的核苷酸330至387组成。
在另一优选的方面,信号肽包含SEQ ID NO:14的氨基酸1至17或由SEQ ID NO:14的氨基酸1至17组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:13的核苷酸47至97或由SEQ ID NO:13的核苷酸47至97组成。
在另一优选的方面,信号肽包含核苷酸编码区或由氨基酸编码区组成,所述氨基酸编码区是SEQ ID NO:16的氨基酸1至19。在另一个优选的方面,信号肽编码区包含SEQ ID NO:15的核苷酸69至125或由SEQ ID NO:15的核苷酸69至125组成。
在另一优选的方面,信号肽包含SEQ ID NO:18的氨基酸1至18或由SEQ ID NO:18的氨基酸1至18组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:17的核苷酸1至54或由SEQ ID NO:17的核苷酸1至54组成。
在另一优选的方面,信号肽包含SEQ ID NO:20的氨基酸1至19或由SEQ ID NO:20的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:19的核苷酸1至57或由SEQ ID NO:19的核苷酸1至57组成。
在另一优选的方面,信号肽包含SEQ ID NO:22的氨基酸1至22或由SEQ ID NO:22的氨基酸1至22组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:21的核苷酸1至66或由SEQ ID NO:21的核苷酸1至66组成。
在另一优选的方面,信号肽包含SEQ ID NO:24的氨基酸1至19或由SEQ ID NO:24的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:23的核苷酸20至76或由SEQ ID NO:23的核苷酸20至76组成。
在另一优选的方面,信号肽包含SEQ ID NO:26的氨基酸1至19或由SEQ ID NO:26的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:25的核苷酸31至86或由SEQ ID NO:25的核苷酸31至86组成。
在另一优选的方面,信号肽包含SEQ ID NO:26的氨基酸1至19或由SEQ ID NO:26的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:27的核苷酸1至57或由SEQ ID NO:27的核苷酸1至57组成。
在另一优选的方面,信号肽包含SEQ ID NO:28的氨基酸1至19或由SEQ ID NO:28的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:29的核苷酸6至62或由SEQ ID NO:29的核苷酸6至62组成。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码区由Romanos等人,1992,见上文,描述。
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化成成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码区。
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(next to)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。
表达载体
可以将本文描述的多种核酸和调控序列结合在一起以产生重组表达载体,其包含编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的多核苷酸、启动子和转录和翻译的终止信号。所述表达载体可以包括一种或多种(几)方便的限制位点以允许在这些位点插入或取代编码所述多肽的核苷酸序列。可供选择的是,可以通过将所述核苷酸序列或包含该序列的核酸构建体插入用于表达的适当载体中来表达编码这样的多肽的多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的用于表达的调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
所述载体优选地含有一个或多个(几)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
所述载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应该优选含有足够数目的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以通过非同源重组将载体整合到宿主细胞基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体在体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene 98:61-67;Cullen等人,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
可以将多于一个拷贝的编码这样的多肽的多核苷酸插入宿主细胞以增加该多肽的产生,所述多核苷酸编码这样的多肽。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或使所述多核苷酸包括可扩增选择性标记基因,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝并且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建所述重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等人,1989,见上文)。
宿主细胞
重组宿主细胞,其包含多核苷酸,所述多核苷酸编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽,可将所述重组宿主细胞有利地使用在所述多肽的重组产生中。将包含这种多核苷酸的载体引入宿主细胞中,从而将该载体保留作为染色体整合体(chromosomalintegrant)或作为前述的自复制的染色体外载体。术语“宿主细胞”包含亲本细胞的任何子代,其由于复制过程中发生的突变而与亲本细胞不相同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。
宿主细胞可以是单细胞微生物,例如,原核生物,或非单细胞微生物,例如,真核生物。
细菌宿主可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞。在本发明的实施中有用的链球菌属细胞包括但不限于似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种。
在优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞。在本发明的实施中有用的链霉菌属细胞包括但不限于不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌和浅青紫链霉菌。
在优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入芽孢杆菌属细胞:例如通过原生质体转化(参见,例如,Chang and Cohen,1979,Molecular General Genetics 168:111-115),通过使用感受态细胞(参见,例如,Young and Spizizen,1961,Journalof Bacteriology 81:823-829或Dubnau and Davidoff-Abelson,1971,Journal ofMolecular Biology 56:209-221),通过电穿孔(参见,例如,Shigekawa and Dower,1988,Biotechniques 6:742-751)或通过接合(参见,例如,Koehler and Thorne,1987,Journal of Bacteriology 169:5771-5278)。可通过如下方法实现将DNA引入大肠杆菌细胞:例如通过原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或通过电穿孔(参见,例如,Dower等人,1988,Nucleic AcidsRes.16:6127-6145)。可通过如下方法实现将DNA引入链霉菌属细胞:例如通过原生质体转化和电穿孔(参见,例如,Gong等人,2004,Folia Microbiol.(Praha)49:399-405),通过接合(参见,例如,Mazodier等人,1989,J.Bacteriol.171:3583-3585),或通过转导(参见,例如,Burke等人,2001,Proc.Natl.Acad.Sci.USA 98:6289-6294)。可通过如下方法实现将DNA引入假单胞菌属细胞:例如通过电穿孔(参见,例如,Choi等人,2006,J.Microbiol.Methods 64:391-397)或通过接合(参见,例如,Pinedo and Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入链球菌属细胞:例如通过天然感受态(参见,例如,Perry and Kuramitsu,1981,Infect.Immun.32:1295-1297),通过原生质体转化(参见,例如,Catt and Jollick,1991,Microbios.68:189-2070),通过电穿孔(参见,例如,Buckley等人,1999,Appl.Environ.Microbiol.65:3800-3804)或通过接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用任何将DNA引入宿主细胞的本领域已知方法。
宿主细胞还可以是真核细胞,例如哺乳动物、昆虫、植物或真菌细胞。
在优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等人,In,Ainsworth and Bisby’sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK所定义)以及卵菌门(Oomycota)(如Hawksworth等人,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等人,1995,见上)。
在更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,应将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在更加优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。
在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另外最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另外最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowia lipolytica)细胞。
在另外更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等人,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个的最优选的方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另外最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporium pannicola、Chrysosporium queenslandicum、Chrysosporiumzonatum、灰盖鬼伞、毛革盖菌(Coriolus hirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌(Trametes villosa)、杂色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton等人,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等人,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito等人,1983,Journal of Bacteriology 153:163;和Hinnen等人,1978,Proceedings of theNational Academy of Sciences USA75:1920。
产生方法
本发明的纤维素分解酶组合物可以通过微生物菌株(野生型或重组宿主细胞)或若干个体微生物菌株(野生型或重组宿主细胞)的发酵而产生。
用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的方法包括:(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收所述多肽。
或者,用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的方法包括:(a)在有益于产生所述多肽的条件下培养重组宿主细胞;和(b)回收所述多肽。
此外,用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的方法包括:(a)在有益于产生所述多肽的条件下培养宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码区中具有至少一个突变,其中所述突变核苷酸序列编码由SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽组成的多肽,和(b)回收所述多肽。
在所述产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,则能够从所述培养基中直接回收该多肽。如果多肽不分泌到培养基中,其能够从细胞裂解物(lysate)回收。
使用本文描述的方法来检测具有增强纤维素分解的活性、内切葡聚糖酶活性、纤维二糖水解酶活性或β-葡聚糖活性的多肽。
可以使用本领域已知的方法回收所得多肽。例如,可以通过常规方法从营养培养基中回收多肽,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
可以通过多种本领域已知的方法纯化所述多肽以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson andLars Ryden,editors,VCH Publishers,New York,1989)。
含纤维素材料的加工
本发明中的组合物和方法可以用于将含纤维素材料例如,木素纤维素,水解(糖化)成可发酵糖并将可发酵糖转换成许多有用的物质,例如化学品和燃料。来自含纤维素材料的期望的发酵产物的生产过程通常包括预处理、酶水解作用(糖化作用)和发酵。
依照本发明,含纤维素材料的加工可以利用本领域已知的方法来完成。而且,可以使用设置为按照本发明来操作的任何生物质加工设备实施本发明的方法。
水解(糖化)和发酵,分别或同时包括但不限于分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和发酵)和直接微生物转化(DMC)。在此所理解的本领域已知任何方法包括预处理、酶水解作用(糖化作用)、发酵或其组合可以用在本发明的方法实施中。
常规设备可以包括补料分批搅拌反应器(fed-batch stirred reactor)、分批搅拌反应器(batch-stirred reactor)、带有超滤的连续流搅拌反应器(continuous flowstirred reactor with ultrafiltration)和/或连续活塞流柱式反应器(continuousplug-flow column reactor)(Femanda de Castilhos Corazza,Flávio Faria deMoraes,Gisella Maria Zanin and Ivo Neitzel,2003,Optimal control in fed-batchreactor for the cellobiose hydrolysis,Acta Scientiarum.Technology 25:33-38;Gusakov,A.V.,and Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis ofcellulose:1.A mathematical model for a batch reactor process,Enz.Microb.Technol.7:346-352)、研磨反应器(attrition reactor)(Ryu,S.K.,and Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65)或带有电磁场引起的强力搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancementof enzymatic cellulose hydrolysis using a novel type of bioreactor with intensivestirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。用于水解和/或发酵作用的附加式反应器类型包括,例如,流化床(fluidized bed)、上流式床(upflow blanket)、固定化的、和挤压机型反应器。
预处理:在实施本发明的方法中,本领域已知的任何预处理方法都可以用于瓦解含纤维素材料的植物细胞壁组分。在预处理之前,也可以用本领域已知的方法对含纤维素材料进行预浸泡、湿润或调节(conditioning)。常规的预处理包括而不限于蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿式爆炸(wet explosion)、氨纤维爆炸、有机溶剂预处理和生物学预处理。另外的预处理包括超声、电穿孔、微波、超临界CO2、超临界H2O和氨渗滤法。
在水解和/或发酵作用之前可以预先处理含纤维素材料。预处理优选在水解之前进行。或者,预处理可以与水解同时进行,例如与用一种或多种纤维素分解酶或其他酶活力处理含纤维素材料同时进行,以释放可发酵糖,如葡萄糖和/或麦芽糖。在大多数情况下预处理步骤本身导致生物质转化成可发酵糖(甚至在酶不存在的情况下)。
蒸汽预处理:在蒸汽预处理中,加热含纤维素材料以瓦解植物细胞壁组分(包括木质素、半纤维素和纤维素),从而使纤维素和其它级分(如半纤维素)更易于让酶接近。将纤维素材料传送至或穿过反应容器,在所述反应容器中注入蒸汽将温度升高到所需的温度和压强,并且在预期的反应时间里将其保持在其中。蒸汽预处理优选在140-230℃,更优选160-200℃,并且最优选170-190℃下完成,其中最适温度范围取决于化学催化剂的加入。蒸汽预处理的驻留时间(residence time)优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最适驻留时间取决于温度范围和化学催化剂的加入。蒸汽预处理允许相对高的固体加样,从而使得含纤维素材料一般仅在预处理时湿润。在预处理后,所述蒸汽预处理经常与材料的爆炸性放电相结合,其称作蒸汽爆炸,也就是说,材料向大气压快速运动(rapid flashing)并快速流动以通过断裂增加可接近表面积。(Duff and Murray,1996,Bioresource Technology 855:1-33;Galbe and Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;U.S.PatentApplication No.20020164730)。
在蒸汽预处理之前常常加入催化剂如H2SO4或SO2(通常0.3至3%w/w),其能减少时间和降低温度,增加回收率以及改善酶水解作用(Ballesteros等人,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等人,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等人,2006,Enzyme Microb.Technol.39:756-762)。
化学预处理:术语“化学处理”指的是促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。适当的化学预处理方法的实例包括,例如,稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(ammonia fiber/freezeexplosion)(AFEX)、氨渗透(ammonia percolation)(APR)或有机溶剂预处理。
在稀酸预处理中,将含纤维素材料与稀酸(通常为H2SO4)、水混合以形成浆料,通过蒸汽加热到所需的温度,并在一段驻留时间后,快速进入大气压。可以在多个反应器设计中进行稀酸预处理,例如,活塞流反应器、逆流反应器或连续逆流收缩床反应器(counter-current shrinking bed reactors)(Duff andMurray,1996,见上文;Schell等人,2004,Bioresource Technol.91:179-188;Lee等人,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。
也可以使用在碱性条件下的集中预处理方法。这些碱性预处理包括,但并不限于,石灰预处理、湿氧化、氨渗透(APR)和氨纤维/冷冻爆炸(AFEX)。
在85-150℃的低温下用碳酸钙、氢氧化钠或氨进行石灰预处理,并且驻留时间为1小时至几天(Wyman等人,2005,Bioresource Technol.96:1959-1966;Mosier等人,2005,Bioresource Technol.96:673-686)。WO 2006/110891、WO2006/11899、WO 2006/11900和WO 2006/110901披露了使用氨的预处理方法。
湿氧化为通常在加入氧化剂(例如过氧化氢或超压氧)的条件下在180-200℃下进行5-15分钟的热预处理(Schmidt and Thomsen,1998,Bioresource Technol.64:139-151;Palonen等人,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等人,2004,Biotechnol.Bioeng.88:567-574;Martin等人,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。以优选1-40%的干物质,更优选2-30%的干物质,并且最优选5-20%的干物质进行预处理,并且通常初始pH值随着碱(例如碳酸钠)的加入而增加。
已知的湿氧化预处理方法的改进方法为湿爆炸(湿氧化和蒸汽爆炸的结合),其可以处理干物质高达30%。在湿爆炸中,在经过一段特定的驻留时间后在预处理过程中引入氧化剂。然后,通过快速进入大气压来结束预处理(WO2006/032282)。
氨纤维爆炸(AFEX)包括在合适的温度下(例如90-100℃)和高压(例如17-20bar)下用液态或气态氨水处理含纤维素材料5-10分钟,其中干物质含量可以高达60%(Gollapalli等人,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等人,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等人,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等人,2005,BioresourceTechnol.96:2014-2018)。
通过在160-200℃下使用乙醇水溶液(40-60%乙醇)萃取30-60分钟,有机溶剂预处理使含纤维素材料脱木素(Pan等人,2005,Biotechnol.Bioeng.90:473-481;Pan等人,2006,Biotechnol.Bioeng.94:851-861;Kurabi等人,2005,Appl.Biochem.Biotechnol.121:219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中,大部分的半纤维素被除去。
Schell等人,2003,Appl.Biochem.and Biotechnol.Vol.105-108,p.69-85和Mosier等人,2005,Bioresource Technology 96:673-686和公开的美国申请2002/0164730描述了合适的预处理方法的其它实例。
在一个方面,优选以酸处理,并且更优选以连续稀酸和/或弱酸处理进行所述的化学预处理。所述酸优选为硫酸,但是也可以使用其它酸,例如醋酸、柠檬酸、硝酸、磷酸、酒石酸、丁二酸、氯化氢或其混合物。在优选1-5,更优选1-4,并且最优选1-3的pH范围下实施弱酸处理。在一个方面,所述酸浓度在优选0.01至20wt%酸,更优选0.05至10wt%酸,甚至更优选0.1至5wt%酸,并且最优选0.2至2.0wt%酸的范围内。使所述酸与含纤维素材料接触,并在一定的温度(例如在160-220℃,优选165-195℃的范围)下保持数秒至数分钟(例如1秒至60分钟)。
在另一方面,以氨纤维爆炸步骤(AFEX预处理步骤)进行预处理。
在另一方面,在浆料水溶液中进行预处理。在优选的方面,在预处理过程中,含纤维素材料以优选10-80wt%之间,更优选20-70wt%之间,并且最优选30-60wt%之间,例如大约50wt%的量存在。所述预处理的含纤维素材料可以是未经洗涤的,或者是使用本领域内已知的任何方法洗涤的,例如用水洗涤。
机械预处理:术语“机械预处理”指的是各种类型的研磨或磨制(例如干磨、湿磨或振动球磨)。
物理预处理:术语“物理预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何预处理。例如,物理预处理可以涉及辐照(例如,微波辐照)、蒸煮/蒸汽爆炸、水热分解(hydro thermolysis)及其组合。
物理预处理可以包括高压和/或高温(蒸汽爆炸)。在一个方面,高压指的是范围在优选大约300至大约600psi,更优选为大约350至大约550psi,并且最优选为大约400至大约500psi,例如大约450psi的压力。在另一方面,高温指的是范围在大约100至大约300℃,优选大约140至大约235℃的温度。在优选的方面,在使用如上所限定的高压和高温的蒸汽枪水解仪系统(例如,Sunds Hydrolyzer,购自Sunds Defibrator AB,Sweden)中以分批法进行机械预处理。
物理和化学预处理的组合:含纤维素材料可以同时进行物理和化学预处理。例如,预处理步骤可以包括稀酸或弱酸处理和高温和/或高压处理。可以根据需要依次或同时进行物理和化学预处理。也可以包括机械预处理。
因此,在优选的方面,使含纤维素材料经历机械、化学或物理预处理或者其任意组合的预处理以促进纤维素、半纤维素和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”指的是促进促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何生物学预处理方法。生物预处理技术可包括应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatment of biomass,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor&Francis,Washington,DC,179-212;Ghosh and Singh,1993,Physicochemical and biological treatments for enzymatic/microbialconversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,in EnzymaticConversion of Biomass for Fuels Production,Himmel,M.E.,Baker,J.O.,andOverend,R.P.,eds.,ACS Symposium Series 566,American Chemical Society,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.,and Tsao,G.T.,1999,Ethanol production from renewable resources,in Advances in BiochemicalEngineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson and Hahn-Hagerdal,1996,Fermentation oflignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;and Vallander and Eriksson,1990,Production of ethanol fromlignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
糖化:在也称为糖化的水解步骤中,将经预处理的含纤维素材料水解以将纤维素以及可选地还有半纤维素分解成可发酵的糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或可溶的寡糖。使用本发明的纤维素分解酶组合物进行酶水解,所述纤维素分解酶组合物包含有效量的具有增强纤维素分解的活性的多肽。也可以依次加入组合物的酶组分。
优选在本领域的技术人员能够容易地确定的条件下,在合适的含水环境中进行酶水解。在优选的方面,在适于酶活性的条件(即,对酶最佳的条件)下进行水解。可以以补料分批或连续方法进行水解,在连续方法中将经预处理的含纤维素材料(底物)逐渐加入到例如包含酶的水解溶液中。
糖化通常在受控的pH、温度和混合条件下,在搅拌釜式反应器或发酵罐中进行。合适的过程时间、温度和pH条件能够由本领域技术人员容易地决定。例如,糖化可以持续多至200小时,但是通常进行优选大约12至大约96小时,更优选大约16至大约72小时,并且最优选大约24至大约48小时。所述温度在优选大约25℃至大约70℃,更优选大约30℃至大约65℃,并且更优选大约40℃至60℃的温度范围内,特别地为大约50℃。所述pH在优选大约3至大约8,更优选大约3.5至大约7,并且最优选大约4至大约6的范围内,特别地为大约pH 5。干固体的含量在优选大约5至大约50wt%,更优选大约10至大约40wt%并且最优选大约20至大约30wt%的范围内。
酶的最优量和具有增强纤维素分解的活性的多肽的最优量依赖于几个因素,所述因素包括但不限于成分纤维素分解蛋白的混合物、纤维素底物、纤维素底物浓度、纤维素底物的预处理、温度、时间、pH和发酵微生物(例如,用于同时糖化和发酵的酵母)的内含物(inclusion)。
在优选的方面,纤维素分解蛋白对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,甚至更优选大约0.5至大约10mg,并且最优选大约2.5至大约10mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,甚至更优选大约0.5至大约10mg,并且最优选大约2.5至大约10mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.01至大约50.0mg,优选大约0.01至大约40mg,更优选大约0.01至大约30mg,更优选大约0.01至大约20mg,更优选大约0.01至大约10mg,更优选大约0.01至大约5mg,更优选大约0.025至大约1.5mg,更优选大约0.05至大约1.25mg,更优选大约0.075至大约1.25mg,更优选大约0.1至大约1.25mg,甚至更优选大约0.15至大约1.25mg,并且最优选大约0.25至大约1.0mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于纤维素分解蛋白的有效量是每克纤维素分解蛋白大约0.005至大约1.0g,优选大约0.01至大约1.0g,更优选大约0.15至大约0.75g,更优选大约0.15至大约0.5g,更优选大约0.1至大约0.5g,甚至更优选大约0.1至大约0.5g,并且最优选大约0.05至大约0.2g。
发酵.通过一种或多种能够直接或间接将糖发酵成期望的发酵产物的发酵微生物可以发酵从经预处理和水解的含纤维素材料得到的可发酵的糖。“发酵”或“发酵方法”指任何发酵方法或任何包括发酵步骤的方法。发酵方法还包括在生物燃料工业、可消费醇工业(例如,啤酒和葡萄酒(wine))、乳品工业(例如,发酵乳制品)、皮革工业和烟草工业中使用的发酵方法。发酵的条件依赖于期望的发酵产物和发酵生物,并且本领域的技术人员可以容易地确定。
在发酵步骤中,将作为预处理和酶水解步骤的结果从含纤维素材料释放的糖通过发酵生物例如酵母发酵成产物,例如乙醇。水解(糖化)和发酵可以是分别的或同时的。这些方法包括,但不限于,分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和共发酵)和直接微生物转化(DMC)。
在实施本发明时,任何合适的经水解的含纤维素材料可以用于发酵步骤中。所述材料通常基于期望的发酵产物来选择,即,基于将要由发酵获得的物质来选择,还基于使用的方法来选择,如本领域内所熟知的。
术语“发酵培养基”在本文中应理解为指在加入发酵微生物之前的培养基,例如,糖化处理产生的培养基,以及例如在同时糖化和发酵方法(SSF)中使用的培养基。
“发酵微生物”指适用于期望的发酵方法中以生产发酵产物的任何微生物,其包括细菌生物和真菌生物。发酵生物可以为C6和/或C5发酵生物,或者其组合。C6和C5发酵生物都是本领域内熟知的。合适的发酵生物能够发酵,即,能够直接或间接地将糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖转化成期望的发酵产物。
Lin等人,2006,Appl.Microbiol.Biotechnol.69:627-642描述了生产乙醇的细菌和真菌发酵生物的实例。
可以发酵C6糖的发酵微生物的实例包括细菌和真菌生物,例如酵母。优选的酵母包括酵母属菌种,优选为酿酒酵母。
可以发酵C5糖的发酵生物的实例包括细菌和真菌生物,例如酵母。优选的发酵C5的酵母包括毕赤酵母属(Pichia)菌株、优选为树干毕赤酵母(Pichiastipitis),例如树干毕赤酵母CBS 5773;念珠菌属的菌株,优选博伊丁念珠菌(Candida boidinii)、芸苔念珠菌(Candida brassicae)、休哈塔念珠菌(Candidasheatae)、迪丹斯念珠菌(Candida diddensii)、假热带念珠菌(Candidapseudotropicalis)、产朊假丝酵母(Candida utilis)。
其它发酵生物包括发酵单孢菌(Zymomonas)的菌株,例如运动发酵单孢菌(Zymomonas mobilis);克鲁维酵母属(Klyveromyces)的菌株,例如脆壁克鲁维酵母(K.fragilis);裂殖酵母属(Schizosaccharomyces)的菌株,例如粟酒裂殖酵母(S.Pombe);和大肠杆菌,特别是已经进行了遗传修饰以提高乙醇产率的大肠杆菌菌株。
在优选的方面,酵母是酵母属菌种(Saccharomyces spp.)。在优选的方面,酵母是酿酒酵母。在另一优选的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一更优选的方面,酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一个优选的方面,酵母是克鲁维酵母属。在另一个更优选的方面,酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一个更优选的方面,酵母是脆壁克鲁维酵母(Kluyveromyces fragilis)。在另一优选的方面,酵母是念珠菌属。在另一更优选的方面,酵母是博伊丁念珠菌。在另一更优选的方面,酵母是芸苔念珠菌。在另一更优选的方面,酵母是迪丹斯念珠菌。在另一更优选的方面,酵母是假热带念珠菌。在另一更优选的方面,酵母是产朊假丝酵母。在另一优选的方面,酵母是棍孢属(Clavispora)。在另一更优选的方面,酵母是葡萄牙棍孢(Clavispora lusitaniae)。在另一更优选的方面,酵母是仙人掌棍孢(Clavispora opuntiae)。在另一优选的方面,酵母是管囊酵母属(Pachysolen)。在另一更优选的方面,酵母是嗜鞣管囊酵母(Pachysolentannophilus)。在另一优选的方面,酵母是毕赤酵母属(Pichia)。在另一更优选的方面,酵母是树干毕赤酵母(Pichia stipitis)。在另一优选的方面,酵母是酒香酵母属(Bretannomyces)。在另一更优选的方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis,G.P.,1996,Cellulose bioconversiontechnology,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor&Francis,Washington,DC,179-212)。
能够有效地将己糖和戊糖发酵成乙醇的细菌包括例如运动发酵单孢菌和热纤维梭菌(Clostridium thermocellum)(Philippidis,1996,见上文)。
在优选的方面,细菌是发酵单孢菌。在更优选的方面,细菌是运动发酵单孢菌。在另一优选的方面,细菌是梭菌属。在另一优选的方面,细菌是热纤维梭菌。
市售可得的适合于乙醇生产的酵母包括,例如,ETHANOL REDTM酵母(可得自Fermentis/Lesaffre,USA)、FALITM(可得自Fleischmann’s Yeast,USA)、SUPERSTARTTM和THERMOSACCTM新鲜酵母(可得自Ethanol Technology,WI,USA)、BIOFERMTM AFT和XR(可得自NABC-North American BioproductsCorporation,GA,USA)、GERT STRANDTM(可得自Gert Strand AB,Sweden)和FERMIOLTM(购自DSM Specialties)。
在优选的方面,发酵微生物已经遗传修饰以提供发酵戊糖的能力,例如,利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物(xylose andarabinose co-utilizing microorganism)。
将异源基因克隆至多种发酵微生物中已经导致构建了能够将己糖和戊糖转化为乙醇的生物(共发酵)(Chen and Ho,1993,Cloning and improving theexpression of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等人,1998,Geneticallyengineered Saccharomyces yeast capable of effectively cofermenting glucose andxylose,Appl.Environ.Microbiol.64:1852-1859;Kotter and Ciriacy,1993,Xylose fermentation by Saccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等人,1995,Xylose-metabolizing Saccharomycescerevisiae strains overexpressing the TKL1 and TAL1 genes encoding the pentosephosphate pathway enzymes transketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等人,2004,Minimal metabolic engineering ofSaccharomyces cerevisiae for efficient anaerobic xylose fermentation:a proof ofprinciple,FEMS Yeast Research 4:655-664;Beall等人,1991,Parametric studiesof ethanol production from xylose and other sugars by recombinant Escherichiacoli,Biotech.Bioeng.38:296-303;Ingram等人,1998,Metabolic engineering ofbacteria for ethanol production,Biotechnol.Bioeng.58:204-214;Zhang等人,1995,Metabolic engineering of a pentose metabolism pathway in ethanologenicZymomonas mobilis,Science 267:240-243;Deanda等人,1996,Development ofan arabinose-fermenting Zymomonas mobilis strain by metabolic pathwayengineering,Appl.Environ.Microbiol.62:4465-4470)。
在优选的方面,经遗传修饰的发酵微生物是酿酒酵母。在另一优选的方面,经遗传修饰的发酵微生物是运动发酵单孢菌。在另一优选的方面,经遗传修饰的发酵微生物是大肠杆菌。在另一优选的实施方式中,经遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。
通常加入发酵微生物以降解纤维素或水解产物,并且发酵进行大约8到大约96小时,例如大约24至大约60小时。温度通常为大约26℃至大约60℃之间,特别是大约32℃或50℃,并且在大约pH3至大约pH8,例如大约pH4-5,6或7。
在优选的方面,将发酵微生物应用于降解的纤维素或水解产物,并且进行发酵大约12至大约96小时,例如通常为24-60小时。在优选的方面,温度优选在大约20℃至大约60℃之间,更优选大约25℃至大约50℃,并且最优选大约32℃至大约50℃,特别是大约32℃或50℃,并且pH通常从大约pH3至大约pH7,优选大约pH 4-7。然而,例如,一些发酵生物具有更高的最佳发酵温度。发酵微生物优选以每毫升的发酵液大约105至1012,优选大约107至1010,特别是大约2×108的活细胞计数的量应用。有关使用酵母发酵的其它指导可参见例如“The Alcohol Textbook”(Editors K.Jacques,T.P.Lyonsand D.R.Kelsall,Nottingham University Press,United Kingdom 1999),将其通过引用并入本文。
对于乙醇产生,在发酵之后蒸馏发酵浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作例如燃料乙醇、饮用乙醇,即,可饮用中性酒精(potableneutral spirits);或工业乙醇。
可以将发酵刺激物(fermentation stimulator)与本文描述的任何酶方法组合使用以进一步改进发酵方法,特别是改进发酵微生物的性能,例如,速率提高和乙醇产率。“发酵刺激物”指用于培养发酵微生物,特别是酵母的生长的刺激物。优选的用于生长的发酵刺激物包括维生素和矿物。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等人,Improving ethanol production and viability of Saccharomyces cerevisiae bya vitamin feeding strategy during fed-batch process,Springer-Verlag(2002),将其通过引用并入本文。矿物的实例包括能够提供营养物的矿物和矿物盐,所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
发酵产物:发酵产物可以为源自发酵的任何物质。所述发酵产物可以是,但不限于,醇(例如,阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇和木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、延胡索酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸);酮类(例如,丙酮);醛类(例如,甲醛);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵产物还可以为作为有高价值产物的蛋白质。
在优选的方面,所述发酵产物是醇。应该理解术语“醇”包含含有一个或多个羟基的物质。在更优选的方面,所述醇是阿拉伯糖醇。在另一更优选的方面,所述醇是丁醇。在另一更优选的方面,所述醇是乙醇。在另一更优选的方面,所述醇是甘油。在另一更优选的方面,所述醇是甲醇。在另一更优选的方面,所述醇是1,3-丙二醇。在另一更优选的方面,所述醇是山梨糖醇。在另一个更优选的方面,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,and Tsao,G.T.,1999,Ethanol production from renewable resources,inAdvances in Biochemical Engineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,andJonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,and Singh,D.,1995,Processes forfermentative production of xylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.and Blaschek,H.P.,2003,Production ofacetone,butanol and ethanol by Clostridium beijerinckii BA101 and in siturecovery by gas stripping,World Journal of Microbiology and Biotechnology 19(6):595-603。
另一个优选的方面,所述发酵产物是有机酸。在另一更优选的方面,所述有机酸是乙酸。在另一更优选的方面,所述有机酸是醋酮酸。在另一更优选的方面,所述有机酸是己二酸。在另一更优选的方面,所述有机酸是抗坏血酸。在另一更优选的方面,所述有机酸是柠檬酸。在另一更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一更优选的方面,所述有机酸是甲酸。在另一更优选的方面,所述有机酸是延胡索酸。在另一更优选的方面,所述有机酸是葡糖二酸。在另一更优选的方面,所述有机酸是葡糖酸。在另一更优选的方面,所述有机酸是葡糖醛酸。在另一更优选的方面,所述有机酸是戊二酸。在另一优选的方面,所述有机酸是3-羟基丙酸。在另一更优选的方面,所述有机酸是衣康酸。在另一更优选的方面,所述有机酸是乳酸。在另一更优选的方面,所述有机酸是苹果酸。在另一更优选的方面,所述有机酸是丙二酸。在另一更优选的方面,所述有机酸是草酸。在另一更优选的方面,所述有机酸是丙酸。在另一更优选的方面,所述有机酸是琥珀酸。在另一更优选的方面,所述有机酸是木糖酸。参见,例如,Chen,R.,and Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一优选的方面,所述发酵产物是酮。应该理解的是术语“酮”涵盖含有一个或多个酮基的物质。在另一更优选的方面,所述酮是丙酮。参见,例如,Qureshi and Blaschek,2003,见上文。
在另一优选的方面,所述发酵产物是醛。在另一更优选的方面,所述醛为甲醛。
在另一优选的方面,所述发酵产物是氨基酸。在另一更优选的方面,所述有机酸是天冬氨酸。在另一更优选的方面,所述氨基酸是谷氨酸。在另一更优选的方面,所述氨基酸是甘氨酸。在另一更优选的方面,所述氨基酸是赖氨酸。在另一更优选的方面,所述氨基酸是丝氨酸。在另一更优选的方面,所述氨基酸是苏氨酸。参见,例如,Richard,A.,and Margaritis,A.,2004,Empirical modeling of batch fermentation kinetics for poly(glutamic acid)production and other microbial biopolymers,Biotechnology and Bioengineering87(4):501-515。
在另一优选的方面,所述发酵产物是气体。在另一更优选的方面,所述气体是甲烷。在另一更优选的方面,所述气体是H2。在另一更优选的方面,所述气体是CO2。在另一更优选的方面,所述气体是CO。参见,例如,Kataoka,N.,A.Miya,and K.Kiriyama,1997,Studies on hydrogen production bycontinuous culture system of hydrogen-producing anaerobic bacteria,WaterScience and Technology 36(6-7):41-47;和Gunaseelan V.N.in Biomass andBioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion of biomass formethane production:A review。
回收:使用本领域已知的方法可以从发酵培养基中任选地回收发酵产物,所述方法包括,但不限于,层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、蒸馏或提取。例如,从发酵的含纤维素材料中分离乙醇,并通过常规的蒸馏方法纯化。可以获得纯度高至大约96vol.%的乙醇,其可以用作,例如燃料乙醇、饮用乙醇,即,可饮用中性酒精(potable neutral spirits);或工业乙醇。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
材料
用作缓冲剂和底物的化学药品为至少为试剂级的市售产品。
培养基
NNCYP培养基由如下物质组成:每升5.0g NH4NO3、0.5g MgSO4·7H2O、0.3gCaCl2、2.5g柠檬酸、1.0g细菌用蛋白胨、5.0g酵母提取物、1ml COVE痕量金属溶液和足量的K2HPO4以实现最终的pH为大约5.4。
COVE痕量金属溶液由如下物质组成:每升0.04g Na2B4O7·10H2O、0.4gCuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O。
实施例1:米曲霉β-葡糖苷酶和具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A的制备
通过在米曲霉中过表达来制备米曲霉β-葡糖苷酶和具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A。根据WO 2005/074656在米曲霉JaL250中重组产生具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A。根据WO 02/095014,在米曲霉JaL250中重组产生米曲霉β-葡糖苷酶。
通过在补充有每升52g的纤维素的NNCYP培养基上培养米曲霉培养物使发酵罐培养物生长,并在发酵过程中(无额外碳源)在42℃将所述培养基分批加入并保持在pH 5.0下。使发酵能够进行直至该批次的纤维素已经消耗完(通常大约40小时),此时采集培养液,并离心分离以除去菌丝。通过在9500xg下离心培养物大约20分钟来清除粗制培养液样品的细胞碎片。然后,过滤澄清的培养液样品(GP ExpressTM membrane,polyethersulfone,0.22μm,Millipore,Bedford,MA,USA)。使用BCATM蛋白测定试剂盒(Pierce,Rockford,IL,USA)测定脱盐材料(HIPREPTM 26/10 Desalting Column,AKTATM,GE Healthcare,Piscataway,NJ,USA)的蛋白浓度,在所述蛋白测定试剂盒中,将牛血清白蛋白用作蛋白标准品。通常在8-16%CRITERIONTM SDS-PAGE凝胶(Bio-Rad,Hercules,CA;200V,1小时)上检验等分试样,在所述凝胶中包括PRECISION PLUS PROTEINTM分子量标准品(Bio-Rad,Hercules,CA,USA)。使用BIO-SAFETM Coomassie Stain(Bio-Rad,Hercules,CA,USA)染色凝胶中的蛋白,并使用去离子水脱染色。
实施例2:玉米秸秆的预处理
在U.S.Department of Energy National Renewable Energy Laboratory(NREL)使用稀硫酸预处理玉米秸秆。使用下列条件进行预处理:在195℃在1.4wt%硫酸预处理4.5分钟。根据使用过量的纤维素酶消化的极限,在经预处理的玉米秸秆(PCS)中的不溶于水的固体包含59.5%的纤维素。在酶水解之前,用大量的去离子水洗涤PCS直至除去可溶酸和糖。发现经水洗涤的PCS的干重为19.16%。
根据NREL实验分析规程第8条(Laboratory Analytical Protocol#008)使用50g的总反应量、使用125ml的带螺旋盖的锥形烧瓶(VWR,West Chester,PA,USA)进行PCS的水解。在该规程中,在占纤维素酶蛋白加样量6%的米曲霉β-葡糖苷酶存在或不存在,以及在加入和没有加入11%橙色嗜热子囊菌多肽GH61A的情况下,使用不同蛋白加样量(用mg酶/g纤维素表示)的LDI样品(Dyadic International,Inc.,Jupiter,FL,USA)进行PCS(在pH 5.0的50mM的醋酸钠缓冲水溶液中大约11.4%的PCS和6.8%纤维素)的水解。用轨道振荡(4080 Incubator,New Brunswick Scientific,Edison,NJ,USA)以150rpm在50℃进行对PCS水解能力的测试。在水解过程的72、120和172小时采集等分试样。离心等分试样,并将上清液使用板式离心机(RT7,Thermo Fisher Scientific,Waltham,MA,USA)通过在2000rpm离心(HV 0.45μm,Millipore,Billerica,MA,USA)15分钟来过滤。当不立即使用时,将经过滤的含有糖的等分试样在-20℃下冷冻。在用0.005M H2SO4以0.4ml/min的流速从4.6×250mm的HPX-87H柱(Bio-Rad,Hercules,CA,USA)洗脱之后,在65℃下用来自经纯糖样品校准过的折射率检测器( 1100HPLC,Agilent Technologies,Santa Clara,CA,USA)的葡萄糖和纤维二糖信号的积分定量来测量稀释在0.005M H2SO4中的样品的糖浓度。所得的当量用于计算各反应的纤维素转化率百分数。
使用以下等式计算纤维素转化成葡萄糖和纤维二糖的程度(转化率,%):
转化率(%)=(葡萄糖+纤维二糖×1.053)(mg/ml)×100×162/(纤维素(mg/ml)×180)=(葡萄糖+纤维二糖×1.053)(mg/ml)×100/(纤维素(mg/ml)×1.111)
在该等式中,因子1.111反映在纤维素转化成葡萄糖时的重量增加,而因子1.053反映纤维二糖转化成葡萄糖时的重量增加。通过消化PCS以释放葡萄糖和纤维二糖的范围测定PCS中的纤维素。
在各实验之前,从贮藏在4℃的酶母液制备新鲜的酶稀释液。
表1所示的结果表明:向LDI中加入米曲霉β-葡糖苷酶产生的大约94%LDI和大约6%β-葡糖苷酶的混合物,其在7.1至43.3mg/g纤维素的蛋白质水平下,与单独使用等量的LDI的蛋白质得到的葡萄糖转化率相比,其提高了葡萄糖转化率。表1的结果表明:向LDI中加入米曲霉β-葡糖苷酶和橙色嗜热子囊菌GH61A产生的大约83%LDI与大约6%β-葡糖苷酶和大约11%GH61A蛋白质的混合物,与单独使用等量的LDI的蛋白质或FIBREZYMETM LDI与β-葡糖苷酶的混合物得到的葡萄糖转化率相比,其提高了葡萄糖转化率。将水解72小时的结果描绘在图1中。
因此,向包含LDI的溶液中加入橙色嗜热子囊菌GH61A蛋白提高了经酸预处理的玉米秸秆(PCS)水解的葡萄糖和纤维二塘的产率。产率的提高高于通过加入等量或更少量的LDI或者等量或更少量的与β-葡糖苷酶混合的LDI实现的产率提高,导致酶加样需求的减少和酶效率的提高。
生物材料的保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心,北区研究中心,1815 University Street,Peoria,Illinois,61604,并给出了下述的登录号:
保藏物 登录号 保藏日期
大肠杆菌菌株pEJG120 NRRL B-30699 2003年12月19日
大肠杆菌菌株pTter61C NRRL B-30813 2005年1月21日
大肠杆菌菌株pTter61D NRRL B-30812 2005年1月21日
大肠杆菌菌株pTter61E NRRL B-30814 2005年1月21日
大肠杆菌菌株pTter61G NRRL B-30811 2005年1月21日
大肠杆菌菌株pDZA2-7 NRRL B-30704 2004年1月30日
大肠杆菌菌株pTr3337 NRRL B-30878 2005年9月20日
大肠杆菌TOP10(pEJG113) NRRL B-30695 2003年10月17日
大肠杆菌TOP10pKKAB NRRL B-30860 2005年7月8日
NN049573 DSM 14240 2001年4月19日
所述菌株已经于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
此处,本文中所描述和要求保护的本发明在范围上并非限定于本文所公开的具体方面,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。事实上,从前面的说明中,对于本领域技术人员来说,除本文所显示和描述的之外,本发明的多种修改将是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。本文引用了多篇参考文献,将其公开的全部内容并入作为参考。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
McFarland,Keith
<120>用于增强含纤维素材料的降解或转化的组合物和方法
<130>11233.204-WO
<150>US 60/917,208
<151>2007-05-10
<160>30
<170>PatentIn version 3.5
<210>1
<211>1371
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>1
atgggtcgcg gcgctgcttt cctaggcctc gcctcgctcc tcgtgggcgc ggccaaggcc 60
cagacgcccg gcgagggcga ggaggtgcac ccgcagatca cgacgtaccg ctgcaccaag 120
gcggacgggt gcgaggagaa gaccaactac atcgtgctgg acgccctatc gcacccggtc 180
caccaggtcg acaacccgta caactgcggc gactggggcc agaagcccaa cgagacggcc 240
tgcccggacc tcgagtcgtg cgccaggaac tgcatcatgg acccggtctc ggactacggc 300
cggcacggtg tctcgaccga cggcacctcg ctgcgcctca agcagctagt cggcggcaac 360
gtcgtcagcc cgcgcgtcta cctgctcgac gagaccaagg agcgctacga gatgctcaag 420
ctgaccggca acgagttcac ctttgacgtc gacgccacca agctgccctg cggcatgaac 480
agcgccctct acctctccga gatggacgcc accggcgccc ggagcgagct caacccgggc 540
ggcgccacct ttggcaccgg ctactgcgac gcccagtgct acgtcacccc cttcatcaac 600
ggcctcggca acatcgaggg caagggcgcg tgctgcaacg agatggatat ctgggaggcc 660
aacgcgcggg cgcagcacat cgcgccgcac ccgtgcagca aggcggggcc gtacctgtgc 720
gagggcgccg agtgcgagtt cgacggcgtg tgcgacaaga acggctgcgc ctggaacccg 780
taccgggtca acgtgacgga ctactacggc gagggcgccg agttcagggt ggacacgacc 840
cggcccttct cggtcgtcac gcagttccgc gccggcggcg acgcgggggg cggcaagctc 900
gagagcatct accggctctt cgtccaggac ggcagggtga ttgagtcgta cgtcgtcgac 960
aagcccggcc tgcccccgac ggaccgcatg acggacgagt tctgcgccgc caccggcgcc 1020
gcccgcttca cggagctcgg cgccatggag gccatgggcg acgccctgac gcgcggcatg 1080
gtcctcgccc tcagcatctg gtggagcgag ggcgacaaca tgaactggct cgactcgggc 1140
gaggccggcc cctgcgaccc ggacgagggc aacccgtcca acatcatccg cgtccagccc 1200
gacccggagg tcgtcttcag caacctgcgc tggggcgaga tcggctcaac ctacgagtcc 1260
gccgtcgacg ggcccgtcgg caagggcaag ggcaagggca agggcaaggc tcccgccggc 1320
gacggcaacg ggaaggagaa gagcaatggc aagcgcttca ggaggttctg a 1371
<210>2
<211>456
<212>PRT
<213>嗜热毁丝霉
<400>2
Met Gly Arg Gly Ala Ala Phe Leu Gly Leu Ala Ser Leu Leu Val Gly
1 5 10 15
Ala Ala Lys Ala Gln Thr Pro Gly Glu Gly Glu Glu Val His Pro Gln
20 25 30
Ile Thr Thr Tyr Arg Cys Thr Lys Ala Asp Gly Cys Glu Glu Lys Thr
35 40 45
Asn Tyr Ile Val Leu Asp Ala Leu Ser His Pro Val His Gln Val Asp
50 55 60
Asn Pro TyrAs n Cys Gly Asp Trp Gly Gln Lys Pro Asn Glu Thr Ala
65 70 75 80
Cys Pro Asp Leu Glu Ser Cys Ala Arg Asn Cys Ile Met Asp Pro Val
85 90 95
Ser Asp Tyr Gly Arg His Gly Val Ser Thr Asp Gly Thr Ser Leu Arg
100 105 110
Leu Lys Gln Leu Val Gly Gly Asn Val Val Ser Pro Arg Val Tyr Leu
115 120 125
Leu Asp Glu Thr Lys Glu Arg Tyr Glu Met Leu Lys Leu Thr Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Ala Thr Lys Leu Pro Cys Gly Met Asn
145 150 155 160
Ser Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr Gly Ala Arg Ser Glu
165 170 175
Leu Asn Pro Gly Gly Ala Thr Phe Gly Thr Gly Tyr Cys Asp Ala Gln
180 185 190
Cys Tyr Val Thr Pro Phe Ile Asn Gly Leu Gly Asn Ile Glu Gly Lys
195 200 205
Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Arg Ala
210 215 220
Gln His Ile Ala Pro His Pro Cys Ser Lys Ala Gly Pro Tyr Leu Cys
225 230 235 240
Glu Gly Ala Glu Cys Glu Phe Asp Gly Val Cys Asp Lys Asn Gly Cys
245 250 255
Ala Trp Asn Pro Tyr Arg Val Asn Val Thr Asp Tyr Tyr Gly Glu Gly
260 265 270
Ala Glu Phe Arg Val Asp Thr Thr Arg Pro Phe Ser Val Val Thr Gln
275 280 285
Phe Arg Ala Gly Gly Asp Ala Gly Gly Gly Lys Leu Glu Ser Ile Tyr
290 295 300
Arg Leu Phe Val Gln Asp Gly Arg Val Ile Glu Ser Tyr Val Val Asp
305 310 315 320
Lys Pro Gly Leu Pro Pro Thr Asp Arg Met Thr Asp Glu Phe Cys Ala
325 330 335
Ala Thr Gly Ala Ala Arg Phe Thr Glu Leu Gly Ala Met Glu Ala Met
340 345 350
Gly Asp Ala Leu Thr Arg Gly Met Val Leu Ala Leu Ser Ile Trp Trp
355 360 365
Ser Glu Gly Asp Asn Met Asn Trp Leu Asp Ser Gly Glu Ala Gly Pro
370 375 380
Cys Asp Pro Asp Glu Gly Asn Pro Ser Asn Ile Ile Arg Val Gln Pro
385 390 395 400
Asp Pro Glu Val Val Phe Ser Asn Leu Arg Trp Gly Glu Ile Gly Ser
405 410 415
Thr Tyr Glu Ser Ala Val Asp Gly Pro Val Gly Lys Gly Lys Gly Lys
420 425 430
Gly Lys Gly Lys Ala Pro Ala Gly Asp Gly Asn Gly Lys Glu Lys Ser
435 440 445
Asn Gly Lys Arg Phe Arg Arg Phe
450 455
<210>3
<211>744
<212>DNA
<213>Chrysosoporium lucknowense
<400>3
atgcagccgt ttctgctctt gttcctctcg tcggtcacgg cggcgagccc cctgacggcg 60
ctcgacaagc ggcagcaggc gacgttgtgc gagcagtacg gctactggtc gggcaacggt 120
tacgaggtca acaacaacaa ctggggcaag gattcggcct cgggcggcca tcagtgcacc 180
tacgtcgaca gcagcagctc cagcggcgtc gcctggcaca cgacctggca gtgggaagga 240
ggccagaacc aggtcaagag cttcgccaac tgcggcctgc aggtgcccaa gggcaggacc 300
atctcgtcca tcagcaacct gcagacctcc atctcgtggt cctacagcaa caccaacatc 360
cgcgccaacg tggcctacga cctcttcacc gcggcagacc cgaaccacgc gaccagcagc 420
ggcgactacg agctcatgat ctggctggcg agattcggcg acgtctaccc catcggctcg 480
tcccagggcc acgtcaacgt ggccggccag gactgggagc tgtggacggg cttcaacggc 540
aacatgcggg tctacagctt cgtagcgccc agcccccgca acagcttcag cgccaacgtc 600
aaggacTTct tcaactatct ccagtccaac cagggcttcc cggccagcag ccaatacctt 660
ctcatcttcc aggcgggcac cgagcccttc accggcggcg agaccaccct taccgtcaac 720
aactactctg caagggttgc ttaa 744
<210>4
<211>247
<212>PRT
<213>Chrysosoporium lucknowense
<400>4
Met Gln Pro Phe Leu Leu Leu Phe Leu Ser Ser Val Thr Ala Ala Ser
1 5 10 15
Pro Leu Thr Ala Leu Asp Lys Arg Gln Gln Ala Thr Leu Cys Glu Gln
20 25 30
Tyr Gly Tyr Trp Ser Gly Asn Gly Tyr Glu Val Asn Asn Asn Asn Trp
35 40 45
Gly Lys Asp Ser Ala Ser Gly Gly His Gln Cys Thr Tyr Val Asp Ser
50 55 60
Ser Ser Ser Ser Gly Val Ala Trp His Thr Thr Trp Gln Trp Glu Gly
65 70 75 80
Gly Gln Asn Gln Val Lys Ser Phe Ala Asn Cys Gly Leu Gln Val Pro
85 90 95
Lys Gly Arg Thr Ile Ser Ser Ile Ser Asn Leu Gln Thr Ser Ile Ser
100 105 110
Trp Ser Tyr Ser Asn Thr Asn Ile Arg Ala Asn Val Ala Tyr Asp Leu
115 120 125
Phe Thr Ala Ala Asp Pro Asn His Ala Thr Ser Ser Gly Asp Tyr Glu
130 135 140
Leu Met Ile Trp Leu Ala Arg Phe Gly Asp Val Tyr Pro Ile Gly Ser
145 150 155 160
Ser Gln Gly His Val Asn Val Ala Gly Gln Asp Trp Glu Leu Trp Thr
165 170 175
Gly Phe Asn Gly Asn Met Arg Val Tyr Ser Phe Val Ala Pro Ser Pro
180 185 190
Arg Asn Ser Phe Ser Ala Asn Val Lys Asp Phe Phe Asn Tyr Leu Gln
195 200 205
Ser Asn Gln Gly Phe Pro Ala Ser Ser Gln Tyr Leu Leu Ile Phe Gln
210 215 220
Ala Gly Thr Glu Pro Phe Thr Gly Gly Glu Thr Thr Leu Thr Val Asn
225 230 235 240
Asn Tyr Ser Ala Arg Val Ala
245
<210>5
<211>678
<212>DNA
<213>Chrysosoporium lucknowense
<400>5
atgcatctct ccgccaccac cgggttcctc gccctcccgg ccctggccct ggcccagctc 60
tcgggcagcg gccagacgac ccggtactgg gactgctgca agccgagctg cgcctggccc 120
ggcaagggcc cctcgtctcc ggtgcaggcc tgcgacaaga acgacaaccc gctcaacgac 180
ggcggctcca cccggtccgg ctgcgacgcg ggcggcagcg cctacatgtg ctcctcccag 240
agcccctggg ccgtcagcga cgagctgtcg tacggctggg cggccgtcaa gctcgccggc 300
agctccgagt cgcagtggtg ctgcgcctgc tacgagctga ccttcaccag cgggccggtc 360
gcgggcaaga agatgattgt gcaggcgacc aacaccggtg gcgacctggg cgacaaccac 420
tttgacctgg ccatccccgg tggcggtgtc ggtattttca acgcctgcac cgaccagtac 480
ggcgctcccc cgaacggctg gggcgaccgc tacggcggca tccattccaa ggaagagtgc 540
gaatccttcc cggaggccct caagcccggc tgcaactggc gcttcgactg gttccaaaac 600
gccgacaacc cgtcggtcac cttccaggag gtggcctgcc cgtcggagct cacgtccaag 660
agcggctgct cccgttaa 678
<210>6
<211>225
<212>PRT
<213>Chrysosoporium lucknowense
<400>6
Met His Leu Ser Ala Thr Thr Gly Phe Leu Ala Leu Pro Ala Leu Ala
1 5 10 15
Leu Ala Gln Leu Ser Gly Ser Gly Gln Thr Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Ala Trp Pro Gly Lys Gly Pro Ser Ser Pro Val
35 40 45
Gln Ala Cys Asp Lys Asn Asp Asn Pro Leu Asn Asp Gly Gly Ser Thr
50 55 60
Arg Ser Gly Cys Asp Ala Gly Gly Ser Ala Tyr Met Cys Ser Ser Gln
65 70 75 80
Ser Pro Trp Ala Val Ser Asp Glu Leu Ser Tyr Gly Trp Ala Ala Val
85 90 95
Lys Leu Ala Gly Ser Ser Glu Ser Gln Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Ile Val Gln
115 120 125
Ala Thr Asn Thr Gly Gly Asp Leu Gly Asp Asn His Phe Asp Leu Ala
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asn Ala Cys Thr Asp Gln Tyr
145 150 155 160
Gly Ala Pro Pro Asn Gly Trp Gly Asp Arg Tyr Gly Gly Ile His Ser
165 170 175
Lys Glu Glu Cys Glu Ser Phe Pro Glu Ala Leu Lys Pro Gly Cys Asn
180 185 190
Trp Arg Phe Asp Trp Phe Gln Asn Ala Asp Asn Pro Ser Val Thr Phe
195 200 205
Gln Glu Val Ala Cys Pro Ser Glu Leu Thr Ser Lys Ser Gly Cys Ser
210 215 220
Arg
225
<210>7
<211>1648
<212>DNA
<213>Chrysosoporium lucknowense
<220>
<221>misc_feature
<222>(1162)..(1162)
<223>NA、C、G或T
<400>7
atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tcagaacgcc 60
tgcactctga ccgctgagaa ccacccctcg ctgacgtggt ccaagtgcac gtctggcggc 120
agctgcacca gcgtccaggg ttccatcacc atcgacgcca actggcggtg gactcaccgg 180
accgatagcg ccaccaactg ctacgagggc aacaagtggg atacttcgta ctgcagcgat 240
ggtccttctt gcgcctccaa gtgctgcatc gacggcgctg actactcgag cacctatggc 300
atcaccacga gcggtaactc cctgaacctc aagttcgtca ccaagggcca gtactcgacc 360
aacatcggct cgcgtaccta cctgatggag agcgacacca agtaceagag taagttcctc 420
tcgcacccgg ccgccgggag atgatggcgc ccagcccgct gacgcgaatg acacagtgtt 480
ccagctcctc ggcaacgagt tcaccttcga tgtcgacgtc tccaacctcg gctgcggcct 540
caatggcgcc ctctacttcg tgtccatgga tgccgatggt ggcatgtcca agtactcggg 600
caacaaggca ggtgccaagt acggtaccgg ctactgtgat tctcagtgcc cccgcgacct 660
caagttcatc aacggcgagg ccaacgtaga gaactggcag agctcgacca acgatgccaa 720
cgccggcacg ggcaagtacg gcagctgctg ctccgagatg gacgtctggg aggccaacaa 780
catggccgcc gccttcactc cccacccttg caccgtgatc ggccagtcgc gctgcgaggg 840
cgactcgtgc ggcggtacct acagcaccga ccgctatgcc ggcatctgcg accccgacgg 900
atgcgacttc aactcgtacc gccagggcaa caagaccttc tacggcaagg gcatgacggt 960
cgacacgacc aagaagatca cggtcgtcac ccagttcctc aagaactcgg ccggcgagct 1020
ctccgagatc aagcggttct acgtccagaa cggcaaggtc atccccaact ccgagtccac 1080
catcccgggc gtcgagggca actccatcac ccaggactgg tgcgaccgcc agaaggccgc 1140
cttcggcgac gtgaccgact tncaggacaa gggcggcatg gtccagatgg gcaaggccct 1200
cgcggggccc atggtcctcg tcatgtccat ctgggacgac cacgccgtca acatgctctg 1260
gctcgactcc acctggccca tcgacggcgc cggcaagccg ggcgccgagc gcggtgcctg 1320
ccccaccacc tcgggcgtcc ccgctgaggt cgaggccgag gcccccaact ccaacgtcat 1380
cttctccaac atccgcttcg gccccatcgg ctccaccgtc tccggcctgc ccgacggcgg 1440
cagcggcaac cccaacccgc ccgtcagctc gtccaccccg gtcccctcct cgtccaccac 1500
atcctccggt tcctccggcc cgactggcgg cacgggtgtc gctaagcact atgagcaatg 1560
cggaggaatc gggttcactg gccctaccca gtgcgagagc ccctacactt gcaccaagct 1620
gaatgactgg tactcgcagt gcctgtaa 1648
<210>8
<211>526
<212>PRT
<213>Chrysosoporium lucknowense
<220>
<221>MISC_FEATURE
<222>(365)..(365)
<223>X=任何氨基酸
<400>8
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala
1 5 10 15
Ala Gln Asn Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
20 25 30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Gln Gly Ser
35 40 45
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Arg Thr Asp Ser Ala
50 55 60
Thr Asn Cys Tyr Glu Gly Asn Lys Trp Asp Thr Ser Tyr Cys Ser Asp
65 70 75 80
Gly Pro Ser Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Asp Tyr Ser
85 90 95
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ser Leu Ash Leu Lys Phe
100 105 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Asn Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
165 170 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu
195 200 205
Asn Trp Gln Ser Ser Thr Asn Asp Ala Asn Ala Gly Thr Gly Lys Tyr
210 215 220
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala
225 230 235 240
Ala Ala Phe Thr Pro His Pro Cys Trp Val Ile Gly Gln Ser Arg Cys
245 250 255
Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
260 265 270
Ile Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn
275 280 285
Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile
290 295 300
Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu
325 330 335
Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys
340 345 350
Asp Arg Gln Lys Ala Ala Phe Gly Asp Val Thr Asp Xaa Gln Asp Lys
355 360 365
Gly Gly Met Val Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu
370 375 380
Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Trp Pro Ile Asp Gly Ala Gly Lys Pro Gly Ala Glu Arg Gly
405 410 415
Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala
420 425 430
Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
Ser Thr Val Ser Gly Leu Pro Asp Gly Gly Ser Gly Asn Pro Asn Pro
450 455 460
Pro Val Ser Ser Ser Thr Pro Val Pro Ser Ser Ser Thr Thr Ser Ser
465 470 475 480
Gly Ser Ser Gly Pro Thr Gly Gly Thr Gly Val Ala Lys His Tyr Glu
485 490 495
Gln Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Ser Pro
500 505 510
Tyr Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210>9
<211>1353
<212>DNA
<213>嗜热毁丝霉
<400>9
atgaagcagt acctccagta cctcgcggcg accctgcccc tggtgggcct ggccacggcc 60
cagcaggcgg gtaacctgca gaccgagact caccccaggc tcacttggtc caagtgcacg 120
gccccgggat cctgccaaca ggtcaacggc gaggtcgtca tcgactccaa ctggcgctgg 180
gtgcacgacg agaacgcgca gaactgctac gacggcaacc agtggaccaa cgcttgcagc 240
tctgccaccg actgcgccga gaattgcgcg ctcgagggtg ccgactacca gggcacctat 300
ggcgcctcga ccagcggcaa tgccctgacg ctcaccttcg tcactaagca cgagtacggc 360
accaacattg gctcgcgcct ctacctcatg aacggcgcga acaagtacca gatgttcacc 420
ctcaagggca acgagctggc cttcgacgtc gacctctcgg ccgtcgagtg cggcctcaac 480
agcgccctct acttcgtggc catggaggag gatggcggtg tgtcgagcta cccgaccaac 540
acggccggtg ctaagttcgg cactgggtac tgcgacgccc aatgcgcacg cgacctcaag 600
ttcgtcggcg gcaagggcaa catcgagggc tggaagccgt ccaccaacga tgccaatgcc 660
ggtgtcggtc cttatggcgg gtgctgcgct gagatcgacg tctgggagtc gaacaagtat 720
gctttcgctt tcaceccgca cggttgcgag aaccctaaat accacgtctg cgagaccacc 780
aactgcggtg gcacctactc cgaggaccgc ttcgctggtg actgcgatgc caacggctgc 840
gactacaacc cctaccgcat gggcaaccag gacttctacg gtcccggctt gacggtcgat 900
accagcaaga agttcaccgt cgtcagccag ttcgaggaga acaagctcac ccagttcttc 960
gtccaggacg gcaagaagat tgagatcccc ggccccaagg tcgagggcat cgatgcggac 1020
agcgccgcta tcacccctga gctgtgcagt gccctgttca aggccttcga tgaccgtgac 1080
cgcttctcgg aggttggcgg cttcgatgcc atcaacacgg ccctcagcac tcccatggtc 1140
ctcgtcatgt ccatctggga tgatcactac gccaatatgc tctggctcga ctcgagctac 1200
ccccctgaga aggctggcca gcctggcggt gaccgtggcc cgtgtcctca ggactctggc 1260
gtcccggccg acgttgaggc tcagtaccct aatgccaagg tcatctggtc caacatccgc 1320
ttcggcccca tcggctcgactgt caacgtc taa 1353
<210>10
<211>450
<212>PRT
<213>嗜热毁丝霉
<400>10
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
1 5 10 15
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
20 25 30
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
35 40 45
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
50 55 60
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
65 70 75 80
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
85 90 95
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
100 105 110
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
115 120 125
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
130 135 140
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
145 150 155 160
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
165 170 175
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
195 200 205
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
210 215 220
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
225 230 235 240
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
245 250 255
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
260 265 270
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
275 280 285
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
290 295 300
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
305 310 315 320
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
325 330 335
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
340 345 350
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
355 360 365
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
370 375 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385 390 395 400
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
405 410 415
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
420 425 430
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
435 440 445
Asn Val
450
<210>11
<211>1800
<212>DNA
<213>土生羧孢霉(Thielavia terrestris)
<400>11
aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga 60
tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg 120
gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg 180
ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc 240
atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac 300
gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc 360
ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc 420
acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg 480
caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac 540
ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc 600
cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc 660
tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac 720
gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc 780
gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc 840
gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc 900
ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc 960
atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac 1020
gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg 1080
gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc 1140
gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc 1200
ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg 1260
tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct 1320
ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga 1380
gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata 1440
tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt 1500
ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg 1560
ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg 1620
gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg 1680
agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc 1740
atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg 1800
<210>12
<211>326
<212>PRT
<213>土生羧孢霉
<400>12
Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu
1 5 10 15
Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp
20 25 30
Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr
35 40 45
Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro
50 55 60
Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met
65 70 75 80
His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly
85 90 95
Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala
100 105 110
Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser
115 120 125
Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly
130 135 140
Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro
145 150 155 160
Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala
165 170 175
Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys
180 185 190
Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val
195 200 205
Asn Phc Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn
210 215 220
Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr
225 230 235 240
Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu
245 250 255
Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro
260 265 270
Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly
275 280 285
Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly
290 295 300
Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro
305 310 315 320
Tyr Tyr Ser Gln Cys Leu
325
<210>13
<211>880
<212>DNA
<213>土生羧孢霉
<400>13
accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc 60
cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat 120
catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac 180
gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg 240
ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac 300
ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg 360
ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct 420
gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac 480
cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca 540
cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct 600
ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt 660
ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct 720
ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct 780
acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg 840
gctacgaggg gaaggcatct gttcgcatga gcgtgggtac 880
<210>14
<211>478
<212>PRT
<213>土生羧孢霉
<400>14
Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala
1 5 10 15
Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro
20 25 30
Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr
35 40 45
Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met
50 55 60
Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala
65 70 75 80
Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly
85 90 95
Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser
100 105 110
His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp
115 120 125
Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys
130 135 140
Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn
145 150 155 160
Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro
165 170 175
Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser
180 185 190
Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro
195 200 205
Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr
210 215 220
Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe Met
225 230 235 240
Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala Gly
245 250 255
His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro Gly
260 265 270
Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr Gln
275 280 285
Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met Arg
290 295 300
Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala Gly
305 310 315 320
Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly Pro
325 330 335
Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser His
340 345 350
Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp Gly
355 360 365
Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys Thr
370 375 380
Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr
385 390 395 400
Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro Gln
405 410 415
Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser Ala
420 425 430
Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro Gln
435 440 445
Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr Ser
450 455 460
Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe
465 470 475
<210>15
<211>1000
<212>DNA
<213>土生羧孢霉
<400>15
ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag 60
agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg 120
cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag 180
ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc 240
agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac 300
tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc 360
accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg 420
cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt 480
gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc 540
aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc 600
aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc 660
cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag 720
gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc 780
ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac 840
tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc 900
atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag 960
gcccgggact tcaccgcctg aagttgttga atcgatggag 1000
<210>16
<211>516
<212>PRT
<213>土生羧孢霉
<400>16
Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly
1 5 10 15
Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn
20 25 30
Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile
35 40 45
Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser
50 55 60
Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala
65 70 75 80
Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser
85 90 95
Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser
100 105 110
Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly
115 120 125
Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser
130 135 140
Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser
145 150 155 160
Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu
165 170 175
Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys
180 185 190
Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser
195 200 205
Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile
210 215 220
Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro
225 230 235 240
Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe
245 250 255
Thr Ala Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala
260 265 270
Ser Gly Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly
275 280 285
Lys Asn Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn
290 295 300
Val Ile Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser
305 310 315 320
Asp Ser Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala
325 330 335
Thr Ala Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr
340 345 350
His Ser Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser
355 360 365
Phe Ser Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu
370 375 380
Ala Gly Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn
385 390 395 400
Pro Ser Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp
405 410 415
Ser Ser Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg
420 425 430
His Glu Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro
435 440 445
Glu Cys Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp
450 455 460
Ala Ser Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro
465 470 475 480
Asn Ile Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys
485 490 495
Ile Pro Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg
500 505 510
Asp Phe Thr Ala
515
<210>17
<211>681
<212>DNA
<213>土生羧孢霉
<400>17
atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac 60
acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg 120
caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc 180
ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc 240
aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc 300
gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat 360
cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc 420
atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac 480
gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc 540
ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg 600
gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc 660
ccggccgtct tcagctgctg a 681
<210>18
<211>452
<212>PRT
<213>土生羧孢霉
<400>18
Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val
1 5 10 15
Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln
20 25 30
Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp
35 40 45
Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala
50 55 60
Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala
65 70 75 80
Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg
85 90 95
Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val
100 105 110
Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr
115 120 125
Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys
130 135 140
Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His
145 150 155 160
Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala
180 185 190
Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile
195 200 205
Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe
210 215 220
Ser Cys Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu
225 230 235 240
Gly Val Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp
245 250 255
Trp Gln Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val
260 265 270
Gly Asp Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser
275 280 285
Pro Ala Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr
290 295 300
Trp Ala Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met
305 310 315 320
Ala Arg Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly
325 330 335
Ala Val Trp Phe Lys ValTyr Glu Asp Hi s Pro Thr Phe Gly Ala Gln
340 345 350
Leu Thr Trp Pro SerThr Gl y Lys Ser Ser Phe Ala Val Pro Ile Pro
355 360 365
Pro Cys Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly
370 375 380
Leu His Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys
385 390 395 400
Ala Gln Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys
405 410 415
Val Ala Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile
420 425 430
Asn Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala
435 440 445
Val Phe Ser Cys
450
<210>19
<211>960
<212>DNA
<213>土生羧孢霉
<400>19
atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat 60
tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc 120
aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat 180
gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc 240
ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc 300
ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc 360
ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac 420
atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac 480
aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc 540
ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc 600
gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg 660
gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg 720
cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg 780
acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg 840
tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac 900
tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc 960
<210>20
<211>608
<212>PRT
<213>土生羧孢霉
<400>20
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
1 5 10 15
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
20 25 30
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
35 40 45
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
50 55 60
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
65 70 75 80
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
85 90 95
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
100 105 110
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
115 120 125
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
130 135 140
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
145 150 155 160
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
180 185 190
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
195 200 205
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
210 215 220
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
225 230 235 240
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
245 250 255
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
260 265 270
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
275 280 285
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
290 295 300
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
305 310 315 320
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
325 330 335
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
340 345 350
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
355 360 365
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
370 375 380
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
385 390 395 400
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
405 410 415
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
420 425 430
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
435 440 445
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
450 455 460
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
465 470 475 480
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
485 490 495
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
500 505 510
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
515 520 525
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
530 535 540
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
545 550 555 560
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
565 570 575
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
580 585 590
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
595 600 605
<210>21
<211>799
<212>DNA
<213>橙色嗜热子囊菌(Thermoascus aurantiacus)
<400>21
atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60
ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120
acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180
atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240
tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300
agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360
tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420
tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480
caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540
caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600
tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660
cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720
cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780
tcctctgtat actggtt aa 799
<210>22
<211>250
<212>PRT
<213>橙色嗜热子囊菌
<400>22
Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
20 25 30
Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser
35 40 45
Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly
50 55 60
Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg
65 70 75 80
Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr
85 90 95
Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val
100 105 110
Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys
115 120 125
Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp
130 135 140
Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn
145 150 155 160
Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly
195 200 205
Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp
210 215 220
Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr
225 230 235 240
Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly
245 250
<210>23
<211>1172
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>23
ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc 60
cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca 120
gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc 180
tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc 240
cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg 300
cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt 360
tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg 420
ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct 480
gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta 540
tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa 600
ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg 660
aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac 720
aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta 780
cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag 840
gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga 900
acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac 960
cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga 1020
atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac 1080
atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa 1140
acactacatg taaaaaaaaa aaaaaaaaaa aa 1172
<210>24
<211>249
<212>PRT
<213>里氏木霉
<400>24
Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser
1 5 10 15
Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr
20 25 30
Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly
35 40 45
His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly
50 55 60
Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys
65 70 75 80
Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn
85 90 95
Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro
100 105 110
Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn
115 120 125
Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr
130 135 140
Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys
145 150 155 160
Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe
165 170 175
Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met
180 185 190
Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr
195 200 205
Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr
210 215 220
Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr
225 230 235 240
Ile Pro Gly Pro Ala Leu Trp Gln Gly
245
<210>25
<211>2771
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>25
ctgttctgct ggttacctgc cacgttatca tgaagcttgg ttggatcgag gtggccgcat 60
tggcggctgc ctcagtagtc agtgccaagg atgatctcgc gtactcccct cctttctacc 120
cttccccatg ggcagatggt cagggtgaat gggcggaagt atacaaacgc gctgtagaca 180
tagtttccca gatgacgttg acagagaaag tcaacttaac gactggaaca ggatggcaac 240
tagagaggtg tgttggacaa actggcagtg ttcccagact caacatcccc agcttgtgtt 300
tgcaggatag tcctcttggt attcgtttct cggactacaa ttcagctttc cctgcgggtg 360
ttaatgtcgc tgccacctgg gacaagacgc tcgcctacct tcgtggtcag gcaatgggtg 420
aggagttcag tgataagggt attgacgttc agctgggtcc tgctgctggc cctctcggtg 480
ctcatccgga tggcggtaga aactgggaag gtttctcacc agatccagcc ctcaccggtg 540
tactttttgc ggagacgatt aagggtattc aagatgctgg tgtcattgcg acagctaagc 600
attatatcat gaacgaacaa gagcatttcc gccaacaacc cgaggctgcg ggttacggat 660
tcaacgtaag cgacagtttg agttccaacg ttgatgacaa gactatgcat gaattgtacc 720
tctggccctt cgcggatgca gtacgcgctg gagtcggtgc tgtcatgtgc tcttacaacc 780
aaatcaacaa cagctacggt tgcgagaata gcgaaactct gaacaagctt ttgaaggcgg 840
agcttggttt ccaaggcttc gtcatgagtg attggaccgc tcatcacagc ggcgtaggcg 900
ctgctttagc aggtctggat atgtcgatgc ccggtgatgt taccttcgat agtggtacgt 960
ctttctgggg tgcaaacttg acggtcggtg tccttaacgg tacaatcccc caatggcgtg 1020
ttgatgacat ggctgtccgt atcatggccg cttattacaa ggttggccgc gacaccaaat 1080
acacccctcc caacttcagc tcgtggacca gggacgaata tggtttcgcg cataaccatg 1140
tttcggaagg tgcttacgag agggtcaacg aattcgtgga cgtgcaacgc gatcatgccg 1200
acctaatccg tcgcatcggc gcgcagagca ctgttctgct gaagaacaag ggtgccttgc 1260
ccttgagccg caaggaaaag ctggtcgccc ttctgggaga ggatgcgggt tccaactcgt 1320
ggggcgctaa cggctgtgat gaccgtggtt gcgataacgg tacccttgcc atggcctggg 1380
gtagcggtac tgcgaatttc ccatacctcg tgacaccaga gcaggcgatt cagaacgaag 1440
ttcttcaggg ccgtggtaat gtcttcgccg tgaccgacag ttgggcgctc gacaagatcg 1500
ctgcggctgc ccgccaggcc agcgtatctc tcgtgttcgt caactccgac tcaggagaaa 1560
gctatcttag tgtggatgga aatgagggcg atcgtaacaa catcactctg tggaagaacg 1620
gcgacaatgt ggtcaagacc gcagcgaata actgtaacaa caccgtggtc atcatccact 1680
ccgtcggacc agttttgatc gatgaatggt atgaccaccc caatgtcact ggtattctct 1740
gggctggtct gccaggccag gagtctggta actccatcgc cgatgtgctg tacggtcgtg 1800
tcaaccctgg cgccaagtct cctttcactt ggggcaagac ccgggagtcg tatggttctc 1860
ccttggtcaa ggatgccaac aatggcaacg gagcgcccca gtctgatttc acccagggtg 1920
ttttcatcga ttaccgccat ttcgataagt tcaatgagac ccctatctac gagtttggct 1980
acggcttgag ctacaccacc ttcgagctct ccgacctcca tgttcagccc ctgaacgcgt 2040
cccgatacac tcccaccagt ggcatgactg aagctgcaaa gaactttggt gaaattggcg 2100
atgcgtcgga gtacgtgtat ccggaggggc tggaaaggat ccatgagttt atctatccct 2160
ggatcaactc taccgacctg aaggcatcgt ctgacgattc taactacggc tgggaagact 2220
ccaagtatat tcccgaaggc gccacggatg ggtctgccca gccccgtttg cccgctagtg 2280
gtggtgccgg aggaaacccc ggtctgtacg aggatctttt ccgcgtctct gtgaaggtca 2340
agaacacggg caatgtcgcc ggtgatgaag ttcctcagct gtacgtttcc ctaggcggcc 2400
cgaatgagcc caaggtggta ctgcgcaagt ttgagcgtat tcacttggcc ccttcgcagg 2460
aggccgtgtg gacaacgacc cttacccgtc gtgaccttgc aaactgggac gtttcggctc 2520
aggactggac cgtcactcct taccccaaga cgatctacgt tggaaactcc tcacggaaac 2580
tgccgctcca ggcctcgctg cctaaggccc agtaaggggc aagtcctgat tgtacagagc 2640
atttcgagat ttatgatgta catgtttatg aatgacctag ggtagggtaa tacttagtag 2700
ggttagttct aattcttgga gtcaagtatt gactcactgg gccgataaaa aaaaaaaaaa 2760
aaaaaaaaaa a 2771
<210>26
<211>861
<212>PRT
<213>米曲霉
<400>26
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Ser Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lrs Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Th rLeu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>27
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>27
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210>28
<211>863
<212>PRT
<213>烟曲霉
<400>28
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Se rGlu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
4654 70 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Tle Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210>29
<211>2800
<212>DNA
<213>巴西青霉(Penieillium brasilianum)
<400>29
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220
caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat 2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800
<210>30
<211>878
<212>PRT
<213>巴西青霉
<400>30
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1 5 10 15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
20 25 30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
35 40 45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
50 55 60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65 70 75 80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
85 90 95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
100 105 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
115 120 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
130 135 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145 150 155 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
165 170 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
180 185 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
195 200 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
210 215 220
Gl y Hi s Gly TyrThr Ile Ser Asp ThrIle Ser Ser Asn Ile Asp Asp
225 230 235 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
245 250 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
260 265 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
275 280 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
290 295 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305 310 315 320
Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
325 330 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
340 345 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
355 360 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
370 375 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385 390 395 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
405 410 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
420 425 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
435 440 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
450 455 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465 470 475 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
485 490 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
500 505 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
515 520 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
530 535 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545 550 555 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
565 570 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
580 585 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
595 600 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
610 615 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625 630 635 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
645 650 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
660 665 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
675 680 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
690 695 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705 710 715 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
725 730 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
740 745 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
755 760 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
770 775 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785 790 795 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
805 810 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
820 825 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
835 840 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
850 855 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865 870 875
49
Claims (29)
1.用于降解或转化含纤维素材料的方法,其包括:用有效量的纤维素分解酶组合物处理含纤维素材料,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组份:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQ ID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;并且
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加。
2.权利要求1的方法,其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO:2的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ ID NO:4的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO:6的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO:8的成熟多肽或其具有纤维二糖水解酶活性的片段,以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO:10的成熟多肽或其具有纤维二糖水解酶活性的片段。
3.权利要求1的方法,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸,并且X(4)是在4个邻接位置上的任何氨基酸;和
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]的具有增强纤维素分解的活性的多肽,其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸,并且x(3)是在3个邻接位置上的任何氨基酸。
4.权利要求3的方法,其中所述包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸,并且X(2)是在2个邻接位置上的任何氨基酸。
5.权利要求1的方法,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)多肽,其包含与SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQIDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:17、SEQ ID NO:19或SEQ IDNO:23的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和
(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽。
6.权利要求1的方法,其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽;或者其具有增强纤维素分解的活性的片段。
7.权利要求1的方法,其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码,该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中,在大肠杆菌NRRL B-30813中所含的质粒pTter61C中,在大肠杆菌NRRL B-30812中所含的质粒pTter61D中,在大肠杆菌NRRL B-30814中所含的质粒pTter61E中,在大肠杆菌NRRL B-30811中所含的质粒pTter61G中,在大肠杆菌NRRL B-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。
8.权利要求1-7中任一项的方法,其中所述组合物进一步包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。
9.权利要求1-8中任一项的方法,其中所述组合物进一步包含有效量的选自下组中的一种或多种(几种)酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
10.权利要求1-9中任一项的方法,其进一步包括回收降解或转化的含纤维素材料。
11.用于生产物质的方法,其包括:
(A)用有效量的纤维素分解酶组合物将含纤维素材料糖化,该纤维素分解酶组合物包含具有增强纤维素分解活性的多肽,和选自下组中一种或多种(几种)组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQ ID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;并且
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加;
(B)用一种或多种(几种)发酵微生物发酵步骤(a)中的糖化的含纤维素材料以产生发酵产物;和
(C)回收发酵产物。
12.权利要求11的方法,其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO:2的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ IDNO:4的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO:6的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO:8的成熟多肽或其具有纤维二糖水解酶活性的片段,以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO:10的成熟多肽或其具有纤维二糖水解酶活性的片段。
13.权利要求11的方法,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸,并且X(4)是在4个邻接位置上的任何氨基酸;和
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ],其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸,并且x(3)是在3个邻接位置上的任何氨基酸。
14.权利要求13的方法,其中所述包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸,并且X(2)是在2个邻接位置上的任何氨基酸。
15.权利要求11的方法,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)多肽,其包含与SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:17、SEQ ID NO:19或SEQ IDNO:23的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和
(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽。
16.权利要求11的方法,其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽;或者其具有增强纤维素分解的活性的片段。
17.权利要求11的方法,其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码,该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中,在大肠杆菌NRRL B-30813中所含的质粒pTter61C中,在大肠杆菌NRRL B-30812中所含的质粒pTter61D中,在大肠杆菌NRRL B-30814中所含的质粒pTter61E中,在大肠杆菌NRRLB-30811中所含的质粒pTter61G中,在大肠杆菌NRRLB-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。
18.权利要求11-17中任一项的方法,其中所述组合物进一步包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。
19.权利要求11-18中任一项的方法,其中所述组合物进一步包含有效量的选自下组中的一种或多种(几种)酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
20.权利要求11-19中任一项的方法,其中所述发酵产物为醇、有机酸、酮、醛、氨基酸或气体。
21.纤维素分解酶组合物,其包含有效量的具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组分:具有内切葡聚糖酶活性的CEL7多肽、具有具有内切葡聚糖酶活性的CEL12多肽、具有具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQ ID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;以及
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加。
22.权利要求21的纤维素酶组合物,其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO:2的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ ID NO:4的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO:6的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO:8的成熟多肽或其具有纤维二糖水解酶活性的片段,以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO:10的成熟多肽或其具有纤维二糖水解酶活性的片段。
23.权利要求21的纤维素分解酶组合物,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸,并且X(4)是在4个邻接位置上的任何氨基酸;和
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ],其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸,并且x(3)是在3个邻接位置上的任何氨基酸。
24.权利要求23的纤维素分解酶组合物,其中所述包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸,并且X(2)是在2个邻接位置上的任何氨基酸。
25.权利要求21的纤维素分解酶组合物,其中所述具有增强纤维素分解活性的多肽选自下组:
(a)多肽,其包含与SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQIINO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:17、SEQ ID NO:19或SEQ IDNO:23的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和
(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQIDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽。
26.权利要求21的纤维素分解酶组合物,其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽;或者其具有增强纤维素分解的活性的片段。
27.权利要求21的纤维素分解酶组合物,其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码,该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中,在大肠杆菌NRRL B-30813中所含的质粒pTter61C中,在大肠杆菌NRRL B-30812中所含的质粒pTter61D中,在大肠杆菌NRRL B-30814中所含的质粒pTter61E中,在大肠杆菌NRRL B-30811中所含的质粒pTter61G中,在大肠杆菌NRRL B-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。
28.权利要求21-27中任一项的纤维素分解酶组合物,其进一步包含有效量的一种或多种(几种)具有β-葡糖苷酶活性的多肽。
29.权利要求21-28中任一项的纤维素分解酶组合物,进一步包含有效量的选自下组中的一种或多种(几种)酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶或者其混合物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510280545.7A CN104962537A (zh) | 2007-05-10 | 2008-05-09 | 用于增强含纤维素材料的降解或转化的组合物和方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US91720807P | 2007-05-10 | 2007-05-10 | |
US60/917,208 | 2007-05-10 | ||
PCT/US2008/005927 WO2008140749A2 (en) | 2007-05-10 | 2008-05-09 | Compositions and methods for enhancing the degradation or conversion of cellulose-containing material |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510280545.7A Division CN104962537A (zh) | 2007-05-10 | 2008-05-09 | 用于增强含纤维素材料的降解或转化的组合物和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101855345A true CN101855345A (zh) | 2010-10-06 |
Family
ID=39672097
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880024110A Pending CN101855345A (zh) | 2007-05-10 | 2008-05-09 | 用于增强含纤维素材料的降解或转化的组合物和方法 |
CN201510280545.7A Pending CN104962537A (zh) | 2007-05-10 | 2008-05-09 | 用于增强含纤维素材料的降解或转化的组合物和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510280545.7A Pending CN104962537A (zh) | 2007-05-10 | 2008-05-09 | 用于增强含纤维素材料的降解或转化的组合物和方法 |
Country Status (6)
Country | Link |
---|---|
US (3) | US8999696B2 (zh) |
EP (1) | EP2069491B1 (zh) |
CN (2) | CN101855345A (zh) |
BR (1) | BRPI0811465A2 (zh) |
DK (1) | DK2069491T3 (zh) |
WO (1) | WO2008140749A2 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103261430A (zh) * | 2010-12-20 | 2013-08-21 | 纳幕尔杜邦公司 | 靶向过水解酶 |
CN103502444A (zh) * | 2011-03-17 | 2014-01-08 | 丹尼斯科美国公司 | 糖基水解酶及其在生物质水解方面的用途 |
CN112272701A (zh) * | 2018-04-19 | 2021-01-26 | 诺维信公司 | 稳定化的纤维素酶变体 |
CN113215135A (zh) * | 2021-06-17 | 2021-08-06 | 福建中烟工业有限责任公司 | 一种内切葡聚糖酶在卷烟原料改良中的应用 |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1980953B (zh) * | 2004-01-30 | 2014-12-24 | 诺维信股份有限公司 | 具有分解纤维增强活性的多肽及其编码多核苷酸 |
US9012186B2 (en) | 2009-04-27 | 2015-04-21 | The Board Of Trustees Of The University Of Illinois | Hemicellulose-degrading enzymes |
AU2010253848C1 (en) * | 2009-05-29 | 2015-02-19 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
JP5745404B2 (ja) | 2009-07-03 | 2015-07-08 | Meiji Seikaファルマ株式会社 | 2種類の異なる微生物に由来するエンドグルカナーゼを含んでなるセルラーゼ調製物 |
CA2767169A1 (en) | 2009-07-07 | 2011-01-13 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
DK3296394T3 (da) | 2009-09-23 | 2020-12-21 | Danisco Us Inc | Hidtil ukendte glycosylhydrolaseenzymer og anvendelser heraf |
EP2977382A3 (en) * | 2009-09-30 | 2016-05-11 | Novozymes Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
CN102041252B (zh) * | 2009-10-26 | 2015-12-02 | 复旦大学 | 高效内切葡聚糖酶RuCelB,其编码基因、制备方法与应用 |
DK2496694T3 (en) * | 2009-11-06 | 2017-06-06 | Novozymes Inc | COMPOSITIONS FOR SACCHARIFYING CELLULOS MATERIAL |
AU2010333801B2 (en) | 2009-12-23 | 2015-12-17 | Danisco Us Inc. | Methods for improving the efficiency of simultaneous saccharification and fermentation reactions |
CN102939376B (zh) * | 2010-03-31 | 2016-07-06 | 明治制果药业株式会社 | 新纤维素酶基因 |
US9598700B2 (en) | 2010-06-25 | 2017-03-21 | Agrivida, Inc. | Methods and compositions for processing biomass with elevated levels of starch |
US10443068B2 (en) | 2010-06-25 | 2019-10-15 | Agrivida, Inc. | Plants with engineered endogenous genes |
ES2628345T3 (es) * | 2010-06-29 | 2017-08-02 | Dsm Ip Assets B.V. | Polipéptido que tiene o que ayuda en la actividad de degradación de materiales glucídicos y usos del mismo |
EP2405008A1 (en) * | 2010-07-06 | 2012-01-11 | LanthioPep B.V. | Bacterial surface display of thioether-bridge-containing peptides |
MX2013007048A (es) * | 2010-12-30 | 2013-07-29 | Novozymes As | Metodo para el tratamiento de textiles con endoglucanasa. |
CN106244622B (zh) | 2011-03-07 | 2020-06-12 | 谷万达公司 | 在工程植物中表达多种蛋白的表达盒和表达载体及制备工程植物和生产可溶性糖的方法 |
RU2013146245A (ru) | 2011-03-17 | 2015-04-27 | ДАНИСКО ЮЭс ИНК. | Способ уменьшения вязкости в процессе осахаривания |
EP2780450A4 (en) * | 2011-11-15 | 2015-09-09 | Novozymes Inc | POLYPEPTIDES HAVING CELLOBIOHYDROLASE ACTIVITY AND POLYNUCLEOTIDES ENCODING SAME |
US9738874B2 (en) * | 2011-12-16 | 2017-08-22 | Novozymes Inc. | Polypeptides having laccase activity and polynucleotides encoding same |
JP5844823B2 (ja) | 2012-01-06 | 2016-01-20 | 本田技研工業株式会社 | 糖化酵素組成物及びそれを用いる糖化溶液の製造方法 |
FI124477B (en) | 2012-06-07 | 2014-09-15 | Roal Oy | New proteins for the treatment of cellulose materials |
US9458440B2 (en) | 2012-06-07 | 2016-10-04 | Roal Oy | Proteins for the treatment of cellulosic material |
US8759040B1 (en) * | 2013-02-12 | 2014-06-24 | Novozymes Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU1890095A (en) | 1994-03-08 | 1995-09-25 | Novo Nordisk A/S | Novel alkaline cellulases |
US7883872B2 (en) * | 1996-10-10 | 2011-02-08 | Dyadic International (Usa), Inc. | Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose |
DK1117808T3 (da) | 1998-10-06 | 2005-04-25 | Mark Aaron Emalfarb | Transformaationssystem inden jfjor området filamentöse svampeværter: I chrysosporium |
WO2001025468A1 (en) | 1999-10-06 | 2001-04-12 | Mark Aaron Emalfarb | High-throughput screening of expressed dna libraries in filamentous fungi |
CA2405954C (en) | 2000-04-13 | 2015-06-30 | Mark Aaron Emalfarb | Novel expression-regulating sequences and expression products in the field of filamentous fungi |
WO2003000941A2 (en) | 2001-06-26 | 2003-01-03 | Novozymes A/S | Polypeptides having cellobiohydrolase i activity and polynucleotides encoding same |
CN1980953B (zh) | 2004-01-30 | 2014-12-24 | 诺维信股份有限公司 | 具有分解纤维增强活性的多肽及其编码多核苷酸 |
EP1733033B1 (en) | 2004-02-06 | 2012-06-20 | Novozymes Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
BRPI0616721A2 (pt) * | 2005-09-30 | 2011-06-28 | Novozymes Inc | métodos para degradar ou converter um material celulósico e para produzir uma substáncia, e, composição detergente |
-
2008
- 2008-05-09 WO PCT/US2008/005927 patent/WO2008140749A2/en active Application Filing
- 2008-05-09 CN CN200880024110A patent/CN101855345A/zh active Pending
- 2008-05-09 EP EP08767648.2A patent/EP2069491B1/en not_active Not-in-force
- 2008-05-09 CN CN201510280545.7A patent/CN104962537A/zh active Pending
- 2008-05-09 DK DK08767648.2T patent/DK2069491T3/en active
- 2008-05-09 US US12/598,574 patent/US8999696B2/en not_active Expired - Fee Related
- 2008-05-09 BR BRPI0811465-0A2A patent/BRPI0811465A2/pt active Search and Examination
-
2015
- 2015-03-27 US US14/671,418 patent/US9631213B2/en active Active
-
2017
- 2017-04-10 US US15/483,661 patent/US9914946B2/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103261430A (zh) * | 2010-12-20 | 2013-08-21 | 纳幕尔杜邦公司 | 靶向过水解酶 |
CN103502444A (zh) * | 2011-03-17 | 2014-01-08 | 丹尼斯科美国公司 | 糖基水解酶及其在生物质水解方面的用途 |
CN112272701A (zh) * | 2018-04-19 | 2021-01-26 | 诺维信公司 | 稳定化的纤维素酶变体 |
CN113215135A (zh) * | 2021-06-17 | 2021-08-06 | 福建中烟工业有限责任公司 | 一种内切葡聚糖酶在卷烟原料改良中的应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2008140749A2 (en) | 2008-11-20 |
US8999696B2 (en) | 2015-04-07 |
US9914946B2 (en) | 2018-03-13 |
EP2069491A2 (en) | 2009-06-17 |
US20170218413A1 (en) | 2017-08-03 |
US9631213B2 (en) | 2017-04-25 |
WO2008140749A3 (en) | 2009-01-15 |
US20100143967A1 (en) | 2010-06-10 |
EP2069491B1 (en) | 2018-01-03 |
CN104962537A (zh) | 2015-10-07 |
US20150197781A1 (en) | 2015-07-16 |
BRPI0811465A2 (pt) | 2014-10-14 |
DK2069491T3 (en) | 2018-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9914946B2 (en) | Polypeptides having xylanase activity and polynucleotides encoding same | |
CN101809150B (zh) | 提高多肽的纤维素分解增强活性的方法 | |
CN105886485B (zh) | β-葡糖苷酶变体及其编码多核苷酸 | |
CN103534348B (zh) | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 | |
CN102459582B (zh) | 用于增强纤维素材料降解或转化的方法 | |
CN102112604B (zh) | 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN102482680B (zh) | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
CN101952421A (zh) | 具有内切葡聚糖酶活性的多肽和编码所述多肽的多核苷酸 | |
CN101970471A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN101952304A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN102365360A (zh) | 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN101945889A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN102918151B (zh) | 纤维二糖水解酶变体及编码其的多核苷酸 | |
CN101784659A (zh) | 具有纤维素分解增强活性的多肽和编码它的多核苷酸 | |
CN102388134A (zh) | 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸 | |
CN107338233A (zh) | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
CN103270165A (zh) | 包含具有纤维素分解增强活性的多肽和醌化合物的组合物及其用途 | |
CN101952420A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN104480088A (zh) | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 | |
CN102597228A (zh) | 纤维二糖水解酶变体及编码其的多核苷酸 | |
CN101910405A (zh) | 降低鞣质对酶促水解纤维素材料的抑制作用的方法 | |
CN101910406A (zh) | 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法 | |
CN102016016A (zh) | 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸 | |
US8609932B2 (en) | Polypeptides having endoglucanase activity and polynucleotides encoding same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20101006 |