CN101784659A - 具有纤维素分解增强活性的多肽和编码它的多核苷酸 - Google Patents
具有纤维素分解增强活性的多肽和编码它的多核苷酸 Download PDFInfo
- Publication number
- CN101784659A CN101784659A CN200880101361A CN200880101361A CN101784659A CN 101784659 A CN101784659 A CN 101784659A CN 200880101361 A CN200880101361 A CN 200880101361A CN 200880101361 A CN200880101361 A CN 200880101361A CN 101784659 A CN101784659 A CN 101784659A
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- sequence
- seq
- preferred aspect
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 489
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 463
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 463
- 230000001461 cytolytic effect Effects 0.000 title claims abstract description 151
- 230000002708 enhancing effect Effects 0.000 title claims abstract description 109
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 96
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 96
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 claims abstract description 152
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 34
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 34
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 34
- 229920002678 cellulose Polymers 0.000 claims description 152
- 239000001913 cellulose Substances 0.000 claims description 151
- 108090000623 proteins and genes Proteins 0.000 claims description 132
- 125000003729 nucleotide group Chemical group 0.000 claims description 126
- 239000002773 nucleotide Substances 0.000 claims description 123
- 102000004190 Enzymes Human genes 0.000 claims description 100
- 108090000790 Enzymes Proteins 0.000 claims description 100
- 239000000463 material Substances 0.000 claims description 95
- 238000000855 fermentation Methods 0.000 claims description 90
- 230000004151 fermentation Effects 0.000 claims description 90
- 102000004169 proteins and genes Human genes 0.000 claims description 68
- 235000018102 proteins Nutrition 0.000 claims description 67
- 235000001014 amino acid Nutrition 0.000 claims description 63
- 150000001413 amino acids Chemical class 0.000 claims description 63
- 241000894006 Bacteria Species 0.000 claims description 50
- 239000000203 mixture Substances 0.000 claims description 50
- 230000014509 gene expression Effects 0.000 claims description 41
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 34
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 32
- 108020004414 DNA Proteins 0.000 claims description 30
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 17
- 230000000295 complement effect Effects 0.000 claims description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 16
- 239000013612 plasmid Substances 0.000 claims description 16
- 239000012634 fragment Substances 0.000 claims description 15
- 235000013311 vegetables Nutrition 0.000 claims description 15
- 239000013604 expression vector Substances 0.000 claims description 14
- 238000009396 hybridization Methods 0.000 claims description 14
- 230000008034 disappearance Effects 0.000 claims description 12
- 230000000968 intestinal effect Effects 0.000 claims description 12
- 238000003259 recombinant expression Methods 0.000 claims description 8
- 230000009261 transgenic effect Effects 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 7
- 230000037431 insertion Effects 0.000 claims description 7
- 108020004459 Small interfering RNA Proteins 0.000 claims description 6
- 239000002679 microRNA Substances 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 4
- 241000588724 Escherichia coli Species 0.000 claims description 3
- 230000000593 degrading effect Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 108091070501 miRNA Proteins 0.000 claims 1
- 239000013598 vector Substances 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 200
- 235000010980 cellulose Nutrition 0.000 description 145
- 210000004215 spore Anatomy 0.000 description 130
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 110
- 229940088598 enzyme Drugs 0.000 description 99
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 97
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 93
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 75
- 241000499912 Trichoderma reesei Species 0.000 description 74
- 108010059892 Cellulase Proteins 0.000 description 66
- 229940024606 amino acid Drugs 0.000 description 60
- 235000019441 ethanol Nutrition 0.000 description 48
- 241000196324 Embryophyta Species 0.000 description 46
- 239000002253 acid Substances 0.000 description 44
- 108010047754 beta-Glucosidase Proteins 0.000 description 44
- 102000006995 beta-Glucosidase Human genes 0.000 description 44
- 238000002203 pretreatment Methods 0.000 description 44
- 230000001580 bacterial effect Effects 0.000 description 36
- 230000000694 effects Effects 0.000 description 36
- 230000007062 hydrolysis Effects 0.000 description 36
- 238000006460 hydrolysis reaction Methods 0.000 description 36
- 239000000047 product Substances 0.000 description 33
- 238000004519 manufacturing process Methods 0.000 description 32
- 230000008569 process Effects 0.000 description 28
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 26
- 240000006439 Aspergillus oryzae Species 0.000 description 26
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 26
- 241000193830 Bacillus <bacterium> Species 0.000 description 25
- 241000233866 Fungi Species 0.000 description 25
- 150000007524 organic acids Chemical class 0.000 description 25
- 239000000126 substance Substances 0.000 description 24
- 230000008859 change Effects 0.000 description 23
- 238000000354 decomposition reaction Methods 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 22
- 244000005700 microbiome Species 0.000 description 22
- 239000000835 fiber Chemical group 0.000 description 21
- 230000002538 fungal effect Effects 0.000 description 21
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 20
- 241001674013 Chrysosporium lucknowense Species 0.000 description 20
- 239000002609 medium Substances 0.000 description 19
- 108091026890 Coding region Proteins 0.000 description 18
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 18
- 239000000523 sample Substances 0.000 description 18
- 239000000243 solution Substances 0.000 description 18
- 238000004880 explosion Methods 0.000 description 17
- -1 methane amide Chemical class 0.000 description 17
- 229920002488 Hemicellulose Polymers 0.000 description 16
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 16
- 239000000499 gel Substances 0.000 description 16
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 15
- 241000223218 Fusarium Species 0.000 description 15
- 241000589516 Pseudomonas Species 0.000 description 15
- 230000004927 fusion Effects 0.000 description 15
- 241000228245 Aspergillus niger Species 0.000 description 14
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 14
- 239000008103 glucose Substances 0.000 description 14
- 238000002703 mutagenesis Methods 0.000 description 14
- 231100000350 mutagenesis Toxicity 0.000 description 14
- 235000000346 sugar Nutrition 0.000 description 14
- 102000005575 Cellulases Human genes 0.000 description 13
- 108010084185 Cellulases Proteins 0.000 description 13
- 241000223258 Thermomyces lanuginosus Species 0.000 description 13
- 229910021529 ammonia Inorganic materials 0.000 description 13
- 230000009466 transformation Effects 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 13
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 12
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 12
- 241000228212 Aspergillus Species 0.000 description 12
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 12
- 240000007594 Oryza sativa Species 0.000 description 12
- 235000007164 Oryza sativa Nutrition 0.000 description 12
- 241000187747 Streptomyces Species 0.000 description 12
- 241001494489 Thielavia Species 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 108010091371 endoglucanase 1 Proteins 0.000 description 12
- 239000007788 liquid Substances 0.000 description 12
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 12
- 239000002853 nucleic acid probe Substances 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 230000008521 reorganization Effects 0.000 description 12
- 235000009566 rice Nutrition 0.000 description 12
- 230000001276 controlling effect Effects 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 241001225321 Aspergillus fumigatus Species 0.000 description 10
- 241000351920 Aspergillus nidulans Species 0.000 description 10
- 241000235648 Pichia Species 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 241000223259 Trichoderma Species 0.000 description 10
- 229940091771 aspergillus fumigatus Drugs 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- 241000228215 Aspergillus aculeatus Species 0.000 description 9
- 241000194108 Bacillus licheniformis Species 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 9
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 9
- 239000004141 Sodium laurylsulphate Substances 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 108010091384 endoglucanase 2 Proteins 0.000 description 9
- 108010092413 endoglucanase V Proteins 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 9
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 9
- 239000004382 Amylase Substances 0.000 description 8
- 108010065511 Amylases Proteins 0.000 description 8
- 102000013142 Amylases Human genes 0.000 description 8
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 8
- 244000285963 Kluyveromyces fragilis Species 0.000 description 8
- 102000035195 Peptidases Human genes 0.000 description 8
- 108091005804 Peptidases Proteins 0.000 description 8
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 8
- 240000008042 Zea mays Species 0.000 description 8
- 235000019418 amylase Nutrition 0.000 description 8
- 235000013339 cereals Nutrition 0.000 description 8
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 8
- 238000003752 polymerase chain reaction Methods 0.000 description 8
- 239000002023 wood Substances 0.000 description 8
- 229960003487 xylose Drugs 0.000 description 8
- HNSDLXPSAYFUHK-UHFFFAOYSA-N 1,4-bis(2-ethylhexyl) sulfosuccinate Chemical compound CCCCC(CC)COC(=O)CC(S(O)(=O)=O)C(=O)OCC(CC)CCCC HNSDLXPSAYFUHK-UHFFFAOYSA-N 0.000 description 7
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 7
- 239000002028 Biomass Substances 0.000 description 7
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 7
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 7
- 241000605909 Fusobacterium Species 0.000 description 7
- 241000235649 Kluyveromyces Species 0.000 description 7
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 7
- 101100166758 Magnaporthe oryzae (strain 70-15 / ATCC MYA-4617 / FGSC 8958) cel12A gene Proteins 0.000 description 7
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 7
- 241000235395 Mucor Species 0.000 description 7
- 241000194017 Streptococcus Species 0.000 description 7
- 241001655322 Streptomycetales Species 0.000 description 7
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 7
- 241000588902 Zymomonas mobilis Species 0.000 description 7
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 239000007789 gas Substances 0.000 description 7
- 230000008488 polyadenylation Effects 0.000 description 7
- 229940081969 saccharomyces cerevisiae Drugs 0.000 description 7
- 239000010902 straw Substances 0.000 description 7
- 150000008163 sugars Chemical class 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 6
- 241000235349 Ascomycota Species 0.000 description 6
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 6
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 6
- 241000123346 Chrysosporium Species 0.000 description 6
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 6
- 241000187432 Streptomyces coelicolor Species 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 229910002091 carbon monoxide Inorganic materials 0.000 description 6
- 210000002421 cell wall Anatomy 0.000 description 6
- 229940106157 cellulase Drugs 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000012258 culturing Methods 0.000 description 6
- 230000002950 deficient Effects 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- 235000019253 formic acid Nutrition 0.000 description 6
- 239000000446 fuel Substances 0.000 description 6
- 238000012239 gene modification Methods 0.000 description 6
- 230000005017 genetic modification Effects 0.000 description 6
- 235000013617 genetically modified food Nutrition 0.000 description 6
- 230000013595 glycosylation Effects 0.000 description 6
- 238000006206 glycosylation reaction Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 150000002500 ions Chemical class 0.000 description 6
- 210000001938 protoplast Anatomy 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 210000003491 skin Anatomy 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 238000009279 wet oxidation reaction Methods 0.000 description 6
- 241001513093 Aspergillus awamori Species 0.000 description 5
- 241001480052 Aspergillus japonicus Species 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 5
- 241001674001 Chrysosporium tropicum Species 0.000 description 5
- 229920000742 Cotton Polymers 0.000 description 5
- 241000223195 Fusarium graminearum Species 0.000 description 5
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 5
- 241000223198 Humicola Species 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- 108090001060 Lipase Proteins 0.000 description 5
- 102000004882 Lipase Human genes 0.000 description 5
- 239000004367 Lipase Substances 0.000 description 5
- 108700011259 MicroRNAs Proteins 0.000 description 5
- 241000235403 Rhizomucor miehei Species 0.000 description 5
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 5
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 5
- 241000235060 Scheffersomyces stipitis Species 0.000 description 5
- 241000235346 Schizosaccharomyces Species 0.000 description 5
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- 241000194054 Streptococcus uberis Species 0.000 description 5
- 241000187392 Streptomyces griseus Species 0.000 description 5
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 5
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 5
- SRBFZHDQGSBBOR-QMKXCQHVSA-N alpha-L-arabinopyranose Chemical compound O[C@H]1CO[C@@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-QMKXCQHVSA-N 0.000 description 5
- 229940041514 candida albicans extract Drugs 0.000 description 5
- 239000001768 carboxy methyl cellulose Substances 0.000 description 5
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 5
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 5
- 230000002779 inactivation Effects 0.000 description 5
- 150000002576 ketones Chemical class 0.000 description 5
- 235000019421 lipase Nutrition 0.000 description 5
- 235000009973 maize Nutrition 0.000 description 5
- 229930182817 methionine Natural products 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 235000016709 nutrition Nutrition 0.000 description 5
- 239000003960 organic solvent Substances 0.000 description 5
- 238000004321 preservation Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 229940115922 streptococcus uberis Drugs 0.000 description 5
- QAOWNCQODCNURD-UHFFFAOYSA-N sulfuric acid Substances OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 229910021654 trace metal Inorganic materials 0.000 description 5
- 239000012138 yeast extract Substances 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- ALRHLSYJTWAHJZ-UHFFFAOYSA-N 3-hydroxypropionic acid Chemical compound OCCC(O)=O ALRHLSYJTWAHJZ-UHFFFAOYSA-N 0.000 description 4
- 240000000073 Achillea millefolium Species 0.000 description 4
- 235000007754 Achillea millefolium Nutrition 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 4
- 241000220433 Albizia Species 0.000 description 4
- 241000223651 Aureobasidium Species 0.000 description 4
- 241000193752 Bacillus circulans Species 0.000 description 4
- 241000193749 Bacillus coagulans Species 0.000 description 4
- 241000193747 Bacillus firmus Species 0.000 description 4
- 241000194107 Bacillus megaterium Species 0.000 description 4
- 241000194103 Bacillus pumilus Species 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 241000193388 Bacillus thuringiensis Species 0.000 description 4
- 241000193764 Brevibacillus brevis Species 0.000 description 4
- ODINCKMPIJJUCX-UHFFFAOYSA-N Calcium oxide Chemical compound [Ca]=O ODINCKMPIJJUCX-UHFFFAOYSA-N 0.000 description 4
- 241000589876 Campylobacter Species 0.000 description 4
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 241000193403 Clostridium Species 0.000 description 4
- 241001362614 Crassa Species 0.000 description 4
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 4
- 241001063191 Elops affinis Species 0.000 description 4
- 241000194033 Enterococcus Species 0.000 description 4
- 108010062466 Enzyme Precursors Proteins 0.000 description 4
- 102000010911 Enzyme Precursors Human genes 0.000 description 4
- 235000002756 Erythrina berteroana Nutrition 0.000 description 4
- 108090000371 Esterases Proteins 0.000 description 4
- 241000589565 Flavobacterium Species 0.000 description 4
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- 102000004157 Hydrolases Human genes 0.000 description 4
- 108090000604 Hydrolases Proteins 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- 125000002061 L-isoleucyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](C([H])([H])[H])([H])C(C([H])([H])[H])([H])[H] 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- 108010029541 Laccase Proteins 0.000 description 4
- 241000186660 Lactobacillus Species 0.000 description 4
- 241000194036 Lactococcus Species 0.000 description 4
- 241000226677 Myceliophthora Species 0.000 description 4
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical class CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 4
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 4
- 241000588653 Neisseria Species 0.000 description 4
- 241000221960 Neurospora Species 0.000 description 4
- 241000233654 Oomycetes Species 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 4
- 241000194109 Paenibacillus lautus Species 0.000 description 4
- 241000228143 Penicillium Species 0.000 description 4
- 102000003992 Peroxidases Human genes 0.000 description 4
- 241000190932 Rhodopseudomonas Species 0.000 description 4
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 4
- 241001123227 Saccharomyces pastorianus Species 0.000 description 4
- 241000607142 Salmonella Species 0.000 description 4
- 241000222480 Schizophyllum Species 0.000 description 4
- 241000191940 Staphylococcus Species 0.000 description 4
- 241000194048 Streptococcus equi Species 0.000 description 4
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 4
- 239000005864 Sulphur Substances 0.000 description 4
- 241000228341 Talaromyces Species 0.000 description 4
- 241001540751 Talaromyces ruber Species 0.000 description 4
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 241001507667 Volvariella Species 0.000 description 4
- 241000607479 Yersinia pestis Species 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- 239000003513 alkali Substances 0.000 description 4
- 229940054340 bacillus coagulans Drugs 0.000 description 4
- 229940005348 bacillus firmus Drugs 0.000 description 4
- 229940097012 bacillus thuringiensis Drugs 0.000 description 4
- 239000002585 base Substances 0.000 description 4
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 4
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 4
- 238000010364 biochemical engineering Methods 0.000 description 4
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 4
- PAFYVDNYOJAWDX-UHFFFAOYSA-L calcium;2,2,2-trichloroacetate Chemical compound [Ca+2].[O-]C(=O)C(Cl)(Cl)Cl.[O-]C(=O)C(Cl)(Cl)Cl PAFYVDNYOJAWDX-UHFFFAOYSA-L 0.000 description 4
- 239000004202 carbamide Substances 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000011284 combination treatment Methods 0.000 description 4
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 4
- 241001233957 eudicotyledons Species 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 229950006191 gluconic acid Drugs 0.000 description 4
- 229960002989 glutamic acid Drugs 0.000 description 4
- JFCQEDHGNNZCLN-UHFFFAOYSA-N glutaric acid Chemical compound OC(=O)CCCC(O)=O JFCQEDHGNNZCLN-UHFFFAOYSA-N 0.000 description 4
- 235000011187 glycerol Nutrition 0.000 description 4
- 239000008187 granular material Substances 0.000 description 4
- 108010002430 hemicellulase Proteins 0.000 description 4
- 230000003301 hydrolyzing effect Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 229910052500 inorganic mineral Inorganic materials 0.000 description 4
- LVHBHZANLOWSRM-UHFFFAOYSA-N itaconic acid Chemical compound OC(=O)CC(=C)C(O)=O LVHBHZANLOWSRM-UHFFFAOYSA-N 0.000 description 4
- 239000004310 lactic acid Substances 0.000 description 4
- 235000014655 lactic acid Nutrition 0.000 description 4
- 229940039696 lactobacillus Drugs 0.000 description 4
- 239000002029 lignocellulosic biomass Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000009996 mechanical pre-treatment Methods 0.000 description 4
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 4
- 239000011707 mineral Substances 0.000 description 4
- 235000010755 mineral Nutrition 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 239000010813 municipal solid waste Substances 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 239000001814 pectin Substances 0.000 description 4
- 229920001277 pectin Polymers 0.000 description 4
- 235000010987 pectin Nutrition 0.000 description 4
- 229940072417 peroxidase Drugs 0.000 description 4
- 108040007629 peroxidase activity proteins Proteins 0.000 description 4
- 230000037039 plant physiology Effects 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 238000002741 site-directed mutagenesis Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000006641 stabilisation Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 150000003722 vitamin derivatives Chemical class 0.000 description 4
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 3
- 108010011619 6-Phytase Proteins 0.000 description 3
- 241000222518 Agaricus Species 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 241000223600 Alternaria Species 0.000 description 3
- 108090000915 Aminopeptidases Proteins 0.000 description 3
- 102000004400 Aminopeptidases Human genes 0.000 description 3
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Natural products OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 3
- 241001112741 Bacillaceae Species 0.000 description 3
- 108010023063 Bacto-peptone Proteins 0.000 description 3
- 229920000018 Callose Polymers 0.000 description 3
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 3
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 3
- 244000025254 Cannabis sativa Species 0.000 description 3
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 3
- 108010006303 Carboxypeptidases Proteins 0.000 description 3
- 102000005367 Carboxypeptidases Human genes 0.000 description 3
- 102000016938 Catalase Human genes 0.000 description 3
- 108010053835 Catalase Proteins 0.000 description 3
- 108010031396 Catechol oxidase Proteins 0.000 description 3
- 102000030523 Catechol oxidase Human genes 0.000 description 3
- 241000146399 Ceriporiopsis Species 0.000 description 3
- 108010022172 Chitinases Proteins 0.000 description 3
- 102000012286 Chitinases Human genes 0.000 description 3
- 241001556045 Chrysosporium merdarium Species 0.000 description 3
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 3
- 241000355696 Chrysosporium zonatum Species 0.000 description 3
- 241000235457 Chytridium Species 0.000 description 3
- 241000221760 Claviceps Species 0.000 description 3
- 241000228437 Cochliobolus Species 0.000 description 3
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 3
- 241000235646 Cyberlindnera jadinii Species 0.000 description 3
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 3
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 3
- 108010053770 Deoxyribonucleases Proteins 0.000 description 3
- 102000016911 Deoxyribonucleases Human genes 0.000 description 3
- 241000935926 Diplodia Species 0.000 description 3
- 241000221433 Exidia Species 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 3
- 102100022624 Glucoamylase Human genes 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 241000006384 Jeotgalibacillus marinus Species 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- 241001344131 Magnaporthe grisea Species 0.000 description 3
- 108010054377 Mannosidases Proteins 0.000 description 3
- 102000001696 Mannosidases Human genes 0.000 description 3
- 241001184659 Melanocarpus albomyces Species 0.000 description 3
- 241000204031 Mycoplasma Species 0.000 description 3
- 229920001131 Pulp (paper) Polymers 0.000 description 3
- 241000235402 Rhizomucor Species 0.000 description 3
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 3
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 3
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 3
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 3
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 3
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- 241001136494 Talaromyces funiculosus Species 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 108060008539 Transglutaminase Proteins 0.000 description 3
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 3
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 3
- 235000010749 Vicia faba Nutrition 0.000 description 3
- 240000006677 Vicia faba Species 0.000 description 3
- 235000009754 Vitis X bourquina Nutrition 0.000 description 3
- 235000012333 Vitis X labruscana Nutrition 0.000 description 3
- 240000006365 Vitis vinifera Species 0.000 description 3
- 235000014787 Vitis vinifera Nutrition 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 3
- 241000222124 [Candida] boidinii Species 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000001476 alcoholic effect Effects 0.000 description 3
- 150000001299 aldehydes Chemical class 0.000 description 3
- 230000029936 alkylation Effects 0.000 description 3
- 238000005804 alkylation reaction Methods 0.000 description 3
- WQZGKKKJIJFFOK-PQMKYFCFSA-N alpha-D-mannose Chemical compound OC[C@H]1O[C@H](O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-PQMKYFCFSA-N 0.000 description 3
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- 239000012298 atmosphere Substances 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 239000012620 biological material Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 3
- 229960000846 camphor Drugs 0.000 description 3
- 108010089934 carbohydrase Proteins 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000011026 diafiltration Methods 0.000 description 3
- 238000004043 dyeing Methods 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000001704 evaporation Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000007710 freezing Methods 0.000 description 3
- 230000008014 freezing Effects 0.000 description 3
- 108010025899 gelatin film Proteins 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 125000003147 glycosyl group Chemical group 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 229910001385 heavy metal Inorganic materials 0.000 description 3
- 229940059442 hemicellulase Drugs 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 235000011073 invertase Nutrition 0.000 description 3
- 238000007834 ligase chain reaction Methods 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012269 metabolic engineering Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 229920001542 oligosaccharide Polymers 0.000 description 3
- 239000010893 paper waste Substances 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 150000002972 pentoses Chemical class 0.000 description 3
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 3
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 3
- 229940085127 phytase Drugs 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 150000004804 polysaccharides Chemical class 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000002797 proteolythic effect Effects 0.000 description 3
- 238000010298 pulverizing process Methods 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 239000002002 slurry Substances 0.000 description 3
- 239000000600 sorbitol Substances 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 102000003601 transglutaminase Human genes 0.000 description 3
- 230000001810 trypsinlike Effects 0.000 description 3
- 108010046845 tryptones Proteins 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 2
- NAOLWIGVYRIGTP-UHFFFAOYSA-N 1,3,5-trihydroxyanthracene-9,10-dione Chemical compound C1=CC(O)=C2C(=O)C3=CC(O)=CC(O)=C3C(=O)C2=C1 NAOLWIGVYRIGTP-UHFFFAOYSA-N 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- UXFQFBNBSPQBJW-UHFFFAOYSA-N 2-amino-2-methylpropane-1,3-diol Chemical compound OCC(N)(C)CO UXFQFBNBSPQBJW-UHFFFAOYSA-N 0.000 description 2
- BWLBGMIXKSTLSX-UHFFFAOYSA-N 2-hydroxyisobutyric acid Chemical compound CC(C)(O)C(O)=O BWLBGMIXKSTLSX-UHFFFAOYSA-N 0.000 description 2
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 2
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 241000743339 Agrostis Species 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 108090000145 Bacillolysin Proteins 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 241000219193 Brassicaceae Species 0.000 description 2
- 241000722885 Brettanomyces Species 0.000 description 2
- 241001466517 Ceriporiopsis aneirina Species 0.000 description 2
- 241000221955 Chaetomium Species 0.000 description 2
- 241001057137 Chaetomium fimeti Species 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 241001508811 Clavispora Species 0.000 description 2
- 241001085790 Coprinopsis Species 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 244000251987 Coprinus macrorhizus Species 0.000 description 2
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 2
- 241001509964 Coptotermes Species 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- 241000221756 Cryphonectria parasitica Species 0.000 description 2
- HEBKCHPVOIAQTA-QWWZWVQMSA-N D-arabinitol Chemical compound OC[C@@H](O)C(O)[C@H](O)CO HEBKCHPVOIAQTA-QWWZWVQMSA-N 0.000 description 2
- RGHNJXZEOKUKBD-UHFFFAOYSA-N D-gluconic acid Natural products OCC(O)C(O)C(O)C(O)C(O)=O RGHNJXZEOKUKBD-UHFFFAOYSA-N 0.000 description 2
- RGHNJXZEOKUKBD-SQOUGZDYSA-N D-gluconic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O RGHNJXZEOKUKBD-SQOUGZDYSA-N 0.000 description 2
- ZAQJHHRNXZUBTE-WUJLRWPWSA-N D-xylulose Chemical compound OC[C@@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-WUJLRWPWSA-N 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- ROSDSFDQCJNGOL-UHFFFAOYSA-N Dimethylamine Chemical compound CNC ROSDSFDQCJNGOL-UHFFFAOYSA-N 0.000 description 2
- 101150015836 ENO1 gene Proteins 0.000 description 2
- 241000223924 Eimeria Species 0.000 description 2
- 101710132690 Endo-1,4-beta-xylanase A Proteins 0.000 description 2
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 2
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 229920001503 Glucan Polymers 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- 241000222418 Lentinus Species 0.000 description 2
- 241000228456 Leptosphaeria Species 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- 108090000856 Lyases Proteins 0.000 description 2
- 102000004317 Lyases Human genes 0.000 description 2
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 2
- 241000183011 Melanocarpus Species 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 102000035092 Neutral proteases Human genes 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 101710157860 Oxydoreductase Proteins 0.000 description 2
- 241000235647 Pachysolen tannophilus Species 0.000 description 2
- 241000123526 Peziza Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000222350 Pleurotus Species 0.000 description 2
- 241001451060 Poitrasia Species 0.000 description 2
- 241000222640 Polyporus Species 0.000 description 2
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 2
- 241001497658 Pseudotrichonympha Species 0.000 description 2
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 2
- 108091030071 RNAI Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 240000005384 Rhizopus oryzae Species 0.000 description 2
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 2
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- 241000582914 Saccharomyces uvarum Species 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- 241000182980 Thielavia ovispora Species 0.000 description 2
- 241000183053 Thielavia subthermophila Species 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- 241000215642 Trichophaea Species 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- 235000002098 Vicia faba var. major Nutrition 0.000 description 2
- 229930003756 Vitamin B7 Natural products 0.000 description 2
- 241001523965 Xylaria Species 0.000 description 2
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 2
- 229920002000 Xyloglucan Chemical group 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- IAJILQKETJEXLJ-QTBDOELSSA-N aldehydo-D-glucuronic acid Chemical compound O=C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-QTBDOELSSA-N 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 102000005840 alpha-Galactosidase Human genes 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 101150078331 ama-1 gene Proteins 0.000 description 2
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 210000001367 artery Anatomy 0.000 description 2
- 238000010923 batch production Methods 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000005422 blasting Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 230000036978 cell physiology Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000002962 chemical mutagen Substances 0.000 description 2
- 238000011098 chromatofocusing Methods 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000002242 deionisation method Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 238000007599 discharging Methods 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000005672 electromagnetic field Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- HCPOCMMGKBZWSJ-UHFFFAOYSA-N ethyl 3-hydrazinyl-3-oxopropanoate Chemical compound CCOC(=O)CC(=O)NN HCPOCMMGKBZWSJ-UHFFFAOYSA-N 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 230000028023 exocytosis Effects 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 210000003495 flagella Anatomy 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 239000001530 fumaric acid Substances 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 229940097043 glucuronic acid Drugs 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 238000000227 grinding Methods 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 150000002402 hexoses Chemical class 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000000413 hydrolysate Substances 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000009655 industrial fermentation Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 229910017053 inorganic salt Inorganic materials 0.000 description 2
- 229960000367 inositol Drugs 0.000 description 2
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 2
- 229920005610 lignin Polymers 0.000 description 2
- 239000012978 lignocellulosic material Substances 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000000442 meristematic effect Effects 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 238000003801 milling Methods 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 150000002482 oligosaccharides Chemical class 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 235000006408 oxalic acid Nutrition 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 238000005222 photoaffinity labeling Methods 0.000 description 2
- 239000010908 plant waste Substances 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 239000001965 potato dextrose agar Substances 0.000 description 2
- 235000019260 propionic acid Nutrition 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 239000012723 sample buffer Substances 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 238000012807 shake-flask culturing Methods 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 238000010563 solid-state fermentation Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000004885 tandem mass spectrometry Methods 0.000 description 2
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 235000015112 vegetable and seed oil Nutrition 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 235000011912 vitamin B7 Nutrition 0.000 description 2
- 239000011735 vitamin B7 Substances 0.000 description 2
- 239000000811 xylitol Substances 0.000 description 2
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 2
- 235000010447 xylitol Nutrition 0.000 description 2
- 229960002675 xylitol Drugs 0.000 description 2
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 1
- ASZCVNVMQXNJGH-ZYRRHWMLSA-N (1S,2R,9S,12S)-4,12-dimethyl-13-oxotetracyclo[10.2.1.01,9.03,8]pentadeca-3,5,7-triene-2-carboxylic acid Chemical compound Cc1cccc2[C@H]3CC[C@@]4(C)C[C@@]3(CC4=O)[C@@H](C(O)=O)c12 ASZCVNVMQXNJGH-ZYRRHWMLSA-N 0.000 description 1
- TWNIBLMWSKIRAT-RWOPYEJCSA-N (1r,2s,3s,4s,5r)-6,8-dioxabicyclo[3.2.1]octane-2,3,4-triol Chemical compound O1[C@@]2([H])OC[C@]1([H])[C@@H](O)[C@H](O)[C@@H]2O TWNIBLMWSKIRAT-RWOPYEJCSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JQFLYFRHDIHZFZ-RXMQYKEDSA-N (2s)-3,3-dimethylpyrrolidine-2-carboxylic acid Chemical compound CC1(C)CCN[C@@H]1C(O)=O JQFLYFRHDIHZFZ-RXMQYKEDSA-N 0.000 description 1
- CNPSFBUUYIVHAP-AKGZTFGVSA-N (2s)-3-methylpyrrolidine-2-carboxylic acid Chemical compound CC1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-AKGZTFGVSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- XJLSEXAGTJCILF-RXMQYKEDSA-N (R)-nipecotic acid zwitterion Chemical compound OC(=O)[C@@H]1CCCNC1 XJLSEXAGTJCILF-RXMQYKEDSA-N 0.000 description 1
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 description 1
- OMGHIGVFLOPEHJ-UHFFFAOYSA-N 2,5-dihydro-1h-pyrrol-1-ium-2-carboxylate Chemical compound OC(=O)C1NCC=C1 OMGHIGVFLOPEHJ-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- BTJIUGUIPKRLHP-UHFFFAOYSA-N 4-nitrophenol Chemical class OC1=CC=C([N+]([O-])=O)C=C1 BTJIUGUIPKRLHP-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- FRXSZNDVFUDTIR-UHFFFAOYSA-N 6-methoxy-1,2,3,4-tetrahydroquinoline Chemical compound N1CCCC2=CC(OC)=CC=C21 FRXSZNDVFUDTIR-UHFFFAOYSA-N 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- 241001134630 Acidothermus cellulolyticus Species 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 101710197633 Actin-1 Proteins 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 108010053754 Aldehyde reductase Proteins 0.000 description 1
- 241001677738 Aleuron Species 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100520142 Caenorhabditis elegans pin-2 gene Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241001646018 Ceriporiopsis gilvescens Species 0.000 description 1
- 241001277875 Ceriporiopsis rivulosa Species 0.000 description 1
- 241000524302 Ceriporiopsis subrufa Species 0.000 description 1
- 241000259840 Chaetomidium Species 0.000 description 1
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000701248 Chlorella virus Species 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 241000123350 Chrysosporium sp. Species 0.000 description 1
- 241001508813 Clavispora lusitaniae Species 0.000 description 1
- 241001508812 Clavispora opuntiae Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000020428 Colea Species 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 241000221755 Cryphonectria Species 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- 235000001427 Cylindropuntia imbricata Nutrition 0.000 description 1
- 240000005729 Cylindropuntia imbricata Species 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 101150060155 Dcc gene Proteins 0.000 description 1
- 241000235036 Debaryomyces hansenii Species 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 235000007810 Eryngium campestre Nutrition 0.000 description 1
- 240000005980 Eryngium maritimum Species 0.000 description 1
- 235000003933 Eryngium maritimum Nutrition 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 241000234642 Festuca Species 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 241000146398 Gelatoporia subvermispora Species 0.000 description 1
- 241000726221 Gemma Species 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- ASZCVNVMQXNJGH-UHFFFAOYSA-N Gibberic acid Natural products C12CCC(C3)(C)C(=O)CC23C(C(O)=O)C2=C1C=CC=C2C ASZCVNVMQXNJGH-UHFFFAOYSA-N 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010068370 Glutens Proteins 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 244000286779 Hansenula anomala Species 0.000 description 1
- 235000014683 Hansenula anomala Nutrition 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- 241001497663 Holomastigotoides Species 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101000891113 Homo sapiens T-cell acute lymphocytic leukemia protein 1 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 241000223199 Humicola grisea Species 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 241000222342 Irpex Species 0.000 description 1
- 241000222344 Irpex lacteus Species 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000588749 Klebsiella oxytoca Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-L L-tartrate(2-) Chemical compound [O-]C(=O)[C@H](O)[C@@H](O)C([O-])=O FEWJPZIEWOKRBE-JCYAYHJZSA-L 0.000 description 1
- DZLNHFMRPBPULJ-VKHMYHEASA-N L-thioproline Chemical compound OC(=O)[C@@H]1CSCN1 DZLNHFMRPBPULJ-VKHMYHEASA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- KKJQZEWNZXRJFG-UHFFFAOYSA-N L-trans-4-Methyl-2-pyrrolidinecarboxylic acid Chemical compound CC1CNC(C(O)=O)C1 KKJQZEWNZXRJFG-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 101710094902 Legumin Proteins 0.000 description 1
- 241000222435 Lentinula Species 0.000 description 1
- 244000211187 Lepidium sativum Species 0.000 description 1
- 235000007849 Lepidium sativum Nutrition 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000219745 Lupinus Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000123315 Meripilus Species 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- GMPKIPWJBDOURN-UHFFFAOYSA-N Methoxyamine Chemical compound CON GMPKIPWJBDOURN-UHFFFAOYSA-N 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 1
- 241001072230 Oceanobacillus Species 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000235652 Pachysolen Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241001496963 Penicillium brasilianum Species 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000222397 Phlebia radiata Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241000422444 Piromyces equi Species 0.000 description 1
- 244000208734 Pisonia aculeata Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 244000252132 Pleurotus eryngii Species 0.000 description 1
- 235000001681 Pleurotus eryngii Nutrition 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 244000292693 Poa annua Species 0.000 description 1
- 241000209049 Poa pratensis Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 235000010829 Prunus spinosa Nutrition 0.000 description 1
- 241000383860 Pseudoplectania Species 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101001076706 Saccharomyces cerevisiae Invertase 1 Proteins 0.000 description 1
- 101001053411 Saccharomyces cerevisiae Invertase 3 Proteins 0.000 description 1
- 101001053412 Saccharomyces cerevisiae Invertase 4 Proteins 0.000 description 1
- 101001053409 Saccharomyces cerevisiae Invertase 5 Proteins 0.000 description 1
- 101001053400 Saccharomyces cerevisiae Invertase 7 Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 101000702553 Schistosoma mansoni Antigen Sm21.7 Proteins 0.000 description 1
- 101000714192 Schistosoma mansoni Tegument antigen Proteins 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 102000013275 Somatomedins Human genes 0.000 description 1
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 102100040365 T-cell acute lymphocytic leukemia protein 1 Human genes 0.000 description 1
- 101150052008 TKL-1 gene Proteins 0.000 description 1
- 241001215623 Talaromyces cellulolyticus Species 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241000228182 Thermoascus aurantiacus Species 0.000 description 1
- 241000203780 Thermobifida fusca Species 0.000 description 1
- 241001100181 Thermothelomyces heterothallica Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241000183057 Thielavia microspora Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000222357 Trametes hirsuta Species 0.000 description 1
- 241000222355 Trametes versicolor Species 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 102000014701 Transketolase Human genes 0.000 description 1
- 108010043652 Transketolase Proteins 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 241000259813 Trichophaea saccata Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 241000202898 Ureaplasma Species 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 206010047400 Vibrio infections Diseases 0.000 description 1
- FPIPGXGPPPQFEQ-BOOMUCAASA-N Vitamin A Natural products OC/C=C(/C)\C=C\C=C(\C)/C=C/C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-BOOMUCAASA-N 0.000 description 1
- 229930003270 Vitamin B Natural products 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 229930003316 Vitamin D Natural products 0.000 description 1
- QYSXJUFSXHHAJI-XFEUOLMDSA-N Vitamin D3 Natural products C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C/C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-XFEUOLMDSA-N 0.000 description 1
- 229930003427 Vitamin E Natural products 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 101500015412 Zea mays Ubiquitin Proteins 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- 241000588901 Zymomonas Species 0.000 description 1
- 241000192381 [Candida] diddensiae Species 0.000 description 1
- DPDMMXDBJGCCQC-UHFFFAOYSA-N [Na].[Cl] Chemical compound [Na].[Cl] DPDMMXDBJGCCQC-UHFFFAOYSA-N 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 238000010306 acid treatment Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 1
- 230000003625 amylolytic effect Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000433 anti-nutritional effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 238000000498 ball milling Methods 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 235000015140 cultured milk Nutrition 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010612 desalination reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- CEYULKASIQJZGP-UHFFFAOYSA-L disodium;2-(carboxymethyl)-2-hydroxybutanedioate Chemical compound [Na+].[Na+].[O-]C(=O)CC(O)(C(=O)O)CC([O-])=O CEYULKASIQJZGP-UHFFFAOYSA-L 0.000 description 1
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000009837 dry grinding Methods 0.000 description 1
- 238000010410 dusting Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 230000001076 estrogenic effect Effects 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 108010000165 exo-1,3-alpha-glucanase Proteins 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- XUFQPHANEAPEMJ-UHFFFAOYSA-N famotidine Chemical compound NC(N)=NC1=NC(CSCCC(N)=NS(N)(=O)=O)=CS1 XUFQPHANEAPEMJ-UHFFFAOYSA-N 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012262 fermentative production Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 description 1
- 238000001879 gelation Methods 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 238000010359 gene isolation Methods 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 108010026195 glycanase Proteins 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000000887 hydrating effect Effects 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- IXCSERBJSXMMFS-UHFFFAOYSA-N hydrogen chloride Substances Cl.Cl IXCSERBJSXMMFS-UHFFFAOYSA-N 0.000 description 1
- 229910000041 hydrogen chloride Inorganic materials 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 230000002895 hyperchromatic effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 235000012204 lemonade/lime carbonate Nutrition 0.000 description 1
- 230000002366 lipolytic effect Effects 0.000 description 1
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000002075 main ingredient Substances 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 229940057059 monascus purpureus Drugs 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 235000019629 palatability Nutrition 0.000 description 1
- 229940055726 pantothenic acid Drugs 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 230000004108 pentose phosphate pathway Effects 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 108060006613 prolamin Proteins 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 1
- 235000008160 pyridoxine Nutrition 0.000 description 1
- 239000011677 pyridoxine Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 235000020071 rectified spirit Nutrition 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 239000012146 running buffer Substances 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 235000017550 sodium carbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000007447 staining method Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010025 steaming Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000010907 stover Substances 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 235000021092 sugar substitutes Nutrition 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229940095064 tartrate Drugs 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 229960002203 tilactase Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- RMLPZKRPSQVRAB-UHFFFAOYSA-N tris(3-methylphenyl) phosphate Chemical compound CC1=CC=CC(OP(=O)(OC=2C=C(C)C=CC=2)OC=2C=C(C)C=CC=2)=C1 RMLPZKRPSQVRAB-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001148471 unidentified anaerobic bacterium Species 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 239000005418 vegetable material Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 235000019156 vitamin B Nutrition 0.000 description 1
- 239000011720 vitamin B Substances 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
- 235000019166 vitamin D Nutrition 0.000 description 1
- 239000011710 vitamin D Substances 0.000 description 1
- 235000019165 vitamin E Nutrition 0.000 description 1
- 239000011709 vitamin E Substances 0.000 description 1
- 229940045997 vitamin a Drugs 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 238000001238 wet grinding Methods 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 150000008498 β-D-glucosides Chemical class 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2445—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01004—Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01021—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01091—Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
Abstract
本发明涉及具有纤维素分解增强活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用这些多肽的方法。
Description
基于联邦资助研发作出的发明的相关权利申明
本发明是在美国能源部提供的基于主合同DE-AC36-98GO10337号、NREL子合同ZCO-30017-02号的政府支持下进行的。美国政府对本发明享有某些权益。
对序列表的援引
本申请包含计算机可读形式的序列表。本申请通过援引并入该序列表。对生物材料保藏物的援引
本申请包含对生物材料保藏物的援引,并通过援引并入该生物材料保藏物。
发明背景
发明领域
本发明涉及具有纤维素分解增强活性的分离的多肽和编码这些多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用这些多肽的方法。
相关技术的说明
纤维素是一种由简单糖类葡萄糖通过β-1,4-联结共价键合而成的聚合物。许多微生物可产生水解β-联结的葡聚糖的酶。这些酶包括内切葡聚糖酶(endoglucanases)、纤维二糖水解酶(cellobiohydrolases)和β-葡糖苷酶(β-glucosidases)。内切葡聚糖酶在随机的部位消化纤维素聚合物,使其暴露于纤维二糖水解酶的攻击之下。纤维二糖水解酶从该纤维素聚合物的末端顺序地释放纤维二糖分子。纤维二糖是一种水溶性的葡萄糖β-1,4-联结二聚物。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将含纤维素原料转化为乙醇具有大量原料易得、可理想地避免材料的焚烧和填埋,以及乙醇燃料的清洁性等优势。木材、农业残余物、草本作物,以及城市固体废物已被考虑用来作为生产乙醇的原料。这些材料主要由纤维素、半纤维素和木质素构成。一旦纤维素被转化为葡萄糖,葡萄糖即被酵母容易地转化为乙醇。
提高转化含纤维素原料的能力在本领域中将会是有利的。
WO 2005/074647公开了来自土生梭孢壳(Thielavia terrestris)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。
WO 2005/074656公开了来自橙色嗜热子囊菌(Thermoascus aurantiacus)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。
公布的美国专利申请序列号2007/0077630公开了来自里氏木霉(Trichoderma reesei)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。
本发明提供具有纤维素分解增强活性的多肽和编码这些多肽的多核苷酸。
发明内容
本发明涉及具有纤维素分解增强活性的分离的多肽,其选自下组:
(a)包含与SEQ ID NO:2的成熟多肽具有至少60%同一性之氨基酸序列的多肽;
(b)由与(i)SEQ ID NO:1的成熟多肽编码序列、(ii)包含SEQ ID NO:1的成熟多肽编码序列之基因组DNA序列、或(iii)(i)或(ii)的全长互补链在至少中等严紧度条件下杂交的多核苷酸所编码的多肽;
(c)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少60%同一性之核苷酸序列的多核苷酸所编码的多肽;和
(d)SEQ ID NO:2的成熟多肽包含一个或多个(数个)氨基酸的取代、缺失和/或插入的变体。
本发明还涉及编码具有纤维素分解增强活性的多肽的分离的多核苷酸,它们选自下组:
(a)编码包含与SEQ ID NO:2的成熟多肽具有至少60%同一性的氨基酸序列之多肽的多核苷酸;
(b)与(i)SEQ ID NO:1的成熟多肽编码序列、(ii)包含SEQ ID NO:1的成熟多肽编码序列之基因组DNA序列、或(iii)(i)或(ii)的全长互补链在至少中等严紧度条件下杂交的多核苷酸;
(c)包含与SEQ ID NO:1的成熟多肽编码序列具有至少60%同一性之核苷酸序列的多核苷酸;和
(d)编码SEQ ID NO:2的成熟多肽包含一个或多个(数个)氨基酸的取代、缺失和/或插入的变体的多核苷酸。
本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体、重组宿主细胞,以及产生具有纤维素分解增强活性的多肽的方法。
本发明还涉及抑制多肽在细胞中的表达的方法,包括对细胞施用或者在细胞中表达双链RNA(dsRNA)分子,其中该dsRNA包含本发明的多核苷酸的子序列。本发明还涉及这样的双链抑制性RNA(dsRNA)分子,其中任选地该dsRNA是siRNA或miRNA分子。
本发明还涉及用于降解或转化含纤维素材料的方法,包括:在有效量的此类具有纤维素分解增强活性的多肽的存在下用有效量的纤维素分解酶组合物处理含纤维素材料,其中与不存在所述具有纤维素分解增强活性的多肽时相比,该具有纤维素分解增强活性的多肽的存在增加含纤维素材料的降解。
本发明还涉及产生发酵产物的方法,包括:(a)在有效量的此类具有纤维素分解增强活性的多肽的存在下,用有效量的纤维素分解酶组合物糖化含纤维素材料,其中与不存在所述具有纤维素分解增强活性的多肽时相比,该具有纤维素分解增强活性的多肽的存在增加含纤维素材料的降解;(b)用一种或多种发酵微生物将步骤(a)的经糖化的含纤维素材料发酵以产生发酵产物;和(c)从发酵回收发酵产物。
本发明还涉及包含编码此类具有纤维素分解增强活性的多肽的分离的多核苷酸的植物。
本发明还涉及产生此类具有纤维素分解增强活性的多肽的方法,包括:(a)在有助于产生此类具有纤维素分解增强活性的多肽的条件下培养包含编码该多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。
本发明还涉及包含编码蛋白质的基因的核酸构建体,其中所述基因可操作地连接于编码信号肽的核苷酸序列,所述信号肽包含SEQ ID NO:2的氨基酸1-15或者由SEQ ID NO:2的氨基酸1-15组成,其中所述基因对于所述核苷酸序列而言是外源的。
附图简要说明
图1显示一种具有纤维素分解增强活性的土生梭孢壳NRRL 8126多肽的cDNA序列及推定的氨基酸序列(分别为SEQ ID NO:1和2)。
图2显示pTter61F的限制性酶切图。
图3显示pAlLo23的限制性酶切图。
图4显示pMJ04的限制性酶切图。
图5显示pCaHj527的限制性酶切图。
图6显示pMT2188的限制性酶切图。
图7显示pCaHj568的限制性酶切图。
图8显示pMJ05的限制性酶切图。
图9显示pSMai130的限制性酶切图。
图10显示米曲霉(Aspergillus oryzae)β-葡糖苷酶的天然信号序列的DNA序列及氨基酸序列(SEQ ID NO:37和38)。
图11显示特异腐质霉(Humicola insolens)内切葡聚糖酶V信号序列的DNA序列及氨基酸序列(SEQ ID NO:41和42)。
图12显示pSMai135的限制性酶切图。
定义
纤维素分解增强活性(cellulolytic enhancing activity):术语“纤维素分解增强活性”在此定义为增强具有纤维素分解活性的蛋白质对含纤维素材料的水解的生物学活性。为本发明的目的,纤维素分解增强活性是通过测量纤维素分解性蛋白质在下述条件下水解含纤维素材料所致的还原糖增加或纤维二糖与葡萄糖的总量增加来加以确定的:1-50mg总蛋白/g PCS中的纤维素,其中总蛋白包含80-99.5%w/w的纤维素分解蛋白/g PCS中的纤维素,及0.5-20%w/w的具有纤维素分解增强活性的蛋白质,50℃历时1-7天,与用相等的无纤维素分解增强活性的总蛋白加载量(1-50mg纤维素分解蛋白/g PCS中的纤维素)所进行的对照水解反应作比较。在一个优选的方面,加载的纤维素酶蛋白是在有3%总蛋白重量的米曲霉β-葡糖苷酶(根据WO02/095014在米曲霉中重组表达的)或3%总蛋白重量的烟曲霉(Aspergillusfumigatus)β-葡糖苷酶(根据WO 02/095014的实施例22在米曲霉中重组表达的)存在的CELLUCLAST 1.5L(Novozymes A/S,Denmark)的混合物,将其用作纤维素分解活性的来源。
所述具有纤维素分解增强活性的多肽具有SEQ ID NO:2的成熟多肽的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,进一步更优选至少90%,最优选至少95%,进一步最优选至少100%的纤维素分解增强活性。
所述具有纤维素分解增强活性的多肽以下述方式增强由具有纤维素分解活性的蛋白质所催化的含纤维素材料的水解:将为达到同样水解程度所需的纤维素分解酶的量减少优选至少0.1倍,更优选至少0.2倍、更优选至少0.3倍、更优选至少0.4倍、更优选至少0.5倍、更优选至少1倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、更优选至少10倍、更优选至少20倍、进一步更优选至少30倍、最优选至少50倍、进一步最优选至少100倍。
纤维素分解活性(cellulolytic activity):术语“纤维素分解活性”在本文中定义为水解含纤维素材料的生物学活性。纤维素分解蛋白可水解或水解羧甲基纤维素(CMC),从而降低温育混合物的粘度。由此造成的粘度下降可以用振动粘度计(例如Sofraser,France产的MIVI 3000)来测定。纤维素酶活性(以纤维素粘度单位(Cellulase Viscosity Unit,CEVU)作为量度)测定是通过测量样品降低羧甲基纤维素(CMC)溶液粘度的能力来确定样品中催化活性的量。测定在适合纤维素分解蛋白和底物的温度和pH进行。对于CELLUCLASTTM(Novozymes A/S,Denmark),进行测定的条件为40℃、于0.1M磷酸盐pH 9.0缓冲液中,历时30分钟,以CMC为底物(33.3g/L羧甲基纤维素Hercules 7LFD),且酶浓度为大约3.3-4.2CEVU/ml。CEVU活性是相对于公认的酶标准品,例如CELLUZYMETM Standard 17-1194(获自Novozymes A/S,Denmark)来计算的。
为本发明的目的,纤维素分解活性是通过测量在下述条件下纤维素分解性混合物对含纤维素材料的水解的增加来确定的:1-10mg纤维素分解蛋白质/g PCS中的纤维素,历时5-7天,50℃,与不加纤维素分解蛋白的对照水解相比较。
内切葡聚糖酶:术语“内切葡聚糖酶”在本文中定义为一种内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(诸如羧甲基纤维素和羟甲基纤维素)、地衣淀粉中的1,4-β-D-糖苷联结;混合型β-1,3葡聚糖如谷物(cereal)β-D-葡聚糖或木葡聚糖,和其他含纤维素性组分的植物材料中的β-1,4键的内水解(endohydrolysis)。为本发明的目的,内切葡聚糖酶活性是根据Ghose,1987,Pure and Appl.Chem.59:257-268所述的程序利用羧甲基纤维素(CMC)水解来确定的。
纤维二糖水解酶:术语“纤维二糖水解酶”在本文中定义为一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化水解纤维素、纤维寡糖、或任何含β-1,4-连接的葡萄糖的聚合物中1,4-β-D-葡糖苷联结,从链的还原端或非还原端释放纤维二糖。为本发明的目的,纤维二糖水解酶活性是依照Lever等,1972,Anal.Biochem.47:273-279和van Tilbeurgh等,1982,FEBSLetters 149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288中记载的程序加以测定的。在本发明中,Lever等人的方法被用来评估玉米秸秆中纤维素的水解,而van Tilbeurgh等人的方法被用于测定对一种荧光性二糖衍生物的纤维二糖水解酶活性。
β-葡糖苷酶:术语“β-葡糖苷酶”在本文中定义为一种β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化水解末端非还原性β-D-葡萄糖残基,释放β-D-葡萄糖。为本发明的目的,β-葡糖苷酶活性是根据Venturi等,2002,J.BasicMicrobiol.42:55-66记载的基本程序来测定的,只是使用了如本文所述的不同条件。一个单位的β-葡糖苷酶活性定义为:在100mM柠檬酸钠、0.01%20中,50℃、pH 5条件下每分钟从作为底物的4mM对硝基苯基-β-D-吡喃葡萄糖苷产生1.0微摩尔对硝基苯酚。
家族61糖苷水解酶:术语“家族61糖苷水解酶”或“家族GH61”在本文中定义为落入根据Henrissat B.,1991,A classification of glycosyl hydorlasesbased on amino-acid sequence similarities,Biochem.J.280:309-316以及Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification ofglycosyl hydorlases,Biochem.J.316:695-696所述的糖苷水解酶家族61的多肽。目前,Henrissat将GH61家族归于未分类之列,表明该家族所属的多肽的机制、催化性亲核体/碱、催化性质子供体以及3D结构等性质均系未知。GH61蛋白又被称为CEL61蛋白。
含纤维素材料:生物质的初生细胞壁中主要的多糖是纤维素,丰度第二高的是半纤维素,第三是果胶。在细胞停止生长后产生的次生细胞璧也含有多糖,并且被与半纤维素共价交联的多聚体木质素所增强。纤维素是脱水纤维二糖的同聚物,因此是一种直链β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,如木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖,具有复杂的分枝结构和一系列取代基。虽然纤维素一般是无定形的,但植物组织中发现的纤维素主要呈现为由平行葡聚糖链构成的不溶性晶体基质。半纤维素通常通过氢键连接于纤维素以及其他半纤维素上,这有助于细胞壁基质的稳定化。
含纤维素材料可以是任何含有纤维素的材料。纤维素通常存在于例如植株的茎、叶、果/种壳(hulls)、果/种皮(husks)和穗轴(cobs),或者树的叶、枝、和木材等之中。含纤维素材料可以是,但不限于,草质材料(herbaceousmaterial)、农业残余物(agricultural residues)、林业残余物(forestry residues),城市固体废物(municipal solid wastes)、废纸(waste paper),以及纸浆和造纸厂残余物(pulp and paper mill residues)。含纤维素材料可以是任何类型的生物质,包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(见例如Wiselogel等,1995,《Handbook on Bioethanol》(Charles E.Wyman编),第105-118页,Taylor & Francis,Washington D.C.;Wyman,1994,BioresourceTechnology 50:3-16;Lynd,1990,Applied Biochemistry and Biotechnology24/25:695-719;Mosier等,1999,Recent Progress in Bioconversion ofLignocellulosics,《Advances in Biochemical Engineering/Biotechnology》,T.Scheper总编,第65卷,第23-40页,Springer-Verlag,New York)。在本文中应该理解,纤维素可以是木素纤维素的形式,它是一种植物细胞壁材料,在混合的基质中包含木质素、纤维素和半纤维素。
在一个优选的方面,含纤维素材料是玉米秸秆(corn stover)。在另一个优选的方面,含纤维素材料是玉米纤维。在另一个优选的方面,含纤维素材料是玉米穗轴。在另一个优选的方面,含纤维素材料是稻草(rice straw)。在另一个优选的方面,含纤维素材料是纸和纸浆加工废物。在另一个优选的方面,含纤维素材料是木本或草本植物。在另一个优选的方面,含纤维素材料是甘蔗渣。
含纤维素材料可以直接使用,或者可以使用本领域已知的常规技术对其进行预处理。例如,物理预处理技术可包括各种类型的粉碎(milling)、辐射(irradiation)、汽蒸/蒸汽爆破(steaming/steam explosion)、和湿热分解作用(hydrothermolysis);化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳、和pH受控的湿热分解作用;而生物预处理技术可涉及施加溶木质素性微生物(参见,例如Hsu,T.-A.,1996,Pretreatment of biomass,《Handbook on Bioethanol:Production and Utilization》,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212;Ghosh,P.和Singh,A.,1993,Physicochemical and biological treatments for enzymatic/microbial conversionof lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,《Enzymatic Conversion ofBiomass for Fuels Production》,Himmel,M.E.,Baker,J.O.和Overend,R.P.编,ACS Symposium Series 566,American Chemical Society,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.和Tsao,G.T.,1999,Ethanol productionfrom renewable resources,《Advances in BiochemicalEngineering/Biotechnology》,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson,L.和Hahn-Hagerdal,B.,1996,Fermentation oflignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;以及Vallander,L.和Eriksson,K.-E.L.,1990,Production of ethanolfrom lignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
预处理的玉米秸秆:术语“PCS”或“预处理的玉米秸秆”在本文中定义为通过热和稀酸处理从玉米秸秆获得的含纤维素材料。为本发明的目的,PCS是通过本文中说明的方法制备的。
分离的多肽:本文所用的术语“分离的多肽”是指从一个来源分离的多肽。在一个优选的方面,所述多肽是通过SDS-PAGE测定为至少1%纯、优选至少5%纯、更优选至少10%纯、更优选至少20%纯、更优选至少40%纯、更优选至少60%纯、进一步更优选至少80%纯、最优选至少90%纯的。
基本上纯的多肽:术语“基本上纯的多肽”在本文是指这样的多肽制备物,其含有以重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,进一步更优选至多2%,最优选至多1%,进一步最优选至多0.5%的与其天然地或重组地相伴随的其他多肽物质。因此,优选的是,基本上纯的多肽以制备物中存在的总多肽物质的重量计是至少92%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、进一步更优选至少99%、最优选至少99.5%纯、进一步最优选100%纯的。本发明的多肽优选是基本上纯的形式,即,多肽制备物实质上不含与其天然地或重组地相伴随的其他多肽物质。这可以通过例如用公知的重组技术或通过经典的纯化方法制备所述多肽来实现。
成熟多肽:术语“成熟多肽”在本文中定义为经过翻译和任何翻译后修饰(如N末端加工、C末端截短、糖基化、磷酸化等)之后,处于其最终形式的具有纤维素分解增强活性的多肽。在一个优选的方面,基于SignalP程序所作的SEQ ID NO:2的氨基酸1-15为信号肽的预测,成熟多肽是SEQ ID NO:2的氨基酸16-317。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码成熟的具有纤维素分解增强活性的多肽的核苷酸序列。在一个优选的方面,基于SignalP程序所作的SEQ ID NO:1的核苷酸1-45编码信号肽的预测,成熟多肽编码序列是SEQ ID NO:1的核苷酸46-951。
同一性:两个氨基酸序列之间或者两个核苷酸序列之间的相关性用参数“同一性”来描述。
为本发明的目的,两个氨基酸序列之间同一性程度的确定使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open SoftwareSuite,Rice等,2000,Trends in Genetics 16:276-277),优选3.0.0或更新的版本中的Needle程序所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)。所用的可选参数为缺口形成罚分(gap openpenalty)10、缺口延伸罚分(gap extension penalty)0.5、和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。将Needle的标记为“longest identity”(“最长同一性”)(使用-nobrief(无简述)选项获得)的输出结果作为百分比同一性使用,它是这样计算出来的:
(相同的残基数x100)/(比对长度-比对中的缺口总数)
为本发明的目的,两个脱氧核糖核苷酸序列之间的同一性程度的确定使用如EMBOSS软件包(EMBOSS:The European Molecular Biology OpenSoftware Suite,Rice等,2000,同上),优选3.0.0或更新的版本中的Needle程序所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)。所用的可选参数为缺口形成罚分10、缺口延伸罚分0.5、和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将Needle的标记为“longestidentity”(“最长同一性”)(使用-nobrief选项获得)的输出结果作为百分比同一性使用,它是这样计算出来的:
(相同的脱氧核糖核苷酸数x100)/(比对长度-比对中的缺口总数)
同源序列:术语“同源序列”在本文中定义为:用SEQ ID NO:2的成熟多肽进行tfasty搜索(Pearson,W.R.,1999,《Bioinformatics Methods andProtocols》,S.Misener和S.A.Krawetz编,第185-219页)时,给出的E值(或称期望值)小于0.001的预测蛋白质。
多肽片段:术语“多肽片段”在本文中定义为从SEQ ID NO:2的成熟多肽的氨基端和/或羧基端缺失一个或多个(数个)氨基酸而得到的多肽;或其同源序列;其中所述片段具有纤维素分解增强活性。在一个优选的方面,片段含有SEQ ID NO:2的成熟多肽或其同源序列的至少255个氨基酸残基、更优选至少270个氨基酸残基、最优选至少285个氨基酸残基。
子序列:术语“子序列”在本文中定义为从SEQ ID NO:1的成熟多肽编码序列的5’端和/或3’端缺失了一个或多个(数个)核苷酸的核苷酸序列;或者其同源序列;其中所述子序列编码具有纤维素分解增强活性的多肽片段。在一个优选的方面,子序列含有SEQ ID NO:1的成熟多肽编码序列或其同源序列的至少765个核苷酸、更优选至少810个核苷酸、最优选至少855个核苷酸。
等位变体(allelic variant):术语“等位变体”是指基因的占据同一染色体座位的两种或更多种可选形式中的任一种。等位变异在天然情况下通过突变产生,并可导致群体中的多态性。基因突变可以是沉默的(被编码的多肽中没有变化),或者可以编码氨基酸序列被改变的多肽。多肽的等位变体是基因的等位变体所编码的多肽。
分离的多核苷酸:本文中所用的术语“分离的多核苷酸”是指从一个来源分离而来的多核苷酸。在一个优选的方面,所述多核苷酸通过琼脂糖凝胶电泳测定为至少1%纯、优选至少5%纯、更优选至少10%纯、更优选至少20%纯、更优选至少40%纯、更优选至少60%纯、进一步更优选至少80%纯、最优选至少90%纯。
基本上纯的多核苷酸:本文中所用的术语“基本上纯的多核苷酸”是指这样的多核苷酸制备物,其不含有其他无关或不需要的核苷酸,并且处于适合在经基因工程改造的蛋白质的生产系统中使用的形式。因此,基本上纯的多核苷酸含有以重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,进一步更优选至多2%,最优选至多1%,进一步最优选至多0.5%的与其天然地或重组地相伴随的其他多核苷酸物质。但是,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,如启动子和终止子。优选的是,基本上纯的多核苷酸以重量计为至少90%纯、优选至少92%纯、更优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少97%纯、进一步更优选至少98%纯、最优选至少99%纯、进一步最优选至少99.5%纯。本发明的多核苷酸优选是处于基本上纯的形式,即多核苷酸制备物基本上不含与其天然地或重组地相伴随的其他多核苷酸物质。多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或者上述来源的任意组合。
编码序列:当用于本文时,术语“编码序列”是指这样的核苷酸序列,它直接规定其蛋白质产物的氨基酸序列。编码序列的边界一般是由可读框决定的,后者通常以ATG起始密码子或其他可选的起始密码子如GTG及TTG开始,而以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的、或重组的核苷酸序列。
cDNA:术语“cDNA”在本文中定义为这样的DNA分子,它能够从获自真核细胞的成熟的、经剪接的mRNA分子通过逆转录制备得到。cDNA缺少在对应的基因组DNA中通常存在的内含子序列。最初的初级RNA转录物是mRNA的前体,它经历一系列步骤被加工之后作为成熟的、经剪接的mRNA出现。这些步骤包括通过一个称为剪接的过程去除内含子序列。因此,从mRNA衍生而来的cDNA缺少任何内含子序列。
核酸构建体:术语“核酸构建体”在用于本文时是指这样的单链或双链核酸分子:其是从天然存在的基因分离的,或者经过修饰而以原本不会存在于自然界中的方式包含核酸的片段,或者是合成的。当核酸构建体包含本发明的编码序列的表达所需的控制序列时,术语“核酸构建体”与术语“表达盒”是同义的。
控制序列:术语“控制序列”在本文中定义为包括编码本发明多肽的多核苷酸的表达所必需的所有组件。每个控制序列对于编码多肽的核苷酸序列而言,或者对于其它控制序列而言,可以是天然的或者外来的。这样的控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽(propeptide)序列、启动子、信号肽序列和转录终止子。在最低程度上,控制序列包括启动子以及转录和翻译终止信号。控制序列可以具有接头,用来引入特异性限制性位点以帮助将控制序列与编码多肽的核苷酸序列的编码区连接。
可操作地连接:术语“可操作地连接”在本文中是指这样一种构型,其中控制序列相对于多核苷酸序列的编码序列被置于合适的位置上,使得该控制序列指导多肽编码序列的表达。
表达:术语“表达”包含多肽产生过程中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”在本文中定义为一种线性或环状DNA分子,其包含编码本发明多肽的多核苷酸,且可操作地连接于为其表达提供条件的其他核苷酸。
宿主细胞:术语“宿主细胞”在用于本文时包括任何易于被包含本发明的多核苷酸的核酸构建体或表达载体所转化、转染、转导等的细胞类型。
修饰:术语“修饰”在本文中意指对由SEQ ID NO:2的成熟多肽组成的多肽或其同源序列进行的任何化学修饰;以及对编码此类多肽的DNA进行的遗传操作。修饰可以是一个或多个(数个)氨基酸的取代、缺失和/或插入,以及一个或多个(数个)氨基酸侧链的替换。
人工变体:当在本文中使用时,术语“人工变体”是指由这样的生物体所产生的具有纤维素分解增强活性的多肽:所述生物体表达SEQ ID NO:1的成熟多肽编码序列或其同源序列的修饰型多核苷酸序列。所述修饰型多核苷酸序列是对SEQ ID NO:1公开的多核苷酸序列或其同源序列通过修饰加以人工干预而获得的。
发明详细说明
具有纤维素分解增强活性的多肽
在第一个方面,本发明涉及包含如下所述的氨基酸序列或由这样的氨基酸序列组成,且具有纤维素分解增强活性的分离的多肽(下文称为“同源多肽):所述氨基酸序列与SEQ ID NO:2的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,进一步更优选至少90%,最优选至少95%,进一步最优选至少96%,至少97%,至少98%,或至少99%的同一性程度。在一个优选的方面,同源多肽包含如下所述的氨基酸序列或由这样的氨基酸序列组成:所述氨基酸序列与SEQ ID NO:2的成熟多肽有10个氨基酸、优选5个氨基酸、更优选4个氨基酸、进一步更优选3个氨基酸、最优选2个氨基酸、进一步最优选1个氨基酸不同。
本发明的多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体、或它们具有纤维素分解增强活性的片段。在一个优选的方面,所述多肽包含SEQ ID NO:2的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ IDNO:2的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:2的氨基酸16-317或其等位变体、或它们具有纤维素分解增强活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:2的氨基酸16-317。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸序列或其等位变体、或它们具有纤维素分解增强活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ IDNO:2的氨基酸16-317或其等位变体、或它们具有纤维素分解增强活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸16-317组成。
在第二个方面,本发明涉及由包含如下所述的核苷酸序列或由这样的核苷酸序列组成的多核苷酸所编码的、具有纤维素分解增强活性的分离的多肽:所述核苷酸序列在优选极低严紧度条件下,更优选低严紧度条件下,更优选中等极严紧度条件下,更优选中-高严紧度条件下,进一步更优选高严紧度条件下,最优选极高严紧度条件下与(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列之基因组DNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的全长互补链杂交(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第二版,Cold Spring Harbor,New York)。SEQ ID NO:1的成熟多肽编码序列的子序列含有至少100个连续的核苷酸,或者优选至少200个连续的核苷酸。而且,子序列可编码具有纤维素分解增强活性的多肽片段。在一个优选的方面,所述互补链是SEQ ID NO:1的成熟多肽编码序列的全长互补链。
可以利用SEQ ID NO:1的核苷酸序列或其子序列以及SEQ ID NO:2的氨基酸序列或其片段来设计核酸探针,根据本领域公知的方法从不同属或种的菌株中鉴定并克隆出编码具有纤维素分解增强活性的多肽的DNA。具体的,可以使用这样的探针,依照标准Southern印迹程序与感兴趣的属或种的基因组或cDNA进行杂交,来从其中鉴定和分离出相应的基因。这样的探针可以显著地短于整个序列,但其长度应当为至少14个、优选至少25个、更优选至少35个、最优选至少70个核苷酸。不过,优选的是核酸探针长度为至少100个核苷酸。例如,核酸探针长度可以为至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可以用更长的探针,例如优选至少600个核苷酸、更优选至少700个核苷酸、进一步更优选至少800个核苷酸、或最优选至少900个核苷酸长的核酸探针。DNA和RNA探针都可以使用。通常将探针加以标记用于检测相应的基因(例如用32P、3H、35S、生物素和抗生物素蛋白(avidin)标记)。本发明涵盖这样的探针。
因此,对于从这样的其他菌株制备的基因组DNA或者cDNA文库,可以从中筛选与上文描述的探针杂交且编码具有纤维素分解增强活性的多肽的DNA。来自这样的其他菌株的基因组或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来加以分离。对于来自所述文库的DNA或者分离的DNA,可以将其转移并固定在硝酸纤维素或者其他合适的载体材料上。为了鉴定与SEQ ID NO:1或其子序列同源的克隆或DNA,优选将所述载体材料用于Southern印迹中。
为本发明的目的,“杂交”表示所述核苷酸序列在极低到极高严紧度条件与对应于下述序列的带标记的核酸探针杂交:SEQ ID NO:1的成熟多肽编码序列;包含SEQ ID NO:1的成熟多肽编码序列之基因组DNA序列;其全长互补链;或它们的子序列。在这些条件下与所述核酸探针杂交的分子可以用例如X射线胶片来检测。
在一个优选的方面,所述核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一个优选的方面,所述核酸探针是SEQ ID NO:1的核苷酸46-951。在另一个优选的方面,所述核酸探针是编码SEQ ID NO:2的多肽的多核苷酸,或其子序列。在另一个优选的方面,所述核酸探针是SEQ ID NO:1。在另一个优选的方面,所述核酸探针是大肠杆菌NRRL B-50044中所含的质粒pTter61F中包含的多核苷酸序列,其中其多核苷酸编码具有纤维素分解增强活性的多肽。在另一个优选的方面,所述核酸探针是大肠杆菌NRRLB-50044中所含的质粒pTter61F中包含的成熟多肽编码区。
对于长度为至少100个核苷酸的长探针而言,极低到极高严紧度条件定义为:42℃下在5X SSPE,0.3% SDS,200μg/ml变性剪切的鲑鱼精子DNA,及25%甲酰胺(对于极低和低严紧度)、35%甲酰胺(对于中等和中-高严紧度)、或50%甲酰胺(对于高和极高严紧度)的条件下,按照标准的Southern印迹程序以最优条件进行历时12-24小时的预杂交和杂交。
对于长度为至少100个核苷酸的长探针而言,最后在优选45℃(极低严紧度)、更优选50℃(低严紧度)、更优选55℃(中等严紧度),更优选60℃(中-高严紧度)、进一步更优选65℃(高严紧度)、最优选70℃(极高严紧度)下,用2X SSC、0.2% SDS将载体材料洗涤3次,每次15分钟。
对于长度为约15个核苷酸到约70个核苷酸的短探针而言,严紧度条件定义为:在比使用根据Bolton和McCarthy(1962,Proceedings of theNational Academy of Sciences USA 48:1390)的计算方法算出的Tm低大约5℃到大约10℃的温度下,在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5% NP-40、1X Denhardt氏溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP和0.2mg/ml酵母RNA中,按照标准的Southern印迹程序以最优条件进行历时12-24小时的预杂交、杂交和杂交后洗涤。
对于长度为约15个核苷酸到约70个核苷酸的短探针而言,在比算出的Tm低5℃到10℃的温度下,用6X SCC+0.1%SDS洗涤1次15分钟,再用6X SSC洗涤两次,每次15分钟。
在第三个方面,本发明涉及由包含如下所述核苷酸序列或者由这样的核苷酸序列组成的多核苷酸所编码,且具有纤维素分解增强活性的分离的多肽:所述核苷酸序列与SEQ ID NO:1的成熟多肽编码序列具有优选至少60%,更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、进一步更优选至少90%、最优选至少95%、进一步最优选96%、97%、98%或99%的同一性程度,且编码活性多肽。参见本文中“多核苷酸”部分。
在第四个方面,本发明涉及包含SEQ ID NO:2的成熟多肽中一个或多个(数个)氨基酸的取代、缺失和/或插入的人工变体;或其同源序列。优选地,氨基酸改变在性质上是不重要的,即为:不会显著影响蛋白质的折叠和/或活性的保守氨基酸取代或者插入;小的缺失,通常为1个到大约30个氨基酸的缺失;小的氨基端或羧基端延伸,如一个氨基端的甲硫氨酸残基;最多约20-25个残基的小接头肽;或通过改变静电荷或其他功能来方便纯化的小延伸,如多聚组氨酸序列段、抗原性表位或结合结构域。
保守取代的例子是下述各组之内进行的取代:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。一般不会改变特定活性的氨基酸取代是本领域已知的,并且在例如H.Neurath和R.L.Hill,1979于The Proteins,Academic Press,NewYork一书中有描述。最常出现的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20种标准的氨基酸之外,可以用非标准氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)来取代野生型多肽的氨基酸残基。可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸、以及非天然氨基酸来取代氨基酸残基。“非天然氨基酸”系在蛋白质合成之后被修饰过,和/或在其侧链中具有与标准氨基酸不同的化学结构。非天然氨基酸可以是化学合成的,优选地是可商购的,包括哌啶酸(pipecolicacid)、噻唑烷羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸、和3,3-二甲基脯氨酸。
或者,氨基酸改变具有这样的性质,以至于多肽的物理化学性质被改变。例如,氨基酸改变可改善多肽的热稳定性、改变底物特异性、改变最适pH,等等。
可以根据本领域已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的关键氨基酸。在上述后一种技术中,在分子中每个残基处引入单一的丙氨酸突变,然后测试所得的突变分子的生物学活性(即纤维素分解增强活性),来鉴定对该分子的活性有关键作用的氨基酸残基。另见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其他生物学相互作用也可以通过对结构的物理学分析来加以确定,如通过核磁共振、晶体学、电子衍射或光亲和标记等技术,与针对推定的接触部位氨基酸的突变相结合来加以确定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。也可以分析与本发明多肽之亲缘多肽的同一性,据此推测关键氨基酸的身份。
可以使用已知的诱变、重组和/或改组方法来进行和测试单个或多个氨基酸的取代、缺失和/或插入,然后进行相关的筛选程序,例如Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625中公开的那些。其它可用的方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochem.30:10832-10837;美国专利5,223,409;WO 92/06204)和区域定向诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。
诱变/改组方法可以与高通量自动化筛选方法结合起来用于检测宿主细胞表达的经克隆、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。对于编码活性多肽的诱变DNA,可以使用本领域中的标准方法从宿主细胞中加以回收并快速测序。这些方法使人们能够快速地确定感兴趣的多肽中个别氨基酸残基的重要性,而且可以用于结构未知的多肽。
SEQ ID NO:2的成熟多肽(如SEQ ID NO:2的氨基酸19-317)的氨基酸取代、缺失和/或插入的总数为10个、优选9个、更优选8个、更优选7个、更优选至多6个、更优选5个、更优选4个、进一步更优选3个、最优选2个、进一步最优选1个。
具有纤维素分解增强活性的多肽的来源
具有纤维素分解增强活性的本发明的多肽可以从任何属的微生物获得。为本发明的目的,术语“从...获得”(或“获自...”)在本文中与特定的来源联用时,意思应该是指由核苷酸序列编码的多肽是由所述来源产生的,或者是由插入了来自该来源的所述核苷酸序列的菌株产生的。在一个优选的方面,从特定来源获得的多肽是胞外分泌的。
具有纤维素分解增强活性的本发明的多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,诸如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)的具有纤维素分解增强活性的多肽,或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏球菌属(Neisseria)或尿枝原体属(Ureaplasma)的具有纤维素分解增强活性的多肽。
在一个优选的方面,所述多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、缓慢芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)的具有纤维素分解增强活性的多肽。
在另一个优选的方面,所述多肽是似马链球菌(Streptococcusequisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)的具有纤维素分解增强活性的多肽。
在另一个优选的方面,所述多肽是不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)的具有纤维素分解增强活性的多肽。
具有纤维素分解增强活性的本发明的多肽还可以是真菌多肽,更优选酵母多肽,如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)的具有纤维素分解增强活性的多肽;或者更优选丝状真菌多肽,诸如枝顶孢霉属(Acremonium)、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳菌属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角属(Claviceps)、旋孢腔菌属(Cochliobolus)、Coprinopsis、Coptotermes、棒囊壳属(Corynascus)、栗疫病菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、网孢菌属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙菌属(Irpex)、香菇属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、Trichophaea、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)或炭角菌属(Xylaria)的具有纤维素分解增强活性的多肽。
在一个优选的方面,所述多肽是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)的具有纤维素分解增强活性的多肽。
在另一个优选的方面,所述多肽是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporium pannicola、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库成镰孢(Fusariumcrookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、灰色腐质酶(Humicola grisea)、特异腐质霉、疏棉状腐质霉(Humicola lanuginosa)、乳白耙菌(Irpex lacteus)、米赫毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)的具有纤维素分解增强活性的多肽。
在另一个优选的方面,所述多肽是无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielaviaaustraleinsis)、Thielavia fimeti、小孢子梭孢壳(Thielavia microspora)、Thielaviaovispora、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielaviasetosa)、Thielavia subthermophila或土生梭孢壳的具有纤维素分解增强活性的多肽。
在一个更优选的方面,所述多肽是土生梭孢壳的具有纤维素分解增强活性的多肽。在一个最优选的实施方案中,所述多肽是土生梭孢壳NRRL8126的具有纤维素分解增强活性的多肽,例如包含SEQ ID NO:2的氨基酸序列的多肽,或它的片段,例如成熟蛋白。
应当理解的是,就前文所述的物种而言,本发明涵盖了它们的完全和不完全状态,以及其它分类学上的等同物,例如无性型,不管它们已知的种名是什么。本领域技术人员可以很容易地识别出合适的等同物的身份。
公众可以在若干保藏机构容易地获取这些物种的菌株,这样的机构诸如美国典型培养物保藏中心(ATCC)、德意志微生物和细胞培养物保藏中心(DSM)、真菌菌种保藏中心(CBS)和北方区域研究中心农业研究机构专利培养物保藏中心(NRRL)。
此外,还可以使用上文所述的探针,从包括从自然界(例如土壤、堆肥、水等等)分离的微生物在内的来源鉴定和获取这样的多肽。用于从天然生境分离微生物的技术是本领域中公知的。然后可以通过类似地筛选此类微生物的基因组文库或cDNA文库来获得所述多核苷酸。一旦用探针检测到了编码多肽的多核苷酸序列,就可以使用本领域普通技术人员公知的技术(参见例如Sambrook等,1989同上)分离或者克隆该多核苷酸。
本发明的多肽还包括融合的多肽或者可切割的融合多肽,其中另一多肽融合在所述多肽或其片段的N-末端或C-末端。融合的多肽是通过将编码另一多肽的核苷酸序列(或其部分)融合到本发明的核苷酸序列(或其部分)而产生的。产生融合多肽的技术是本领域已知的,包括将编码各多肽的编码序列连接起来使它们符合阅读框,并使得被融合的多肽的表达处于相同的启动子和终止子的控制之下。
融合多肽还可以包含切割位点。融合蛋白一旦被分泌,该位点就被切割,从融合蛋白中释放出具有纤维素分解增强活性的多肽。切割位点的实例包括但不限于:Kex2位点,其编码二肽Lys-Arg(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991,Biotechnology 9:378-381);Ile-(Glu或Asp)-Gly-Arg位点,其被因子Xa蛋白酶在精氨酸残基之后切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点,其被肠激酶在赖氨酸之后切割(Collins-Racie等,1995,Biotechnology 13:982-987);His-Tyr-Glu位点或His-Tyr-Asp位点,其被Genenase I切割(Carter等,1989,Proteins:Structure,Function,and Genetics 6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点,其被凝血酶在Arg之后切割(Stevens,2003,Drug Discovery World 4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其被TEV蛋白酶在Gln之后切割(Stevens,2003,同上);以及Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其被一种基因工程形式的人鼻病毒3C蛋白酶在Gln之后切割(Stevens,2003,同上)。
多核苷酸
本发明还涉及分离的多核苷酸,它们包含编码本发明具有纤维素分解增强活性的多肽的核苷酸序列或者由这样的核苷酸序列组成。
在一个优选的方面,所述核苷酸序列包含SEQ ID NO:1或者由其组成。在另一个更优选的方面,所述核苷酸序列包含大肠杆菌NRRL B-50044所含的质粒pTter61F中包含的序列,或者由该序列组成。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:1的成熟多肽编码序列,或者由其组成。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:1的氨基酸46-951,或者由其组成。在另一个更优选的方面,所述核苷酸序列包含大肠杆菌NRRL B-50044所含的质粒pTter61F中包含的成熟多肽编码序列,或者由该序列组成。本发明还涵盖编码这样的核苷酸序列,它们编码包含SEQ IDNO:2的氨基酸序列或其成熟多肽或由SEQ ID NO:2的氨基酸序列或其成熟多肽组成的多肽,并且与SEQ ID NO:1或其成熟多肽编码序列存在基于遗传密码简并性的差异。本发明还涉及SEQ ID NO:1的编码SEQ ID NO:2的具有纤维素分解增强活性的片段的子序列。
本发明还涉及突变的多核苷酸,其包含SEQ ID NO:1的成熟多肽编码序列中至少一处突变或由其构成,其中突变的核苷酸序列编码SEQ ID NO:2的成熟多肽。
用于分离或克隆编码多肽的多核苷酸的技术是本领域已知的,包括从基因组DNA分离,从cDNA制备,或它们的组合。从这样的基因组DNA克隆本发明的多核苷酸可以例如这样实现:通过使用公知的聚合酶链式反应(PCR)或对表达文库进行抗体筛选以检测具有共同的结构特征的克隆的DNA片段。参见例如Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其它核酸扩增程序诸如连接酶链式反应(LCR)、连接激活的转录(LAT)和基于核苷酸序列的扩增(NASBA)。多核苷酸可以从梭孢壳属的菌株或其它的或近缘的生物体分离,因此,例如,可以是所述核苷酸序列的多肽编码区域的等位变体或种变体(speciesvariant)。
本发明还涉及包含下述核苷酸序列或由其组成的分离的多核苷酸,所述核苷酸序列与SEQ ID NO:1的成熟多肽编码序列具有优选至少60%的同一性程度、更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、进一步更优选至少90%、最优选至少95%、进一步最优选至少96%、至少97%、至少98%、或至少99%的同一性,并且编码活性多肽。
为了合成与所述多肽基本上相似的多肽,可能需要对编码本发明的多肽的核苷酸序列进行修饰。术语与多肽“基本上相似”是指所述多肽的非天然存在的形式。这些多肽与分离自其天然来源的多肽可能存在一些经过工程化改造的差异,例如,在特异性活性、热稳定性、最适pH等方面有所不同的人工变体。变体序列可以基于作为SEQ ID NO:1的成熟多肽编码序列呈示的核苷酸序列而构建,例如其子序列,和/或通过导入这样的核苷酸取代来构建:此类核苷酸取代不会使该核苷酸序列编码的多肽具有其它氨基酸序列,而是对应于要用来产生酶的宿主生物体的密码子选择;或者可以通过引入可能产生不同的氨基酸序列的核苷酸取代来构建。核苷酸取代的一般说明可参见例如Ford等,1991,Protein Expression and Purification 2:95-107。
本领域技术人员将容易想到,可以在对于分子的功能有关键作用的区域之外进行这样的取代,而仍然产生活性的多肽。对于由本发明分离的多核苷酸编码的多肽的活性所必需的、因此优选不予以取代的氨基酸残基,可以根据本领域已知的程序,诸如定点诱变或丙氨酸分区诱变(参见例如Cunningham和Wells,1989,同上),来加以鉴定。在后一种技术中,在分子中每一个带正电的残基处引入突变,并测试所得的突变分子的纤维素分解增强活性,从而鉴定出对该分子活性有关键作用的氨基酸残基。还可以通过对使用核磁共振分析、晶体学或光亲和标记等技术(参见例如de Vos等,1992,同上文;Smith等,1992,同上文;Wlodaver等,1992,同上文)所确定三维结构的分析来确定底物-酶相互作用的位点。
本发明还涉及如下所述的编码本发明多肽的分离的多核苷酸:所述多核苷酸在如本文定义的极低严紧度条件下,优选低严紧度条件下,更优选中等严紧度条件下,更优选中-高严紧度条件下,进一步更优选高严紧度条件下,最优选极高严紧度条件下与(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列之基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和子序列杂交(Sambrook等,1989,同上文)。在一个优选的方面,所述互补链是SEQ ID NO:1的成熟多肽编码序列的全长互补链。
本发明还涉及通过下述方式获得的分离的多核苷酸:(a)使DNA群体在极低、低、中等、中-高、高、或极高严紧度条件下与(i)SEQ ID NO:1的成熟多肽编码序列;(ii)包含SEQ ID NO:1的成熟多肽编码序列之基因组DNA序列;或(iii)(i)或(ii)的全长互补链杂交,且(b)分离编码具有纤维素分解增强活性的多肽的杂交多核苷酸。在一个优选的方面,所述互补链是SEQ IDNO:1的成熟多肽编码序列的全长互补链。
核酸构建体
本发明还涉及核酸构建体,其包含与一种或多种(数种)控制序列可操作连接的本发明的分离的多核苷酸,所述控制序列指导编码序列在合适的宿主细胞中在与这些控制序列相容的条件下表达。
可以对编码本发明多肽的分离的多核苷酸进行多种方式的操作以便于表达所述多肽。取决于表达载体,在插入载体之前对多核苷酸的序列进行操作可能是理想的或者必要的。使用重组DNA方法修饰多核苷酸序列的技术是本领域公知的。
控制序列可以是合适的启动子序列,启动子序列是被宿主细胞所识别来表达编码本发明多肽的多核苷酸的核苷酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子序列可以是任何在所选择的宿主细胞中显示转录活性的核苷酸序列,包括突变的、截短的和杂合的启动子,而且可以从对宿主细胞而言为同源或异源的胞外或胞内多肽获得。
适于指导本发明的核酸构建体的转录,尤其是在细菌宿主细胞中转录的启动子的例子是获自大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、以及原核β-内酰胺酶基因的启动子(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731),和tac启动子(DeBoer等,1983,Proceedings of the National Academy of SciencesUSA 80:21-25)。Scientific American,1980,242:74-94中″Useful proteins fromrecombinant bacteria″和Sambrook等,1989(同上)中描述了其它启动子。
适于在丝状真菌宿主细胞中指导本发明的核酸构建体的转录的启动子的实例是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶;以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体);以及它们的突变、截短和杂合的启动子。
在酵母宿主中,有用的启动子是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶的基因获得的。对酵母宿主细胞有用的其他启动子在Romanos等,1992,Yeast 8:423-488中有记载。
控制序列还可以是合适的转录终止子序列。终止子序列是被宿主细胞识别来终止转录的序列。终止子序列可操作地连接于编码多肽的核苷酸序列的3’末端。任何可在所选的宿主细胞中发挥功能的终止子都可以用于本发明。
优选的用于丝状真菌宿主细胞的终止子是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶的基因获得的。
优选的用于酵母宿主细胞的终止子是从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得的。对酵母宿主细胞有用的其他终止子在Romanos等,1992(同上)中有记载。
控制序列也可以是合适的前导序列,前导序列是mRNA中的一种不被翻译的区域,它对于宿主细胞进行的翻译而言是重要的。前导序列可操作地连接于编码多肽的核苷酸序列的5’末端。任何可在所选择的宿主细胞中发挥功能的前导序列都可以用于本发明。
优选的用于丝状真菌宿主细胞的前导序列是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得的。
用于酵母宿主细胞的前导序列是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得的。
控制序列还可以是聚腺苷酸化序列,聚腺苷酸化序列是一段与核苷酸序列的3’末端可操作连接的序列,转录后被宿主细胞所识别,作为向被转录的mRNA添加聚腺苷酸残基的信号。任何可在所选择的宿主细胞中发挥功能的聚腺苷酸化序列都可以用于本发明。
优选的用于丝状真菌宿主细胞的聚腺苷酸化序列是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基因获得的。
Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990记载了在酵母宿主细胞中有用的聚腺苷酸化序列。
控制序列还可以是信号肽编码序列,其编码的氨基酸序列连接于多肽的氨基末端,并引导被编码的多肽进入细胞的分泌途径。核苷酸序列的编码序列的5’端可以固有地包含信号肽编码序列,该序列天然地以符合翻译阅读框的方式连接于编码序列中编码分泌型多肽的区段。或者,编码序列的5’端可以包含对该编码序列而言为外源的信号肽编码序列。在编码序列天然地不包含信号肽编码序列的场合,可能需要外源信号肽编码序列。或者,可以简单地用外源信号肽编码序列取代天然信号肽编码序列以增强多肽的分泌。然而,引导被表达的多肽进入所选的宿主细胞的分泌途径,即分泌到培养基中的任何信号肽编码序列都可以用于本发明。
对细菌宿主细胞有效的信号肽编码序列是从芽孢杆菌NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、和枯草芽孢杆菌prsA的基因获得的信号肽编码序列。Simonen和Palva,1993,Microbiological Reviews 57:109-137记载了其它信号肽。
对丝状真菌宿主细胞有效的信号肽编码序列是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、和疏棉状腐质霉脂肪酶的基因获得的信号肽编码序列。
对酵母宿主细胞有用的信号肽是从酿酒酵母α-因子和酿酒酵母转化酶获得的。其它有用的信号肽编码序列在Romanos等,1992,同上文中有记载。
在一个优选的方面,信号肽包含SEQ ID NO:2的氨基酸1-15或者由SEQ
ID NO:2的氨基酸1-15组成。在另一个优选的方面,信号肽编码序列包含SEQ ID NO:1的核苷酸1-45或者由SEQ ID NO:1的核苷酸1-45组成。
控制序列还可以是前肽编码序列,其编码位于多肽的氨基末端的氨基酸序列。所得的多肽被称为酶原(proenzyme)或原多肽(propolypeptide)(或者在某些情况下称为酶原(zymogen))。前肽通常是没有活性的,并且通过将前肽从原多肽中催化或自催化切割出来可以转化为成熟的活性多肽。前肽编码序列可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶的基因获得(WO 95/33836)。
在信号肽和前肽序列都存在于多肽氨基末端的场合,前肽序列位于多肽氨基末端的相邻位置,而信号肽序列位于前肽序列的氨基末端的相邻位置。
添加这样的调控序列可能也是理想的:该序列容许相对于宿主细胞的生长调节多肽的表达。调控系统的例子有导致基因的表达响应于化学或物理刺激(包括调控性化合物的存在)而开启或关闭的那些调控系统。原核系统中的调控系统包括lac、tac、和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调控序列。其他调控序列的例子有使基因能够扩增的调控序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因,和在重金属存在下被扩增的金属硫蛋白基因。在这些场合,编码多肽的核苷酸序列将与调控序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。可以将本文中描述的各种核酸和控制序列连接起来产生重组表达载体,后者可包括一个或多个(数个)便利的限制性位点以便于在这些位点上插入或替换编码多肽的核苷酸序列。或者,可以将核苷酸序列或包含该序列的核酸构建体插入合适的表达用载体来表达本发明的多核苷酸序列。在生成表达载体的过程中,将编码序列置于载体中使得该编码序列与合适的表达用控制序列可操作地连接。
重组表达载体可以是任何可便利地进行重组DNA程序并且能够带来核苷酸序列的表达的载体(例如质粒或病毒)。载体的选择通常将取决于载体与该载体要导入的宿主细胞的相容性。载体可以是线性的或者闭合环状的质粒。
所述载体可以是自主复制的载体,即作为染色体外实体存在,其复制不依赖于染色体复制的载体,例如质粒、染色体外元件、微型染色体、或人工染色体。载体可含有任何用于保证自我复制的工具。或者,载体可以是这样的载体,当它被导入宿主细胞时,整合到基因组中并随同它整合到其中的染色体一起复制。另外,可以使用单一的载体或质粒,或两个或更多个共同包含要导入宿主细胞基因组的总DNA的载体或质粒,或者转座子。
本发明的载体优选含有一个或多个(数个)选择标记,这些标记容许容易地选择经过转化、转染、转导等的细胞。选择标记是这样的基因,其产物可提供杀生物剂或病毒抗性、对重金属的抗性,对营养缺陷型的原养性,等等。
细菌选择标记的例子有来自枯草芽孢杆菌或者地衣芽孢杆菌的dal基因,或者赋予抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。用于酵母宿主细胞的合适标记有ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶)、sC(硫酸腺苷转移酶),和trpC(邻氨基苯甲酸合酶),以及它们的等同物。优选用于曲霉细胞的是构巢曲霉或米曲霉的amdS和pyrG基因,以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选包含容许载体整合到宿主细胞的基因组或者容许载体在细胞中不依赖基因组自主复制的元件。
为了整合到宿主细胞基因组中,载体可能依赖多核苷酸的编码多肽的序列或者载体的任何其它元件来通过同源或异源重组整合到基因组中。或者,载体可含有附加的核苷酸序列,用来指导通过同源重组在染色体上的精确位置整合到宿主细胞的基因组中。为了增加在精确位置上整合的机率,整合元件优选应含有足够数目的与相应靶序列具有高度同一性的核酸,诸如100-10,000个碱基对,优选400-10,000个碱基对,最优选800-10,000个碱基对,以提高同源重组的概率。整合元件可以是任何与宿主细胞基因组中的靶序列同源的序列。此外,整合元件可以是非编码的或者编码的核苷酸序列。此外,载体可以通过非同源重组整合到宿主细胞基因组中。
为了自主复制,载体可进一步包含复制起点,该起点使得载体能够在所讨论的宿主细胞中自主地复制。复制起点可以是在细胞中发挥功能的任何介导自主复制的质粒复制子。术语“复制起点”或“质粒复制子”在本文中定义为使质粒或载体能够在体内复制的核苷酸序列。
细菌复制起点的实例有容许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及容许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于在酵母宿主细胞中的复制起点的例子有2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合,以及ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的例子有AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。AMA1基因的分离,以及包含该基因的质粒或载体的构建,可以根据WO 00/24883中公开的方法来实现。
可以向宿主细胞中插入本发明多核苷酸的多于一个拷贝以增加基因产物的生产。可以通过下述方法获得多核苷酸的拷贝数的增加:向宿主细胞基因组中插入至少一个额外拷贝的序列;或者纳入伴随该多核苷酸的可扩增选择标记基因,由此通过在合适的选择剂的存在下培养细胞,可以选择出含有扩增拷贝数的选择标记基因,从而也就含有更多拷贝的所述多核苷酸的细胞。
用于连接上述元件来构建本发明的重组表达载体的程序是本领域技术人员公知的(参见例如Sambrook等,1989,同上文)。
宿主细胞
本发明还涉及重组宿主细胞,它们包含本发明的分离的多核苷酸,有利地用于多肽的重组生产中。将包含本发明多核苷酸的载体导入宿主细胞使得载体作为染色体整合子或者如前文所述的自复制的染色体外载体被保持。术语“宿主细胞”涵盖亲本细胞的任何因复制过程中的突变而与亲本细胞不同的后代。宿主细胞的选择在很大程度上将取决于编码多肽的基因及其来源。
宿主细胞可以是任何在本发明的多肽的重组生产中有用的细胞,例如原核生物或真核生物。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属和海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏球菌属或尿枝原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞。本发明的实践中可以使用的芽孢杆菌属细胞包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、缓慢芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在一个优选的方面,所述细菌宿主细胞是解淀粉芽孢杆菌、缓慢芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在一个更优选的方面,所述细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是枯草芽孢杆菌细胞。
细菌宿主细胞也可以是任何链球菌属细胞。本发明的实践中可以使用的链球菌属细胞包括但不限于似马链球菌、酿脓链球菌、乳房链球菌、和马链球菌兽瘟亚种细胞。
在一个优选的方面,所述细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞也可以是任何链霉菌属细胞。本发明的实践中可以使用的链霉菌属细胞包括但不限于不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌和浅青紫链霉菌细胞。
在一个优选的方面,所述细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是天蓝色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是浅青紫链霉菌细胞。
向芽孢杆菌属细胞中导入DNA可以通过例如原生质体转化(参见例如Chang和Cohen,1979,Molecular General Genetics 168:111-115)、使用感受态细胞(参见例如Young和Spizizen,1961,Journal of Bacteriology 81:823-829,或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology56:209-221)、通过电穿孔(参见例如Shigekawa和Dower,1988,Biotechniques6:742-751),或通过接合(参见例如Koehler和Thorne,1987,Journal ofBacteriology 169:5271-5278)来实现。向大肠杆菌细胞中导入DNA可以通过例如原生质体转化(参见例如Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见例如Dower等,1988,Nucleic Acids Res.16:6127-6145)来实现。向链霉菌属细胞中导入DNA可以通过例如原生质体转化和电穿孔来实现(参见例如Gong等,2004,Folia Microbiol.(Praha)49:399-405)、接合(参见例如Mazodier等,1989,J.Bacteriol.171:3583-3585)、或转导(参见例如Burke等,2001,Proc.Natl.Acad.Sci.USA 98:6289-6294)来实现。向假单胞菌属细胞中导入DNA可以通过例如电穿孔(参见例如Choi等,2006,J.Microbiol.Methods 64:391-397)、或接合(参见例如Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)来实现。向链球菌属细胞中导入DNA可以通过例如天然感受态(参见例如Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297)、原生质体转化(参见例如Catt和Jollick,1991,Microbios.68:189-2070)、电穿孔(参见例如Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)、或接合(参见例如Clewell,1981,Microbiol.Rev.45:409-436)来实现。尽管如此,本领域已知的任何用于将DNA导入宿主细胞的方法都可以使用。
宿主细胞也可以是真核生物,诸如哺乳动物、昆虫、植物、或真菌细胞。
在一个优选的方面,所述宿主细胞是真菌细胞。本文所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth等在Ainsworth and Bisby’sDictionary of The Fungi,第八版,1995,CAB International,University Press,Cambridge,UK中定义的),和卵菌门(Oomycota)(如Hawksworth等,1995,同上文,第171页引用的)等门,以及全部有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等,1995,同上文)。
在一个更优选的方面,真菌宿主细胞是酵母细胞。本文所用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子孢子囊酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在将来可能有所改变,为了本发明的目的,酵母将如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.和Davenport,R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述加以定义。
在一个进一步更优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。
在一个最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowia lipolytica)细胞。
在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌(Eumycota)和卵菌(Oomycota)亚门的所有丝状形式(如Hawksworth等,1995,同上文定义)。丝状真菌的一般特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复杂多糖组成的菌丝壁。营养生长是通过菌丝延伸,且碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养生长是通过单细胞菌体的芽殖,且碳分解代谢可以是发酵的。
在一个进一步更优选的方面,丝状真菌宿主细胞枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、网孢菌属、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。
在一个更优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个更优选的方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporiumpannicola、Chrysosporium queenslandicum、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳、长绒毛栓菌(Trametes villosa)、杂色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
真菌细胞可以用包括方式本身已知的原生质体形成、原生质体转化和细胞壁再生的方法来加以转化。用于曲霉属和木霉属宿主细胞转化的合适方法描述于EP 238023和Yelton等,1984,Proceedings of the National.Academy of Sciences USA 81:1470-1474。Malardier等,1989,Gene 78:147-156和WO 96/00787描述了转化镰孢属的种的合适方法。酵母可用Becker和Guarente在Abelson,J.N.和Simon,M.I.编的Guide to Yeast Genetics andMolecular Biology,Methods in Enzymology,第194卷,第182-187页,Academic Press,New York;Ito等,1983,Journal of Bacteriology 153:163;和Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920中所述的方法转化。
生产方法
本发明还涉及生产本发明的多肽的方法,所述方法包括:(a)在有助于产生所述多肽的条件下培养细胞,所述细胞以野生型形式可产生所述多肽;和(b)回收该多肽。在一个优选的方面,所述细胞属于梭孢壳属。在一个更优选的方面,所述细胞是土生梭孢壳。在一个更优选的方面,所述细胞是土生梭孢壳NRRL 8126。
本发明还涉及生产本发明的多肽的方法,所述方法包括:(a)在有助于产生所述多肽的条件下培养如本文所述的重组宿主细胞,和(b)回收所述多肽。
本发明还涉及生产本发明的多肽的方法,所述方法包括:(a)在有助于产生所述多肽的条件下培养如本文所述的重组宿主细胞,其中该宿主细胞包含在SEQ ID NO:1的成熟多肽编码序列中具有至少1个突变的突变核苷酸序列,其中所述突变的核苷酸序列编码包含SEQ ID NO:2的成熟多肽或由其组成的多肽;和(b)回收所述多肽。
在本发明的生产方法中,用本领域中公知的方法在适于多肽产生的营养培养基中培养细胞。例如,可在实验室或工业发酵罐中通过摇瓶培养、和小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)培养细胞,这在合适的培养基中和使多肽能被表达和/或分离的条件下进行。用本领域中已知的程序,在含有碳源和氮源和无机盐的合适营养培养基中进行培养。合适的培养基可从商业供应商得到或根据公开的组成(例如,于美国典型培养物保藏中心的目录中)制备。如果多肽分泌到营养培养基中,则可直接从培养基中回收该多肽。如果该多肽不被分泌,则可从细胞裂解产物中回收它。
可使用本领域中已知的、对所述多肽为特异性的方法检测所述多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可如本文所述地使用酶测定法确定多肽的活性。
可以使用本领域已知的方法回收得到的多肽。例如,可以通过常规方法,包括,但不限于,离心、过滤、抽提、喷雾干燥、蒸发或沉淀将多肽从营养培养基中回收出来。
本发明的多肽可通过本领域中已知的多种方法进行纯化,所述方法包括,但不限于,层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度法(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(见,例如,Protein Purification J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989),来获得基本上纯的多肽。
植物
本发明还涉及包含编码本发明具有纤维素分解增强活性的多肽的分离的多核苷酸而以可回收量表达和产生所述多肽的植物,例如转基因植物、植株部分、或植物细胞。所述多肽可从植物或植株部分回收。或者,可以将含有重组多肽的植物或植株部分直接用于改善食物或饲料的质量,例如提高营养价值、可口性、和流变性,或破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例有禾草(grasses),例如草地草(蓝草,早熟禾属(Poa));草料草,诸如羊矛属(Festuca)、黑麦草属(Lolium);温带草(temperate grass),例如剪股颖属(Agrostis);和谷类(cereals),例如小麦、燕麦、黑麦、大麦、水稻、高粱、和玉蜀黍(玉米)。
双子叶植物的实例有烟草、豆科作物诸如羽扇豆、马铃薯、甜菜、豌豆、菜豆、和大豆,和十字花科植物(十字花科(Brassicaceae)),诸如花椰菜、油菜籽(rape seed)、和十分近缘的模式生物体拟南芥(Arabidopsis thaliana)。
植株部分的实例有茎、愈伤组织、叶、根、果实、种子、和块茎,以及构成这些部分的单独组织,例如表皮、叶肉、薄壁组织、脉管组织、分生组织。特殊的植物细胞小室,诸如叶绿体、质外体、线粒体、液泡、过氧化物酶体、和细胞质也认为是植株部分。此外,任何植物细胞,无论组织来源如何,也认为是植株部分。类似的,植株部分,诸如有利于本发明应用而分离的特定组织和细胞也认为是植株部分,例如胚、胚乳、糊粉、和种皮。
这些植物、植株部分、和植物细胞的后代也包括在本发明范围之内。
表达本发明多肽的转基因植物或植物细胞的构建可根据本领域已知的方法进行。简而言之,植物或植物细胞的构建可通过将一种或多种(数种)编码本发明多肽的表达构建体掺入植物宿主基因组或叶绿体基因组中并将所得的经修饰植物或植物细胞繁殖成转基因植物或植物细胞来进行。
表达构建体便利地是核酸构建体,它含有编码本发明多肽的多核苷酸且该多核苷酸与所选定的植物或植株部分中表达此核苷酸序列所需的适当调控序列可操作地连接。而且,表达构建体可包含用于鉴定整合了该表达构建体的宿主细胞的选择标记,和将此构建体导入所讨论的植物所需要的DNA序列(后者取决于所用的DNA导入方法)。
例如,根据希望在何时、在何处、和怎样表达多肽来决定调控序列的选择,所述调控序列诸如启动子和终止子序列和任选的信号或转运序列。例如,编码本发明多肽的基因的表达可以是组成性的或可诱导的,或者是发育、阶段、或组织特异性的,基因产物可以靶向特定组织或植株部分诸如种子或叶。调控序列在例如Tague等,1988,Plant Physiology 86:506有描述。
对于组成性表达,可使用35S-CaMV、玉蜀黍遍在蛋白1、和稻肌动白1启动子(Franck等,1980,Cell 21:285-294;Christensen等,1992,PlantMol.Biol.18:675-689;Zhang等,1991,Plant Cell 3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissues)诸如种子、马铃薯块茎、和果实(Edwards和Coruzzi,1990,Ann Rev Genet 24:275-303),或来自于代谢库(metabolic sink tissues)组织诸如分生组织(Ito等,1994,PlantMol Biol 24:863-878),种子特异性启动子诸如来自稻的谷蛋白、醇溶谷蛋白(prolamin)、球蛋白、或清蛋白启动子(Wu等,1998,Plant and CellPhysiology 39:885-889),来自蚕豆(Vicia faba)豆球蛋白B4和未知种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology 152:708-711),来自种子油体(seed oil body)蛋白的启动子(Chen等,1998,Plantand Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或者本领域已知的任何其它种子特异启动子,例如WO91/14772中所述。此外,启动子可以是叶特异性启动子,诸如来自水稻或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000),小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins,1994,PlantMolecular Biology 26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular and General Genetics 248:668-674),或者伤口诱导性启动子诸如马铃薯pin2启动子(Xu等,1993,Plant Molecular Biology 22:573-588)。同样,启动子可通过非生物处理例如温度、干旱、或盐度变化来诱导,或通过外源施加能激活启动子的物质,例如乙醇、雌激素、植物激素诸如乙烯、脱落酸和赤霉酸以及重金属来诱导。
还可使用启动子增强子元件以在植物中获得本发明多肽的更高表达。例如,启动子增强子元件可以是位于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如Xu等,1993,同上中公开了利用水稻肌动蛋白1基因的第一个内含子来增强表达。
选择标记基因和表达构建体的任何其它部分可选自本领域中可利用的那些。
根据本领域已知的常规技术将核酸构建体掺入植物基因组中,包括土壤杆菌(Agrobacterium)介导的转化、病毒介导的转化、显微注射、粒子轰击、生物射弹转化(biolistic transformation)、和电穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto等,1989,Nature 338:274)。
目前,根瘤土壤杆菌(Agrobacterium tumefaciens)介导的基因转移是用于产生转基因双子叶植物的首选方法(其综述可参见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15-38),而且也可用于转化单子叶植物,尽管这些植物常使用其它转化方法。目前,选择用于产生转基因单子叶植物的方法是粒子轰击(以转化用DNA包被的金或钨微粒)胚的愈伤组织或发育中的胚(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current Opinion Biotechnology 5:158-162;Vasil等,1992,Bio/Technology 10:667-674)。一种备选的单子叶植物转化方法是基于原生质体转化来进行,如Omirulleh等,1993,Plant Molecular Biology 21:415-428中所描述的。
在转化后,根据本领域熟知的方法选出已掺入了表达构建体的转化体,并使其再生成为完整植株。通常转化程序设计成在再生期间或在后代中选择性清除选择基因,例如通过两种单独T-DNA构建体的共转化或通过特异重组酶进行的选择基因的位点特异切除来进行。
本发明还涉及产生本发明的多肽的方法,所述方法包括:(a)在有利于产生所述多肽的条件下,培养转基因植物或植物细胞,所述植物或植物细胞包含编码具有纤维素分解增强活性的本发明的多肽的多核苷酸;和(b)回收所述多肽。
纤维素分解增强活性的去除或降低
本发明还涉及产生亲本细胞的突变体的方法,所述方法包括破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,结果生成当在同样条件下培养时较该亲本细胞产生较少的所述多肽的突变体细胞。
突变体细胞可以通过使用本领域公知的方法,例如插入、破坏、替换或缺失,降低或消除编码本发明多肽的核苷酸序列的表达,来加以构建。在一个优选的方面,所述核苷酸序列是失活的。要加以修饰或失活的核苷酸序列可以是,例如,编码区或者编码区中对活而言必需的部分,或者编码区表达所需的调控元件。此类调控或控制序列的例子可以是启动子序列或其功能部分,即足以影响核苷酸序列表达的部分。其他用于可能的修饰的控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录活化子。
核苷酸序列的修饰或失活可以通过对亲本细胞进行诱变并选择该核苷酸序列的表达已降低或消除的突变细胞来进行。诱变可以是特异性的或者是随机性的,可以使用例如合适的物理或化学诱变剂、使用合适的寡核苷酸、或者通过使DNA序列经受PCR生成的诱变来实施。此外,可以使用这些诱变剂的任何组合来实施诱变。
适于本目的的物理或化学诱变剂的例子包括紫外(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、甲基磺酸乙酯(EMS)、亚硫酸氢钠、甲酸、以及核苷酸类似物。
当使用此类作用剂时,诱变通常如下进行:将要诱变的亲本细胞在所选择的诱变剂存在下在合适的条件下温育,并筛选和/或选择展现所述基因的表达降低或无表达的突变细胞。
核苷酸序列的修饰或失活可通过在基因中或在其转录或翻译所需要的调控元件中引入、替换、或去除一个或多个(数个)核苷酸来进行。例如,可插入或去除核苷酸从而导致终止密码子的引入、起始密码子的去除、或可读框的改变。这些修饰或灭活可根据本领域已知的方法通过定点诱变或PCR产生诱变来完成。虽然,原则上,修饰可在体内进行,即直接在表达要修饰的核苷酸序列的细胞上进行,优选的是如下文例示的那样在体外进行修饰。
便利的消除或降低细胞核苷酸序列表达的方法的一个实例是基于基因替换、基因缺失、或基因破坏技术。例如,在基因破坏方法中,将对应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷的核酸序列,然后将其转化到亲本细胞中以产生缺陷基因。通过同源重组,缺陷的核酸序列替换内源核苷酸序列。可能理想的是,缺陷的核苷酸序列还编码可用于选择核苷酸序列已经被修饰或破坏了的转化体的标记。在一个特别优选的方面,利用选择标记,诸如用本文所述的那些,来破坏核苷酸序列。
或者,核苷酸序列的修饰或失活可通过已建立的反义或RNAi技术使用与核苷酸序列互补的序列来进行。更具体的说,细胞核苷酸序列的表达可通过引入与基因核苷酸序列互补的序列来降低或消除,其中该引入的序列可在细胞中转录并能与细胞中所产生的mRNA发生杂交。在允许互补的反义核苷酸序列与mRNA发生杂交的条件下,所翻译蛋白质的量由此被降低或消除。
本发明还涉及在编码所述多肽的核苷酸序列或其控制序列中包含破坏或缺失的亲本细胞的突变细胞,这导致该突变细胞与亲本细胞相比产生的所述多肽较少或不产生多肽。
这样构建的多肽缺陷的突变细胞作为宿主细胞用于天然和/或异源多肽的表达特别有用。因此,本发明还涉及生产天然或异源多肽的方法,所述方法包括:(a)在有助于产生多肽的条件下培养突变细胞;并(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞来说不是天然的多肽,经过修饰改变了天然序列的天然蛋白质,或是经过重组DNA技术对宿主细胞的处理从而使其表达发生了量变的天然蛋白质。
在另一个方面,本发明涉及通过发酵生成本发明多肽和感兴趣的蛋白质产物二者的细胞来生产基本上没有纤维素分解增强活性的蛋白质产物的方法,其中在发酵完成之前、当中、或之后往发酵液中加入有效量的可抑制纤维素分解增强活性的试剂,并从发酵液中回收目的产物,以及任选地对回收产物进行进一步纯化。
在另一个方面,本发明涉及通过下列步骤来生产基本上没有纤维素分解增强活性的蛋白质产物的方法,在允许产物表达的条件下培养细胞,并对所得培养液进行pH和温度联合处理以便显著地降低纤维素分解增强活性,并从培养液中回收产物。或者,pH和温度联合处理可对从培养液中回收的酶制备物进行。任选地,pH和温度联合处理增强可与纤维素分解增强抑制剂处理结合使用。
根据本发明的这个方面,可能消除至少60%、优选至少75%、更优选至少85%、仍更优选至少95%、且最优选至少99%的纤维素分解增强活性。通过使用这种方法可实现纤维素分解增强活性的完全消除。
优选地,在pH为2-4或9-11和至少60-70℃的温度范围内进行足够时间的pH和温度联合处理以达到预期的效果,其中30-60分钟通常是足够的。
可使用本领域已知的方法进行培养和目的产物的纯化。
本发明的产生基本上没有纤维素分解增强性的产物的方法在真核多肽,尤其是真菌蛋白质例如酶的生产中特别令人感兴趣。所述酶可以选自,例如,淀粉分解酶、脂肪分解酶、蛋白水解酶、纤维素分解酶、氧化还原酶、或植物细胞壁降解酶。此类酶的例子包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡萄糖氧化酶、葡糖苷酶、卤素过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶、或木聚糖酶。纤维素分解增强性缺陷的细胞也可以用来表达有药用意义的异源蛋白质如激素、生长因子、和受体等。
应当理解,术语“真核多肽”不但包括天然多肽,还包括通过氨基酸取代、缺失或添加或其他这类修饰形式进行了修饰而提高活性、热稳定性、pH耐受性等的多肽,例如酶。
在一个进一步的方面,本发明涉及一种基本上没有纤维素分解增强活性的蛋白质产物,其是通过本发明的方法产生的。
抑制多肽表达的方法
本发明还涉及抑制细胞中多肽表达的方法,所述方法包括对细胞施用或者在细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明的多核苷酸的子序列。在一个优选的方面,所述dsRNA的长度为大约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。
所述dsRNA优选是小干扰RNA(siRNA)或微RNA(miRNA)。在一个优选的方面,所述dsRNA是用于抑制转录的小干扰RNA(siRNA)。在另一个优选的方面,所述dsRNA是用于抑制转录的微RNA(miRNA)。
本发明还涉及这样的双链RNA(dsRNA)分子,它们包含SEQ ID NO:1的成熟多肽编码序列的一部分,用于在细胞中抑制多肽表达。虽然本发明不限于任何具体的作用机制,dsRNA可以进入细胞并导致具有相似或相同序列的包括内源mRNA在内的单链RNA(ssRNA)的降解。当细胞被暴露于dsRNA时,来自同源基因的mRNA通过一种称为RNA干扰(RNAi)的过程被选择性地降解。
本发明的dsRNA可以用于基因沉默性治疗(gene-silencing therapeutics)。在一个方面,本发明提供使用本发明的dsRNA来选择性降解RNA的方法。该方法可以在体外、离体或体内实施。在一个方面,dsRNA分子可用来在细胞、器官或动物中生成功能丧失突变。制备和使用dsRNA用于选择性降解RNA的方法是本领域中公知的,参见例如美国专利6,506,559、美国专利6,511,824、美国专利6,515,109、和美国专利6,489,127。
组合物
本发明还涉及包含本发明多肽的组合物。优选的是,组合物是富集了这类多肽的。术语“富集”是指组合物的纤维素分解增强活性已经被增加,例如以至少1.1的富集因子增加。
所述组合物可包含本发明的多肽作为主要组分,例如单一组分组合物。或者,组合物还可含有多种酶活性,诸如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
在一个优选的方面,所述组合物包含一种或多种如本文所述的纤维素分解酶和本发明的多肽。
通过例如下列微生物可产生其它酶,例如属于曲霉属的微生物,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、或镶片镰孢;腐质霉属,优选特异腐质酶或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉。
可根据本领域已知的方法来制备多肽组合物,并且它可以是液体或干燥组合物的形式。例如,多肽组合物可以是颗粒或微粒的形式。可以根据本领域已知的方法对要包含在组合物中的多肽加以稳定化。
下文给出了本发明多肽组合物的优选用途的实例。本发明多肽组合物的剂量和使用组合物的其它条件可根据本领域已知的方法来确定。
含纤维素材料的加工方法
本发明还涉及降解或转化含纤维素材料的方法,所述方法包括:在有效量的本发明的具有纤维素分解增强活性的多肽存在下,用有效量的纤维素分解酶组合物处理含纤维素材料,其中与不存在具有纤维素分解增强活性的多肽时相比,具有纤维素分解增强活性的多肽的存在增加所述含纤维素材料的降解。
本发明还涉及用于产生发酵产物的方法,所述方法包括:(a)在有效量的本发明的具有纤维素分解增强活性的多肽存在下,用有效量的纤维素分解酶组合物糖化含纤维素材料,其中与没有所述具有纤维素分解增强活性的多肽存在时相比,所述具有纤维素分解增强活性的多肽的存在增加所述含纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的含纤维素材料以产生发酵产物;和(c)从发酵中回收发酵产物。本发明的方法可以用来将含纤维素材料例如木素纤维素水解(糖化)成可发酵糖,并将可发酵糖转化为许多有用的物质例如化学品和燃料。从含纤维素材料生产期望的发酵产品通常涉及预处理、酶促水解(糖化)和发酵。
本发明的含纤维素材料的加工可以使用本领域已知的方法来完成。此外,本发明的方法可以使用任何为了依照本发明运行而配置的生物质加工装置来实现。
单独或同时进行的水解(糖化)和发酵包括,但不限于:单独水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(hybrid hydrolysis and fermentation,HHF)、SHCF(单独水解和共发酵)、HHCF(混合水解和发酵)、及直接微生物转化(DMC)。本文中应当理解,本领域中任何包括预处理、酶促水解(糖化)、发酵或它们的组合的方法都可用于实施本发明的方法。
常规装置可以包括补料分批搅拌反应器、分批搅拌反应器、带超滤的连续流动搅拌反应器、和/或连续活塞流动柱反应器(Fernanda de CastilhosCorazza,Flávio Faria de Moraes,Gisella Maria Zanin和Ivo Neitzel,2003,Optimal control in fed-batch reactor for the cellobiose hydrolysis,ActaScientiarum.Technology 25:33-38;Gusakov,A.V.和Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis of cellulose:1.A mathematical model fora batch reactor process,Enz.Microb.Technol.7:346-352)、碾磨反应器(Ryu,S.K.和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attritionbioreactor,Biotechnol.Bioeng.25:53-65)、或具有电磁场诱发的强烈搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancement of enzymatic cellulose hydrolysis using a novel typeof bioreactor with intensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。其它反应器类型包括,例如,用于水解和/或发酵的流化床型、厌氧污泥床(upflow blanket)型、固定化型、以及挤出机型反应器。
预处理.在本发明的方法的实施中,本领域已知的任何预处理方法都可以用来破坏含纤维素材料的植物细胞壁组分。在预处理之前还可以使用本领域已知的方法对含纤维素材料进行预浸泡、润湿、或调制(conditioning)。常规的预处理包括但不限于蒸汽预处理(有或没有爆破)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿爆破、氨纤维爆破(ammonia fiber explosion)、有机溶剂预处理(organosolv pretreatment)、和生物预处理。其它预处理包括超声、电穿孔、微波、超临界CO2、超临界H2O、和氨渗滤(ammoniapercolation)。
可以在水解和/或发酵之前预处理含纤维素材料。预处理优选在水解之前进行。或者,预处理可以和水解同时进行,诸如在用一种或多种纤维素分解酶或其它酶活性处理含纤维素材料以释放可发酵糖如葡萄糖和/或麦芽糖的同时进行预处理。在大多数情况下预处理步骤本身会导致一些生物质转化成可发酵糖(即使没有酶存在)。
蒸汽预处理.在蒸汽预处理中,将含纤维素材料加热以破坏植物细胞壁组分,包括木质素、半纤维素、和纤维素,以使得纤维素和其它部分如半纤维素(hemicellulase)暴露于酶。使纤维素材料通至或通过反应容器,在那里喷射蒸汽以升温到需要的温度和压力,并在其中保持需要的反应时间。蒸汽预处理优选在140-230℃、更优选160-200℃、最优选170-190℃进行,其中最优的温度范围取决于化学催化剂的添加。蒸汽预处理的停留时间优选1-15分钟、更优选3-12分钟、最优选4-10分钟,其中最优的停留时间取决于温度范围和化学催化剂的添加。蒸汽预处理容许相对较高的固形物载量,使得含纤维素材料在预处理过程中一般仅是轻微潮湿的。蒸汽预处理通常与预处理后对材料的爆破性出料(explosive discharge)相结合,后者被称为蒸汽爆破(steam explosion),即将材料急速瞬时置于大气压和湍流下,以通过碎裂作用增加暴露的表面积(Duff和Murray,1996,BioresourceTechnology 855:1-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美国专利申请20020164730)。
在蒸汽预处理之前往往添加催化剂如H2SO4或SO2(典型地为0.3-3%w/w),催化剂可减少时间和温度,增加收率,以及改善酶促水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等,2006,Enzyme Microb.Technol.39:756-762)。
化学预处理:术语“化学预处理”是指任何可促进纤维素、半纤维素和/或木质素的分离和/或释放的化学预处理。合适的化学预处理过程的例子包括稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆破(AFEX)、氨渗滤(APR)、和有机溶剂预处理。
在稀酸预处理中,将含纤维素材料与稀酸,通常是H2SO4,以及水混合形成浆液,蒸汽加热到希望的温度,然后经过一段停留时间瞬时变化到大气压。稀酸预处理可以用多种反应器设计来实施,例如活塞流动反应器、逆流反应器、或连续逆流收缩床反应器(Duff和Murray,1996,同上文;Schell等,2004,Bioresource Technol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。
还可以采用数种碱性条件下的预处理方法。这些碱性预处理包括,但不限于石灰预处理、湿氧化、氨渗滤(APR)和氨纤维/冷冻爆破(AFEX)。
石灰预处理用碳酸钙、氢氧化钠或氨在85-150℃的低温下进行,停留时间为1小时至数日(Wyman等,2005,Bioresource Technol.96:1959-1966;Mosier等,2005,Bioresource Technol.96:673-686)。WO 2006/110891、WO2006/11899、WO 2006/11900和WO 2006/110901公开了使用氨的预处理方法。
湿氧化是一种热预处理,典型地在180-200℃进行5-15分钟,同时添加氧化剂如过氧化氢或氧过压(Schmidt和Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。预处理优选在1-40%干物质、更优选2-30%干物质、最优选5-20%干物质的条件下进行,并且经常通过添加碱,如碳酸钠来提高初始pH。
湿氧化预处理方法的一种变化形式,称为湿爆破(湿氧化和蒸汽爆破的结合),可以处理高达30%的干物质。在湿爆破中,在预处理过程中经过一定的停留时间后引入氧化剂。然后瞬间变化到大气压而终止预处理(WO2006/032282)。
氨纤维爆破(AFEX)涉及用液态或气态的氨在中等温度如90-100℃和高压如17-20巴的条件下处理含纤维素材料5-10分钟,其中干物质含量可高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,Bioresource Technol.96:2014-2018)。
有机溶剂预处理通过使用乙醇水溶液(40-60%乙醇)在160-200℃萃取30-60分钟来使含纤维素材料脱木质素(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,大部分的半纤维素被去除。
Schell等,2003,Appl.Biochem.and Biotechnol.第105-108卷,第69-85页和Mosier等,2005,Bioresource Technology 96:673-686以及美国专利申请公布2002/0164730描述了其他合适的预处理方法的例子。
在一个方面,化学预处理作为酸处理,更优选作为连续稀酸和/或弱酸(mild acid)处理来实施。所述酸通常是硫酸,但也可以用其它的酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或它们的混合物。弱酸处理在优选1-5,更优选1-4,最优选1-3的pH范围内进行。在一个方面,酸浓度在优选0.01-20wt%酸,更优选0.05-10wt%酸,进一步更优选0.1-5wt%酸,最优选0.2-2.0wt%酸的范围。将所述酸与含纤维素材料接触,并在一定温度如160-200℃,优选165-195℃的范围内保持自若干秒到若干分钟不等的时间,例如1秒至60分钟。
在另一个方面,预处理作为氨纤维爆破步骤(AFEX预处理步骤)来实施。
在另一个方面,预处理在水浆液中进行。在优选的方面,含纤维素材料在预处理过程中以优选10-80wt%之间,更优选20-70wt%之间,最优选30-60wt%之间,诸如50wt%左右的量存在。经过预处理的含纤维素材料可以不予洗涤,或者可以用任何本领域已知的方法洗涤,例如用水洗涤。
机械预处理:术语“机械预处理”是指各类研磨(grinding)或粉碎(milling)(例如干粉碎,湿粉碎或振动球粉碎(vibratory ball milling))。
物理预处理:术语“物理预处理”是指任何可促进纤维素、半纤维素和/或木质素从含纤维素材料分离和/或释放的预处理。例如,物理预处理可涉及辐射(例如微波辐射)、蒸汽处理/蒸汽爆破、湿热分解作用,和它们的组合。
物理预处理可涉及高压和/或高温(蒸汽爆破)。在一个方面,高压是指在优选约300-约600psi,更优选约350-约550psi,最优选约400-约500psi的范围,如450psi左右。在另一个方面,高温意指约100-约300℃,优选约140-约235℃范围的温度。在一个优选的方面,机械预处理在使用如上定义的高压及高温的分批过程式蒸汽喷射水解装置系统(batch-process,steamgun hydrolyzer system)中,如可获自Sunds Defibrator AB,Sweden的SundsHydrolyzer中进行。
物理和化学联合预处理:可以既以物理方式又以化学方式处理含纤维素材料。例如,预处理步骤可涉及稀酸或弱酸处理以及高温和/或高压处理。根据需要,物理预处理和化学预处理可以顺序地或同时地进行。还可以包含机械预处理。
于是,在一个优选的方面,对含纤维素材料进行机械、化学、或物理预处理,或它们的任何组合,来促进纤维素、半纤维素和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”是指任何可促进纤维素、半纤维素和/或木质素从含纤维素材料分离和/或释放的生物预处理。生物预处理技术可涉及施用溶木质素微生物(参见例如Hsu,T.-A.,1996,Pretreatment of biomass,《Handbook on Bioethanol:Production and Utilization》,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemical and biological treatments for enzymatic/microbial conversionof lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,《Enzymatic Conversion ofBiomass for Fuels Production》,Himmel,M.E.,Baker,J.O.和Overend,R.P.编,ACS Symposium Series 566,American Chemical Society,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.和Tsao,G.T.,1999,Ethanol productionfrom renewable resources,《Advances in Biochemical Engineering/Biotechnology》,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson和Hahn-Hagerdal,1996,Fermentation of lignocellulosichydrolysates for ethanol production,Enz.Microb.Tech.18:312-331,及Vallander和Eriksson,1990,Production of ethanol from lignocellulosicmaterials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
糖化.在水解步骤,又称糖化中,经过预处理的含纤维素材料被水解以将纤维素或者半纤维素降解成可发酵糖,如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或可溶性寡糖。水解以酶促方式进行,使用包含有效量的具有纤维素分解增强活性的本发明的多肽的纤维素分解酶组合物。该组合物的酶组分也可以顺序地添加。
在本发明的方法中,纤维素分解酶组合物可以包含在将含纤维素材料加工成葡萄糖,或将半纤维素加工成木糖、甘露糖、半乳糖和阿拉伯糖、它们的聚合物,或如下所述的它们的衍生产物的加工中涉及的任何蛋白质。在一个方面,所述纤维素分解酶组合物包含内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶,或它们的组合。在另一个方面,所述纤维素分解酶组合物还包含一种或多种附加的用于改善含纤维素材料降解的酶活性。优选的附加酶有半纤维素酶、酯酶(例如脂肪酶、磷脂酶、和/或角质酶)、蛋白酶、漆酶、过氧化物酶、或它们的混合物。
纤维素分解酶组合物可以是单组分制备物,例如一种内切葡聚糖酶,多组分制备物,例如一种或多种内切葡聚糖酶,一种或多种纤维二糖水解酶;和一种或多种β-葡糖苷酶,或者多组分蛋白制备物与单组分蛋白制备物的组合。纤维素分解蛋白可在酸性、中性或碱性pH范围内具有活性,即,水解含纤维素材料。
如上文所述,本发明中使用的纤维素分解蛋白可以是单组分制备物,即基本上不含其它纤维素分解性组分的组分。单个组分可以是重组组分,即通过克隆编码该单个组分的DNA序列,然后用该DNA序列转化细胞,并在宿主中表达而产生的(参见例如WO 91/17243和WO 91/17244)。宿主细胞可以是异源宿主(酶对宿主而言是外来的)或者宿主也可以是野生型宿主(酶对宿主而言是天然的)。单组分纤维素分解蛋白还可以通过从发酵液中纯化此类蛋白来加以制备。
添加了有效量的具有纤维素分解增强活性的多肽的纤维素分解酶组合物可以是任何适合在本文所述的方法中使用的形式,例如含或不含细胞的粗发酵液、干粉或颗粒剂、非粉化性颗粒剂(non-dusting granulate)、液体、稳定化液体、或经保护的酶。颗粒剂例如可如在美国专利4,106,991和4,661,452中所公开的方法制备,并可任选使用本领域已知的方法进行包衣。例如,液体酶制备物可根据既定的方法通过加入稳定剂诸如糖、糖醇或其它多元醇、和/或乳酸或其它有机酸来稳定化。经保护的酶可根据EP 238,216中所公开的方法制备。
具有纤维素分解酶活性的多肽可以从任何属的微生物获得。术语“从...获得”(或“获自...”)在此处意思是指所述酶可以是从天然产生所述酶作为天然酶的生物体分离而来的。“从...获得”(或“获自...”)在此处还意指所述酶可以是在宿主生物体中重组产生的,其中重组产生的酶对于宿主生物体而言为天然的或外来的,或者具有经修饰的氨基酸序列,例如缺失、插入和/或取代了一个或多个氨基酸,即作为天然氨基酸序列的突变体和/或片段的重组产生的酶或通过本领域已知的核酸改组方法产生的酶。天然酶的意义中涵盖天然变体,外来酶的意义中涵盖通过化学或重组诱变,如通过定点诱变或改组获得的变体。因此,纤维素分解性蛋白的经过化学修饰或蛋白质工程改造的突变体也可以用于本发明。在一个优选的方面,获自给定来源的多肽是胞外分泌的。
具有纤维素分解酶活性的多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,诸如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属的具有纤维素分解酶活性的多肽,或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏球菌属或尿枝原体属的具有纤维素分解酶活性的多肽。
在一个优选的方面,所述多肽是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、缓慢芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌的具有纤维素分解酶活性的多肽。
在另一个优选的方面,所述多肽是似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种的具有纤维素分解酶活性的多肽。
在另一个优选的方面,所述多肽是不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌、或浅青紫链霉菌的具有纤维素分解酶活性的多肽。
具有纤维素分解酶活性的多肽还可以是真菌多肽,更优选酵母多肽,如假丝酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属的具有纤维素分解酶活性的多肽;或者更优选丝状真菌多肽,如枝顶孢霉属、蘑菇属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属、拟蜡菌属、毛壳菌属、金孢子菌属、麦角属、旋孢腔菌属、Coprinopsis、Coptotermes、棒囊壳属、栗疫病菌属、隐球菌属、色二孢属、黑耳属、网孢菌属、镰孢属、赤霉属、全鞭毛虫属、腐质霉属、耙菌属、香菇属、小球腔菌属、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、Pseudotrichonympha、根毛霉属、裂褶菌属、柱顶孢属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、木霉属、Trichophaea、轮枝孢属、小包脚菇属、或小包脚菇属的具有纤维素分解酶活性的多肽。
在一个优选的方面所述多肽是卡尔酵母、酿酒酵母(Saccharomycescerevisiae)、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母的具有纤维素分解酶活性的多肽。
在另一个优选的方面,所述多肽是解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、Chrysosporiummerdarium、Chrysosporium inops、Chrysosporium pannicola、Chrysosporiumqueenslandicum、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰色腐质酶、特异腐质霉、疏棉状腐质霉、乳白耙菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳、Thielavia fimeti、小孢子梭孢壳、Thielavia ovispora、Thielaviaperuviana、Thielavia spededonium、毛梭孢壳、Thielavia subthermophila、土生梭孢壳、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata的具有纤维素分解酶活性的多肽。
在本发明的方法中,可以使用任何一种或多种内切葡聚糖酶,一种或多种纤维二糖水解酶,和/或一种或多种β-葡糖苷酶,以及其他纤维素分解性蛋白质,例如一种或多种半纤维素酶。
可以用于本发明的细菌内切葡聚糖酶的例子包括但不限于解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039;WO 93/15186;美国专利5,275,944;WO 96/02551;美国专利5,536,655,WO 00/70031,WO05/093050);褐色喜热裂孢菌(Thermobifida fusca)内切葡聚糖酶III(WO05/093050);和褐色喜热裂孢菌内切葡聚糖酶V(WO 05/093050)。
可以用于本发明的真菌内切葡聚糖酶的例子包括但不限于里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene 45:253-263;GenBankTM登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene 63:11-22;GenBankTM登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GenBankTM登录号AB003694);里氏木霉内切葡聚糖酶IV(Saloheimo等,1997,Eur.J.Biochem.249:584-591;GenBankTM登录号Y11113);和里氏木霉内切葡聚糖酶V(Saloheimo等,1994,Molecular Microbiology 13:219-228;GenBankTM登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acids Research 18:5884);川地曲霉(Aspergillis kawachii)内切葡聚糖酶(Sakamoto等,1995,Current Genetics 27:435-439);金孢子菌属菌种(Chrysosporium sp.)C1(美国专利6,573,086;GenPept登录号AAQ38150);Corynascus heterothallicus(美国专利6,855,531;GenPept登录号AAY00844);Erwinia carotovara内切葡聚糖酶(Saarilahti等,1990,Gene 90:9-14);尖镰孢内切葡聚糖酶(GenBankTM登录号L29381);灰腐质霉thermoidea变体菌株内切葡聚糖酶(GenBankTM登录号AB003107);Melanocarpus albomyces内切葡聚糖酶(GenBankTM登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GenBankTM登录号XM_324477);马瘤胃弧菌(Piromyces equi)(Eberhardt等,2000,Microbiology 146:1999-2008;GenPept登录号CAB92325);米根霉(Rhizopus oryzae)(Moriya等,2003,J.Bacteriology185:1749-1756;GenBankTM登录号AB047927,AB056667、AB056668);和土生梭孢壳(WO 2004/053039;EMBL登录号CQ827970)。
公开了使用依照Henrissat B.,1991,A classification of glycosyl hydrolasesbased on amino-acid sequence similarities,Biochem.J.280:309-316;以及Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification ofglycosyl hydrolasess,Biochem.J.316:695-696的分类法分类的超过13个糖基水解酶家族中的其它内切葡聚糖酶。
在一个优选的方面,所述内切葡聚糖酶是里氏木霉内切葡聚糖酶I(CEL7B)。在另一个优选的方面,所述内切葡聚糖酶是里氏木霉内切葡聚糖酶II(CEL5A)。在另一个优选的方面,所述内切葡聚糖酶是里氏木霉内切葡聚糖酶III(CEL12A)。在另一个优选的方面,所述内切葡聚糖酶是里氏木霉内切葡聚糖酶V(CEL45A)。在另一个优选的方面,所述内切葡聚糖酶是嗜热毁丝霉CEL7内切葡聚糖酶。在另一个优选的方面,所述内切葡聚糖酶是Chrysosporium lucknowense CEL12内切葡聚糖酶。在另一个优选的方面,所述内切葡聚糖酶是Chrysosporium lucknowense CEL45内切葡聚糖酶。
在一个更优选的方面,所述里氏木霉内切葡聚糖酶I(CEL7B)是SEQ IDNO:46的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶II(CEL5A)是SEQ ID NO:48的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶III(CEL12A)是SEQ ID NO:50的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶V(CEL45A)是SEQ ID NO:52的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述嗜热毁丝霉CEL7内切葡聚糖酶是SEQ ID NO:54的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述Chrysosporium lucknowense CEL12内切葡聚糖酶是SEQ ID NO:56的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述Chrysosporium lucknowense CEL45内切葡聚糖酶是SEQID NO:58的成熟多肽或其直向同源物或变体。
在另一个更优选的方面,所述里氏木霉内切葡聚糖酶I(CEL7B)由SEQID NO:45的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶II(CEL5A)由SEQ ID NO:47的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶III(CEL12A)由SEQ ID NO:49的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶V(CEL45A)由SEQ ID NO:51的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述嗜热毁丝霉CEL7内切葡聚糖酶由SEQ ID NO:53的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述Chrysosporium lucknowense CEL12内切葡聚糖酶由SEQ ID NO:55的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述Chrysosporium lucknowense CEL45内切葡聚糖酶由SEQ ID NO:57的成熟多肽编码序列或其直向同源物或变体所编码。
所述里氏木霉内切葡聚糖酶I(CEL7B)可根据Penttila等,1986,Gene 45:253-263获得。所述里氏木霉内切葡聚糖酶II(CEL5A)可根据Saloheimo等,1988,Gene 63:11-22获得。所述里氏木霉内切葡聚糖酶III(CEL12A)可根据Okada等,1988,Appl.Environ.Microbiol.64:555-563获得。所述里氏木霉内切葡聚糖酶V(CEL45A)可根据Saloheimo等,1994,Molecular Microbiology13:219-228获得。所述嗜热毁丝霉CEL7内切葡聚糖酶可根据WO 95/024471获得。所述Chrysosporium lucknowense CEL12内切葡聚糖酶可根据WO2001/25468获得。所述Chrysosporium lucknowense CEL45内切葡聚糖酶可根据WO 2000/20555获得。
在另一个优选的方面,所述纤维二糖水解酶是里氏木霉纤维二糖水解酶I(CEL7A)。在另一个优选的方面,所述纤维二糖水解酶是里氏木霉纤维二糖水解酶II(CEL6A)。在另一个优选的方面,所述纤维二糖水解酶是具有纤维素结合域的Chrysosporium lucknowense CEL7纤维二糖水解酶。在另一个优选的方面,所述纤维二糖水解酶是不具有纤维素结合域的嗜热毁丝霉CEL7纤维二糖水解酶。在另一个优选的方面,所述纤维二糖水解酶是土生梭孢壳纤维二糖水解酶。
在另一个更优选的方面,所述里氏木霉纤维二糖水解酶I(CEL7A)是SEQ ID NO:60的成熟多肽或其直向同源物或变体。在另一个优选的方面,所述里氏木霉纤维二糖水解酶II(CEL6A)是SEQ ID NO:62的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述具有纤维素结合域的Chrysosporium lucknowense CEL7纤维二糖水解酶是SEQ ID NO:64的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述不具有纤维素结合域的嗜热毁丝霉CEL7纤维二糖水解酶是SEQ ID NO:66的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述土生梭孢壳纤维二糖水解酶是SEQ ID NO:68的成熟多肽或其直向同源物或变体。
在另一个更优选的方面,所述里氏木霉纤维二糖水解酶I(CEL7A)纤维二糖水解酶由SEQ ID NO:59的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述里氏木霉纤维二糖水解酶II(CEL6A)纤维二糖水解酶由SEQ ID NO:61的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述具有纤维素结合域的Chrysosporium lucknowense CEL7纤维二糖水解酶由SEQ ID NO:63的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述不具有纤维素结合域的嗜热毁丝霉CEL7纤维二糖水解酶由SEQ ID NO:65的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述土生梭孢壳纤维二糖水解酶由SEQ ID NO:67的成熟多肽编码序列或其直向同源物或变体所编码。
所述里氏木霉纤维二糖水解酶I(CEL7A)可以依照Shoemaker等,1983,Biotechnology(N.Y.)1:691-696获得。所述里氏木霉纤维二糖水解酶II(CEL6A)可以依照Terri等,1987,Gene 51:43-52获得。所述具有纤维素结合域的Chrysosporium lucknowense CEL7纤维二糖水解酶可以依照WO2001/79507获得。所述不具有纤维素结合域的嗜热毁丝霉CEL7纤维二糖水解酶可以依照WO 2003/000941获得。所述土生梭孢壳纤维二糖水解酶可以依照WO 2006/074435获得。
在另一个优选的方面,所述β-葡糖苷酶获自米曲霉。在另一个优选的方面,所述β-葡糖苷酶获自烟曲霉。在另一个优选的方面,所述β-葡糖苷酶获自巴西青霉(Penicillium brasilianum),例如巴西青霉IBT 20888株。在另一个优选的方面,所述β-葡糖苷酶获自黑曲霉。在另一个优选的方面,所述β-葡糖苷酶获自棘孢曲霉。
在一个更优选的方面,所述米曲霉β-葡糖苷酶是SEQ ID NO:70的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述烟曲霉β-葡糖苷酶是SEQ ID NO:72的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述巴西青霉β-葡糖苷酶是SEQ ID NO:74的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述黑曲霉β-葡糖苷酶是SEQ ID NO:76的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述棘孢曲霉β-葡糖苷酶是SEQ ID NO:78的成熟多肽或其直向同源物或变体。
在另一个更优选的方面,所述米曲霉β-葡糖苷酶由SEQ ID NO:69的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述烟曲霉β-葡糖苷酶由SEQ ID NO:71的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述巴西青霉β-葡糖苷酶由SEQ ID NO:73的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述黑曲霉β-葡糖苷酶由SEQ ID NO:75的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述棘孢曲霉β-葡糖苷酶由SEQ ID NO:77的成熟多肽编码序列或其直向同源物或变体所编码。
所述具有β-葡糖苷酶活性的米曲霉多肽可以根据WO 2002/095014获得。所述具有β-葡糖苷酶活性的烟曲霉多肽可以根据WO 2005/047499获得。所述具有β-葡糖苷酶活性的巴西青霉多肽可以根据WO 2007/019442获得。所述具有β-葡糖苷酶活性的黑曲霉多肽可以根据Dan等,2000,J.Biol.Chem.275:4973-4980获得。所述具有β-葡糖苷酶活性的棘孢曲霉多肽可以根据Kawaguchi等,1996,Gene 173:287-288获得。
在另一个优选的方面,所述β-葡糖苷酶是SEQ ID NO:80的米曲霉β-葡糖苷酶变体BG融合蛋白。在另一个优选的方面,所述米曲霉β-葡糖苷酶变体BG融合蛋白由SEQ ID NO:79的多核苷酸编码。在另一个优选的方面,所述β-葡糖苷酶是SEQ ID NO:82的米曲霉β-葡糖苷酶融合蛋白。在另一个优选的方面,所述米曲霉β-葡糖苷酶融合蛋白由SEQ ID NO:81的多核苷酸编码。
在一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;β-葡糖苷酶;里氏木霉纤维二糖水解酶I(CEL7A);里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B)。
在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;β-葡糖苷酶;里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),里氏木霉内切葡聚糖酶I(CEL7B),并进一步包含(1)选自里氏木霉内切葡聚糖酶II(CEL5A)、里氏木霉内切葡聚糖酶V(CEL45A)、和里氏木霉内切葡聚糖酶III(CEL12A)的一种或多种酶,和/或进一步包含(2)土生梭孢壳纤维二糖水解酶。
在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;SEQ ID NO:82的β-葡糖苷酶融合蛋白;具有SEQ ID NO:60的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),具有SEQID NO:62的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和具有SEQID NO:46的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。
在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;SEQ ID NO:82的β-葡糖苷酶融合蛋白;具有SEQ ID NO:60的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),具有SEQID NO:62的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和具有SEQID NO:46的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),且进一步包含选自下组的一种或多种酶:具有SEQ ID NO:47的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),具有SEQ ID NO:51的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),以及具有SEQ ID NO:49的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)。
在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;SEQ ID NO:82的β-葡糖苷酶融合蛋白;具有SEQ ID NO:60的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),具有SEQID NO:62的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和具有SEQID NO:46的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并进一步包含具有SEQ ID NO:68的成熟多肽的土生梭孢壳纤维二糖水解酶。
在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;SEQ ID NO:82的β-葡糖苷酶融合蛋白;具有SEQ ID NO:60的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),具有SEQID NO:62的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),以及具有SEQ ID NO:46的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并进一步包含(1)选自具有SEQ ID NO:47的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A)、具有SEQ ID NO:51的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A)、和具有SEQ ID NO:49的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)的一种或多种酶,和/或进一步包含(2)具有SEQ ID NO:68的成熟多肽的土生梭孢壳纤维二糖水解酶。
在另一个优选的方面,所述纤维素分解酶组合物包含选自下组的一种或多种(数种)组分:有内切葡聚糖酶活性的嗜热毁丝霉CEL7多肽,有内切葡聚糖酶活性的Chrysosporium lucknowense CEL12多肽,有内切葡聚糖酶活性的Chrysosporium lucknowense CEL45多肽,有纤维二糖水解酶活性并具有纤维素结合域的Chrysosporium lucknowense CEL7多肽,和有纤维二糖水解酶活性而没有纤维素结合域的嗜热毁丝霉CEL7多肽。在另一个优选的方面,所述纤维素分解酶组合物包含有内切葡聚糖酶活性的嗜热毁丝霉CEL7多肽,有内切葡聚糖酶活性的Chrysosporium lucknowense CEL12多肽,有内切葡聚糖酶活性的Chrysosporium lucknowense CEL45多肽,有纤维二糖水解酶活性并具有纤维素结合域的CEL7多肽,和有纤维二糖水解酶活性而没有纤维素结合域的嗜热毁丝霉CEL7多肽。在另一个优选的方面,上述组合物还包含一种或多种(数种)具有β-葡糖苷酶的多肽。
所述纤维素分解酶组合物还可以是商业制备物。适用于本发明的商业纤维素分解酶制备物的实例包括,例如,CELLUCLASTTM(可获自Novozymes A/S)和NOVOZYMTM 188(可获自Novozymes A/S)。其它可用的商品化制备物包括CELLUZYMETM、CEREFLOTM和ULTRAFLOTM(Novozymes A/S),LAMINEXTM和SPEZYMETM CP(Genencor Int.),ROHAMENTTM 7069W(GmbH),和LDI,LBR,或150L(Dyadic International,Inc.,Jupiter,FL,USA)。
可用于本发明的其它纤维素分解蛋白在下列文献中有记载:EP495,257、EP 531,315、EP 531,372、WO 89/09259、WO 94/07998、WO95/24471、WO 96/11262、WO 96/29397、WO 96/034108、WO 97/14804、WO 98/08940、WO 98/012307、WO 98/13465、WO 98/015619、WO 98/015633、WO 98/028411、WO 99/06574、WO 99/10481、WO 99/025846、WO 99/025847、WO 99/031255、WO 2000/009707、WO 2002/050245、WO 2002/0076792、WO 2002/101078、WO 2003/027306、WO 2003/052054、WO 2003/052055、WO 2003/052056、WO 2003/052057、WO 2003/052118、WO 2004/016760、WO 2004/043980、WO 2004/048592、WO 2005/001065、WO 2005/028636、WO 2005/093050、WO 2005/093073、WO 2006/074005、WO 2006/117432、WO 2007/071818、WO 2007/071820、WO 2008/008070、WO 2008/008793、美国专利4,435,307、美国专利5,457,046、美国专利5,648,263、美国专利5,686,593、美国专利5,691,178、美国专利5,763,254、和美国专利5,776,757。
本发明的方法中使用的纤维素分解蛋白可以通过利用本领域已知的程序,用含有合适的碳源及氮源和无机盐的营养培养基发酵上文提到的微生物菌株来加以生产(参见例如Bennett,J.W.和LaSure,L.(编辑),More GeneManipulations in Fungi,Academic Press,CA,1991)。合适的培养基可以从供应商获得,或者可以依照公开的组成(例如美国典型培养物保藏中心的目录中)来制备。适于生长和纤维素分解蛋白产生的温度范围及其它条件是本领域已知的(参见例如Bailey,J.E.和Ollis,D.F.,Biochemical EngineeringFundamentals,McGraw-Hill Book Company,NY,1986)。
发酵可以是任何培养细胞而导致纤维素分解蛋白的表达或分离的方法。因此,发酵可以理解为包括在实验室或工业发酵罐中实施的摇瓶培养、或小规模或大规模发酵(包括连续、分批、补料分批或固态发酵),其在合适的培养基中,在容许纤维素分解蛋白表达或分离的条件下进行。依照上述方法所得的纤维素分解蛋白可以从发酵培养基回收并通过如本文描述的常规程序加以纯化。
酶促水解优选在合适的含水环境中于本领域技术人员可容易确定的条件下进行。在一个优选的方面,水解在适合于一种或多种酶的活性的条件,即对一种或多种酶而言最适的条件下进行。水解可以作为补料分批或者连续过程进行,例如经预处理的含纤维素材料(底物)被逐渐添加到例如含酶的水解溶液中。
糖化通常在搅拌槽式反应器或发酵罐中在受控的pH、温度和混合条件下进行。合适的过程时间、温度和pH条件可以由本领域技术人员容易地确定。例如,糖化可持续最多达200个小时,但通常进行优选约12个到约96个小时,更优选约16个到约72个小时,最优选约24个到约48个小时。温度范围为优选约25℃-约70℃,更优选约30℃-约65℃,更优选约40℃-60℃,尤其是约50℃。pH范围为优选约3-约8,更优选约3.5-约7,最优选约4-约6,尤其是大约pH 5。干固形物含量范围为优选约5-约50wt%,更优选约10-约40wt%,最优选约20-约30wt%。
具有纤维素分解增强活性的酶和多肽的最适量取决于数种因素,包括但不限于作为成分的纤维素分解蛋白的混合物,含纤维素底物,含纤维素底物的浓度,含纤维素底物的一种或多种预处理,温度,时间,pH,以及发酵生物的选用(例如用于同时糖化和发酵的酵母)。
在一个优选的方面,一种或多种纤维素分解蛋白对含纤维素材料的有效量为大约0.5-约50mg,优选约0.5-约40mg,更优选约0.5-约25mg,更优选约0.75-约20mg,更优选约0.75-约15mg,进一步更优选约0.5-约10mg,最优选约2.5-约10mg每克含纤维素材料。
在另一个优选的方面,具有纤维素分解增强活性的多肽对含纤维素材料的有效量为约0.5-约50mg,优选约0.5-约40mg,更优选约0.5-约25mg,更优选约0.75-约20mg,更优选约0.75-约15mg,进一步更优选约0.5-约10mg,最优选约2.5-约10mg每克含纤维素材料。
在另一个优选的方面,具有纤维素分解增强活性的一种或多种多肽对含纤维素材料的有效量为约0.01-约50.0mg,优选约0.01-约40mg,更优选约0.01-约30mg,更优选约0.01-约20mg,更优选约0.01-约10mg,更优选约0.01-约5mg,更优选约0.025-约1.5mg,更优选约0.05-约1.25mg,更优选约0.075-约1.25mg,更优选约0.1-约1.25mg,进一步更优选约0.15-约1.25mg,最优选约0.25-约1.0mg每克含纤维素材料。
在另一个优选的方面,一种或多种具有纤维素分解增强活性的多肽对纤维素分解蛋白的有效量为约0.005-约1.0g,优选约0.01-约1.0g,更优选约0.15-约0.75g,更优选约0.15-约0.5g,更优选约0.1-约0.5g,进一步更优选约0.1-约0.5g,最优选约0.05-约0.2g每克一种或多种纤维素分解蛋白。
发酵.对于从经过预处理和水解的含纤维素材料获得的可发酵糖,可以用一种或多种能够直接或间接将糖发酵为期望的发酵产物的发酵微生物来加以发酵。“发酵”或“发酵过程”是指任何发酵过程或任何包含发酵步骤的过程。发酵过程还包括生物燃料工业、食用酒精工业(例如啤酒和葡萄酒)、乳品工业(例如发酵乳产品)、皮革工业及烟草工业上使用的发酵过程。发酵条件取决于期望的发酵产物及发酵生物,可以由本领域技术人员容易地予以确定。
在发酵步骤中,作为预处理和酶促水解步骤的结果从含纤维素材料释放的糖被发酵生物如酵母发酵成产物,例如乙醇。水解(糖化)和发酵可以分别或同时进行。这样的方法包括,但不限于,分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和发酵)、以及直接微生物转化(DMC)。
任何合适的经水解的含纤维素材料都可以用于本发明实施中的发酵步骤。如本领域中公知的,所述材料的选择通常基于期望的发酵产物,即要通过发酵获得的物质,以及所采用的过程。
术语“发酵培养基”在本文中理解为指添加一种或多种发酵微生物之前的培养基,例如由糖化过程得到的培养基,以及例如在同时糖化和发酵过程(SSF)中使用的培养基。
“发酵微生物”是指适合在期望的发酵过程中使用来产生发酵产物的任何微生物,包括细菌和真菌生物。发酵微生物可以是C6和/或C5发酵生物,或它们的组合。C6和C5发酵生物都是本领域中公知的。合适的发酵微生物能够将糖类,如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖,直接或间接发酵,即转化成期望的发酵产物。
Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642记载了产生乙醇的细菌及真菌发酵微生物的例子。
能够发酵C6糖的发酵微生物的例子包括细菌和真菌生物,如酵母。优选的酵母包括酵母属一些种,优选酿酒酵母的菌株。
能够发酵C5糖的发酵微生物的例子包括细菌和真菌生物,如酵母。优选的发酵C5的酵母包括:毕赤酵母属的菌株,优选树干毕赤酵母(Pichiastipitis),如树干毕赤酵母CBS 5773;假丝酵母属的菌株,优选博伊丁假丝酵母(Candida boidinii)、芸苔假丝酵母(Candida brassicae)、休哈塔假丝酵母(Candida sheatae)、迪丹斯假丝酵母(Candida diddensii)、假热带假丝酵母(Candida pseudotropicalis)或产朊假丝酵母(Candida utilis)。
其它发酵生物包括发酵单孢菌属(Zymomonas)如运动发酵单胞菌(Zymomonas mobilis)的菌株;汉逊酵母属(Hansenula)如异常汉逊酵母(Hansenula anomala)的菌株;克鲁维酵母属如脆壁克鲁维酵母(K.fragilis)的菌株;裂殖酵母属如粟酒裂殖酵母的菌株;以及大肠杆菌,尤其是已经过遗传修饰而改善了乙醇产率的大肠杆菌菌株。
在一个优选的方面,所述酵母是酵母属的一些种(Saccharomyces spp)。在一个更优选的方面,所述酵母是酿酒酵母。在另一个更优选的方面,所述酵母是糖化酵母。在另一个更优选的方面,所述酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一个优选的方面,所述酵母是克鲁维酵母。在另一个更优选的方面,所述酵母是马克斯克鲁维酵母(Kluyveromycesmarxianus)。在另一个更优选的方面,所述酵母是脆壁克鲁维酵母。在另一个优选的方面,所述酵母是假丝酵母。在另一个更优选的方面,所述酵母是博伊丁假丝酵母。在另一个更优选的方面,所述酵母是芸苔假丝酵母。在另一个更优选的方面,所述酵母是迪丹斯假丝酵母。在另一个更优选的方面,所述酵母是假热带假丝酵母。在另一个更优选的方面,所述酵母是产朊假丝酵母。在另一个优选的方面,所述酵母是棍孢属(Clavispora)。在另一个更优选的方面,所述酵母是葡萄牙棍孢(Clavispora lusitaniae)。在另一个更优选的方面,所述酵母是仙人掌棍孢(Clavispora opuntiae)。在另一个优选的方面,所述酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面,所述酵母是嗜鞣管囊酵母(Pachysolen tannophilus)。在另一个优选的方面,所述酵母是毕赤酵母。在另一个更优选的方面,所述酵母是树干毕赤酵母。在另一个优选的方面,所述酵母是酒香酵母属(Bretannomyces)。在另一个更优选的方面,所述酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis,G.P.,1996,Cellulose bioconversion technology,在Wyman,C.E.编的《Handbook on Bioethanol:Production and Utilization》中,Taylor &Francis,Washington,DC,179-212)。
能够高效地将己糖和戊糖发酵成乙醇的细菌包括,运动发酵单胞菌和热纤维梭菌(Clostridium thermocellum)(Philippidis,1996,同上文)。
在一个优选的方面,所述细菌是发酵单胞菌。在一个更优选的方面,所述细菌是运动发酵单胞菌。在另一个优选的方面,所述细菌是梭菌。在另一个更优选的方面,所述细菌是热纤维梭菌。
适用于乙醇生产的商品化酵母包括,例如,ETHANOL RED酵母(可获自Fermentis/Lesaffre,USA)、FALITM(可获自Fleischmann’s Yeast,USA),SUPERSTARTTM和THERMOSACCTM鲜酵母(可获自Ethanol Technology,WI,USA)、BIOFERMTM AFT和XR(可获自NABC-North American BioproductsCorporation,GA,USA)、GERT STRANDTM(可获自Gert Strand AB,Sweden),以及FERMIOLTM(可获自DSM Specialties)。
在一个优选的方面,所述发酵微生物经过了遗传修饰来提供发酵戊糖的能力,例如利用木糖的、利用阿拉伯糖的、以及共利用木糖和阿拉伯糖的微生物。
通过克隆异源基因到各种发酵微生物中,已经构建出了能够将己糖和戊糖转化为乙醇(共发酵)的生物(Chen和Ho,1993,Cloning and improving theexpression of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,Genetically engineeredSaccharomyces yeast capable of effectively cofermenting Saccharomycescerevisiae and xylose,Appl.Environ.Microbiol.64:1852-1859;Kotter andCiriacy,1993,Xylose fermentation by Saccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizingSaccharomyces cerevisiae strains overexpressing the TKL1 and TAL1 genesencoding the pentose phosphate pathway enzymes transketolase andtransaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,Minimal metabolic engineering of Saccharomyces cerevisiae for efficientanaerobic xylose fermentation:a proof of principle,FEMS Yeast Research 4:655-664;Beall等,1991,Parametric studies of ethanol production from xyloseand other sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214;Zhang等,1995,Metabolic engineering of apentose metabolism pathway in ethanologenic Zymomonas mobilis,Science 267:240-243;Deanda等,1996,Development of an arabinose-fermenting Zymomonasmobilis strain by metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470)。
在一个优选的方面,所述经过了遗传修饰的发酵微生物是酿酒酵母。在另一个优选的方面,所述经过了遗传修饰的发酵微生物是运动发酵单胞菌。在另一个优选的方面,所述经过了遗传修饰的发酵微生物是大肠杆菌。在另一个优选的方面,所述经过了遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。
通常将一种或多种发酵微生物添加到经降解的纤维素或水解产物中,进行约8小时至约96小时,例如约24-约60小时的发酵。温度通常为约26℃-约60℃,尤其是约32℃或50℃,pH为约3-8,如大约pH 4-5,6,或7左右。
在一个优选的方面,将一种或多种发酵微生物施加到经降解的纤维素或水解产物,并进行大约12小时至大约96小时,如通常24-60小时的发酵。在一个优选的方面,温度优选为大约20℃至大约60℃,更优选大约25℃至大约50℃,最优选大约32℃至大约50℃,特别是大约32℃或50℃,pH一般为大约pH 3至大约pH 7,优选pH 4-7左右。然而,某些发酵微生物如细菌发酵生物,具有更高的最适发酵温度。一种或多种发酵微生物施加的量优选为每ml发酵液大约105至1012,优选大约107至1010,特别是大约2x108个活细胞计数。关于使用酵母进行发酵的更多指导可见例如“TheAlcohol Textbook”(K.Jacques,T.P.Lyons和D.R.Kelsall编,NottinghamUniversity Press,United Kingdom 1999),本文援引并入该文献。
为了生产乙醇,在发酵之后将经发酵的浆液蒸馏以提取乙醇。依照本发明的方法获得的乙醇可以用作,例如,燃料乙醇、饮用乙醇即可饮用酒精(potable neutral spirits);或工业乙醇。
发酵刺激物(fermentation stimulator)可与本文描述的任何酶促过程组合使用以进一步改进发酵方法,特别是发酵微生物的性能,诸如速率提高和乙醇产量。“发酵刺激物”指用于发酵微生物特别是酵母的生长的刺激物。优选的用于生长的发酵刺激物包括维生素和矿物质。维生素的实例包括多种维生素(multivitamins)、生物素、泛酸、烟酸、内消旋肌醇(meso-inositol)、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素、及维生素A、B、C、D和E。参见例如Alfenore等,Improving ethanol production and viability ofSaccharomyces cerevisiae by a vitamin feeding strategy during fed-batchprocess,Springer-Verlag,2002,本文援引并入该文献。矿物质的实例包括能够提供营养的矿物质和矿物质盐,包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
发酵产物:发酵产物可以是任何来源于发酵的物质。所述发酵产物包括,但不限于,醇类(例如阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇和木糖醇);有机酸(例如乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸);酮类(例如丙酮);醛类(例如甲醛);氨基酸(例如天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);和气体(例如甲烷、氢(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵产物还可以是作为高价值产物的蛋白质。
在一个优选的方面,所述发酵产物是醇。应理解的是术语“醇”涵盖含有一个或多个羟基部分的物质。在一个更优选的方面,所述醇是阿拉伯糖醇。在另一个更优选的方面,所述醇是丁醇。在另一个更优选的方面,所述醇是乙醇。在另一个更优选的方面,所述醇是甘油。在另一个更优选的方面,所述醇是甲醇。在另一个更优选的方面,所述醇是1,3-丙二醇。在另一个更优选的方面,所述醇是山梨糖醇。在另一个更优选的方面,所述醇是木糖醇。参见例如Gong,C.S.、Cao,N.J.、Du,J.和Tsao,G.T.,1999,Ethanol productionfrom renewable resources,在《Advances in BiochemicalEngineering/Biotechnology》中,Scheper,T.编,Springer-Verlag BerlinHeidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,Thebiotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,和Singh,D.,1995,Processes for fermentative production ofxylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.、Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanol and ethanolby Clostridium beijerinckii BA 101 and in situ recovery by gas stripping,WorldJournal of Microbiology and Biotechnology 19(6):595-603。
在另一个优选的方面,所述发酵产物是有机酸。在另一个更优选的方面,所述有机酸是乙酸。在另一个更优选的方面,所述有机酸是醋酮酸。在另一个更优选的方面,所述有机酸是己二酸。在另一个更优选的方面,所述有机酸是抗坏血酸。在另一个更优选的方面,所述有机酸是柠檬酸。在另一个更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面,所述有机酸是甲酸。在另一个更优选的方面,所述有机酸是富马酸。在另一个更优选的方面,所述有机酸是葡糖二酸。在另一个更优选的方面,所述有机酸是葡糖酸。在另一个更优选的方面,所述有机酸是葡糖醛酸。在另一个更优选的方面,所述有机酸是戊二酸。在另一个优选的方面,所述有机酸是3-羟基丙酸。在另一个更优选的方面,所述有机酸是衣康酸。在另一个更优选的方面,所述有机酸是乳酸。在另一个更优选的方面,所述有机酸是苹果酸。在另一个更优选的方面,所述有机酸是丙二酸。在另一个更优选的方面,所述有机酸是草酸。在另一个更优选的方面,所述有机酸是丙酸。在另一个更优选的方面,所述有机酸是琥珀酸。在另一个更优选的方面,所述有机酸是木糖酸。参见例如Chen,R.,和Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid productionfrom cellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一个优选的方面,所述发酵产物是酮。可以理解的是术语“酮”涵盖含有一个或多个酮部分的物质。在另一个更优选的方面,所述酮是丙酮。参见例如Qureshi和Blaschek,2003,同上文。
在另一个优选的方面,所述发酵产物是醛。在另一个更优选的方面,所述醛是甲醛。
在另一个优选的方面,所述发酵产物是氨基酸。在另一个更优选的方面,所述有机酸是天冬氨酸。在另一个更优选的方面,所述氨基酸是谷氨酸。在另一个更优选的方面,所述氨基酸是甘氨酸。在另一个更优选的方面,所述氨基酸是赖氨酸。在另一个更优选的方面,所述氨基酸是丝氨酸。在另一个更优选的方面,所述氨基酸是苏氨酸。参见例如Richard,A.,和Margaritis,A.,2004,Empirical modeling of batch fermentation kinetics forpoly(glutamic acid)production and other microbial biopolymers,Biotechnologyand Bioengineering 87(4):501-515。
在另一个优选的方面,所述发酵产物是气体。在另一个更优选的方面,所述气体是甲烷。在另一个更优选的方面,所述气体是H2。在另一个更优选的方面,所述气体是CO2。在另一个更优选的方面,所述气体是CO。参见例如Kataoka,N.、A.Miya,和K.Kiriyama,1997,Studies on hydrogenproduction by continuous culture system of hydrogen-producing anaerobicbacteria,Water Science and Technology 36(6-7):41-47;及Gunaseelan V.N.,Biomass and Bioenergy Vol.13(1-2),第83-114页,1997,Anaerobic digestionof biomass for methane production:A review。
回收.任选地可以使用任何本领域已知的方法从发酵培养基回收一种或多种发酵产物,这些方法包括但不限于:层析(例如离子交换、亲和、疏水、层析聚焦、和大小排阻)、电泳程序(例如制备性等电聚焦)、差异溶解度(例如硫酸铵沉淀)、蒸馏、或萃取。例如,从经过发酵的含纤维素材料通过常规蒸馏方法分离乙醇并纯化。可以获得纯度最高达约96vol%的乙醇,它可以用作,例如,燃料乙醇、饮用乙醇即可饮用酒精(po),或工业乙醇。
信号肽
本发明还涉及包含编码蛋白质的基因的核酸构建体,其中所述基因可操作地连接于编码信号肽的核苷酸序列,所述信号肽包含SEQ ID NO:2的氨基酸1-15或者由SEQ ID NO:2的氨基酸1-15组成,其中所述基因对所述核苷酸序列而言是外来的。
在一个优选的方面,所述核苷酸序列包含SEQ ID NO:1的核苷酸1-45或者由SEQ ID NO:1的核苷酸1-45组成。
本发明还涉及包含这样的核酸构建体的重组表达载体和重组宿主细胞。
本发明还涉及用于产生蛋白质的方法,所述方法包括(a)在适合于蛋白质产生的条件下培养这样的重组宿主细胞;和(b)回收所述蛋白质。
所述蛋白质对于宿主细胞而言可以是天然的或者异源的。术语“蛋白质”在本文中并不意指被编码产物的具体长度,因此涵盖了肽、寡肽和蛋白质。术语“蛋白质”还涵盖结合形成被编码产物的两个或更多个多肽。蛋白质还包括杂合多肽,其包含从至少两种不同蛋白质(其中一种或多种(数种)可以是对宿主细胞而言为异源或天然的)获得的部分或完整多肽序列的组合。蛋白质还包括上述蛋白质和杂合蛋白的天然存在的等位变化形式以及工程改造的变化形式。
优选的,所述蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分、或报道分子。在一个更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶。在一个进一步更优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、其他脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
所述基因可以从任何原核、真核或其他来源获得。
下面用实施例进一步描述本发明,这些实施例不应解释为对本发明范围的限制。
实施例
材料
用作缓冲剂和底物的化学品是至少试剂级的商品。
培养基
PDA平板的组成为每升39克马铃薯葡萄糖琼脂。
NNCYP培养基的组成为每升5.0g NH4NO3、0.5g MgSO4·7H2O、0.3gCaCl2、2.5g柠檬酸、1.0g细菌用蛋白胨(Bacto Peptone)、5.0g酵母提取物,1ml COVE痕量金属溶液、以及足量的K2HPO4使最终pH达到约5.4。
NNCYPmod培养基的组成为每升1.0g NaCl、5.0g NH4NO3、0.2gMgSO4·7H2O、0.2g CaCl2、2.0g柠檬酸、1.0g细菌用蛋白胨、5.0g酵母提取物,1ml of COVE痕量金属溶液、以及足量的K2HPO4使最终pH达到约5.4。
COVE痕量金属溶液的组成为每升0.04g Na2B4O7·10H2O、0.4gCuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4.H2O、0.8g Na2MoO2·2H2O、和10g ZnSO4·7H2O。
LB平板的组成为每升10g胰蛋白胨、5g酵母提取物,5g氯化钠、和15g细菌用琼脂(Bacto Agar)。
MDU2BP培养基的组成为每升45g麦芽糖、1g MgSO4·7H2O、1g NaCl、2g K2HSO4、12g KH2PO4、2g尿素、和500μl AMG痕量金属溶液,然后将pH调整到5.0,用0.22μm过滤元件进行过滤除菌。
AMG痕量金属溶液的组成为每升14.3g ZnSO4·7H2O、2.5gCuSO4·5H2O、0.5g NiCl2·6H2O、13.8g FeSO4·H2O、8.5g MnSO4·7H2O、和3g柠檬酸。
SOC培养基的组成为2%胰蛋白胨、0.5%酵母提取物、10mM NaCl、2.5mM KCl、10mM MgCl2和10mM MgSO4,然后在高压蒸汽灭菌后添加经过滤除菌的葡萄糖至20mM。
冷冻培养基的组成为60%SOC和40%甘油。
2X YT培养基的组成为每升16g胰蛋白胨、10g酵母提取物,5g NaCl、和15g细菌用琼脂。
实施例1:从土生梭孢壳NRRL 8126鉴定GH61F多肽
从在NNCYPmod培养基(添加有1%Type 20纤维素(Sigma Chemical Co.,St.Louis,MO,USA))上培养土生梭孢壳NRRL 8126所得的新鲜平板取琼脂糖块,接种到50ml添加了1%葡萄糖的NNCYPmod培养基中,45℃、200rpm温育25小时。然后对15个500ml烧瓶和两个250ml烧瓶分别接种2ml上述的培养物,其中每个500ml烧瓶和250ml烧瓶分别含100ml和50ml添加有2%Type 20纤维素的NNCYPmod培养基。将这些烧瓶在45℃、200rpm条件下温育4天。将培养物合并后于3000xg离心10分钟,将上清液通过玻璃纤维预滤器(Nalge Nunc Int’l.,Rochester,NY,USA)过滤。滤液冷却到4℃保存。
二维聚丙烯酰胺凝胶电泳.取1ml滤液,添加100μl饱和(4℃)三氯乙酸(TCA),在冰上温育10分钟,然后添加9ml冰冷的丙酮,再在冰上温育20分钟,来加以沉淀。将经过沉淀的溶液在10,000xg 4℃离心10分钟,倾去上清液,用冰冷的丙酮洗涤离心沉淀两次,让其风干。
将干燥的离心沉淀溶于0.2ml等电聚焦(IEF)样品缓冲液。IEF样品缓冲液的组成为9.0M尿素、3.0% w/v 3-[(3-胆酰胺丙基)二甲基-铵]-1-丙磺酸盐(3-[(3-cholamidopropyl)dimethyl-ammonium]-1-propanesulfonate)(CHAPS,Pierce Chemical Co.Rockford,IL,USA)、1%(v/v)pH 4-7两性电解质、1%β-巯基乙醇,和0.005%溶于蒸馏水的溴酚蓝。尿素储液用501-X8(D),20-5-目,混合床树脂(Bio-Rad,Hercules,CA,USA)去离子。去离子后的溶液保存在-20℃。将所得的混合物在摇床(Lab Industries,Berkeley,CA,USA)上轻柔混合数小时让其溶解。将样品缓冲液-蛋白质混合物加到IPG复水皿(Amersham Biosciences,Piscataway,NJ,USA)中的11cm IPG凝胶条(strip)(Bio-Rad,Hercules,CA,USA)上。在IPG凝胶条上覆盖一层750μl等份的干凝胶条覆盖液(Amersham Biosciences,Piscataway,NJ,USA)以防止蒸发,让其在20℃复水12小时,与此同时使用等电聚焦单元(Amersham Biosciences,Piscataway,NJ,USA)施加30伏电压。该被编程以提供恒定电压且使每条凝胶条的最大电流为50μA。复水12小时后,等电聚焦条件如下:200伏1小时,500伏1小时,和1000伏1小时。然后施加从1000伏到8000伏历时30分钟的梯度,编程使等电聚焦在8000伏运行并在达到>30,000伏小时完结。
在第二维分析之前将IPG凝胶条还原并烷基化,方法是首先用每10mlSDS平衡缓冲液100mg的二硫苏糖醇还原15分钟,然后在黑暗中用每10ml平衡缓冲液250mg的碘乙酰胺烷基化15分钟。SDS平衡缓冲液的组成为50mM Tris HCl pH 8.8、6.0M尿素、2%w/v十二烷基硫酸钠(SDS)、30%甘油、以及0.002%w/v溴酚蓝。将IPG凝胶条在SDS-PAGE运行缓冲液(Invitrogen/Novex,Carlsbad,CA,USA)中快速清洗,放在一条11cm,1孔8-16%Tris-甘氨酸SDS-PAGE凝胶(Bio-Rad,Hercules,CA,USA)上,用电泳单元(Bio-Rad,Hercules,CA,USA)以50伏电泳直到样品进入凝胶,然后增加电压到200伏,运行直到溴酚蓝染料达到凝胶底部。
多肽检测.二维凝胶用荧光橙色蛋白染色剂(Molecular Probes,Eugene,OR,USA)染色。荧光染色方法来自Malone等,2001,Electrophoresis,22,919-932并经过优化和调适。在平台式振荡器上将SDS-PAGE凝胶在40%乙醇、2%乙酸和0.0005%SDS中固定1小时到过夜。通过重复3次洗涤步骤来去除并更换固定溶液,每个步骤由2%乙酸和0.0005%SDS,30分钟构成。将凝胶在黑暗中用2%乙酸、0.0005%SDS和0.02%橙色蛋白染色剂染色1.5小时到过夜。在PROCESSOR PLUSTM染色单元(Amersham Biosciences,Piscataway,NJ,USA)上对染色和脱色进一步优化以改善再现性和自动化。在MOLECULARSTORMTM 860成像系统(Amersham Biosciences,Piscataway,NJ,USA)上进行扫描,使用蓝色荧光,像素大小200μm,光电倍增管增益800V,以获得经过荧光染色的SDS-PAGE凝胶的图像。用软件第5版(AmershamBiosciences,Piscataway,NJ,USA)观察和调整图像。进一步将凝胶在使用橙色滤光片的DARK蓝光透照仪上可视化。用2mmACU-活检冲孔器(Acuderm Inc.,Ft.Lauderdale,FL,USA)切出观察到的蛋白凝胶斑点,保存在预先用含0.1%三氟乙酸(TFA)的60%乙腈洗涤、再用HPLC级水洗涤过两次的96孔板中。经过染色的二维凝胶斑点在预洗过的平板上的25-50ml的水中保存于-20℃直到消化。
凝胶内多肽消化用于肽测序.使用II液体操作机器人(PerkinElmer Life and Analytical Sciences,Boston,MA,USA)进行凝胶内消化。将含有感兴趣多肽的二维凝胶斑点用50μl含10mM二硫苏糖醇(DTT)的100mM碳酸氢铵、pH 8.0室温还原30分钟。还原之后,将凝胶片用50μl含55mM碘乙酰胺的100mM碳酸氢铵、pH 8.0烷基化20分钟。让干燥的凝胶片在组成为6ng测序级胰蛋白酶(Promega,Madison,WI,USA)/μl 50mM碳酸氢铵pH 8的胰蛋白酶消化溶液中室温溶胀30分钟,然后在40℃消化8小时。上述每个反应步骤之后都按照生产商的标准规程用合适的溶液进行多次洗涤和预洗涤。在反应与反应之间用50μl乙腈使凝胶脱水,在步骤和步骤之间将凝胶片风干。用含1%甲酸/2%乙腈的HPLC级水抽提肽两次,历时30分钟。将肽抽提液转移到已冷却至10-15℃的THERMO-96孔带裙边小规格PCR平板(skirted PCR low profile plate)(ABGene,Rochester,NY,USA)中并盖上96孔板盖(PerkinElmer Life andAnalytical Sciences,Boston,MA,USA)以防止蒸发。进一步将平板保存在4℃直到能够进行质谱分析。
采用串联质谱的肽测序.对于采用串联质谱的肽测序,使用Q-TOFMICROTM混合正交四极飞行时间质谱仪( MSTechnologies,Milford,MA,USA)进行LC-MS/MS分析。Q-TOF MICROTM质谱仪配置有ULTIMATETM毛细管和纳米流HPLC系统(Dionex,Sunnyvale,CA,USA),该系统耦联于FAMOSTM微型自动采样器(Dionex,Sunnyvale,CA,USA)和SWITCHOSTM II柱切换装置(Dionex,Sunnyvale,CA,USA)用于样品的浓缩和脱盐。将6μl自凝胶内消化回收的肽溶液加载到设置于注射环中的保护柱(300μm IDx5cm,C18Dionex,Sunnyvale,CA,USA)上,利用SWITCHOSTM II泵(Dionex,Sunnyvale,CA,USA)用含0.1%甲酸的水以40μl/min洗涤2分钟。在一根75μm IDx15cm、C18、3μm、100 纳米流融合型毛细管柱(nanoflow fused capillary column)(Dionex,Sunnyvale,CA,USA)上分离肽,其中流速为175nl/min,来自用NAN-75校准器(Dionex,Sunnyvale,CA,USA)产生的175μl/min的分流。线性洗脱梯度为从含5%乙腈到含60%乙腈的0.1%甲酸,在45分钟的时间段内施加。对柱洗脱液在215nm进行监测,并将其通过设置在纳米喷射界面上的电喷射离子源引入Q-TOF MICROTM质谱仪中。质谱仪完全由微处理器控制,使用MASSLYNXTM软件第3.5版( MS Technologies,Milford,MA,USA)。数据获取在全范围扫描(survey scan)模式下进行,质量范围从50-2000m/z,设有从MS到MS/MS的切换标准,采纳大于10.0个离子/秒的离子强度及+2、+3和+4的电荷状态。能够获得多达4个共洗脱类型的扫描时间1.9秒、扫描间隔时间0.1秒的分析谱。典型地使用65伏的锥孔电压(cone voltage),并对碰撞能量(collision energy)编程使其依照洗脱肽的质量和电荷状态在10-60伏的范围内变化。将所得的多个谱合并、平滑化、并自动集中生成一个峰列表。利用ROTEINLYNXTM Global Server 1.1软件( MS Technologies,Milford,MA,USA)将所得的峰列表对选定的数据库进行搜索。对PROTEINLYNXTM检索结果进行评估,对于未鉴定的蛋白通过评估每个感兴趣离子的MS/MS谱加以进一步分析,并通过鉴定y和b离子序列并将质量差与合适的氨基酸匹配来确定从头序列。
将一个对应于近似分子量40kDa、近似等电点4.5的2D凝胶点用胰蛋白酶进行凝胶内消化,进行如所述的从头测序。一个431.782m/z的二价电荷胰蛋白酶肽离子被确定为Gly-Pro-[Ile/Leu]-Ala-Tyr-[Ile-Leu]-Lys(SEQ ID NO:2的氨基酸98-105)。另一个570.976m/z的二价电荷胰蛋白酶肽离子被确定为His-Thr-[Ile/Leu]-Thr-Ser-Gly-Pro-Asp-Asp-Val-Met-Asp-Ala-Ser-His-Lys(SEQ ID NO:2的氨基酸82-97)。第三个825.9517的二价电荷胰蛋白酶肽离子被确定为Val-Asp-Asp-Ala-[Ile/Leu]-Thr-Asp-Thr-Gly-[Ile/Leu]-Gly-Gly-Gly-Trp-Phe-Lys(SEQ ID NO:2的氨基酸107-122)。
实施例2:表达序列标签(EST)cDNA文库构建
用来自土生梭孢壳NRRL 8126的24小时液体培养物(50ml添加了1%葡萄糖的NNCYPmod,于250ml烧瓶中45℃温育,200rpm)的2ml等份试样接种装有100ml添加了2%Type 20纤维素的NNCYPmod培养基的500ml烧瓶。培养物在45℃、200rpm温育3天。用带有玻璃纤维预滤器(Nalgene,Rochester NY,USA)的布氏漏斗过滤收集菌丝体,用10mM Tris-HCl-1mM EDTA pH 8(TE)洗涤两次,然后在液氮中速冻。
用下述方法收集总RNA。将冷冻的土生梭孢壳NRRL 8126菌丝体在电动咖啡磨中磨碎。将磨碎的材料在50ml管中以1∶1 v/v与20mlFenazol(Ambion,Inc.,Austin,TX,USA)混合。一旦菌丝体被悬浮,即用氯仿抽提它们,再用苯酚-氯仿-异戊醇的25∶24∶1 v/v/v混合物抽提3次。从所得的水相中通过添加1/10体积的3M乙酸钠pH 5.2和1.25倍体积的异丙醇将RNA沉淀出来。在12,000xg 4℃离心30分钟收集沉淀的RNA。最终的离心沉淀用冷的70%乙醇洗涤、风干、并重悬于500ml用焦碳酸二乙酯处理过的水(DEPC水)中。
用2100 Bioanalyzer(生物分析仪)(Agilent Technologies,Inc.,Palo Alto,CA,USA)评估纯化的RNA的数量和质量。借助POLY(A)PURISTTM MAGKit(Ambion,Inc.,Austin,TX,USA),依照供应商的说明,从360μg总RNA中分离出聚腺苷酸化mRNA。
为了产生cDNA文库,采用CLONEMINERTM Kit(Invitrogen,Carlsbad,CA,USA)来构建不需要使用限制酶克隆的定向文库,从而减少嵌合克隆的数目和大小偏好。
为了保证cDNA的成功合成,用两种不同浓度的mRNA(2.2和4.4μgpoly(A)+mRNA)平行进行两个反应。将mRNA样品与Biotin-attB2-Oligo(dt)引物(CLONEMINERTM Kit,Invitrogen,Carlsbad,CA,USA),1X第一链缓冲液(Invitrogen,Carlsbad,CA,USA),2μl 0.1M二硫苏糖醇(DTT),10mM每种dNTP、以及水混合至终体积分别为18和16μl。
小心地混合反应混合物,然后加入2μl和4μl SUPERSCRIPTTM逆转录酶(Invitrogen,Carlsbad,CA,USA),45℃温育60分钟以合成第一互补链。第二链合成是向每个第一链反应加入30μl 5X第二链缓冲液(Invitrogen,Carlsbad,CA,USA)、3μl的10mM各种dNTP、10单位大肠杆菌DNA连接酶(Invitrogen,Carlsbad,CA,USA),40单位大肠杆菌DNA聚合酶I(Invitrogen,Carlsbad,CA,USA),和2单位的大肠杆菌RNase H(Invitrogen,Carlsbad,CA,USA),总体积为150μl。然后在16℃将混合物温育2小时。在2小时温育之后将2μl T4 DNA聚合酶(Invitrogen,Carlsbad,CA,USA)加入每个反应中,16℃温育5分钟以生成平末端cDNA(bunt-ended cDNA)。对cDNA反应物用苯酚-氯仿-异戊醇25∶24∶1 v/v/v混合物抽提,并在20μg糖原、120μl 5M乙酸铵及660μl乙醇的存在下沉淀。12,000xg 4℃离心30分钟后用冷70%乙醇洗涤cDNA离心沉淀,真空干燥2-3分钟,并重悬于18μl DEPC水中。向每个重悬的cDNA样品中加入10μl 5X衔接缓冲液(adapted buffer)、10μg的每种attB1衔接子(CLONEMINERTM Kit中提供)、7μl 0.1M DTT、和5单位T4DNA连接酶。
将连接反应物在16℃温育过夜。过量的衔接子通过用1mlSEPHACRYLTM S-500HR树脂(Amersham Biosciences,Piscataway,NJ,USA)进行大小排阻层析来予以去除。根据试剂盒的说明收集柱级分,将第3-14个级分用2100 Bioanalyzer进行分析来确定attB1衔接子开始被洗脱的级分。该分析显示衔接子大约在第10或11个级分开始被洗脱。第一文库合并了第6-11个级分,第二文库合并了第4-11个级分。
依照技术(Invitrogen,Carlsbad,CA,USA)通过同源DNA重组来进行cDNA克隆,使用BP CLONASETM(Invitrogen,Carlsbad,CA,USA)作为重组酶。每个BP CLONASETM重组反应物含有大约70ng被attB侧翼包围的cDNA、250ng pDONRTM 222、2μl 5X BP CLONASETM缓冲液、2μlTE和3μl BP CLONASETM。将重组反应在25℃温育过夜。
然后将热灭活的BP重组反应物分成6个等份,电穿孔到ELECTROMAXTM DH10B电感受态细胞(Invitrogen,Carlsbad,CA,USA)中,其中电穿孔使用GENEII Electroporation System(GENEII电穿孔系统)(Bio-Rad,Hercules,CA,USA),参数如下:电压:2.0kV,电阻:200Ω,电容:25μF。将经过电穿孔的细胞重悬在1ml SOC培养基中,在恒定振荡(200rpm)下于37℃温育60分钟。温育期之后,将经转化的细胞合并,并以1∶1与冷冻培养基混合。取出200μl等份用于实验室滴定,然后将每个文库剩余的部分等份分到1.8ml冷冻管(Wheaton ScienceProducts,Millville,NJ,USA)中,-80℃冷冻保存。
每个文库制备了四个系列稀释度:1/100、1/1000、1/104、1/105。从每个稀释度取100μl涂布到每ml添加有50μg卡那霉素的150mm LB平板上,37℃温育过夜。计算每个稀释物平板上菌落的数目,用它来计算每个文库中转化子的总数。
第一文库显示有大约540万个独立克隆,第二文库显示有大约900万个独立克隆。
实施例3:模板制备和cDNA克隆的核苷酸测序
将来自两个文库的等份试样混合并涂布到每ml添加有50μg卡那霉素的25x25cm LB平板上。借助QPix Robot(Genetix Inc.,Boston,MA,USA)将菌落个体排列(array)到含100μl每ml添加有50μg卡那霉素的LB培养基的96孔板上。对于总共4320个克隆个体,获得了45个96孔板。将这些平板37℃、200rpm振荡下温育过夜。温育之后,向每个孔里加100μl无菌50%甘油。借助一种96针工具(Boekel,Feasterville,PA,USA)将转化子影印到第二组深盘型(deep-dish)96孔微量培养板(Advanced Genetic TechnologiesCorporation,Gaithersburg,MD,USA)中,后者每孔中含有1ml添加了50μg/ml卡那霉素的MAGNIFICENT BROTHTM(MacConnell Research,SanDiego,CA,USA)。将第一组微量滴定板冷冻保存在-80℃。将第二组深盘型平板在回转摇床上剧烈振荡(300rpm)下37℃温育过夜。为了防止洒出和交叉污染,且容许充分的通气,第二组的每个培养板都用聚丙烯垫板(AdvancedGenetic Technologies Corporation,Gaithersburg,MD,USA)和塑料微量滴定盘盖加以覆盖。用Robot-Smart 384(MWG Biotech Inc.,High Point,NC,USA)和MONTAGETM Plasmid Miniprep96Kit(MONTAGETM质粒小量制备96型试剂盒)(Millipore,Billerica,MA,USA)制备质粒DNA。
测序反应使用Terminator v3.0 Ready Reaction CycleSequencing Kit(终止物v3.0就绪反应循环测序试剂盒)(AppliedBiosystems,Inc.,Foster City,CA,USA),采用终止物化学(terminator chemistry)(Giesecke等,1992,Journal of Virology Methods 38:47-60)和如下所示的M13Forward(正向)(-20)测序引物进行。
5’-GTAAAACGACGGCCAG-3’(SEQ ID NO:3)
测序反应使用Robot-Smart 384(MWG Biotech Inc.,High Point,NC,USA)以384孔规格进行,并用MULSeq384 Sequencing Clean-up Kit(Seq384测序清洁试剂盒)(Millipore,Billerica,MA,USA)去除终止物。反应物包含6μl质粒DNA和4μl测序预混剂,其中预混剂含1μl 5X测序缓冲液(Millipore,Billerica,MA,USA)、1μl终止物(Applied Biosystems,Inc.,Foster City,CA,USA)、1.6皮摩尔M13正向引物和1μl水。用ABI3700DNA Sequencer(ABI3700DNA测序仪)(Applied Biosystems,Foster City,CA,USA)进行单程(Single-pass)DNA测序。
实施例4:cDNA克隆的DNA序列数据的分析
借助PHRED/PHRAP软件(University of Washington,Seattle,WA,USA)进行碱基判定(base calling)、特性值指定(quality value assignment)和载体修剪(vector trimming)。用Transcript Assembler v.2.6.2.软件(Paracel,Inc.,Pasadena,CA,USA)对EST进行聚类分析。对EST聚类的分析显示有395个独立的簇。
将组装的EST序列面向多个数据库(如PIR)进行序列同源性分析,该分析通过Blastx程序(Altschul et.al.,1990,J.Mol.Biol.215:403-410)在一个32节点的Linux集群(Paracel,Inc.,Pasadena,CA,USA)上实施,使用BLOSUM62矩阵(Henikoff,1992,Proc.Natl.Acad.Sci.USA 89:10915-10919)。它们中的246个命中了公共或专有蛋白数据库中的已知基因,149个在这些数据库中没有显著的命中。在这246个基因中,有13个命中了已知的糖基水解酶基因。
实施例5:编码具有纤维素分解增强活性的家族61多肽(GH61F)的cDNA克隆的鉴定
首先根据其与一种来自粗糙脉孢菌的家族61蛋白(UniProt Q7S439)的同一性鉴定了一个编码具有纤维素分解增强活性的家族61多肽(GH61F)的cDNA克隆。该初始分析显示这两种蛋白质在蛋白质水平上有57.67%的同一性,分布在一段211个氨基酸(663个碱基对)的序列上。
在该初始分析之后,从原始的冻存平板上取得克隆Tter18A8,在添加了50μg/ml卡那霉素的LB平板上划线。将平板37℃温育过夜,第二天用来自平板上的一个单菌落接种添加了50μg/ml卡那霉素的3ml LB。将该液体培养物37℃温育过夜,用9600(QIAGEN Inc.,Valencia,CA,USA)制备质粒DNA。利用上文所述的终止物化学对克隆Tter08C4质粒DNA再次测序,使用所述M13正向引物及如下所示的Poly-T引物来对该克隆的3’端测序。
5′-TTTTTTTTTTTTTTTTTTTTTTTVN-3′(SEQ ID NO:4)
其中V=G、A、C;N=G、A、C、T
对新序列信息的Blastp同源性分析显示,由克隆Tter18A8编码的蛋白质与一种粗糙脉孢菌假定蛋白NCU02240.1(UniRef Q7S439)相似。这两种蛋白有74%同一性,分布在一段316个氨基酸的序列上。
用Interproscan程序(Zdobnov和Apweiler,2001,Bioinformatics 17:847-848)分析克隆18A8的推定蛋白质序列显示,克隆18A8编码的基因含有家族61蛋白的序列签名。该序列签名名称为Pfam模式F03443(Bateman,A.等,2002,Nucleic Acids Research 30:276-280),在距离起始氨基酸甲硫氨酸119个氨基酸处被发现,这确证了克隆Tter18A8编码土生梭孢壳家族61蛋白。该分析还表明该蛋白包含一个真菌纤维素结合域(34个氨基酸长),其位于距离起始氨基酸甲硫氨酸283个氨基酸处。
cDNA序列(SEQ ID NO:1)和推定的氨基酸序列(SEQ ID NO:2)如图1所示。该cDNA克隆编码317个氨基酸的多肽。该基因的cDNA克隆的%G+C含量为64.9%,成熟蛋白编码区(SEQ ID NO:1的核苷酸46-955)的%G+C含量也是64.9%。用SignalP软件程序(Nielsen等,1997,Protein Engineering 10:1-6)预测了一条15个残基的信号肽。预测的成熟蛋白含302个氨基酸,分子量为31.14kDa。
使用Clustal W法(Higgins,1989,同上文)确定了家族61序列的比较性比对,其中使用矢量NTI Advance 10.3软件(Invitrogen,Carlsbad,CA,USA)的AlignX模块,使用blosum62mt2评分矩阵和下列多重比对参数:K-元组大小(K-tuple size)1;最佳对角线(best diagonals)5;窗口大小(window size)5;缺口罚分(gap penalty)5;缺口形成罚分(gap opening penalty)10;缺口延伸罚分(gap extension penalty)0.1。该比对显示成熟土生梭孢壳gh61f基因的推定氨基酸序列与具有纤维素分解增强活性的土生梭孢壳Cel61G多肽(WO2005/074647)的成熟区域具有43%的同一性。
确认了克隆Tter18A8的身份之后,将一份0.5μl的来自该克隆的质粒DNA(命名为pTer61F,见图2)转移到一小管ONE大肠杆菌TOP10细胞(Invitrogen,Carlsbad,CA,USA)中,轻柔混合,在冰上温育10分钟。然后将细胞42℃热激30秒,再在冰上温育2分钟。将细胞重悬在250μl SOC培养基中,在恒定震荡(200rpm)下37℃温育60分钟。温育期之后,取两个30μl等份涂布在添加了50μg/ml卡那霉素的LB平板上,37℃温育过夜。第二天挑取单菌落,在含有约1.5ml添加了50μg/ml卡那霉素的LB琼脂糖的1.8ml冷冻小管上划线。小管用PETRISEALTM(Diversified Biotech,Boston,MA,USA)密封,保藏于北方区域研究中心农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection,Northern RegionalResearch Center),1815 University Street,Peoria,IL,USA,保藏号为NRRLB-50044,保藏日为2007年5月25日。
实施例6:克隆家族gh61f基因到米曲霉表达载体中
设计了两条合成寡核苷酸引物(如下所示)来从编码家族GH61F具有纤维素分解增强活性的多肽的土生梭孢壳EST Tter18A8 PCR扩增全长可读框。使用IN-PCR Cloning Kit(IN-PCR克隆试剂盒)(BDBiosciences,Palo Alto,CA,USA)将该片段直接克隆到质粒pAlLo2(WO2004/099228)中。
正向引物:
5’-ACTGGATTTACCATGAAGGGCCTCAGCCTCCTCG-3’(SEQ ID NO:5)
反向引物:
5’-TCACCTCTAGTTAATTAATTACTGGCATTGCGAGTAATAG-3’(SEQ ID NO:6)
加粗的字母代表编码序列。其余的序列与pAlLo2的插入位点相比含有序列同一性。
将上述引物各50皮摩尔用于终体积为50μl的PCR反应物中,其中包含:50ng pTter18A8 DNA;1X Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA);6μl dATP、dTTP、dGTP及dCTP的10mM合剂;2.5单位Pfx DNA聚合酶(Invitrogen、Carlsbad、CA、USA);1μl 50mM MgSO4;和5 l 10X pCRx Enhancer Solution(加强溶液)(Invitrogen,Carlsbad,CA,USA)。用如下编程的 5333(EppendorfScientific,Inc.,Westbury,NY,USA)扩增该片段:98℃ 2分钟循环一次,而后94℃ 30秒、62.1℃ 30秒、68℃ 1.0分钟循环35次。35个循环后,将反应物在68℃温育10分钟,然后在10℃冷却备用。使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液和0.1μg/ml的溴化乙锭在0.8% 琼脂糖凝胶(Cambrex Bioproducts,East Rutherford,NJ,USA)上分离了一个984bp的PCR反应产物。借助DARK(ClareChemical Research,Dolores,CO,USA)显现DNA条带以避免UV诱发的突变。用一次性剃刀片切下DNA条带,用UL-DA转杯(Millipore,Billerica,MA,USA)根据制造商的说明加以纯化。
通过Nco I和Pac I消化来使质粒pAlLo2线性化。通过如上所述进行的凝胶电泳和超滤来纯化片段。用IN-PCR Cloning Kit将纯化后的PCR片段克隆到经过线性化和纯化的pAlLo2中。反应物(20 l)包含2 l1X IN-缓冲液、2 l 1X BSA、1 l IN-酶(1∶10稀释的)、100ng经Nco I和Pac I消化的pAlLo2,和100ng土生梭孢壳gh61f纯化PCR产物。将反应物在室温温育30分钟。使用该反应物的2μl样品依照制造商的说明转化大肠杆菌XL10Gold细胞(Stratagene,La Jolla,CA,USA)。经过一段恢复期之后,将来自转化反应物的两个100μl等分试样涂布到添加有100μg/ml氨苄青霉素的150mm 2X YT平板上。将平板37℃温育过夜。从选择平板上收集4个推定的重组克隆,从每一个克隆使用9600(QIAGEN Inc.,Valencia,CA,USA)制备质粒DNA。通过Pst I限制性消化分析这些克隆。然后对两个具有预期的限制性消化模式的克隆进行测序来确认克隆的插入序列中没有突变存在。测序用ABI3130xl DNA Sequencer(Applied Biosystems,Foster City,CA,USA)进行。选择第3号克隆并命名为pAlLo23(图3)。
实施例7:米曲霉JaL250中土生梭孢壳家族gh61f基因的表达
根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉JaL250(WO 99/61651)原生质体。用5微克的pAlLo23(以及作为质粒对照的pAlLo2)转化米曲霉JaL250原生质体。
用pAlLo22转化米曲霉JaL250产生了大约50个转化子。将8个转化子分离到单独的PDA平板上,在34℃温育5天。
汇合孢子平板用5ml 0.01%80洗涤,用孢子悬液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。转化子培养物在200rpm恒定震荡下于34℃温育。接种后第五天,将培养物6000xg离心,收集它们的上清液。将每种上清液7.5微升与等体积的2X上样缓冲液(10%β-巯基乙醇)混合,上样到1.5mm 8%-16% Tris-甘氨酸SDS-PAGE凝胶上,用BIO-SAFETMCoomassie Blue G250(Bio-Rad,Hercules,CA,USA)染色。培养液的SDS-PAGE概貌显示,8个转化子中的7个具有一条大约45kDa的新蛋白条带。选择了第4号转化子用于进一步研究,并将其命名为米曲霉JaL250AlLo23。
实施例8:米曲霉JaL250AlLo23的发酵
将100ml摇瓶培养基加入500ml摇瓶中。摇瓶培养基的组成为每升50g蔗糖、10g KH2PO4、0.5g CaCl2、2g MgSO4·7H2O、2g K2SO4、2g尿素、10g酵母提取物、2g柠檬酸、和0.5ml痕量金属溶液。痕量金属溶液组成为每升13.8g FeSO4·7H2O、14.3g ZnSO4·7H2O、8.5g MnSO4·H2O、2.5gCuSO4·5H2O和3g柠檬酸。在所述摇瓶中接种两个来自米曲霉JaL250AlLo23固体平板培养物的琼脂块,在回转摇床上200rpm 34℃温育24小时。
将50ml摇瓶培养液接种到含1.8升发酵分批培养基的3升发酵容器,所述发酵分批培养基的组成为每升10g酵母提取物、24g蔗糖、5g(NH4)2SO4、2g KH2PO4、0.5g CaCl2·2H2O、2g MgSO4.7H2O、1g柠檬酸、2g K2SO4、0.5ml消泡剂、和0.5ml痕量金属溶液。痕量金属溶液组成为每升13.8g FeSO4·7H2O、14.3g ZnSO4·7H2O、8.5g MnSO4·H2O、2.5gCuSO4·5H2O、和3g柠檬酸。发酵补料培养基组成为麦芽糖和消泡剂。发酵补料培养基以0-4.4g/l/hr的速率在185小时的时间内定量添加。发酵容器保持在34℃的温度,pH控制在6.1+/-0.1的固定点。以1vvm的速率向容器中通入空气,并用转速为1100-1300rpm的Rushton叶轮搅拌发酵液。发酵结束时,从容器中收集所有发酵液,3000xg离心去除生物质。上清液无菌过滤后保存在35-40℃。
实施例9:pMJ04表达载体的构建
使用如下所示的引物993429(反义)和993428(有义)从里氏木霉RutC30基因组DNA PCR扩增里氏木霉外切纤维二糖水解酶1基因(cbh1,CEL7A)终止子,构建了表达载体pMJ04。经过工程改造,所述反义引物在5’末端具有一个PacI位点,有义引物在3’末端具有一个SpeI位点。
引物993429(反义):
5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO:7)
引物993428(有义):
5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO:8)
扩增反应物(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)(New England Biolabs,Beverly,MA,USA)、0.3mM dNTP、100ng里氏木霉RutC30基因组DNA、0.3μM引物993429、0.3μM引物993428、和2单位的Vent DNA聚合酶(New England Biolabs,Beverly,MA,USA)。将这些反应物在如下编程的 5333中温育:进行94℃ 30秒、50℃ 30秒、72℃ 60秒的循环5次,然后进行94℃ 30秒、65℃ 30秒、72℃ 120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下229bp的产物条带,使用Gel Extraction Kit(凝胶提取试剂盒)(QIAGEN Inc.,Valencia,CA,USA)依照生产商的说明进行纯化。
所得的PCR片段用PacI和SpeI消化后,用Rapid Ligation Kit(快速连接试剂盒)(Roche,Indianapolis,IN,USA)连接到经相同的限制酶消化过的pAlLo1(WO 05/067531)中,产生pMJ04(图4)。
实施例10:pCaHj568的构建
从pCaHj170(美国专利5,763,254)和pMT2188出发构建质粒pCaHj568。质粒pCaHj 170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQID NO:9,编码SEQ ID NO:10的氨基酸序列)。pMT2188的构建最先是用如下所示的引物142779和142780从pCaHj483(WO 98/00529)PCR扩增出pUC19复制起点。引物142780在PCR片段中引入BbuI位点。
142779:
5’-TTGAATTGAAAATAGATTGATTTAAAACTTC-3’(SEQ ID NO:11)
142780:
5’-TTGCATGCGTAATCATGGTCATAGC-3’(SEQ ID NO:12)
该扩增使用PCR System(Roche Molecular Biochemicals,Basel,Switzerland)依照制造商的说明进行。在琼脂糖凝胶上分离PCR产物,使用Jetquick Gel Extraction Spin Kit(离心式快速凝胶提取试剂盒)(Genomed,Wielandstr,Germany)分离并纯化出一个1160bp的片段。
使用如下所示的引物140288和142778,利用PCR System从通用酿酒酵母克隆载体pYES2(Invitrogen,Carlsbad,CA,USA)中扩增出URA3基因。引物140288在PCR片段中引入一个EcoRI位点。
140288:
5’-TTGAATTCATGGGTAATAACTGATAT-3’(SEQ ID NO:13)
142778:
5’-AAATCAATCTATTTTCAATTCAATTCATCATT-3’(SEQ ID NO:14)
在琼脂糖凝胶上分离PCR产物,使用Jetquick Gel Extraction Spin Kit(离心式快速凝胶提取试剂盒)分离并纯化出一个1126bp的片段。
通过混合所述两个PCR片段并用如上所示的引物142780和140288依照重叠剪接(overlap splicing)法(Horton等,1989,Gene 77:61-68)进行扩增,将这两个片段融合起来。在琼脂糖凝胶上分离PCR产物,使用Jetquick GelExtraction Spin Kit(离心式快速凝胶提取试剂盒)分离并纯化出一个2263bp的片段。
所得的片段用EcoRI和BbuI消化,并使用标准规程连接到用相同的限制酶消化过的pCaHj483的最大片段中。将连接混合物转化到依照Mandel和Higa,1970,J.Mol.Biol.45:154的方法制成感受态的pyrF阴性大肠杆菌菌株DB6507(ATCC 35673)中。在每升添加了1g酪蛋白氨基酸、500μg硫胺素和10mg卡那霉素的M9培养基(Sambrook等,1989,Molecular Cloning,A Laboratory Manual,2nd edition,Cold Spring Harbor Laboratory Press)上选择转化子。分离了来自于一个转化子的质粒,命名为pCaHj527(图5)。
使用PCR System并依照制造商的说明,通过PCR对pCaHj527上存在的NA2-tpi启动子进行定点诱变。利用如下所示的诱变引物141223,将核苷酸134-144从GTACTAAAACC(SEQ ID NO:15)转变为CCGTTAAATTT(SEQ ID NO:16)。
引物141223:
5’-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3’(SEQ ID NO:17)
利用如下所示的诱变引物141222,将核苷酸423-436从ATGCAATTTAAACT(SEQ ID NO:18)转变为CGGCAATTTAACGG(SEQID NO:19)。
引物141222:
5’-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3’(SEQ ID NO:20)
所得的质粒命名为pMT2188(图6)。
将特异腐质霉内切葡聚糖酶V编码区从pCaHj170作为Bam HI-Sal I片段转移到用Bam HI和Xho I消化过的pMT2188中,生成pCaHj568(图7)。质粒pCaHj568包含与特异腐质霉内切葡聚糖酶V全长编码序列可操作地连接的突变的NA2-tpi启动子。
实施例11:pMJ05的构建
质粒pMJ05的构建是通过使用如下所示的引物HiEGV-F和HiEGV-R从pCaHj568PCR扩增出915bp的特异腐质霉内切葡聚糖酶V全长编码区。
HiEGV-F(有义):
5’-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO:21)
HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:22)
扩增反应物(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、10ng/μl pCaHj568、0.3μM HiEGV-F引物、0.3μM HiEGV-R引物、和2单位Vent DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 30秒、50℃ 30秒、72℃ 60秒的循环5次,然后进行94℃ 30秒、65℃ 30秒、72℃ 120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下937bp的产物条带,使用GelExtraction Kit依照生产商的说明进行纯化。
用937bp的纯化片段作为模板DNA继续用下述引物进行扩增:
HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:23)
HiEGV-F-overlap(有义):
5’-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3’(SEQ IDNO:24)
斜体表示的引物序列与里氏木霉纤维二糖水解酶I基因(cbh1)启动子的17bp同源,下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠使得包含里氏木霉cbh1启动子的994bp片段能够精确的融合于包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。
扩增反应物(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、1μl纯化的937bp PCR片段、0.3μMHiEGV-F-overlap引物、0.3μM HiEGV-R引物、和2单位Vent DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 30秒、50℃ 30秒、72℃ 60秒的循环5次,然后进行94℃ 30秒、65℃ 30秒、72℃ 120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下945bp的产物条带,使用Gel Extraction Kit依照生产商的说明进行纯化。
另外使用如下所示的引物(该有义引物经工程改造在5’末端具有一个SalI限制位点)进行PCR,来从里氏木霉RutC30基因组DNA扩增里氏木霉cbh1启动子序列,该序列从所述基因的ATG起始密码子上游994bp开始延伸。里氏木霉RutC30基因组DNA是用Plant Maxi Kit分离的。
TrCBHIpro-F(有义):
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:25)
TrCBHIpro-R(反义):
5’-GATGCGCAGTCCGCGGT-3’(SEQ ID NO:26)
扩增反应物(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、100ng/μl里氏木霉RutC30基因组DNA、0.3μMTrCBHIpro-F引物、0.3μM TrCBHIpro-R引物、和2单位Vent DNA聚合酶。将这些反应物在如下编程的 5333中温育:94℃ 30秒、55℃ 30秒、72℃ 120秒的循环30次(最终延伸5分钟)。将反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下998bp的产物条带,使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
用纯化的998bp PCR片段作为模板DNA继续用下述引物进行扩增。
TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:27)
TrCBHIpro-R-overlap:
5’-GGAGGGGGGAGGAACGCATGATGCGCA GTCCGCGGT-3’(SEQ ID NO:28)
斜体表示的序列与里氏木霉cbh1启动子的17bp同源,下划线的序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠使得包含里氏木霉cbh1启动子的994bp片段能够精确的融合于包含特异腐质霉内切葡聚糖酶V全长编码区的918bp片段。
扩增反应物(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、1μl纯化的998bp PCR片段、0.3μMTrCBH1pro-F引物、0.3μM TrCBH1pro-R-overlap引物、和2单位Vent DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 30秒、50℃ 30秒、72℃ 60秒的循环5次,然后进行94℃ 30秒、65℃ 30秒、72℃ 120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1017bp的产物条带,使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
用1017bp里氏木霉cbh1启动子PCR片段和945bp特异腐质霉内切葡聚糖酶V PCR片段作为模板DNA继续用下述引物进行扩增,以利用重叠PCR精确地将994bp cbh1启动子融合于918bp内切葡聚糖酶V全长编码区。
TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:29)
HiEGV-R:
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:30)
扩增反应物(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、0.3μM TrCBH1pro-F引物、0.3μM HiEGV-R引物和2单位Vent DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 30秒、50℃ 30秒、72℃ 60秒的循环5次,然后进行94℃ 30秒、65℃ 30秒、72℃ 120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1926bp的产物条带,使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
将所得的1926bp片段使用 PCR Cloning Kit( PCR克隆试剂盒)(Invitrogen,Carlsbad,CA,USA)依照制造商的规程克隆到-Blunt-II-载体(Invitrogen,Carlsbad,CA,USA)中。所得的载体用Not I和Sal I消化,使用GelExtraction Kit(凝胶提取试剂盒)凝胶纯化1926bp片段,然后使用T4DNA连接酶(Roche,Indianapolis,IN,USA)连接到pMJ04(其也用同样两种限制酶消化过)中,产生pMJ05(图8)。质粒pMJ05包含与特异腐质霉内切葡聚糖酶V全长编码序列可操作地连接的里氏木霉纤维二糖水解酶I启动子及终止子。
实施例12:pSMai130表达载体的构建
从作为模板的pJaL660(WO 2002/095014)用如下所示的引物993467(有义)和993456(反义)PCR扩增了米曲霉β-葡糖苷酶全长编码序列(cDNA序列:SEQ ID NO:31;推定的氨基酸序列:SEQ ID NO:32;大肠杆菌DSM14240)中从ATG起始密码子直到TAA终止密码子的2586bp的DNA片段。一个Spe I位点被工程构建到反义引物的5’末端以便于连接。斜体字的引物序列与里氏木霉cbh1启动子的24bp同源,下划线的序列与米曲霉β-葡糖苷酶编码区的22bp同源。
引物993467:
5’-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATCGA GG-3’(SEQ ID NO:33)
引物993456:
5’-ACTAGTTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:34)
扩增反应物(50μl)的组成为Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),0.25mM dNTP,10ng pJaL660,6.4μM引物993467,3.2μM引物993456,1mM MgCl2和2.5单位Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)。将这些反应物在如下编程的 5333中温育:进行94℃ 60秒、55℃ 60秒、72℃ 180秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下2586bp的产物条带,使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
另外使用如下所示的引物993453(有义)和引物993463(反义)进行PCR,来扩增里氏木霉cbh1启动子序列(其从该基因ATG起始密码子上游1000bp处开始延伸),产生一个1000bp的PCR片段。
引物993453:
5’-GTCGACTCGAAGCCCGAATGTAGGAT-3’(SEQ ID NO:35)
引物993463:
5’-CCTCGATCCAACCAAGCTTCATGATGCGCAGTCCGCGGTTGACTA-3’(SEQ ID NO:36)
斜体表示的引物序列与里氏木霉cbh1启动子的24bp同源,下划线的引物序列与米曲霉β-葡糖苷酶全长编码区的22bp同源。启动子和编码序列之间46bp的重叠使得包含里氏木霉cbh1启动子的1000bp片段能够精确的融合于包含米曲霉β-葡糖苷酶编码区的2586bp片段。
扩增反应物(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、100ng里氏木霉RutC30基因组DNA、6.4μM引物993453、3.2μM引物993463、1mMMgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 60秒、55℃ 60秒、72℃ 180秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1000bp的产物条带,使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
用纯化的片段作为模板DNA,进一步通过使用上文所示的引物993453(有义)和引物993456(反义)的重叠PCR进行扩增,来将包含里氏木霉cbh1启动子的1000bp片段精确地融合于包含米曲霉β-葡糖苷酶全长编码区的2586bp片段。
扩增反应物(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、6.4μM引物99353、3.2μM引物993456、1mM MgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 60秒、60℃ 60秒、72℃ 240秒的循环30次(最终延伸15分钟)。
将所得的3586bp片段用Sal I和Spe I消化,并连接到用同样两种限制酶消化过的pMJ04中,产生pSMai130(图9)。质粒pSMai130包含与米曲霉天然β-葡糖苷酶信号序列及编码序列(即全长米曲霉β-葡糖苷酶编码序列)可操作地连接的里氏木霉纤维二糖水解酶I基因启动子及终止子。
实施例13:pSMai135的构建
从作为模板的pJaL660利用如下所示的引物993728(有义)及引物993727(反义)PCR扩增出从Lys-20到TAA终止密码子的米曲霉β-葡糖苷酶成熟编码区(减去天然信号序列,见图10;SEQ ID NO:37和38代表信号肽和它的编码序列)。
引物993728:
5’-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3’(SEQID NO:39)
引物993727:
5’-GACTAGTCTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:40)
斜体字的序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,下划线的序列与米曲霉β-葡糖苷酶编码区的22bp同源。将一个Spe I位点工程化到反义引物的5’端中。
扩增反应物(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、10ng/μlpJal660、6.4μM引物993728、3.2μM引物993727、1mM MgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 60秒、55℃ 60秒、72℃ 180秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下2523bp的产物条带,使用GelExtraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
另外使用如下所示的引物993724(有义)和引物993729(反义)进行PCR扩增来扩增里氏木霉cbh1启动子的1000bp和特异腐质霉内切葡聚糖酶V信号序列的63bp(ATG起始密码子到Ala-21,图11,SEQ ID NO:41和42)。
引物993724:
5’-ACGCGTCGACCGAATGTAGGATTGTTATCC-3’(SEQ ID NO:43)
引物993729:
5’-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3’(SEQ ID NO:44)
斜体字的引物序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。
用包含cbh1启动子控制下的特异腐质霉内切葡聚糖酶V编码区的质粒pMJ05作为模板,产生了一条包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段。里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列与米曲霉β-葡糖苷酶成熟编码序列之间有42bp的重叠,以提供所述启动子与2523bp米曲霉β-葡糖苷酶编码区的ATG起始密码子之间的完美连结。
扩增反应物(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、10ng/μlpMJ05、6.4μM引物993728、3.2μM引物993727、1mM MgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 60秒、60℃ 60秒、72℃ 240秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1063bp的产物条带,使用GelExtraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
用纯化的重叠片段作为模板,用如上所述的引物993724(有义)和引物993727(反义)进行扩增,通过重叠PCR将所述包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确地融合于所述包含米曲霉β-葡糖苷酶成熟编码区框的2523bp片段。
扩增反应物(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、6.4μM引物993724、3.2μM引物993727、1mM MgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的 5333中温育:进行94℃ 60秒、60℃ 60秒、72℃ 240秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下3591bp的产物条带,使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
将所得的3591bp片段用Sal I和Spe I消化,连接到用相同的限制酶消化过的pMJ04中产生pSMai135(图12)。质粒pSMai135包含可操作地连接于特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列的里氏木霉纤维二糖水解酶I基因启动子和终止子。
实施例14:带有特异腐质霉内切葡聚糖酶V分泌序列的米曲霉β-葡糖苷酶的表达
通过PEG-介导的转化(Penttila等,1987,Gene 61155-164)将编码与特异腐质霉内切葡聚糖酶V分泌序列连接的成熟米曲霉β-葡糖苷酶的质粒pSMai135(图11)导入里氏木霉RutC30中。该质粒含有构巢曲霉amdS基因,使得转化子可以利用乙酰胺作为唯一氮源生长。
将里氏木霉RutC30在25ml添加了2%(w/v)葡萄糖和10mM尿苷的YP培养基中27℃、90rpm条件下培养17个小时。用Vacuum DrivenDisposable Filtration System(一次性真空驱动过滤系统)(Millipore,Bedford,MA,USA)过滤收集菌丝体,用去离子水和1.2M山梨醇各洗涤两次。将经过洗涤的菌丝体重悬在含15mg/ml(Novozymes A/S,Denmark)和0.36单位/ml壳多糖酶(Sigma Chemical Co.,St.Louis,MO,USA)的20ml 1.2M山梨醇中,90rpm轻柔震荡下34℃温育15-25分钟来生成原生质体。400xg离心7分钟收集原生质体,用冷的1.2M山梨醇洗涤两次。原生质体用血细胞计数器计数后重悬于STC中至终浓度1X108个原生质体/ml。多余的原生质体在Cryo 1 C Freezing Container(1 C冷冻柜)(Nalgene,Rochester,NY,USA)中-80℃保存。
将大约7μg经Pme I消化的pSMai135加入100μl原生质体溶液中,轻柔混合,然后加入260μl PEG缓冲液,混合,室温温育30分钟。然后加入STC(3ml),混合,将转化溶液涂布到使用构巢曲霉amdS选择的COVE平板上。将平板在28℃温育5-7天。将转化子分培到COVE2平板上,使其在28℃生长。
将用pSMai135获得的67个转化子(称为SMA135)分培到含有乙酰胺的新鲜平板上,让它们在28℃产生孢子7天。
将这67个SMA135里氏木霉转化子在含25ml pH 6.0纤维素酶诱导培养基的125ml带挡板烧瓶中培养,其中用所述转化子的孢子接种培养基,在28℃、200rpm条件下温育7天。用里氏木霉RutC30作为对照。在第7天取出培养液样品。将每种培养液1ml在微量离心管中15,700xg离心5分钟,将上清液转移到新管中。样品保存在4℃直到进行酶测定。用对硝基苯基-β-D-吡喃葡萄糖苷作为底物测定上清液的β-葡糖苷酶活性,如下所述。
β-葡糖苷酶活性测定在环境温度下进行,使用25μl等份的在50mM琥珀酸盐(succinate)pH 5.0中1∶10稀释过的培养上清液,在作为底物的200μl0.5mg/ml对硝基苯基-β-D-吡喃葡萄糖苷(溶于50mM琥珀酸盐pH 5.0)中实施。温育15分钟后加入100μl 1M Tris-HCl pH 8.0终止反应,用分光光度计读取405nm吸光度。1个单位的β-葡糖苷酶活性对应于环境温度、pH 5.0条件下每升每分钟产生1μmol对硝基苯。用黑曲霉β-葡糖苷酶(NOVOZYMTM 188,Novozymes A/S,Denmark)作为酶标准品。
若干个SMA135转化子显示了比里氏木霉RutC30高数倍的β-葡糖苷酶活性。转化子SMA135-04产生了最高的β-葡糖苷酶活性。
用系统(Bio-Rad,Hercules,CA,USA)使用Tris-HCl(5%分离型)凝胶(Bio-Rad,Hercules,CA,USA)进行SDS-PAGE。将5μl第7天上清液(见上文)重悬在2X浓度的Laemmli Sample Buffer(Laemmli样品缓冲液)(Bio-Rad,Hercules,CA,USA)中,在5%β-巯基乙醇存在下煮沸3分钟。将上清液样品加载到聚丙烯酰胺凝胶上,用1X Tris/甘氨酸/SDS作为运行缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。所得的凝胶用BIO-Coomassie Stain(考马斯染料)染色。
总的说来,38个里氏木霉SMA135转化子中的26个产生了一个大约110kDa的蛋白质,其未见于作为对照的里氏木霉RutC30中。转化子里氏木霉SMA135-04产生的β-葡糖苷酶水平最高。
实施例15:里氏木霉SMA135-04的发酵
将100ml的下述摇瓶培养基加入500ml摇瓶中。摇瓶培养基的组成为每升20g葡萄糖、10g玉米浸浆固形物、1.45g(NH4)2SO4、2.08g KH2PO4、0.36g CaCl2、0.42g MgSO4·7H2O和0.42ml痕量金属溶液。痕量金属溶液的组成为每升216g FeCl3·6H2O、58g ZnSO4·7H2O、27g MnSO4·H2O、10gCuSO4·5H2O、2.4g H3BO3和336g柠檬酸。用来自里氏木霉SMA135-04固体平板培养物的两块琼脂块接种摇瓶,在回转摇床上200rpm 28℃温育48小时。
用50ml的该摇瓶培养液接种含1.8升发酵分批培养基(fermentationbatch medium)的3升发酵容器,所述发酵分批培养基的组成为每升30g纤维素、4g葡萄糖、10g玉米浸浆固形物、3.8g(NH4)2SO4、2.8g KH2PO4、2.64g CaCl2、1.63g MgSO4.7H2O、1.8ml消泡剂和0.66ml痕量金属溶液。痕量金属溶液组成为每升216g FeCl3·6H2O、58g ZnSO4·7H2O、27gMnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3和336g柠檬酸。发酵补料培养基(fermentation feed medium)由葡萄糖和纤维素组成,以0-4g/l/hr的速率定量添加165小时。发酵容器保持在28℃的温度,pH控制在4.75+/-0.1的设定点。以1vvm的速率向容器中通入空气,并用转速为1100-1300rpm的Rushton叶轮搅拌发酵液。发酵结束时,从容器中收集所有发酵液,3000xg离心去除生物质。上清液无菌过滤后保存在35-40℃。
实施例16:具有纤维素分解增强活性的土生梭孢壳GH61F多肽的表征
玉米秸秆在美国能源部国立可再生能源实验室(NREL),Golden,CO使用稀硫酸进行预处理。预处理使用下述条件:0.048g硫酸/g干生物量、190℃、25%w/w干固形物、历时大约1分钟。据NREL称,经预处理的玉米秸秆(PCS)中的水不溶性固形物含有53.2%纤维素、3.2%半纤维素和31.5%木质素。通过下述方法测定纤维素和半纤维素:使用NREL StandardAnalytical Procedure #002(NREL标准分析流程002号),在二阶段硫酸水解后通过高效液相层析来分析糖。木质素的测定是使用NREL StandardAnalytical Procedure#003(NREL标准分析流程003号),在用硫酸水解了纤维素和半纤维素部分之后通过重量分析测定的。在酶促水解之前,用大量的去离子水洗涤PCS以去除酸预处理过程中产生的可溶性化合物。
如实施例7中所述在米曲霉中表达土生梭孢壳GH61F多肽,将培养液9500xg离心,然后将上清液通过0.22μm滤器(Millipore,Billerica,MA,USA)过滤。经过过滤的培养液用ECONO-10DG柱(Bio-Rad,Hercules,CA,USA)脱盐。
如实施例15所述获得了一种含米曲霉β-葡糖苷酶(WO 02/095014)的里氏木霉纤维素酶制备物,下文中称其为Tr/AoBG。
PCS(45mg/ml,于50mM乙酸钠pH 5.0缓冲液中)的水解使用96孔深孔型平板(Axygen Scientific,Inc.,Union City,CA,USA)进行,这些平板用ALPS 300TM自动化实验室用平板密封仪(ABgene Inc.,Rochester,NY,USA)密封,总反应体积为1.0ml。测试了土生梭孢壳GH61F多肽增强含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物的水解能力的能力。PCS的水解如下进行,每克纤维素使用2.25、4.5和6.75mg含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物,分别添加了每克纤维素0.25、0.5和0.75mg的土生梭孢壳GH61F多肽,与分别为每克纤维素2.5、5.0及7.5mg的单独的含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物比较。在TS Autoflow CO2 WaterJacketed Incubator(TS自动流程式CO2水蒸汽保温箱)(NuAire Inc.,Plymouth,MN,USA)中于50℃和60℃进行PCS水解。反应一式三份进行,在水解过程中取等份样品。通过将每个水解产物的20μl等份样品与180μl 0.1MNaOH(终止试剂)混合来终止PCS水解反应。为每个样品制备合适的系列稀释物,并利用一种适用于96孔微量板规格的对羟基苯甲酸酰肼(para-hydroxybenzoic acid hydrazide)(PHBAH,Sigma Chemical Co.,St.Louis,MO,USA)测定法来测定还原糖量,该测定法如下所述。简单地说,将100μl等份的合适稀释的样品置于96孔锥底微量平板中。加入50μl溶于0.5MNaOH的1.5%(w/v)PHBAH到每个孔中启动反应。平板不加盖95℃加热10分钟。让平板冷却到室温(RT),向每个孔中加入50μl蒸馏水。从每个孔取100μl等份转移到平底96孔板中,用Microplate Reader(微量平板读数器)(Molecular Devices,Sunnyvale,CA,USA)测定410nm吸光度。用葡萄糖标准品(0.1-0.0125mg/ml,用0.1M氢氧化钠稀释)制作标准曲线,用来将所得的A410nm值换算成葡萄糖当量。用所得的当量来计算每个反应的PCS纤维素转化率百分比。
用下面的等式计算纤维素转化为还原糖的程度(转化率,%):
转化率(%)=RS(mg/ml)x100x162/(纤维素(mg/ml)x180)==RS(mg/ml)x100/(纤维素(mg/ml)x1.111)
在该等式中,RS是以葡萄糖当量(mg/ml)计的溶液中还原糖浓度,因子1.111反映纤维素到葡萄糖的转化中的重量增加。
单独的含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物(2.5、5和7.5mg/g纤维素)或者有10%替换成土生梭孢壳GH61F多肽(2.25+0.25,4.5+0.5,6.75+0.75mg/g纤维素)的纤维素转化率总结于表1。
表1.单独或添加有土生梭孢壳GH61F多肽的含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物在50℃及60℃、pH 5.0条件下120小时的纤维素转化率
表1中所示的结果显示,土生梭孢壳GH61F多肽增强了含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物对PCS的活性。该土生梭孢壳GH61F多肽自身(0.75mg/g纤维素)在50℃和60℃下120小时后分别产生了1.6%和0.9%的纤维素转化。在50℃和60℃下,向6.75mg含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物添加0.75mg土生梭孢壳GH61F多肽都产生了比7.5mg Tr/AoBG高的纤维素转化,表明含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物对PCS的活性被土生梭孢壳GH61F多肽增强,并且含米曲霉β-葡糖苷酶的里氏木霉纤维素酶制备物与土生梭孢壳GH61F多肽之间有协同作用。
生物材料的保藏
下列生物材料已经根据布达佩斯条约的规定保藏于北方区域研究中心农业研究机构专利培养物保藏中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,并被给予下列保藏号:
保藏物 保藏号 保藏日
大肠杆菌pTter61F NRRL B-50044 2007年5月25日
该菌株在这样的条件下被保藏,以确保在本专利申请的审批过程中,由美国专利与商标局长根据联邦法规汇编第37编第1.14节及美国法典第35编第122条的规定确定为有资格者可获取该培养物。该保藏物是被保藏菌株的基本上纯的培养物。本主题申请在其他国家提交了对应申请或其子申请的,该保藏物可应这些国家专利法的要求予以提供。然而应当理解,提供保藏物并不构成对于实施本发明而损害由政府授予的专利权的行为的许可。
本文中所描述并要求保护的发明的范围不应受到本文中公开的具体方面的限制,因为公开这些方面是为了举例说明本发明的一些方面。任何等同的方面都应落入本发明的范围。事实上,除了本文中显示和描述的那些之外,本领域技术人员根据前面的说明书可以容易地想到本发明的各种修改。这些修改也应落入本发明的范围。在冲突的情况下,应以包括定义在内的本公开内容为准。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
Lopez de Leon,Alfredo
Ding,Hanshu
Brown,Kimberly
<120>具有纤维素分解增强活性的多肽和编码它的多核苷酸
<130>11235.204-WO
<150>60/941,234
<151>2007-05-31
<160>82
<170>PatentIn version 3.5
<210>1
<211>954
<212>DNA
<213>土生梭孢壳(Thielavia terrestris)
<400>1
atgaagggcc tcagcctcct cgccgctgcg tcggcagcga ctgctcatac catcttcgtg 60
cagctcgagt cagggggaac gacctatccg gtatcctacg gcatccggga ccctagctac 120
gacggtccca tcaccgacgt cacctccgac tcactggctt gcaatggtcc cccgaacccc 180
acgacgccgt ccccgtacat catcaacgtc accgccggca ccacggtcgc ggcgatctgg 240
aggcacaccc tcacatccgg ccccgacgat gtcatggacg ccagccacaa ggggccgacc 300
ctggcctacc tcaagaaggt cgatgatgcc ttgaccgaca cgggtatcgg cggcggctgg 360
ttcaagatcc aggaggccgg ttacgacaat ggcaattggg ctaccagcac ggtgatcacc 420
aacggtggct tccaatatat tgacatcccc gcctgcattc ccaacggcca gtatctgctc 480
cgcgccgaga tgatcgcgct ccacgccgcc agcacgcagg gtggtgccca gctctacatg 540
gagtgcgcgc agatcaacgt ggtgggcggc tccggcagcg ccagcccgca gacgtacagc 600
atcccgggca tctaccaggc aaccgacccg ggcctgctga tcaacatcta ctccatgacg 660
ccgtccagcc agtacaccat tccgggtccg cccctgttca cctgcagcgg cagcggcaac 720
aacggcggcg gcagcaaccc gtcgggcggg cagaccacga cggcgaagcc cacgacgacg 780
acggcggcga cgaccacctc ctccgccgct cctaccagca gccagggggg cagcagcggt 840
tgcaccgttc cccagtggca gcagtgcggt ggcatctcgt tcaccggctg caccacctgc 900
gcggcgggct acacctgcaa gtatctgaac gactattact cgcaatgcca gtaa 954
<210>2
<211>317
<212>PRT
<213>土生梭孢壳
<400>2
Met Lys Gly Leu Ser Leu Leu Ala Ala Ala Ser Ala Ala Thr Ala His
1 5 10 15
Thr Ile Phe Val Gln Leu Glu Ser Gly Gly Thr Thr Tyr Pro Val Ser
20 25 30
Tyr Gly Ile Arg Asp Pro Ser Tyr Asp Gly Pro Ile Thr Asp Val Thr
35 40 45
Ser Asp Ser Leu Ala Cys Asn Gly Pro Pro Asn Pro Thr Thr Pro Ser
50 55 60
Pro Tyr Ile Ile Asn Val Thr Ala Gly Thr Thr Val Ala Ala Ile Trp
65 70 75 80
Arg His Thr Leu Thr Ser Gly Pro Asp Asp Val Met Asp Ala Ser His
85 90 95
Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Asp Asp Ala Leu Thr
100 105 110
Asp Thr Gly Ile Gly Gly Gly Trp Phe Lys Ile Gln Glu Ala Gly Tyr
115 120 125
Asp Asn Gly Asn Trp Ala Thr Ser Thr Val Ile Thr Asn Gly Gly Phe
130 135 140
Gln Tyr Ile Asp Ile Pro Ala Cys Ile Pro Asn Gly Gln Tyr Leu Leu
145 150 155 160
Arg Ala Glu Met Ile Ala Leu His Ala Ala Ser Thr Gln Gly Gly Ala
165 170 175
Gln Leu Tyr Met Glu Cys Ala Gln Ile Asn Val Val Gly Gly Ser Gly
180 185 190
Ser Ala Ser Pro Gln Thr Tyr Ser Ile Pro Gly Ile Tyr Gln Ala Thr
195 200 205
Asp Pro Gly Leu Leu Ile Asn Ile Tyr Ser Met Thr Pro Ser Ser Gln
210 215 220
Tyr Thr Ile Pro Gly Pro Pro Leu Phe Thr Cys Ser Gly Ser Gly Asn
225 230 235 240
Asn Gly Gly Gly Ser Asn Pro Ser Gly Gly Gln Thr Thr Thr Ala Lys
245 250 255
Pro Thr Thr Thr Thr Ala Ala Thr Thr Thr Ser Ser Ala Ala Pro Thr
260 265 270
Ser Ser Gln Gly Gly Ser Ser Gly Cys Thr Val Pro Gln Trp Gln Gln
275 280 285
Cys Gly Gly Ile Ser Phe Thr Gly Cys Thr Thr Cys Ala Ala Gly Tyr
290 295 300
Thr Cys Lys Tyr Leu Asn Asp Tyr Tyr Ser Gln Cys Gln
305 310 315
<210>3
<211>16
<212>DNA
<213>土生梭孢壳
<400>3
gtaaaacgac ggccag 16
<210>4
<211>25
<212>DNA
<213>土生梭孢壳
<220>
<221>misc_feature
<222>(24)..(24)
<223>V=G,A,C
<220>
<221>misc feature
<222>(25)..(25)
<223>N=G,A,C,T
<400>4
tttttttttt tttttttttt tttvn 25
<210>5
<211>34
<212>DNA
<213>土生梭孢壳
<400>5
actggattta ccatgaaggg cctcagcctc ctcg 34
<210>6
<211>40
<212>DNA
<213>土生梭孢壳
<400>6
tcacctctag ttaattaatt actggcattg cgagtaatag 40
<210>7
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>7
aacgttaatt aaggaatcgt tttgtgttt 29
<210>8
<211>29
<212>DNA
<213>里氏木霉
<400>8
agtactagta gctccgtggc gaaagcctg 29
<210>9
<211>918
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>9
atgcgttcct cccccctcct cccgtccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct 720
ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca 780
gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat 840
ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg 900
taccatcagt gcctgtag 918
<210>10
<211>305
<212>PRT
<213>特异腐质霉
<400>10
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser
225 230 235 240
Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr
245 250 255
Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu
260 265 270
Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys
275 280 285
Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys
290 295 300
Leu
305
<210>11
<211>31
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>11
ttgaattgaa aatagattga tttaaaactt c 31
<210>12
<211>25
<212>DNA
<213>酿酒酵母
<400>12
ttgcatgcgt aatcatggtc atagc 25
<210>13
<211>26
<212>DNA
<213>酿酒酵母
<400>13
ttgaattcat gggtaataac tgatat 26
<210>14
<211>32
<212>DNA
<213>酿酒酵母
<400>14
aaatcaatct attttcaatt caattcatca tt 32
<210>15
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>15
gtactaaaac c 11
<210>16
<211>11
<212>DNA
<213>黑曲霉
<400>16
ccgttaaatt t 11
<210>17
<211>45
<212>DNA
<213>黑曲霉
<400>17
ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc 45
<210>18
<211>14
<212>DNA
<213>黑曲霉
<400>18
atgcaattta aact 14
<210>19
<211>14
<212>DNA
<213>黑曲霉
<400>19
cggcaattta acgg 14
<210>20
<211>44
<212>DNA
<213>黑曲霉
<400>20
ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc 44
<210>21
<211>29
<212>DNA
<213>特异腐质霉
<400>21
aagcttaagc atgcgttcct cccccctcc 29
<210>22
<211>32
<212>DNA
<213>特异腐质霉
<400>22
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>23
<211>32
<212>DNA
<213>里氏木霉
<400>23
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>24
<211>36
<212>DNA
<213>里氏木霉
<400>24
accgcggact gcgcatcatg cgttcctccc ccctcc 36
<210>25
<211>29
<212>DNA
<213>里氏木霉
<400>25
aaacgtcgac cgaatgtagg attgttatc 29
<210>26
<211>17
<212>DNA
<213>里氏木霉
<400>26
gatgcgcagt ccgcggt 17
<210>27
<211>29
<212>DNA
<213>里氏木霉
<400>27
aaacgtcgac cgaatgtagg attgttatc 29
<210>28
<211>36
<212>DNA
<213>里氏木霉
<400>28
ggagggggga ggaacgcatg atgcgcagtc cgcggt 36
<210>29
<211>29
<212>DNA
<213>里氏木霉
<400>29
aaacgtcgac cgaatgtagg attgttatc 29
<210>30
<211>32
<212>DNA
<213>里氏木霉
<400>30
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>31
<211>2771
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>31
ctgttctgct ggttacctgc cacgttatca tgaagcttgg ttggatcgag gtggccgcat 60
tggcggctgc ctcagtagtc agtgccaagg atgatctcgc gtactcccct cctttctacc 120
cttccccatg ggcagatggt cagggtgaat gggcggaagt atacaaacgc gctgtagaca 180
tagtttccca gatgacgttg acagagaaag tcaacttaac gactggaaca ggatggcaac 240
tagagaggtg tgttggacaa actggcagtg ttcccagact caacatcccc agcttgtgtt 300
tgcaggatag tcctcttggt attcgtttct cggactacaa ttcagctttc cctgcgggtg 360
ttaatgtcgc tgccacctgg gacaagacgc tcgcctacct tcgtggtcag gcaatgggtg 420
aggagttcag tgataagggt attgacgttc agctgggtcc tgctgctggc cctctcggtg 480
ctcatccgga tggcggtaga aactgggaag gtttctcacc agatccagcc ctcaccggtg 540
tactttttgc ggagacgatt aagggtattc aagatgctgg tgtcattgcg acagctaagc 600
attatatcat gaacgaacaa gagcatttcc gccaacaacc cgaggctgcg ggttacggat 660
tcaacgtaag cgacagtttg agttccaacg ttgatgacaa gactatgcat gaattgtacc 720
tctggccctt cgcggatgca gtacgcgctg gagtcggtgc tgtcatgtgc tcttacaacc 780
aaatcaacaa cagctacggt tgcgagaata gcgaaactct gaacaagctt ttgaaggcgg 840
agcttggttt ccaaggcttc gtcatgagtg attggaccgc tcatcacagc ggcgtaggcg 900
ctgctttagc aggtctggat atgtcgatgc ccggtgatgt taccttcgat agtggtacgt 960
ctttctgggg tgcaaacttg acggtcggtg tccttaacgg tacaatcccc caatggcgtg 1020
ttgatgacat ggctgtccgt atcatggccg cttattacaa ggttggccgc gacaccaaat 1080
acacccctcc caacttcagc tcgtggacca gggacgaata tggtttcgcg cataaccatg 1140
tttcggaagg tgcttacgag agggtcaacg aattcgtgga cgtgcaacgc gatcatgccg 1200
acctaatccg tcgcatcggc gcgcagagca ctgttctgct gaagaacaag ggtgccttgc 1260
ccttgagccg caaggaaaag ctggtcgccc ttctgggaga ggatgcgggt tccaactcgt 1320
ggggcgctaa cggctgtgat gaccgtggtt gcgataacgg tacccttgcc atggcctggg 1380
gtagcggtac tgcgaatttc ccatacctcg tgacaccaga gcaggcgatt cagaacgaag 1440
ttcttcaggg ccgtggtaat gtcttcgccg tgaccgacag ttgggcgctc gacaagatcg 1500
ctgcggctgc ccgccaggcc agcgtatctc tcgtgttcgt caactccgac tcaggagaaa 1560
gctatcttag tgtggatgga aatgagggcg atcgtaacaa catcactctg tggaagaacg 1620
gcgacaatgt ggtcaagacc gcagcgaata actgtaacaa caccgtggtc atcatccact 1680
ccgtcggacc agttttgatc gatgaatggt atgaccaccc caatgtcact ggtattctct 1740
gggctggtct gccaggccag gagtctggta actccatcgc cgatgtgctg tacggtcgtg 1800
tcaaccctgg cgccaagtct cctttcactt ggggcaagac ccgggagtcg tatggttctc 1860
ccttggtcaa ggatgccaac aatggcaacg gagcgcccca gtctgatttc acccagggtg 1920
ttttcatcga ttaccgccat ttcgataagt tcaatgagac ccctatctac gagtttggct 1980
acggcttgag ctacaccacc ttcgagctct ccgacctcca tgttcagccc ctgaacgcgt 2040
cccgatacac tcccaccagt ggcatgactg aagctgcaaa gaactttggt gaaattggcg 2100
atgcgtcgga gtacgtgtat ccggaggggc tggaaaggat ccatgagttt atctatccct 2160
ggatcaactc taccgacctg aaggcatcgt ctgacgattc taactacggc tgggaagact 2220
ccaagtatat tcccgaaggc gccacggatg ggtctgccca gccccgtttg cccgctagtg 2280
gtggtgccgg aggaaacccc ggtctgtacg aggatctttt ccgcgtctct gtgaaggtca 2340
agaacacggg caatgtcgcc ggtgatgaag ttcctcagct gtacgtttcc ctaggcggcc 2400
cgaatgagcc caaggtggta ctgcgcaagt ttgagcgtat tcacttggcc ccttcgcagg 2460
aggccgtgtg gacaacgacc cttacccgtc gtgaccttgc aaactgggac gtttcggctc 2520
aggactggac cgtcactcct taccccaaga cgatctacgt tggaaactcc tcacggaaac 2580
tgccgctcca ggcctcgctg cctaaggccc agtaaggggc aagtcctgat tgtacagagc 2640
atttcgagat ttatgatgta catgtttatg aatgacctag ggtagggtaa tacttagtag 2700
ggttagttct aattcttgga gtcaagtatt gactcactgg gccgataaaa aaaaaaaaaa 2760
aaaaaaaaaa a 2771
<210>32
<211>861
<212>PRT
<213>米曲霉
<400>32
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Ser Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>33
<211>46
<212>DNA
<213>米曲霉
<400>33
atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg 46
<210>34
<211>26
<212>DNA
<213>米曲霉
<400>34
actagtttac tgggccttag gcagcg 26
<210>35
<211>26
<212>DNA
<213>里氏木霉
<400>35
gtcgactcga agcccgaatg taggat 26
<210>36
<211>45
<212>DNA
<213>里氏木霉
<400>36
cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta 45
<210>37
<211>57
<212>DNA
<213>米曲霉
<400>37
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgcc 57
<210>38
<211>19
<212>PRT
<213>米曲霉
<400>38
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala
<210>39
<211>42
<212>DNA
<213>米曲霉
<400>39
tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc 42
<210>40
<211>28
<212>DNA
<213>米曲霉
<400>40
gactagtctt actgggcctt aggcagcg 28
<210>41
<211>63
<212>DNA
<213>特异腐质霉
<400>41
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gcc 63
<210>42
<211>21
<212>PRT
<213>特异腐质霉
<400>42
Met Arg Ser Ser Pro Leu Leu ArgSer Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala
20
<210>43
<211>30
<212>DNA
<213>里氏木霉
<400>43
acgcgtcgac cgaatgtagg attgttatcc 30
<210>44
<211>42
<212>DNA
<213>里氏木霉
<400>44
gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca 42
<210>45
<211>1377
<212>DNA
<213>里氏木霉
<400>45
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctt 1377
<210>46
<211>459
<212>PRT
<213>里氏木霉
<400>46
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210>47
<211>1254
<212>DNA
<213>里氏木霉
<400>47
atgaacaagt ccgtggctcc attgctgctt gcagcgtcca tactatatgg cggcgccgtc 60
gcacagcaga ctgtctgggg ccagtgtgga ggtattggtt ggagcggacc tacgaattgt 120
gctcctggct cagcttgttc gaccctcaat ccttattatg cgcaatgtat tccgggagcc 180
actactatca ccacttcgac ccggccacca tccggtccaa ccaccaccac cagggctacc 240
tcaacaagct catcaactcc acccacgagc tctggggtcc gatttgccgg cgttaacatc 300
gcgggttttg actttggctg taccacagat ggcacttgcg ttacctcgaa ggtttatcct 360
ccgttgaaga acttcaccgg ctcaaacaac taccccgatg gcatcggcca gatgcagcac 420
ttcgtcaacg aggacgggat gactattttc cgcttacctg tcggatggca gtacctcgtc 480
aacaacaatt tgggcggcaa tcttgattcc acgagcattt ccaagtatga tcagcttgtt 540
caggggtgcc tgtctctggg cgcatactgc atcgtcgaca tccacaatta tgctcgatgg 600
aacggtggga tcattggtca gggcggccct actaatgctc aattcacgag cctttggtcg 660
cagttggcat caaagtacgc atctcagtcg agggtgtggt tcggcatcat gaatgagccc 720
cacgacgtga acatcaacac ctgggctgcc acggtccaag aggttgtaac cgcaatccgc 780
aacgctggtg ctacgtcgca attcatctct ttgcctggaa atgattggca atctgctggg 840
gctttcatat ccgatggcag tgcagccgcc ctgtctcaag tcacgaaccc ggatgggtca 900
acaacgaatc tgatttttga cgtgcacaaa tacttggact cagacaactc cggtactcac 960
gccgaatgta ctacaaataa cattgacggc gccttttctc cgcttgccac ttggctccga 1020
cagaacaatc gccaggctat cctgacagaa accggtggtg gcaacgttca gtcctgcata 1080
caagacatgt gccagcaaat ccaatatctc aaccagaact cagatgtcta tcttggctat 1140
gttggttggg gtgccggatc atttgatagc acgtatgtcc tgacggaaac accgactagc 1200
agtggtaact catggacgga cacatccttg gtcagctcgt gtctcgcaag aaag 1254
<210>48
<211>418
<212>PRT
<213>里氏木霉
<400>48
Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr
1 5 10 15
Gly Gly Ala Val Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr
35 40 45
Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr
50 55 60
Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
65 70 75 80
Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala
85 90 95
Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
100 105 110
Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser
115 120 125
Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Glu
130 135 140
Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
145 150 155 160
Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr
165 170 175
Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val
180 185 190
Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
195 200 205
Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
210 215 220
Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
225 230 235 240
His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val
245 250 255
Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro
260 265 270
Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala
275 280 285
Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
290 295 300
Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
305 310 315 320
Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala
325 330 335
Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
340 345 350
Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln
355 360 365
Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly
370 375 380
Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Ser
385 390 395 400
Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala
405 410 415
Arg Lys
<210>49
<211>702
<212>DNA
<213>里氏木霉
<400>49
atgaagttcc ttcaagtcct ccctgccctc ataccggccg ccctggccca aaccagctgt 60
gaccagtggg caaccttcac tggcaacggc tacacagtca gcaacaacct ttggggagca 120
tcagccggct ctggatttgg ctgcgtgacg gcggtatcgc tcagcggcgg ggcctcctgg 180
cacgcagact ggcagtggtc cggcggccag aacaacgtca agtcgtacca gaactctcag 240
attgccattc cccagaagag gaccgtcaac agcatcagca gcatgcccac cactgccagc 300
tggagctaca gcgggagcaa catccgcgct aatgttgcgt atgacttgtt caccgcagcc 360
aacccgaatc atgtcacgta ctcgggagac tacgaactca tgatctggct tggcaaatac 420
ggcgatattg ggccgattgg gtcctcacag ggaacagtca acgtcggtgg ccagagctgg 480
acgctctact atggctacaa cggagccatg caagtctatt cctttgtggc ccagaccaac 540
actaccaact acagcggaga tgtcaagaac ttcttcaatt atctccgaga caataaagga 600
tacaacgctg caggccaata tgttcttagc taccaatttg gtaccgagcc cttcacgggc 660
agtggaactc tgaacgtcgc atcctggacc gcatctatca ac 702
<210>50
<211>234
<212>PRT
<213>里氏木霉
<400>50
Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala
1 5 10 15
Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr
20 25 30
Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys
35 40 45
Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp
50 55 60
Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln
65 70 75 80
Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro
85 90 95
Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val
100 105 110
Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser
115 120 125
Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly
130 135 140
Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp
145 150 155 160
Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val
165 170 175
Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe
180 185 190
Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val
195 200 205
Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu
210 215 220
Asn Val Ala Ser Trp Thr Ala Ser Ile Asn
225 230
<210>51
<211>726
<212>DNA
<213>里氏木霉
<400>51
atgaaggcaa ctctggttct cggctccctc attgtaggcg ccgtttccgc gtacaaggcc 60
accaccacgc gctactacga tgggcaggag ggtgcttgcg gatgcggctc gagctccggc 120
gcattcccgt ggcagctcgg catcggcaac ggagtctaca cggctgccgg ctcccaggct 180
ctcttcgaca cggccggagc ttcatggtgc ggcgccggct gcggtaaatg ctaccagctc 240
acctcgacgg gccaggcgcc ctgctccagc tgcggcacgg gcggtgctgc tggccagagc 300
atcatcgtca tggtgaccaa cctgtgcccg aacaatggga acgcgcagtg gtgcccggtg 360
gtcggcggca ccaaccaata cggctacagc taccatttcg acatcatggc gcagaacgag 420
atctttggag acaatgtcgt cgtcgacttt gagcccattg cttgccccgg gcaggctgcc 480
tctgactggg ggacgtgcct ctgcgtggga cagcaagaga cggatcccac gcccgtcctc 540
ggcaacgaca cgggctcaac tcctcccggg agctcgccgc cagcgacatc gtcgagtccg 600
ccgtctggcg gcggccagca gacgctctat ggccagtgtg gaggtgccgg ctggacggga 660
cctacgacgt gccaggcccc agggacctgc aaggttcaga accagtggta ctcccagtgt 720
cttcct 726
<210>52
<211>242
<212>PRT
<213>里氏木霉
<400>52
Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser
1 5 10 15
Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala
20 25 30
Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile
35 40 45
Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr
50 55 60
Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu
65 70 75 80
Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala
85 90 95
Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn
100 105 110
Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly
115 120 125
Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp
130 135 140
Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala
145 150 155 160
Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro
165 170 175
Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser
180 185 190
Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr
195 200 205
Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys
210 215 220
Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys
225 230 235 240
Leu Pro
<210>53
<211>1371
<212>DNA
<213>嗜热毁丝霉(Mycel iophthora thermophila)
<400>53
atgggtcgcg gcgctgcttt cctaggcctc gcctcgctcc tcgtgggcgc ggccaaggcc 60
cagacgcccg gcgagggcga ggaggtgcac ccgcagatca cgacgtaccg ctgcaccaag 120
gcggacgggt gcgaggagaa gaccaactac atcgtgctgg acgccctatc gcacccggtc 180
caccaggtcg acaacccgta caactgcggc gactggggcc agaagcccaa cgagacggcc 240
tgcccggacc tcgagtcgtg cgccaggaac tgcatcatgg acccggtctc ggactacggc 300
cggcacggtg tctcgaccga cggcacctcg ctgcgcctca agcagctagt cggcggcaac 360
gtcgtcagcc cgcgcgtcta cctgctcgac gagaccaagg agcgctacga gatgctcaag 420
ctgaccggca acgagttcac ctttgacgtc gacgccacca agctgccctg cggcatgaac 480
agcgccctct acctctccga gatggacgcc accggcgccc ggagcgagct caacccgggc 540
ggcgccacct ttggcaccgg ctactgcgac gcccagtgct acgtcacccc cttcatcaac 600
ggcctcggca acatcgaggg caagggcgcg tgctgcaacg agatggatat ctgggaggcc 660
aacgcgcggg cgcagcacat cgcgccgcac ccgtgcagca aggcggggcc gtacctgtgc 720
gagggcgccg agtgcgagtt cgacggcgtg tgcgacaaga acggctgcgc ctggaacccg 780
taccgggtca acgtgacgga ctactacggc gagggcgccg agttcagggt ggacacgacc 840
cggcccttct cggtcgtcac gcagttccgc gccggcggcg acgcgggggg cggcaagctc 900
gagagcatct accggctctt cgtccaggac ggcagggtga ttgagtcgta cgtcgtcgac 960
aagcccggcc tgcccccgac ggaccgcatg acggacgagt tctgcgccgc caccggcgcc 1020
gcccgcttca cggagctcgg cgccatggag gccatgggcg acgccctgac gcgcggcatg 1080
gtcctcgccc tcagcatctg gtggagcgag ggcgacaaca tgaactggct cgactcgggc 1140
gaggccggcc cctgcgaccc ggacgagggc aacccgtcca acatcatccg cgtccagccc 1200
gacccggagg tcgtcttcag caacctgcgc tggggcgaga tcggctcaac ctacgagtcc 1260
gccgtcgacg ggcccgtcgg caagggcaag ggcaagggca agggcaaggc tcccgccggc 1320
gacggcaacg ggaaggagaa gagcaatggc aagcgcttca ggaggttctg a 1371
<210>54
<211>456
<212>PRT
<213>嗜热毁丝霉
<400>54
Met Gly Arg Gly Ala Ala Phe Leu Gly Leu Ala Ser Leu Leu Val Gly
1 5 10 15
Ala Ala Lys Ala Gln Thr Pro Gly Glu Gly Glu Glu Val His Pro Gln
20 25 30
Ile Thr Thr Tyr Arg Cys Thr Lys Ala Asp Gly Cys Glu Glu Lys Thr
35 40 45
Asn Tyr Ile Val Leu Asp Ala Leu Ser His Pro Val His Gln Val Asp
50 55 60
Asn Pro Tyr Asn Cys Gly Asp Trp Gly Gln Lys Pro Asn Glu Thr Ala
65 70 75 80
Cys Pro Asp Leu Glu Ser Cys Ala Arg Asn Cys Ile Met Asp Pro Val
85 90 95
Ser Asp Tyr Gly Arg His Gly Val Ser Thr Asp Gly Thr Ser Leu Arg
100 105 110
Leu Lys Gln Leu Val Gly Gly Asn Val Val Ser Pro Arg Val Tyr Leu
115 120 125
Leu Asp Glu Thr Lys Glu Arg Tyr Glu Met Leu Lys Leu Thr Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Ala Thr Lys Leu Pro Cys Gly Met Asn
145 150 155 160
Ser Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr Gly Ala Arg Ser Glu
165 170 175
Leu Asn Pro Gly Gly Ala Thr Phe Gly Thr Gly Tyr Cys Asp Ala Gln
180 185 190
Cys Tyr Val Thr Pro Phe Ile Asn Gly Leu Gly Asn Ile Glu Gly Lys
195 200 205
Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Arg Ala
210 215 220
Gln His Ile Ala Pro His Pro Cys Ser Lys Ala Gly Pro Tyr Leu Cys
225 230 235 240
Glu Gly Ala Glu Cys Glu Phe Asp Gly Val Cys Asp Lys Asn Gly Cys
245 250 255
Ala Trp Asn Pro Tyr Arg Val Asn Val Thr Asp Tyr Tyr Gly Glu Gly
260 265 270
Ala Glu Phe Arg Val Asp Thr Thr Arg Pro Phe Ser Val Val Thr Gln
275 280 285
Phe Arg Ala Gly Gly Asp Ala Gly Gly Gly Lys Leu Glu Ser Ile Tyr
290 295 300
Arg Leu Phe Val Gln Asp Gly Arg Val Ile Glu Ser Tyr Val Val Asp
305 310 315 320
Lys Pro Gly Leu Pro Pro Thr Asp Arg Met Thr Asp Glu Phe Cys Ala
325 330 335
Ala Thr Gly Ala Ala Arg Phe Thr Glu Leu Gly Ala Met Glu Ala Met
340 345 350
Gly Asp Ala Leu Thr Arg Gly Met Val Leu Ala Leu Ser Ile Trp Trp
355 360 365
Ser Glu Gly Asp Asn Met Asn Trp Leu Asp Ser Gly Glu Ala Gly Pro
370 375 380
Cys Asp Pro Asp Glu Gly Asn Pro Ser Asn Ile Ile Arg Val Gln Pro
385 390 395 400
Asp Pro Glu Val Val Phe Ser Asn Leu Arg Trp Gly Glu Ile Gly Ser
405 410 415
Thr Tyr Glu Ser Ala Val Asp Gly Pro Val Gly Lys Gly Lys Gly Lys
420 425 430
Gly Lys Gly Lys Ala Pro Ala Gly Asp Gly Asn Gly Lys Glu Lys Ser
435 440 445
Asn Gly Lys Arg Phe Arg Arg Phe
450 455
<210>55
<211>744
<212>DNA
<213>Chrysosoporium lucknowense
<400>55
atgcagccgt ttctgctctt gttcctctcg tcggtcacgg cggcgagccc cctgacggcg 60
ctcgacaagc ggcagcaggc gacgttgtgc gagcagtacg gctactggtc gggcaacggt 120
tacgaggtca acaacaacaa ctggggcaag gattcggcct cgggcggcca tcagtgcacc 180
tacgtcgaca gcagcagctc cagcggcgtc gcctggcaca cgacctggca gtgggaagga 240
ggccagaacc aggtcaagag cttcgccaac tgcggcctgc aggtgcccaa gggcaggacc 300
atctcgtcca tcagcaacct gcagacctcc atctcgtggt cctacagcaa caccaacatc 360
cgcgccaacg tggcctacga cctcttcacc gcggcagacc cgaaccacgc gaccagcagc 420
ggcgactacg agctcatgat ctggctggcg agattcggcg acgtctaccc catcggctcg 480
tcccagggcc acgtcaacgt ggccggccag gactgggagc tgtggacggg cttcaacggc 540
aacatgcggg tctacagctt cgtagcgccc agcccccgca acagcttcag cgccaacgtc 600
aaggacttct tcaactatct ccagtccaac cagggcttcc cggccagcag ccaatacctt 660
ctcatcttcc aggcgggcac cgagcccttc accggcggcg agaccaccct taccgtcaac 720
aactactctg caagggttgc ttaa 744
<210>56
<211>247
<212>PRT
<213>Chrysosoporium lucknowense
<400>56
Met Gln Pro Phe Leu Leu Leu Phe Leu Ser Ser Val Thr Ala Ala Ser
1 5 10 15
Pro Leu Thr Ala Leu Asp Lys Arg Gln Gln Ala Thr Leu Cys Glu Gln
20 25 30
Tyr Gly Tyr Trp Ser Gly Asn Gly Tyr Glu Val Asn Asn Asn Asn Trp
35 40 45
Gly Lys Asp Ser Ala Ser Gly Gly His Gln Cys Thr Tyr Val Asp Ser
50 55 60
Ser Ser Ser Ser Gly Val Ala Trp His Thr Thr Trp Gln Trp Glu Gly
65 70 75 80
Gly Gln Asn Gln Val Lys Ser Phe Ala Asn Cys Gly Leu Gln Val Pro
85 90 95
Lys Gly Arg Thr Ile Ser Ser Ile Ser Asn Leu Gln Thr Ser Ile Ser
100 105 110
Trp Ser Tyr Ser Asn Thr Asn Ile Arg Ala Asn Val Ala Tyr Asp Leu
115 120 125
Phe Thr Ala Ala Asp Pro Asn His Ala Thr Ser Ser Gly Asp Tyr Glu
130 135 140
Leu Met Ile Trp Leu Ala Arg Phe Gly Asp Val Tyr Pro Ile Gly Ser
145 150 155 160
Ser Gln Gly His Val Asn Val Ala Gly Gln Asp Trp Glu Leu Trp Thr
165 170 175
Gly Phe Asn Gly Asn Met Arg Val Tyr Ser Phe Val Ala Pro Ser Pro
180 185 190
Arg Asn Ser Phe Ser Ala Asn Val Lys Asp Phe Phe Asn Tyr Leu Gln
195 200 205
Ser Asn Gln Gly Phe Pro Ala Ser Ser Gln Tyr Leu Leu Ile Phe Gln
210 215 220
Ala Gly Thr Glu Pro Phe Thr Gly Gly Glu Thr Thr Leu Thr Val Asn
225 230 235 240
Asn Tyr Ser Ala Arg Val Ala
245
<210>57
<211>678
<212>DNA
<213>Chrysosoporium lucknowense
<400>57
atgcatctct ccgccaccac cgggttcctc gccctcccgg ccctggccct ggcccagctc 60
tcgggcagcg gccagacgac ccggtactgg gactgctgca agccgagctg cgcctggccc 120
ggcaagggcc cctcgtctcc ggtgcaggcc tgcgacaaga acgacaaccc gctcaacgac 180
ggcggctcca cccggtccgg ctgcgacgcg ggcggcagcg cctacatgtg ctcctcccag 240
agcccctggg ccgtcagcga cgagctgtcg tacggctggg cggccgtcaa gctcgccggc 300
agctccgagt cgcagtggtg ctgcgcctgc tacgagctga ccttcaccag cgggccggtc 360
gcgggcaaga agatgattgt gcaggcgacc aacaccggtg gcgacctggg cgacaaccac 420
tttgacctgg ccatccccgg tggcggtgtc ggtattttca acgcctgcac cgaccagtac 480
ggcgctcccc cgaacggctg gggcgaccgc tacggcggca tccattccaa ggaagagtgc 540
gaatccttcc cggaggccct caagcccggc tgcaactggc gcttcgactg gttccaaaac 600
gccgacaacc cgtcggtcac cttccaggag gtggcctgcc cgtcggagct cacgtccaag 660
agcggctgct cccgttaa 678
<210>58
<211>225
<212>PRT
<213>Chrysosoporium lucknowense
<400>58
Met His Leu Ser Ala Thr Thr Gly Phe Leu Ala Leu Pro Ala Leu Ala
1 5 10 15
Leu Ala Gln Leu Ser Gly Ser Gly Gln Thr Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Ala Trp Pro Gly Lys Gly Pro Ser Ser Pro Val
35 40 45
Gln Ala Cys Asp Lys Asn Asp Asn Pro Leu Asn Asp Gly Gly Ser Thr
50 55 60
Arg Ser Gly Cys Asp Ala Gly Gly Ser Ala Tyr Met Cys Ser Ser Gln
65 70 75 80
Ser Pro Trp Ala Val Ser Asp Glu Leu Ser Tyr Gly Trp Ala Ala Val
85 90 95
Lys Leu Ala Gly Ser Ser Glu Ser Gln Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Ile Val Gln
115 120 125
Ala Thr Asn Thr Gly Gly Asp Leu Gly Asp Asn His Phe Asp Leu Ala
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asn Ala Cys Thr Asp Gln Tyr
145 150 155 160
Gly Ala Pro Pro Asn Gly Trp Gly Asp Arg Tyr Gly Gly Ile His Ser
165 170 175
Lys Glu Glu Cys Glu Ser Phe Pro Glu Ala Leu Lys Pro Gly Cys Asn
180 185 190
Trp Arg Phe Asp Trp Phe Gln Asn Ala Asp Asn Pro Ser Val Thr Phe
195 200 205
Gln Glu Val Ala Cys Pro Ser Glu Leu Thr Ser Lys Ser Gly Cys Ser
210 215 220
Arg
225
<210>59
<211>1542
<212>DNA
<213>里氏木霉
<400>59
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60
tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120
acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180
acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240
aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300
gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360
gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420
ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480
ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540
ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600
aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660
ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720
gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780
ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840
aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900
accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960
tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020
aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080
tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140
atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200
aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260
cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320
ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380
ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440
tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500
acaacttgcc aggtcctgaa cccttactac tctcagtgcc tg 1542
<210>60
<211>514
<212>PRT
<213>里氏木霉
<400>60
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
450 455 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465 470 475 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
485 490 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
500 505 510
Cys Leu
<210>61
<211>1413
<212>DNA
<213>里氏木霉
<400>61
atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct 60
ctagaggagc ggcaagcttg ctcaagcgtc tggggccaat gtggtggcca gaattggtcg 120
ggtccgactt gctgtgcttc cggaagcaca tgcgtctact ccaacgacta ttactcccag 180
tgtcttcccg gcgctgcaag ctcaagctcg tccacgcgcg ccgcgtcgac gacttctcga 240
gtatccccca caacatcccg gtcgagctcc gcgacgcctc cacctggttc tactactacc 300
agagtacctc cagtcggatc gggaaccgct acgtattcag gcaacccttt tgttggggtc 360
actccttggg ccaatgcata ttacgcctct gaagttagca gcctcgctat tcctagcttg 420
actggagcca tggccactgc tgcagcagct gtcgcaaagg ttccctcttt tatgtggcta 480
gatactcttg acaagacccc tctcatggag caaaccttgg ccgacatccg caccgccaac 540
aagaatggcg gtaactatgc cggacagttt gtggtgtatg acttgccgga tcgcgattgc 600
gctgcccttg cctcgaatgg cgaatactct attgccgatg gtggcgtcgc caaatataag 660
aactatatcg acaccattcg tcaaattgtc gtggaatatt ccgatatccg gaccctcctg 720
gttattgagc ctgactctct tgccaacctg gtgaccaacc tcggtactcc aaagtgtgcc 780
aatgctcagt cagcctacct tgagtgcatc aactacgccg tcacacagct gaaccttcca 840
aatgttgcga tgtatttgga cgctggccat gcaggatggc ttggctggcc ggcaaaccaa 900
gacccggccg ctcagctatt tgcaaatgtt tacaagaatg catcgtctcc gagagctctt 960
cgcggattgg caaccaatgt cgccaactac aacgggtgga acattaccag ccccccatcg 1020
tacacgcaag gcaacgctgt ctacaacgag aagctgtaca tccacgctat tggacctctt 1080
cttgccaatc acggctggtc caacgccttc ttcatcactg atcaaggtcg atcgggaaag 1140
cagcctaccg gacagcaaca gtggggagac tggtgcaatg tgatcggcac cggatttggt 1200
attcgcccat ccgcaaacac tggggactcg ttgctggatt cgtttgtctg ggtcaagcca 1260
ggcggcgagt gtgacggcac cagcgacagc agtgcgccac gatttgactc ccactgtgcg 1320
ctcccagatg ccttgcaacc ggcgcctcaa gctggtgctt ggttccaagc ctactttgtg 1380
cagcttctca caaacgcaaa cccatcgttc ctg 1413
<210>62
<211>471
<212>PRT
<213>里氏木霉
<400>62
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1 5 10 15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
50 55 60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65 70 75 80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
85 90 95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
100 105 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
115 120 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
130 135 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145 150 155 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
165 170 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
180 185 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
195 200 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
210 215 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225 230 235 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
245 250 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
260 265 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
275 280 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
290 295 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305 310 315 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
325 330 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
340 345 350
Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn
355 360 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
370 375 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385 390 395 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
405 410 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
420 425 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
435 440 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
450 455 460
Asn Ala Asn Pro Ser Phe Leu
465 470
<210>63
<211>1648
<212>DNA
<213>Chrysosoporium lucknowense
<220>
<221>misc_feature
<222>(1162)..(1162)
<223>N=A、C、G或T
<400>63
atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tcagaacgcc 60
tgcactctga ccgctgagaa ccacccctcg ctgacgtggt ccaagtgcac gtctggcggc 120
agctgcacca gcgtccaggg ttccatcacc atcgacgcca actggcggtg gactcaccgg 180
accgatagcg ccaccaactg ctacgagggc aacaagtggg atacttcgta ctgcagcgat 240
ggtccttctt gcgcctccaa gtgctgcatc gacggcgctg actactcgag cacctatggc 300
atcaccacga gcggtaactc cctgaacctc aagttcgtca ccaagggcca gtactcgacc 360
aacatcggct cgcgtaccta cctgatggag agcgacacca agtaccagag taagttcctc 420
tcgcacccgg ccgccgggag atgatggcgc ccagcccgct gacgcgaatg acacagtgtt 480
ccagctcctc ggcaacgagt tcaccttcga tgtcgacgtc tccaacctcg gctgcggcct 540
caatggcgcc ctctacttcg tgtccatgga tgccgatggt ggcatgtcca agtactcggg 600
caacaaggca ggtgccaagt acggtaccgg ctactgtgat tctcagtgcc cccgcgacct 660
caagttcatc aacggcgagg ccaacgtaga gaactggcag agctcgacca acgatgccaa 720
cgccggcacg ggcaagtacg gcagctgctg ctccgagatg gacgtctggg aggccaacaa 780
catggccgcc gccttcactc cccacccttg caccgtgatc ggccagtcgc gctgcgaggg 840
cgactcgtgc ggcggtacct acagcaccga ccgctatgcc ggcatctgcg accccgacgg 900
atgcgacttc aactcgtacc gccagggcaa caagaccttc tacggcaagg gcatgacggt 960
cgacacgacc aagaagatca cggtcgtcac ccagttcctc aagaactcgg ccggcgagct 1020
ctccgagatc aagcggttct acgtccagaa cggcaaggtc atccccaact ccgagtccac 1080
catcccgggc gtcgagggca actccatcac ccaggactgg tgcgaccgcc agaaggccgc 1140
cttcggcgac gtgaccgact tncaggacaa gggcggcatg gtccagatgg gcaaggccct 1200
cgcggggccc atggtcctcg tcatgtccat ctgggacgac cacgccgtca acatgctctg 1260
gctcgactcc acctggccca tcgacggcgc cggcaagccg ggcgccgagc gcggtgcctg 1320
ccccaccacc tcgggcgtcc ccgctgaggt cgaggccgag gcccccaact ccaacgtcat 1380
cttctccaac atccgcttcg gccccatcgg ctccaccgtc tccggcctgc ccgacggcgg 1440
cagcggcaac cccaacccgc ccgtcagctc gtccaccccg gtcccctcct cgtccaccac 1500
atcctccggt tcctccggcc cgactggcgg cacgggtgtc gctaagcact atgagcaatg 1560
cggaggaatc gggttcactg gccctaccca gtgcgagagc ccctacactt gcaccaagct 1620
gaatgactgg tactcgcagt gcctgtaa 1648
<210>64
<211>526
<212>PRT
<213>Chrysosoporium lucknowense
<220>
<221>MISC_FEATURE
<222>(365)..(365)
<223>X=任意氨基酸
<400>64
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala
1 5 10 15
Ala Gln Asn Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
20 25 30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Gln Gly Ser
35 40 45
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Arg Thr Asp Ser Ala
50 55 60
Thr Asn Cys Tyr Glu Gly Asn Lys Trp Asp Thr Ser Tyr Cys Ser Asp
65 70 75 80
Gly Pro Ser Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Asp Tyr Ser
85 90 95
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ser Leu Asn Leu Lys Phe
100 105 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Asn Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
165 170 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu
195 200 205
Asn Trp Gln Ser Ser Thr Asn Asp Ala Asn Ala Gly Thr Gly Lys Tyr
210 215 220
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala
225 230 235 240
Ala Ala Phe Thr Pro His Pro Cys Trp Val Ile Gly Gln Ser Arg Cys
245 250 255
Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
260 265 270
Ile Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn
275 280 285
Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile
290 295 300
Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu
325 330 335
Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys
340 345 350
Asp Arg Gln Lys Ala Ala Phe Gly Asp Val Thr Asp Xaa Gln Asp Lys
355 360 365
Gly Gly Met Val Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu
370 375 380
Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Trp Pro Ile Asp Gly Ala Gly Lys Pro Gly Ala Glu Arg Gly
405 410 415
Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala
420 425 430
Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
Ser Thr Val Ser Gly Leu Pro Asp Gly Gly Ser Gly Asn Pro Asn Pro
450 455 460
Pro Val Ser Ser Ser Thr Pro Val Pro Ser Ser Ser Thr Thr Ser Ser
465 470 475 480
Gly Ser Ser Gly Pro Thr Gly Gly Thr Gly Val Ala Lys His Tyr Glu
485 490 495
Gln Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Ser Pro
500 505 510
Tyr Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210>65
<211>1353
<212>DNA
<213>嗜热毁丝霉
<400>65
atgaagcagt acctccagta cctcgcggcg accctgcccc tggtgggcct ggccacggcc 60
cagcaggcgg gtaacctgca gaccgagact caccccaggc tcacttggtc caagtgcacg 120
gccccgggat cctgccaaca ggtcaacggc gaggtcgtca tcgactccaa ctggcgctgg 180
gtgcacgacg agaacgcgca gaactgctac gacggcaacc agtggaccaa cgcttgcagc 240
tctgccaccg actgcgccga gaattgcgcg ctcgagggtg ccgactacca gggcacctat 300
ggcgcctcga ccagcggcaa tgccctgacg ctcaccttcg tcactaagca cgagtacggc 360
accaacattg gctcgcgcct ctacctcatg aacggcgcga acaagtacca gatgttcacc 420
ctcaagggca acgagctggc cttcgacgtc gacctctcgg ccgtcgagtg cggcctcaac 480
agcgccctct acttcgtggc catggaggag gatggcggtg tgtcgagcta cccgaccaac 540
acggccggtg ctaagttcgg cactgggtac tgcgacgccc aatgcgcacg cgacctcaag 600
ttcgtcggcg gcaagggcaa catcgagggc tggaagccgt ccaccaacga tgccaatgcc 660
ggtgtcggtc cttatggcgg gtgctgcgct gagatcgacg tctgggagtc gaacaagtat 720
gctttcgctt tcaccccgca cggttgcgag aaccctaaat accacgtctg cgagaccacc 780
aactgcggtg gcacctactc cgaggaccgc ttcgctggtg actgcgatgc caacggctgc 840
gactacaacc cctaccgcat gggcaaccag gacttctacg gtcccggctt gacggtcgat 900
accagcaaga agttcaccgt cgtcagccag ttcgaggaga acaagctcac ccagttcttc 960
gtccaggacg gcaagaagat tgagatcccc ggccccaagg tcgagggcat cgatgcggac 1020
agcgccgcta tcacccctga gctgtgcagt gccctgttca aggccttcga tgaccgtgac 1080
cgcttctcgg aggttggcgg cttcgatgcc atcaacacgg ccctcagcac tcccatggtc 1140
ctcgtcatgt ccatctggga tgatcactac gccaatatgc tctggctcga ctcgagctac 1200
ccccctgaga aggctggcca gcctggcggt gaccgtggcc cgtgtcctca ggactctggc 1260
gtcccggccg acgttgaggc tcagtaccct aatgccaagg tcatctggtc caacatccgc 1320
ttcggcccca tcggctcgac tgtcaacgtc taa 1353
<210>66
<211>450
<212>PRT
<213>嗜热毁丝霉
<400>66
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
1 5 10 15
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
20 25 30
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
35 40 45
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
50 55 60
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
65 70 75 80
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
85 90 95
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
100 105 110
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
115 120 125
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
130 135 140
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
145 150 155 160
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
165 170 175
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
195 200 205
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
210 215 220
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
225 230 235 240
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
245 250 255
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
260 265 270
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
275 280 285
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
290 295 300
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
305 310 315 320
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
325 330 335
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
340 345 350
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
355 360 365
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
370 375 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385 390 395 400
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
405 410 415
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
420 425 430
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
435 440 445
Asn Val
450
<210>67
<211>1446
<212>DNA
<213>土生梭孢壳
<400>67
atggctcaga agctccttct cgccgccgcc cttgcggcca gcgccctcgc tgctcccgtc 60
gtcgaggagc gccagaactg cggttccgtc tggagccaat gcggcggcat tggctggtcc 120
ggcgcgacct gctgcgcttc gggcaatacc tgcgttgagc tgaacccgta ctactcgcag 180
tgcctgccca acagccaggt gactacctcg accagcaaga ccacctccac caccaccagg 240
agcagcacca ccagccacag cagcggtccc accagcacga gcaccaccac caccagcagt 300
cccgtggtca ctaccccgcc gagtacctcc atccccggcg gtgcctcgtc aacggccagc 360
tggtccggca acccgttctc gggcgtgcag atgtgggcca acgactacta cgcctccgag 420
gtctcgtcgc tggccatccc cagcatgacg ggcgccatgg ccaccaaggc ggccgaggtg 480
gccaaggtgc ccagcttcca gtggcttgac cgcaacgtca ccatcgacac gctgttcgcc 540
cacacgctgt cgcagatccg cgcggccaac cagaaaggcg ccaacccgcc ctacgcgggc 600
atcttcgtgg tctacgacct tccggaccgc gactgcgccg ccgccgcgtc caacggcgag 660
ttctccatcg cgaacaacgg ggcggccaac tacaagacgt acatcgacgc gatccggagc 720
ctcgtcatcc agtactcaga catccgcatc atcttcgtca tcgagcccga ctcgctggcc 780
aacatggtga ccaacctgaa cgtggccaag tgcgccaacg ccgagtcgac ctacaaggag 840
ttgaccgtct acgcgctgca gcagctgaac ctgcccaacg tggccatgta cctggacgcc 900
ggccacgccg gctggctcgg ctggcccgcc aacatccagc cggccgccaa cctcttcgcc 960
gagatctaca cgagcgccgg caagccggcc gccgtgcgcg gcctcgccac caacgtggcc 1020
aactacaacg gctggagcct ggccacgccg ccctcgtaca cccagggcga ccccaactac 1080
gacgagagcc actacgtcca ggccctcgcc ccgctgctca ccgccaacgg cttccccgcc 1140
cacttcatca ccgacaccgg ccgcaacggc aagcagccga ccggacaacg gcaatgggga 1200
gactggtgca acgttatcgg aactggcttc ggcgtgcgcc cgacgacaaa caccggcctc 1260
gacatcgagg acgccttcgt ctgggtcaag cccggcggcg agtgcgacgg cacgagcaac 1320
acgacctctc cccgctacga ctaccactgc ggcctgtcgg acgcgctgca gcctgctccg 1380
gaggccggca cttggttcca ggcctacttc gagcagctcc tgaccaacgc caacccgccc 1440
ttttaa 1446
<210>68
<211>481
<212>PRT
<213>土生梭孢壳
<400>68
Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu
1 5 10 15
Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser
20 25 30
Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly
35 40 45
Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg
65 70 75 80
Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr
85 90 95
Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro
100 105 110
Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly
115 120 125
Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu
130 135 140
Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val
145 150 155 160
Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp
165 170 175
Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys
180 185 190
Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro
195 200 205
Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala
210 215 220
Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser
225 230 235 240
Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro
245 250 255
Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala
260 265 270
Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln
275 280 285
Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly
290 295 300
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala
305 310 315 320
Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala
325 330 335
Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser
340 345 350
Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala
355 360 365
Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr
370 375 380
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly
385 390 395 400
Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr
405 410 415
Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly
420 425 430
Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr
435 440 445
His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr
450 455 460
Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro
465 470 475 480
Phe
<210>69
<211>2586
<212>DNA
<213>米曲霉
<400>69
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480
ggtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720
ggagtcggtg ctgtcatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 840
gattggaccg ctcatcacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580
cagtaa 2586
<210>70
<211>861
<212>PRT
<213>米曲霉
<400>70
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>71
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>71
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210>72
<211>863
<212>PRT
<213>烟曲霉
<400>72
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asp Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210>73
<211>2800
<212>DNA
<213>巴西青霉(Penicillium brasilianum)
<400>73
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220
caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat 2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800
<210>74
<211>878
<212>PRT
<213>巴西青霉
<400>74
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1 5 10 15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
20 25 30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
35 40 45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
50 55 60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65 70 75 80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
85 90 95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
100 105 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
115 120 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
130 135 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145 150 155 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
165 170 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
180 185 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
195 200 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
210 215 220
Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp
225 230 235 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
245 250 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
260 265 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
275 280 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
290 295 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305 310 315 320
Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
325 330 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
340 345 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
355 360 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
370 375 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385 390 395 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
405 410 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
420 425 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
435 440 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
450 455 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465 470 475 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
485 490 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
500 505 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
515 520 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
530 535 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545 550 555 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
565 570 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
580 585 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
595 600 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
610 615 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625 630 635 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
645 650 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
660 665 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
675 680 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
690 695 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705 710 715 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
725 730 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
740 745 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
755 760 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
770 775 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785 790 795 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
805 810 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
820 825 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
835 840 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
850 855 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865 870 875
<210>75
<211>2583
<212>DNA
<213>黑曲霉
<400>75
atgaggttca ctttgatcga ggcggtggct ctgactgccg tctcgctggc cagcgctgat 60
gaattggcct actccccacc gtattaccca tccccttggg ccaatggcca gggcgactgg 120
gcgcaggcat accagcgcgc tgttgatatt gtctcgcaaa tgacattgga tgagaaggtc 180
aatctgacca caggaactgg atgggaattg gaactatgtg ttggtcagac tggcggtgtt 240
ccccgattgg gagttccggg aatgtgttta caggatagcc ctctgggcgt tcgcgactcc 300
gactacaact ctgctttccc tgccggcatg aacgtggctg caacctggga caagaatctg 360
gcataccttc gcggcaaggc tatgggtcag gaatttagtg acaagggtgc cgatatccaa 420
ttgggtccag ctgccggccc tctcggtaga agtcccgacg gtggtcgtaa ctgggagggc 480
ttctccccag accctgccct aagtggtgtg ctctttgccg agaccatcaa gggtatccaa 540
gatgctggtg tggttgcgac ggctaagcac tacattgctt acgagcaaga gcatttccgt 600
caggcgcctg aagcccaagg ttttggattt aatatttccg agagtggaag tgcgaacctc 660
gatgataaga ctatgcacga gctgtacctc tggcccttcg cggatgccat ccgtgcaggt 720
gctggcgctg tgatgtgctc ctacaaccag atcaacaaca gttatggctg ccagaacagc 780
tacactctga acaagctgct caaggccgag ctgggcttcc agggctttgt catgagtgat 840
tgggctgctc accatgctgg tgtgagtggt gctttggcag gattggatat gtctatgcca 900
ggagacgtcg actacgacag tggtacgtct tactggggta caaacttgac cattagcgtg 960
ctcaacggaa cggtgcccca atggcgtgtt gatgacatgg ctgtccgcat catggccgcc 1020
tactacaagg tcggccgtga ccgtctgtgg actcctccca acttcagctc atggaccaga 1080
gatgaatacg gctacaagta ctactacgtg tcggagggac cgtacgagaa ggtcaaccag 1140
tacgtgaatg tgcaacgcaa ccacagcgaa ctgattcgcc gcattggagc ggacagcacg 1200
gtgctcctca agaacgacgg cgctctgcct ttgactggta aggagcgcct ggtcgcgctt 1260
atcggagaag atgcgggctc caacccttat ggtgccaacg gctgcagtga ccgtggatgc 1320
gacaatggaa cattggcgat gggctgggga agtggtactg ccaacttccc atacctggtg 1380
acccccgagc aggccatctc aaacgaggtg cttaagcaca agaatggtgt attcaccgcc 1440
accgataact gggctatcga tcagattgag gcgcttgcta agaccgccag tgtctctctt 1500
gtctttgtca acgccgactc tggtgagggt tacatcaatg tggacggaaa cctgggtgac 1560
cgcaggaacc tgaccctgtg gaggaacggc gataatgtga tcaaggctgc tgctagcaac 1620
tgcaacaaca caatcgttgt cattcactct gtcggaccag tcttggttaa cgagtggtac 1680
gacaacccca atgttaccgc tatcctctgg ggtggtttgc ccggtcagga gtctggcaac 1740
tctcttgccg acgtcctcta tggccgtgtc aaccccggtg ccaagtcgcc ctttacctgg 1800
ggcaagactc gtgaggccta ccaagactac ttggtcaccg agcccaacaa cggcaacgga 1860
gcccctcagg aagactttgt cgagggcgtc ttcattgact accgtggatt tgacaagcgc 1920
aacgagaccc cgatctacga gttcggctat ggtctgagct acaccacttt caactactcg 1980
aaccttgagg tgcaggtgct gagcgcccct gcatacgagc ctgcttcggg tgagaccgag 2040
gcagcgccaa ccttcggaga ggttggaaat gcgtcggatt acctctaccc cagcggattg 2100
cagagaatta ccaagttcat ctacccctgg ctcaacggta ccgatctcga ggcatcttcc 2160
ggggatgcta gctacgggca ggactcctcc gactatcttc ccgagggagc caccgatggc 2220
tctgcgcaac cgatcctgcc tgccggtggc ggtcctggcg gcaaccctcg cctgtacgac 2280
gagctcatcc gcgtgtcagt gaccatcaag aacaccggca aggttgctgg tgatgaagtt 2340
ccccaactgt atgtttccct tggcggtccc aatgagccca agatcgtgct gcgtcaattc 2400
gagcgcatca cgctgcagcc gtcggaggag acgaagtgga gcacgactct gacgcgccgt 2460
gaccttgcaa actggaatgt tgagaagcag gactgggaga ttacgtcgta tcccaagatg 2520
gtgtttgtcg gaagctcctc gcggaagctg ccgctccggg cgtctctgcc tactgttcac 2580
taa 2583
<210>76
<211>860
<212>PRT
<213>黑曲霉
<400>76
Met Arg Phe Thr Leu Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu
1 5 10 15
Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Asp Trp Ala Gln Ala Tyr Gln Arg Ala Val
35 40 45
Asp Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Gly Val Pro Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
85 90 95
Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Met Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Lys Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Phe
195 200 205
Gly Phe Asn Ile Ser Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr
210 215 220
Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly
225 230 235 240
Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val
275 280 285
Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp
290 295 300
Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Tyr Lys Tyr Tyr
355 360 365
Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Tyr Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly
435 440 445
Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Ser Asn Glu Val Leu Lys His Lys Asn Gly Val Phe Thr Ala
465 470 475 480
Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile
500 505 510
Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg
515 520 525
Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr
530 535 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr
545 550 555 560
Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln
595 600 605
Asp Tyr Leu Val Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu
610 615 620
Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Asn Leu Glu Val Gln Val Leu Ser Ala Pro Ala Tyr
660 665 670
Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val
675 680 685
Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Ser Gly Leu Gln Arg Ile Thr
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Gly Thr Asp Leu Glu Ala Ser Ser
705 710 715 720
Gly Asp Ala Ser Tyr Gly Gln Asp Ser Ser Asp Tyr Leu Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Pro
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe
785 790 795 800
Glu Arg Ile Thr Leu Gln Pro Ser Glu Glu Thr Lys Trp Ser Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Lys Gln Asp Trp
820 825 830
Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Val Gly Ser Ser Ser Arg
835 840 845
Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His
850 855 860
<210>77
<211>2583
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>77
atgaagctca gttggcttga ggcggctgcc ttgacggctg cttcagtcgt cagcgctgat 60
gaactggcgt tctctcctcc tttctacccc tctccgtggg ccaatggcca gggagagtgg 120
gcggaagcct accagcgtgc agtggccatt gtatcccaga tgactctgga tgagaaggtc 180
aacctgacca ccggaactgg atgggagctg gagaagtgcg tcggtcagac tggtggtgtc 240
ccaagactga acatcggtgg catgtgtctt caggacagtc ccttgggaat tcgtgatagt 300
gactacaatt cggctttccc tgctggtgtc aacgttgctg cgacatggga caagaacctt 360
gcttatctac gtggtcaggc tatgggtcaa gagttcagtg acaaaggaat tgatgttcaa 420
ttgggaccgg ccgcgggtcc cctcggcagg agccctgatg gaggtcgcaa ctgggaaggt 480
ttctctccag acccggctct tactggtgtg ctctttgcgg agacgattaa gggtattcaa 540
gacgctggtg tcgtggcgac agccaagcat tacattctca atgagcaaga gcatttccgc 600
caggtcgcag aggctgcggg ctacggattc aatatctccg acacgatcag ctctaacgtt 660
gatgacaaga ccattcatga aatgtacctc tggcccttcg cggatgccgt tcgcgccggc 720
gttggcgcca tcatgtgttc ctacaaccag atcaacaaca gctacggttg ccagaacagt 780
tacactctga acaagcttct gaaggccgag ctcggcttcc agggctttgt gatgtctgac 840
tggggtgctc accacagtgg tgttggctct gctttggccg gcttggatat gtcaatgcct 900
ggcgatatca ccttcgattc tgccactagt ttctggggta ccaacctgac cattgctgtg 960
ctcaacggta ccgtcccgca gtggcgcgtt gacgacatgg ctgtccgtat catggctgcc 1020
tactacaagg ttggccgcga ccgcctgtac cagccgccta acttcagctc ctggactcgc 1080
gatgaatacg gcttcaagta tttctacccc caggaagggc cctatgagaa ggtcaatcac 1140
tttgtcaatg tgcagcgcaa ccacagcgag gttattcgca agttgggagc agacagtact 1200
gttctactga agaacaacaa tgccctgccg ctgaccggaa aggagcgcaa agttgcgatc 1260
ctgggtgaag atgctggatc caactcgtac ggtgccaatg gctgctctga ccgtggctgt 1320
gacaacggta ctcttgctat ggcttggggt agcggcactg ccgaattccc atatctcgtg 1380
acccctgagc aggctattca agccgaggtg ctcaagcata agggcagcgt ctacgccatc 1440
acggacaact gggcgctgag ccaggtggag accctcgcta aacaagccag tgtctctctt 1500
gtatttgtca actcggacgc gggagagggc tatatctccg tggacggaaa cgagggcgac 1560
cgcaacaacc tcaccctctg gaagaacggc gacaacctca tcaaggctgc tgcaaacaac 1620
tgcaacaaca ccatcgttgt catccactcc gttggacctg ttttggttga cgagtggtat 1680
gaccacccca acgttactgc catcctctgg gcgggcttgc ctggccagga gtctggcaac 1740
tccttggctg acgtgctcta cggccgcgtc aacccgggcg ccaaatctcc attcacctgg 1800
ggcaagacga gggaggcgta cggggattac cttgtccgtg agctcaacaa cggcaacgga 1860
gctccccaag atgatttctc ggaaggtgtt ttcattgact accgcggatt cgacaagcgc 1920
aatgagaccc cgatctacga gttcggacat ggtctgagct acaccacttt caactactct 1980
ggccttcaca tccaggttct caacgcttcc tccaacgctc aagtagccac tgagactggc 2040
gccgctccca ccttcggaca agtcggcaat gcctctgact acgtgtaccc tgagggattg 2100
accagaatca gcaagttcat ctatccctgg cttaattcca cagacctgaa ggcctcatct 2160
ggcgacccgt actatggagt cgacaccgcg gagcacgtgc ccgagggtgc tactgatggc 2220
tctccgcagc ccgttctgcc tgccggtggt ggctctggtg gtaacccgcg cctctacgat 2280
gagttgatcc gtgtttcggt gacagtcaag aacactggtc gtgttgccgg tgatgctgtg 2340
cctcaattgt atgtttccct tggtggaccc aatgagccca aggttgtgtt gcgcaaattc 2400
gaccgcctca ccctcaagcc ctccgaggag acggtgtgga cgactaccct gacccgccgc 2460
gatctgtcta actgggacgt tgcggctcag gactgggtca tcacttctta cccgaagaag 2520
gtccatgttg gtagctcttc gcgtcagctg ccccttcacg cggcgctccc gaaggtgcaa 2580
tga 2583
<210>78
<211>860
<212>PRT
<213>棘孢曲霉
<400>78
Met Lys Leu Ser Trp Leu Glu Ala Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Val Ser Ala Asp Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Glu Trp Ala Glu Ala Tyr Gln Arg Ala Val
35 40 45
Ala Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Lys Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Asn Ile Gly Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
85 90 95
Ile Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu His Phe Arg Gln Val Ala Glu Ala Ala Gly Tyr
195 200 205
Gly Phe Asn Ile Ser Asp Thr Ile Ser Ser Asn Val Asp Asp Lys Thr
210 215 220
Ile His Glu Met Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly
225 230 235 240
Val Gly Ala Ile Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser Gly Val
275 280 285
Gly Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Thr
290 295 300
Phe Asp Ser Ala Thr Ser Phe Trp Gly Thr Asn Leu Thr Ile Ala Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Tyr Gln Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Phe
355 360 365
Tyr Pro Gln Glu Gly Pro Tyr Glu Lys Val Asn His Phe Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Val Ile Arg Lys Leu Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asn Asn Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Lys Val Ala Ile Leu Gly Glu Asp Ala Gly Ser Asn Ser Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala
435 440 445
Trp Gly Ser Gly Thr Ala Glu Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Gln Ala Glu Val Leu Lys His Lys Gly Ser Val Tyr Ala Ile
465 470 475 480
Thr Asp Asn Trp Ala Leu Ser Gln Val Glu Thr Leu Ala Lys Gln Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ser Asp Ala Gly Glu Gly Tyr Ile
500 505 510
Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Leu Thr Leu Trp Lys
515 520 525
Asn Gly Asp Asn Leu Ile Lys Ala Ala Ala Asn Asn Cys Asn Asn Thr
530 535 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asp Glu Trp Tyr
545 550 555 560
Asp His Pro Asn Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gly
595 600 605
Asp Tyr Leu Val Arg Glu Leu Asn Asn Gly Asn Gly Ala Pro Gln Asp
610 615 620
Asp Phe Ser Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Gly Leu His Ile Gln Val Leu Asn Ala Ser Ser Asn
660 665 670
Ala Gln Val Ala Thr Glu Thr Gly Ala Ala Pro Thr Phe Gly Gln Val
675 680 685
Gly Asn Ala Ser Asp Tyr Val Tyr Pro Glu Gly Leu Thr Arg Ile Ser
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ser
705 710 715 720
Gly Asp Pro Tyr Tyr Gly Val Asp Thr Ala Glu His Val Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Pro Gln Pro Val Leu Pro Ala Gly Gly Gly Ser
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Val Lys Asn Thr Gly Arg Val Ala Gly Asp Ala Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe
785 790 795 800
Asp Arg Leu Thr Leu Lys Pro Ser Glu Glu Thr Val Trp Thr Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Ala Ala Gln Asp Trp
820 825 830
Val Ile Thr Ser Tyr Pro Lys Lys Val His Val Gly Ser Ser Ser Arg
835 840 845
Gln Leu Pro Leu His Ala Ala Leu Pro Lys Val Gln
850 855 860
<210>79
<211>3294
<212>DNA
<213>米曲霉
<400>79
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>80
<211>1097
<212>PRT
<213>米曲霉
<400>80
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Sar Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
<210>81
<211>3294
<212>DNA
<213>米曲霉
<400>81
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>82
<211>1097
<212>PRT
<213>米曲霉
<400>82
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Sar Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
Claims (26)
1.一种具有纤维素分解增强活性的分离的多肽,其选自下组:
(a)包含与SEQ ID NO:2的成熟多肽具有优选至少60%,更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、进一步更优选至少85%、最优选至少90%、进一步最优选至少95%同一性之氨基酸序列的多肽;
(b)由与(i)SEQ ID NO:1的成熟多肽编码序列、(ii)包含SEQ ID NO:1的成熟多肽编码序列之基因组DNA序列、或(iii)(i)或(ii)的全长互补链在优选至少低严紧度条件,更优选至少中等严紧度条件,进一步更优选至少中-高严紧度条件,最优选至少高严紧度条件下杂交的多核苷酸所编码的多肽;
(c)由包含与SEQ ID NO:1的成熟多肽编码序列具有优选至少60%、更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、进一步更优选至少85%、最优选至少90%、进一步最优选至少95%同一性之核苷酸序列的多核苷酸所编码的多肽;和
(d)SEQ ID NO:2的成熟多肽包含一个或多个(数个)氨基酸的取代、缺失和/或插入的变体。
2.权利要求1的多肽,其包含SEQ ID NO:2的氨基酸序列或其具有纤维素分解增强活性的片段,或者由SEQ ID NO:2的氨基酸序列或其具有纤维素分解增强活性的片段组成。
3.权利要求2的多肽,其包含SEQ ID NO:2的成熟多肽或者由SEQ IDNO:2的成熟多肽组成。
4.权利要求1的多肽,其由大肠杆菌(E.coli)NRRL B-50044中包含的质粒pTter61F中所含的多核苷酸所编码。
5.一种分离的多核苷酸,其包含编码权利要求1-4中任一项之多肽的核苷酸序列。
6.一种核酸构建体,其包含与一个或多个(数个)指导所述多肽在表达宿主中产生的控制序列可操作连接的权利要求5的多核苷酸。
7.包含权利要求6的核酸构建体的重组表达载体。
8.包含权利要求6的核酸构建体的重组宿主细胞。
9.一种产生权利要求1-4中任一项的多肽的方法,包括(a)在有助于产生所述多肽的条件下培养在其野生型形式中产生所述多肽的细胞,和(b)回收所述多肽。
10.一种产生权利要求1-4中任一项的多肽的方法,包括:(a)在有助于产生所述多肽的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列,和(b)回收所述多肽。
11.一种产生亲本细胞的突变体的方法,包括破坏或缺失编码权利要求1-4中任一项的多肽的核苷酸序列,导致该突变体产生的所述多肽比亲本细胞少。
12.通过权利要求11的方法产生的突变细胞。
13.权利要求12的突变细胞,其还包含编码天然或异源蛋白的基因。
14.一种产生蛋白质的方法,包括:(a)在有助于产生该蛋白质的条件下培养权利要求13的突变细胞,和(b)回收该蛋白质。
15.权利要求5的分离的多核苷酸,其是通过下述方式获得的:(a)在优选至少低严紧度条件,更优选中等严紧度条件,进一步更优选中-高严紧度条件,最优选至少高严紧度条件下使DNA群体与(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列之基因组DNA序列,或(iii)(i)或(ii)的全长互补链杂交,和(b)分离发生杂交的多核苷酸,其编码具有纤维素分解增强活性的多肽。
16.一种产生权利要求1-4中任一项的多肽的方法,包括(a)在有助于产生所述多肽的条件下培养包含编码所述多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。
17.用编码权利要求1-4中任一项的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。
18.一种双链抑制性RNA(dsRNA)分子,包含权利要求5的多核苷酸的子序列,其中任选地该dsRNA是siRNA或miRNA分子。
19.权利要求18的双链抑制性RNA(dsRNA)分子,其长度为大约15、16、17、18、19、20、21、22、23、24、25个或更多个双链体核苷酸。
20.一种抑制细胞中多肽的表达的方法,包括对细胞施用或在细胞中表达权利要求18或19的双链抑制性RNA(dsRNA)分子。
21.一种核酸构建体,其包含与编码信号肽的核苷酸序列可操作连接的编码蛋白质的基因,所述信号肽包含SEQ ID NO:2的氨基酸1-15或者由SEQ ID NO:2的氨基酸1-15组成,其中所述基因对于所述核苷酸序列而言是外源的。
22.包含权利要求21的核酸构建体的重组表达载体。
23.包含权利要求21的核酸构建体的重组宿主细胞。
24.一种产生蛋白质的方法,包括:(a)在有助于产生所述蛋白质的条件下培养权利要求23的重组宿主细胞;和(b)回收所述蛋白质。
25.一种降解或转化含纤维素材料的方法,包括:在有效量的权利要求1-4中任一项所述的具有纤维素分解增强活性的多肽的存在下用有效量的纤维素分解酶组合物处理含纤维素材料,其中与不存在所述具有纤维素分解增强活性的多肽时相比,该具有纤维素分解增强活性的多肽的存在增加含纤维素材料的降解。
26.一种用于产生发酵产物的方法,包括:
(a)在有效量的权利要求1-4中任一项所述的具有纤维素分解增强活性的多肽的存在下,用有效量的纤维素分解酶组合物糖化含纤维素材料,其中与不存在所述具有纤维素分解增强活性的多肽时相比,该具有纤维素分解增强活性的多肽的存在增加含纤维素材料的降解;
(b)用一种或多种发酵微生物将步骤(a)的经糖化的含纤维素材料发酵以产生发酵产物;和
(c)从发酵回收发酵产物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US94123407P | 2007-05-31 | 2007-05-31 | |
US60/941,234 | 2007-05-31 | ||
PCT/US2008/065393 WO2008148131A1 (en) | 2007-05-31 | 2008-05-30 | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101784659A true CN101784659A (zh) | 2010-07-21 |
CN101784659B CN101784659B (zh) | 2016-05-18 |
Family
ID=39626513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880101361.8A Expired - Fee Related CN101784659B (zh) | 2007-05-31 | 2008-05-30 | 具有纤维素分解增强活性的多肽和编码它的多核苷酸 |
Country Status (7)
Country | Link |
---|---|
US (3) | US8044264B2 (zh) |
EP (1) | EP2069489A1 (zh) |
CN (1) | CN101784659B (zh) |
BR (1) | BRPI0812035A2 (zh) |
CA (1) | CA2687609A1 (zh) |
MX (1) | MX2009012846A (zh) |
WO (1) | WO2008148131A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013071883A1 (en) * | 2011-11-18 | 2013-05-23 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
CN104755617A (zh) * | 2012-10-08 | 2015-07-01 | 诺维信公司 | 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸 |
CN106190874A (zh) * | 2015-05-06 | 2016-12-07 | 中国科学院天津工业生物技术研究所 | 一种强化丝状真菌蛋白质生产的方法 |
CN109112118A (zh) * | 2011-11-21 | 2019-01-01 | 诺维信股份有限公司 | Gh61多肽变体以及编码所述变体的多核苷酸 |
CN111206025A (zh) * | 2020-02-28 | 2020-05-29 | 江南大学 | 一种比活提高的溶菌酶突变体 |
CN111500599A (zh) * | 2014-05-16 | 2020-08-07 | 中央研究院 | 用以制备虾红素的重组多核苷酸序列及其应用 |
CN112662734A (zh) * | 2011-06-30 | 2021-04-16 | 诺维信公司 | 用于筛选α-淀粉酶的方法 |
CN113302305A (zh) * | 2018-12-12 | 2021-08-24 | 诺维信公司 | 提高丝状真菌细胞在多肽的产生方面的生产力的方法 |
Families Citing this family (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2709490A1 (en) | 2007-12-19 | 2009-07-09 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
CN101952304A (zh) | 2007-12-19 | 2011-01-19 | 诺维信公司 | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 |
WO2010006152A2 (en) * | 2008-07-09 | 2010-01-14 | The Board Of Regents For Oklahoma State University | Thermocellulases for lignocellulosic degradation |
WO2010080527A1 (en) * | 2008-12-19 | 2010-07-15 | Novozymes, Inc. | Methods for determining cellulolytic enhancing activity of a polypeptide |
WO2010083518A2 (en) * | 2009-01-19 | 2010-07-22 | The Board Of Regents For Oklahoma State University | Thermohemicellulases for lignocellulosic degradation |
US8604277B2 (en) | 2009-01-28 | 2013-12-10 | Novozymes, Inc. | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
WO2010120557A1 (en) * | 2009-03-31 | 2010-10-21 | Codexis, Inc. | Improved endoglucanases |
US9012186B2 (en) | 2009-04-27 | 2015-04-21 | The Board Of Trustees Of The University Of Illinois | Hemicellulose-degrading enzymes |
AU2010253848C1 (en) * | 2009-05-29 | 2015-02-19 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
MX2012000322A (es) | 2009-07-17 | 2012-02-08 | Novozymes As | Metodo de analisis del decaimiento de la celulosa en la hidrolisis del material celulosico. |
ES2560805T3 (es) | 2009-09-29 | 2016-02-22 | Novozymes Inc. | Polipéptidos con actividad mejoradora celulolítica y polinucleótidos que los codifican |
WO2011050037A1 (en) | 2009-10-23 | 2011-04-28 | Novozymes, Inc. | Cellobiohydrolase variants and polynucleotides encoding same |
DK2588604T3 (en) | 2010-06-30 | 2016-09-26 | Novozymes Inc | Polypeptides having beta-glucosidase activity and polynucleotides encoding them |
BR112013000287B1 (pt) | 2010-07-07 | 2021-07-13 | Novozymes North America, Inc | Processo para produzir um produto de fermentação a partir de material contendo lignocelulose, e, uso de polipeptídeos gh61 |
WO2012012590A2 (en) | 2010-07-23 | 2012-01-26 | Novozymes A/S | Processes for producing fermentation products |
US8865448B2 (en) | 2010-07-30 | 2014-10-21 | Cleanvantage Llc | Aspergillus containing beta-glucosidase, beta-glucosidases and nucleic acids encoding the same |
US9458483B2 (en) | 2010-08-12 | 2016-10-04 | Novozymes, Inc. | Compositions comprising a polypeptide having cellulolytic enhancing activity and a bicyclic compound and uses thereof |
US9057086B2 (en) | 2010-08-12 | 2015-06-16 | Novozymes, Inc. | Compositions comprising a polypeptide having cellulolytic enhancing activity and a bicycle compound and uses thereof |
WO2012030849A1 (en) | 2010-08-30 | 2012-03-08 | Novozymes A/S | Polypeptides having xylanase activity and polynucleotides encoding same |
US9267126B2 (en) * | 2010-08-30 | 2016-02-23 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
EP2611901B1 (en) | 2010-08-30 | 2016-05-11 | Novozymes A/S | Polypeptides having beta-glucosidase activity, beta-xylosidase activity, or beta-glucosidase and beta-xylosidase activity and polynucleotides encoding same |
EP2611914A1 (en) | 2010-08-30 | 2013-07-10 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US20130212746A1 (en) | 2010-08-30 | 2013-08-15 | Novoyzmes A/S | Polypeptides Having Hemicellulolytic Activity And Polynucleotides Encoding Same |
WO2012030811A1 (en) | 2010-08-30 | 2012-03-08 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
JP2013539971A (ja) * | 2010-09-15 | 2013-10-31 | ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア | Trichodermareeseiのエンドグルカナーゼiの好熱性変異体 |
ES2599613T3 (es) | 2010-09-30 | 2017-02-02 | Novozymes, Inc. | Variantes de polipéptidos que tienen actividad de mejora celulolítica y polinucleótidos que codifican los mismos |
CN103282489B (zh) | 2010-09-30 | 2016-12-14 | 诺维信股份有限公司 | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 |
CA2815070A1 (en) | 2010-10-20 | 2012-04-26 | Andrei Miasnikov | Thermostable trichoderma cellulase |
BR112013009817B1 (pt) | 2010-10-26 | 2020-02-04 | Novozymes As | métodos de degradar ou converter refugo de cana de açúcar, de produzir um produto de fermentação, e, de fermentar refugo de cana de açúcar |
BR112013010008B1 (pt) | 2010-11-02 | 2020-09-08 | Novozymes, Inc. | Métodos para degradar e para fermentar um material celulósico, e para produzir um produto de fermentação |
US9212354B2 (en) | 2010-11-04 | 2015-12-15 | Novozymes Inc. | Polypeptides having cellobiohydrolase activitiy and polynucleotides encoding same |
US9139823B2 (en) | 2010-11-12 | 2015-09-22 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
WO2012068509A1 (en) | 2010-11-18 | 2012-05-24 | Novozymes, Inc. | Chimeric polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US9506048B2 (en) | 2011-01-26 | 2016-11-29 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
MX2013007720A (es) | 2011-01-26 | 2013-08-09 | Novozymes As | Polipeptidos que tienen actividad celobiohidrolasa y polinucleotidos que codifican para los mismos. |
WO2012103288A1 (en) | 2011-01-26 | 2012-08-02 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
WO2012103293A1 (en) | 2011-01-26 | 2012-08-02 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
US9238806B2 (en) * | 2011-02-09 | 2016-01-19 | Novozymes A/S | Cellulase enzyme mixtures for depilling and uses thereof |
EP2678352B1 (en) | 2011-02-23 | 2017-12-06 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US9051376B2 (en) | 2011-02-23 | 2015-06-09 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
CN103608461B (zh) | 2011-03-09 | 2016-08-03 | 诺维信公司 | 增加多肽的纤维素分解增强活性的方法 |
US9409958B2 (en) | 2011-03-10 | 2016-08-09 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
RU2013146245A (ru) * | 2011-03-17 | 2015-04-27 | ДАНИСКО ЮЭс ИНК. | Способ уменьшения вязкости в процессе осахаривания |
DK2689011T3 (en) | 2011-03-25 | 2018-01-22 | Novozymes As | PROCEDURE FOR DEGRADATION OR CONVERSION OF CELLULOSE-SUBSTANCING MATERIAL |
WO2012135659A2 (en) | 2011-03-31 | 2012-10-04 | Novozymes A/S | Methods for enhancing the degradation or conversion of cellulosic material |
WO2012135719A1 (en) | 2011-03-31 | 2012-10-04 | Novozymes, Inc. | Cellulose binding domain variants and polynucleotides encoding same |
WO2012146171A1 (en) * | 2011-04-25 | 2012-11-01 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US9340810B2 (en) | 2011-04-25 | 2016-05-17 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US9926547B2 (en) | 2011-04-28 | 2018-03-27 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
BR112013027463A2 (pt) | 2011-04-29 | 2017-09-26 | Novozymes Inc | métodos para degradar ou converter, e para fermentar um material celulóliso, para produzir um produto de fermentação, e para limpar ou lavar uma superfície dura ou roupa suja, e, composição de detergente |
WO2012159009A1 (en) | 2011-05-19 | 2012-11-22 | Novozymes, Inc. | Methods for enhancing the degradation of cellulosic material with chitin binding proteins |
US20140141471A1 (en) | 2011-05-19 | 2014-05-22 | Novozymes, Inc. | Methods for Enhancing the Degradation of Cellulosic Material with Chitin Binding Proteins |
US20140147895A1 (en) | 2011-07-22 | 2014-05-29 | Novozymes A/S | Processes for Pretreating Cellulosic Material and Improving Hydrolysis Thereof |
BR112014002401B1 (pt) | 2011-08-04 | 2021-08-03 | Novozymes A/S | Célula hospedeira transgênica de fungo filamentoso, métodos para produzir um polipeptídeo e uma proteína, e, construto de ácido nucleico ou um vetor de expressão |
BR112014002405A2 (pt) | 2011-08-04 | 2017-04-04 | Novozymes As | polopeptídeo e polinucleotídeo isolados, composição, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, planta transgênica, parte da planta ou célula de planta, métodos para produzir um polipeptídeo e uma proteína, e, processos para degradar um material celulóssico, para produzir um produto de fermentação, e para fermentar um material celulósico |
AU2012298713B2 (en) | 2011-08-24 | 2017-11-23 | Novozymes, Inc. | Methods for obtaining positive transformants of a filamentous fungal host cell |
BR112014004190A2 (pt) | 2011-08-24 | 2017-03-01 | Novozymes Inc | método para construir uma cepa fúngida filamentosa, cepa fúngida filamentosa, método para produzir múltiplos polipeptídeos recombinantes, e, construto em tandem |
WO2013043910A1 (en) | 2011-09-20 | 2013-03-28 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US10017753B2 (en) | 2011-09-29 | 2018-07-10 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
CN103930438A (zh) | 2011-09-30 | 2014-07-16 | 诺维信股份有限公司 | 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸 |
EP2773656B1 (en) | 2011-10-31 | 2019-06-19 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
BR112014011902A2 (pt) | 2011-11-18 | 2017-05-16 | Novozymes As | polipeptídeo e polinucleotídeo isolados, célula hospedeira recombinante, métodos para produzir um polipeptídeo, e para produzir um mutante de uma célula parental, processos para produzir uma proteína, para degradar ou converter um material celulósico ou material contendo xilano, para produzir um produto de fermentação, e para fermentar um material celulósico ou material contendo xilano, e, formulação de caldo integral ou composição de cultura de células |
US9708591B2 (en) | 2011-11-18 | 2017-07-18 | Novozymes Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
DK2782998T3 (en) | 2011-11-22 | 2018-04-16 | Novozymes Inc | POLYPEPTIDES WITH BETA-XYLOSIDASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM |
EP2785732B1 (en) | 2011-12-01 | 2017-04-12 | Novozymes, Inc. | Polypeptides having beta-xylosidase activity and polynucleotides encoding same |
US9683248B2 (en) | 2011-12-16 | 2017-06-20 | Alliance For Sustainable Energy, Llc | Enhanced processive cellulases |
EP3272862A1 (en) | 2011-12-16 | 2018-01-24 | Novozymes, Inc. | Polypeptides having laccase activity and polynucleotides encoding same |
WO2013096369A1 (en) | 2011-12-19 | 2013-06-27 | Novozymes A/S | Processes and compositions for increasing the digestibility of cellulosic materials |
EP2794870A4 (en) | 2011-12-19 | 2015-06-17 | Novozymes Inc | POLYPEPTIDES WITH XYLANASE ACTIVITY AND POLYNUCLEOTIDES THAT CODE |
CA2878019A1 (en) | 2011-12-20 | 2013-06-27 | Novozymes, Inc. | Cellobiohydrolase variants and polynucleotides encoding same |
EP2794899A1 (en) | 2011-12-21 | 2014-10-29 | Novozymes, Inc. | Methods for determining the degradation of a biomass material |
CN113234695A (zh) | 2012-04-27 | 2021-08-10 | 诺维信股份有限公司 | Gh61多肽变体以及编码其的多核苷酸 |
BR112015005884A2 (pt) | 2012-09-19 | 2017-08-08 | Novozymes Inc E Novozymes As | processos para degradação de um material celulósico, para produção de um produto da fermentação, e de fermentação de um material celulósico, composição, e, formulação de caldo inteiro ou composição de cultura de células |
WO2014048369A1 (en) | 2012-09-28 | 2014-04-03 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US20150275194A1 (en) * | 2012-10-24 | 2015-10-01 | Novozymes A/S | Polypeptides Having Cellulolytic Enhancing Activity And Polynucleotides Encoding Same |
US9938551B2 (en) | 2012-12-12 | 2018-04-10 | Danisco Us Inc | Variants of cellobiohydrolases |
WO2014093835A1 (en) | 2012-12-14 | 2014-06-19 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
WO2014099798A1 (en) | 2012-12-19 | 2014-06-26 | Novozymes A/S | Polypeptides having cellulolytic enhancinc activity and polynucleotides encoding same |
CN105164254B (zh) | 2013-03-08 | 2019-06-28 | 诺维信公司 | 纤维二糖水解酶变体和编码它们的多核苷酸 |
US10612061B2 (en) | 2013-03-15 | 2020-04-07 | Lallemand Hungary Liquidity Management Llc | Expression of beta-glucosidases for hydrolysis of lignocellulose and associated oligomers |
CN105283546A (zh) | 2013-05-10 | 2016-01-27 | 诺维信公司 | 具有木聚糖酶活性的多肽以及对其进行编码的多核苷酸 |
US9446187B2 (en) * | 2013-06-03 | 2016-09-20 | Bigfoot Biomedical, Inc. | Infusion pump system and method |
EP3495502B1 (en) | 2013-07-24 | 2021-09-08 | The Chinese University Of Hong Kong | Biomarkers for premature birth |
CA2919157A1 (en) | 2013-09-04 | 2015-03-12 | Novozymes A/S | Processes for increasing enzymatic hydrolysis of cellulosic material |
FR3013731B1 (fr) * | 2013-11-22 | 2017-09-01 | Ifp Energies Now | Variants d'endoglucanases a activite amelioree et leurs utilisations |
EP3074513A1 (en) | 2013-11-26 | 2016-10-05 | Novozymes A/S | Enzyme compositions and uses thereof |
EP3511418B1 (en) | 2014-01-07 | 2020-07-15 | Novozymes A/S | Corollospora maritima mannanase and its use |
MY182924A (en) * | 2014-06-06 | 2021-02-05 | Novozymes As | Enzyme compositions and uses thereof |
PL3174988T3 (pl) | 2014-07-28 | 2023-01-02 | Purac Biochem Bv | Sposób wytwarzania kwasu mlekowego |
CN106574278B (zh) | 2014-07-28 | 2021-05-04 | 普拉克生化公司 | 通过分开的糖化和发酵步骤从木质纤维素材料制备乳酸和/或乳酸盐 |
US11124808B2 (en) | 2014-08-28 | 2021-09-21 | Renescience A/S | Solubilization of MSW with blend enzymes |
US11390898B2 (en) | 2014-09-05 | 2022-07-19 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
DK3198001T3 (da) | 2014-09-23 | 2021-11-08 | Novozymes As | Fremgangsmåde til fremstilling af ethanol og fermentering af organismer |
US10287610B2 (en) | 2015-01-28 | 2019-05-14 | Dsm Ip Assets B.V. | Integrated process for coproducing alcohol and organic acid from lignocellulosic material |
EP4001419A1 (en) | 2015-01-28 | 2022-05-25 | DSM IP Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
WO2016120298A1 (en) | 2015-01-28 | 2016-08-04 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
WO2016138167A2 (en) | 2015-02-24 | 2016-09-01 | Novozymes A/S | Cellobiohydrolase variants and polynucleotides encoding same |
BR112017019332A2 (pt) | 2015-03-12 | 2018-07-24 | Beta Renewables Spa | processos para melhorar um rendimento de glicose ou xilose de sacarificação de um material lignocelulósico e para produzir um produto de fermentação a partir de um material lignocelulósico |
US20180051306A1 (en) | 2015-03-12 | 2018-02-22 | Novozymes A/S | Enzymatic Hydrolysis with Hemicellulolytic Enzymes |
WO2016145363A1 (en) | 2015-03-12 | 2016-09-15 | Novozymes A/S | Multi-stage enzymatic hydrolysis of lignocellulosic biomass employing an oxidoreductase with an aa9 polypeptide |
WO2016169893A1 (en) | 2015-04-20 | 2016-10-27 | Dsm Ip Assets B.V. | Whole fermentation broth |
WO2016169892A1 (en) | 2015-04-20 | 2016-10-27 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
CN116676293A (zh) | 2015-05-27 | 2023-09-01 | 国投生物科技投资有限公司 | 具有纤维二糖水解酶活性的多肽以及对其进行编码的多核苷酸 |
WO2016207144A1 (en) | 2015-06-22 | 2016-12-29 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
US20180216089A1 (en) | 2015-07-24 | 2018-08-02 | Novozymes, Inc. | Polypeptides Having Beta-Xylosidase Activity And Polynucleotides Encoding Same |
CN108138153A (zh) | 2015-07-24 | 2018-06-08 | 诺维信股份有限公司 | 具有阿拉伯呋喃糖苷酶活性的多肽以及编码它们的多核苷酸 |
EP3344761A1 (en) | 2015-09-04 | 2018-07-11 | Novozymes A/S | Methods of inhibiting aa9 lytic polysaccharide monooxygenase catalyzed inactivation of enzyme compositions |
CN108350044B (zh) | 2015-09-22 | 2022-05-24 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽以及对其进行编码的多核苷酸 |
WO2017070219A1 (en) | 2015-10-20 | 2017-04-27 | Novozymes A/S | Lytic polysaccharide monooxygenase (lpmo) variants and polynucleotides encoding same |
WO2017076421A1 (en) | 2015-11-02 | 2017-05-11 | Renescience A/S | Solubilization of msw with blend enzymes |
CN108883400B (zh) | 2016-02-19 | 2021-09-17 | 洲际大品牌有限责任公司 | 由生物质源形成多值料流的方法 |
CN109415712A (zh) | 2016-03-02 | 2019-03-01 | 诺维信公司 | 纤维二糖水解酶变体和编码它们的多核苷酸 |
DK3433358T3 (da) | 2016-03-24 | 2022-09-26 | Novozymes As | Cellobiohydrolasevarianter og polynukleotider, der koder for dem |
WO2017205535A1 (en) | 2016-05-27 | 2017-11-30 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
EP3469090A1 (en) | 2016-06-09 | 2019-04-17 | DSM IP Assets B.V. | Seed train for large scale enzyme production |
US10913938B2 (en) | 2016-07-29 | 2021-02-09 | Dsm Ip Assets B.V. | Polypeptides having cellulolytic enhancing activity and uses thereof |
WO2018026868A1 (en) | 2016-08-01 | 2018-02-08 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
WO2018085370A1 (en) | 2016-11-02 | 2018-05-11 | Novozymes A/S | Processes for reducing production of primeverose during enzymatic saccharification of lignocellulosic material |
BR112019010355B1 (pt) | 2016-11-24 | 2024-03-05 | Dsm Ip Assets B.V. | Composição de enzimas |
US20190276809A1 (en) | 2016-11-24 | 2019-09-12 | Dsm Ip Assets B.V. | Enzyme composition |
WO2018185071A1 (en) | 2017-04-03 | 2018-10-11 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
US11319559B2 (en) | 2017-10-09 | 2022-05-03 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
WO2019074828A1 (en) | 2017-10-09 | 2019-04-18 | Danisco Us Inc | CELLOBIOSE DEHYDROGENASE VARIANTS AND METHODS OF USE |
CA3075907A1 (en) | 2017-10-23 | 2019-05-02 | Novozymes A/S | Processes for reducing lactic acid in a biofuel fermentation system |
CA3078156A1 (en) | 2017-10-30 | 2019-05-09 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
WO2019086370A1 (en) | 2017-10-30 | 2019-05-09 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
WO2019185681A1 (en) | 2018-03-28 | 2019-10-03 | Dsm Ip Assets B.V. | Enzyme composition |
WO2019185680A1 (en) | 2018-03-28 | 2019-10-03 | Dsm Ip Assets B.V. | Enzyme composition |
WO2019201765A1 (en) | 2018-04-20 | 2019-10-24 | Renescience A/S | Method for determining chemical compounds in waste |
WO2019219804A1 (en) | 2018-05-17 | 2019-11-21 | Dsm Ip Assets B.V. | Process for producing a polypeptide |
CA3099202A1 (en) | 2018-05-30 | 2019-12-05 | Dsm Ip Assets B.V. | Process for producing sugars from carbohydrate materials |
WO2020058248A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
WO2020058249A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
WO2020058253A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
US20210380958A1 (en) | 2018-10-24 | 2021-12-09 | Dsm Ip Assets B.V | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
EP3894551A1 (en) | 2018-12-12 | 2021-10-20 | Novozymes A/S | Polypeptides having xylanase activity and polynucleotides encoding same |
EP3938525A1 (en) | 2019-03-12 | 2022-01-19 | DSM IP Assets B.V. | Process for producing a fermentation broth |
EP4028536A1 (en) | 2019-09-10 | 2022-07-20 | DSM IP Assets B.V. | Enzyme composition |
GB202005073D0 (en) | 2020-04-06 | 2020-05-20 | Mellizyme Biotechnology Ltd | Enzymatic degradation of plastics |
WO2022013148A1 (en) | 2020-07-13 | 2022-01-20 | Dsm Ip Assets B.V. | Process for the production of biogas |
AU2021374777A1 (en) | 2020-11-04 | 2023-06-15 | Renescience A/S | Method for enzymatic and/or microbial processing of waste comprising recirculation of process water |
WO2022214459A1 (en) | 2021-04-06 | 2022-10-13 | Dsm Ip Assets B.V. | Enzyme composition |
WO2022214458A1 (en) | 2021-04-06 | 2022-10-13 | Dsm Ip Assets B.V. | Enzyme composition |
BR112023020370A2 (pt) | 2021-04-06 | 2023-11-21 | Dsm Ip Assets Bv | Composição de enzimas |
AU2022253636A1 (en) | 2021-04-08 | 2023-06-01 | Versalis S.P.A. | Process for the preparation of a sugar product and a fermentation product |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60335640D1 (de) * | 2002-10-01 | 2011-02-17 | Novozymes As | Polypeptide der gh-61-familie |
CN1980953B (zh) * | 2004-01-30 | 2014-12-24 | 诺维信股份有限公司 | 具有分解纤维增强活性的多肽及其编码多核苷酸 |
EP1733033B1 (en) * | 2004-02-06 | 2012-06-20 | Novozymes Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
BRPI0616721A2 (pt) * | 2005-09-30 | 2011-06-28 | Novozymes Inc | métodos para degradar ou converter um material celulósico e para produzir uma substáncia, e, composição detergente |
-
2008
- 2008-05-30 US US12/130,722 patent/US8044264B2/en not_active Expired - Fee Related
- 2008-05-30 BR BRPI0812035-8A2A patent/BRPI0812035A2/pt not_active IP Right Cessation
- 2008-05-30 CA CA002687609A patent/CA2687609A1/en not_active Abandoned
- 2008-05-30 MX MX2009012846A patent/MX2009012846A/es active IP Right Grant
- 2008-05-30 WO PCT/US2008/065393 patent/WO2008148131A1/en active Application Filing
- 2008-05-30 CN CN200880101361.8A patent/CN101784659B/zh not_active Expired - Fee Related
- 2008-05-30 EP EP08756561A patent/EP2069489A1/en not_active Ceased
-
2011
- 2011-09-21 US US13/238,755 patent/US8207400B2/en active Active
-
2012
- 2012-05-21 US US13/476,542 patent/US20120252068A1/en not_active Abandoned
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112662734A (zh) * | 2011-06-30 | 2021-04-16 | 诺维信公司 | 用于筛选α-淀粉酶的方法 |
WO2013071883A1 (en) * | 2011-11-18 | 2013-05-23 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
CN109112118A (zh) * | 2011-11-21 | 2019-01-01 | 诺维信股份有限公司 | Gh61多肽变体以及编码所述变体的多核苷酸 |
CN104755617A (zh) * | 2012-10-08 | 2015-07-01 | 诺维信公司 | 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸 |
CN104755617B (zh) * | 2012-10-08 | 2019-01-01 | 诺维信公司 | 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸 |
CN111500599A (zh) * | 2014-05-16 | 2020-08-07 | 中央研究院 | 用以制备虾红素的重组多核苷酸序列及其应用 |
CN106190874A (zh) * | 2015-05-06 | 2016-12-07 | 中国科学院天津工业生物技术研究所 | 一种强化丝状真菌蛋白质生产的方法 |
CN106190874B (zh) * | 2015-05-06 | 2020-06-26 | 中国科学院天津工业生物技术研究所 | 一种强化丝状真菌蛋白质生产的方法 |
CN113302305A (zh) * | 2018-12-12 | 2021-08-24 | 诺维信公司 | 提高丝状真菌细胞在多肽的产生方面的生产力的方法 |
CN111206025A (zh) * | 2020-02-28 | 2020-05-29 | 江南大学 | 一种比活提高的溶菌酶突变体 |
Also Published As
Publication number | Publication date |
---|---|
MX2009012846A (es) | 2009-12-14 |
US8207400B2 (en) | 2012-06-26 |
US20090019608A1 (en) | 2009-01-15 |
WO2008148131A1 (en) | 2008-12-04 |
US20120252068A1 (en) | 2012-10-04 |
CN101784659B (zh) | 2016-05-18 |
BRPI0812035A2 (pt) | 2014-10-14 |
US20120011619A1 (en) | 2012-01-12 |
US8044264B2 (en) | 2011-10-25 |
CA2687609A1 (en) | 2008-12-04 |
EP2069489A1 (en) | 2009-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101784659B (zh) | 具有纤维素分解增强活性的多肽和编码它的多核苷酸 | |
CN102482680B (zh) | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
CN102597243B (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN102112604B (zh) | 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN102639697B (zh) | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
US8258370B2 (en) | Polypeptides having endoglucanase activity and polynucleotides encoding same | |
US8975059B2 (en) | Polypeptides having endoglucanase activity and polynucleotides encoding same | |
CN101970471A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN101952420A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN101952304A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN101945889A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN103620028A (zh) | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 | |
CN102112603A (zh) | 具有α-葡糖醛酸糖苷酶活性的多肽和编码该多肽的多核苷酸 | |
CN102712916A (zh) | 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸 | |
CN103958675A (zh) | 具有木聚糖酶活性的多肽以及编码它们的多核苷酸 | |
US8586828B2 (en) | Polypeptides having beta-glucosidase activity and polynucleotides encoding same | |
US20140096287A1 (en) | Polypeptides having endoglucanase activity and polynucleotides encoding same | |
US20090148903A1 (en) | Polypeptides having beta-glucosidase activity and polynucleotides encoding same | |
CN103930438A (zh) | 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸 | |
CN109022394A (zh) | 具有β-木糖苷酶活性的多肽和编码该多肽的多核苷酸 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160518 Termination date: 20190530 |
|
CF01 | Termination of patent right due to non-payment of annual fee |