CN1620501A - 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸 - Google Patents
具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸 Download PDFInfo
- Publication number
- CN1620501A CN1620501A CNA028127684A CN02812768A CN1620501A CN 1620501 A CN1620501 A CN 1620501A CN A028127684 A CNA028127684 A CN A028127684A CN 02812768 A CN02812768 A CN 02812768A CN 1620501 A CN1620501 A CN 1620501A
- Authority
- CN
- China
- Prior art keywords
- seq
- nucleotide
- identity
- position nucleotide
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 394
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 381
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 380
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 title claims abstract description 247
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 61
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 61
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 61
- 230000000694 effects Effects 0.000 title abstract description 25
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 1236
- 239000002773 nucleotide Substances 0.000 claims abstract description 1211
- 238000000034 method Methods 0.000 claims abstract description 87
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 23
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 22
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 22
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 253
- 235000001014 amino acid Nutrition 0.000 claims description 233
- 150000001413 amino acids Chemical class 0.000 claims description 230
- 244000005700 microbiome Species 0.000 claims description 208
- 210000004027 cell Anatomy 0.000 claims description 113
- 239000013612 plasmid Substances 0.000 claims description 67
- 241000233866 Fungi Species 0.000 claims description 61
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 54
- 241000894006 Bacteria Species 0.000 claims description 51
- 241000235349 Ascomycota Species 0.000 claims description 44
- 241000196324 Embryophyta Species 0.000 claims description 41
- 108020004414 DNA Proteins 0.000 claims description 40
- 239000000523 sample Substances 0.000 claims description 40
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 39
- 238000003780 insertion Methods 0.000 claims description 35
- 230000037431 insertion Effects 0.000 claims description 35
- 241000228212 Aspergillus Species 0.000 claims description 30
- 229920000742 Cotton Polymers 0.000 claims description 29
- 230000004048 modification Effects 0.000 claims description 28
- 238000012986 modification Methods 0.000 claims description 28
- 230000001105 regulatory effect Effects 0.000 claims description 25
- 241001523963 Xylaria hypoxylon Species 0.000 claims description 23
- 230000001276 controlling effect Effects 0.000 claims description 23
- 230000000295 complement effect Effects 0.000 claims description 22
- 230000001580 bacterial effect Effects 0.000 claims description 21
- 239000012634 fragment Substances 0.000 claims description 20
- 244000025254 Cannabis sativa Species 0.000 claims description 19
- 241000223258 Thermomyces lanuginosus Species 0.000 claims description 19
- 238000009396 hybridization Methods 0.000 claims description 18
- 238000004519 manufacturing process Methods 0.000 claims description 18
- 241000235525 Rhizomucor pusillus Species 0.000 claims description 17
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 claims description 16
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 claims description 16
- 230000008521 reorganization Effects 0.000 claims description 16
- 241000221955 Chaetomium Species 0.000 claims description 15
- 241001451059 Poitrasia circinans Species 0.000 claims description 15
- 239000000758 substrate Substances 0.000 claims description 15
- 241000123318 Meripilus giganteus Species 0.000 claims description 14
- 241000233622 Phytophthora infestans Species 0.000 claims description 14
- 241000182985 Thielavia australiensis Species 0.000 claims description 14
- 241001070941 Castanea Species 0.000 claims description 13
- 235000014036 Castanea Nutrition 0.000 claims description 13
- 241000259828 Chaetomidium pingtungium Species 0.000 claims description 13
- 241000259811 Cladorrhinum foecundissimum Species 0.000 claims description 13
- 241000220317 Rosa Species 0.000 claims description 13
- 244000223760 Cinnamomum zeylanicum Species 0.000 claims description 12
- 241000222393 Phanerochaete chrysosporium Species 0.000 claims description 12
- 235000017803 cinnamon Nutrition 0.000 claims description 12
- 244000007853 Sarothamnus scoparius Species 0.000 claims description 11
- 239000013604 expression vector Substances 0.000 claims description 11
- 241000235395 Mucor Species 0.000 claims description 10
- 241000589516 Pseudomonas Species 0.000 claims description 10
- 230000008034 disappearance Effects 0.000 claims description 10
- 210000002752 melanocyte Anatomy 0.000 claims description 10
- 235000013311 vegetables Nutrition 0.000 claims description 10
- 241000221198 Basidiomycota Species 0.000 claims description 9
- 239000002028 Biomass Substances 0.000 claims description 9
- 239000002253 acid Substances 0.000 claims description 9
- 241000222382 Agaricomycotina Species 0.000 claims description 8
- 241000259813 Trichophaea saccata Species 0.000 claims description 7
- 230000009261 transgenic effect Effects 0.000 claims description 7
- 241000758405 Zoopagomycotina Species 0.000 claims description 6
- 108010047754 beta-Glucosidase Proteins 0.000 claims description 6
- 238000003259 recombinant expression Methods 0.000 claims description 6
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 claims description 5
- 241000259810 Acremonium thermophilum Species 0.000 claims description 5
- 244000251987 Coprinus macrorhizus Species 0.000 claims description 5
- 241000221435 Exidia glandulosa Species 0.000 claims description 5
- 241000223218 Fusarium Species 0.000 claims description 5
- 241000190144 Lasiodiplodia theobromae Species 0.000 claims description 5
- 241000233654 Oomycetes Species 0.000 claims description 5
- 241000221700 Pezizales Species 0.000 claims description 5
- 241001313536 Thermothelomyces thermophila Species 0.000 claims description 5
- 241000259840 Chaetomidium Species 0.000 claims description 4
- 241000259808 Cladorrhinum Species 0.000 claims description 4
- 235000001673 Coprinus macrorhizus Nutrition 0.000 claims description 4
- 241001184659 Melanocarpus albomyces Species 0.000 claims description 4
- 241000123315 Meripilus Species 0.000 claims description 4
- 241001480490 Mucoraceae Species 0.000 claims description 4
- 241000226677 Myceliophthora Species 0.000 claims description 4
- 241000123526 Peziza Species 0.000 claims description 4
- 241001451060 Poitrasia Species 0.000 claims description 4
- 241000145838 Pyronemataceae Species 0.000 claims description 4
- 241000235527 Rhizopus Species 0.000 claims description 4
- 241000082085 Verticillium <Phyllachorales> Species 0.000 claims description 4
- 239000013543 active substance Substances 0.000 claims description 4
- 230000001476 alcoholic effect Effects 0.000 claims description 4
- 102000006995 beta-Glucosidase Human genes 0.000 claims description 4
- 239000003610 charcoal Substances 0.000 claims description 4
- 239000011148 porous material Substances 0.000 claims description 4
- 241000221452 Auriculariales Species 0.000 claims description 3
- 241001248634 Chaetomium thermophilum Species 0.000 claims description 3
- 241000222511 Coprinus Species 0.000 claims description 3
- 241000935926 Diplodia Species 0.000 claims description 3
- 241000131442 Dothideaceae Species 0.000 claims description 3
- 241000228436 Dothideales Species 0.000 claims description 3
- 241001480693 Exidiaceae Species 0.000 claims description 3
- 241000259838 Humicola nigrescens Species 0.000 claims description 3
- 241000233614 Phytophthora Species 0.000 claims description 3
- 241000383853 Pseudoplectania nigrella Species 0.000 claims description 3
- 241000233612 Pythiaceae Species 0.000 claims description 3
- 241000235402 Rhizomucor Species 0.000 claims description 3
- 241001149962 Sporothrix Species 0.000 claims description 3
- 241000228182 Thermoascus aurantiacus Species 0.000 claims description 3
- 241000215410 Trichothecium roseum Species 0.000 claims description 3
- 241000259841 Verticillium tenerum Species 0.000 claims description 3
- 241001523965 Xylaria Species 0.000 claims description 3
- 239000002775 capsule Substances 0.000 claims description 3
- 201000010099 disease Diseases 0.000 claims description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 3
- 238000011065 in-situ storage Methods 0.000 claims description 3
- 241000222518 Agaricus Species 0.000 claims description 2
- 241000228257 Aspergillus sp. Species 0.000 claims description 2
- 241000088530 Chaetomium sp. Species 0.000 claims description 2
- 241001149959 Fusarium sp. Species 0.000 claims description 2
- 241000221781 Hypocreaceae Species 0.000 claims description 2
- 241000243190 Microsporidia Species 0.000 claims description 2
- 241001674208 Mycothermus thermophilus Species 0.000 claims description 2
- 241000259850 Neotermes castaneus Species 0.000 claims description 2
- 241001149708 Sarcosomataceae Species 0.000 claims description 2
- 241000915973 Scopulariopsis sp. Species 0.000 claims description 2
- 241001557894 Scytalidium sp. Species 0.000 claims description 2
- 241000287188 Thermothelomyces hinnulea Species 0.000 claims description 2
- 241001494489 Thielavia Species 0.000 claims description 2
- 241000221841 Verticillium sp. (in: Hypocreales) Species 0.000 claims description 2
- 241001523973 Xylariales Species 0.000 claims description 2
- 230000037303 wrinkles Effects 0.000 claims description 2
- 101150052795 cbh-1 gene Proteins 0.000 abstract description 22
- 239000013598 vector Substances 0.000 abstract description 3
- 229940024606 amino acid Drugs 0.000 description 125
- 238000004321 preservation Methods 0.000 description 78
- 108090000623 proteins and genes Proteins 0.000 description 74
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 69
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 60
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 55
- 108090000790 Enzymes Proteins 0.000 description 48
- 229940088598 enzyme Drugs 0.000 description 48
- 239000000203 mixture Substances 0.000 description 48
- 102000004190 Enzymes Human genes 0.000 description 47
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 45
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 45
- 239000002299 complementary DNA Substances 0.000 description 32
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 30
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 29
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 29
- 229920002678 cellulose Polymers 0.000 description 26
- 239000001913 cellulose Substances 0.000 description 26
- 230000002596 correlated effect Effects 0.000 description 26
- 239000003599 detergent Substances 0.000 description 26
- 239000012620 biological material Substances 0.000 description 24
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 23
- 102000004169 proteins and genes Human genes 0.000 description 23
- 230000000875 corresponding effect Effects 0.000 description 22
- 235000018102 proteins Nutrition 0.000 description 22
- 239000000463 material Substances 0.000 description 20
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 18
- 230000002538 fungal effect Effects 0.000 description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 18
- 230000036961 partial effect Effects 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 16
- 108010076504 Protein Sorting Signals Proteins 0.000 description 16
- 241001326533 Sordariomycetes Species 0.000 description 16
- 230000008859 change Effects 0.000 description 16
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 15
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 14
- 241000221926 Sordariales Species 0.000 description 14
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 14
- 230000000813 microbial effect Effects 0.000 description 14
- 241000193830 Bacillus <bacterium> Species 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 13
- 108091005804 Peptidases Proteins 0.000 description 13
- -1 amyL Chemical class 0.000 description 13
- 108010065511 Amylases Proteins 0.000 description 12
- 240000006439 Aspergillus oryzae Species 0.000 description 12
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 12
- 108010059892 Cellulase Proteins 0.000 description 12
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 12
- 108090001060 Lipase Proteins 0.000 description 12
- 229940106157 cellulase Drugs 0.000 description 12
- 102000004882 Lipase Human genes 0.000 description 11
- 239000004367 Lipase Substances 0.000 description 11
- 102000035195 Peptidases Human genes 0.000 description 11
- 235000019421 lipase Nutrition 0.000 description 11
- 238000003752 polymerase chain reaction Methods 0.000 description 11
- 235000000346 sugar Nutrition 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 239000000835 fiber Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 102000003992 Peroxidases Human genes 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 229940072417 peroxidase Drugs 0.000 description 8
- 108040007629 peroxidase activity proteins Proteins 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 239000004382 Amylase Substances 0.000 description 7
- 102000013142 Amylases Human genes 0.000 description 7
- 241000194108 Bacillus licheniformis Species 0.000 description 7
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 7
- 241000221952 Sordariaceae Species 0.000 description 7
- 239000000654 additive Substances 0.000 description 7
- 230000000996 additive effect Effects 0.000 description 7
- 235000019418 amylase Nutrition 0.000 description 7
- 239000002585 base Substances 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 230000007062 hydrolysis Effects 0.000 description 7
- 238000006460 hydrolysis reaction Methods 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 238000005406 washing Methods 0.000 description 7
- 241000351920 Aspergillus nidulans Species 0.000 description 6
- 241001494491 Chaetomiaceae Species 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- 108020005091 Replication Origin Proteins 0.000 description 6
- 241001655322 Streptomycetales Species 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 238000000855 fermentation Methods 0.000 description 6
- 230000004151 fermentation Effects 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 229920000018 Callose Polymers 0.000 description 5
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 5
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 5
- 229920002488 Hemicellulose Polymers 0.000 description 5
- 241001480714 Humicola insolens Species 0.000 description 5
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 5
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 5
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 229940125396 insulin Drugs 0.000 description 5
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Substances N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 102220023256 rs387907547 Human genes 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 210000005253 yeast cell Anatomy 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 4
- 241000567163 Fusarium cerealis Species 0.000 description 4
- 241000223221 Fusarium oxysporum Species 0.000 description 4
- 241000209510 Liliopsida Species 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 4
- 241000235070 Saccharomyces Species 0.000 description 4
- 244000061456 Solanum tuberosum Species 0.000 description 4
- 235000002595 Solanum tuberosum Nutrition 0.000 description 4
- 108090000787 Subtilisin Proteins 0.000 description 4
- 241000499912 Trichoderma reesei Species 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- 238000013016 damping Methods 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- 230000000968 intestinal effect Effects 0.000 description 4
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 235000016709 nutrition Nutrition 0.000 description 4
- 230000037039 plant physiology Effects 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 239000002994 raw material Substances 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000002269 spontaneous effect Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 241000193422 Bacillus lentus Species 0.000 description 3
- 206010004173 Basophilia Diseases 0.000 description 3
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 3
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 3
- 241000567178 Fusarium venenatum Species 0.000 description 3
- 229920001503 Glucan Polymers 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 241000219146 Gossypium Species 0.000 description 3
- 102000004157 Hydrolases Human genes 0.000 description 3
- 108090000604 Hydrolases Proteins 0.000 description 3
- 108090000769 Isomerases Proteins 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 108091000080 Phosphotransferase Proteins 0.000 description 3
- 241000235648 Pichia Species 0.000 description 3
- 108091034057 RNA (poly(A)) Proteins 0.000 description 3
- 241000235403 Rhizomucor miehei Species 0.000 description 3
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 3
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 3
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 3
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 3
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 3
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 150000001408 amides Chemical class 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000007844 bleaching agent Substances 0.000 description 3
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 3
- 239000004327 boric acid Substances 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 150000002016 disaccharides Chemical group 0.000 description 3
- 239000004744 fabric Substances 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 239000006210 lotion Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 210000001724 microfibril Anatomy 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 150000004804 polysaccharides Chemical class 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- DNIAPMSPPWPWGF-GSVOUGTGSA-N (R)-(-)-Propylene glycol Chemical compound C[C@@H](O)CO DNIAPMSPPWPWGF-GSVOUGTGSA-N 0.000 description 2
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 2
- RLFWWDJHLFCNIJ-UHFFFAOYSA-N 4-aminoantipyrine Chemical compound CN1C(C)=C(N)C(=O)N1C1=CC=CC=C1 RLFWWDJHLFCNIJ-UHFFFAOYSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 241000222501 Agaricaceae Species 0.000 description 2
- 241000222485 Agaricales Species 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 241000220433 Albizia Species 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 241000228215 Aspergillus aculeatus Species 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 108090000145 Bacillolysin Proteins 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241000193752 Bacillus circulans Species 0.000 description 2
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 229920002498 Beta-glucan Polymers 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- KAKZBPTYRLMSJV-UHFFFAOYSA-N Butadiene Chemical group C=CC=C KAKZBPTYRLMSJV-UHFFFAOYSA-N 0.000 description 2
- 101710128063 Carbohydrate oxidase Proteins 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- 125000002353 D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 101710088194 Dehydrogenase Proteins 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 241001326550 Dothideomycetes Species 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241001063191 Elops affinis Species 0.000 description 2
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 2
- 102000010911 Enzyme Precursors Human genes 0.000 description 2
- 108010062466 Enzyme Precursors Proteins 0.000 description 2
- 235000002756 Erythrina berteroana Nutrition 0.000 description 2
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical group C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- 241001465753 Fusarium torulosum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 102100022624 Glucoamylase Human genes 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 241000256602 Isoptera Species 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- 108010029541 Laccase Proteins 0.000 description 2
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 2
- 241001619412 Meruliaceae Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 2
- 241001459558 Monographella nivalis Species 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 241000221961 Neurospora crassa Species 0.000 description 2
- 102000035092 Neutral proteases Human genes 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- BPQQTUXANYXVAA-UHFFFAOYSA-N Orthosilicate Chemical compound [O-][Si]([O-])([O-])[O-] BPQQTUXANYXVAA-UHFFFAOYSA-N 0.000 description 2
- 241001326541 Pezizomycetes Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 2
- 108010059820 Polygalacturonase Proteins 0.000 description 2
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241001085826 Sporotrichum Species 0.000 description 2
- 108010056079 Subtilisins Proteins 0.000 description 2
- 102000005158 Subtilisins Human genes 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 239000005864 Sulphur Substances 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 241000223260 Trichoderma harzianum Species 0.000 description 2
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 2
- 240000006677 Vicia faba Species 0.000 description 2
- 235000010749 Vicia faba Nutrition 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 241001314279 Zoopagales Species 0.000 description 2
- 229920006243 acrylic copolymer Polymers 0.000 description 2
- 150000001336 alkenes Chemical class 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 229940054340 bacillus coagulans Drugs 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 150000001558 benzoic acid derivatives Chemical class 0.000 description 2
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 2
- 102220369445 c.668T>C Human genes 0.000 description 2
- 108010089934 carbohydrase Proteins 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000008393 encapsulating agent Substances 0.000 description 2
- 238000007046 ethoxylation reaction Methods 0.000 description 2
- 241001233957 eudicotyledons Species 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 229960002989 glutamic acid Drugs 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000004310 lactic acid Substances 0.000 description 2
- 235000014655 lactic acid Nutrition 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 239000008108 microcrystalline cellulose Substances 0.000 description 2
- 229940016286 microcrystalline cellulose Drugs 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000006386 neutralization reaction Methods 0.000 description 2
- LIXVMPBOGDCSRM-UHFFFAOYSA-N nonylbenzene Chemical compound CCCCCCCCCC1=CC=CC=C1 LIXVMPBOGDCSRM-UHFFFAOYSA-N 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 150000004965 peroxy acids Chemical class 0.000 description 2
- 230000008635 plant growth Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 229920005862 polyol Polymers 0.000 description 2
- 150000003077 polyols Chemical class 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 102220023258 rs387907548 Human genes 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 2
- 239000007974 sodium acetate buffer Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 229920002554 vinyl polymer Polymers 0.000 description 2
- 210000001835 viscera Anatomy 0.000 description 2
- 229920001221 xylan Polymers 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- UYQJCPNSAVWAFU-ZEUIETHYSA-N (2r,3r,4r,5r)-4-[(2s,3r,4r,5s,6r)-5-[(2s,3r,4r,5s,6r)-3,4-dihydroxy-6-(hydroxymethyl)-5-[(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,4-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-2,3,5,6-tetrahydroxyhexanal Chemical compound O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@@H](CO)O1 UYQJCPNSAVWAFU-ZEUIETHYSA-N 0.000 description 1
- JCGNPQHAXBIDLH-UHFFFAOYSA-N (4-formyloxyphenyl)boronic acid Chemical compound OB(O)C1=CC=C(OC=O)C=C1 JCGNPQHAXBIDLH-UHFFFAOYSA-N 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- RAXXELZNTBOGNW-UHFFFAOYSA-N 1H-imidazole Chemical compound C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 1
- BTJIUGUIPKRLHP-UHFFFAOYSA-N 4-nitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1 BTJIUGUIPKRLHP-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- MKPCNMXYTMQZBE-UHFFFAOYSA-N 7h-purin-6-amine;sulfuric acid;dihydrate Chemical compound O.O.OS(O)(=O)=O.NC1=NC=NC2=C1NC=N2.NC1=NC=NC2=C1NC=N2 MKPCNMXYTMQZBE-UHFFFAOYSA-N 0.000 description 1
- AJBBHZDIKZCZAI-UHFFFAOYSA-N 8,11-eicosadiynoic acid Chemical compound CCCCCCCCC#CCC#CCCCCCCC(O)=O AJBBHZDIKZCZAI-UHFFFAOYSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000589513 Burkholderia cepacia Species 0.000 description 1
- BGRYFXOPHDGRSE-UHFFFAOYSA-N C(CCCCCCCCCCC)(=O)O.C(C=C)(=O)OC Chemical compound C(CCCCCCCCCCC)(=O)O.C(C=C)(=O)OC BGRYFXOPHDGRSE-UHFFFAOYSA-N 0.000 description 1
- 101100520142 Caenorhabditis elegans pin-2 gene Proteins 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 229920002299 Cellodextrin Polymers 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 241000701248 Chlorella virus Species 0.000 description 1
- 241001451058 Choanephoraceae Species 0.000 description 1
- 241000233652 Chytridiomycota Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- GUBGYTABKSRVRQ-UHFFFAOYSA-N D-Cellobiose Natural products OCC1OC(OC2C(O)C(O)C(O)OC2CO)C(O)C(O)C1O GUBGYTABKSRVRQ-UHFFFAOYSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical class O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 240000008570 Digitaria exilis Species 0.000 description 1
- 235000005459 Digitaria exilis Nutrition 0.000 description 1
- 108010001394 Disaccharidases Proteins 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 241000228427 Eurotiales Species 0.000 description 1
- 241001326555 Eurotiomycetes Species 0.000 description 1
- 241000221433 Exidia Species 0.000 description 1
- 101710098247 Exoglucanase 1 Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 108010068370 Glutens Proteins 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 241000221775 Hypocreales Species 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 101710094902 Legumin Proteins 0.000 description 1
- 244000211187 Lepidium sativum Species 0.000 description 1
- 235000007849 Lepidium sativum Nutrition 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000209082 Lolium Species 0.000 description 1
- 241000219745 Lupinus Species 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010054377 Mannosidases Proteins 0.000 description 1
- 102000001696 Mannosidases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 241000235388 Mucorales Species 0.000 description 1
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 206010029379 Neutrophilia Diseases 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 241000047703 Nonion Species 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 108010013639 Peptidoglycan Proteins 0.000 description 1
- 241000425347 Phyla <beetle> Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241000168225 Pseudomonas alcaligenes Species 0.000 description 1
- 241000589540 Pseudomonas fluorescens Species 0.000 description 1
- 241000589630 Pseudomonas pseudoalcaligenes Species 0.000 description 1
- 241000383860 Pseudoplectania Species 0.000 description 1
- 241000518274 Pythiales Species 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 101710173866 Seminase Proteins 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- BGRWYDHXPHLNKA-UHFFFAOYSA-N Tetraacetylethylenediamine Chemical compound CC(=O)N(C(C)=O)CCN(C(C)=O)C(C)=O BGRWYDHXPHLNKA-UHFFFAOYSA-N 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- 241000183057 Thielavia microspora Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 241001136486 Trichocomaceae Species 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 241000215642 Trichophaea Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- 241001523964 Xylariaceae Species 0.000 description 1
- 229920002000 Xyloglucan Polymers 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 229910021536 Zeolite Inorganic materials 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 150000004996 alkyl benzenes Chemical class 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000005227 alkyl sulfonate group Chemical group 0.000 description 1
- 102000004139 alpha-Amylases Human genes 0.000 description 1
- 229940024171 alpha-amylase Drugs 0.000 description 1
- 229940064734 aminobenzoate Drugs 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960003311 ampicillin trihydrate Drugs 0.000 description 1
- 239000003945 anionic surfactant Substances 0.000 description 1
- 230000000433 anti-nutritional effect Effects 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 101150072344 argA gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 239000003637 basic solution Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229940077388 benzenesulfonate Drugs 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QRZGKKJRSA-N beta-cellobiose Chemical compound OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QRZGKKJRSA-N 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 125000005340 bisphosphate group Chemical group 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 102220369447 c.1352G>A Human genes 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 150000001773 cellobioses Chemical class 0.000 description 1
- FYGDTMLNYKFZSV-ZWSAEMDYSA-N cellotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-ZWSAEMDYSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 239000007859 condensation product Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- HNPSIPDUKPIQMN-UHFFFAOYSA-N dioxosilane;oxo(oxoalumanyloxy)alumane Chemical compound O=[Si]=O.O=[Al]O[Al]=O HNPSIPDUKPIQMN-UHFFFAOYSA-N 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical class [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 108010091371 endoglucanase 1 Proteins 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092450 endoglucanase Z Proteins 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- FHJUNZDWQYDDNJ-UHFFFAOYSA-N ethoxy ethyl sulfate Chemical compound CCOOS(=O)(=O)OCC FHJUNZDWQYDDNJ-UHFFFAOYSA-N 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 1
- 150000002191 fatty alcohols Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005243 fluidization Methods 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 239000013505 freshwater Substances 0.000 description 1
- 239000003502 gasoline Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 150000008131 glucosides Chemical group 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 150000002337 glycosamines Chemical class 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 150000003949 imides Chemical class 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000011499 joint compound Substances 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 108010020132 microbial serine proteinases Proteins 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 229920001206 natural gum Polymers 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- MGFYIUFZLHCRTH-UHFFFAOYSA-N nitrilotriacetic acid Chemical compound OC(=O)CN(CC(O)=O)CC(O)=O MGFYIUFZLHCRTH-UHFFFAOYSA-N 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 125000001402 nonanoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 235000019629 palatability Nutrition 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 229940044652 phenolsulfonate Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- HXITXNWTGFUOAU-UHFFFAOYSA-N phenylboronic acid Chemical class OB(O)C1=CC=CC=C1 HXITXNWTGFUOAU-UHFFFAOYSA-N 0.000 description 1
- 150000003014 phosphoric acid esters Chemical class 0.000 description 1
- 150000003016 phosphoric acids Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 229920005646 polycarboxylate Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- GMVPRGQOIOIIMI-DWKJAMRDSA-N prostaglandin E1 Chemical compound CCCCC[C@H](O)\C=C\[C@H]1[C@H](O)CC(=O)[C@@H]1CCCCCCC(O)=O GMVPRGQOIOIIMI-DWKJAMRDSA-N 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 229940047431 recombinate Drugs 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 235000017550 sodium carbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- MWNQXXOSWHCCOZ-UHFFFAOYSA-L sodium;oxido carbonate Chemical compound [Na+].[O-]OC([O-])=O MWNQXXOSWHCCOZ-UHFFFAOYSA-L 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 150000003457 sulfones Chemical class 0.000 description 1
- 229910021653 sulphate ion Inorganic materials 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 239000008399 tap water Substances 0.000 description 1
- 235000020679 tap water Nutrition 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 229940048102 triphosphoric acid Drugs 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000010457 zeolite Substances 0.000 description 1
- 150000008498 β-D-glucosides Chemical class 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11D—DETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
- C11D3/00—Other compounding ingredients of detergent compositions covered in group C11D1/00
- C11D3/16—Organic compounds
- C11D3/38—Products with no well-defined composition, e.g. natural products
- C11D3/386—Preparations containing enzymes, e.g. protease or amylase
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11D—DETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
- C11D3/00—Other compounding ingredients of detergent compositions covered in group C11D1/00
- C11D3/16—Organic compounds
- C11D3/38—Products with no well-defined composition, e.g. natural products
- C11D3/386—Preparations containing enzymes, e.g. protease or amylase
- C11D3/38645—Preparations containing enzymes, e.g. protease or amylase containing cellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2477—Hemicellulases not provided in a preceding group
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/14—Multiple stages of fermentation; Multiple types of microorganisms or re-use of microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01091—Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Abstract
本发明涉及具有纤维二糖水解酶I(也被称为CBH I或CBH 1)活性的多肽和含有编码该多肽的核苷酸序列的多核苷酸。本发明还涉及含有该核苷酸构建体的核酸构建体、载体和宿主细胞,以及制备和使用该多肽的方法。
Description
发明领域
本发明涉及具有纤维二糖水解酶(cellobiohydrolase)I(也被称为CBHI或CBH 1)活性的多肽和含有编码该多肽的核苷酸序列的多核苷酸。本发明还涉及含有核酸构建体、载体和该核酸构建体的宿主细胞,以及制备和使用该多肽的方法。
发明背景
纤维素是一种重要的工业原材料和一种可再生能源的来源。天然纤维素的物理结构和形态学很复杂,并且它的细微结构很难通过实验方法确定。然而,纤维素的化学结构很简单,它是由D-葡萄糖残基通过β-1,4-糖苷键连接形成的线性聚合体,链长超过10.000个糖苷残基。
为了有效地消化纤维素,需要几种酶的共同作用。其中至少有三类酶是必需的,它们将纤维素转化为葡萄糖:随机切断纤维素链的内切-(1,4)-β-D-葡聚糖酶(EC 3.2.1.4),从显微素链末端剪切纤维二糖单位的纤维二糖水解酶(EC 3.2.1.91),和将纤维二糖和可溶性纤维糊精转化为葡萄糖的β-葡萄糖苷酶(EC 3.2.1.21)。在这三类与纤维素降解有关的酶中,纤维二糖水解酶是降解天然晶态纤维素的关键性酶。
外切-纤维二糖水解酶(纤维二糖水解酶I,或CBH I)指通过从纤维素聚合体链的非还原末端水解纤维二糖降解纤维素的纤维二糖水解酶。
本发明的一个目的是提供具有纤维二糖水解酶I活性的改良多肽和编码该多肽的多核苷酸。改良多肽具有改善的特定活性和/或改善的稳定性特别是热稳定性。该多肽还具有改善的通过纤维二糖抵抗抑制的能力。
发明概述
本发明的第一个方面涉及选自下组所示的具有纤维二糖水解酶I活性的多肽:
(a)包含选自下组所示氨基酸序列的多肽:
与SEQ ID NO:2中第1-526位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:4中第1-529位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:6中第1-451位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:8中第1-457位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:10中第1-538位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:12中第1-415位氨基酸具有至少70%同一性的氨基酸序列,
与SEQ ID NO:14中第1-447位氨基酸具有至少70%同一性的氨基酸序列,
与SEQ ID NO:16中第1-452位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:38中第1-454位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:40中第1-458位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:42中第1-450位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:44中第1-446位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:46中第1-527位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:48中第1-455位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:50中第1-464位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:52中第1-460位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:54中第1-450位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:56中第1-532位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:58中第1-460位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:60中第1-525位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:66中第1-456位氨基酸具有至少80%同一性的氨基酸序列。
(b)包含选自下组所示氨基酸序列的多肽:
与存在于嗜热支顶孢(Acremonium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热毛壳霉(Chaetomium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于小柱孢菌(Scytalidium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热小柱孢菌(Scytalidium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于橙黄色热子囊菌(Thermoascus aurantiacus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Thielavia australiensis中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于幼嫩轮枝孢(Verticillium tenerum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70%同一性的氨基酸序列,
与存在于栗色新螱(Neotermes castaneus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70%同一性的氨基酸序列,
与存在于黑素白丝菌(Melanocarpus albomyces)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于支顶孢(Acremonium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Chaetomidium pingtungium中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Sporotrichum pruinosum中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于棉色二孢(Diplodia gossypina)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于囊状长毛盘菌(Trichophaea saccata)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热毁丝霉(Myceliophthora thermophila)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Exidia glandulosa中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于块团炭角菌(Xylaria hypoxylon)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于poitrasia circinans中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于灰色鬼伞(Coprinus cinereus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于淡黑假黑盘菌(Pseudoplectania nigrella)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
存在于玫瑰单瑞孢(Trichothecium roseum)IFO 5372中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于产黑色腐质霉(Humicola nigrescens)CBS 819.73中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于Cladorrhinum foecundissimum CBS 427.97中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于棉色二孢(Diplodia gossypina)CBS 247.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于嗜热毁丝霉(Myceliophthora thermophila)CBS117.65中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于微小根毛霉(Rhizomucor pusillus)CBS109471中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于Meripilus giganteus CBS 521.95中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于黑耳(Exidia glandulosa)CBS 2377.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于块团炭角菌(Xylaria hypoxylon)CBS 284.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于长毛盘菌(Trichophaea saccata)CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于毛壳霉(Chaetomium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于肉桂色毁丝霉(Myceliophthora hinnulea)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于有小孢子囊的草根霉(Thielavia cf.microspora)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于曲霉(Aspergillus sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于帚霉(Scopulariopsis sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于镰孢(Fusarium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于轮枝孢(Verticillium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,和
存在于蔓延疫霉(Phytophthora infestans)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列。
(c)包含选自下组所示氨基酸序列的多肽:
与SEQ ID NO:1中第1-1578位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:3中第1-1587位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:5中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:7中第1-1371位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:9中第1-1614位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:11中第1-1245位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:13中第1-1341位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:15中第1-1356位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:37中第1-1365位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:39中第1-1377位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:41中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:43中第1-1341位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:45中第1-1584位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:47中第1-1368位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:49中第1-1395位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:51中第1-1383位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:53中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:55中第1-1599位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:57中第1-1383位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:59中第1-1578位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:65中第1-1371位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
(d)由在高严谨条件下与下组所示的多核苷酸探针杂交的核苷酸序列编码的多肽:
(i)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,
(ii)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51第1-500位核苷酸,
SEQ ID NO:53第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,和
(iii)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,和
SEQ ID NO:65中第1-200位核苷酸,和
(e)具有纤维二糖水解酶I活性的(a)、(b)或(c)的片段。
本发明的第二个方面涉及一种含有编码本发明多肽的核苷酸序列的多核苷酸。
本发明的第三个方面涉及一种含有编码本发明多肽的核苷酸序列的核酸构建体,其中该核苷酸与一种或多种能引导多肽在适宜宿主中生产的调控序列可操作地连接。
本发明的第四个方面涉及含有本发明核酸构建体的重组表达载体。
本发明的第五个方面涉及含有本发明核酸构建体的重组宿主细胞。
本发明的第六个方面涉及一种生产本发明多肽的方法,该方法包括:
(a)培养菌株来生产多肽,该菌株野生型能生产多肽;和
(b)回收多肽。
本发明的第七个方面涉及一种生产本发明多肽的方法,该方法包括:
(a)在适宜于生产多肽的条件下培养本发明的重组宿主细胞,和
(b)回收多肽。
本发明的第八个方面涉及一种原位生产本发明多肽的方法,该方法包括:
(a)在适宜于生产多肽的条件下培养本发明的重组宿主细胞,和
(b)没有前面多肽的回收,而是将多肽与一种所要的底物接触。
本发明涉及的其它方面可以从以下的说明书和附的权利要求书中明显得出。
在进一步详细地讨论本发明之前,首先对下列术语和发明作出定义。
大致纯的多肽:在本文中,术语“大致(substantially)纯的多肽”指一种多肽制品,其中含有与其天然结合的至多10%重量的其它多肽物质(低百分比的其它多肽物质是优选的,如至多8%的重量,如至多6%的重量,如至多5%的重量,如至多4%的重量,如至多3%的重量,如至多2%的重量,如至多1%的重量,如至多1/2%的重量)。因此,优选大致纯的多肽为92%纯,即所述多肽至少占制品中总的多肽物质重量的92%,和优选高百分比纯度如至少94%纯,至少95%纯,至少96%纯,至少97%纯,至少98%纯,至少99%纯,至少99.5%纯。这里公开的多肽优选为大致纯的形式,尤其优选“基本纯的形式”,如多肽制品实质上不含有与其天然结合的其它多肽物质。这些可以通过如采用已知的重组方法来制备完成。这里,术语“大致纯的多肽”与术语“分离的多肽”及“分离形式的多肽”同义。
纤维二糖水解酶I活性:这里定义的术语“纤维二糖水解酶I活性”指作为一种纤维素1,4-β-纤维二糖酶(也称为外-葡聚糖酶,外-纤维二糖水解酶或1,4-β-纤维二糖水解酶)所具有的活性,如在酶的类别EC3.2.1.91中所定义的,能够催化纤维素和纤维四糖中的1,4-β-糖苷键水解并从链的非还原末端释放出纤维二糖。
与本发明的目的相适应,纤维二糖水解酶I的活性可以通过实施例2中描述的方法确定。
在一个方案中,纤维二糖水解酶I的活性可以根据Deshpande MV等(Methods in Enzymology,pp.126-130,“Selective Assay for Exo-1,4-β-glucanases”,1998)描述的方法测定。根据该方法,一个单位的纤维二糖水解酶I活性(糖苷键剪切活性)定义为在50℃、PH5.0时每分钟产生1.0μmol的p-硝基酚。
本发明的多肽应优选具有至少20%的选自下组所示氨基酸序列组成多肽的纤维二糖水解酶I活性:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60和SEQ ID NO:66。在一个优选方案中,由一种选自下组所示的氨基酸序列组成的多肽必须具有至少40%,如至少50%,优选至少60%,如至少70%,更优选至少80%,如至少90%,最好优选至少95%,如约或至少100%的纤维二糖水解酶I活性,该组包括SEQ IDNO:2中1-526位氨基酸、SEQ ID NO:4中1-529位氨基酸、SEQ ID NO:6中1-451位氨基酸、SEQ ID NO:8中1-457位氨基酸、SEQ ID NO:10中1-538位氨基酸、SEQ ID NO:12中1-415位氨基酸、SEQ ID NO:14中1-447位氨基酸、SEQ ID NO:16中1-452位氨基酸、SEQ ID NO:38中1-454位氨基酸、SEQ ID NO:40中1-458位氨基酸、SEQ ID NO:42中1-450位氨基酸、SEQ IDNO:44中1-446位氨基酸、SEQ ID NO:46中1-527位氨基酸、SEQ ID NO:48中1-455位氨基酸、SEQ ID NO:50中1-464位氨基酸、SEQ ID NO:52中1-460位氨基酸、SEQ ID NO:54中1-450位氨基酸、SEQ ID NO:56中1-532位氨基酸、SEQ ID NO:58中1-460位氨基酸、SEQ ID NO:60中1-525位氨基酸和SEQ ID NO:66中1-456位氨基酸。
同一性:在本文中,两个氨基酸序列或两个核苷酸序列之间的同源性通过参数同一性来描述。
适合于本发明的目标,两个氨基酸序列之间的同一性通过使用FASTA程序包2.0x版中的FASTA软件(参见W.R.Pearson和D.J.Lipman,1998,“Improved tools for biological sequence analysis”,PANS85:2444-2448;和W.R.Pearson,1990,“Rapid and Senstive SequenceComparison with FASTP and FASTA”,methods in enzymology 183:63-98)确定。使用的评分矩阵是BIOSUM50,间隙罚分(gap penalty)为12,间隙扩大罚分(gap extension penalty)为2。
两个核苷酸之间的同一性程度通过使用运算法则和上述的软件包确定,使用的矩阵为同一性矩阵,间隙罚分为16,间隙罚分为4。
片段:当在这里使用时,序列选自下组所示序列:SEQ ID NO:2,SEQ IDNO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ IDNO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,该序列片段为该氨基酸序列的氨基和/或羧基末端缺失了一或多个氨基酸的多肽。片段优选为具有缺失了相应于SWISS-PROT受理号P00725中描述的Trichoderma reesei纤维二糖水解酶I的“纤维素结合域”和/或“连接结构域”的氨基酸序列。片段更优选含有相应于SWISS-PROT受理号P00725中描述的Trichoderma reesei纤维二糖水解酶I的“催化域”的氨基酸序列。片段最优选是含有至少434个氨基酸残基,如选自下组所示的氨基酸残基:SEQ ID NO:2的第1-434位氨基酸,SEQ ID NO:4的第1-434位氨基酸,SEQ ID NO:6的第1-434位氨基酸,SEQ ID NO:8的第1-434位氨基酸,SEQ ID NO:10的第1-434位氨基酸,SEQ ID NO:12的第1-434位氨基酸,SEQ ID NO:14的第1-434位氨基酸,SEQ ID NO:16的第1-434位氨基酸,SEQ ID NO:38的第1-434位氨基酸,SEQ ID NO:40的第1-434位氨基酸,SEQ ID NO:42的第1-434位氨基酸,SEQ ID NO:44的第1-434位氨基酸,SEQ ID NO:46的第1-434位氨基酸,SEQ ID NO:48的第1-434位氨基酸,SEQ ID NO:50的第1-434位氨基酸,SEQ ID NO:52的第1-434位氨基酸,SEQ ID NO:54的第1-434位氨基酸,SEQ ID NO:56的第1-434位氨基酸,SEQ ID NO:58的第1-434位氨基酸,SEQ ID NO:60的第1-434位氨基酸和SEQ ID NO:66的第1-434位氨基酸。尤其是片段含有至少215个氨基酸残基,如选自下组所示的氨基酸残基:SEQ ID NO:2的第200-434位氨基酸,SEQ ID NO:4的第200-434位氨基酸,SEQ ID NO:6的第200-434位氨基酸,SEQ ID NO:8的第200-434位氨基酸,SEQ ID NO:10的第200-434位氨基酸,SEQ ID NO:12的第200-434位氨基酸,SEQ IDNO:14的第200-434位氨基酸,SEQ ID NO:16的第200-434位氨基酸,SEQ ID NO:38的第200-434位氨基酸,SEQ ID NO:40的第200-434位氨基酸,SEQ ID NO:42的第200-434位氨基酸,SEQ ID NO:44的第200-434位氨基酸,SEQ ID NO:46的第200-434位氨基酸,SEQ ID NO:48的第200-434位氨基酸,SEQ ID NO:50的第200-434位氨基酸,SEQ ID NO:52的第200-434位氨基酸,SEQ ID NO:54的第200-434位氨基酸,SEQ IDNO:56的第200-434位氨基酸,SEQ ID NO:58的第200-434位氨基酸,SEQ ID NO:60的第200-434位氨基酸和SEQ ID NO:66的第200-434位氨基酸。
等位基因变异体:在本文中,术语“等位基因变异体”指位于相同染色体位点基因的两个或多个可选择形式中的任何一种。等位基因变异体是由于突变天然产生的,并且可以导致群体内的多态性。基因突变可以是沉默的(编码的多肽没有变化)或可以编码具有相异氨基酸序列的多肽。一种多肽的一个等位基因变异体是由基因的一个等位基因变异体编码的多肽。
大致纯的多核苷酸:这里使用的术语“大致纯的多核苷酸”指一种多核苷酸制品,其中该多核苷酸已经远离它的自然遗传环境,因而不含有其它外源或不想要的编码序列,并以适于在遗传工程蛋白质生产体系中使用的形式存在。因此,一种大致纯的多核苷酸含有至多10%重量的其它与之天然关联的多核苷酸物质(低百分比的其它多核苷酸物质是优选的,如占至多8%的重量,6%的重量,5%的重量,4%的重量,3%的重量,2%的重量,1%的重量和1/2%的重量)。然而,一种大致纯的多核苷酸也可以含有天然存在的5′和3′非翻译区域,如作为启动子和终止子。优选大致纯的多核苷酸纯度至少为92%,如多核苷酸至少占制品中总的多核苷酸物质重量的92%,较高百分数优选如至少94%纯,至少95%纯,至少96%纯,至少97%纯,至少98%纯,至少99%纯,至少99.5%纯。这里公开的多核苷酸优选是一种大致纯的形式,特别优选这里公开的多核苷酸是一种基本纯的形式,如多核苷酸基本上不含有其它与之天然关联的多核苷酸物质。这里,术语“大致纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”同义。
修饰:本发明文中的术语“修饰”意指对选自下组所示的氨基酸序列的多肽进行任何一种化学修饰:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,以及对编码该多肽的DNA进行基因操作。修饰可以是氨基酸侧链的取代,在感兴趣的氨基酸上进行的替换、缺失和/或插入。
人工变异体:当在这里使用时,术语“人工变异体”指具有纤维二糖水解酶I活性的多肽,该多肽可通过微生物表达一种相应于下列序列修饰过的基因而生产:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59或SEQ ID NO:65。编码在适宜宿主中表达产生的所述变异体的修饰过的基因,可以通过修饰选自下组所示的多核苷酸序列进行人为干预获得:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ IDNO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59或SEQ ID NO:65。
cDNA:在本文中使用的术语“cDNA”包括通过从来源于真核细胞的天然的、成熟的、剪切过的mRNA分子反转录制备出的DNA分子。cDNA缺少了通常存在于相应基因组DNA中的内含子序列。初始的基本的RNA转录本是mRNA的前体,在成为成熟的剪切过的mRNA前它需经历一系列的加工事件,包括通过所谓的剪切过程剪切掉内含子序列。所以当cDNA来源于mRNA时,它就缺少了内含子序列。
核酸构建体:当在这里使用时,核酸构建体指一种核酸分子,不管是单链还是双链的,它是从天然存在的基因中分离出的或是已经被修饰过的,其中含有的核酸片段是不可能天然存在的。当核酸构建体含有表达本发明编码序列必需的调控序列时,术语核酸构建体与术语“表达框”同义。
调控序列:这里定义的术语“调控序列”包括了所有必需的或利于本发明多肽表达的组件。每一调控序列对于编码多肽的核酸序列可以是天然的或是外源的。这种调控序列包括但不局限于前导序列、多聚腺苷酸序列、前肽序列、启动子、信号肽序列和转录终止子。调控序列最低程度应包括一个启动子、转录和转录终止信号。为了引入能促进调控序列与编码多肽核苷酸序列的编码区连接的特异的限制性位点,可以在调控序列中加入接头。
可操作的连接:这里定义的“可操作的连接”作为一种构造,其中调控序列被适当地置于与DNA序列中编码序列相关联的位置,从而该调控序列能指导多肽的表达。
编码序列:当在这里使用时,术语“编码序列”包括直接特异于蛋白产物氨基酸序列的核酸序列。编码序列的界限通常由一个普遍起始于ATG启始密码子的开放式阅读框来确定。典型的编码序列包括DNA、cDNA和重组核苷酸序列。
表达:本文中的术语“表达”包括生产多肽中的任一步骤,包括但不局限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:本文中的术语“表达载体”包括线性或环状的DNA分子,该DNA分子含有可操作地与其它用于其转录的片段相连的编码本发明多肽的片段。
宿主细胞:这里使用的术语“宿主细胞”包括可耐受核酸构建体转化的任一细胞类型。
术语“多核苷酸探针”、“杂交”和各种严谨条件在题为“具有纤维二糖水解酶I活性的多肽”的章节中定义了。
热稳定性:这里使用的术语“热稳定性”按照实施例2中描述的方法测定。
发明详述
具有纤维二糖水解酶I活性的多肽
在第一个方案中,本发明涉及具有纤维二糖水解酶I活性的多肽,该多肽优选含有与选自下组所示的氨基酸序列有一定同一性的氨基酸序列:SEQID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,其中同一性为至少65%(如成熟的多肽),优选至少70%,如至少75%,更优选至少80%,如至少85%,甚至更优选90%,最优选至少95%,如至少96%,至少97%,和甚至最优选至少98%,如至少99%(其后的“同源多肽”)。在一个优选的方案中,氨基酸序列为与选自下组的氨基酸序列至多有10个氨基酸的差别(如10个氨基酸)的序列,其中特别是至多5个氨基酸的差别(如5个氨基酸),例如至多4个氨基酸的差别(如4个氨基酸),如至多3个氨基酸的差别(如3个氨基酸),该组包括SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。在一个最优选的方案中,氨基酸序列的差别至多为两个氨基酸(如两个氨基酸),例如选自下组所示的氨基酸序列中发生了一个氨基酸的改变:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。
优选地,本发明的多肽包括选自下组所示的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66;其中的等位基因变异体;或是其中具有纤维二糖水解酶I活性的片段。在另一个优选的方案中,本发明的多肽包括选自下组所示的氨基酸序列:SEQID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。
本发明的多肽可以是鉴定的野生型纤维二糖水解酶I,是天然来源分离的。这种野生型纤维二糖水解酶I可通过本领域已知标准技术特异地筛选出,如在实施例1中描述的分子筛选方法。而且,本发明的多肽可以通过DNA改组(shuffling)技术制备,如J.E.Ness等(Nature biotechnology,1999,17,893-896)所描述的。另外,本发明的多肽可以是一种人工变异体,其中包括在相应于选自下组所示的氨基酸序列中含有至少一个氨基酸发生替代、缺失和/或插入的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。这样的人工变体可通过本领域已知技术构建,如多肽的定点/随机诱变,所述多肽包含选自下组的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。在本发明的另一个方案中,氨基酸的变化(人工变异体和野生型多肽)是一种次要的状态,即可以是一种保守的氨基酸取代,故不会显著地影响折叠和/或蛋白的活性;少量的缺失,典型的有1至约30个氨基酸;少量的氨基或羧基端延伸,如氨基末端的甲硫氨酸残基;至多约20-25个残基的少量的连接肽;或通过改变净电荷或其它功能促进纯化的少量延伸,例如一种聚组氨酸区(tract)、抗原表位或结合域。
保守取代的例子在下组所述的氨基酸范围内,包括碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、中性氨基酸(谷氨酸和天冬酰胺酸)、疏水氨基酸(亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸),和小氨基酸(氨基乙酸、丙氨酸、丝氨酸和苏氨酸)。通常不改变特定活性的氨基酸取代是已知的并已经在现有技术中公开,如参见H.Neurath和R.L.Hill等的文献(1997,Theproteins,Academic Press,纽约)。最常进行的交换有Ala/Ser,Val/lle,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly,或是它们的反向交换。
在感兴趣的本发明的一个方案中,氨基酸的变化能改变多肽的物理化学特性,例如通过氨基酸的改变改善多肽的热稳定性,改变底物的特异性,或是改变最适PH值与其它。
这种取代、缺失和/或插入优选的氨基酸残基的数目与选自下组的氨基酸序列相比至多为10个,例如至多9个,如至多8个,更优选至多7个,如至多6个,例如至多5个,最优选至多4个,如至多3个,例如至多2个,尤其是至多1个,该组氨基酸有SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。
发明人已经分离出了编码具有纤维二糖水解酶I活性的多肽的核苷酸序列,这些酶来自于选自下组所述的微生物:嗜热支顶孢、嗜热毛壳霉、小柱孢菌属、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉;和来自白蚁幼虫内脏的栗色新螱。因此,在一个次要的方案中,本发明涉及含有同源氨基酸序列的多肽,该氨基酸序列与由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少65%同一性,其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。在本发明一个感兴趣的方案中,多肽含有的氨基酸序列与存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的同一性为至少70%的,如至少75%,优选至少80%,例如至少85%,更优选至少90%,最优选至少95%,如至少96%,例如97%,甚至最优选至少98%,例如99%,其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉,其后称它们为“同源多肽”。在一个感兴趣的方案中,氨基酸序列相应于由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的差别至多为10个氨基酸(如10个氨基酸),优选至多5个氨基酸的差别(如5个氨基酸),例如至多4个氨基酸的差别(如4个氨基酸),如至多3个氨基酸的差别(如3个氨基酸),其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinum foecundissimum CBS 427.97、棉色二孢CBS247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilusgiganteus CBS 521.95、黑耳CBS 2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。在一个特别优选的方案中,氨基酸序列相应于由存在于选自下组的微生物中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的差别至多为2个氨基酸(如2个氨基酸),例如仅有1个氨基酸的差别,其中所述微生物为嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢IFO 5372、产黑色腐质霉CBS 819.73、Cladorrhinumfoecundissimum CBS 427.97、棉色二孢CBS 247.96、嗜热毁丝霉CBS117.65、微小根毛霉CBS109471、Meripilus giganteus CBS 521.95、黑耳CBS2377.96、块团炭角菌CBS 284.96、长毛盘菌CBS 804.70、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichumpruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌和蔓延疫霉。
优选地,本发明的多肽含有存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCCNO.0748,CGMCC NO.0749,CGMCC NO.0750。在另一个优选方案中,本发明的多肽由存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列组成,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCCNO.0749,CGMCC NO.0750。
在与上面所述相似的一个方案中,本发明的多肽可以是一种人工变异体,与存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列相比,该变异体包括优选由具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列组成,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCCNO.0749,CGMCC NO.0750。
在第三个方案中,本发明涉及由在极低严谨条件下杂交的核苷酸序列编码的具有纤维二糖水解酶I活性的多肽,优选在低严谨条件、更优选中等严谨条件、更优选中等偏上的严谨条件、甚至更优选高严谨条件和更优选极高严谨条件下与核苷酸探针进行杂交,其中探针选自下组所述的核苷酸序列:
(i)选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中1-1578位核苷酸,
SEQ ID NO:3中1-1587位核苷酸,
SEQ ID NO:5中1-1353位核苷酸,
SEQ ID NO:7中1-1371位核苷酸,
SEQ ID NO:9中1-1614位核苷酸,
SEQ ID NO:11中1-1245位核苷酸,
SEQ ID NO:13中1-1341位核苷酸,
SEQ ID NO:15中1-1356位核苷酸,
SEQ ID NO:37中1-1365位核苷酸,
SEQ ID NO:39中1-1377位核苷酸,
SEQ ID NO:41中1-1353位核苷酸,
SEQ ID NO:43中1-1341位核苷酸,
SEQ ID NO:45中1-1584位核苷酸,
SEQ ID NO:47中1-1368位核苷酸,
SEQ ID NO:49中1-1395位核苷酸,
SEQ ID NO:51中1-1383位核苷酸,
SEQ ID NO:53中1-1353位核苷酸,
SEQ ID NO:55中1-1599位核苷酸,
SEQ ID NO:57中1-1383位核苷酸,
SEQ ID NO:59中1-1578位核苷酸,和
SEQ ID NO:65中1-1371位核苷酸;
(ii)选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中1-500位核苷酸,
SEQ ID NO:3中1-500位核苷酸,
SEQ ID NO:5中1-500位核苷酸,
SEQ ID NO:7中1-500位核苷酸,
SEQ ID NO:9中1-500位核苷酸,
SEQ ID NO:11中1-500位核苷酸,
SEQ ID NO:13中1-500位核苷酸,
SEQ ID NO:15中1-500位核苷酸,
SEQ ID NO:37中1-500位核苷酸,
SEQ ID NO:39中1-500位核苷酸,
SEQ ID NO:41中1-500位核苷酸,
SEQ ID NO:43中1-500位核苷酸,
SEQ ID NO:45中1-500位核苷酸,
SEQ ID NO:47中1-500位核苷酸,
SEQ ID NO:49中1-500位核苷酸,
SEQ ID NO:51中1-500位核苷酸,
SEQ ID NO:53中1-500位核苷酸,
SEQ ID NO:55中1-500位核苷酸,
SEQ ID NO:57中1-500位核苷酸,
SEQ ID NO:59中1-500位核苷酸,
SEQ ID NO:65中1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,和
(iii)选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,和
SEQ ID NO:65中第1-200位核苷酸
(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,分子克隆实验室手册,第二版,冷泉巷,纽约)。
在另一个方案中,本发明涉及由存在于下组所述的微生物中的纤维二糖水解酶I编码部分核苷酸序列编码的具有纤维二糖水解酶I活性的多肽:
一种微生物,该微生物属于接合菌门(zygomycota),优选属于毛霉菌属(Mucorales),更优选属于毛霉菌科(Mucoraceae),最优选属于根毛霉属(Rhizomucor),如微小根毛霉(Rhizomucor pusillus),或是笄霉科(choanephoraceae),最优选属于poitrasia属,如poitrasia circinans。
一种微生物,该微生物属于卵菌纲(Oomycetes),优选腐霉目(Pythiales),更优选腐霉科(Pythiaceae),最优选疫霉属(Phytophthora),如蔓延疫霉(Phytophthora infestans)。
一种微生物,该微生物属于Auriculariales,担子菌目(Basidiomycota),层菌纲(Hymenomycetes),更优选属于Exidiaceae科,最优选属于Exidia属(如黑耳(Exidia glandulosa))。
一种微生物,该微生物属于Xylariales,(子囊菌门(Ascomycota),Sordariomycetes目),更优选属于炭角菌科(Xylariaceae),最优选属于炭角菌属(Xylaria),如块团炭角菌(Xylaria hypoxylon)。
一种微生物,该微生物属于Dothideales,子囊菌门,Dothideomycetes目,更优选属于Dothideaceae科,最优选属于色二孢属(Diplodia),如棉色二孢(Diplodia gossypina)。
一种微生物,该微生物属于盘菌目(Pezizales,子囊菌门),优选属于Pyronemataceae科,更优选属于长毛盘菌属(Trichophaea),如囊状长毛盘菌(Trichophaea saccata);或是Sarcosomataceae科,更优选属于假黑盘菌属(Pseudoplectania),如淡黑假黑盘菌(Pseudoplectanianigrella)。
一种微生物,该微生物属于Rigidiporaceae科(在担子菌门,Hymenomycetes,Hymenomycetales之下),更优选属于Meripilus属,如Meripilus giganteus。
一种微生物,该微生物属于皱孔菌科(Meruliaceae,在担子菌门,Hymenomycetes,Sterealesales之下),更优选属于孢子丝菌属(Sporothrichum),如孢子丝菌。
一种微生物,该微生物属于蘑菇科(Agaricaceae,在担子菌门,Hymenomycetes,伞菌目之下),更优选属于鬼伞属,如灰色鬼伞(Coprinuscinereus)。
一种微生物,该微生物属于肉座菌科(Hypocreceae,在子囊菌门,Sordariomycetes,肉座菌目之下),更优选属于支顶孢属(Acremonium,如嗜热支顶孢(Acremonium thermophilum),支顶孢;或有有丝分裂孢子的轮枝孢属(Verticillium),如幼嫩轮枝孢(Verticillium tenerum)。
一种微生物,该微生物属Cladorrhinum属(在子囊菌门,Sordariomycetes,Sordariales,Sordariaceae之下),如Cladorrhinumfoecundissimum。
一种微生物,该微生物属于毁丝霉属(在子囊菌门,Sordariomycetes,Sordariales,Sordariaceae之下),如嗜热毁丝霉(Myceliophthorathermophila)或肉桂色毁丝霉(Myceliophthora hinnulae)。
一种微生物,该微生物属于毛壳霉属(在子囊菌门,Sordariomycetes,Sordariales,Chaetomiaceae之下),如嗜热毛壳霉(Chaetomiumthermophilum)。
一种微生物,该微生物属于Chaetomidium属(在子囊菌门,Sordariomycetes,Sordariales,Chaetomiaceae之下),如Chaetomidiumpingtungium。
一种微生物,该微生物属于草根霉属(在子囊菌门,Sordariomycetes,Sordariales,Chaetomiaceae之下),如Thielavia australiensis或有孢子囊的草根霉(Thielavia microspora)。
一种微生物,该微生物属于热子囊菌属(在子囊菌门,之下),如橙黄色热子囊菌(Thermoascus aurantiacus)。
一种微生物,该微生物属于单瑞孢属(有丝分裂孢子的子囊菌门),如玫瑰单瑞孢(Trichothecium roseum),和
一种属于产黑色腐质霉种(Humicola nigrescens)的微生物。
一种选自下组所示序列的核苷酸序列或其亚序列:SEQ ID NO:1,SEQ IDNO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ IDNO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:65,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ IDNO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ IDNO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:61,SEQ ID NO:62,SEQ IDNO:63,SEQ ID NO:64和SEQ ID NO:67,以及是一种选自下组所示的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,或是其片段,它们可以用于设计多核苷酸探针来鉴别和克隆出编码具有纤维二糖水解酶I活性的多肽的DNA,可以根据本领域公知的技术从不同的属或种的菌株中获得该DNA。这种探针尤其可用于与感兴趣的属或种的基因组或cDNA杂交,随后进行标准的DNA印迹过程,从而鉴别和分离出其中相应的基因。这种探针可以比全序列短,但必须至少有15个核苷酸,优选至少25个,更优选至少35个核苷酸的长度,例如长度为至少70个核苷酸。然而优选核苷酸探针长至少为100个核苷酸。例如,多核苷酸探针可以为至少200个核苷酸长度,至少300个核苷酸长度,至少400个核苷酸长度或至少为500个核苷酸长度。甚至可以使用更长的探针,如多核苷酸探针的长度至少为600个核苷酸,至少为700个核苷酸,至少为800个核苷酸,或至少为900个核苷酸。DNA和RNA探针都可以使用,探针通常被标记后用来检测相应的基因(例如,用32P,3H,35S,生物素或抗生物素蛋白来标记)。
因此,通过建立其它微生物的DNA和cDNA文库,从中可以筛选出与上述探针杂交的DNA,该DNA编码具有纤维二糖水解酶I活性的多肽。来自于这些其它微生物的基因组或其它DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳分离,或是采用其它的分离技术。来自于文库的DNA或分离的DNA可以被转移或固定在硝化纤维或其它适合的载体物质上。为了鉴别出克隆或与SEQ ID NO:1同源的DNA,含有固定DNA的载体物质用于DNA印迹中。
为了达到本发明的目的,杂交显示了与标记的多核苷酸探针杂交的核苷酸序列,其中探针与SEQ ID NO:1所示序列能在极低至极高严谨条件下杂交。在这些条件下由多核苷酸探针杂交上的分子可以通过X光片或任何其它本领域已知技术测定。无论何时在本文中使用的术语“多核苷酸探针”都可以被理解成含有至少15个核苷酸的探针。
在一个感兴趣的方案中,多核苷酸探针是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:1中第1-1302位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:3中第1-1302位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:5中第1-1302位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:7中第1-1302位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:9中第1-1302位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:13中第1-1302位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:15中第1-1302位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:37中第1-1302位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:39中第1-1302位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:41中第1-1302位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:43中第1-1302位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:45中第1-1302位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:47中第1-1302位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:49中第1-1302位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:51中第1-1302位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:53中第1-1302位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:55中第1-1302位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:57中第1-1302位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:59中第1-1302位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,和
SEQ ID NO:65中第1-1302位核苷酸,
或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51中第1-500位核苷酸,
SEQ ID NO:53中第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,和
或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,
SEQ ID NO:65中第1-200位核苷酸,
SEQ ID NO:22中第1-200位核苷酸,
SEQ ID NO:23中第1-200位核苷酸,
SEQ ID NO:24中第1-200位核苷酸,
SEQ ID NO:25中第1-200位核苷酸,
SEQ ID NO:26中第1-200位核苷酸,
SEQ ID NO:27中第1-200位核苷酸,
SEQ ID NO:28中第1-200位核苷酸,
SEQ ID NO:29中第1-200位核苷酸,
SEQ ID NO:30中第1-200位核苷酸,
SEQ ID NO:31中第1-200位核苷酸,
SEQ ID NO:32中第1-200位核苷酸,
SEQ ID NO:33中第1-200位核苷酸,
SEQ ID NO:34中第1-200位核苷酸,
SEQ ID NO:35中第1-200位核苷酸,
SEQ ID NO:61中第1-200位核苷酸,
SEQ ID NO:62中第1-200位核苷酸,
SEQ ID NO:63中第1-200位核苷酸,
SEQ ID NO:64中第1-200位核苷酸,和
SEQ ID NO:67中第1-200位核苷酸。
在另一个感兴趣的方案中,多核苷酸探针是编码选自下组所示多肽的核苷酸序列的互补链:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60和SEQ ID NO:66。在更优选的方案中,多核苷酸探针是选自下组所示核苷酸序列的互补链:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59或SEQ ID NO:65。在另一个优选的方案中,多核苷酸探针是包含在质粒中的核苷酸序列的互补链,其中质粒存在于选自于下组的保藏微生物中:CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCCNO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。
对于至少100个核苷酸长度的探针来说,极低至极高的严谨条件定义为在42℃、5×SSPE、1.0% SDS、5×分子杂交封闭剂(Denhardt’ssolution)、100μg/ml剪切和变性鲑精DNA条件下预杂交和杂交,随后进入标准的DNA印迹程序。优选地,至少100个核苷酸的长探针不含有1000个以上的核苷酸。对于至少100个核苷酸长度的探针,最后在42℃用2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(极低严谨条件);优选在42℃使用0.5×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(低严谨条件);更优选在42℃使用0.2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(中等严谨条件);甚至更优选在55℃使用0.2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(中等偏上严谨条件);最优选在60℃使用0.2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(高严谨条件);尤其是在68℃使用0.2×SSC、0.1% SDS洗涤载体材料三次,每次15分钟(极高严谨条件)。
虽然没有被特别地选定,但也预期了可以使用短的探针,如约15至99个核苷酸长度的探针,例如从约15至约70个核苷酸长度的探针。对于这种短的探针来说,严谨条件定义为在低于Tm值下5-10℃时进行预杂交、杂交和杂交后洗涤,Tm值根据Bolton和McCaethy所述方法计算(1962,Proceedings of the National Academy of Sciences USA 48:1390),其中每毫升杂交液含有0.9M NaCl,0.09M PH7.6 Tris-HCl,6mM EDYA,0.5%NP-40,1×分子杂交封闭剂,1mM焦磷酸盐,1mM磷酸单碱钠,0.1mM ATP,和0.2mg酵母RNA条件下预杂交和杂交,随后进入标准的DNA印迹程序。
对于约15至99个核苷酸长度的短探针来说,第一次在6×SSC加上0.1%SDS中洗涤载体材料15分钟,在低于计算的Tm值5-10℃时使用6×SSC再洗涤两次,每次15分钟。
具有纤维二糖水解酶I活性的多肽的来源
本发明的多肽可以从任何一种微生物获得。适应于本发明目的,这里使用的“获自”指由核苷酸编码的多肽由细胞生产,该核苷酸序列天然存在于或该核苷酸序列已经被插入细胞中。在一个优选的方案中,多肽被分泌到细胞外。
本发明的多肽可以是一种细菌多肽。例如,多肽可以是一种革兰氏阳性菌,例如是一种芽孢杆菌多肽,如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂类芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽;或一种链霉菌多肽,如变青链霉菌或鼠灰链霉菌多肽;或是一种革兰氏阴性菌,如大肠杆菌或一种假单孢菌多肽。
本发明的多肽可以是一种真菌多肽,和更优选一种酵母多肽,例如假丝酵母属、克鲁维氏酵母属、Neocallimastix、毕赤氏酵母属、Piromyces、糖酵母属、裂殖糖酵母属或Yarrowia多肽;或更优选一种细丝状真菌多肽如支顶孢属、曲霉属、短柄酶属Cryptococcus、Filibasidium、镰孢属、腐质霉属、Magnaporthe、毛霉属、毁丝霉属、链孢霉属、拟青霉属、青霉属、裂褶菌属、踝节菌属、热子囊菌属、草根霉属、Tolypocladium或木霉属多肽。
在一个感兴趣的方案中,多肽是一种卡尔斯伯糖酵母、啤酒糖酵母、糖化糖酵母、Saccaromyces douglasii、Saccaromyces kluyveri、Saccaromyces norbensis或卵形糖酵母多肽。
在另一个感兴趣的方案中,多肽是一种棘孢曲霉、泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑色曲霉、米曲霉、杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、玫瑰色镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、Fusarium torulosum、Fusariumtrichothecioides、Fusarium venenatum、Humicola insolens、Humicolalanuginosa、米赫毛霉、嗜热毁丝霉、粗糙链孢霉、产紫青霉、Trichodermaharzianum、康宁氏木霉、Trichoderma longibrachiatum、Trichodermareesei或绿色木霉多肽。
在一个优选的方案中,多肽是一种嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、曲霉、帚霉、镰孢、轮枝孢、淡黑假黑盘菌或蔓延疫霉多肽。
在一个更优选的方案中,多肽是一种嗜热支顶孢、嗜热毛壳霉、小柱孢菌、嗜热小柱孢菌、橙黄色热子囊菌、Thielavia australiensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、Poitrasia circinans或Coprinus cinereus多肽。如该多肽由选自所示的氨基酸序列组成:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60和SEQ ID NO:66。
可以理解上述微生物包括了完全和不完全的形态,和其它分类学等价物,如变异体,而不管它们已知的品种名称。本领域的技术人员将容易地识别和鉴别适合的等价物。
公众可以从一些保藏单位容易获得这些菌株,例如美国典型培养物保藏中心(ATCC),德意志微生物保藏中心(DSMZ),中国普通微生物保藏中心(CGMCC),荷兰真菌菌种保藏中心(CBS),美国农业机构保藏中心(NRRL)。
而且,通过前述探针可以从自然界(如土壤、水、植物、动物等)中分离出的微生物等其它来源鉴别出和获得这种多肽。从自然环境中分离微生物的技术是本领域公知的。然后可以通过对其它微生物的基因组或cDNA文库进行相似筛选得到核苷酸序列。一旦编码多肽的核苷酸序列被探针检测出来,使用本领域普通技术人员已知的技术可以将该序列分离或克隆(参见Sambrook等,1989,supra)。
由本发明核苷酸序列编码的多肽还包括融合多肽或可剪切多肽,其中其它的多肽在该多肽或其片段的N-末端或C-末端融合。融合多肽可以通过一种编码其它多肽的核苷酸序列(或其部分)与本发明的核苷酸序列(或其部分)融合产生。融合多肽的生产技术是本领域公知的,并且包括了连接编码多肽的编码序列,这样它们处于表达框中并且融合多肽的表达处于相同启动子和终止子的调控之下。
多核苷酸和核苷酸序列
本发明还涉及含有编码本发明多肽的核苷酸序列的多核苷酸,本发明尤其涉及由编码本发明多肽的核苷酸序列组成的多核苷酸。在一个优选的方案中,核苷酸序列选自下组所示的序列:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65。在一个更优选的方案中,核苷酸序列为成熟多肽编码区,它包含在质粒中,所述质例包含在选自下组的保藏微生物中:CGMCC NO.0584,CGMCC NO.0581,CGMCCNO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCCNO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。本发明还包括一种多核苷酸,它含有、优选具有编码与选自下组的一种氨基酸序列一致的多肽的核苷酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66,该核苷酸序列的遗传密码与选自下组的核苷酸序列的简并性不同:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ IDNO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ IDNO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65。
本发明还涉及含有,优选由下列组成,选自下组的核苷酸序列的亚序列的多核苷酸:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,和SEQ ID NO:65,该核苷酸序列编码一种选自下组的氨基酸序列的片段,该片段具有纤维二糖水解酶I的活性:SEQ ID NO:2,SEQ IDNO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ IDNO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。一种选自下组的核苷酸序列的亚序列:SEQ ID NO:1,SEQ ID NO:3,SEQ IDNO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ IDNO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65,该核苷酸序列包含在选自下组的核苷酸序列中,除了5’和/或3’端缺失了一个或多个核苷酸以外:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65,
本发明还涉及具有选自下组的,优选由其组成,成熟多肽编码序列中含有至少一种修饰的核苷酸序列的多核苷酸:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:65,而且其中修饰的核苷酸序列编码一种具有选自下组氨基酸序列的多肽:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。
分离或克隆编码一种多肽的核苷酸序列的方法是本领域已知的,并且包括了从基因组DNA中的分离技术、来自cDNA的制备方法或它们的组合。从这种基因组DNA中克隆出本发明的核苷酸序列是可以实现的,如使用公知的聚合酶链反应(PCR)或利用共同的结构特征经抗体筛选表达文库来检测克隆的DNA片段(参见如Innis等,1990,PCR:A Guide to Methods andApplication,Academic Press,New York)。其它扩增程序例如连接酶链反应(LCR)、连接激活转录(LAT)和基于核苷酸序列的扩增(NASBA)可以被使用。核苷酸序列可以从一种选自下组的菌株中克隆:支顶孢、小柱孢菌、热子囊菌、草根霉、轮枝孢、新螱、白丝菌、poitrasia、鬼伞、单瑞孢、产腐质霉、Cladorrhinum、二孢、毁丝霉、根毛霉、Meripilus、黑耳、炭角菌、盘菌、毛壳霉、Chaetomidium、毁丝霉、Sporotrichum、草根霉、曲霉、帚霉、镰孢、假黑盘菌和疫霉,或其它相关的微生物,这样,该序列可以是如多肽编码区核苷酸序列的一种等位基因或变异体。
在遗传工程中使用标准的克隆技术可以获得核苷酸序列,将它从天然位点重新定位到它将被复制的不同位点。克隆方法可以包括对感兴趣的含有编码多肽的核苷酸序列的片段进行切除和分离,将片段插入载体分子中和将重组载体转化进宿主细胞,宿主细胞中的核苷酸序列的多拷贝或克隆将被复制。核苷酸序列可以是基因组、cDNA、RNA、半合成、合成来源或它们的组合。
本发明还涉及包含,优选具有与选自下组的核苷酸序列具有一定同一性的核苷酸序列的多核苷酸:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51中第1-500位核苷酸,
SEQ ID NO:53中第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸
其中同一性为至少70%,例如至少75%;优选序列具有至少80%的同一性,如85%的同一性,例如至少90%的同一性,更优选至少95%的同一性,例如至少96%的同一性,如至少97%的同一性,甚至更优选至少98%的同一性,例如99%。优选核苷酸序列编码具有纤维二糖水解酶I活性的多肽。两种核苷酸序列之间的同一性可根据前述方法确定(参见题为“定义”的章节)。
在感兴趣的另一个方面,本发明涉及包含,优选具有,与存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少65%同一性的核苷酸序列的多核苷酸:CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。在另一个优选的方案中,核苷酸序列与存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列的同一性至少为70%:CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCCNO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750,例如至少75%;优选序列具有至少80%的同一性,如85%的同一性,例如至少90%的同一性,更优选至少95%的同一性,例如至少96%的同一性,如至少97%的同一性,甚至更优选至少98%的同一性,例如99%。优选核苷酸序列含有存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列:CGMCC NO.0584,CGMCCNO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。在一个更优选的方案中,核苷酸序列具有存在于选自下组的保藏微生物中的被插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列:CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,DSM 15064,DSM 15065,DSM 15066,DSM 15067,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750。
编码本发明多肽的核苷酸序列的修饰对于多肽的合成可以是必需的,其中包括相应于选自下组的氨基酸序列具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ IDNO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:66。根据某些工程方法,这些人工变异体不同于从天然来源分离的多肽,如它们之间的区别在于特定的活性、热稳定性、最适PH值等。
对于本领域的技术人员来说,很显然这些修饰可以在与分子功能密切相关的区域以外进行,从而获得具有活性的多肽。对于由本发明核苷酸序列编码的多肽的活性所必需的氨基酸残基自然是优选不被进行取代等修饰的,可以根据本领域公知的技术如位点直接突变或丙氨酸筛选突变等方法确定这些残基(参见如Cunningham和Wells,1989,Science244:1081-1085)。在后一种方法中,对分子中的每一个正电荷残基进行突变,然后通过对生成的突变分子进行纤维二糖水解酶I活性检测,从而鉴定出发生突变的氨基酸残基对于分子活性是否必需。还可以通过分析由核磁共振、晶体衍射技术或光亲和标记等技术测定的三维结构来确定底物-酶互作位点(参见如Vos等,1992,Science 255:306-312;Smith等,1992,Journal of moleucar biology 224:899-904;Wlodaver等,1992,FEBSLetters 309:59-64)。
而且,编码本发明多肽的核苷酸序列可以经引入一个核苷酸替代进行修饰,该修饰不会导致生成另一种由核苷酸序列编码多肽的氨基酸序列,但是需与宿主微生物生产酶时使用密码子的习惯相一致。
可以通过使用本领域已知的任何方法进行位点定向诱变,从而在核苷酸序列中引入突变,使一个核苷酸变成另一个核苷酸。在这些方法中,尤其实用的方法是使用一种超螺旋双链DNA载体,将感兴趣的基因和所需突变的两条合成引物插入该载体中,其中每条寡核苷酸引物与载体的相反链互补并且能在温度循环中依靠Pfu DNA聚合酶进行延伸。在引物结合上之后生成了含有交错缺口的突变质粒。温度循环后,用特异于甲基化和半甲基化DNA的Dpnl处理产物,消化亲代DNA模板并挑选出含有突变的合成DNA。本领域已知的其它方法也可以使用。对于核苷酸替代的综合描述参见如Ford等的文献(1991,Protein Expression and Purification 2:95-107)。
本发明还涉及包含,优选具有,一种编码具有纤维二糖水解酶I活性的多肽的核苷酸序列,并且该核苷酸序列在极低严谨条件、优选低严谨条件、更优选中等严谨条件、更优选中等偏上严谨条件、甚至更优选高严谨条件和最优选极高严谨条件下与选自下组所述的核苷酸探针杂交:
(i)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:1中第1-1302位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:3中第1-1302位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:5中第1-1302位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:7中第1-1302位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:9中第1-1302位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:13中第1-1302位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:15中第1-1302位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:37中第1-1302位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:39中第1-1302位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:41中第1-1302位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:43中第1-1302位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:45中第1-1302位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:47中第1-1302位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:49中第1-1302位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:51中第1-1302位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:53中第1-1302位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:55中第1-1302位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:57中第1-1302位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:59中第1-1302位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,和
SEQ ID NO:65中第1-1302位核苷酸,
(ii)或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51中第1-500位核苷酸,
SEQ ID NO:53中第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,
(iii)或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,
SEQ ID NO:65中第1-200位核苷酸,
SEQ ID NO:22中第1-200位核苷酸,
SEQ ID NO:23中第1-200位核苷酸,
SEQ ID NO:24中第1-200位核苷酸,
SEQ ID NO:25中第1-200位核苷酸,
SEQ ID NO:26中第1-200位核苷酸,
SEQ ID NO:27中第1-200位核苷酸,
SEQ ID NO:28中第1-200位核苷酸,
SEQ ID NO:29中第1-200位核苷酸,
SEQ ID NO:30中第1-200位核苷酸,
SEQ ID NO:31中第1-200位核苷酸,
SEQ ID NO:32中第1-200位核苷酸,
SEQ ID NO:33中第1-200位核苷酸,
SEQ ID NO:34中第1-200位核苷酸,
SEQ ID NO:35中第1-200位核苷酸,
SEQ ID NO:61中第1-200位核苷酸,
SEQ ID NO:62中第1-200位核苷酸,
SEQ ID NO:63中第1-200位核苷酸,
SEQ ID NO:64中第1-200位核苷酸,和
SEQ ID NO:67中第1-200位核苷酸。
可以理解,有关核苷酸序列杂交的细节和特例与在名为“具有纤维二糖水解酶I活性的多肽”的章节中讨论的相同或类似。
核苷酸构建体
本发明还涉及一种核苷酸构建体,其中本发明的核苷酸序列可操作地与一个或多个调控序列相连,这些调控序列能在适合的宿主细胞内在调控序列适应的条件下指导编码序列的表达。
编码本发明多肽的核苷酸序列可以经各种操作处理后用于多肽的表达。在核苷酸序列插入载体之前可以对它们进行处理或这种处理是必须的,这取决于表达载体本身。通过重组DNA技术修饰核苷酸序列的方法是本领域公知的。
调控序列可以是一种适合的启动子序列,该序列可以被表达核苷酸序列的宿主细胞识别。启动子序列含有介导多肽表达的转录调控序列。启动子可以是任何一种在所选宿主细胞中具有转录活性的核苷酸序列,包括发生突变的、截短的和杂合的启动子,并且可以获自那些对于宿主细胞同源或异源的编码胞外或胞内多肽的基因。
特异于大肠杆菌的用于指导本发明核苷酸构建体转录的适合的启动子有:获自大肠杆菌lac操纵子的启动子,天蓝色链霉菌乳糖基因(dagA),模式种果聚糖蔗糖酶基因(SacB),地衣芽孢杆菌α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌麦芽糖淀粉酶(amyM),解淀粉芽孢杆菌α-淀粉酶基因(amyQ),地衣芽孢杆菌青霉素酶基因(penP),模式种xylA和xylB基因,和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceeding of thenational academy of sciences USA 75:3727-3731),以及tac启动子(DeBoer等,1983,Proceeding of the national academy of sciences USA80:21-25)。更多的有关启动子的描述参见“Useful proteins fromrecombinant bacteria”(Scientific American,198O,242:74-94)和Sambrook等(1989,supra)。
用于在细丝状真菌宿主细胞中指导本发明核苷酸构建体转录的适合的启动子如获自以下基因的启动子:米曲霉TAKA淀粉酶基因,Rhizomucormiehei天冬氨酸蛋白酶,黑色曲霉中性α-淀粉酶,黑色曲霉稳定的α-淀粉酶,黑色曲霉或泡盛曲霉葡糖淀粉酶(glaA),Rhizomucor miehei脂肪酶,米曲霉碱性蛋白酶,米曲霉丙糖磷酸盐异构酶,构巢曲霉乙酰胺酶,和尖孢镰孢类胰岛素蛋白酶(WO96/00787),以及NA2-tpi启动子(来自于黑色曲霉中性α-淀粉酶和米曲霉丙糖磷酸盐异构酶的杂合的启动子),和它们的变异体,截短的和杂合的形式。
在酵母宿主中,有用的启动子获自啤酒糖酵母烯醇酶(ENO-1)、啤酒糖酵母半乳糖激酶(GAL1)、啤酒糖酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和啤酒糖酵母3-磷酸甘油酸盐激酶基因。更多用于酵母宿主细胞的有用的启动子由Romanos等描述了(1992,Yeast,8:423-488)。
调控序列还可以是适合的转录终止序列,该序列可以被宿主细胞识别而终止转录。终止序列可操作地连接于编码多肽的核苷酸序列的3′端。任何一种在所选宿主细胞内具有功能的终止子均可用于本发明。
优选适用于细丝状真菌宿主细胞的终止子获自米曲霉TAKA淀粉酶基因、黑色曲霉葡糖淀粉酶基因、构巢曲霉邻基苯甲酸盐合成酶基因、黑色曲霉α-淀粉酶基因和类胰岛素蛋白酶基因。
优选适用于酵母宿主细胞的终止子获自啤酒糖酵母烯醇酶基因、啤酒糖酵母细胞色素C(CYC1)基因和啤酒糖酵母甘油醛-3-磷酸脱氢酶基因。其它用于酵母宿主细胞的有用的终止子由Romanos等描述了(1992,Supra)。
调控序列还可以是一种适合的前导序列,一种对于宿主细胞非常重要的mRNA的非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5′端。任何一种在所选宿主细胞内具有功能的前导序列均可用于本发明。
优选用于细丝状真菌宿主细胞的前导序列获自米曲霉TAKA淀粉酶基因和米曲霉丙糖磷酸盐异构酶基因。
适用于酵母宿主细胞启动子获自啤酒糖酵母烯醇酶(ENO-1)基因、啤酒糖酵母3-磷酸甘油酸盐激酶基因、啤酒糖酵母α-因子和啤酒糖酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因。
调控序列还可以是一种聚腺苷酸化序列,该序列可操作地连接于编码多肽的核苷酸序列的3′端,当转录时作为一种在转录的mRNA上添加多聚腺苷酸残基的信号被宿主细胞识别。任何一种在所选宿主细胞内具有功能的聚腺苷酸化序列均可用于本发明。
优选适用于细丝状真菌宿主细胞的聚腺苷酸化序列获自米曲霉TAKA淀粉酶基因、黑色曲霉葡糖淀粉酶基因、构巢曲霉邻基苯甲酸盐合成酶基因、尖孢镰孢类胰岛素蛋白酶基因和黑色曲霉α-糖苷酶。
适用于酵母宿主细胞的聚腺苷酸化序列由Guo和Sherman公开了(1995,Molecular cellular biology 15:5983-5990)。
调控序列还可以是一种信号肽编码区,它编码一种连接于多肽的氨基端的氨基酸序列并指导编码的多肽进入细胞的分泌途径。编码序列5′端的核苷酸序列可以原本就含有信号肽编码区,在翻译阅读框中它与编码分泌多肽的编码区片段天然相连。或者,编码序列的5′端可以含有一种与编码序列异源的信号肽编码区。当编码序列不天然含有信号肽编码区时,外源信号肽编码区有可能需要。或者,为了促进多肽的分泌,可以只是用外源信号肽编码区替换天然的信号肽编码区。然而,任何一种能指导表达的多肽进入所选宿主细胞的分泌途径的信号肽编码区都可以用于本发明。
适合于细菌宿主细胞的有效的信号肽编码区是获自芽孢杆菌NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的信号肽编码区。Simonen和Palva描述了更多的信号肽(1993,Microbiological Reviews 57:109-137)。
用于细丝状真菌宿主细胞的有效的信号肽编码区获自米曲霉TAKA淀粉酶基因、黑色曲霉中性淀粉酶基因、黑色曲霉葡糖淀粉酶基因、Rhizomucormiehei天冬氨酸蛋白酶基因、Humicola insolens纤维素酶和Humicolalanuginosa脂肪酶基因。
适用于酵母宿主细胞的信号肽编码区获自啤酒糖酵母α-因子基因和啤酒糖酵母转化酵素基因。Romanos等描述了其它有用的信号肽编码区(1992,supra)。
调控序列还可以是一种编码位于多肽氨基端氨基酸序列的前肽编码区。这种生成的多肽称之为酶原或多肽原(或在某些情形时被称为酵素原)。多肽原通常没有活性,经由催化或多肽的自发催化剪切作用从多肽原转化成成熟的活性多肽。多肽原编码区可以获自模式种碱性蛋白酶(aprE)基因、模式种中性蛋白酶(nprT)基因、啤酒糖酵母α-因子基因、Rhizomucormiehei天冬氨酸蛋白酶基因和嗜热性毁丝霉漆酶基因(WO95/33836)。
其中信号肽和前肽区存在于多肽的氨基端,前肽区相邻于多肽的氨基端,信号肽区相邻于前肽的氨基端。
还可以添加其它的调节序列来调节与宿主细胞生长相关的多肽的表达。如当收到一种化学或物理刺激包括存在一种调节化合物时,调节系统发生反应开始或停止基因的表达。原核系统中的调节体系包括lac、tac和trp操纵子系统。在酵母中,可以使用ADH2和GAL1系统。在细丝状真菌中,TAKA淀粉酶启动子、黑色曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可以用作调节序列。其它调节序列如那些允许基因扩增的序列,在真核系统中,这些序列包括二氢叶酸还原酶基因和金属硫因基因,前者在存在氨甲蝶呤时被扩增,后者扩增时需要重金属。在这些例子里,编码多肽的核苷酸序列被可操作地与调节序列连接。
表达载体
本发明还涉及含有本发明核酸构建体的重组表达载体。上述各种核苷酸和调控序列可以被连接起来产生一种重组表达载体,该载体可以包括一或多个适宜的限制性位点用于编码多肽的核苷酸序列在这些位点插入或替代。或者,本发明的核苷酸序列可以通过将核苷酸序列或含有该序列的核酸构建体插入一种适合于表达的载体而进行表达。构建表达载体时,编码序列插入载体中这样编码序列可以与适于表达的调控序列可操作地连接起来。
重组表达载体可以是任何一种能方便地用于重组DNA技术和能使核苷酸序列表达的载体(如质粒或病毒)。载体的选择主要根据载体与载体转化的宿主细胞之间的相容性。载体可以是线性的或闭合的环状质粒。
载体可以是一种能自我复制的载体,如作为一种染色体外实体存在的载体,它的复制依赖于染色体的复制,如质粒,一种染色体外元件,微型染色体,或一种人工染色体。
载体可以通过任何一种方式来确保自我复制。或者,当转化入宿主细胞时,载体可以整合进基因组并与其整合进的染色体一起复制。而且,可以使用引入宿主细胞基因组的单个载体或质粒或一起包含总DNA的两个或多个载体或质粒,或者一种转座子。
本发明的载体优选含有一或多个可选择的标记,从而能容易地挑选出转化的细胞。可选择的标记是一种基因,其产物能提供杀虫或病毒抗性、重金属耐受性、原养型或营养缺陷型,等等。
细菌的可选标记如来自模式种或地衣芽孢杆菌,或具有抗生素如氨苄西林、卡那徽素、氯霉素或四环素抗性的标记。适用于酵母宿主细胞的可选择标记有ADE1、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于细丝状真菌宿主细胞的可选择标记包括但不局限于amdS(乙酰胺酶)、argA(鸟氨酸氨基甲酰转移酶)、bar(瞵丝菌素乙酰基转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺嘌呤转移酶)和trpC(氨基苯甲酸盐合成酶),以及它们的等价物。
优选用于曲霉细胞的可选择标记有米曲霉或构巢曲霉的amdS和pyrG基因和吸水链霉菌的bar基因。
本发明的载体优选含有允许载体稳定地整合进宿主细胞基因组或载体在细胞中不依赖于基因组进行自发复制的元件。
为了整合进宿主细胞基因组,载体可以依靠编码多肽的核苷酸序列或载体的其它元件,通过同源或非同源重组稳定地整合进基因组。或者,载体可以含有额外的核苷酸序列用于指导通过同源重组整合进宿主细胞基因组。额外的核苷酸序列使得载体能在染色体上的一个精确的位点被整合进宿主细胞基因组。为了提高在准确位点整合的可能性,整合元件必须优选含有足够数量的核苷酸,例如100至1500个碱基对,优选400至1500个碱基对,和更优选800至1500个碱基对,并且核苷酸序列与相应的靶序列具有很高的同一性能增强同源重组的可能性。整合的元件可以是任一种与宿主细胞内基因组上的靶序列同源的序列。而且,整合的元件可以是非编码或编码核苷酸序列。在另一方面,通过非同源重组可以将载体整合进宿主细胞的基因组中。
为了能自发复制,载体进一步包含一种复制起点使得载体能在所讨论的宿主细胞内自发复制。在细菌中的复制起始点的离子有能在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起始点,以及能在芽孢杆菌中复制的pUB110、PE194、pTA1060和pAMβ1的复制起始点。用于酵母宿主细胞中的复制起始点是2微米的复制起始点ARS1、ARS4、ARS1与CEN3的组合、ARS4与CEN6的组合。复制起始点可以包含一种突变使得它在宿主细胞中具有温度敏感性(参见如Ehrlich,1978,proceedings ofthe national academy of sciences USA 75:1433)。
多于一拷贝的本发明的核苷酸序列可以插入宿主细胞中以提高基因产物的产量。核苷酸序列的拷贝数量的提高可以通过将至少一个额外拷贝的序列整合进宿主细胞基因组来获得,或者额外拷贝的核苷酸序列包括一种可进行扩增选择的标记基因,当细胞含有扩增的可选择标记基因的拷贝时,因此在存在适合的可选择剂时培养细胞可以被挑选出额外拷贝的核苷酸序列。
用于连接上述元件来构建本发明重组表达载体的方法是本领域技术人员所公知的(参见如Sambrook等,1989,supra).
宿主细胞
本发明还涉及含有本发明核酸构建体的重组宿主细胞,可以适用于重组产生多肽。含有本发明核苷酸序列的载体被转化进宿主细胞,这样载体被保持作为一种染色体的整合部分或如前所述的作为一种染色体外自我复制的载体。
宿主细胞可以是一种单细胞微生物,如原核微生物,或是一种非单细胞微生物如真核微生物。
适用的单细胞微生物有细菌细胞如革兰氏阳性细菌包括但不局限于,一种芽孢杆菌细胞,如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂类芽孢杆菌、迟缓芽孢杆菌、地衣形芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌;或一种链霉菌多肽,如变青链霉菌或鼠灰链霉菌;或是一种革兰氏阴性菌,如大肠杆菌或一种假单孢菌。在一个优选方案中,细菌宿主细胞是迟缓芽孢杆菌、地衣形芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌。在另一个优选方案中,细菌宿主细胞是嗜碱芽孢杆菌。
载体导入细菌宿主细胞可以受到原生质体转化的影响(参见如Chang和Cohen,1979,molecular general genetics 168:111-115),使用全细胞(参见Young和Spizizin,journal of bacteriology 81:823-829;或Dubnau和Davidoff-Abelson,journal of molecular biology 56:209-221),电穿孔(参见如Shigekawa和Dower,1988,Biortechniques 6:742-751),或接合作用(参见如Koehler和Thorne,1987,journal ofbacteriology 169:5771-5278)。
宿主细胞可以是真核细胞,例如哺乳动物、昆虫、植物或真菌细胞。
在一个优选方案中,宿主细胞是真菌细胞。这里使用的“真菌”包括Phyla Ascomycota、Basidiomycota、Chytridiomycota和Zygomycota(定义参见Hawksworth等,Ainsworth and Bisby’s dictionary of the fungi,第八版,1995,CAB international,University Press,Cambridge,UK)以及Oomycota(引用于Hawksworth等,1995,supra,171)和所有的有丝分裂孢子真菌(Hawksworth等,1995,supra)。
在一个更优选的方案中,真菌宿主细胞是酵母细胞。这里使用的“酵母”包括ascosporogenous yeast(Endomycetales),basidiosporogenousyeast,和属于fundi Impefecti(Blastomycetes)的酵母。由于酵母的分类可能在将来发生变化,为了达到本发明的目的,酵母的定义如在Biologyand Activities of Yeast中所描述的(Skinner,F.A.Passmore,S.M.Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium SeriesNo.91980)。
在一个更优选的方案中,酵母宿主细胞是假丝酵母、Aschbyii、Hansenula、克鲁维氏酵母属、毕赤氏酵母属、糖酵母属、裂殖糖酵母属或Yarrowia细胞。
在一个更优选的方案中,酵母细胞是卡尔斯伯糖酵母、啤酒糖酵母、糖化糖酵母、Saccaromyces douglasii、Saccaromyces kluyveri、Saccaromyces norbensis或卵形糖酵母细胞。在另一个更优选的方案中,酵母细胞是乳克鲁维氏酵母细胞。在另一个更优选的方案中,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个更优选的方案中,真菌细胞是一种细丝状真菌细胞。“细丝状真菌”包括细丝形式的子目Eumycota和Oomycota(定义按Hawksworth等,1995,supra)。细丝状真菌的特征在于由角素、纤维素、葡聚糖、几丁质、甘露聚糖和其它复合多肽组成的菌丝体壁。通过菌丝延长和碳的分解作用的植物生长依赖于氧。相反,通过酵母如啤酒糖酵母的植物生长是通过发出单细胞叶状体芽,其碳的分解是一种发酵。
在一个更优选的方案中,细丝状真菌宿主细胞是一种类的细胞,但不仅仅局限于支顶孢、曲霉、镰孢、毛霉、毁丝霉、链孢霉、青霉或木霉。
在一个最优选的方案中,细丝状真菌宿主细胞是棘孢曲霉、泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑色曲霉或米曲霉细胞。在另一个最优选的方案中,细丝状真菌宿主细胞是杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、玫瑰色镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、Fusarium torulosum、Fusariumtrichothecioides、Fusarium venenatum细胞。在一个甚至最优选的方案中,细丝状真菌宿主细胞是Fusarium venenatum(Nirenberg sp.Nov.)细胞。在另一个最优选的方案中,细丝状真菌宿主细胞是Humicolainsolens、Humicola lanuginosa、米赫毛霉、嗜热毁丝霉、粗糙链孢霉、产紫青霉、Trichoderma harzianum、康宁氏木霉、Trichodermalongibrachiatum、Trichoderma reesei或绿色木霉多肽。
真菌细胞可以通过已知的方法进行转化,包括原生质体形成、原生质体转化和细胞壁的再生。用于曲霉宿主细胞的转化的适合的方法参见EP238023和Yelton等(1984,proceedings of the national academy ofsciences USA 81:1470-1474)。适合于镰孢属转化的方法参见Malardier等,1989,Gene 78:147-156和WO9600787。可以使用Becker和Grarente描述的方法转化酵母(in Abelson,J.N.和Simon,M.l.,editors,Guideto Yeast genetics and molecular biology,methods in enzymology,Volume 194,pp182-187,academic press inc.,New York;Ito等,1983,journal of bacteriology 153:163;和Hinnen等,1978,Proceedingsof the national academy of sciences USA 75:1920)。
生产方法
本发明还涉及生产本发明多肽的方法,包括(a)培养野生型菌株,该菌株适于生产多肽;和(b)回收多肽。优选菌株选自下组所示真菌:支顶孢、小柱孢菌、热子囊菌、草根霉、轮枝孢、新螱、白丝菌、poitrasia、鬼伞、单瑞孢、腐质霉、Cladorrhinum、二孢、毁丝霉、根毛霉、Meripilus、黑耳、炭角菌、长毛盘菌、毛壳霉、Chaetomidium、Sporotrichum、草根霉、曲霉、帚霉、镰孢、假黑盘菌或疫霉;更优选菌株选自下组所示真菌:嗜热支顶孢、嗜热毛壳霉、嗜热小柱孢菌、橙黄色热子囊菌、Thielaviaaustraliensis、幼嫩轮枝孢、栗色新螱、黑素白丝菌、poitrasia circinans、灰色鬼伞、玫瑰单瑞孢、产黑色腐质霉、Cladorrhinum foecundissimum、棉色二孢、嗜热毁丝霉、微小根毛霉、Meripilus giganteus、黑耳、块团炭角菌、长毛盘菌、Acremonium sp、毛壳霉、Chaetomidium pingtungium、肉桂色毁丝霉、Sporotrichum pruinosum、有小孢子囊的草根霉、淡黑假黑盘菌或蔓延疫霉。
本发明还涉及生产本发明多肽的方法,包括(a)在适于生产多肽的条件下培养野生型菌株,和(b)将多肽与一种嗜好的底物如有纤维质的底物接触,没有前面多肽的回收。术语“原位产物”意指多肽在在其将要被使用的位置处直接产生,例如在一个用于生产乙醇的发酵过程中。
在本发明的生产方法中,细胞使用本领域已知的方法在适合于生产多肽的营养培养基上培养细胞。例如,细胞可以通过振荡烧瓶培养,实验室里的小范围或大范围发酵(包括连续的、一批、同批或固体阶段发酵)培养或在适宜的培养基中和允许多肽被表达和/或分离的条件下进行工业发酵培养。根据本领域已知方法在适宜的包括碳、氮源和无机盐的营养培养基中进行细胞培养。适合的培养基获自商家或可以根据发表的组合无进行制备(如,in catalogues of the American Type Culture Collection)。如果多肽被分泌进营养培养基,就可以直接从培养基中回收多肽。如果多肽没有分泌,可以从细胞溶解产物中回收多肽。
可以使用本领域已知的特异于多肽的技术来检测多肽。这些检测方法包括使用特异性抗体,形成一种酶产物,或一种酶底物的消失。例如,酶检测可以用于确定上述多肽的活性。
生产的多肽可以通过本领域已知方法来回收。例如,通过但不局限于离心、过滤、提取、喷雾干燥、真空抽干或沉淀这些常规方法可以将多肽从营养培养基中回收。
本发明的多肽可以经过进一步的纯化处理,其中可以使用各种本领域已知的方法包括但不局限于层析(如离子交换,亲和,疏水,层析聚焦,和顺序排除),电泳方法(如预备等电子聚焦),差示溶解度(如硫酸铵沉淀),SDS-PAGE,或抽提(参见如,Protein Purification,J.-C.Janson和Las Ryden,editors,VCH Publishers,New York,1989)。
植物
本发明还涉及转化有编码具有本发明纤维二糖水解酶I活性的多肽的核苷酸序列的转基因植物、植物部分或植物细胞,这样能表达和产生可回收量的的多肽。多肽可以从植物或植物部分中回收。或者,含有重组多肽的植物或植物部分可以用作如提高食物或饲料的质量,如改善营养价值、适口性和流变学特性或破坏抗营养因子。
转基因植物可以是双子叶或单子叶植物,单子叶植物有草,例如牧草(蓝色草,Poa),草料草例如稻草,Lolium,气候草,例如草类和谷类等,如小麦、燕麦、黑麦、大麦、稻、高梁、栗和玉米。
双子叶植物有烟草,羽扇豆,马铃薯,糖用甜菜,豆类如豌豆、豆和大豆,和十字花科植物(如芸苔),例如花椰菜、油菜、canola和密切相关的模型微生物Arabidopsis thaliana。
植物部分可以是茎、愈合组织、叶、根、果实、种子和块茎。还有特异的植物组织如叶绿体、质外体、线粒体、空泡、过氧物酶体和细胞质也被认为是植物部分。而且,任何一种植物细胞,不管其组织来源,均被认为是一植物部分。
在本发明的范围内还包括这种植物、植物部分和植物细胞的后代(克隆或种子)。
表达本发明多肽的转基因植物或植物细胞可以通过本领域已知的方法构建。简要地,可以通过转化进植物宿主基因组一或多个编码本发明多肽的表达结构构建植物或植物细胞,然后繁殖由此产生的修饰过的植物或植物细胞形成转基因植物或植物细胞。
便利地,表达结构是含有编码一种本发明多肽的核苷酸序列的核酸构建体,其中核苷酸序列与在所选植物或植物部分中表达核苷酸序列所需的适宜调节序列可操作地相连。而且,表达结构可以包含用于鉴别表达结构整合进的宿主细胞和将结构导入进所讨论植物必需的DNA序列(后者依赖于所使用的DNA导入的方法)。
在选择调节序列例如启动子和终止子序列和任意的信号或转运序列时需要考虑,例如希望多肽在什么时候、什么地点和怎样表达。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发展性的、阶段性的或细胞特异性的,和基因产物可以靶向一种特定的组织或植物部分例如种子或叶子。调节序列如参见Tague等的描述(1988,plantphysiology 86:506)。
35S-CaMV启动子可用于组成型表达(Franck等,1980,cell 24:285-294)。器官特异性的启动子可以来自如储水组织如种子、马铃薯块茎和果实(Edwards & Coruzzi,1990,Ann.Rev. Genet.24:275-303),或来自水代谢组织如分裂组织(Ito等,1994,Plant Mol.Biol.24:863-878),一种种子特异性的启动子例如来自鼠的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(Wu等,1988,Plant and Cell Physiology 39:885-889),来自豆球蛋白B4和Vicia faba的一种未知种子基因的Vicia faba启动子(Conrad等,1998,journal of Plant Physiology 152:708-711),一种来自种子油体蛋白的启动子(Chen等,1998,Plant and Cell Physiology39:935-941),来自Brassica napus的贮存蛋白napA启动子,或任何其它本领域已知的种子特异性启动子,如在WO91/14772中所描述的那些。而且,启动子可以是一种叶子特异性启动子如来自鼠或马铃薯的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000),绿藻病毒腺嘌呤甲基转移酶基因启动子(Mitra and Higgins,1994,Plant MolecularBiology 26:85-93),或是来自鼠的aldP基因(Kagaya et al.,1995,Molecular and general genetics 248:668-674),或一种伤口诱导型启动子例如马铃薯pin2启动子(Xu et al.,1993,Plant Molecular Biology22:573-588)。
一种启动子增强元件还可以用于获得酶在植物中的高表达。例如,启动子增强子元件可以是一种置于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如,Xu等1993年在supra上公开了鼠肌动蛋白1基因的第一个内含子可用于增强表达。
可选择的标记基因和任何其它部分表达结构可以选自那些可获得的文献。
核酸构建体可以根据本领域已知的常规技术被导入植物基因组中,其中包括土壤杆菌介导的转化,病毒介导的转化,显微注射,粒子轰击,抗生素转化和电穿孔(Gasser等,1990,Science 244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamato等,1989,Nature 338:274)。
目前,土壤杆菌介导的基因转化是用于产生转基因双子叶植物时选择的方法(参见Hooykas和Schilperoort,1992,Plant Molecular Biology19:15-38)。然而,该方法还可用于转化单子叶植物,虽然其它转发方法一般优选用于这些植物。目前,选择用于产生转基因单子叶植物的方法是粒子轰击(包被有转化DNA的显微的金或钨微粒)胚胎calli或发育的胚胎(Christou,1992,Plant journal 2:275-281;Shinmamoto,1994,Current Opinion Biotechnology 5:158-162;Vasil等,1992,Bio/Technology 10:667-674)。转化单子叶植物的一种替代方法基于原生质体的转化,如Omirulleh等描述的(1993,Plant Molecular Biology 21:415-428)。
转化后,根据本领域公知的技术将导入了本发明表达结构的转化体挑选出来并再生成完整的植物。
本发明还涉及生产本发明多肽的方法,包括:(a)在适合多肽生产的条件下培养含有编码本发明具有纤维二糖水解酶I活性多肽的核苷酸序列的转基因植物或植物细胞;和(b)回收多肽。
本发明还涉及原位生产本发明多肽的方法,包括:(a)在适合多肽生产的条件下培养含有编码本发明具有纤维二糖水解酶I活性多肽的核苷酸序列的转基因植物或植物细胞;和(b)将多肽与一种嗜好的底物如有纤维质的底物接触,没有前面多肽的回收。
组合物
在一个更进一步的方面,本发明涉及含有本发明多肽的组合物。
组合物可以包含一种本发明的多肽作为主要的酶促成分,如单成分合成物。或者,组合物可以具有多种酶促活性,例如作为一种氨基肽酶、淀粉酶、糖酶、羧肽酶、过氧化物酶、纤维素酶、几丁质酶、角质酶、环式糊精糖基转移酶、脱氧核糖核酸酶、脂肪酶、α-葡萄糖苷酶、葡糖淀粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、环过氧化物酶、转化酵素、漆酶、甘露糖苷酶、氧化酶、果胶酶、肽聚糖酶、过氧化物酶、肌醇六磷酸酶、蛋白水解酶、核糖核酸酶、转糖苷酶或木聚糖酶。
组合物可以根据本领域已知的方法来制备并形成液体或干燥形式的组合物。例如,多肽组合物可以形成颗粒或微粒的形式。包含在组合物中的多肽可以通过本领域已知技术进行稳定。
以下给出的是本发明多肽组合物优选的用途。本发明多肽组合物的剂量和其它有关在何种条件下使用组合物可以根据本领域已知方法进行确定。
去污剂组合物
本发明的多肽可以作为一种去污剂组合物成分被添加。
本发明的去污剂组合物可以制备成如一种人工或机械洗衣去污剂组合物,其中包括一种适合于对沾污的织物进行预处理的洗衣添加剂和一种织物柔顺漂洗剂,或制备成一种用于普通家庭坚硬表面请洗操作时的去污剂组合物,或是制备成一种人工或机械洗碗剂。
在一个优选的方面,本发明提供了一种含有本发明多肽的去污添加剂。和去污剂组合物一样去污添加剂可以包含一或多种其它的酶如蛋白酶,脂肪酶,角质酶,淀粉酶,糖酶,纤维素酶,果胶酶,甘露糖酶,阿拉伯糖酶,半乳糖酶,木聚糖酶,和氧化酶,如漆酶,和/或过氧化物酶。
一般来说所选酶的特性必须与所选去污剂组合物相适应,(如最佳PH值、和其它酶促和非酶促成分的相容性,等等),并且酶必须以有效量存在。
蛋白酶:合适的蛋白酶包括那些动物、植物或微生物来源的。微生物来源是优选的。其中包括了那些化学修饰的酶或蛋白工程化变异体。蛋白酶可以是一种丝氨酸蛋白酶或金属蛋白酶,优选是一种嗜碱性微生物蛋白酶或类胰岛素蛋白酶。嗜碱性蛋白酶如枯草杆菌蛋白酶,尤其是那些来自芽孢杆菌属的,如枯草杆菌蛋白酶Novo,枯草杆菌蛋白酶Carlsberg,枯草杆菌蛋白酶309,枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(WO89/06279中描述的)。类胰岛素蛋白酶如胰岛素(如猪或牛来源的)和在WO89/06270和WO94/25583中所描述的镰孢属蛋白酶。
有用的蛋白酶如在WO92/19729、WO98/20115、WO98/20116和WO98/34946中公开的变异体,尤其是那些在以下一或多个位点发生取代的变异体:27、36、57、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
脂肪酶:适合的脂肪酶包括那些细菌或真菌来源的,其中包括化学修饰的和蛋白工程化变异体。适合的脂肪酶包括来自腐质酶(synonymthermomyces),如EP258068和EP305216中公开的来自H.Lanuginosa(T.Lanuginosus)或WO96/13580中公开的来自H.Insolens的脂肪酶,一种假单胞菌脂肪酶,如来自P.Alcaligenes或类产碱假单胞菌(EP218272)、葱头假单胞菌(EP331376)、司徒茨氏假单胞菌(GB1372034)、荧光假单胞菌、假单胞菌种菌株SD705(WO95/06720和WO96/27002)、P.Wiscomsinensis(WO9612012)的脂肪酶,一种芽孢杆菌属脂肪酶,如来自枯草芽孢杆菌(Dartois等,1993,Biochemica et Biophysica Acta,1131,253-360)、嗜热脂肪芽孢杆菌(JP64/74492)或短小芽孢杆菌(WO91/16422)的脂肪酶。
其它脂肪酶变异体如那些在WO92/05249、WO94/01541、EP407225、EP260105、WO9535381、WO9600292、WO95/30744、WO9425578、WO95/14783、WO97/04079和WO97/07202中公开的。
淀粉酶:适合的淀粉酶(α和/或β)包括细菌或真菌来源的那些,其中包括了化学修饰的或蛋白工程化的变异体。淀粉酶包括如获自芽孢杆菌如GB1296839中详细描述的地衣型芽孢杆菌特定菌株的α-淀粉酶。
有用的淀粉酶如WO9402597、WO9418314、WO9623873和WO9743424中描述的变异体,尤其是在以下一或多个位点发生取代的变异体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
纤维素酶:适合的纤维素酶包括细菌或真菌来源的那些,其中包括了化学修饰的或蛋白工程化的变异体。适合的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、草根霉属、支顶孢属,如真菌纤维素酶产自Humicola Insolens、嗜热毁丝霉和尖胞镰孢,这些公开于US4435307、US5648263、US5691178、US5776757和WO8909259。
特别适合的纤维素酶是具有颜色偏好特性的嗜碱性或嗜中性纤维素酶。这种纤维素酶如EP0495257、WP0531372、WO9611262、WO9629397和WO9808940中公开的那些。其它纤维素酶变异体如在WO9407998、EP0531315、US5457046、US5686593、US5763254、WO9524471、WO9812307和PCT/DK98/00299中公开的那些。
过氧化物酶/氧化酶:适合的过氧化物酶/氧化酶包括细菌或真菌来源的那些,其中包括了化学修饰的或蛋白工程化的变异体。有用的多氧化物酶包括来自Coprinus如C.Cinereus和其变异体的多氧化物酶,这些在WO9324618、WO9510602和WO9815257中公开了。
去污剂酶可以包含在去污剂组合物组合物中,这可以通过加入含有一或多种酶的分离剂实现,或通过加入一种含有所有这种酶的组合添加剂获得。本发明的一种去污添加剂,如分离剂或组合添加剂可以被制备成如一种颗粒、液体、泥浆等。优选的去污添加剂制品可以是颗粒,优选无尘颗粒、液体,优选稳定的液体、泥浆。
无尘颗粒可以如按照US4106991和US4661452中公开的万法生产并可任意地根据本领域已知的方法进行包封。蜡制包衣材料如重约1000至2000平均分子量的聚(环氧乙烷)产物(聚乙二醇,PEG);具有16至50个环氧乙烷单位的乙氧基化壬基苯;其中乙醇含有12至20个碳原子和其中有15至80个环氧乙烷单位的乙氧基化脂肪族乙醇;脂肪族乙醇;脂肪酸;和单和双和三甘油酯。适合于通过流化床技术应用的膜形成包衣原料在GB1483591中给出了。液体酶制品可以被稳定,如根据已建立的方法加入多羟基化合物如丙二醇,糖或糖乙醇,乳酸或硼酸。受保护的酶可以通过EP238216公开的方法制备。
本发明的去污剂组合物可以以任何一种便利的形式存在,如药条、药片、粉末、颗粒、药贴或一种液体。液体去污剂组合物可以是水溶性的,通常含有至多70%的水和0-30%的有机溶剂,或是非水性的。
去污剂组合物包含一或多种表面活性剂,可以是非离子包括半极性和/或阴离子和/或阳离子和/或两极性的表面活性剂。表面活性剂通常以0.1%至60%的重量水平存在。
当包括在其中时,去污剂组合物常含有约1%至约40%的阴离子表面活性剂例如线性烷基苯磺酸盐,α-石蜡磺酸盐,烷基硫酸盐(脂肪族乙醇硫酸盐),乙醇乙氧基硫酸盐,二级烷磺酸盐,α-磺酰脂肪酸甲基酯,烷-或烯烃琥珀酸或肥皂。
当包括在其中时,去污剂组合物通常含有从约0.2%至约40%的非离子表面活性剂,例如脂肪醇乙氧基化物,壬基苯乙氧基化物,烷基聚配糖,烷基甲胺氧化物,乙氧基化的脂肪酸单乙醇酰胺,脂肪酸单乙醇酰胺,聚羟基烷基脂肪酸胺,或葡糖胺的N-酰基N-烷基衍生物(“glucamides”)。
去污剂组合物可以含有0-65%的去污剂组合物助洗剂或复合剂,例如沸石,二磷酸,三磷酸,磷酸盐,碳酸盐,柠檬酸盐,次氮基三乙酸,乙二胺四乙酸,二乙烯基三胺五乙酸,烷基-或烯烃琥珀酸,可溶性硅酸盐或分层的硅酸盐(如来自Hoechst的SKS-6)。
去污剂组合物可以包含一或多种聚合体,如羧甲基纤维素,聚乙烯吡咯烷酮,聚乙二醇,聚乙烯醇,聚乙烯基嘧啶-N-氧化物,聚乙烯基咪唑,聚羧酸盐如聚丙烯酸盐,马来酸/丙烯酸共聚物和月桂酸异丁烯酸盐/丙烯酸共聚物。
去污剂组合物可以包含一种漂白体系,其中包括一种H2O2来源如过硼酸盐或过碳酸盐,它们可以与过酸构成的漂白活化因子如四乙酰基乙二胺或壬酰苯酚磺酸盐。或者,漂白体系可以包含如氨化物、酰亚胺或砜的过氧酸。
本发明去污组合物中的酶可以通过使用常规稳定剂使之稳定,稳定剂如一种多羟基化合物如丙二醇或甘油,一种糖或糖醇,乳酸,硼酸或硼酸衍生物,如一种芳香族硼酸酯,或一种苯基硼酸衍生物如4-甲酸基苯基硼酸,并且该组合物可以根据如WO92/19709和WO92/19708中描述的方法制备。
去污剂组合物还可以含有常规的去污剂组合物成分如织物调节剂,其中包括粘合成分,起泡剂,泡沫抑制剂,抗腐蚀剂,油悬浮剂,抗油再沉淀剂,染料,杀虫剂,光学增白剂,助水溶物,失去光泽的抑制因子或香味素。
目前已经预期了去污剂组合物中的任何一种酶,优选本发明的多肽,可以以相应于每升洗液含0.01-100mg酶蛋白的量被加入,优选每升洗液含0.05-5mg酶蛋白,优选每升洗液含0.1-1mg酶蛋白。
本发明的多肽还可以额外地加入WO97/07202中公开地去污剂组合物制品中,该文献引入本文作为参考。
DNA重组(改组)
以下核苷酸序列可用于DNA重组(或改组)过程:SEQ ID NO:1,SEQ IDNO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ IDNO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:62,SEQ ID NO:63,SEQ ID NO:64,SEQ ID NO:65,SEQ ID NO:67。由该过程获得的新的核苷酸序列可以编码具有改进的纤维二糖酶活性的新的多肽,如改进的稳定性(储存稳定性,热稳定性),改进的特异性活性,改进的最适PH值,和/或改进的对特异性化合物的耐受力。
在两个或多个同源输入的多核苷酸(起始点多核苷酸)之间的改组包括打断核苷酸和重组片段,从而获得输出的多核苷酸(如已经经过改组循环),其中核苷酸片段的数目与输入的多核苷酸相比发生了变化。
DNA重组或改组可以是(部分地)随机过程,其中设想的基因文库获自两个或多个起始基因。许多已知形式可以用于实施该改组或重组过程。
该过程可包括随机打断亲代DNA,接着通过PCR的重新接合形成新的全长基因,如在US5605793、US5811238、US5830721、US6117679中公开的。基因的体外重组可以按照US6159687、WO98/41623、US6159688、US5965408和US6153510中描述的方法进行。重组过程可以在活细胞内发生,如参见WO97/07205和WO98/28416。
亲代DNA可以通过脱氧核糖核酸酶I处理或限制性内切核酸酶的消化形成片段,方法参见Kikuchi等(2000a,Gene 236:159-167)。两亲代之间的改组可以通过改组两亲代中单一的标准亲代链来进行,参见Kikuchi等(2000b,Gene 243:133-137)。
一种特别的改组方法是根据Grameri等描述的方法(1998,Nature,391:288-291和Ness等,Nature Biotechnology 17:893-896)。另一种形式是在US6159687中的实施例1和2描述的方法。
从生物质生产乙醇
本发明还涉及从生物质如有纤维质的原料中生产乙醇的方法,其中包括生物质与本发明的多肽接触。乙醇可以基本上被回收。本发明的多肽可以通过在适合于生产本发明多肽的条件下培养宿主细胞或菌株而“原位”获得,如作为乙醇生产过程的一部分或直接就是该过程,其中宿主细胞或菌株以适合于生产该多肽的野生形式存在。
乙醇可以通过对生物质进行酶促降解并将释放的多糖转化为乙醇来生产。这种乙醇常常指生物乙醇或生物燃料。它可以被用作一种以从少于1%至高达100%的量混合的燃料添加剂或混合剂(一种燃料替代品)。在某些国家,例如在巴西,乙醇在很大程度上替代了汽油。
生物质的初级细胞壁中的主要多糖是纤维素,第二最多的是半纤维素,第三位的是胶质。在细胞停止生长后产生的次级细胞壁还含有多糖,并且经由聚合木质素与半纤维素的共价交联连接加固了。虽然通过取代光谱发现在半纤维素复杂的分枝结构中包括了各种化合物,如木聚糖,xyloglucans,树胶醛木聚糖,和甘露聚糖,但纤维素是一种纤维二糖酐的同源聚合体,并且是一种线性的β-(1-4)-D-葡聚糖。虽然纤维素具有多种形态,但在植物组织中它首先是被作为一种不可溶的并联葡聚糖链的结晶基体。半纤维素通常与纤维素以氢键连接,就如与其它半纤维素一样,这样能帮助稳定细胞壁基体。
三种主要类别的纤维素酶被用于分裂生物质:
·内切-1,4-β-葡聚糖酶或1,4-β-D-葡聚糖-4-葡聚糖水解酶(EC3.2.1.4),它们能随机作用于可溶的和不可溶的1,4-β-葡聚糖底物。
·外切-1,4-β-D-葡聚糖酶包括1,4-β-D-葡聚糖葡聚糖水解酶(EC3.2.1.74),该酶能从1,4-β-D-葡聚糖中释放出D-葡萄糖并且可以缓慢水解D-纤维二糖,和1,4-β-D-葡聚糖纤维二糖水解酶(EC 3.2.1.91),也被称为纤维二糖水解酶I,它能从1,4-β-葡聚糖中释放出纤维二糖。
·β-D-葡糖苷酶或β-D-葡糖苷葡聚糖水解酶(EC 3.2.1.21),它们能从纤维二糖和可溶性的纤维糊精中释放出D-葡萄糖单元,一种配糖的排列。
这三类酶在复合体中相互配合相互影响,从而能从生物质中有效地去结晶和水解天然的纤维素,产生能通过发酵转化为乙醇的还原糖类。
本发明通过一下实施例作进一步的描述,但不作为一种对本发明保护范围的限制。
实施例
用作缓冲液和底物的化学制品均是试剂等级的商品。
实施例1
克隆部分和全长的纤维二糖水解酶I(CBH1)的DNA序列
棉色二孢的cDNA文库被用于PCR筛选找出存在的CBH1基因。为了该目的,基于CBH1蛋白中保守区域的序列排列和标识设计了一套引物。通过凝胶电泳得到的PCR条带被用于获得来自棉色二包CBH1基因的部分序列。同源性研究证实了该部分序列是CBH1基因的部分序列(EC 3.2.1.91)。
通过访问专利保藏号CBS 247.96,进行DNA或cDNA制备,使用部分序列作为构建特异性引物的基础,并通过标准的PCR克隆技术一步步地得到棉色二孢的全长CBH1基因。
其它几种可以使用的方法:
·可以对cDNA文库或用于构建文库的cDNAs进行PCR筛选。为了这样做,基因特异性引物(GSP)和载体/连接物引物分别构建自CBH1基因的部分cDNA序列和自载体/连接物;两套引物均被设计成朝向(go outward into)CBH1基因cDNA缺失的5′和3′区。通过使用组合的GSP和载体/连接物引物获得的最长的PCR产物代表了来自棉色二孢CBH1 cDNA全长的5′和3′区。与部分cDNA序列的同源研究和比较证实了5′和3′PCR产物属于相同的棉色二孢CBH1 cDNA。使用构建自5′和3′端的引物组进行PCR可以获得全长的cDNA。
·或者,使用标准杂交技术并将部分cDNA序列作为探针可以从cDNA文库中筛选出全长cDNA。给出与探针阳性杂交信号的克隆被纯化并进行测序来确定最长的cDNA序列。同源研究和比较证实了全长cDNA对应于最初用作探针的部分CBH1 cDNA序列。
上述的两种方法基于全长CBH1 cDNA序列存在于cDNA文库或用于构建文库的cDNAs中。或者,5′和3′端示踪(RACE,cDNA末端的快速扩增)技术或衍生技术可以用于鉴别缺失的5′和3′区。为了该目的,优选分离出棉色二孢的mRNAs,并使用含有寡(dT)-的连接物引物或5′-基因特异性引物(GSP)的将之用于合成cDNAs的第一条链。
获自棉色二孢CBH1基因的全长cDNA还可以通过利用棉色二孢的基因组DNA获得。CBH1基因可以通过PCR技术鉴别出,例如上述的一种方法或使用杂交技术和部分CBH1 cDNA探针通过标准的基因组文库筛选出该基因。与部分cDNA序列的同源研究和比较证实了基因组序列对应于棉色二孢CBH1基因。对保守序列如作为转录的起始位点、起始和终止密码子或多聚腺苷酸位点进行鉴别,该结果可以被用于确定包含全长cDNA的区域。然后利用构建自该区的5′和3′端的引物从源自棉色二孢的mRNA和cDNA文库中扩增出全长的cDNA(如上)。
通过在适合的表达宿主构建体中表达全长基因,CBH1酶可以作为胞内酶或胞外酶从培养基中回收。
上述的方法可以应用于从所有的生物体而不只局限于棉色二孢中克隆出纤维二糖水解酶I的DNA序列。
实施例2
纤维二糖水解酶I(CBH1)的活性
纤维二糖水解酶I的特征在于相比于其它纤维素酶能非常有效地水解高度结晶的纤维二糖。纤维二糖水解酶I以PASC(磷酸膨胀纤维素,phosphoric acid swollen cellulose)为底物时比以CMC为底物时具有更高的催化活性。为了达到本发明的目的,下述任何一种测定方法均可用于鉴别纤维二糖水解酶I:
对偶氮-微晶纤维素(Azo-Avicel)的活性
根据操作手册使用氮-微晶纤维素(Megazyme,Bray Business Park,Bray,Wicklow,Irelang)。
对PNP-β-纤维二糖的活性
底物溶液:5mM PNPβ-D-纤维二糖(p-硝基苯β-d-纤维二糖糖苷SigmaN-5759)溶于0.1M醋酸钠缓冲液,PH 5.0;
终止试剂:0.1M碳酸钠,PH 11.5;
50μL CBH1溶液与1mL底物溶液混合并于40℃温育20分钟。加入5mL终止试剂终止反应。测定404nm时的吸光度。
对PASC和CMC的活性
底物被纤维二糖水解酶I(CBH1)降解成还原的糖类。一种Microdochiumnivale的碳水化合物氧化酶(rMnO)或另外等价的氧化酶在O2存在时作用于还原的糖产生H2O2。在存在额外的过氧化物酶时形成的H2O2激活了氧化浓缩的4-氨基安替比林(AA)和N-乙烷基-N-磺酸丙烷基(sulfopropyl)-m-甲苯胺(TOPS),形成了一种可通过在550nm处吸光度进行定量的紫色产物。
当所有的成分除了CBH1外有剩余时,吸光度的增加与CBH1活性成正比例。反应是一级动力学反应,并可以在一种Cobas Fara离心分析仪(Hoffmann La Roche)上或其它等价的能稳定测定状态动力学(steadystate kinetics)的分光光度计上自动进行。
缓冲液:50mM醋酸钠缓冲液(PH5.0);
试剂:rMnO氧化酶,纯化的Microdochium nivale的碳水化合物氧化酶2mg/L(终浓度);
过氧化物酶,SIGMA P-8125(96U/mg),25mg/L(终浓度);
4-氨基安替比林,SIGMA A-4382,200mg/L(终浓度);
TOPS,SIGMA E-8506,600mg/L(终浓度);
PASC或CMC(见下),5g/L(终浓度)。
所有的试剂以上面提示的浓度加入缓冲液并充分混合试剂溶液。
50μL纤维二糖水解酶I样品(经合适的稀释)与300μL的试剂溶液混合并于40℃温育20分钟。检测紫颜色的形成并测定550nm处的吸光度。
AA/TOPS冷凝物吸收系数是0.01935A550/(μM cm)。根据OD550/min和吸收系数计算速率为每分钟产生μmols还原糖。
PASC
原料:5gAvicel_(Art.2331 Merck);
150mL 85%正-磷酸(Art.573 Merck);
800mL丙酮(Art.14 Merck);
约2升去离子水(Milli-Q);
1L玻璃烧杯;
1L玻璃过滤漏斗;
2L抽气细颈瓶;
Ultra Turrax Homogenizer。
丙酮和正-磷酸在冰上冷却。Avicel_用水弄湿,然后加入150mL冰冷的85%的正-磷酸。混合物置于冰浴中轻微搅拌一个小时。
加入500mL冰冷的丙酮并搅拌,将混合物转入一玻璃过滤漏斗并用3×100mL冰冷的丙酮冲洗,每次洗时尽量吸干。用2×500mL水(或直到没有丙酮的气味),每次洗时尽量吸干。
将固体重悬于水中至总体积为500mL,使用一种Ultra Turrax匀浆器均匀混合物。湿保存在冰箱中,使用缓冲液通过离心平衡,使用前重悬。
CMC
不纯形式的细菌纤维素微原纤维(microfibrils)获自日本食物“natade coco”(Fujico Company,Japan)。将350g这种产品的纤维素悬于4L自来水中进行纯化。每天两次用新鲜的水置换,连续4天。
然后用1%(w/v)的NaOH替代水,产品重悬于碱性溶液,每天更换两次共4天。用蒸馏水漂洗纤维素来中和溶液直至产品表面的PH值为中性(PH7)。
纤维素被微原纤维化,通过在韦林氏搅切器中将纯化的纤维素微原纤维匀化30分钟获得一种单独的细菌纤维素微原纤维悬浮液。通过将悬浮液对去离子水透析过孔膜进一步纯化纤维素微原纤维,分离和纯化的纤维素微原纤维以水悬浮液的形式保存于4℃。
保藏的生物材料
中国普通微生物保藏中心(CGMCC)
下列微生物材料已经根据布达佩斯条约在中国普通微生物保藏中心(CGMCC)进行了保藏,中科院微生物所,海淀,北京100080,中国:
保藏号: CGMCC No.0584
申请人证明: ND000575
保藏日期: 2001-05-29
说明: 在质粒上的嗜热支顶孢CBH 1基因
分类: 子囊菌门;Sordariomycetes;Hypocrales;Hypocreceae
来源: 中国,1999
相关序列: SEQ ID NO:1和SEQ ID NO:2(编码一种来自于嗜热
支顶孢的纤维二糖水解酶I的DNA序列和相应的蛋白
序列)。
保藏号: CGMCC No.0581
申请人证明: ND000548
保藏日期: 2001-05-29
说明: 在质粒上的嗜热毛壳酶CBH 1基因
分类: 子囊菌门;Sordariomycetes,Sordariales,
Chaetomiaceae
来源: 中国,1999
相关序列: SEQ ID NO:3和SEQ ID NO:4(编码一种来自于嗜热
毛壳酶的纤维二糖水解酶I的DNA序列和相应的蛋白
序列)。
保藏号: CGMCC No.0585
申请人证明: ND001223
保藏日期: 2001-05-29
说明: 在质粒上的小柱孢菌CBH 1基因
分类: 子囊菌门;有丝分裂孢子真菌
来源: 中国,1999
相关序列: SEQ ID NO:5和SEQ ID NO:6(编码一种来自于小柱
孢菌种的纤维二糖水解酶I的DNA序列和相应的蛋白序
列)。
保藏号: CGMCC No.0582
申请人证明: ND000549
保藏日期: 2001-05-29
说明: 连接在质粒上的橙黄色热子囊菌CBH 1基因
分类: Eurotiomycetes,Eurotiales,Trichocomaceae
来源: 中国
相关序列: SEQ ID NO:7和SEQ ID NO:8(编码一种来自于橙黄
色热子囊菌的纤维二糖水解酶I的DNA序列和相应的
蛋白序列)。
保藏号: CGMCC No.0583
申请人证明: ND001182
保藏日期: 2001-05-29
说明: 连接在质粒上的Thielavia australiensis CBH1基
因
分类: 子囊菌门,Sordariomycetes,Sordariales,
Chaetomiaceae
来源: 中国,1998
相关序列: SEQ ID NO:9和SEQ ID NO:10(编码一种来自于
Thielavia australiensis的纤维二糖水解酶I的DNA
序列和相应的蛋白序列)。
保藏号: CGMCC No.0580
申请人证明: ND001182
保藏日期: 2001-05-29
说明: 连接在质粒上的Melanocarpus albomyces CBH 1基
因
分类: 子囊菌门,Sordariomycetes,Sordariales
来源: 中国,1999
相关序列: SEQ ID NO:15和SEQ ID NO:16(编码一种来自于
Melanocarpus albomyces的纤维二糖水解酶I的DNA
序列和相应的蛋白序列)。
保藏号: CGMCC No.0748
申请人证明: ND001181
保藏日期: 2002-06-07
说明: 连接在质粒上的支顶孢CBH 1基因
分类: 有丝分裂孢子的子囊菌纲
来源: 中国,2000
相关序列: SEQ ID NO:53和SEQ ID NO:54
保藏号: CGMCC No.0749
申请人证明: ND000577
保藏日期: 2002-06-07
说明: 连接在质粒上的Chaetomidium pingtungium CBH 1
基因
分类: Chaetomiaceae,Sordariales,Ascomycota
来源: 中国,2000
相关序列: SEQ ID NO:55和SEQ ID NO:56
保藏号: CGMCC No.0747
申请人证明: ND001175
保藏日期: 2002-06-07
说明: 连接在质粒上的Sporotrichum pruinosum CBH 1基
因
分类: Meruliaceae,Sterealesales,担子菌门
来源: 中国,2000
相关序列: SEQ ID NO:57和SEQ ID NO:58
保藏号: CGMCC No.0750
申请人证明: ND000571
保藏日期: 2002-06-07
说明: 连接在质粒上的嗜热小柱孢菌CBH 1基因
分类: 子囊菌门,有丝分裂孢子真菌
来源: 中国,2000
相关序列: SEQ ID NO:59和SEQ ID NO:60
真菌菌种保藏中心(CBS)
下列微生物材料已根据布达佩斯条约在真菌菌种保藏中心(CBS)进行了保藏,Uppsalalaan 8,3584 CT Utrecht,荷兰(或者P.O.Box85167,3508AD Utrecht,荷兰)。
保藏号: CBS 109513
申请人证明: ND000538
保藏日期: 2001-06-01
说明: 幼嫩轮枝孢
分类: 子囊菌门,Hypocreceae,核菌类(有丝分裂孢子)
来源: -
相关序列: SEQ ID NO:11和SEQ ID NO:12(编码一种来自于幼
嫩轮枝孢的纤维二糖水解酶I的DNA序列和相应的蛋白
序列)。
保藏号: CBS 819.73
申请人证明: ND000533
保藏日期: 公众可获得的(非申请人保藏)
说明: 产黑色腐质酶
分类: Sordariaceae,Sordariales,Sordariomycetes,
子囊菌门
来源: -
相关序列: SEQ ID NO:18(编码来自于产黑色腐质酶的纤维二糖
水解酶I的部分DNA序列)。
保藏号: CBS 427.97
申请人证明: ND000530
保藏日期: 1997-01-23
说明: Cladorrhinum foecundissimum
分类: Sordariaceae,Sordariales,Sordariomycetes,子
囊菌门
来源: 牙买加
相关序列: SEQ ID NO:19(编码Cladorrhinum foecundissimum
纤维二糖水解酶I的部分DNA序列)。
保藏号: CBS 247.96
申请人证明: ND000534和ND001231
保藏日期: 1996-03-12
说明: 棉色二孢
分类: Dothideaceae,Dothideales,Dothideomycetes,
子囊菌门
来源: 印尼
相关序列: SEQ ID NO:20(编码棉色二孢纤维二糖水解酶I的部
分DNA序列),SEQ ID NO:37(编码棉色二孢纤维二糖
水解酶I的全长DNA序列)和SEQ ID NO:38(棉色二孢
纤维二糖水解酶I的全长蛋白序列)。
保藏号: CBS 117.65
申请人证明: ND000536
保藏日期: 公众可得到的
说明: 嗜热毁丝霉
分类: Sordariaceae,Sordariales,Sordariomycetes,子
囊菌门
来源: -
相关序列: SEQ ID NO:21(编码来自于嗜热毁丝霉的纤维二糖水
解酶I的部分DNA序列)。
保藏号: CBS 109471
申请人证明: ND000537
保藏日期: 2001-05-29
说明: 微小根毛霉
分类: 毛霉菌科,毛霉菌属,接合菌门
来源: 丹麦
相关序列: SEQ ID NO:22(编码来自于微小根毛霉的纤维二糖水
解酶I的部分DNA序列)。
保藏号: CBS 521.95
申请人证明: ND000542
保藏日期: 1995-07-04
说明: Meripilus giganteus
分类: Rigidiporaceae,Hymenomycetales,Basidiomycota
来源: 丹麦,1993
相关序列: SEQ ID NO:23(编码来自于Meripilus giganteus的
纤维二糖水解酶I的部分DNA序列)。
保藏号: CBS 277.96
申请人证明: ND000543,ND001346和ND001243
保藏日期: 1996-03-12
说明: 黑耳
分类: Exidiaceae,Auriculariales,层菌纲,担子菌目
来源: 丹麦,1993
相关序列: SEQ ID NO:24(编码来自于黑耳的纤维二糖水解酶I
的部分DNA序列),SEQ ID NO:45(编码来自于黑耳的
具有CBD的纤维二糖水解酶I的全长DNA序列),SEQ ID
NO:46(来自于黑耳的具有CBD的纤维二糖水解酶I的
全长蛋白序列),SEQ ID NO:47(编码来自于黑耳的纤
维二糖水解酶I的全长DNA序列),SEQ ID NO:48(编
码来自于黑耳的纤维二糖水解酶I的全长蛋白序列)。
保藏号: CBS 284.96
申请人证明: ND000544和ND001235
保藏日期: 1996-03-12
说明: 块团炭角菌
分类: Sordariaceae,Sordariales,Sordariomycetes,
子囊菌门
来源: 丹麦,1993
相关序列: SEQ ID NO:25(编码来自于块团炭角菌的纤维二糖水
解酶I的部分DNA序列),SEQ ID NO:43(编码来自于
块团炭角菌的纤维二糖水解酶I的全长DNA序列),SEQ
ID NO:44(编码来自于块团炭角菌的纤维二糖水解酶I
的全长蛋白序列)。
保藏号: CBS 804.70
申请人证明: ND001227
保藏日期: 公众可获得的
说明: Trichophaea saccata
分类: 子囊菌门,Pezizomycetes,盘菌目,Pyronemataceae
相关序列: SEQ ID NO:36(编码来自于Trichophaea saccata的
纤维二糖水解酶I的部分DNA序列)。
德意志微生物保藏中心(DSMZ)
下列微生物材料已经根据布达佩斯条约在德意志微生物保藏中心(DSM)进行了保藏,Mascheroder Weg 1b,38124 Braunschweig,德国:
保藏号: DSM 14348
申请人证明: ND000551
保藏日期: 2001-06-13
说明: 与质粒连接的栗色新螱,白蚁CBH1基因
分类: -
相关序列: SEQ ID NO:13和SEQ ID NO:14(编码来自于栗色新
螱内脏细胞或微生物的纤维二糖水解酶I的DNA序列
及其相应的蛋白序列)。
保藏号: DSM 15066
申请人证明: ND001349
保藏日期: 2002-06-21
说明: 与质粒连接的poitrasia circinans CBH1基因
分类: 笄霉科,接合菌门,毛霉菌属
来源: -
相关序列: SEQ ID NO:49(编码来自于poitrasia circinans的
纤维二糖水解酶I的DNA序列),SEQ ID NO:50(来自于
poitrasia circinans的纤维二糖水解酶I的蛋白序
列)。
保藏号: DSM 15065
申请人证明: ND001339
保藏日期: 2002-06-21
说明: 与质粒连接的灰色鬼伞CBH1基因
分类: Basidiomycota,Hymenomycetes,Agaricales,
Agaricaceae
来源: 丹麦
相关序列: SEQ ID NO:51(编码来自于灰色鬼伞的纤维二糖水解
酶I的DNA序列),SEQ ID NO:52(来自于灰色鬼伞的
纤维二糖水解酶I的蛋白序列)。
保藏号: DSM 15064
申请人证明: ND001264
保藏日期: 2002-06-21
说明: 与质粒连接的长毛盘菌CBH1基因
分类: 子囊菌门,Pezizomycetes,Pezizales,
Pyronemataceae
来源: -
相关序列: SEQ ID NO:39(编码来自于长毛盘菌的纤维二糖水解
酶I的DNA序列),SEQ ID NO:40(来自于长毛盘菌的
纤维二糖水解酶I的蛋白序列)。
保藏号: DSM 15067
申请人证明: ND001232
保藏日期: 2002-06-21
说明: 与质粒连接的嗜热毁丝霉CBH1基因
分类: Sordariaceae,Sordariales,Sordariomycetes,
子囊菌门
来源: -
相关序列: SEQ ID NO:41(编码来自于嗜热毁丝霉的纤维二糖水
解酶I的DNA序列),SEQ ID NO:42(来自于嗜热毁丝
霉的纤维二糖水解酶I的蛋白序列)。
发酵研究所,大阪(IFO)
下列微生物材料已经根据布达佩斯条约在发酵研究所,大阪(IFO)进行了保藏,17-85,Juso-Honmachi 2-chome,Yodogawa-Ku,大阪532-8686,日本:
保藏号: IFO 5372
申请人证明: ND000531
保藏日期: 公众可获得的(非申请人保藏)
说明: 玫瑰单瑞孢
分类: 有丝分裂孢子的子囊菌门
来源: -
相关序列: SEQ ID NO:17(编码来自于玫瑰单瑞孢的纤维二糖水
解酶I的部分DNA序列)。
保藏的CBS427.97、CBS247.96、CBS521.95、CBS284.96、CBS274.96由Novo Nordisk A/S制备并且稍后转让给了Novozymes A/S。
0-10-1-1 | 表格-PCT/RO/134(EASY)与保藏微生物或其它生物材料相关的简要说明(PCT Rule13bis)准备使用 | PCT-EASY 2.92版(更新于01.06.2002) |
0-2 | 国际申请号 | |
0-3 | 申请人或代理人的申请标识 | 10129.204-WO |
11-11-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 63-6431-2 |
1-31-3-11-3-21-3-31-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0584 |
1-4 | 附注 | 无 |
1-5 | 指定的需要这些说明的国家 | 所有指定国 |
1-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
22-12-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 644-12 |
2-32-3-12-3-22-3-32-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0581 |
2-4 | 附注 | 无 |
2-5 | 指定的需要这些说明的国家 | 所有指定国 |
2-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
33-13-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6414-22 |
3-33-3-13-3-23-3-33-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0585 |
3-4 | 附注 | 无 |
3-5 | 指定的需要这些说明的国家 | 所有指定国 |
3-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
44-14-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6424-32 |
4-3 | 保藏证明 | |
4-3-14-3-24-3-34-3-4 | 保藏单位名称保藏单位地址保藏日期保藏号 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0582 |
4-4 | 附注 | 无 |
4-5 | 指定的需要这些说明的国家 | 所有指定国 |
4-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
5 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明: |
5-15-2 | 页行 | 64-6534-5 |
5-35-3-15-3-25-3-35-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29CGMCC 0583 |
5-4 | 附注 | 无 |
5-5 | 指定的需要这些说明的国家 | 所有指定国 |
5-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
66-16-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 657-15 |
6-36-3-16-3-26-3-3 | 保藏证明保藏单位名称保藏单位地址保藏日期 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2001-05-29 |
6-3-4 | 保藏号 | CGMCC 0580 |
6-4 | 附注 | 无 |
6-5 | 指定的需要这些说明的国家 | 所有指定国 |
6-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
77-17-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6517-23 |
7-37-3-1 | 保藏证明保藏单位名称 | 中国普通微生物中心 |
7-3-27-3-37-3-4 | 保藏单位地址保藏日期保藏号 | 中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2002-06-07CGCCM 0748 |
7-4 | 附注 | 无 |
7-5 | 指定的需要这些说明的国家 | 所有指定国 |
7-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
88-18-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6525-31 |
8-38-3-18-3-28-3-38-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2002-06-07CGCCM 0749 |
8-4 | 附注 | 无 |
8-5 | 指定的需要这些说明的国家 | 所有指定国 |
8-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
99-19-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 65-6633-2 |
9-39-3-19-3-29-3-39-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2002-06-07CGCCM 0747 |
9-4 | 附注 | 无 |
9-5 | 指定的需要这些说明的国家 | 所有指定国 |
9-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1010-110-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 664-10 |
10-310-3-110-3-210-3-310-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 中国普通微生物中心中国微生物菌种保藏管理委员会P.O.Box 2714,北京100080,中国2002-06-07CGCCM 0750 |
10-4 | 附注 | 无 |
10-5 | 指定的需要这些说明的国家 | 所有指定国 |
10-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1111-111-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6618-26 |
11-311-3-111-3-211-3-311-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰2001-06-01CBS 109513 |
11-4 | 附注 | 无 |
11-5 | 指定的需要这些说明的国家 | 所有指定国 |
11-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1212-112-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 66-6737-7 |
12-312-3-112-3-212-3-312-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1997-01-23CBS 427.97 |
12-4 | 附注 | 无 |
12-5 | 指定的需要这些说明的国家 | 所有指定国 |
12-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1313-113-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 679-19 |
13-313-3-113-3-213-3-313-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1996-03-12CBS 247.96 |
13-4 | 附注 | 无 |
13-5 | 指定的需要这些说明的国家 | 所有指定国 |
13-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1414-114-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6730-37 |
14-314-3-114-3-214-3-314-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰2001-05-29CBS 109471 |
14-4 | 附注 | 无 |
14-5 | 指定的需要这些说明的国家 | 所有指定国 |
14-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1515-115-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 682-9 |
15-315-3-115-3-215-3-315-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1995-07-04CBS 521.95 |
15-4 | 附注 | 无 |
15-5 | 指定的需要这些说明的国家 | 所有指定国 |
15-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1616-116-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6826-36 |
16-316-3-116-3-216-3-316-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1996-03-12CBS 284.96 |
16-4 | 附注 | 无 |
16-5 | 指定的需要这些说明的国家 | 所有指定国 |
16-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1717-117-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6811-24 |
17-317-3-117-3-217-3-317-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 真菌菌种保藏中心Uppsalalaan 8,NL-3584 CT Ultrecht,The Netherlands/P.O.Box 85167,NL-3508 AD Utrecht,荷兰1996-03-12CBS 277.96 |
17-4 | 附注 | 无 |
17 -5 | 指定的需要这些说明的国家 | 所有指定国 |
17-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1818-118-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6915-23 |
18-318-3-118-3-218-3-318-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2001-06-13DSMZ 14348 |
l8-4 | 附注 | 无 |
18-5 | 指定的需要这些说明的国家 | 所有指定国 |
18-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
1919-119-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 6925-33 |
19-319-3-119-3-219-3-319-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2002-06-21DSMZ 15066 |
19-4 | 附注 | 无 |
19-5 | 指定的需要这些说明的国家 | 所有指定国 |
19-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
2020-120-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 69-7035-6 |
20-320-3-120-3-220-3-320-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2002-06-21DSMZ 15065 |
20-4 | 附注 | 无 |
20-5 | 指定的需要这些说明的国家 | 所有指定国 |
20-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
2121-121-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 708-16 |
21-321-3-121-3-221-3-321-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2002-06-21DSMZ 15064 |
21-4 | 附注 | 无 |
21-5 | 指定的需要这些说明的国家 | 所有指定国 |
21-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
2222-122-2 | 以下为说明书中涉及保藏微生物或其它生物材料的简要说明:页行 | 708-16 |
22-322-3-122-3-222-3-322-3-4 | 保藏证明保藏单位名称保藏单位地址保藏日期保藏号 | 德意志微生物保藏中心Mascheroder Weg 1b,D-38124 Braunschweig,德国2001-06-13DSMZ 15067 |
22-4 | 附注 | 无 |
22-5 | 指定的需要这些说明的国家 | 所有指定国 |
22-6 | 单独需要声明的稍后这些声明将被提交国际局 | 无 |
序列表
<110> Novozymes A/S
<120> 具有纤维二糖水解酶I活性的多肽和编码多肽的多核苷酸
<130> 10129-WO
<160> 67
<170> PatentIn version 3.1
<210> 1
<211> 1581
<212> DNA
<213> 嗜热支顶孢(Acremonium thermophilum)
<220>
<221> CDS
<222> (1)..(1581)
<223>
<400> 1
atg cac gcc aag ttc gcg acc ctc gcc gcc ctt gtg gcg tcc gcc gcg 48
Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala
1 5 10 15
gcc cag cag gcc tgc aca ctc acg gct gag aac cac ccc acc ctg tcg 96
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser
20 25 30
tgg tcc aag tgc acg tcc ggc ggc agc tgc acc agc gtc tcg ggc tcc 144
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
35 40 45
gtc acc atc gat gcc aac tgg cgg tgg act cac cag gtc tcg agc tcg 192
Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser
50 55 60
acc aac tgc tac acg ggc aat gag tgg gac acg tcc atc tgc acc gac 240
Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp
65 70 75 80
ggt gct tcg tgc gcc gcc gcc tgc tgc ctc gat ggc gcc gac tac tcg 288
Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser
85 90 95
ggc acc tat ggc atc acc acc agc ggc aac gcc ctc agc ctc cag ttc 336
Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe
100 105 110
gtc act cag ggc ccc tac tcg acc aac att ggc tcg cgt acc tac ctg 384
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
atg gcc tcg gac acc aag tac cag atg ttc act ctg ctc ggc aac gag 432
Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu
130 135 140
ttc acc ttc gac gtg gac gtc aca ggc ctc ggc tgc ggt ctg aac ggc 480
Phe Thr Phe Asp Val Asp Val Thr Gly Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
gcc ctc tac ttc gtc tcc atg gac gag gac ggt ggt ctt tcc aag tac 528
Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr
165 170 175
tcg ggc aac aag gct ggc gcc aag tac ggc acc ggc tac tgc gac tcg 576
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
cag tgc ccc cgc gac ctc aag ttc atc aac ggc gag gct aac aac gtt 624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val
195 200 205
ggc tgg acc ccg tcg tcc aac gac aag aac gcc ggc ttg ggc aac tac 672
Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr
210 215 220
ggc agc tgc tgc tcc gag atg gat gtc tgg gag gcc aac agc atc tcg 720
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225 230 235 240
gcg gcc tac acg ccc cat cct tgc act acc atc ggc cag acg cgc tgc 768
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
245 250 255
gag ggc gac gac tgc ggt ggt acc tac agc act gac cgc tac gcc ggc 816
Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
260 265 270
gag tgc gac cct gac gga tgc gac ttc aac tcg tac cgc atg ggc aac 864
Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn
275 280 285
acg acc ttc tac ggc aag ggc atg acc gtc gac acc agc aag aag ttc 912
Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe
290 295 300
acg gtg gtg acc cag ttc ctg acg gac tcg tct ggc aac ctg tcc gag 960
Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu
305 310 315 320
atc aag cgc ttc tac gtc cag aac ggc gtc gtc att ccc aac tcg aac 1008
Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn
325 330 335
tcc aac atc gcg ggc gtc tcg ggc aac tcc atc acc cag gcc ttc tgc 1056
Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys
340 345 350
gat gct cag aag acc gct ttc ggc gac acc aac gtc ttc gac caa aag 1104
Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys
355 360 365
ggc ggc ctg gcc cag atg ggc aag gct ctt gcc cag ccc atg gtc ctc 1152
Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu
370 375 380
gtc atg tcc ctc tgg gac gac cac gcc gtc aac atg ctc tgg ctc gac 1200
Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
tcg acc tac ccg acc aac gcg gcc ggc aag ccg ggc gcc gcc cgc ggt 1248
Ser Thr Tyr Pro Thr Asn Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly
405 410 415
acc tgc ccc acc acc tcg ggc gtc ccc gcc gac gtc gag tcc cag gcg 1296
Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala
420 425 430
ccc aac tcc aag gtc atc tac tcc aac atc cgc ttc ggc ccc atc ggc 1344
Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
tcc acc gtc tcc ggc ctg ccc ggc ggc ggc agc aac ccc ggc ggc ggc 1392
Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly
450 455 460
tcc agc tcc acc acc acc acc acc aga ccc gcc acc tcc acc acc tcc 1440
Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser
465 470 475 480
tcg gcc agc tcc ggc ccg acc ggc ggt ggc acg gct gcc cac tgg ggc 1488
Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly
485 490 495
cag tgc ggc ggc atc ggc tgg acc ggc ccg acc gtc tgc gcc tcg ccc 1536
Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro
500 505 510
tac acc tgc cag aag ctg aac gac tgg tac tac cag tgc ctc taa 1581
Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu
515 520 525
<210> 2
<211> 526
<212> PRT
<213> 嗜热支顶孢(Acremonium thermophilum)
<400> 2
Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala
1 5 10 15
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser
20 25 30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
35 40 45
Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp
65 70 75 80
Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser
85 90 95
Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe
100 105 110
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Thr Gly Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr
165 170 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val
195 200 205
Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr
210 215 220
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225 230 235 240
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
245 250 255
Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
260 265 270
Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn
275 280 285
Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe
290 295 300
Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn
325 330 335
Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys
340 345 350
Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys
355 360 365
Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Tyr Pro Thr Asn Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly
405 410 415
Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala
420 425 430
Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly
450 455 460
Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser
465 470 475 480
Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly
485 490 495
Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro
500 505 510
Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu
515 520 525
<210> 3
<211> 1590
<212> DNA
<213> 嗜热毛壳酶(Chaetomium thermophilum)
<220>
<221> CDS
<222> (1)..(1590)
<223>
<400> 3
atg atg tac aag aag ttc gcc gct ctc gcc gcc ctc gtg gct ggc gcc 48
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
1 5 10 15
gcc gcc cag cag gct tgc tcc ctc acc act gag acc cac ccc aga ctc 96
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
20 25 30
act tgg aag cgc tgc acc tct ggc ggc aac tgc tcg acc gtg aac ggc 144
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
35 40 45
gcc gtc acc atc gat gcc aac tgg cgc tgg act cac acc gtt tcc ggc 192
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
50 55 60
tcg acc aac tgc tac acc ggc aac gag tgg gat acc tcc atc tgc tct 240
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
65 70 75 80
gat ggc aag agc tgc gcc cag acc tgc tgc gtc gac ggc gct gac tac 288
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
tct tcg acc tat ggt atc acc acc agc ggt gac tcc ctg aac ctc aag 336
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
100 105 110
ttc gtc acc aag cac cag tac ggc acc aat gtc ggc tct cgt gtc tac 384
Phe Val Thr Lys His Gln Tyr Gly Thr Asn Val Gly Ser Arg Val Tyr
115 120 125
ctg atg gag aac gac acc aag tac cag atg ttc gag ctc ctc ggc aac 432
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
130 135 140
gag ttc acc ttc gat gtc gat gtc tct aac ctg ggc tgc ggt ctc aac 480
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
145 150 155 160
ggt gcc ctc tac ttc gtc tcc atg gac gct gat ggt ggt atg agc aag 528
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
tac tct ggc aac aag gct ggc gcc aag tac ggg acg ggg tac tgt gat 576
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
gct cag tgc ccg cgc gac ctt aag ttc atc aac ggc gag gcc aac att 624
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
gag aac tgg acc cct tcg acc aat gat gcc aac gcc ggt ttc ggc cgc 672
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
210 215 220
tat ggc agc tgc tgc tct gag atg gat atc tgg gag gcc aac aac atg 720
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225 230 235 240
gct act gcc ttc act cct cac cct tgc acc att atc ggc cag agc cgc 768
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
tgc gag ggc aac agc tgc ggt ggc acc tac agc tct gag cgc tat gct 816
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
260 265 270
ggt gtt tgc gat cct gat ggc tgc gac ttc aac gcc tac cgc cag ggc 864
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
275 280 285
gac aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag 912
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
atg acc gtc gtc acc cag ttc cac aag aac tcg gct ggc gtc ctc agc 960
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
305 310 315 320
gag atc aag cgc ttc tac gtt cag gac ggc aag gtc att gcc aac gcc 1008
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Val Ile Ala Asn Ala
325 330 335
gag tcc aag atc ccc ggc aac ccc ggc aac tcc atc acc cag gag tgg 1056
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
340 345 350
tgc gat gcc cag aag gtc gcc ttc ggt gac atc gat gac ttc aac cgc 1104
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
aag ggc ggt atg gct cag atg agc aag gcc ctc gaa ggc cct atg gtc 1152
Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val
370 375 380
ctg gtc atg tcc gtc tgg gat gac cac tac gcc aac atg ctc tgg ctc 1200
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
385 390 395 400
gac tcg acc tac ccc atc gac aag gcc ggc acc ccc ggc gcc gag cgc 1248
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
405 410 415
ggt gct tgc ccg acc acc tcc ggt gtc cct gcc gag att gag gcc cag 1296
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
420 425 430
gtc ccc aac agc aac gtc atc ttc tcc aac atc cgc ttc ggc ccc atc 1344
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
ggc tcg acc gtc cct ggc ctc gac ggc agc act ccc agc aac ccg acc 1392
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
450 455 460
gcc acc gtt gct cct ccc act tct acc acc agc gtg aga agc agc act 1440
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Ser Val Arg Ser Ser Thr
465 470 475 480
act cag att tcc acc ccg act agc cag ccc ggc ggc tgc acc acc cag 1488
Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr Gln
485 490 495
aag tgg ggc cag tgc ggt ggt atc ggc tac acc ggc tgc act aac tgc 1536
Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn Cys
500 505 510
gtt gct ggc act acc tgc act gag ctc aac ccc tgg tac agc cag tgc 1584
Val Ala Gly Thr Thr Cys Thr Glu Leu Ash Pro Trp Tyr Ser Gln Cys
515 520 525
ctg taa 1590
Leu
<210> 4
<211> 529
<212> PRT
<213> 嗜热毛壳酶(Chaetomium thermophilum)
<400> 4
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
1 5 10 15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
20 25 30
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
35 40 45
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
50 55 60
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
65 70 75 80
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
100 105 110
Phe Val Thr Lys His Gln Tyr Gly Thr Asn Val Gly Ser Arg Val Tyr
115 120 125
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
145 150 155 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
210 215 220
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225 230 235 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
260 265 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
275 280 285
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
305 310 315 320
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Val Ile Ala Asn Ala
325 330 335
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
340 345 350
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val
370 375 380
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
385 390 395 400
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
405 410 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
420 425 430
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
450 455 460
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Ser Val Arg Ser Ser Thr
465 470 475 480
Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr Gln
485 490 495
Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn Cys
500 505 510
Val Ala Gly Thr Thr Cys Thr Glu Leu Asn Pro Trp Tyr Ser Gln Cys
515 520 525
Leu
<210> 5
<211> 1356
<212> DNA
<213> 小柱胞菌(Scytalidium sp.)
<220>
<221> CDS
<222> (1)..(1356)
<223>
<400> 5
atg cag atc aag agc tac atc cag tac ctg gcc gcg gct ctg ccg ctc 48
Met Gln Ile Lys Ser Tyr Ile Gln Tyr Leu Ala Ala Ala Leu Pro Leu
1 5 10 15
ctg agc agc gtc gct gcc cag cag gcc ggc acc atc acc gcc gag aac 96
Leu Ser Ser Val Ala Ala Gln Gln Ala Gly Thr Ile Thr Ala Glu Asn
20 25 30
cac ccc agg atg acc tgg aag agg tgc tcg ggc ccc ggc aac tgc cag 144
His Pro Arg Met Thr Trp Lys Arg Cys Ser Gly Pro Gly Asn Cys Gln
35 40 45
acc gtg cag ggc gag gtc gtc atc gac gcc aac tgg cgc tgg ctg cac 192
Thr Val Gln Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His
50 55 60
aac aac ggc cag aac tgc tat gag ggc aac aag tgg acc agc cag tgc 240
Asn Asn Gly Gln Asn Cys Tyr Glu Gly Asn Lys Trp Thr Ser Gln Cys
65 70 75 80
agc tcg gcc acc gac tgc gcg cag agg tgc gcc ctc gac ggt gcc aac 288
Ser Ser Ala Thr Asp Cys Ala Gln Arg Cys Ala Leu Asp Gly Ala Asn
85 90 95
tac cag tcg acc tac ggc gcc tcg acc agc ggc gac tcc ctg acg ctc 336
Tyr Gln Ser Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu
100 105 110
aag ttc gtc acc aag cac gag tac ggc acc aac atc ggc tcg cgc ttc 384
Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe
115 120 125
tac ctc atg gcc aac cag aac aag tac cag atg ttc acc ctg atg aac 432
Tyr Leu Met Ala Asn Gln Asn Lys Tyr Gln Met Phe Thr Leu Met Asn
130 135 140
aac gag ttc gcc ttc gat gtc gac ctc tcc aag gtt gag tgc ggt atc 480
Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Lys Val Glu Cys Gly Ile
145 150 155 160
aac agc gct ctg tac ttc gtc gcc atg gag gag gat ggt ggc atg gcc 528
Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala
165 170 175
agc tac ccg agc aac cgt gct ggt gcc aag tac ggc acg ggc tac tgc 576
Ser Tyr Pro Ser Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
180 185 190
gat gcc caa tgc gcc cgt gac ctc aag ttc att ggc ggc aag gcc aac 624
Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Ile Gly Gly Lys Ala Asn
195 200 205
att gag ggc tgg cgc ccg tcc acc aac gac ccc aac gcc ggt gtc ggt 672
Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Pro Asn Ala Gly Val Gly
210 215 220
ccc atg ggt gcc tgc tgc gct gag atc gac gtt tgg gag tcc aac gcc 720
Pro Met Gly Ala Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala
225 230 235 240
tat gct tat gcc ttc acc ccc cac gcc tgc ggc agc aag aac cgc tac 768
Tyr Ala Tyr Ala Phe Thr Pro His Ala Cys Gly Ser Lys Asn Arg Tyr
245 250 255
cac atc tgc gag acc aac aac tgc ggt ggt acc tac tcg gat gac cgc 816
His Ile Cys Glu Thr Asn Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg
260 265 270
ttc gcc ggc tac tgc gac gcc aac ggc tgc gac tac aac ccc tac cgc 864
Phe Ala Gly Tyr Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg
275 280 285
atg ggc aac aag gac ttc tat ggc aag ggc aag acc gtc gac acc aac 912
Met Gly Asn Lys Asp Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Asn
290 295 300
cgc aag ttc acc gtt gtc tcc cgc ttc gag cgt aac agg ctc tct cag 960
Arg Lys Phe Thr Val Val Ser Arg Phe Glu Arg Asn Arg Leu Ser Gln
305 310 315 320
ttc ttc gtc cag gac ggc cgc aag atc gag gtg ccc cct ccg acc tgg 1008
Phe Phe Val Gln Asp Gly Arg Lys Ile Glu Val Pro Pro Pro Thr Trp
325 330 335
ccc ggc ctc ccg aac agc gcc gac atc acc cct gag ctc tgc gat gct 1056
Pro Gly Leu Pro Asn Ser Ala Asp Ile Thr Pro Glu Leu Cys Asp Ala
340 345 350
cag ttc cgc gtc ttc gat gac cgc aac cgc ttc gcc gag acc ggt ggc 1104
Gln Phe Arg Val Phe Asp Asp Arg Asn Arg Phe Ala Glu Thr Gly Gly
355 360 365
ttc gat gct ctg aac gag gcc ctc acc att ccc atg gtc ctt gtc atg 1152
Phe Asp Ala Leu Asn Glu Ala Leu Thr Ile Pro Met Val Leu Val Met
370 375 380
tcc atc tgg gat gac cac cac tcc aac atg ctc tgg ctc gac tcc agc 1200
Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp Ser Ser
385 390 395 400
tac ccg ccc gag aag gcc ggc ctc ccc ggt ggc gac cgt ggc ccg tgc 1248
Tyr Pro Pro Glu Lys Ala Gly Leu Pro Gly Gly Asp Arg Gly Pro Cys
405 410 415
ccg acc acc tct ggt gtc cct gcc gag gtc gag gct cag tac ccc gat 1296
Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asp
420 425 430
gct cag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg acc 1344
Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr
435 440 445
gtc aac gtc taa 1356
Val Asn Val
450
<210> 6
<211> 451
<212> PRT
<213> 小柱胞菌(Scytalidium sp.)
<400> 6
Met Gln Ile Lys Ser Tyr Ile Gln Tyr Leu Ala Ala Ala Leu Pro Leu
1 5 10 15
Leu Ser Ser Val Ala Ala Gln Gln Ala Gly Thr Ile Thr Ala Glu Asn
20 25 30
His Pro Arg Met Thr Trp Lys Arg Cys Ser Gly Pro Gly Asn Cys Gln
35 40 45
Thr Val Gln Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His
50 55 60
Asn Asn Gly Gln Asn Cys Tyr Glu Gly Asn Lys Trp Thr Ser Gln Cys
65 70 75 80
Ser Ser Ala Thr Asp Cys Ala Gln Arg Cys Ala Leu Asp Gly Ala Asn
85 90 95
Tyr Gln Ser Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu
100 105 110
Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe
115 120 125
Tyr Leu Met Ala Asn Gln Asn Lys Tyr Gln Met Phe Thr Leu Met Asn
130 135 140
Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Lys Val Glu Cys Gly Ile
145 150 155 160
Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala
165 170 175
Ser Tyr Pro Ser Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
180 185 190
Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Ile Gly Gly Lys Ala Asn
195 200 205
Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Pro Asn Ala Gly Val Gly
210 215 220
Pro Met Gly Ala Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala
225 230 235 240
Tyr Ala Tyr Ala Phe Thr Pro His Ala Cys Gly Ser Lys Asn Arg Tyr
245 250 255
His Ile Cys Glu Thr Asn Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg
260 265 270
Phe Ala Gly Tyr Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg
275 280 285
Met Gly Asn Lys Asp Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Asn
290 295 300
Arg Lys Phe Thr Val Val Ser Arg Phe Glu Arg Asn Arg Leu Ser Gln
305 310 315 320
Phe Phe Val Gln Asp Gly Arg Lys Ile Glu Val Pro Pro Pro Thr Trp
325 330 335
Pro Gly Leu Pro Asn Ser Ala Asp Ile Thr Pro Glu Leu Cys Asp Ala
340 345 350
Gln Phe Arg Val Phe Asp Asp Arg Asn Arg Phe Ala Glu Thr Gly Gly
355 360 365
Phe Asp Ala Leu Asn Glu Ala Leu Thr Ile Pro Met Val Leu Val Met
370 375 380
Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp Ser Ser
385 390 395 400
Tyr Pro Pro Glu Lys Ala Gly Leu Pro Gly Gly Asp Arg Gly Pro Cys
405 410 415
Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asp
420 425 430
Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr
435 440 445
Val Asn Val
450
<210> 7
<211> 1374
<212> DNA
<213> 橙黄色热子囊菌(Thermoascus aurantiacus)
<220>
<221> CDS
<222> (1)..(1374)
<223>
<400> 7
atg tat cag cgc gct ctt ctc ttc tct ttc ttc ctc tcc gcc gcc cgc 48
Met Tyr Gln Arg Ala Leu Leu Phe Ser Phe Phe Leu Ser Ala Ala Arg
1 5 10 15
gcg cag cag gcc ggt acc cta acc gca gag aat cac cct tcc ctg acc 96
Ala Gln Gln Ala Gly Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
20 25 30
tgg cag caa tgc tcc agc ggc ggt agt tgt acc acg cag aat gga aaa 144
Trp Gln Gln Cys Ser Ser Gly Gly Ser Cys Thr Thr Gln Asn Gly Lys
35 40 45
gtc gtt atc gat gcg aac tgg cgt tgg gtc cat acc acc tct gga tac 192
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Thr Thr Ser Gly Tyr
50 55 60
acc aac tgc tac acg ggc aat acg tgg gac acc agt atc tgt ccc gac 240
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Pro Asp
65 70 75 80
gac gtg acc tgc gct cag aat tgt gcc ttg gat gga gcg gat tac agt 288
Asp Val Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
85 90 95
ggc acc tat ggt gtt acg acc agt ggc aac gcc ctg aga ctg aac ttt 336
Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Arg Leu Asn Phe
100 105 110
gtc acc caa agc tca ggg aag aac att ggc tcg cgc ctg tac ctg ctg 384
Val Thr Gln Ser Ser Gly Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu
115 120 125
cag gac gac acc act tat cag atc ttc aag ctg ctg ggt cag gag ttt 432
Gln Asp Asp Thr Thr Tyr Gln Ile Phe Lys Leu Leu Gly Gln Glu Phe
130 135 140
acc ttc gat gtc gac gtc tcc aat ctc cct tgc ggg ctg aac ggc gcc 480
Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
ctc tac ttt gtg gcc atg gac gcc gac ggc gga ttg tcc aaa tac cct 528
Leu Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Leu Ser Lys Tyr Pro
165 170 175
ggc aac aag gca ggc gct aag tat ggc act ggt tac tgc gac tct cag 576
Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
tgc cct cgg gat ctc aag ttc atc aac ggt cag gcc aac gtt gaa ggc 624
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
tgg cag ccg tct gcc aac gac cca aat gcc ggc gtt ggt aac cac ggt 672
Trp Gln Pro Ser Ala Asn Asp Pro Asn Ala Gly Val Gly Asn His Gly
210 215 220
tcc tgc tgc gct gag atg gat gtc tgg gaa gcc aac agc atc tct act 720
Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Thr
225 230 235 240
gcg gtg acg cct cac cca tgc gac acc ccc ggc cag acc atg tgc cag 768
Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Gln
245 250 255
gga gac gac tgt ggt gga acc tac tcc tcc act cga tat gct ggt acc 816
Gly Asp Asp Cys Gly Gly Thr Tyr Ser Ser Thr Arg Tyr Ala Gly Thr
260 265 270
tgc gac cct gat ggc tgc gac ttc aat cct tac cgc cag ggc aac cac 864
Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Gln Gly Asn His
275 280 285
tcg ttc tac ggc ccc ggg aag atc gtc gac act agc tcc aaa ttc acc 912
Ser Phe Tyr Gly Pro Gly Lys Ile Val Asp Thr Ser Ser Lys Phe Thr
290 295 300
gtc gtc acc cag ttc atc acc gac gac ggg acc ccc tcc ggc acc ctg 960
Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Pro Ser Gly Thr Leu
305 310 315 320
acg gag atc aaa cgc ttc tac gtc cag aac ggc aag gtg atc ccc cag 1008
Thr Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln
325 330 335
tcg gag tcg acg atc agc ggc gtc acc ggc aac tca atc acc acc gag 1056
Ser Glu Ser Thr Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu
340 345 350
tat tgc acg gcc cag aag gcc gcc ttc ggc gac aac acc ggc ttc ttc 1104
Tyr Cys Thr Ala Gln Lys Ala Ala Phe Gly Asp Asn Thr Gly Phe Phe
355 360 365
acg cac ggc ggg ctt cag aag atc agt cag gct ctg gct cag ggc atg 1152
Thr His Gly Gly Leu Gln Lys Ile Ser Gln Ala Leu Ala Gln Gly Met
370 375 380
gtc ctc gtc atg agc ctg tgg gac gat cac gcc gcc aac atg ctc tgg 1200
Val Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asn Met Leu Trp
385 390 395 400
ctg gac agc acc tac ccg act gat gcg gac ccg gac acc cct ggc gtc 1248
Leu Asp Ser Thr Tyr Pro Thr Asp Ala Asp Pro Asp Thr Pro Gly Val
405 410 415
gcg cgc ggt acc tgc ccc acg acc tcc ggc gtc ccg gcc gac gtt gag 1296
Ala Arg Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu
420 425 430
tcg cag aac ccc aat tca tat gtt atc tac tcc aac atc aag gtc gga 1344
Ser Gln Asn Pro Asn Ser Tyr Val Ile Tyr Ser Asn Ile Lys Val Gly
435 440 445
ccc atc aac tcg acc ttc acc gcc aac taa 1374
Pro Ile Asn Ser Thr Phe Thr Ala Asn
450 455
<210> 8
<211> 457
<212> PRT
<213> 橙黄色热子囊菌(Thermoascus aurantiacus)
<400> 8
Met Tyr Gln Arg Ala Leu Leu Phe Ser Phe Phe Leu Ser Ala Ala Arg
1 5 10 15
Ala Gln Gln Ala Gly Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
20 25 30
Trp Gln Gln Cys Ser Ser Gly Gly Ser Cys Thr Thr Gln Asn Gly Lys
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Thr Thr Ser Gly Tyr
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Pro Asp
65 70 75 80
Asp Val Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
85 90 95
Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Arg Leu Asn Phe
100 105 110
Val Thr Gln Ser Ser Gly Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu
115 120 125
Gln Asp Asp Thr Thr Tyr Gln Ile Phe Lys Leu Leu Gly Gln Glu Phe
130 135 140
Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Leu Ser Lys Tyr Pro
165 170 175
Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Gln Pro Ser Ala Asn Asp Pro Asn Ala Gly Val Gly Asn His Gly
210 215 220
Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Thr
225 230 235 240
Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Gln
245 250 255
Gly Asp Asp Cys Gly Gly Thr Tyr Ser Ser Thr Arg Tyr Ala Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Gln Gly Asn His
275 280 285
Ser Phe Tyr Gly Pro Gly Lys Ile Val Asp Thr Ser Ser Lys Phe Thr
290 295 300
Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Pro Ser Gly Thr Leu
305 310 315 320
Thr Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln
325 330 335
Ser Glu Ser Thr Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu
340 345 350
Tyr Cys Thr Ala Gln Lys Ala Ala Phe Gly Asp Asn Thr Gly Phe Phe
355 360 365
Thr His Gly Gly Leu Gln Lys Ile Ser Gln Ala Leu Ala Gln Gly Met
370 375 380
Val Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asn Met Leu Trp
385 390 395 400
Leu Asp Ser Thr Tyr Pro Thr Asp Ala Asp Pro Asp Thr Pro Gly Val
405 410 415
Ala Arg Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu
420 425 430
Ser Gln Asn Pro Asn Ser Tyr Val Ile Tyr Ser Asn Ile Lys Val Gly
435 440 445
Pro Ile Asn Ser Thr Phe Thr Ala Asn
450 455
<210> 9
<211> 1617
<212> DNA
<213> Thielavia australiensis
<220>
<221> CDS
<222> (1)..(1617)
<223>
<400> 9
atg tat gcc aag ttc gcg acc ctc gcc gcc ctc gtg gct ggc gcc tcc 48
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ser
1 5 10 15
gcc cag gcc gtc tgc agc ctt acc gct gag acg cac cct tcc ctg acg 96
Ala Gln Ala Val Cys Ser Leu Thr Ala Glu Thr His Pro Ser Leu Thr
20 25 30
tgg cag aag tgc acg gcc ccc ggc agc tgc acc aac gtc gcc ggc tcc 144
Trp Gln Lys Cys Thr Ala Pro Gly Ser Cys Thr Asn Val Ala Gly Ser
35 40 45
atc acc atc gac gcc aac tgg cgc tgg act cac cag acc tcg tcc gcg 192
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Thr Ser Ser Ala
50 55 60
acc aac tgc tac agc ggc agc aag tgg gac tcg tcc atc tgc acg acc 240
Thr Asn Cys Tyr Ser Gly Ser Lys Trp Asp Ser Ser Ile Cys Thr Thr
65 70 75 80
ggc acc gac tgc gcc tcc aag tgc tgc att gat ggc gcc gag tac tcg 288
Gly Thr Asp Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Glu Tyr Ser
85 90 95
agc acc tac ggc atc acc acc agc ggc aat gcc ctg aac ctc aag ttc 336
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
100 105 110
gtc acc aag ggc cag tac tcg acc aac att ggc tcg cgt acc tac ctc 384
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
atg gag tcg gac acc aag tac cag atg ttc aag ctc ctt ggc aac gag 432
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Lys Leu Leu Gly Asn Glu
130 135 140
ttc acc ttc gac gtc gat gtc tcc aac ctc ggc tgc ggc ctc aac ggc 480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
gcc ctg tac ttc gtc tcc atg gat gcc gac ggt ggc atg tcc aag tac 528
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
165 170 175
tcg ggc aac aag gcc ggt gcc aag tac ggt acc ggc tac tgc gat gct 576
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
cag tgc ccc cgc gac ctc aag ttc atc aac ggc gag gcc aac gtt gag 624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu
195 200 205
ggc tgg gag agc tcg acc aac gac gcc aac gcc ggc tcg ggc aag tac 672
Gly Trp Glu Ser Ser Thr Asn Asp Ala Asn Ala Gly Ser Gly Lys Tyr
210 215 220
ggc agc tgc tgc acc gag atg gac gtc tgg gag gcc aac aac atg gcg 720
Gly Ser Cys Cys Thr Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala
225 230 235 240
act gcc ttc act cct cac cct tgc acc acc att ggc cag act cgc tgc 768
Thr Ala Phe Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
245 250 255
gag ggc gac acc tgc ggc ggc acc tac agc tca gac cgc tac gcc ggc 816
Glu Gly Asp Thr Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
260 265 270
gtc tgc gac ccc gac gga tgc gac ttc aac tcg tac cgc cag ggc aac 864
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn
275 280 285
aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag atc 912
Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile
290 295 300
acg gtc gtc acc cag ttc ctc aag aac tcg gcc ggc gag ctc tcc gag 960
Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu
305 310 315 320
atc aag cgc ttc tac gcc cag gac ggc aag gtc atc ccg aac agt gag 1008
Ile Lys Arg Phe Tyr Ala Gln Asp Gly Lys Val Ile Pro Asn Ser Glu
325 330 335
tct acc att gcc ggc atc ccc ggc aac tcc atc acc aag gcc tac tgc 1056
Ser Thr Ile Ala Gly Ile Pro Gly Asn Ser Ile Thr Lys Ala Tyr Cys
340 345 350
gac gcc cag aag acc gtc ttc cag aac acc gac gac ttc acc gcc aag 1104
Asp Ala Gln Lys Thr Val Phe Gln Asn Thr Asp Asp Phe Thr Ala Lys
355 360 365
ggc ggc ctc gtc cag atg ggc aag gcc ctc gcc ggc gac atg gtc ctc 1152
Gly Gly Leu Val Gln Met Gly Lys Ala Leu Ala Gly Asp Met Val Leu
370 375 380
gtc atg tcc gtc tgg gac gac cac gcc gtc aac atg ctc tgg cta gac 1200
Val Met Ser Val Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
tcg acc tac ccg acc gac cag gtc ggc gtt gcc ggc gct gag cgc ggc 1248
Ser Thr Tyr Pro Thr Asp Gln Val Gly Val Ala Gly Ala Glu Arg Gly
405 410 415
gcc tgc ccc acc acc tcg ggc gtc ccc tcg gat gtt gag gcc aac gcc 1296
Ala Cys Pro Thr Thr Ser Gly Val Pro Ser Asp Val Glu Ala Asn Ala
420 425 430
ccc aac tcc aac gtc atc ttc tcc aac atc cgc ttc ggc ccc atc ggc 1344
Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
tcc acc gtc cag ggc ctg ccc agc tcc ggc ggc acc tcc agc agc tcg 1392
Ser Thr Val Gln Gly Leu Pro Ser Ser Gly Gly Thr Ser Ser Ser Ser
450 455 460
agc gcc gct ccc cag tcg acc agc acc aag gcc tcg acc acc acc tca 1440
Ser Ala Ala Pro Gln Ser Thr Ser Thr Lys Ala Ser Thr Thr Thr Ser
465 470 475 480
gct gtc cgc acc acc tcg act gcc acc acc aag acc acc tcc tcg gct 1488
Ala Val Arg Thr Thr Ser Thr Ala Thr Thr Lys Thr Thr Ser Ser Ala
485 490 495
ccc gcc cag ggc acc aac act gcc aag cat tgg cag caa tgc ggt ggt 1536
Pro Ala Gln Gly Thr Asn Thr Ala Lys His Trp Gln Gln Cys Gly Gly
500 505 510
aac ggc tgg acc ggc ccg acg gtg tgc gag tct ccc tac aag tgc acc 1584
Asn Gly Trp Thr Gly Pro Thr Val Cys Glu Ser Pro Tyr Lys Cys Thr
515 520 525
aag cag aac gac tgg tac tcg cag tgc ctc taa 1617
Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu
530 535
<210> 10
<211> 538
<212> PRT
<213> Thielavia australiensis
<400> 10
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ser
1 5 10 15
Ala Gln Ala Val Cys Ser Leu Thr Ala Glu Thr His Pro Ser Leu Thr
20 25 30
Trp Gln Lys Cys Thr Ala Pro Gly Ser Cys Thr Asn Val Ala Gly Ser
35 40 45
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Thr Ser Ser Ala
50 55 60
Thr Asn Cys Tyr Ser Gly Ser Lys Trp Asp Ser Ser Ile Cys Thr Thr
65 70 75 80
Gly Thr Asp Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Glu Tyr Ser
85 90 95
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
100 105 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Lys Leu Leu Gly Asn Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
165 170 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu
195 200 205
Gly Trp Glu Ser Ser Thr Asn Asp Ala Asn Ala Gly Ser Gly Lys Tyr
210 215 220
Gly Ser Cys Cys Thr Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala
225 230 235 240
Thr Ala Phe Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
245 250 255
Glu Gly Asp Thr Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
260 265 270
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn
275 280 285
Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile
290 295 300
Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Ala Gln Asp Gly Lys Val Ile Pro Asn Ser Glu
325 330 335
Ser Thr Ile Ala Gly Ile Pro Gly Asn Ser Ile Thr Lys Ala Tyr Cys
340 345 350
Asp Ala Gln Lys Thr Val Phe Gln Asn Thr Asp Asp Phe Thr Ala Lys
355 360 365
Gly Gly Leu Val Gln Met Gly Lys Ala Leu Ala Gly Asp Met Val Leu
370 375 380
Val Met Ser Val Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Tyr Pro Thr Asp Gln Val Gly Val Ala Gly Ala Glu Arg Gly
405 410 415
Ala Cys Pro Thr Thr Ser Gly Val Pro Ser Asp Val Glu Ala Asn Ala
420 425 430
Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
Ser Thr Val Gln Gly Leu Pro Ser Ser Gly Gly Thr Ser Ser Ser Ser
450 455 460
Ser Ala Ala Pro Gln Ser Thr Ser Thr Lys Ala Ser Thr Thr Thr Ser
465 470 475 480
Ala Val Arg Thr Thr Ser Thr Ala Thr Thr Lys Thr Thr Ser Ser Ala
485 490 495
Pro Ala Gln Gly Thr Asn Thr Ala Lys His Trp Gln Gln Cys Gly Gly
500 505 510
Asn Gly Trp Thr Gly Pro Thr Val Cys Glu Ser Pro Tyr Lys Cys Thr
515 520 525
Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu
530 535
<210> 11
<211> 1248
<212> DNA
<213> 幼嫩轮枝孢(Verticillium tenerum)
<220>
<221> CDS
<222> (1)..(1248)
<223>
<400> 11
atg aag aag gct ctc atc acc agc ctc tcc ctg ctg gcc acg gcc atg 48
Met Lys Lys Ala Leu Ile Thr Ser Leu Ser Leu Leu Ala Thr Ala Met
1 5 10 15
ggc cag cag gcc ggt acc ctc gag acc gag acg cat ccc aag ctg acc 96
Gly Gln Gln Ala Gly Thr Leu Glu Thr Glu Thr His Pro Lys Leu Thr
20 25 30
tgg cag cgc tgc acc acc tcc ggc tgt acc aac gtc aac ggc gag gtc 144
Trp Gln Arg Cys Thr Thr Ser Gly Cys Thr Asn Val Asn Gly Glu Val
35 40 45
gtc atc gac gcc aac tgg cgt tgg gcc cac gac atc aac ggc tac gag 192
Val Ile Asp Ala Asn Trp Arg Trp Ala His Asp Ile Asn Gly Tyr Glu
50 55 60
aac tgc ttc gag ggc aac acc tgg acc ggc acc tgc agc ggc gcc gac 240
Asn Cys Phe Glu Gly Asn Thr Trp Thr Gly Thr Cys Ser Gly Ala Asp
65 70 75 80
ggc tgc gcg aag aac tgc gcc gtc gag gga gcc aac tac cag tcg acc 288
Gly Cys Ala Lys Asn Cys Ala Val Glu Gly Ala Asn Tyr Gln Ser Thr
85 90 95
tac ggt gtc tcg acc agc ggc aac gcc ctc tcc ctg cgc ttc gtc acc 336
Tyr Gly Val Ser Thr Ser Gly Asn Ala Leu Ser Leu Arg Phe Val Thr
100 105 110
gag cac gag cac ggc gtc aac acc ggt tcg cgc acg tac ctc atg gag 384
Glu His Glu His Gly Val Asn Thr Gly Ser Arg Thr Tyr Leu Met Glu
115 120 125
agc gcc acc aag tac cag atg ttc acc ctg atg aac aac gag ctc gcc 432
Ser Ala Thr Lys Tyr Gln Met Phe Thr Leu Met Asn Asn Glu Leu Ala
130 135 140
ttc gac gtc gac ctg tcc aag gtc gcc tgc ggc atg aac agc gcc ctc 480
Phe Asp Val Asp Leu Ser Lys Val Ala Cys Gly Met Asn Ser Ala Leu
145 150 155 160
tac ctc gtc ccc atg aag gcc gac ggc ggt ctc tcg tcc gag acc aac 528
Tyr Leu Val Pro Met Lys Ala Asp Gly Gly Leu Ser Ser Glu Thr Asn
165 170 175
aac aac gcc ggc gcc aag tac ggt acc ggt tac tgc gac gcc cag tgc 576
Asn Asn Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys
180 185 190
gct cgc gat ctc aag ttc gtc aac ggc aag gcc aac atc gag ggc tgg 624
Ala Arg Asp Leu Lys Phe Val Asn Gly Lys Ala Asn Ile Glu Gly Trp
195 200 205
caa gcc tcc aag acc gac gag aac tct ggc gtc ggt aac atg ggc tcc 672
Gln Ala Ser Lys Thr Asp Glu Asn Ser Gly Val Gly Asn Met Gly Ser
210 215 220
tgc tgt gct gag att gac gtt tgg gag tcc aac cgc gag tct ttc gcc 720
Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Arg Glu Ser Phe Ala
225 230 235 240
ttc acc cct cac gct tgc tcg cag aac gag tac cac gtc tgc acc ggc 768
Phe Thr Pro His Ala Cys Ser Gln Asn Glu Tyr His Val Cys Thr Gly
245 250 255
gcc aac tgc ggc ggt acc tac tcg gac gac cgc ttc gcc ggc aag tgc 816
Ala Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe Ala Gly Lys Cys
260 265 270
gat gcc aac ggt tgc gac tac aac ccc ttc cgc gtg ggc aac cag aac 864
Asp Ala Asn Gly Cys Asp Tyr Asn Pro Phe Arg Val Gly Asn Gln Asn
275 280 285
ttc tac ggc ccc ggc atg acc gtc aac acc aac tcc aag ttc act gtc 912
Phe Tyr Gly Pro Gly Met Thr Val Asn Thr Asn Ser Lys Phe Thr Val
290 295 300
atc tct cgc ttc cgg gag aac gag gcc tac cag gtc ttc atc cag aac 960
Ile Ser Arg Phe Arg Glu Asn Glu Ala Tyr Gln Val Phe Ile Gln Asn
305 310 315 320
ggc cgc acc atc gag gtc ccc cgt ccc acc ctc tcc ggc atc acc cag 1008
Gly Arg Thr Ile Glu Val Pro Arg Pro Thr Leu Ser Gly Ile Thr Gln
325 330 335
ttc gag gcc aag atc acc ccc gag ttc tgc tcg acc tac ccc acc gtc 1056
Phe Glu Ala Lys Ile Thr Pro Glu Phe Cys Ser Thr Tyr Pro Thr Val
340 345 350
ttc ggc gac cgc gac cgc cac ggc gag atc ggc ggc cac acc gcc ctc 1104
Phe Gly Asp Arg Asp Arg His Gly Glu Ile Gly Gly His Thr Ala Leu
355 360 365
aac gcg gcc ctc cgc atg ccc atg gtc ctc gtc atg tcc atc tgg gcc 1152
Asn Ala Ala Leu Arg Met Pro Met Val Leu Val Met Ser Ile Trp Ala
370 375 380
gac cac tac gcc aac atg ctc tgg ctc gac tcc atc tac ccg cca gag 1200
Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ile Tyr Pro Pro Glu
385 390 395 400
aag agg ggc cag ccc ggc gcc cac cgc ggc cgc aga tct aga ggg tga 1248
Lys Arg Gly Gln Pro Gly Ala His Arg Gly Arg Arg Ser Arg Gly
405 410 415
<210> 12
<211> 415
<212> PRT
<213> 幼嫩轮枝孢(Verticillium tenerum)
<400> 12
Met Lys Lys Ala Leu Ile Thr Ser Leu Ser Leu Leu Ala Thr Ala Met
1 5 10 15
Gly Gln Gln Ala Gly Thr Leu Glu Thr Glu Thr His Pro Lys Leu Thr
20 25 30
Trp Gln Arg Cys Thr Thr Ser Gly Cys Thr Asn Val Asn Gly Glu Val
35 40 45
Val Ile Asp Ala Asn Trp Arg Trp Ala His Asp Ile Asn Gly Tyr Glu
50 55 60
Asn Cys Phe Glu Gly Asn Thr Trp Thr Gly Thr Cys Ser Gly Ala Asp
65 70 75 80
Gly Cys Ala Lys Asn Cys Ala Val Glu Gly Ala Asn Tyr Gln Ser Thr
85 90 95
Tyr Gly Val Ser Thr Ser Gly Asn Ala Leu Ser Leu Arg Phe Val Thr
100 105 110
Glu His Glu His Gly Val Asn Thr Gly Ser Arg Thr Tyr Leu Met Glu
115 120 125
Ser Ala Thr Lys Tyr Gln Met Phe Thr Leu Met Asn Asn Glu Leu Ala
130 135 140
Phe Asp Val Asp Leu Ser Lys Val Ala Cys Gly Met Asn Ser Ala Leu
145 150 155 160
Tyr Leu Val Pro Met Lys Ala Asp Gly Gly Leu Ser Ser Glu Thr Asn
165 170 175
Asn Asn Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys
180 185 190
Ala Arg Asp Leu Lys Phe Val Asn Gly Lys Ala Asn Ile Glu Gly Trp
195 200 205
Gln Ala Ser Lys Thr Asp Glu Asn Ser Gly Val Gly Asn Met Gly Ser
210 215 220
Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Arg Glu Ser Phe Ala
225 230 235 240
Phe Thr Pro His Ala Cys Ser Gln Asn Glu Tyr His Val Cys Thr Gly
245 250 255
Ala Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe Ala Gly Lys Cys
260 265 270
Asp Ala Asn Gly Cys Asp Tyr Asn Pro Phe Arg Val Gly Asn Gln Asn
275 280 285
Phe Tyr Gly Pro Gly Met Thr Val Asn Thr Asn Ser Lys Phe Thr Val
290 295 300
Ile Ser Arg Phe Arg Glu Asn Glu Ala Tyr Gln Val Phe Ile Gln Asn
305 310 315 320
Gly Arg Thr Ile Glu Val Pro Arg Pro Thr Leu Ser Gly Ile Thr Gln
325 330 335
Phe Glu Ala Lys Ile Thr Pro Glu Phe Cys Ser Thr Tyr Pro Thr Val
340 345 350
Phe Gly Asp Arg Asp Arg His Gly Glu Ile Gly Gly His Thr Ala Leu
355 360 365
Asn Ala Ala Leu Arg Met Pro Met Val Leu Val Met Ser Ile Trp Ala
370 375 380
Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ile Tyr Pro Pro Glu
385 390 395 400
Lys Arg Gly Gln Pro Gly Ala His Arg Gly Arg Arg Ser Arg Gly
405 410 415
<210> 13
<211> 1341
<212> DNA
<213> 栗色新螱(Neotermes castaneus)
<220>
<22l> CDS
<222> (1)..(1341)
<223>
<400> 13
gca cga ggg ctc gct gct gca ttg ttc acc ttt gca tgt agc gtt ggt 48
Ala Arg Gly Leu Ala Ala Ala Leu Phe Thr Phe Ala Cys Ser Val Gly
1 5 10 15
atc ggc acc aaa acg gcc gag aac cac ccg aag ctg aac tgg cag aac 96
Ile Gly Thr Lys Thr Ala Glu Asn His Pro Lys Leu Asn Trp Gln Asn
20 25 30
tgc gcc tcc aag ggc agc tgc tca caa gtg tcc ggc gaa gtg aca atg 144
Cys Ala Ser Lys Gly Ser Cys Ser Gln Val Ser Gly Glu Val Thr Met
35 40 45
gac tcg aac tgg cgg tgg acc cac gat ggc aac ggc aag aac tgc tac 192
Asp Ser Asn Trp Arg Trp Thr His Asp Gly Asn Gly Lys Asn Cys Tyr
50 55 60
gac ggc aac acc tgg atc tcc agc ctc tgc cca gac ggc aag acc tgc 240
Asp Gly Asn Thr Trp Ile Ser Ser Leu Cys Pro Asp Gly Lys Thr Cys
65 70 75 80
tct gac aag tgc gtc ctc gat ggc gcc gaa tac caa gcg acc tac ggc 288
Ser Asp Lys Cys Val Leu Asp Gly Ala Glu Tyr Gln Ala Thr Tyr Gly
85 90 95
atc acc tcg aac ggg acc gcg gtc acc ctc aag ttc gtc acc cac ggc 336
Ile Thr Ser Asn Gly Thr Ala Val Thr Leu Lys Phe Val Thr His Gly
100 105 110
tcg tac tcg acg aac atc ggc tcc cgc ctg tat ctc ctc aag gac gaa 384
Ser Tyr Ser Thr Asn Ile Gly Ser Arg Leu Tyr Leu Leu Lys Asp Glu
115 120 125
aac act tac tac atc ttc aag gtg aac aac aag gaa ttc aca ttc agc 432
Asn Thr Tyr Tyr Ile Phe Lys Val Asn Asn Lys Glu Phe Thr Phe Ser
130 135 140
gtc gat gtg tcg aag ctc ccg tgc ggc ctg aac ggt gcc ctc tac ttc 480
Val Asp Val Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe
145 150 155 160
gtc tcg atg gac gcc gac ggt ggc gca gga aag tat tca ggt gcg aag 528
Val Ser Met Asp Ala Asp Gly Gly Ala Gly Lys Tyr Ser Gly Ala Lys
165 170 175
cca ggc gcg aag tac ggc ctc ggc tac tgc gat gcg caa tgc ccg agc 576
Pro Gly Ala Lys Tyr Gly Leu Gly Tyr Cys Asp Ala Gln Cys Pro Ser
180 185 190
gat ctg aag ttc atc aac ggc gaa gcg aac agc gat ggc tgg aag ccc 624
Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ser Asp Gly Trp Lys Pro
195 200 205
cag gcg aac gac aag aat gcg gga aac ggc aaa tac gga tcg tgc tgc 672
Gln Ala Asn Asp Lys Asn Ala Gly Asn Gly Lys Tyr Gly Ser Cys Cys
210 215 220
tcg gaa atg gac gtt tgg gag gcg aac tcg cag gca aca gct tac act 720
Ser Glu Met Asp Val Trp Glu Ala Asn Ser Gln Ala Thr Ala Tyr Thr
225 230 235 240
ccg cac gtc tgc aag acc acg ggc cag cag cgc tgc tcg ggc aca tcg 768
Pro His Val Cys Lys Thr Thr Gly Gln Gln Arg Cys Ser Gly Thr Ser
245 250 255
gaa tgc ggc ggc cag gat ggc gca gcg cgt ttc cag gga ctg tgc gac 816
Glu Cys Gly Gly Gln Asp Gly Ala Ala Arg Phe Gln Gly Leu Cys Asp
260 265 270
gag gac ggt tgc gac ttc aac agc tgg cgc cag ggc gac aag acg ttc 864
Glu Asp Gly Cys Asp Phe Asn Ser Trp Arg Gln Gly Asp Lys Thr Phe
275 280 285
tac ggc ccg gga ttg act gtt gac acg aag tcg ccg ttc aca gtc gtc 912
Tyr Gly Pro Gly Leu Thr Val Asp Thr Lys Ser Pro Phe Thr Val Val
290 295 300
aca caa ttc gtc gga agt ccg gtg aag gaa atc cgc agg aag tac gtc 960
Thr Gln Phe Val Gly Ser Pro Val Lys Glu Ile Arg Arg Lys Tyr Val
305 310 315 320
cag aac gga aag gtg att gag aac tcg aag aac aag att tcg gga att 1008
Gln Asn Gly Lys Val Ile Glu Asn Ser Lys Asn Lys Ile Ser Gly Ile
325 330 335
gac gag acg aac gca gtg agt gat act ttc tgc gat cag caa aag aag 1056
Asp Glu Thr Asn Ala Val Ser Asp Thr Phe Cys Asp Gln Gln Lys Lys
340 345 350
gcc ttc ggt gat acg aac gat ttc aag aac aag ggc ggt ttc gct aag 1104
Ala Phe Gly Asp Thr Asn Asp Phe Lys Asn Lys Gly Gly Phe Ala Lys
355 360 365
ttg ggt cag gtg ttc gag act ggt cag gtt ctc gtg ctg tcg ctg tgg 1152
Leu Gly Gln Val Phe Glu Thr Gly Gln Val Leu Val Leu Ser Leu Trp
370 375 380
gat gac cac tcg gtt gca atg ctg tgg ttg gac tcg gcc tac cca acg 1200
Asp Asp His Ser Val Ala Met Leu Trp Leu Asp Ser Ala Tyr Pro Thr
385 390 395 400
aac aag gat aag agc agc cca ggt gtt gac cgt ggg cct tgc ccg acg 1248
Asn Lys Asp Lys Ser Ser Pro Gly Val Asp Arg Gly Pro Cys Pro Thr
405 410 415
act tcc ggg aag ccg gat gat gtt gaa agc caa tct ccc gat gca acc 1296
Thr Ser Gly Lys Pro Asp Asp Val Glu Ser Gln Ser Pro Asp Ala Thr
420 425 430
gtc att tat ggc aac atc aag ttc ggt gca ctg gac tcc act tac 1341
Val Ile Tyr Gly Asn Ile Lys Phe Gly Ala Leu Asp Ser Thr Tyr
435 440 445
<210> 14
<211> 447
<212> PRT
<213> 栗色新螱(Neotermes castaneus)
<400> 14
Ala Arg Gly Leu Ala Ala Ala Leu Phe Thr Phe Ala Cys Ser Val Gly
1 5 10 15
Ile Gly Thr Lys Thr Ala Glu Asn His Pro Lys Leu Asn Trp Gln Asn
20 25 30
Cys Ala Ser Lys Gly Ser Cys Ser Gln Val Ser Gly Glu Val Thr Met
35 40 45
Asp Ser Asn Trp Arg Trp Thr His Asp Gly Asn Gly Lys Asn Cys Tyr
50 55 60
Asp Gly Asn Thr Trp Ile Ser Ser Leu Cys Pro Asp Gly Lys Thr Cys
65 70 75 80
Ser Asp Lys Cys Val Leu Asp Gly Ala Glu Tyr Gln Ala Thr Tyr Gly
85 90 95
Ile Thr Ser Asn Gly Thr Ala Val Thr Leu Lys Phe Val Thr His Gly
100 105 110
Ser Tyr Ser Thr Asn Ile Gly Ser Arg Leu Tyr Leu Leu Lys Asp Glu
115 120 125
Asn Thr Tyr Tyr Ile Phe Lys Val Asn Asn Lys Glu Phe Thr Phe Ser
130 135 140
Val Asp Val Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe
145 150 155 160
Val Ser Met Asp Ala Asp Gly Gly Ala Gly Lys Tyr Ser Gly Ala Lys
165 170 175
Pro Gly Ala Lys Tyr Gly Leu Gly Tyr Cys Asp Ala Gln Cys Pro Ser
180 185 190
Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ser Asp Gly Trp Lys Pro
195 200 205
Gln Ala Asn Asp Lys Asn Ala Gly Asn Gly Lys Tyr Gly Ser Cys Cys
210 215 220
Ser Glu Met Asp Val Trp Glu Ala Asn Ser Gln Ala Thr Ala Tyr Thr
225 230 235 240
Pro His Val Cys Lys Thr Thr Gly Gln Gln Arg Cys Ser Gly Thr Ser
245 250 255
Glu Cys Gly Gly Gln Asp Gly Ala Ala Arg Phe Gln Gly Leu Cys Asp
260 265 270
Glu Asp Gly Cys Asp Phe Asn Ser Trp Arg Gln Gly Asp Lys Thr Phe
275 280 285
Tyr Gly Pro Gly Leu Thr Val Asp Thr Lys Ser Pro Phe Thr Val Val
290 295 300
Thr Gln Phe Val Gly Ser Pro Val Lys Glu Ile Arg Arg Lys Tyr Val
305 310 315 320
Gln Asn Gly Lys Val Ile Glu Asn Ser Lys Asn Lys Ile Ser Gly Ile
325 330 335
Asp Glu Thr Asn Ala Val Ser Asp Thr Phe Cys Asp Gln Gln Lys Lys
340 345 350
Ala Phe Gly Asp Thr Asn Asp Phe Lys Asn Lys Gly Gly Phe Ala Lys
355 360 365
Leu Gly Gln Val Phe Glu Thr Gly Gln Val Leu Val Leu Ser Leu Trp
370 375 380
Asp Asp His Ser Val Ala Met Leu Trp Leu Asp Ser Ala Tyr Pro Thr
385 390 395 400
Asn Lys Asp Lys Ser Ser Pro Gly Val Asp Arg Gly Pro Cys Pro Thr
405 410 415
Thr Ser Gly Lys Pro Asp Asp Val Glu Ser Gln Ser Pro Asp Ala Thr
420 425 430
Val Ile Tyr Gly Asn Ile Lys Phe Gly Ala Leu Asp Ser Thr Tyr
435 440 445
<210> 15
<211> 1359
<212> DNA
<213> 黑素白丝菌(Melanocarpus albomyces)
<220>
<221> CDS
<222> (1)..(1359)
<223>
<400> 15
atg atg atg aag cag tac ctc cag tac ctc gcg gcc gcg ctg ccg ctc 48
Met Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu
1 5 10 15
gtc ggc ctc gcc gcc ggc cag cgc gct ggt aac gag acg ccc gag agc 96
Val Gly Leu Ala Ala Gly Gln Arg Ala Gly Asn Glu Thr Pro Glu Ser
20 25 30
cac ccc ccg ctc acc tgg cag agg tgc acg gcc ccg ggc aac tgc cag 144
His Pro Pro Leu Thr Trp Gln Arg Cys Thr Ala Pro Gly Asn Cys Gln
35 40 45
acc gtg aac gcc gag gtc gta att gac gcc aac tgg cgc tgg ctg cac 192
Thr Val Asn Ala Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His
50 55 60
gac gac aac atg cag aac tgc tac gac ggc aac cag tgg acc aac gcc 240
Asp Asp Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala
65 70 75 80
tgc agc acc gcc acc gac tgc gct gag aag tgc atg atc gag ggt gcc 288
Cys Ser Thr Ala Thr Asp Cys Ala Glu Lys Cys Met Ile Glu Gly Ala
85 90 95
ggc gac tac ctg ggc acc tac ggc gcc tcg acc agc ggc gac gcc ctg 336
Gly Asp Tyr Leu Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu
100 105 110
acg ctc aag ttc gtc acg aag cac gag tac ggc acc aac gtc ggc tcg 384
Thr Leu Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Val Gly Ser
115 120 125
cgc ttc tac ctc atg aac ggc ccg gac aag tac cag atg ttc gac ctc 432
Arg Phe Tyr Leu Met Asn Gly Pro Asp Lys Tyr Gln Met Phe Asp Leu
130 135 140
ctg ggc aac gag ctt gcc ttt gac gtc gac ctc tcg acc gtc gag tgc 480
Leu Gly Asn Glu Leu Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys
145 150 155 160
ggc atc aac agc gcc ctg tac ttc gtc gcc atg gag gag gac ggc ggc 528
Gly Ile Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly
165 170 175
atg gcc agc tac ccg agc aac cag gcc ggc gcc cgg tac ggc act ggg 576
Met Ala Ser Tyr Pro Ser Asn Gln Ala Gly Ala Arg Tyr Gly Thr Gly
180 185 190
tac tgc gat gcc caa tgc gct cgt gac ctc aag ttc gtt ggc ggc aag 624
Tyr Cys Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys
195 200 205
gcc aac att gag ggc tgg aag ccg tcc acc aac gac ccc aac gct ggc 672
Ala Asn Ile Glu Gly Trp Lys Pro Ser Thr Asn Asp Pro Asn Ala Gly
210 215 220
gtc ggc ccg tac ggc ggc tgc tgc gct gag atc gac gtc tgg gag tcg 720
Val Gly Pro Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser
225 230 235 240
aac gcc tat gcc ttc gct ttc acg ccg cac gcg tgc acg acc aac gag 768
Asn Ala Tyr Ala Phe Ala Phe Thr Pro His Ala Cys Thr Thr Asn Glu
245 250 255
tac cac gtc tgc gag acc acc aac tgc ggt ggc acc tac tcg gag gac 816
Tyr His Val Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp
260 265 270
cgc ttc gcc ggc aag tgc gac gcc aac ggc tgc gac tac aac ccc tac 864
Arg Phe Ala Gly Lys Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr
275 280 285
cgc atg ggc aac ccc gac ttc tac ggc aag ggc aag acg ctc gac acc 912
Arg Met Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr
290 295 300
agc cgc aag ttc acc gtc gtc tcc cgc ttc gag gag aac aag ctc tcc 960
Ser Arg Lys Phe Thr Val Val Ser Arg Phe Glu Glu Asn Lys Leu Ser
305 310 315 320
cag tac ttc atc cag gac ggc cgc aag atc gag atc ccg ccg ccg acg 1008
Gln Tyr Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr
325 330 335
tgg gag ggc atg ccc aac agc agc gag atc acc ccc gag ctc tgc tcc 1056
Trp Glu Gly Met Pro Asn Ser Ser Glu Ile Thr Pro Glu Leu Cys Ser
340 345 350
acc atg ttc gat gtg ttc aac gac cgc aac cgc ttc gag gag gtc ggc 1104
Thr Met Phe Asp Val Phe Asn Asp Arg Asn Arg Phe Glu Glu Val Gly
355 360 365
ggc ttc gag cag ctg aac aac gcc ctc cgg gtt ccc atg gtc ctc gtc 1152
Gly Phe Glu Gln Leu Asn Asn Ala Leu Arg Val Pro Met Val Leu Val
370 375 380
atg tcc atc tgg gac gac cac tac gcc aac atg ctc tgg ctc gac tcc 1200
Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser
385 390 395 400
atc tac ccg ccc gag aag gag ggc cag ccc ggc gcc gcc cgt ggc gac 1248
Ile Tyr Pro Pro Glu Lys Glu Gly Gln Pro Gly Ala Ala Arg Gly Asp
405 410 415
tgc ccc acg gac tcg ggt gtc ccc gcc gag gtc gag gct cag ttc ccc 1296
Cys Pro Thr Asp Ser Gly Val Pro Ala Glu Val Glu Ala Gln Phe Pro
420 425 430
gac gcc cag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg 1344
Asp Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser
435 440 445
acc tac gac ttc taa 1359
Thr Tyr Asp Phe
450
<210> 16
<211> 452
<212> PRT
<213> 黑素白丝菌(Melanocarpus albomyces)
<400> 16
Met Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu
1 5 10 15
Val Gly Leu Ala Ala Gly Gln Arg Ala Gly Asn Glu Thr Pro Glu Ser
20 25 30
His Pro Pro Leu Thr Trp Gln Arg Cys Thr Ala Pro Gly Asn Cys Gln
35 40 45
Thr Val Asn Ala Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His
50 55 60
Asp Asp Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala
65 70 75 80
Cys Ser Thr Ala Thr Asp Cys Ala Glu Lys Cys Met Ile Glu Gly Ala
85 90 95
Gly Asp Tyr Leu Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu
100 105 110
Thr Leu Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Val Gly Ser
115 120 125
Arg Phe Tyr Leu Met Asn Gly Pro Asp Lys Tyr Gln Met Phe Asp Leu
130 135 140
Leu Gly Asn Glu Leu Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys
145 150 155 160
Gly Ile Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly
165 170 175
Met Ala Ser Tyr Pro Ser Asn Gln Ala Gly Ala Arg Tyr Gly Thr Gly
180 185 190
Tyr Cys Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys
195 200 205
Ala Asn Ile Glu Gly Trp Lys Pro Ser Thr Asn Asp Pro Asn Ala Gly
210 215 220
Val Gly Pro Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser
225 230 235 240
Asn Ala Tyr Ala Phe Ala Phe Thr Pro His Ala Cys Thr Thr Asn Glu
245 250 255
Tyr His Val Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp
260 265 270
Arg Phe Ala Gly Lys Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr
275 280 285
Arg Met Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr
290 295 300
Ser Arg Lys Phe Thr Val Val Ser Arg Phe Glu Glu Asn Lys Leu Ser
305 310 315 320
Gln Tyr Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr
325 330 335
Trp Glu Gly Met Pro Asn Ser Ser Glu Ile Thr Pro Glu Leu Cys Ser
340 345 350
Thr Met Phe Asp Val Phe Asn Asp Arg Asn Arg Phe Glu Glu Val Gly
355 360 365
Gly Phe Glu Gln Leu Asn Asn Ala Leu Arg Val Pro Met Val Leu Val
370 375 380
Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser
385 390 395 400
Ile Tyr Pro Pro Glu Lys Glu Gly Gln Pro Gly Ala Ala Arg Gly Asp
405 410 415
Cys Pro Thr Asp Ser Gly Val Pro Ala Glu Val Glu Ala Gln Phe Pro
420 425 430
Asp Ala Gln Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser
435 440 445
Thr Tyr Asp Phe
450
<210> 17
<211> 221
<212> DNA
<213> 玫瑰单瑞孢(Trichothecium roseum)
<220>
<221> misc_feature
<222> (1)..(221)
<223> 部分CBH1编码序列
<400> 17
tacgcccagt gcgcccgtga cctcaagttc ctcggcggca cttccaacta cgacggctgg 60
aagccctcgg acactgacga cagcgccggt gtcggcaacc gcggatcctg ctgcgccgag 120
attgacatct gggagtccaa ctcgcacgcc ttcgccttca ccccccacgc ctgcgagaac 180
aacgagtacc acatctgcga gaccaccgac tgcggcggca c 221
<210> 18
<211> 239
<212> DNA
<213> Humicola nigrescens
<220>
<221> misc_feature
<222> (1)..(239)
<223> 部分CBH1编码序列
<400> 18
tacggcacgg ggtactgcga cgcccaatgc gcccgcgatc tcaagttcgt tggcggcaag 60
gccaatgttg agggctggaa acagtccacc aacgatgcca atgccggcgt gggtccgatg 120
ggcggttgct gcgccgaaat tgacgtctgg gaatcgaacg cccatgcctt cgccttcacg 180
ccgcacgcgt gcgagaacaa caagtaccac atctgcgaga ctgacggatg cggcggcac 239
<210> 19
<211> 199
<212> DNA
<213> Cladorrhinum foecundissimum
<220>
<221> misc_feature
<222> (1)..(199)
<223> 部分CBH1编码序列
<400> 19
tacataaacg gtatcggcaa cgttgagggt tggtcctcct ctaccaacga tcccaacgct 60
ggtgtcggta accrcggtac ttgctgctcc gagaatggat atctgggagg ccaacaagat 120
ctcgaccgcc tacactcccc acccctgcac caccatcgac cagcacatgt gcgagggcaa 180
ctcgtgcggc ggaacctac 199
<210> 20
<211> 191
<212> DNA
<213> 棉色二孢(Diplodia gossypina)
<220>
<221> misc_feature
<222> (1)..(191)
<223> 部分CBH1编码序列
<400> 20
gttgatccga cggcaaggcc caacgtcgag ggctgggtcc cgtccgagaa cgactccaac 60
gctggtgtcg gcaaccttgg ctcttgctgt gctgagatgg atatctggga ggccaactcc 120
atctcgaccg cctacacccc ccacagctgc aagacggtcg cccagcactc ttgcactggc 180
gacgactgcg g 191
<210> 21
<211> 232
<212> DNA
<213> 嗜热毁丝酶(Myceliophthora thermophila)
<220>
<221> misc_feature
<222> (1)..(232)
<223> 部分CBH1编码序列
<400> 21
gggtactgcg acgcccaatg cgcacgcgac ctcaagttcg tcggcggcaa gggcaacatc 60
gagggctgga agccgtccac caacgatgcc aatgccggtg tcggtcctta tggcgggtgc 120
tgcgctgaga tcgacgtctg ggagtcgaac aagtatgctt tcgctttcac cccgcacggt 180
tgcgagaacc ctaaatacca cgtctgcgag accaccaact gcggcggcac ct 232
<210> 22
<211> 467
<212> DNA
<213> 微小根毛霉(Rhizomucor pusillus)
<220>
<221> misc_feature
<222> (1)..(467)
<223> 部分CBH1编码序列
<400> 22
tccttcgcct ttacccccca cgcttgctcg cagnaacgag taccacgtct gcaccaccaa 60
caactgcggc ggcacctact cggacgaccg cttcgccggc aagtgcgacg ccaacggttg 120
cgactacaac ccgttccgcc tgggcaacca ggacttctac ggcccgggca tgaccgtcga 180
caccaactcc aagttcaccg tcatctcccg cttcagggag aacgaggcct accaggtctt 240
catgcagggc ggccggacca tcgaggtccc ggccccgcag ctgtccgggc tcacccagtt 300
cgacgccaag atcacccccg agttctgcga cacctacccg accgtcttcg acgaccgcaa 360
ccgccacggc gagatcggcg gccacaccgc cctcaacgcc gccctgcgca tgcccatggt 420
cctcgtcatg tccatctggg ctgaccacta cgccagctgc tagtgtc 467
<210> 23
<211> 534
<212> DNA
<213> Meripilus giganteus
<220>
<221> misc_feature
<222> (1)..(534)
<223> 部分CBH1编码序列
<400> 23
gggagggctc cccgaacgac ccgaacgcgg gaagcggcca gtacggaacg tgctgcaacg 60
agatggacat ctgggaggcg aaccagaacg gcgcggcggt cacgccgcac gtctgctccg 120
tcgacggcca gacgcgctgc gagggcacgg actgcggcga cggcgacgag cggtacgacg 180
gcatctgcga caaggacggc tgcgacttca actcgtaccg catgggcgac cagtccttcc 240
tcggcctcgg caagaccgtc gacacctcga agaagttcac cgtcgtcacc cagttcctca 300
ccgcggacaa cacgacgtcc ggccagctca cggagatccg ccggctgtac gtgcaggacg 360
gcaaggtcat cgcgaactcg aagacgaaca tccccggcct cgactcgttc gactccatca 420
ccgacgactt ctgcaacgcg cagaaggagg tcttcggcga caccaactcg ttcgagaagc 480
tcggcggcct cgcggagatg ggcaaggcct tccagaaggg catggtcctc gtca 534
<210> 24
<211> 563
<212> DNA
<213> 黑耳(Exidia glandulosa)
<220>
<221> misc_feature
<222> (1)..(563)
<223> 部分CBH1编码序列
<400> 24
gccacgtcga gggctggact ccttcmccaa cgatgccaac gccggcattg gcacccacgg 60
ctcctgctgt tcggagatgg acatctggga ggctaacaat gttgccgctg cgtacacccc 120
ccatccttgc acaactatcg gccagtcgat ctgctcgggc gattcttgcg gaggaaccta 180
cagctctgac cgttacgccg gtgtctgcga tccagacggt tgcgatttca acagctaccg 240
catgggcgac acgggcttct acggcaaggg cctgacagtc gacacgagct ccaagttcac 300
cgtcgtcacc cagttcctca ccggctccga cggcaacctt tccgagatca agcgcttcta 360
cgtccagaac ggcaaggtca ttcccaactc gcagtccaag attgccggcg tcagcggcaa 420
ctccatcacc accgacttct gctccgccca gaagaccgcc ttcggcgaca ccaacgtctt 480
cgcgcaaaag ggaggtactc gccgggatgg gcgccgccct caaggccggc atggtcctcg 540
tcatgtccat ctgggacgac cac 563
<210> 25
<211> 218
<212> DNA
<213> 块团炭角菌(Xylaria hypoxylon)
<220>
<221> misc_feature
<222> (1)..(218)
<223> 部分CBH1编码序列
<400> 25
gacgctcagt gtgcccgtga cttgaagttc gtcggtggca agggcaacgt tgagggatgg 60
gagccatcca ccaacgacga caacgccggt gttggccctt acggwgcctg ctgtgccgaa 120
atsgatgtst gggagtccaa ctstcactct ttcgctttca cccctcaccc wtgcaccacc 180
aacgaatacc acgtctgtga gcaggacgag tgtggcgg 218
<210> 26
<211> 492
<212> DNA
<213> 支顶孢菌(Acremonium sp.)
<220>
<221> misc_feature
<222> (1)..(492)
<223> 部分CBH1编码序列
<400> 26
gggacggggt actgcgacgc ccaatgcgcc cgtgatctca agttcgtcgg cggcaaggcc 60
aacattgagg gctggaggcc gtccaccaac gacgcgaacg ccggcgtcgg cccgatgggc 120
ggctgctgcg cggaaatcga tgtctgggag tccaacgccc acgcttttgc cttcacgccg 180
cacgcgtgcg agaacaacaa ctaccacatc tgcgagacct ccaactgcgg cggtacctac 240
tccgacgacc gcttcgccgg cctctgcgac gccaacggct gcgactacaa cccgtaccgc 300
atgggcaacc ccgacttcta cggcaagggc aagactcttg acacctcgcg gaagttcacc 360
gtcgtcaccc gctttcagga gaacgacctc tcgcagtact tcgtccagga cggcccgaag 420
atcgagatcc cgcccccgac ctgggacggc ctcccgaaga gcagcacata cgccgagctg 480
tgcgcgaccc ag 492
<210> 27
<211> 481
<212> DNA
<213> 支顶孢菌(Acremonium sp.)
<220>
<221> misc_feature
<222> (1)..(481)
<223> 部分CBH1编码序列
<400> 27
ggctccgttt actcctaccc ttgcacggaa atcggccaga gccgctgcga gggcgacagc 60
tgcggcggta cctacagcac cgaccgctac gctggcgtct gcgaccccga tggatgcgac 120
ttcaactcgt accgccaggg caacaagacc ttctatggca agggcatgac cgtcgacacc 180
accaagaaga ttaccgtcgt cacccagttc ctcaccgact cgtccggcaa cctgtccgag 240
atcaagcgct tctacgccca gaacggcgtc gtcatcccca actccgagtc caccattgct 300
ggcgtccctg gcaactcgat cacccaggac tactgcgaca agcagaagac cgcctttggt 360
gacaacaacg acttcgacaa gaagggtggt ctcgcccaga tgggtaaggc cctggcccaa 420
cccatggtcc tcgtcatgtc cgtctgggat gaccatgccg tcaacatgct ctgcttcgaa 480
a 481
<210> 28
<211> 463
<212> DNA
<213> 毛壳霉(Chaetomium sp.)
<220>
<221> misc_feature
<222> (1)..(463)
<223> 部分CBH1编码序列
<400> 28
ctccccgtct tcacgccgca cgcgtgcaag aacatcaagt accacgtctg cgagacgtcg 60
ggatgcggcg gcacctactc ggaggaccgc ttcgcgggcg actgcgacgc caacggttgc 120
gactacaacc cctaccgcat gggcaacacc gacttctacg gcaagggcat gacggtcgac 180
accagcaaga agttcaccgt cgtgacccaa ttccaggaga acaagctcac ccagttcttc 240
gtccagaacg gcaagaagat cgagatccct ggccccaagt gggacggcat tgagggcgac 300
agcgccgcca tcacgcccca gctgtgcact tccatgttca aggccttcga cgaccgcgat 360
cgcttctcgg aggtcggcgg cttcacccag atcaaccagg ccctctcggt gcccatggtg 420
ctcgtcatgt ccatctggga cgaccactac gccaacatgc ttg 463
<210> 29
<211> 513
<212> DNA
<213> Chaetomidium pingtungium
<220>
<221> misc_feature
<222> (1)..(513)
<223> 部分CBH1编码序列
<400> 29
gaagggtggc agccctcctc caacgatgcc aatgcgggta ccggcaacca cgggtcctgc 60
tgcgcggaga tggatatctg ggaggccaac agcatctcca cggccttcac cccccatccg 120
tgcgacacgc ccggccaggt gatgtgcacc ggtgatgcct gcggtggcac ctacagctcc 180
gaccgctacg gcggcacctg cgaccccgac ggatgtgatt tcaactcctt ccgccagggc 240
aacaagacct tctacggccc tggcatgacc gtcgacacca agagcaagtt taccgtcgtc 300
acccagttca tcaccgacga cggcacctcc agcggcaccc tcaaggagat caagcgcttc 360
tacgtgcaga acggcaaggt gatccccaac tcggagtcga cctggaccgg cgtcagcggc 420
aactccatca ccaccgagta ctgcaccgcc cagaagagcc tgttccagga ccagaacgtc 480
ttcgaaaagc acggtggcct cgagggcatg ggt 513
<210> 30
<211> 579
<212> DNA
<213> 嗜热毁丝酶(Myceliophthora thermophila)
<220>
<221> misc_feature
<222> (1)..(579)
<223> 部分CBH1编码序列
<400> 30
gagatggata tttgggaggc caacaacatg gccgccgcct tcactcccca cccttgcacc 60
gtgatcggcc agtcgcgctg cgagggcgac tcgtgcggcg gtacctacag caccgaccgc 120
tatgccggca tctgcgaccc cgacggatgc gacttcaact cgtaccgcca gggcaacaag 180
accttctacg gcaagggcat gacggtcgac acgaccaaga agatcacggt cgtcacccag 240
ttcctcaaga actcggccgg cgagctctcc gagatcaagc ggttctacgt ccagaacggc 300
aaggtcatcc ccaactccga gtccaccatc ccgggcgtcg agggcaactc cattacccag 360
gactggtgcg accgccagaa ggccgctttc ggcgacgtga ccgactttca ggacaagggc 420
ggcatggtcc agatgggcaa ggccctcgcg ggcccaatgg tcctcgtcat gtccatctgg 480
gacgaccacg ccgtcaacat gctctggctc gaaatcacta gtgcggccgc tgcaggtcga 540
ccatatggga gagctccacg cgttggatgc atagcttga 579
<210> 31
<211> 514
<212> DNA
<213> 肉桂色毁丝霉(Myceliophthora hinnulea)
<220>
<221> misc_feature
<222> (1)..(514)
<223> 部分CBH1编码序列
<400> 31
cgtgagggct gggagagctc gaccaacgat gccaacgccg gcacgggcag gtacggcagc 60
tgctgctccg agatggacgt ctgggaggcc aacaacatgg ccaccgcctt caccccccat 120
ccttgcacca tcatcggcca gtcgcgctgc gagggcgaga cgtgcggcgg cacctacagc 180
tcggaccgct acgccggcgt ctgcgacccc gacggctgcg acttcaactc gtaccgccag 240
ggcaacaaga ccttctacgg caagggcatg acggtcgaca cgaccaagaa gctcacggtc 300
gtcacgcagt tcctcaagaa ctcggccggc gagctgtccg agatcaagcg gttctacgtc 360
caggacggca aggtgatccc caactccgag tccaccatcc ccggcgtcga gggcaactcg 420
atcacgcagg actggtgcga ccgccagaag gccgccttcg gcgacgtcac cgacttccag 480
gacaagggcg gcatggtcca gatggcaagg cgct 514
<210> 32
<211> 477
<212> DNA
<213> Sporotrichum pruinosum
<220>
<221> misc_feature
<222> (1)..(477)
<223> 部分CBH1编码序列
<400> 32
cacccttgcc gcaccacgaa cgacggtggc taccaacgct gccaaggacg tgactgcaac 60
cagcctcgtt atgagggtct ttgcgatcct gacggttgcg actacaaccc tttccgtatg 120
ggtaaccgcg aattctacgg ccctggaaag accgtcgaca ccaacaggaa gttcactgtt 180
gtgacccaat tcattaccga caacaactct gacactggta ccctcgtcga catccgccgc 240
ctctacgtcc aagacggccg tgtcattgcc aaccctccca ccaacttccc cggtctcatg 300
cccgcccacg actccatcac ttagcaattc tgtgacgacg ccaagcgagc attcgaggac 360
aacgacagct ttggcaggaa cggtggtctt gctcacatgg gtcgctccct tgccaagggc 420
catgtcctcg ccctttccat ttggaatgat cacactgcca acatgctctg gctcgaa 477
<210> 33
<211> 500
<212> DNA
<213> Thielavia cf.microspora
<220>
<221> misc_feature
<222> (1)..(500)
<223> 部分CBH1编码序列
<400> 33
gagatagatg tctgggagtc caactcgcac tcgtttgcct tcacgccgca cgcgtgcaag 60
aacaacaagt accacgtctg ccagacgacc gggtgcggcg gcacctactc ggaggaccgc 120
ttcgccggcg actgcgacgc caacggctgc gactacaacc cctaccgcat gggcaacacc 180
gacttttacg gcaagggcaa gacggtcgac acgagcaaga agtttaccat ggtgacccag 240
ttccaaaaga acaagctcgt ccagttcttt gtccaggacg gcaagaagat cgacatcccc 300
ggccccaagt gggacggcct gccgcagggc agcgccgcca tcaccccgga gctgtgcacc 360
ttcatgttca aggccttcaa cgaccgcgac cgcttctcag aggttggcgg cttcgaccag 420
atcaacacgg ccctctcggt gccaatggtg ctcgtcatgt ccatctggga tgatcactac 480
gccaacatgc tctggcttga 500
<210> 34
<211> 470
<212> DNA
<213> 小柱胞菌(Scytalidium sp.)
<220>
<221> misc_feature
<222> (1)..(470)
<223> 部分CBH1编码序列
<400> 34
cgttnggccc gcgtcgcatg ctcccgcccg catggcccgc gggatttcca gccagagcat 60
gttggagtgg tggtcatccc agatggacat gacaaggacc atgggaatgg tgagggcctc 120
gttcagagca tcgaagccac cggtctcggc gaagcggttg cggtcatcga agacgcggaa 180
ctgagcatcg cagagctcag gggtgatgtc ggcgctgttc gggaggccgg gccaggtcgg 240
agggggcacc tcgatcttgc ggccgtcctg gacgaagaac tgagagagcc tgttacgctc 300
gaagcgggag acaacggtga acttgcggtt ggtgtcgacg gtcttgccct tgccatagaa 360
gtccttgttg cccatgcggt aggggttgta gtcgcagccg ttggcatcgc agtagccggc 420
gaagcggtca tccgagtagg taccaccgca gttgttggtc tccagatgtg 470
<210> 35
<211> 491
<212> DNA
<213> 小柱胞菌(Scytalidium sp.)
<220>
<221> misc_feature
<222> (1)..(491)
<223> 部分CBH1编码序列
<400> 35
gaaatcgacg tctgggagtc gaacgcctat gcctatgcct taccccgcac gcttgcggca 60
gccagaaccg ctaccacgtc tgcgagacca acaactgcgg tggtacctac tcggatgacc 120
gcttcgccgg ttactgcgat gccaacggct gcgactacaa cccgtaccgc atgggcaaca 180
gggacttcta cggcaagggc ctgcaggtcg acaccagccg gaagttcacc gtcgtgagcc 240
gcttcgagcg caacaagctc acccagttct tcgttcagga cggccgcaag atcgagcccc 300
ctgcgccgac ctgggacggc atcccgaaga gcgccgacat cacccccgag ttctgcagcg 360
cccagttcaa ggtcttcgac gaccgtgacc gcttcgcgga gactggcggc ttcgatgccc 420
tgaacgatgc tctcagcatt cccatggtcc ttgtcatgtc catctgggat taccactact 480
ccaacataat c 491
<210> 36
<211> 221
<212> DNA
<213> 囊状长毛盘菌(Trichophaea saccata)
<220>
<221> misc_feature
<222> (1)..(221)
<223> 部分CBH1编码序列
<400> 36
tgcgactccc agtgtccccg cgatctcaag ttcatcaatg gacagggcaa cgttgaaggc 60
tggaagccat cctcaaatga tgccaacgca ggcgtcgggg gacacggttc ctgctgcgca 120
gagatggatg tttgggaggc caattccatc tccgcggccg taacaccgca ctcgtgctcc 180
acaaccagcc agacgatgtg caacggcgac tcctgcggcg g 221
<210> 37
<211> 1365
<212> DNA
<213> 棉色二孢(Diplodia gossypina)
<220>
<221> CDS
<222> (1)..(1365)
<223>
<400> 37
atg ctt acc cag gca gtt ctc gct act ctc gcc acc ctg gcc gcc agc 48
Met Leu Thr Gln Ala Val Leu Ala Thr Leu Ala Thr Leu Ala Ala Ser
1 5 10 15
cag cag gtc ggc acc cag aag gag gag gtc cac ccc tcc atg acc tgg 96
Gln Gln Val Gly Thr Gln Lys Glu Glu Val His Pro Ser Met Thr Trp
20 25 30
cag act tgc acc agc agc ggc tgc acc acc aac cag ggc tcc atc gtc 144
Gln Thr Cys Thr Ser Ser Gly Cys Thr Thr Asn Gln Gly Ser Ile Val
35 40 45
gtt gac gcc aac tgg cgc tgg gtc cac aac acc gag ggc tac acc aac 192
Val Asp Ala Asn Trp Arg Trp Val His Asn Thr Glu Gly Tyr Thr Asn
50 55 60
tgc tac acg ggc aac acc tgg aac gcc gac tac tgc acc gac aac acc 240
Cys Tyr Thr Gly Asn Thr Trp Asn Ala Asp Tyr Cys Thr Asp Asn Thr
65 70 75 80
gag tgc gcc tcc aac tgc gcc ctc gac ggc gcc gac tac tct ggc acc 288
Glu Cys Ala Ser Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr
85 90 95
tac ggc gct acc acc tcc ggc gac tcg ctg cgc ctg aac ttc atc acc 336
Tyr Gly Ala Thr Thr Ser Gly Asp Ser Leu Arg Leu Asn Phe Ile Thr
100 105 110
aac ggc cag cag aag aac att ggc tcc cgc atg tac ctc atg cag gat 384
Asn Gly Gln Gln Lys Asn Ile Gly Ser Arg Met Tyr Leu Met Gln Asp
115 120 125
gac gag acc tac gcc gtc cac aag ctc ctc aac aag gag ttc acc ttc 432
Asp Glu Thr Tyr Ala Val His Lys Leu Leu Asn Lys Glu Phe Thr Phe
130 135 140
gac gtc gac acc tcc aag ctg cct tgc ggc ctc aac ggt gcc gtc tac 480
Asp Val Asp Thr Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Val Tyr
145 150 155 160
ttc gtc tcc atg gac gct gac ggt ggc atg gcc aag ttc ccc gac aac 528
Phe Val Ser Met Asp Ala Asp Gly Gly Met Ala Lys Phe Pro Asp Asn
165 170 175
aag gcc ggc gcc aag tac ggt acc ggt tac tgc gac tcg cag tgc ccc 576
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
cgt gac ctc aag ttc atc gac ggc aag gcc aac gtc gag ggc tgg gtc 624
Arg Asp Leu Lys Phe Ile Asp Gly Lys Ala Asn Val Glu Gly Trp Val
195 200 205
ccg tcc gag aac gac tcc aac gct ggt gtc ggc aac ctt ggc tct tgc 672
Pro Ser Glu Asn Asp Ser Asn Ala Gly Val Gly Asn Leu Gly Ser Cys
210 215 220
tgt gct gag atg gat atc tgg gag gcc aac tcc atc tcg acc gcc tac 720
Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Tyr
225 230 235 240
acc ccc cac agc tgc aag acg gtc gcc cag cac tct tgc act ggc gac 768
Thr Pro His Ser Cys Lys Thr Val Ala Gln His Ser Cys Thr Gly Asp
245 250 255
gac tgc ggt ggc acc tac tcc gcg acc cgc tac gcc ggc gac tgc gac 816
Asp Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly Asp Cys Asp
260 265 270
ccc gac gga tgc gac ttc aac tcg tac cgc cag ggc gtc aag gac ttc 864
Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Val Lys Asp Phe
275 280 285
tac ggg ccc ggc atg acc gtc gac agc aac tcg gtc gtc acc gtc gtc 912
Tyr Gly Pro Gly Met Thr Val Asp Ser Asn Ser Val Val Thr Val Val
290 295 300
acg cag ttc atc acc aac gac ggc acc gcg tcc ggc acc ctc tcc gag 960
Thr Gln Phe Ile Thr Asn Asp Gly Thr Ala Ser Gly Thr Leu Ser Glu
305 310 315 320
atc aag cgc ttc tac gtc cag aac ggc aag gtt atc ccc aac tcc gag 1008
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu
325 330 335
tcc acc atc gcc ggc gtc agc ggc aac agc atc acc tcc gcg tac tgc 1056
Ser Thr Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Ser Ala Tyr Cys
340 345 350
gac gcg cag aag gag gtc ttc ggc gac aac acg tcg ttc cag gac cag 1104
Asp Ala Gln Lys Glu Val Phe Gly Asp Asn Thr Ser Phe Gln Asp Gln
355 360 365
ggc ggc ttg gcc agc atg agc cag gcc ctc aac gcc ggc atg gtc ctc 1152
Gly Gly Leu Ala Ser Met Ser Gln Ala Leu Asn Ala Gly Met Val Leu
370 375 380
gtc atg tcc atc tgg gac gac cac cac agc aac atg ctc tgg ctc gac 1200
Val Met Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp
385 390 395 400
tcc gac tac ccc gtc gac gcc gac ccg agc cag ccc ggc atc tcc cgc 1248
Ser Asp Tyr Pro Val Asp Ala Asp Pro Ser Gln Pro Gly Ile Ser Arg
405 410 415
ggt act tgc ccc acc acc tct ggt gtc ccc agc gag gtt gag gag agc 1296
Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ser Glu Val Glu Glu Ser
420 425 430
gcc gct agc gcc tac gtc gtc tac tcg aac att aag gtt ggt gac ctt 1344
Ala Ala Ser Ala Tyr Val Val Tyr Ser Asn Ile Lys Val Gly Asp Leu
435 440 445
aac agc act ttc tct gct tag 1365
Asn Ser Thr Phe Ser Ala
450
<210> 38
<211> 454
<212> PRT
<213> 棉色二孢(Diplodia gossypina)
<400> 38
Met Leu Thr Gln Ala Val Leu Ala Thr Leu Ala Thr Leu Ala Ala Ser
1 5 10 15
Gln Gln Val Gly Thr Gln Lys Glu Glu Val His Pro Ser Met Thr Trp
20 25 30
Gln Thr Cys Thr Ser Ser Gly Cys Thr Thr Asn Gln Gly Ser Ile Val
35 40 45
Val Asp Ala Asn Trp Arg Trp Val His Asn Thr Glu Gly Tyr Thr Asn
50 55 60
Cys Tyr Thr Gly Asn Thr Trp Asn Ala Asp Tyr Cys Thr Asp Asn Thr
65 70 75 80
Glu Cys Ala Ser Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr
85 90 95
Tyr Gly Ala Thr Thr Ser Gly Asp Ser Leu Arg Leu Asn Phe Ile Thr
100 105 110
Asn Gly Gln Gln Lys Asn Ile Gly Ser Arg Met Tyr Leu Met Gln Asp
115 120 125
Asp Glu Thr Tyr Ala Val His Lys Leu Leu Asn Lys Glu Phe Thr Phe
130 135 140
Asp Val Asp Thr Ser Lys Leu Pro Cys Gly Leu Asn Gly Ala Val Tyr
145 150 155 160
Phe Val Ser Met Asp Ala Asp Gly Gly Met Ala Lys Phe Pro Asp Asn
165 170 175
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Leu Lys Phe Ile Asp Gly Lys Ala Asn Val Glu Gly Trp Val
195 200 205
Pro Ser Glu Asn Asp Ser Asn Ala Gly Val Gly Asn Leu Gly Ser Cys
210 215 220
Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Tyr
225 230 235 240
Thr Pro His Ser Cys Lys Thr Val Ala Gln His Ser Cys Thr Gly Asp
245 250 255
Asp Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly Asp Cys Asp
260 265 270
Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Val Lys Asp Phe
275 280 285
Tyr Gly Pro Gly Met Thr Val Asp Ser Asn Ser Val Val Thr Val Val
290 295 300
Thr Gln Phe Ile Thr Asn Asp Gly Thr Ala Ser Gly Thr Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu
325 330 335
Ser Thr Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Ser Ala Tyr Cys
340 345 350
Asp Ala Gln Lys Glu Val Phe Gly Asp Asn Thr Ser Phe Gln Asp Gln
355 360 365
Gly Gly Leu Ala Ser Met Ser Gln Ala Leu Asn Ala Gly Met Val Leu
370 375 380
Val Met Ser Ile Trp Asp Asp His His Ser Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Asp Tyr Pro Val Asp Ala Asp Pro Ser Gln Pro Gly Ile Ser Arg
405 410 415
Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ser Glu Val Glu Glu Ser
420 425 430
Ala Ala Ser Ala Tyr Val Val Tyr Ser Asn Ile Lys Val Gly Asp Leu
435 440 445
Asn Ser Thr Phe Ser Ala
450
<210> 39
<211> 1377
<212> DNA
<213> 囊状长毛盘菌(Trichophaea saccata)
<220>
<221> CDS
<222> (1)..(1377)
<223>
<400> 39
atg caa cgc ctt ctc gtt ctt ctc acc tcc ctt ctc gct ttc acc tat 48
Met Gln Arg Leu Leu Val Leu Leu Thr Ser Leu Leu Ala Phe Thr Tyr
1 5 10 15
ggc caa caa gtt ggc act caa cag gcc gaa gtc cac ccc tcg atg acc 96
Gly Gln Gln Val Gly Thr Gln Gln Ala Glu Val His Pro Ser Met Thr
20 25 30
tgg cag cag tgt aca aag tcc ggc ggc tgc acc acg aag aac ggc aaa 144
Trp Gln Gln Cys Thr Lys Ser Gly Gly Cys Thr Thr Lys Asn Gly Lys
35 40 45
gtc gtg atc gat gcc aac tgg cgt tgg gta cac aat gtc ggc ggc tac 192
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly Tyr
50 55 60
acc aat tgc tac act ggc aac acc tgg gac agt tcg ctt tgt ccc gac 240
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Ser Ser Leu Cys Pro Asp
65 70 75 80
gat gtc acc tgc gcg aag aat tgc gct ctt gat ggc gcg gac tac tct 288
Asp Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
85 90 95
ggc act tat gga gtt act gcg ggc ggg aat tcg ttg aag ctc acc ttc 336
Gly Thr Tyr Gly Val Thr Ala Gly Gly Asn Ser Leu Lys Leu Thr Phe
100 105 110
gtc act aag ggt caa tac tct act aat gtg ggc tcg cga ttg tat atg 384
Val Thr Lys Gly Gln Tyr Ser Thr Asn Val Gly Ser Arg Leu Tyr Met
115 120 125
ctc gcc gac gac agc aca tac cag atg tat aat ctg ctg aac cag gag 432
Leu Ala Asp Asp Ser Thr Tyr Gln Met Tyr Asn Leu Leu Asn Gln Glu
130 135 140
ttt acg ttc gac gtt gat gtt tct aat ctt cct tgt ggg ctt aac ggg 480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly
145 150 155 160
gct ctg tat ttc gtc tcg atg gat aag gat ggt ggg atg tcg aag tac 528
Ala Leu Tyr Phe Val Ser Met Asp Lys Asp Gly Gly Met Ser Lys Tyr
165 170 175
tct ggg aac aag gct ggt gcc aag tat gga act ggg tac tgc gac tcc 576
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
cag tgt ccc cgc gat ctc aag ttc atc aat gga cag ggc aac gtt gaa 624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Gly Asn Val Glu
195 200 205
ggc tgg aag cca tcc tca aat gat gcc aac gca ggc gtc ggg gga cac 672
Gly Trp Lys Pro Ser Ser Asn Asp Ala Asn Ala Gly Val Gly Gly His
210 215 220
ggt tcc tgc tgc gca gag atg gat gtt tgg gag gcc aat tcc atc tcc 720
Gly Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225 230 235 240
gcg gcc gta aca ccg cac tcg tgc tcc aca acc agc cag acg atg tgc 768
Ala Ala Val Thr Pro His Ser Cys Ser Thr Thr Ser Gln Thr Met Cys
245 250 255
aac ggc gac tcc tgc ggc ggt acc tac tca gcc aca cga tac gct ggt 816
Asn Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly
260 265 270
gtc tgc gat ccc gat ggc tgc gac ttc aac tcc tac cgt atg ggc gac 864
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
275 280 285
acg acc ttc tac ggc aag gga aag acg gtc gat acc agc tcc aag ttc 912
Thr Thr Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Ser Ser Lys Phe
290 295 300
acg gtc gtg acc cag ttc atc acc gac act gga acc gcc tcc ggc tcg 960
Thr Val Val Thr Gln Phe Ile Thr Asp Thr Gly Thr Ala Ser Gly Ser
305 310 315 320
ctc acg gag atc cgc cgc ttc tac gtc cag aac gga aag ttg atc ccc 1008
Leu Thr Glu Ile Arg Arg Phe Tyr Val Gln Asn Gly Lys Leu Ile Pro
325 330 335
aac tcc cag tcg aag atc tcg ggc gtc act ggc aac tcc atc acc tct 1056
Asn Ser Gln Ser Lys Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Ser
340 345 350
gct ttc tgc gac gct cag aag gcg gct ttc ggc gat aac tac acg ttc 1104
Ala Phe Cys Asp Ala Gln Lys Ala Ala Phe Gly Asp Asn Tyr Thr Phe
355 360 365
aag gac aag ggc ggc ttc gca tcc atg act act gct atg aag aac gga 1152
Lys Asp Lys Gly Gly Phe Ala Ser Met Thr Thr Ala Met Lys Asn Gly
370 375 380
atg gtc ctg gtt atg agt ctt tgg gat gac cac tac gcc aat atg ctc 1200
Met Val Leu Val Met Ser Leu Trp Asp Asp His Tyr Ala Asn Met Leu
385 390 395 400
tgg ctt gat agc gac tat ccc act aac gcg gac tcc tcc aag ccg ggt 1248
Trp Leu Asp Ser Asp Tyr Pro Thr Asn Ala Asp Ser Ser Lys Pro Gly
405 410 415
gtt gct cgt ggc acc tgc ccg act tct tcc ggc gtg ccc tcg gat gtc 1296
Val Ala Arg Gly Thr Cys Pro Thr Ser Ser Gly Val Pro Ser Asp Val
420 425 430
gag act aac aat gca agc gct tcg gtc acg tac tcc aac att aga ttt 1344
Glu Thr Asn Asn Ala Ser Ala Ser Val Thr Tyr Ser Asn Ile Arg Phe
435 440 445
gga gat ctc aat tcc act tac acc gcc cag taa 1377
Gly Asp Leu Asn Ser Thr Tyr Thr Ala Gln
450 455
<210> 40
<211> 458
<212> PRT
<213> 囊状长毛盘菌(Trichophaea saccata)
<400> 40
Met Gln Arg Leu Leu Val Leu Leu Thr Ser Leu Leu Ala Phe Thr Tyr
1 5 10 15
Gly Gln Gln Val Gly Thr Gln Gln Ala Glu Val His Pro Ser Met Thr
20 25 30
Trp Gln Gln Cys Thr Lys Ser Gly Gly Cys Thr Thr Lys Asn Gly Lys
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly Tyr
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Ser Ser Leu Cys Pro Asp
65 70 75 80
Asp Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
85 90 95
Gly Thr Tyr Gly Val Thr Ala Gly Gly Asn Ser Leu Lys Leu Thr Phe
100 105 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Val Gly Ser Arg Leu Tyr Met
115 120 125
Leu Ala Asp Asp Ser Thr Tyr Gln Met Tyr Asn Leu Leu Asn Gln Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Lys Asp Gly Gly Met Ser Lys Tyr
165 170 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Gly Asn Val Glu
195 200 205
Gly Trp Lys Pro Ser Ser Asn Asp Ala Asn Ala Gly Val Gly Gly His
210 215 220
Gly Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225 230 235 240
Ala Ala Val Thr Pro His Ser Cys Ser Thr Thr Ser Gln Thr Met Cys
245 250 255
Asn Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ala Thr Arg Tyr Ala Gly
260 265 270
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
275 280 285
Thr Thr Phe Tyr Gly Lys Gly Lys Thr Val Asp Thr Ser Ser Lys Phe
290 295 300
Thr Val Val Thr Gln Phe Ile Thr Asp Thr Gly Thr Ala Ser Gly Ser
305 310 315 320
Leu Thr Glu Ile Arg Arg Phe Tyr Val Gln Asn Gly Lys Leu Ile Pro
325 330 335
Asn Ser Gln Ser Lys Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Ser
340 345 350
Ala Phe Cys Asp Ala Gln Lys Ala Ala Phe Gly Asp Asn Tyr Thr Phe
355 360 365
Lys Asp Lys Gly Gly Phe Ala Ser Met Thr Thr Ala Met Lys Asn Gly
370 375 380
Met Val Leu Val Met Ser Leu Trp Asp Asp His Tyr Ala Asn Met Leu
385 390 395 400
Trp Leu Asp Ser Asp Tyr Pro Thr Asn Ala Asp Ser Ser Lys Pro Gly
405 410 415
Val Ala Arg Gly Thr Cys Pro Thr Ser Ser Gly Val Pro Ser Asp Val
420 425 430
Glu Thr Asn Asn Ala Ser Ala Ser Val Thr Tyr Ser Asn Ile Arg Phe
435 440 445
Gly Asp Leu Asn Ser Thr Tyr Thr Ala Gln
450 455
<210> 41
<211> 1353
<212> DNA
<213> 嗜热毁丝酶(Myceliophthora thermophila)
<220>
<221> CDS
<222> (1)..(1353)
<223>
<400> 41
atg aag cag tac ctc cag tac ctc gcg gcg acc ctg ccc ctg gtg ggc 48
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
1 5 10 15
ctg gcc acg gcc cag cag gcg ggt aac ctg cag acc gag act cac ccc 96
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
20 25 30
agg ctc act tgg tcc aag tgc acg gcc ccg gga tcc tgc caa cag gtc 144
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
35 40 45
aac ggc gag gtc gtc atc gac tcc aac tgg cgc tgg gtg cac gac gag 192
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
50 55 60
aac gcg cag aac tgc tac gac ggc aac cag tgg acc aac gct tgc agc 240
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
65 70 75 80
tct gcc acc gac tgc gcc gag aat tgc gcg ctc gag ggt gcc gac tac 288
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
85 90 95
cag ggc acc tat ggc gcc tcg acc agc ggc aat gcc ctg acg ctc acc 336
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
100 105 110
ttc gtc act aag cac gag tac ggc acc aac att ggc tcg cgc ctc tac 384
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
115 120 125
ctc atg aac ggc gcg aac aag tac cag atg ttc acc ctc aag ggc aac 432
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
130 135 140
gag ctg gcc ttc gac gtc gac ctc tcg gcc gtc gag tgc ggc ctc aac 480
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
145 150 155 160
agc gcc ctc tac ttc gtg gcc atg gag gag gat ggc ggt gtg tcg agc 528
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
165 170 175
tac ccg acc aac acg gcc ggt gct aag ttc ggc act ggg tac tgc gac 576
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
180 185 190
gcc caa tgc gca cgc gac ctc aag ttc gtc ggc ggc aag ggc aac atc 624
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
195 200 205
gag ggc tgg aag ccg tcc acc aac gat gcc aat gcc ggt gtc ggt cct 672
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
210 215 220
tat ggc ggg tgc tgc gct gag atc gac gtc tgg gag tcg aac aag tat 720
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
225 230 235 240
gct ttc gct ttc acc ccg cac ggt tgc gag aac cct aaa tac cac gtc 768
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
245 250 255
tgc gag acc acc aac tgc ggt ggc acc tac tcc gag gac cgc ttc gct 816
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
260 265 270
ggt gac tgc gat gcc aac ggc tgc gac tac aac ccc tac cgc atg ggc 864
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
275 280 285
aac cag gac ttc tac ggt ccc ggc ttg acg gtc gat acc agc aag aag 912
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
290 295 300
ttc acc gtc gtc agc cag ttc gag gag aac aag ctc acc cag ttc ttc 960
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
305 310 315 320
gtc cag gac ggc aag aag att gag atc ccc ggc ccc aag gtc gag ggc 1008
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
325 330 335
atc gat gcg gac agc gcc gct atc acc cct gag ctg tgc agt gcc ctg 1056
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
340 345 350
ttc aag gcc ttc gat gac cgt gac cgc ttc tcg gag gtt ggc ggc ttc 1104
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
355 360 365
gat gcc atc aac acg gcc ctc agc act ccc atg gtc ctc gtc atg tcc 1152
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
370 375 380
atc tgg gat gat cac tac gcc aat atg ctc tgg ctc gac tcg agc tac 1200
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385 390 395 400
ccc cct gag aag gct ggc cag cct ggc ggt gac cgt ggc ccg tgt cct 1248
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
405 410 415
cag gac tct ggc gtc ccg gcc gac gtt gag gct cag tac cct aat gcc 1296
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
420 425 430
aag gtc atc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg act gtc 1344
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
435 440 445
aac gtc taa 1353
Asn Val
450
<210> 42
<211> 450
<212> PRT
<213> 嗜热毁丝酶(Myceliophthora thermophila)
<400> 42
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
1 5 10 15
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
20 25 30
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
35 40 45
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
50 55 60
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
65 70 75 80
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
85 90 95
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
100 105 110
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
115 120 125
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
130 135 140
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
145 150 155 160
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
165 170 175
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
195 200 205
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
210 215 220
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
225 230 235 240
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
245 250 255
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
260 265 270
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
275 280 285
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
290 295 300
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
305 310 315 320
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
325 330 335
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
340 345 350
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
355 360 365
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
370 375 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385 390 395 400
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
405 410 415
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
420 425 430
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
435 440 445
Asn Val
450
<210> 43
<211> 1341
<212> DNA
<213> 块团炭角菌(Xylaria hypoxylon)
<220>
<221> CDS
<222> (1)..(1341)
<223>
<400> 43
atg ttg tcc ctc gcc gtg tcg gcc gcc ctt ctc ggg ctc gcg tct gcc 48
Met Leu Ser Leu Ala Val Ser Ala Ala Leu Leu Gly Leu Ala Ser Ala
1 5 10 15
cag cag gtt gga aag gag caa tct gag act cac cct aag ctg tct tgg 96
Gln Gln Val Gly Lys Glu Gln Ser Glu Thr His Pro Lys Leu Ser Trp
20 25 30
aag aag tgc acc agc ggt ggt tcc tgc acc cag acc aac gct gag gtg 144
Lys Lys Cys Thr Ser Gly Gly Ser Cys Thr Gln Thr Asn Ala Glu Val
35 40 45
acc atc gac tct aac tgg cga tgg ctt cac tct ctc gaa ggc act gag 192
Thr Ile Asp Ser Asn Trp Arg Trp Leu His Ser Leu Glu Gly Thr Glu
50 55 60
aac tgc tac gat ggt aac aag tgg acc tcg cag tgc agc act ggc gag 240
Asn Cys Tyr Asp Gly Asn Lys Trp Thr Ser Gln Cys Ser Thr Gly Glu
65 70 75 80
gac tgc gcc acc aag tgc gcc atc gag ggt gcc gac tac agc aag acc 288
Asp Cys Ala Thr Lys Cys Ala Ile Glu Gly Ala Asp Tyr Ser Lys Thr
85 90 95
tac ggt gcc tct act agc ggc gat gct ctt acc ctc aag ttc ctg acc 336
Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu Thr Leu Lys Phe Leu Thr
100 105 110
aag cac gag tac gga acc aac atc ggc tcc cga ttc tac ctt atg aat 384
Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe Tyr Leu Met Asn
115 120 125
ggt gcc gac aag tac cag acc ttc gac ctc aag ggt aac gag ttc acc 432
Gly Ala Asp Lys Tyr Gln Thr Phe Asp Leu Lys Gly Asn Glu Phe Thr
130 135 140
ttc gat gtc gac ctg tcc acc gtc gac tgt ggt ctt aac gcc gct ctt 480
Phe Asp Val Asp Leu Ser Thr Val Asp Cys Gly Leu Asn Ala Ala Leu
145 150 155 160
tac ttc gtc gcc atg gag gaa gac ggt ggc atg gct agc tac ccc aac 528
Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala Ser Tyr Pro Asn
165 170 175
aac aag gcc ggt gcc aag tac ggt acc ggt tac tgt gac gct cag tgt 576
Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys
180 185 190
gcc cgt gac ttg aag ttc gtc ggt ggc aag ggc aac gtt gag gga tgg 624
Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Val Glu Gly Trp
195 200 205
gag cca tcc acc aac gac gac aac gcc ggt gtt ggc cct tac ggt gcc 672
Glu Pro Ser Thr Asn Asp Asp Asn Ala Gly Val Gly Pro Tyr Gly Ala
210 215 220
tgc tgt gcc gaa atc gat gtc tgg gag tcc aac tct cac tct ttc gct 720
Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ser His Ser Phe Ala
225 230 235 240
ttc acc cct cac cct tgc acc acc aac gaa tac cac gtc tgt gag cag 768
Phe Thr Pro His Pro Cys Thr Thr Asn Glu Tyr His Val Cys Glu Gln
245 250 255
gac gag tgt ggt ggt acc tac tct gag gac cga ttc gct ggc aag tgt 816
Asp Glu Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala Gly Lys Cys
260 265 270
gat gcc aac ggt tgt gac tac aac cct tac cgc atg ggt aac acc gac 864
Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly Asn Thr Asp
275 280 285
ttc tac ggc cag ggc aag acc gtc gac acc agc aag aaa ttc act gtt 912
Phe Tyr Gly Gln Gly Lys Thr Val Asp Thr Ser Lys Lys Phe Thr Val
290 295 300
gtc acc cag ttc gcc gaa aac aag ttg act cag ttc ttc gtc cag gac 960
Val Thr Gln Phe Ala Glu Asn Lys Leu Thr Gln Phe Phe Val Gln Asp
305 310 315 320
ggt aag aag att gag atc ccc ggt ccc aag att gac ggt ttc cct acc 1008
Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Ile Asp Gly Phe Pro Thr
325 330 335
gat agc gcc atc acc ccc gag tac tgc act gcc gaa ttc aac gtt cta 1056
Asp Ser Ala Ile Thr Pro Glu Tyr Cys Thr Ala Glu Phe Asn Val Leu
340 345 350
gga gac cgt gac cgc ttc agt gaa gtt ggt ggc ttc gac cag ctc aac 1104
Gly Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe Asp Gln Leu Asn
355 360 365
aac gct ctt gac gta ccc atg gtc ctt gtc atg tcc atc tgg gac gac 1152
Asn Ala Leu Asp Val Pro Met Val Leu Val Met Ser Ile Trp Asp Asp
370 375 380
cac tac gcc aac atg ctt tgg ctc gac tcc agc tac ccc cct gag aag 1200
His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr Pro Pro Glu Lys
385 390 395 400
gct ggc cag ccc ggt ggt gac cgt ggt gac tgt gcc ccc gac tcc ggt 1248
Ala Gly Gln Pro Gly Gly Asp Arg Gly Asp Cys Ala Pro Asp Ser Gly
405 410 415
gtc ccc tcc gac gtc gag gcc agc atc ccc gat gcc aag gtc gtc tgg 1296
Val Pro Ser Asp Val Glu Ala Ser Ile Pro Asp Ala Lys Val Val Trp
420 425 430
tcc aac atc cgc ttc ggt ccc atc ggc tct act gtc gag gtt taa 1341
Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val Glu Val
435 440 445
<210> 44
<211> 446
<212> PRT
<213> 块团炭角菌(Xylaria hypoxylon)
<400> 44
Met Leu Ser Leu Ala Val Ser Ala Ala Leu Leu Gly Leu Ala Ser Ala
1 5 10 15
Gln Gln Val Gly Lys Glu Gln Ser Glu Thr His Pro Lys Leu Ser Trp
20 25 30
Lys Lys Cys Thr Ser Gly Gly Ser Cys Thr Gln Thr Asn Ala Glu Val
35 40 45
Thr Ile Asp Ser Asn Trp Arg Trp Leu His Ser Leu Glu Gly Thr Glu
50 55 60
Asn Cys Tyr Asp Gly Asn Lys Trp Thr Ser Gln Cys Ser Thr Gly Glu
65 70 75 80
Asp Cys Ala Thr Lys Cys Ala Ile Glu Gly Ala Asp Tyr Ser Lys Thr
85 90 95
Tyr Gly Ala Ser Thr Ser Gly Asp Ala Leu Thr Leu Lys Phe Leu Thr
100 105 110
Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe Tyr Leu Met Asn
115 120 125
Gly Ala Asp Lys Tyr Gln Thr Phe Asp Leu Lys Gly Asn Glu Phe Thr
130 135 140
Phe Asp Val Asp Leu Ser Thr Val Asp Cys Gly Leu Asn Ala Ala Leu
145 150 155 160
Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala Ser Tyr Pro Asn
165 170 175
Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala Gln Cys
180 185 190
Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Val Glu Gly Trp
195 200 205
Glu Pro Ser Thr Asn Asp Asp Asn Ala Gly Val Gly Pro Tyr Gly Ala
210 215 220
Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ser His Ser Phe Ala
225 230 235 240
Phe Thr Pro His Pro Cys Thr Thr Asn Glu Tyr His Val Cys Glu Gln
245 250 255
Asp Glu Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala Gly Lys Cys
260 265 270
Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly Asn Thr Asp
275 280 285
Phe Tyr Gly Gln Gly Lys Thr Val Asp Thr Ser Lys Lys Phe Thr Val
290 295 300
Val Thr Gln Phe Ala Glu Asn Lys Leu Thr Gln Phe Phe Val Gln Asp
305 310 315 320
Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Ile Asp Gly Phe Pro Thr
325 330 335
Asp Ser Ala Ile Thr Pro Glu Tyr Cys Thr Ala Glu Phe Asn Val Leu
340 345 350
Gly Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe Asp Gln Leu Asn
355 360 365
Asn Ala Leu Asp Val Pro Met Val Leu Val Met Ser Ile Trp Asp Asp
370 375 380
His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr Pro Pro Glu Lys
385 390 395 400
Ala Gly Gln Pro Gly Gly Asp Arg Gly Asp Cys Ala Pro Asp Ser Gly
405 410 415
Val Pro Ser Asp Val Glu Ala Ser Ile Pro Asp Ala Lys Val Val Trp
420 425 430
Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val Glu Val
435 440 445
<210> 45
<211> 1584
<212> DNA
<213> 黑耳(Exidia glandulosa)
<220>
<221> CDS
<222> (1)..(1584)
<223>
<400> 45
atg tac gcc aag ttc gct acc ctc gct gcc ctc gtg gca gct gcc agc 48
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser
1 5 10 15
gcc cag cag gca tgc aca ctc acc gcc gag aac cat ccc fcc atg act 96
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr
20 25 30
tgg tct aag tgt gcc gcc gga ggt agc tgc act tcg gtt tct ggt tca 144
Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
35 40 45
gtc acc atc gat gcc aac tgg cga tgg ctt cac cag ctc aac agc gcc 192
Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala
50 55 60
acc aac tgc tac gac ggc aac aag tgg aac acc acc tac tgc agc aca 240
Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr
65 70 75 80
gat gct act tgc gct gct cag tgc tgt gtt gat ggc tca gac tat gct 288
Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala
85 90 95
ggc acc tac ggt gcc acc act agc ggt aac gct ctg aac ctc aag ttc 336
Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
100 105 110
gtc acc caa ggg tcc tat tct aag aac atc ggt tcc cgg ttg tac ctc 384
Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu
115 120 125
atg gag tcg gat acc aag tat cag atg ttt caa ctg ctc ggc cag gag 432
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu
130 135 140
ttc act ttc gac gta gat gtc tcc aac ttg ggc tgc ggt ctc aac ggt 480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
gcc ctc tac ttc gtc agc atg gac gct gac ggt ggc acg tcc aag tat 528
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr
165 170 175
acc ggc aac aag gcc ggc gcc aag tat ggc act ggc tac tgc gac agc 576
Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
cag tgc ccg cgc gac ctg aag ttc atc aat ggt cag gcc aac gtc gag 624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu
195 200 205
ggc tgg act cct tcc acc aac gat gcc aac gcc ggc att ggc acc cac 672
Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His
210 215 220
ggc tcc tgc tgt tcg gag atg gac atc tgg gag gct aac aat gtt gcc 720
Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala
225 230 235 240
gct gcg tac acc ccc cat cct tgc aca act atc ggc cag tcg atc tgc 768
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys
245 250 255
tcg ggc gat tct tgc gga gga acc tac agc tct gac cgt tac gcc ggt 816
Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
260 265 270
gtc tgc gat cca gac ggt tgc gat ttc aac agc tac cgc atg ggc gac 864
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
275 280 285
acg ggc ttc tac ggc aag ggc ctg aca gtc gac acg agc tcc aag ttc 912
Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe
290 295 300
acc gtc gtc acc cag ttc ctc acc ggc tcc gac ggc aac ctt tcc gag 960
Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu
305 310 315 320
atc aag cgc ttc tac gtc cag aac ggc aag gtc att ccc aac tcg cag 1008
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln
325 330 335
tcc aag att gcc ggc gtc agc ggc aac tcc atc acc acc gac ttc tgc 1056
Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys
340 345 350
tcc gcc cag aag acc gcc ttc ggc gac acc aac gtc ttc gcg caa aag 1104
Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys
355 360 365
gga ggt ctc gcc ggg atg ggc gcc gcc ctc aag gcc ggc atg gtc ctc 1152
Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu
370 375 380
gtc atg tcc atc tgg gac gac cac gca gtc aac atg ctg tgg ctg gac 1200
Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
tcg acc tac ccg acc gac agc acc aag ccc ggc gcg gcc cgc ggc acc 1248
Ser Thr Tyr Pro Thr Asp Ser Thr Lys Pro Gly Ala Ala Arg Gly Thr
405 410 415
tgc ccg acc acc tcc ggc gtc ccc gcc gac gtc gag gcc cag gtc ccc 1296
Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ala Gln Val Pro
420 425 430
aac tcg aac gtc atc tac tcc aac atc aag gtc ggc ccc atc aac tcg 1344
Asn Ser Asn Val Ile Tyr Ser Asn Ile Lys Val Gly Pro Ile Asn Ser
435 440 445
act ttc acc ggc ggc act tcc ggc ggc ggc ggt agc agc agc agc tcc 1392
Thr Phe Thr Gly Gly Thr Ser Gly Gly Gly Gly Ser Ser Ser Ser Ser
450 455 460
acc acc atc cga acc agc acc acc agc act cgc acc acc agc acc agc 1440
Thr Thr Ile Arg Thr Ser Thr Thr Ser Thr Arg Thr Thr Ser Thr Ser
465 470 475 480
acc gcg ccc ggc ggc ggc tcc act ggc agc gcc ggc gcc gat cac tgg 1488
Thr Ala Pro Gly Gly Gly Ser Thr Gly Ser Ala Gly Ala Asp His Trp
485 490 495
gcg caa tgc ggc ggt atc ggc tgg act ggt ccc acg acc tgc aag agc 1536
Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Thr Cys Lys Ser
500 505 510
ccg tac acg tgc aca gcc tcc aac ccg tac tac tcg cag tgc ttg taa 1584
Pro Tyr Thr Cys Thr Ala Ser Asn Pro Tyr Tyr Ser Gln Cys Leu
515 520 525
<210> 46
<211> 527
<212> PRT
<213> 黑耳(Exidia glandulosa)
<400> 46
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser
1 5 10 15
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr
20 25 30
Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
35 40 45
Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr
65 70 75 80
Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala
85 90 95
Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
100 105 110
Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu
115 120 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr
165 170 175
Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu
195 200 205
Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His
210 215 220
Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala
225 230 235 240
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys
245 250 255
Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
260 265 270
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
275 280 285
Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe
290 295 300
Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln
325 330 335
Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys
340 345 350
Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys
355 360 365
Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu
370 375 380
Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Tyr Pro Thr Asp Ser Thr Lys Pro Gly Ala Ala Arg Gly Thr
405 410 415
Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ala Gln Val Pro
420 425 430
Asn Ser Asn Val Ile Tyr Ser Asn Ile Lys Val Gly Pro Ile Asn Ser
435 440 445
Thr Phe Thr Gly Gly Thr Ser Gly Gly Gly Gly Ser Ser Ser Ser Ser
450 455 460
Thr Thr Ile Arg Thr Ser Thr Thr Ser Thr Arg Thr Thr Ser Thr Ser
465 470 475 480
Thr Ala Pro Gly Gly Gly Ser Thr Gly Ser Ala Gly Ala Asp His Trp
485 490 495
Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Thr Cys Lys Ser
500 505 510
Pro Tyr Thr Cys Thr Ala Ser Asn Pro Tyr Tyr Ser Gln Cys Leu
515 520 525
<210> 47
<211> 1368
<212> DNA
<213> 黑耳(Exidia glandulosa)
<220>
<221> CDS
<222> (1)..(1368)
<223>
<400> 47
atg tac gcc aag ttc gct acc ctc gct gcc ctc gtg gca gct gcc agc 48
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser
1 5 10 15
gcc cag cag gca tgc aca ctc acc gcc gag aac cat ccc tcc atg act 96
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr
20 25 30
tgg tct aag tgt gcc gcc gga ggt agc tgc act tcg gtt tct ggt tca 144
Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
35 40 45
gtc acc atc gat gcc aac tgg cga tgg ctt cac cag ctc aac agc gcc 192
Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala
50 55 60
acc aac tgc tac gac ggc aac aag tgg aac acc acc tac tgc agc aca 240
Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr
65 70 75 80
gat gct act tgc gct gct cag tgc tgt gtt gat ggc tca gac tat gct 288
Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala
85 90 95
ggc acc tac ggt gcc acc act agc ggt aac gct ctg aac ctc aag ttc 336
Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
100 105 110
gtc acc caa ggg tcc tat tct aag aac atc ggt tcc cgg ttg tac ctc 384
Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu
115 120 125
atg gag tcg gat acc aag tat cag atg ttt caa ctg ctc ggc cag gag 432
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu
130 135 140
ttc act ttc gac gta gat gtc tcc aac ttg ggc tgc ggt ctc aac ggt 480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
gcc ctc tac ttc gtc agc atg gac gct gac ggt ggc acg tcc aag tat 528
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr
165 170 175
acc ggc aac aag gcc ggc gcc aag tat ggc act ggc tac tgc gac agc 576
Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
cag tgc ccg cgc gac ctg aag ttc atc aat ggt cag gcc aac gtc gag 624
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu
195 200 205
ggc tgg act cct tcc acc aac gat gcc aac gcc ggc att ggc acc cac 672
Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His
210 215 220
ggc tcc tgc tgt tcg gag atg gac atc tgg gag gct aac aat gtt gcc 720
Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala
225 230 235 240
gct gcg tac acc ccc cat cct tgc aca act atc ggc cag tcg atc tgc 768
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys
245 250 255
tcg ggc gat tct tgc gga gga acc tac agc tct gac cgt tac gcc ggt 816
Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
260 265 270
gtc tgc gat cca gac ggt tgc gat ttc aac agc tac cgc atg ggc gac 864
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
275 280 285
acg ggc ttc tac ggc aag ggc ctg aca gtc gac acg agc tcc aag ttc 912
Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe
290 295 300
acc gtc gtc acc cag ttc ctc acc ggc tcc gac ggc aac ctt tcc gag 960
Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu
305 310 315 320
atc aag cgc ttc tac gtc cag aac ggc aag gtc att ccc aac tcg cag 1008
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln
325 330 335
tcc aag att gcc ggc gtc agc ggc aac tcc atc acc acc gac ttc tgc 1056
Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys
340 345 350
tcc gcc cag aag acc gcc ttc ggc gac acc aac gtc ttc gcg caa aag 1104
Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Ala Gln Lys
355 360 365
gga ggt ctc gcc ggg atg ggc gcc gcc ctc aag gcc ggc atg gtc ctc 1152
Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu
370 375 380
gtc atg tcc atc tgg gac gat cac tac gcc aac atg ctg tgg ctc gac 1200
Val Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp
385 390 395 400
tcg acc tac ccg act gac gcc tct ccc gat gag ccc ggc aag ggc cgc 1248
Ser Thr Tyr Pro Thr Asp Ala Ser Pro Asp Glu Pro Gly Lys Gly Arg
405 410 415
ggc acc tgc gac acc agc tcg ggt gtt cct gct gac atc gag acc agc 1296
Gly Thr Cys Asp Thr Ser Ser Gly Val Pro Ala Asp Ile Glu Thr Ser
420 425 430
cag gcc agc aac tca gtc atc tac tcg aac atc aag ttc gga ccc atc 1344
Gln Ala Ser Asn Ser Val Ile Tyr Ser Asn Ile Lys Phe Gly Pro Ile
435 440 445
aac tcg acc ttc aag gcg tcc taa 1368
Asn Ser Thr Phe Lys Ala Ser
450 455
<210> 48
<211> 455
<212> PRT
<213> 黑耳(Exidia glandulosa)
<400> 48
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ala Ala Ser
1 5 10 15
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Met Thr
20 25 30
Trp Ser Lys Cys Ala Ala Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
35 40 45
Val Thr Ile Asp Ala Asn Trp Arg Trp Leu His Gln Leu Asn Ser Ala
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Lys Trp Asn Thr Thr Tyr Cys Ser Thr
65 70 75 80
Asp Ala Thr Cys Ala Ala Gln Cys Cys Val Asp Gly Ser Asp Tyr Ala
85 90 95
Gly Thr Tyr Gly Ala Thr Thr Ser Gly Asn Ala Leu Asn Leu Lys Phe
100 105 110
Val Thr Gln Gly Ser Tyr Ser Lys Asn Ile Gly Ser Arg Leu Tyr Leu
115 120 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Gln Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Thr Ser Lys Tyr
165 170 175
Thr Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu
195 200 205
Gly Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Ile Gly Thr His
210 215 220
Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Val Ala
225 230 235 240
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Ser Ile Cys
245 250 255
Ser Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly
260 265 270
Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asp
275 280 285
Thr Gly Phe Tyr Gly Lys Gly Leu Thr Val Asp Thr Ser Ser Lys Phe
290 295 300
Thr Val Val Thr Gln Phe Leu Thr Gly Ser Asp Gly Asn Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Gln
325 330 335
Ser Lys Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Thr Asp Phe Cys
340 345 350
Ser Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn ValPhe Ala Gln Lys
355 360 365
Gly Gly Leu Ala Gly Met Gly Ala Ala Leu Lys Ala Gly Met Val Leu
370 375 380
Val Met Ser Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Tyr Pro Thr Asp Ala Ser Pro Asp Glu Pro Gly Lys Gly Arg
405 410 415
Gly Thr Cys Asp Thr Ser Ser Gly Val Pro Ala Asp Ile Glu Thr Ser
420 425 430
Gln Ala Ser Asn Ser Val Ile Tyr Ser Asn Ile Lys Phe Gly Pro Ile
435 440 445
Asn Ser Thr Phe Lys Ala Ser
450 455
<210> 49
<211> 1395
<212> DNA
<213> Poitrasia circinans
<220>
<221> CDS
<222> (1)..(1395)
<223>
<400> 49
atg cat cag act tcc gtt ctt tct tcg ctc tct ttg ctc ctc gca gcc 48
Met His Gln Thr Ser Val Leu Ser Ser Leu Ser Leu Leu Leu Ala Ala
1 5 10 15
tcc ggt gcc cag cag gtc ggc acc cag aat gct gag act cac ccg agt 96
Ser Gly Ala Gln Gln Val Gly Thr Gln Asn Ala Glu Thr His Pro Ser
20 25 30
ctg acc acc cag aag tgt acc acc gac ggc ggc tgc acc gac cag tcc 144
Leu Thr Thr Gln Lys Cys Thr Thr Asp Gly Gly Cys Thr Asp Gln Ser
35 40 45
act gcc atc gtg ctt gac gcc aac tgg cgc tgg ctg cac acc acc gag 192
Thr Ala Ile Val Leu Asp Ala Asn Trp Arg Trp Leu His Thr Thr Glu
50 55 60
ggc tac acc aac tgc tac act ggc cag gaa tgg gac acc gac atc tgc 240
Gly Tyr Thr Asn Cys Tyr Thr Gly Gln Glu Trp Asp Thr Asp Ile Cys
65 70 75 80
tcc tcc ccg gag gct tgc gcc acc ggc tgc gct ctt gac ggt gcc gac 288
Ser Ser Pro Glu Ala Cys Ala Thr Gly Cys Ala Leu Asp Gly Ala Asp
85 90 95
tac gag ggc act tac ggc att acg act gac ggc aac gct ctt tcc atg 336
Tyr Glu Gly Thr Tyr Gly Ile Thr Thr Asp Gly Asn Ala Leu Ser Met
100 105 110
aag ttt gtc acc cag ggc tcg cag aag aac gtc ggc ggt cgt gtt tac 384
Lys Phe Val Thr Gln Gly Ser Gln Lys Asn Val Gly Gly Arg Val Tyr
115 120 125
ctg ctt gct ccc gac tcc gaa gat gcg tac gag ctc ttc aag ttg aag 432
Leu Leu Ala Pro Asp Ser Glu Asp Ala Tyr Glu Leu Phe Lys Leu Lys
130 135 140
aac cag gag ttc act ttc gac gtt gac gtc tcc gac ctc ccc tgc ggc 480
Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asp Leu Pro Cys Gly
145 150 155 160
ctg aac ggc gcc ctg tac ttc tcc gag atg gat gaa gat ggt ggc atg 528
Leu Asn Gly Ala Leu Tyr Phe Ser Glu Met Asp Glu Asp Gly Gly Met
165 170 175
tcc aag tac gag aac aac aag gcc ggc gcc aag tac ggc act ggc tac 576
Ser Lys Tyr Glu Asn Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr
180 185 190
tgc gac acg cag tgc ccc cac gac gtc aag ttc atc aac ggc gag gcc 624
Cys Asp Thr Gln Cys Pro His Asp Val Lys Phe Ile Asn Gly Glu Ala
195 200 205
aac att ctc aac tgg acc aag tcc gag acc gac gtc aac gcc ggc act 672
Asn Ile Leu Asn Trp Thr Lys Ser Glu Thr Asp Val Asn Ala Gly Thr
210 215 220
ggc caa tac ggc tcc tgc tgc aac gag atg gat atc tgg gag gcc aac 720
Gly Gln Tyr Gly Ser Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn
225 230 235 240
tcg cag gcc acc gcc gtc act ccc cac gtc tgc aac gcc gat gtc atc 768
Ser Gln Ala Thr Ala Val Thr Pro His Val Cys Asn Ala Asp Val Ile
245 250 255
ggc cag gtc cgt tgc aac ggc acc gac tgc ggt gac ggc gac aac cgc 816
Gly Gln Val Arg Cys Asn Gly Thr Asp Cys Gly Asp Gly Asp Asn Arg
260 265 270
tac ggc ggc gtc tgc gac aag gat ggc tgc gac tac aac ccc tac cgc 864
Tyr Gly Gly Val Cys Asp Lys Asp Gly Cys Asp Tyr Asn Pro Tyr Arg
275 280 285
atg ggc aac gag tcg ttc tac ggc tcc aac ggc agc acc atc gac acc 912
Met Gly Asn Glu Ser Phe Tyr Gly Ser Asn Gly Ser Thr Ile Asp Thr
290 295 300
act gcc aag ttc acc gtc att acg cag ttc atc acc tcg gac aac act 960
Thr Ala Lys Phe Thr Val Ile Thr Gln Phe Ile Thr Ser Asp Asn Thr
305 310 315 320
tcg act ggc gac ctc gtt gag atc cgc cgc aag tac gtc cag gac ggc 1008
Ser Thr Gly Asp Leu Val Glu Ile Arg Arg Lys Tyr Val Gln Asp Gly
325 330 335
acc gtc atc gag aac tcg ttc gcc gac tac gac acc ctg gcc acg ttc 1056
Thr Val Ile Glu Asn Ser Phe Ala Asp Tyr Asp Thr Leu Ala Thr Phe
340 345 350
aac tcc atc tcg gac gac ttc tgc gac gcc cag aag acg ctc ttc ggc 1104
Asn Ser Ile Ser Asp Asp Phe Cys Asp Ala Gln Lys Thr Leu Phe Gly
355 360 365
gac gag aac gac ttc aag acc aag ggc ggc att gcc cgc atg ggc gag 1152
Asp Glu Asn Asp Phe Lys Thr Lys Gly Gly Ile Ala Arg Met Gly Glu
370 375 380
tcc ttc gag cgc ggc atg gtc ctc gtc atg agc atc tgg gat gac cac 1200
Ser Phe Glu Arg Gly Met Val Leu Val Met Ser Ile Trp Asp Asp His
385 390 395 400
gcg gcc aac gcc ctc tgg ctc gac tcg acc tac ccc gtc gac ggc gac 1248
Ala Ala Asn Ala Leu Trp Leu Asp Ser Thr Tyr Pro Val Asp Gly Asp
405 410 415
gcg acc aag cct ggc atc aag cgc ggc cct tgc ggc acc gac act ggt 1296
Ala Thr Lys Pro Gly Ile Lys Arg Gly Pro Cys Gly Thr Asp Thr Gly
420 425 430
gtt ccc gcc gac gtc gag tcg gag tcg ccc gat tcg acc gtc atc tac 1344
Val Pro Ala Asp Val Glu Ser Glu Ser Pro Asp Ser Thr Val Ile Tyr
435 440 445
tcc aac att cgc tac gga gac att ggc tcc acc ttc aac gcc acc gct 1392
Ser Asn Ile Arg Tyr Gly Asp Ile Gly Ser Thr Phe Asn Ala Thr Ala
450 455 460
tag 1395
<210> 50
<211> 464
<212> PRT
<213> Poitrasia circinans
<400> 50
Met His Gln Thr Ser Val Leu Ser Ser Leu Ser Leu Leu Leu Ala Ala
1 5 10 15
Ser Gly Ala Gln Gln Val Gly Thr Gln Asn Ala Glu Thr His Pro Ser
20 25 30
Leu Thr Thr Gln Lys Cys Thr Thr Asp Gly Gly Cys Thr Asp Gln Ser
35 40 45
Thr Ala Ile Val Leu Asp Ala Asn Trp Arg Trp Leu His Thr Thr Glu
50 55 60
Gly Tyr Thr Asn Cys Tyr Thr Gly Gln Glu Trp Asp Thr Asp Ile Cys
65 70 75 80
Ser Ser Pro Glu Ala Cys Ala Thr Gly Cys Ala Leu Asp Gly Ala Asp
85 90 95
Tyr Glu Gly Thr Tyr Gly Ile Thr Thr Asp Gly Asn Ala Leu Ser Met
100 105 110
Lys Phe Val Thr Gln Gly Ser Gln Lys Asn Val Gly Gly Arg Val Tyr
115 120 125
Leu Leu Ala Pro Asp Ser Glu Asp Ala Tyr Glu Leu Phe Lys Leu Lys
130 135 140
Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asp Leu Pro Cys Gly
145 150 155 160
Leu Asn Gly Ala Leu Tyr Phe Ser Glu Met Asp Glu Asp Gly Gly Met
165 170 175
Ser Lys Tyr Glu Asn Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr
180 185 190
Cys Asp Thr Gln Cys Pro His Asp Val Lys Phe Ile Asn Gly Glu Ala
195 200 205
Asn Ile Leu Asn Trp Thr Lys Ser Glu Thr Asp Val Asn Ala Gly Thr
210 215 220
Gly Gln Tyr Gly Ser Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn
225 230 235 240
Ser Gln Ala Thr Ala Val Thr Pro His Val Cys Asn Ala Asp Val Ile
245 250 255
Gly Gln Val Arg Cys Asn Gly Thr Asp Cys Gly Asp Gly Asp Asn Arg
260 265 270
Tyr Gly Gly Val Cys Asp Lys Asp Gly Cys Asp Tyr Asn Pro Tyr Arg
275 280 285
Met Gly Asn Glu Ser Phe Tyr Gly Ser Asn Gly Ser Thr Ile Asp Thr
290 295 300
Thr Ala Lys Phe Thr Val Ile Thr Gln Phe Ile Thr Ser Asp Asn Thr
305 310 315 320
Ser Thr Gly Asp Leu Val Glu Ile Arg Arg Lys Tyr Val Gln Asp Gly
325 330 335
Thr Val Ile Glu Asn Ser Phe Ala Asp Tyr Asp Thr Leu Ala Thr Phe
340 345 350
Asn Ser Ile Ser Asp Asp Phe Cys Asp Ala Gln Lys Thr Leu Phe Gly
355 360 365
Asp Glu Asn Asp Phe Lys Thr Lys Gly Gly Ile Ala Arg Met Gly Glu
370 375 380
Ser Phe Glu Arg Gly Met Val Leu Val Met Ser Ile Trp Asp Asp His
385 390 395 400
Ala Ala Asn Ala Leu Trp Leu Asp Ser Thr Tyr Pro Val Asp Gly Asp
405 410 415
Ala Thr Lys Pro Gly Ile Lys Arg Gly Pro Cys Gly Thr Asp Thr Gly
420 425 430
Val Pro Ala Asp Val Glu Ser Glu Ser Pro Asp Ser Thr Val Ile Tyr
435 440 445
Ser Asn Ile Arg Tyr Gly Asp Ile Gly Ser Thr Phe Asn Ala Thr Ala
450 455 460
<210> 51
<211> 1383
<212> DNA
<213> 灰色鬼伞(Coprinus cinereus)
<220>
<221> CDS
<222> (1)..(1383)
<223>
<400> 51
atg ttc aag aaa gtc gcc ctc acc gct ctc tgc ttc ctc gcc gtc gca 48
Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala
1 5 10 15
cag gcc caa cag gtc ggt cgc gaa gtc gct gaa aac cac ccc cgt ctc 96
Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu
20 25 30
ccg tgg cag cgt tgc act cgc aac ggc gga tgc cag act gtc tcc aac 144
Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn
35 40 45
ggt cag gtc gtc ctc gac gcc aac tgg cga tgg ctc cac gtc acc gac 192
Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp
50 55 60
ggc tac acc aac tgc tac acc ggt aac tcc tgg aac agc acc gtc tgc 240
Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys
65 70 75 80
tcc gac ccc acc acc tgc gct cag cga tgc gct ctc gag ggt gcc aac 288
Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn
85 90 95
tac cag caa acc tac ggt atc acc acc aac gga gac gcc ctc acc atc 336
Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile
100 105 110
aag ttc ctc acc cga tcc caa caa acc aac gtc ggt gct cgt gtc tac 384
Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr
115 120 125
ctc atg gag aac gag aac cga tac cag atg ttc aac ctc ctc aac aag 432
Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys
130 135 140
gag ttc acc ttc gac gtt gac gtc tcc aag gtt cct tgc ggt atc aac 480
Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn
145 150 155 160
ggt gcc ctc tac ttc atc cag atg gac gcc gat ggt ggt atg agc aag 528
Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
caa ccc aac aac agg gct ggt gct aag tac ggt acc ggc tac tgc gac 576
Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
tct cag tgc ccc cgt gac atc aag ttc att gac ggc gtg gcc aac agc 624
Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser
195 200 205
gcc gac tgg act cca tcc gag acc gat ccc aat gcc gga agg ggt cgc 672
Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg
210 215 220
tac ggc att tgc tgc gcc gag atg gat atc tgg gag gcc aac tcc atc 720
Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile
225 230 235 240
tcc aat gcc tac acc ccc cac cct tgc cga acc cag aac gat ggt ggc 768
Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly
245 250 255
tac cag cgc tgc gag ggc cgc gac tgc aac cag cct cgc tat gag ggt 816
Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly
260 265 270
ctt tgc gat cct gat ggc tgt gac tac aac ccc ttc cgc atg ggt aac 864
Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn
275 280 285
aag gac ttc tac gga ccc gga aag acc gtc gac acc aac agg aag atg 912
Lys Asp Phe Tyr Gly Pro Gly Lys Thr Val Asp Thr Asn Arg Lys Met
290 295 300
acc gtc gtc acc caa ttc atc acc cac gac aac acc gac act ggc acc 960
Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr
305 310 315 320
ctc gtt gac atc cgc cgc ctc tac gtt caa gac ggc cgt gtc att gcc 1008
Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala
325 330 335
aac cct ccc acc aac ttc ccc ggt ctc atg ccc gcc cac gac tcc atc 1056
Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile
340 345 350
acc gag cag ttc tgc act gac cag aag aac ctc ttc ggc gac tac agc 1104
Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser
355 360 365
agc ttc gct cgt gac ggt ggt ctc gct cac atg ggt cgc tcc ctc gcc 1152
Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala
370 375 380
aag ggt cac gtc ctc gct ctc tcc atc tgg aac gac cac ggt gcc cac 1200
Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His
385 390 395 400
atg ttg tgg ctc gac tcc aac tac ccc acc gac gct gac ccc aac aag 1248
Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys
405 410 415
ccc ggt att gct cgt ggt acc tgc ccg acc act ggt ggc acc ccc cgt 1296
Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg
420 425 430
gaa acc gaa caa aac cac cct gat gcc cag gtc atc ttc tcc aac att 1344
Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile
435 440 445
aaa ttc ggt gac atc ggc tcg act ttc tct ggt tac taa 1383
Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr
450 455 460
<210> 52
<211> 460
<212> PRT
<213> 灰色鬼伞(Coprinus cinereus)
<400> 52
Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala
1 5 10 15
Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu
20 25 30
Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn
35 40 45
Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp
50 55 60
Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys
65 70 75 80
Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn
85 90 95
Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile
100 105 110
Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr
115 120 125
Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn
145 150 155 160
Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser
195 200 205
Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg
210 215 220
Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile
225 230 235 240
Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly
245 250 255
Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly
260 265 270
Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn
275 280 285
Lys Asp Phe Tyr Gly Pro Gly Lys Thr Val Asp Thr Asn Arg Lys Met
290 295 300
Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr
305 310 315 320
Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala
325 330 335
Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile
340 345 350
Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser
355 360 365
Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala
370 375 380
Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His
385 390 395 400
Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys
405 410 415
Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg
420 425 430
Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile
435 440 445
Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr
450 455 460
<210> 53
<211> 1353
<212> DNA
<213> 支顶孢菌(Acremonium sp.)
<220>
<221> CDS
<222> (1)..(1353)
<223>
<400> 53
atg atg aag cag tat ctt cag tac ctg gcg gcg gct ctg ccc cta atg 48
Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu Met
1 5 10 15
ggc ctt gcc gcg ggc cag caa gcc ggc cgg gag acg ccc gaa aac cac 96
Gly Leu Ala Ala Gly Gln Gln Ala Gly Arg Glu Thr Pro Glu Asn His
20 25 30
ccc cgg ctc acc tgg aag aag tgc tcg ggc cag ggg tcc tgc cag acc 144
Pro Arg Leu Thr Trp Lys Lys Cys Ser Gly Gln Gly Ser Cys Gln Thr
35 40 45
gtc aac ggc gag gtc gtc att gat gcc aac tgg cgc tgg ctc cac gac 192
Val Asn Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Asp
50 55 60
tcc aac atg cag aac tgc tac gac ggc aac cag tgg acc agc gcg tgc 240
Ser Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Ser Ala Cys
65 70 75 80
agc tcg gcc acc gac tgc gcc tcc aag tgc tac atc gag ggt gcc gac 288
Ser Ser Ala Thr Asp Cys Ala Ser Lys Cys Tyr Ile Glu Gly Ala Asp
85 90 95
tac ggc agg acc tac ggc gct tcg acg agc ggc gac tcc ctc acg ctc 336
Tyr Gly Arg Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu
100 105 110
aag ttt gtc act cag cac gag tac ggt acc aac atc ggc tcg cgc ttc 384
Lys Phe Val Thr Gln His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe
115 120 125
tac ctg atg agc agc ccg acc cgg tac cag atg ttc acc ctc atg aac 432
Tyr Leu Met Ser Ser Pro Thr Arg Tyr Gln Met Phe Thr Leu Met Asn
130 135 140
aac gaa ttt gct ttc gat gtc gac ctc tcg acc gtc gag tgc ggc atc 480
Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys Gly Ile
145 150 155 160
aac agc gcc ctg tac ttc gtc gcc atg gag gag gac ggc ggc atg gcc 528
Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala
165 170 175
agc tac ccc acc aac aag gcc gga gcc aag tac ggc acg ggt tac tgc 576
Ser Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
180 185 190
gac gcc caa tgc gcc cgt gat ctc aag ttc gtc ggc ggc aag gcc aac 624
Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Ala Asn
195 200 205
att gag ggc tgg agg ccg tcc acc aac gac gcg aac gcc ggc gtc ggc 672
Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly
210 215 220
ccg atg ggc ggc tgc tgc gcg gaa atc gat gtt tgg gag tcc aac gcc 720
Pro Met Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala
225 230 235 240
cac gct ttt gcc ttc acg ccg cac gcg tgc gag aac aac aac tac cac 768
His Ala Phe Ala Phe Thr Pro His Ala Cys Glu Asn Asn Asn Tyr His
245 250 255
atc tgc gag acc tcc aac tgc ggc ggt acc tac tcc gac gac cgc ttc 816
Ile Cys Glu Thr Ser Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe
260 265 270
gcc ggc ctc tgc gac gcc aac ggc tgc gac tac aac ccg tac cgc atg 864
Ala Gly Leu Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met
275 280 285
ggc aac ccc gac ttc tac ggc aag ggc aag act ctt gac acc tcg cgg 912
Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr Ser Arg
290 295 300
aag ttc acc gtc gtc acc cgc ttc cag gag aac gac ctc tcg cag tac 960
Lys Phe Thr Val Val Thr Arg Phe Gln Glu Asn Asp Leu Ser Gln Tyr
305 310 315 320
ttc atc cag gac ggc cgc aag atc gag atc ccg ccc ccg acc tgg gac 1008
Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr Trp Asp
325 330 335
ggc ctc ccg aag agc agc cac atc acg ccc gag ctg tgc gcg acc cag 1056
Gly Leu Pro Lys Ser Ser His Ile Thr Pro Glu Leu Cys Ala Thr Gln
340 345 350
ttc gac gtc ttc gac gac cgc aac cgc ttc gag gag gtc ggc ggc ttc 1104
Phe Asp Val Phe Asp Asp Arg Asn Arg Phe Glu Glu Val Gly Gly Phe
355 360 365
ccc gcc ctc aac gcc gct ctc cgc atc ccc atg gtc ctt gtc atg tcc 1152
Pro Ala Leu Asn Ala Ala Leu Arg Ile Pro Met Val Leu Val Met Ser
370 375 380
atc tgg gac gac cac tac gcc aac atg ctc tgg ctc gac tcc gtc tac 1200
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Val Tyr
385 390 395 400
ccg ccc gag aag gag ggc acc ccc ggc gcc gag cgt ggc cct tgc ccc 1248
Pro Pro Glu Lys Glu Gly Thr Pro Gly Ala Glu Arg Gly Pro Cys Pro
405 410 415
cag acc tct ggt gtc ccc gcc gaa gtc gag gcc cag tac ccc aac gcc 1296
Gln Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asn Ala
420 425 430
aag gtc gtc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg acc tac 1344
Lys Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Tyr
435 440 445
aac atg taa 1353
Asn Met
450
<210> 54
<211> 450
<212> PRT
<213> 支顶孢菌(Acremonium sp.)
<400> 54
Met Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Ala Leu Pro Leu Met
1 5 10 15
Gly Leu Ala Ala Gly Gln Gln Ala Gly Arg Glu Thr Pro Glu Asn His
20 25 30
Pro Arg Leu Thr Trp Lys Lys Cys Ser Gly Gln Gly Ser Cys Gln Thr
35 40 45
Val Asn Gly Glu Val Val Ile Asp Ala Asn Trp Arg Trp Leu His Asp
50 55 60
Ser Asn Met Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Ser Ala Cys
65 70 75 80
Ser Ser Ala Thr Asp Cys Ala Ser Lys Cys Tyr Ile Glu Gly Ala Asp
85 90 95
Tyr Gly Arg Thr Tyr Gly Ala Ser Thr Ser Gly Asp Ser Leu Thr Leu
100 105 110
Lys Phe Val Thr Gln His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Phe
115 120 125
Tyr Leu Met Ser Ser Pro Thr Arg Tyr Gln Met Phe Thr Leu Met Asn
130 135 140
Asn Glu Phe Ala Phe Asp Val Asp Leu Ser Thr Val Glu Cys Gly Ile
145 150 155 160
Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Met Ala
165 170 175
Ser Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
180 185 190
Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Ala Asn
195 200 205
Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly
210 215 220
Pro Met Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Ala
225 230 235 240
His Ala Phe Ala Phe Thr Pro His Ala Cys Glu Asn Asn Asn Tyr His
245 250 255
Ile Cys Glu Thr Ser Asn Cys Gly Gly Thr Tyr Ser Asp Asp Arg Phe
260 265 270
Ala Gly Leu Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met
275 280 285
Gly Asn Pro Asp Phe Tyr Gly Lys Gly Lys Thr Leu Asp Thr Ser Arg
290 295 300
Lys Phe Thr Val Val Thr Arg Phe Gln Glu Asn Asp Leu Ser Gln Tyr
305 310 315 320
Phe Ile Gln Asp Gly Arg Lys Ile Glu Ile Pro Pro Pro Thr Trp Asp
325 330 335
Gly Leu Pro Lys Ser Ser His Ile Thr Pro Glu Leu Cys Ala Thr Gln
340 345 350
Phe Asp Val Phe Asp Asp Arg Asn Arg Phe Glu Glu Val Gly Gly Phe
355 360 365
Pro Ala Leu Asn Ala Ala Leu Arg Ile Pro Met Val Leu Val Met Ser
370 375 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Val Tyr
385 390 395 400
Pro Pro Glu Lys Glu Gly Thr Pro Gly Ala Glu Arg Gly Pro Cys Pro
405 410 415
Gln Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro Asn Ala
420 425 430
Lys Val Val Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Tyr
435 440 445
Asn Met
450
<210> 55
<211> 1599
<212> DNA
<213> Chaetomidium pingtungium
<220>
<221> CDS
<222> (1)..(1599)
<223>
<400> 55
atg ctg gcc tcc acc ttc tcc tac cgc atg tac aag acc gcg ctc atc 48
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
ctg gcc gcc ctt ctg ggc tct ggc cag gct cag cag gtc ggt act tcc 96
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
cag gcg gaa gtg cat ccg tcc atg acc tgg cag agc tgc acg gct ggc 144
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
ggc agc tgc acc acc aac aac ggc aag gtg gtc atc gac gcg aac tgg 192
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
cgt tgg gtg cac aaa gtc ggc gac tac acc aac tgc tac acc ggc aac 240
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
acc tgg gac acg act atc tgc cct gac gat gcg acc tgc gca tcc aac 288
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
tgc gcc ctt gag ggt gcc aac tac gaa tcc acc tat ggt gtg acc gcc 336
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
agc ggc aat tcc ctc cgc ctc aac ttc gtc acc acc agc cag cag aag 384
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
aac att ggc tcg cgt ctg tac atg atg aag gac gac tcg acc tac gag 432
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
atg ttt aag ctg ctg aac cag gag ttc acc ttc gat gtc gat gtc tcc 480
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
aac ctc ccc tgc ggt ctc aac ggt gct ctg tac ttt gtc gcc atg gac 528
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
gcc ggc ggt ggc atg tcc aag tac cca acc aac aag gcc ggt gcc aag 576
Ala Gly Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
tac ggt act gga tac tgt gac tcg cag tgc cct cgc gac ctc aag ttc 624
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
atc aac ggt cag gcc aac gtt gaa ggg tgg cag ccc tcc tcc aac gat 672
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
gcc aat gcg ggt acc ggc aac cac ggg tcc tgc tgc gcg gag atg gat 720
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
atc tgg gag gcc aac agc atc tcc acg gcc ttc acc ccc cat ccg tgc 768
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
gac acg ccc ggc cag gtg atg tgc acc ggt gat gcc tgc ggt ggc acc 816
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
tac agc tcc gac cgc tac ggc ggc acc tgc gac ccc gac gga tgt gat 864
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
ttc aac tcc ttc cgc cag ggc aac aag acc ttc tac ggc cct ggc atg 912
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
acc gtc gac acc aag agc aag ttt acc gtc gtc acc cag ttc atc acc 960
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
gac gac ggc acc tcc agc ggc acc ctc aag gag atc aag cgc ttc tac 1008
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
gtg cag aac ggc aag gtg atc ccc aac tcg gag tcg acc tgg acc ggc 1056
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
gtc agc ggc aac tcc atc acc acc gag tac tgc acc gcc cag aag agc 1104
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
ctg ttc cag gac cag aac gtc ttc gaa aag cac ggc ggc ctc gag ggc 1152
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
atg ggt gct gcc ctc gcc cag ggc atg gtt ctc gtc atg tcc ctg tgg 1200
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
gat gat cac tcg gcc aac atg ctc tgg ctc gac agc aac tac ccg acc 1248
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
act gcc tct tcc acc act ccc ggc gtc gcc cgt ggt acc tgc gac atc 1296
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
tcc tcc ggc gtc cct gcg gat gtc gag gcg aac cac ccc gac gcc tac 1344
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
gtc gtc tac tcc aac atc aag gtc ggc ccc atc ggc tcg acc ttc aac 1392
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
agc ggt ggc tcg aac ccc ggt ggc gga acc acc acg aca act acc acc 1440
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
cag cct act acc acc acg acc acg gct gga aac cct ggc ggc acc gga 1488
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
gtc gca cag cac tat ggc cag tgt ggt gga atc gga tgg acc gga ccc 1536
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
aca acc tgt gcc agc cct tat acc tgc cag aag ctg aat gat tat tac 1584
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
tct cag tgc ctg tag 1599
Ser Gln Cys Leu
530
<210> 56
<211> 532
<212> PRT
<213> Chaetomidium pingtungium
<400> 56
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Gly Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
<210> 57
<211> 1383
<212> DNA
<213> Sporotrichum pruinosum
<220>
<221> CDS
<222> (1)..(1383)
<223>
<400> 57
atg ttc aag aaa gtc gcc ctc acc gct ctc tgc ttc ctc gcc gtc gca 48
Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala
1 5 10 15
cag gcc caa cag gtc ggt cgc gaa gtc gct gaa aac cac ccc cgt ctc 96
Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu
20 25 30
ccg tgg cag cgt tgc act cgc aac ggc gga tgc cag act gtc tct aac 144
Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn
35 40 45
ggt cag gtc gtc ctc gac gcc aac tgg cga tgg ctc cac gtc acc gat 192
Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp
50 55 60
ggc tac acc aac tgc tac acc ggt aac tcc tgg aac agc acc gtc tgc 240
Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys
65 70 75 80
tcc gac ccc acc acc tgc gct cag cga tgc gct ctc gag ggt gcc aac 288
Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn
85 90 95
tac cag caa acc tac ggt atc acc acc aac gga gac gcc ctc acc atc 336
Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile
100 105 110
aag ttc ctc acc cga tcc caa caa acc aac gtc ggt gct cgt gtc tac 384
Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr
115 120 125
ctc atg gag aac gag aac cga tac cag atg ttc aac ctc ctc aac aag 432
Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys
130 135 140
gag ttc acc ttc gac gtt gac gtc tcc aag gtt cct tgc ggt atc aac 480
Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn
145 150 155 160
ggt gcc ctc tac ttc atc cag atg gac gcc gat ggt ggt atg agc aag 528
Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
caa ccc aac aac agg gct ggt gct aag tac ggt acc ggc tac tgc gac 576
Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
tct cag tgc ccc cgt gac atc aag ttc att gac ggc gtg gcc aac agc 624
Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser
195 200 205
gcc gac tgg act cca tcc gag acc gat ccc aat gcc gga agg ggt cgc 672
Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg
210 215 220
tac ggc att tgc tgc gcc gag atg gat atc tgg gag gcc aac tcc atc 720
Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile
225 230 235 240
tcc aat gcc tac acc ccc cac cct tgc cga acc cag aac gat ggt ggc 768
Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly
245 250 255
tac cag cgc tgc gag ggc cgc gac tgc aac cag cct cgc tat gag ggt 816
Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly
260 265 270
ctt tgc gat cct gat ggc tgt gac tac aac ccc ttc cgc atg ggt aac 864
Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn
275 280 285
aag gac ttc tac gga ccc gga aag acc atc gac acc aac agg aag atg 912
Lys Asp Phe Tyr Gly Pro Gly Lys Thr Ile Asp Thr Asn Arg Lys Met
290 295 300
acc gtc gtc acc caa ttc atc acc cac gac aac acc gac act ggc acc 960
Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr
305 310 315 320
ctc gtt gac atc cgc cgc ctc tac gtt caa gac ggc cgt gtc att gcc 1008
Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala
325 330 335
aac cct ccc acc aac ttc ccc ggt ctc atg ccc gcc cac gac tcc atc 1056
Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile
340 345 350
acc gag cag ttc tgc act gac cag aag aac ctc ttc ggc gac tac agc 1104
Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser
355 360 365
agc ttc gct cgt gac ggt ggt ctc gct cac atg ggt cgc tcc ctc gcc 1152
Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala
370 375 380
aag ggt cac gtc ctc gct ctc tcc atc tgg aac gac cac ggt gcc cac 1200
Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His
385 390 395 400
atg ttg tgg ctc gac tcc aac tac ccc acc gac gct gac ccc aac aag 1248
Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys
405 410 415
ccc ggt att gct cgt ggt acc tgc ccg acc act ggt ggc acc ccc cgt 1296
Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg
420 425 430
gaa acc gaa caa aac cac cct gat gcc cag gtc atc ttc tcc aac att 1344
Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile
435 440 445
aaa ttc ggt gac atc ggc tcg act ttc tct ggt tac taa 1383
Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr
450 455 460
<210> 58
<211> 460
<212> PRT
<213> Sporotrichum pruinosum
<400> 58
Met Phe Lys Lys Val Ala Leu Thr Ala Leu Cys Phe Leu Ala Val Ala
1 5 10 15
Gln Ala Gln Gln Val Gly Arg Glu Val Ala Glu Asn His Pro Arg Leu
20 25 30
Pro Trp Gln Arg Cys Thr Arg Asn Gly Gly Cys Gln Thr Val Ser Asn
35 40 45
Gly Gln Val Val Leu Asp Ala Asn Trp Arg Trp Leu His Val Thr Asp
50 55 60
Gly Tyr Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asn Ser Thr Val Cys
65 70 75 80
Ser Asp Pro Thr Thr Cys Ala Gln Arg Cys Ala Leu Glu Gly Ala Asn
85 90 95
Tyr Gln Gln Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ala Leu Thr Ile
100 105 110
Lys Phe Leu Thr Arg Ser Gln Gln Thr Asn Val Gly Ala Arg Val Tyr
115 120 125
Leu Met Glu Asn Glu Asn Arg Tyr Gln Met Phe Asn Leu Leu Asn Lys
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Lys Val Pro Cys Gly Ile Asn
145 150 155 160
Gly Ala Leu Tyr Phe Ile Gln Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
Gln Pro Asn Asn Arg Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ser Gln Cys Pro Arg Asp Ile Lys Phe Ile Asp Gly Val Ala Asn Ser
195 200 205
Ala Asp Trp Thr Pro Ser Glu Thr Asp Pro Asn Ala Gly Arg Gly Arg
210 215 220
Tyr Gly Ile Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile
225 230 235 240
Ser Asn Ala Tyr Thr Pro His Pro Cys Arg Thr Gln Asn Asp Gly Gly
245 250 255
Tyr Gln Arg Cys Glu Gly Arg Asp Cys Asn Gln Pro Arg Tyr Glu Gly
260 265 270
Leu Cys Asp Pro Asp Gly Cys Asp Tyr Asn Pro Phe Arg Met Gly Asn
275 280 285
Lys Asp Phe Tyr Gly Pro Gly Lys Thr Ile Asp Thr Asn Arg Lys Met
290 295 300
Thr Val Val Thr Gln Phe Ile Thr His Asp Asn Thr Asp Thr Gly Thr
305 310 315 320
Leu Val Asp Ile Arg Arg Leu Tyr Val Gln Asp Gly Arg Val Ile Ala
325 330 335
Asn Pro Pro Thr Asn Phe Pro Gly Leu Met Pro Ala His Asp Ser Ile
340 345 350
Thr Glu Gln Phe Cys Thr Asp Gln Lys Asn Leu Phe Gly Asp Tyr Ser
355 360 365
Ser Phe Ala Arg Asp Gly Gly Leu Ala His Met Gly Arg Ser Leu Ala
370 375 380
Lys Gly His Val Leu Ala Leu Ser Ile Trp Asn Asp His Gly Ala His
385 390 395 400
Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asp Ala Asp Pro Asn Lys
405 410 415
Pro Gly Ile Ala Arg Gly Thr Cys Pro Thr Thr Gly Gly Thr Pro Arg
420 425 430
Glu Thr Glu Gln Asn His Pro Asp Ala Gln Val Ile Phe Ser Asn Ile
435 440 445
Lys Phe Gly Asp Ile Gly Ser Thr Phe Ser Gly Tyr
450 455 460
<210> 59
<211> 1578
<212> DNA
<213> 嗜热小柱孢菌(Scytalidium thermophilum)
<220>
<221> CDS
<222> (1)..(1578)
<223>
<400> 59
atg cgt acc gcc aag ttc gcc acc ctc gcc gcc ctt gtg gcc tcg gcc 48
Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala
1 5 10 15
gcc gcc cag cag gcg tgc agt ctc acc acc gag agg cac cct tcc ctc 96
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu
20 25 30
tct tgg aag aag tgc acc gcc ggc ggc cag tgc cag acc gtc cag gct 144
Ser Trp Lys Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala
35 40 45
tcc atc act ctc gac tcc aac tgg cgc tgg act cac cag gtg tct ggc 192
Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly
50 55 60
tcc acc aac tgc tac acg ggc aac aag tgg gat act agc atc tgc act 240
Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr
65 70 75 80
gat gcc aag tcg tgc gct cag aac tgc tgc gtc gat ggt gcc gac tac 288
Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
acc agc acc tat ggc atc acc acc aac ggt gat tcc ctg agc ctc aag 336
Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys
100 105 110
ttc gtc acc aag ggc cag cac tcg acc aac gtc ggc tcg cgt acc tac 384
Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr
115 120 125
ctg atg gac ggc gag gac aag tat cag acc ttc gag ctc ctc ggc aac 432
Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn
130 135 140
gag ttc acc ttc gat gtc gat gtc tcc aac atc ggc tgc ggt ctc aac 480
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn
145 150 155 160
ggc gcc ctg tac ttc gtc tcc atg gac gcc gat ggt ggt ctc agc cgc 528
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg
165 170 175
tat cct ggc aac aag gct ggt gcc aag tac ggt acc ggc tac tgc gat 576
Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
gct cag tgc ccc cgt gac atc aag ttc atc aac ggc gag gcc aac att 624
Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
gag ggc tgg acc ggc tcc acc aac gac ccc aac gcc ggc gcg ggc cgc 672
Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg
210 215 220
tat ggt acc tgc tgc tct gag atg gat atc tgg gaa gcc aac aac atg 720
Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225 230 235 240
gct act gcc ttc act cct cac cct tgc acc atc att ggc cag agc cgc 768
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
tgc gag ggc gac tcg tgc ggt ggc acc tac agc aac gag cgc tac gcc 816
Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala
260 265 270
ggc gtc tgc gac ccc gat ggc tgc gac ttc aac tcg tac cgc cag ggc 864
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly
275 280 285
aat aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag 912
Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
atc act gtc gtc acc cag ttc ctc aag gat gcc aac ggc gat ctc ggc 960
Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly
305 310 315 320
gag gtc aag cgc ttc tac gtc cag gat ggc aag atc atc ccc aac tcc 1008
Glu Val Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser
325 330 335
gag tcc acc atc ccc ggc gtc gag ggc aat tcc atc acc cag gac tgg 1056
Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp
340 345 350
tgc gac cgc cag aag gtt gcc ttt ggc gac att gac gac ttc aac cgc 1104
Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
aag ggc ggc atg aag cag atg ggc aag gcc ctc gcc ggc ccc atg gtc 1152
Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val
370 375 380
ctg gtc atg tcc atc tgg gat gac cac gcc tcc aac atg ctc tgg ctc 1200
Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu
385 390 395 400
gac tcg acc ttc cct gtc gat gcc gct ggc aag ccc ggc gcc gag cgc 1248
Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg
405 410 415
ggt gcc tgc ccg acc acc tcg ggt gtc cct gct gag gtt gag gcc gag 1296
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu
420 425 430
gcc ccc aac agc aac gtc gtc ttc tcc aac atc cgc ttc ggc ccc atc 1344
Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
ggc tcg acc gtt gct ggt ctc ccc ggc gcg ggc aac ggc ggc aac aac 1392
Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn
450 455 460
ggc ggc aac ccc ccg ccc ccc acc acc acc acc tcc tcg gct ccg gcc 1440
Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala
465 470 475 480
acc acc acc acc gcc agc gct ggc ccc aag gct ggc cac tgg cag cag 1488
Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly His Trp Gln Gln
485 490 495
tgc ggc ggc atc ggc ttc act ggc ccg acc cag tgc gag gag ccc tac 1536
Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr
500 505 510
act tgc acc aag ctc aac gac tgg tac tct cag tgc ctg taa 1578
Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210> 60
<211> 525
<212> PRT
<213> 嗜热小柱孢菌(Scytalidium thermophilum)
<400> 60
Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala
1 5 10 15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu
20 25 30
Ser Trp Lys Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala
35 40 45
Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly
50 55 60
Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr
65 70 75 80
Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys
100 105 110
Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr
115 120 125
Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn
145 150 155 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg
165 170 175
Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg
210 215 220
Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225 230 235 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala
260 265 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly
275 280 285
Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly
305 310 315 320
Glu Val Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser
325 330 335
Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp
340 345 350
Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val
370 375 380
Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu
385 390 395 400
Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg
405 410 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu
420 425 430
Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn
450 455 460
Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala
465 470 475 480
Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly His Trp Gln Gln
485 490 495
Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr
500 505 510
Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210> 61
<211> 519
<212> DNA
<213> 曲霉(Aspergillus sp.)
<220>
<221> misc_feature
<222> (1)..(519)
<223> 部分CBH1编码序列
<400> 61
gagatggaca tatgggaggc caacagcatc tccacggcct tcacgcccca cccctgcgat 60
gtccccggcc aggtgatgtg cgagggcgac tcctgcggtg gcacctacag cagcgaccgc 120
tatggcggca cctgcgatcc cgatggatgt gacttcaact cctaccgcca gggcaacaag 180
tccttctacg gccccggcat gaccgtcgac accaacagca aggtcaccgt cgtgactcag 240
ttcctcaccg acgacggcac tgccaccggc accctgtcgg agatcaagcg gttctacgtg 300
cagaacggca aggtcatccc caactccgag tcgacctggc ccggcgtcgg cggcaactcc 360
atcaccaccg actactgtct ggcccagaag agcctcttcg gcgataccga cgtcttcacc 420
aagcacggcg gtatggaggg catgggcgcc gccctcgccg agggcatggt cctcgtcctg 480
agtctctggg acgaccacca ctccaacatg ctctggctg 519
<210> 62
<211> 497
<212> DNA
<213> 帚霉属(Scopulariopsis sp.)
<220>
<221> misc_feature
<222> (1)..(497)
<223> 部分CBH1编码序列
<400> 62
gagatcgatg tgtgggagtc gaacgcctat gccttcgttt tcacgccgca cgcgtgcacg 60
accaacgagt accacgtctg cgagaccacc aactgcggtg gcacctactc ggaggaccgc 120
ttcaccggca agtgcgacgc caacggctgc gactacaacc cctaccgcat gggcaacccc 180
gacttctacg gcaagggcaa gacgctcgac accagccgca agttcaccgt cgtctcccgc 240
ttcgaggaga acaagctctc ccagtacttc atccaggacg gccgcaagat cgagatcccg 300
ccgccgacgt gggagggcat gcccaacagc agcgagatca cccccgagct ctgctccacc 360
atgttcgatg tgctcgacga ccgcaaccgc ttgcaggagg tcggcggctt cgagcagctg 420
aacaacgccc tccgggttcc catggtcctc gtcatgtcca tctgggacga ccactacgcc 480
aacatgctct ggctcga 497
<210> 63
<211> 498
<212> DNA
<213> 镰孢属(Fusarium sp.)
<220>
<221> misc_feature
<222> (1)..(498)
<223> 部分CBH1编码序列
<400> 63
gagatggata tctgggaggc caacaagatc tccactgcct acactcccca cccctgcaag 60
agcctcaccc agcagtcctg cgagggcgat gcctgcggtg gcacctactc tactacccgc 120
tatgctggaa cttgcgaccc cgatggttgc gatttcaacc cttaccgcca gggcaacaag 180
accttctacg gccccggctc cggcttcaac gttgatacca ccaagaaggt gactgtcgtg 240
acccagttca tcaagggcag cgacggcaag ctttccgaga tcaagcgtct ctatgttcag 300
aatggcaagg tcattggcaa cccccagtct gagattgcca gcaaccctgg cagcagcgtc 360
accgacagct tctgcaaggc ccagaaggtt gccttcaacg accccgatga cttcaacaag 420
aagggtggct ggagcggaat gagcgacgcc ctcgccaagc ccatggttct cgtcatgagc 480
ttgtggcacg acgtgagt 498
<210> 64
<211> 525
<212> DNA
<213> 轮枝孢(Verticillium sp.)
<220>
<221> misc_feature
<222> (1)..(525)
<223> 部分CBH1编码序列
<400> 64
gagatggata tctgggaggc caacaagatc tccacggcct acactcccca tccctgcaag 60
agcctcaccc agcagtcctg tgagggcgat gcctgcggtg gcacctactc ttccacccgc 120
tatgctggaa cttgcgatcc cgatggctgc gatttcaacc cttaccgcca gggcaaccac 180
accttctacg gtcccggctc cggcttcaac gtcgatacca ccaagaaggt gactgtcgtg 240
acccagttca tcaagggcag cgacggcaag ctttccgaga tcaagcgtct ctatgttcag 300
aatggcaagg tcatcggcaa cccccagtcc gagattgcaa acaaccccgg cagctccgtc 360
accgacagct tctgcaaggc ccagaaggtt gccttcaacg accccgatga cttcaacaag 420
aagggtggct ggagcggcat gaacgacgcc ctcgccaagc ccatggttct cgtcatgagc 480
ctgtggcacg acgtgagtaa tctaacccct gagtctcgga caaga 525
<210> 65
<211> 1371
<212> DNA
<213> 淡黑假黑盘菌(Pseudoplectania nigrella)
<220>
<221> CDS
<222> (1)..(1371)
<400> 65
atg cta tcc aat ctc ctt ctc tca ctc tct ttc ctt tcc cta gcc tcc 48
Met Leu Ser Asn Leu Leu Leu Ser Leu Ser Phe Leu Ser Leu Ala Ser
1 5 10 15
ggg caa aac atc ggt acc aac acc gcc gaa agc cac ccc caa ctt cgt 96
Gly Gln Asn Ile Gly Thr Asn Thr Ala Glu Ser His Pro Gln Leu Arg
20 25 30
tct caa acc tgc acc aaa ggc aac gga tgc agc acc caa tcc acc tcc 144
Ser Gln Thr Cys Thr Lys Gly Asn Gly Cys Ser Thr Gln Ser Thr Ser
35 40 45
gta gtc ctg gac tcc aac tgg cgc tgg ctg cac aat aat gga ggt tca 192
Val Val Leu Asp Ser Asn Trp Arg Trp Leu His Asn Asn Gly Gly Ser
50 55 60
acg aac tgc tac acc ggc aat tcc tgg gac tct aca tta tgt ccc gac 240
Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asp Ser Thr Leu Cys Pro Asp
65 70 75 80
cca gtt acc tgc gcc aag aac tgt gct ctc gac ggt gcc gac tat tct 288
Pro Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
85 90 95
ggg aca tac gga atc acc tct acg gga gat gct ttg acg ttg aag ttt 336
Gly Thr Tyr Gly Ile Thr Ser Thr Gly Asp Ala Leu Thr Leu Lys Phe
100 105 110
gtt act cag ggt cct tat tcg act aat att gga tct cgg gta tac cta 384
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Val Tyr Leu
115 120 125
atg gcg agt gat act cag tat aag atg ttc cag ctc aag aac aag gag 432
Met Ala Ser Asp Thr Gln Tyr Lys Met Phe Gln Leu Lys Asn Lys Glu
130 135 140
ttt acg ttt gat gtt gat gtc tct aat ctt cct tgt gga tta aac gga 480
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly
145 150 155 160
gcg ttg tat ttt gtg gag atg gat gcg gat gga gga atg tcg aaa tac 528
Ala Leu Tyr Phe Val Glu Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
165 170 175
ccg tct aat aaa gcc ggg gca aaa tat gga acc ggg tat tgt gat gcg 576
Pro Ser Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
cag tgt cca cat gat atc aaa ttt atc aac ggg gag gca aat ctc cta 624
Gln Cys Pro His Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Leu Leu
195 200 205
gac tgg acg cct tca acc agc gac aaa aat gcc ggc tcc gga cgt tac 672
Asp Trp Thr Pro Ser Thr Ser Asp Lys Asn Ala Gly Ser Gly Arg Tyr
210 215 220
ggg acc tgt tgt caa gaa atg gac atc tgg gaa gcc aac agc atg gca 720
Gly Thr Cys Cys Gln Glu Met Asp Ile Trp Glu Ala Asn Ser Met Ala
225 230 235 240
acc gcc tat aca ccg cat ccc tgt agt gtc tca gga cct acc cga tgc 768
Thr Ala Tyr Thr Pro His Pro Cys Ser Val Ser Gly Pro Thr Arg Cys
245 250 255
tca gga acc caa tgt ggg gat ggt tct aac cgt cat aac gga att tgc 816
Ser Gly Thr Gln Cys Gly Asp Gly Ser Asn Arg His Asn Gly Ile Cys
260 265 270
gat aaa gat ggc tgc gat ttc aat tcc tac cgt atg ggc aat acg aca 864
Asp Lys Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn Thr Thr
275 280 285
ttc ttc ggc aag gga gca acg gtt aac acc aac tcc aaa ttt act gtt 912
Phe Phe Gly Lys Gly Ala Thr Val Asn Thr Asn Ser Lys Phe Thr Val
290 295 300
gta acg caa ttc atc acc tcc gac aac acc tca act gga gcg cta aag 960
Val Thr Gln Phe Ile Thr Ser Asp Asn Thr Ser Thr Gly Ala Leu Lys
305 310 315 320
gag att cgt cgt ctt tat att cag aat gga aaa gtc atc cag aac tcg 1008
Glu Ile Arg Arg Leu Tyr Ile Gln Asn Gly Lys Val Ile Gln Asn Ser
325 330 335
aaa agt aat atc tcc ggc atg tca gct tac gac tct ata acc gag gat 1056
Lys Ser Asn Ile Ser Gly Met Ser Ala Tyr Asp Ser Ile Thr Glu Asp
340 345 350
ttc tgt gcc gct caa aaa acc gca ttt gga gac aca aat gac ttt aag 1104
Phe Cys Ala Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Asp Phe Lys
355 360 365
gca aag ggc gga ttt aca aac ctt ggg aat gcg ttg caa aag gga atg 1152
Ala Lys Gly Gly Phe Thr Asn Leu Gly Asn Ala Leu Gln Lys Gly Met
370 375 380
gtt ttg gcg ttg agt att tgg gat gat cat gct gcg cag atg ctt tgg 1200
Val Leu Ala Leu Ser Ile Trp Asp Asp His Ala Ala Gln Met Leu Trp
385 390 395 400
ttg gat agt tct tac ccg ctc gat aaa gac cct tct caa cca ggt gtt 1248
Leu Asp Ser Ser Tyr Pro Leu Asp Lys Asp Pro Ser Gln Pro Gly Val
405 410 415
aag agg ggc gcg tgt gct acc tct tct ggt aaa ccg tcg gat gtc gag 1296
Lys Arg Gly Ala Cys Ala Thr Ser Ser Gly Lys Pro Ser Asp Val Glu
420 425 430
aac cag tct ccg aat gcg tcg gtg act ttt tcg aac att aag ttt ggg 1344
Asn Gln Ser Pro Asn Ala Ser Val Thr Phe Ser Asn Ile Lys Phe Gly
435 440 445
gat att gga tcg act tat tcc tct tag 1371
Asp Ile Gly Ser Thr Tyr Ser Ser
450 455
<210> 66
<211> 456
<212> PRT
<213> 淡黑假黑盘菌(Pseudoplectania nigrella)
<400> 66
Met Leu Ser Asn Leu Leu Leu Ser Leu Ser Phe Leu Ser Leu Ala Ser
1 5 10 15
Gly Gln Asn Ile Gly Thr Asn Thr Ala Glu Ser His Pro Gln Leu Arg
20 25 30
Ser Gln Thr Cys Thr Lys Gly Asn Gly Cys Ser Thr Gln Ser Thr Ser
35 40 45
Val Val Leu Asp Ser Asn Trp Arg Trp Leu His Asn Asn Gly Gly Ser
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Ser Trp Asp Ser Thr Leu Cys Pro Asp
65 70 75 80
Pro Val Thr Cys Ala Lys Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
85 90 95
Gly Thr Tyr Gly Ile Thr Ser Thr Gly Asp Ala Leu Thr Leu Lys Phe
100 105 110
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Val Tyr Leu
115 120 125
Met Ala Ser Asp Thr Gln Tyr Lys Met Phe Gln Leu Lys Asn Lys Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Glu Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
165 170 175
Pro Ser Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
Gln Cys Pro His Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Leu Leu
195 200 205
Asp Trp Thr Pro Ser Thr Ser Asp Lys Asn Ala Gly Ser Gly Arg Tyr
210 215 220
Gly Thr Cys Cys Gln Glu Met Asp Ile Trp Glu Ala Asn Ser Met Ala
225 230 235 240
Thr Ala Tyr Thr Pro His Pro Cys Ser Val Ser Gly Pro Thr Arg Cys
245 250 255
Ser Gly Thr Gln Cys Gly Asp Gly Ser Asn Arg His Asn Gly Ile Cys
260 265 270
Asp Lys Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn Thr Thr
275 280 285
Phe Phe Gly Lys Gly Ala Thr Val Asn Thr Asn Ser Lys Phe Thr Val
290 295 300
Val Thr Gln Phe Ile Thr Ser Asp Asn Thr Ser Thr Gly Ala Leu Lys
305 310 315 320
Glu Ile Arg Arg Leu Tyr Ile Gln Asn Gly Lys Val Ile Gln Asn Ser
325 330 335
Lys Ser Asn Ile Ser Gly Met Ser Ala Tyr Asp Ser Ile Thr Glu Asp
340 345 350
Phe Cys Ala Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Asp Phe Lys
355 360 365
Ala Lys Gly Gly Phe Thr Asn Leu Gly Asn Ala Leu Gln Lys Gly Met
370 375 380
Val Leu Ala Leu Ser Ile Trp Asp Asp His Ala Ala Gln Met Leu Trp
385 390 395 400
Leu Asp Ser Ser Tyr Pro Leu Asp Lys Asp Pro Ser Gln Pro Gly Val
405 410 415
Lys Arg Gly Ala Cys Ala Thr Ser Ser Gly Lys Pro Ser Asp Val Glu
420 425 430
Asn Gln Ser Pro Asn Ala Ser Val Thr Phe Ser Asn Ile Lys Phe Gly
435 440 445
Asp Ile Gly Ser Thr Tyr Ser Ser
450 455
<210> 67
<211> 951
<212> DNA
<213> 蔓延疫霉(Phytophthora infestans)
<220>
<221> misc_feature
<222> (1)..(951)
<223> 部分CBH1编码序列
<400> 67
tgcgatgctg atggttgtga cttcaactct taccgccagg gtaacacctc tttctatggt 60
gcaggtctta ccgtgaacac caacaaagtt ttcaccgttg taacccaatt catcaccaac 120
gatggaacag cttcaggtac cttgaaagaa atccgacgat tctatgttca gaatggcgtc 180
gtgattccaa actcgcaatc cacaatcgct ggagttccag gaaattccat caccgactct 240
ttctgtgccg cacaaaagac tgcttttggt gacaccaacg aattcgctac taagggaggt 300
cttgccacaa tgagcaaagc tttggcaaag ggtatggtac ttgtcatgtc catttgggat 360
gaccataccg ccaacatgtt gtggctcgat gccccttacc cagcaaccaa atccccaagc 420
gccccaggtg tcactcgagg atcatgcagt gctacttcag gtaaccccgt tgatgttgaa 480
gccaattctc caggttcttc cgtcaccttc tcaaacatca agtggggtcc catcaactct 540
acctacactg gatctggagc cgccccaagt gttccaggca ctacaaccgt tagctcggca 600
cccgcatcga ctgcaacttc aggagctggt ggtgtcgcta agtatgccca atgtggaggt 660
actggataca gtggagctac cgcttgcgtt tcaggcagca cctgtgttgc cctcaaccct 720
tactactccc aatgccaata gattgtttcc ctcaggagca attaggtttc caacctaagg 780
ggagagatct tcacaagtct gtacataggg tcagctaaat gttgatcatt catattcttt 840
catgtattta gttgttgaca atttgaagtt gcaagtcaag acgggaaaac agaagcagga 900
aatatatggg acataacaaa gtcaatcgtt tacataagaa ccttctttaa a 951
Claims (29)
1.一种具有纤维二糖水解酶I活性的多肽,其选自下组:
(a)包含选自下组所示氨基酸序列的多肽:
与SEQ ID NO:2中第1-526位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:4中第1-529位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:6中第1-451位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:8中第1-457位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:10中第1-538位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:12中第1-415位氨基酸具有至少70%同一性的氨基酸序列,
与SEQ ID NO:14中第1-447位氨基酸具有至少70%同一性的氨基酸序列,
与SEQ ID NO:16中第1-452位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:38中第1-454位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:40中第1-458位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:42中第1-450位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:44中第1-446位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:46中第1-527位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:48中第1-455位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:50中第1-464位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:52中第1-460位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:54中第1-450位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:56中第1-532位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:58中第1-460位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:60中第1-525位氨基酸具有至少80%同一性的氨基酸序列,
与SEQ ID NO:66中第1-456位氨基酸具有至少80%同一性的氨基酸序列,
(b)包含选自下组所示氨基酸序列的多肽:
与存在于嗜热支顶孢(Acremonium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热毛壳霉(Chaetomium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于小柱孢菌种(Scytalidium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热小柱孢菌(Scytalidium thermophilum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于橙黄色热子囊菌(Thermoascus aurantiacus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Thielavia australiensis中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于幼嫩轮枝孢(Verticillium tenerum)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70%同一性的氨基酸序列,
与存在于栗色新螱(Neotermes castaneus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少70%同一性的氨基酸序列,
与存在于黑素白丝菌(Melanocarpus albomyces)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于支顶孢属(Acremonium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Chaetomidium pingtungium中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Sporotrichum pruinosum中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于棉色二孢(Diplodia gossypina)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于囊状长毛盘菌(Trichophaea saccata)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于嗜热毁丝霉(Myceliophthora thermophila)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Exidia glandulosa中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于块团炭角菌(Xylaria hypoxylon)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于Poitrasia circinans中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于灰色鬼伞(Coprinus cinereus)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
与存在于淡黑假黑盘菌(Pseudoplectania nigrella)中的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性的氨基酸序列,
存在于玫瑰单瑞孢(Trichothecium roseum)IFO 5372中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于产黑色腐质霉(Humicola nigrescens)CBS 819.73中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于Cladorrhinum foecundissimum CBS 427.97中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于棉色二孢(Diplodia gossypina)CBS 247.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于嗜热毁丝霉(Myceliophthora thermophila)CBS117.65中的纤维二糖水解酶I编码部分的核苷酸序列编码的的氨基酸序列,
存在于微小根毛霉(Rhizomucor pusillus)CBS109471中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于Meripilus giganteus CBS 521.95中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于黑耳(Exidia glandulosa)CBS 2377.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于块团炭角菌(Xylaria hypoxylon)CBS 284.96中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于长毛盘菌(Trichophaea saccata)CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列编码的多氨基酸序列,
存在于毛壳霉(Chaetomium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于肉桂色毁丝霉(Myceliophthora hinnulea)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于有小孢子囊的草根霉(Thielavia cf.microspora)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于曲霉(Aspergillus sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于帚霉(Scopulariopsis sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于镰孢(Fusarium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,
存在于轮枝孢(Verticillium sp.)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列,和
存在于蔓延疫霉(Phytophthora infestans)中的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列。
(c)包含选自下组所示氨基酸序列的多肽:
与SEQ ID NO:1中第1-1578位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:3中第1-1587位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:5中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:7中第1-1371位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:9中第1-1614位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:11中第1-1245位核苷酸编码的多肽具有至少70%同一性的氨基酸序列,
与SEQ ID NO:13中第1-1341位核苷酸编码的多肽具有至少70%同一性的氨基酸序列,
与SEQ ID NO:15中第1-1356位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:37中第1-1365位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:39中第1-1377位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:41中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:43中第1-1341位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:45中第1-1584位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:47中第1-1368位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:49中第1-1395位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:51中第1-1383位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:53中第1-1353位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:55中第1-1599位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:57中第1-1383位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:59中第1-1578位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
与SEQ ID NO:65中第1-1371位核苷酸编码的多肽具有至少80%同一性的氨基酸序列,
(d)由在高严谨条件下与选自下组所示的多核苷酸探针杂交的核苷酸序列编码的多肽:
(i)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,
SEQ ID NO:65中第1-1371位核苷酸,
(ii)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51第1-500位核苷酸,
SEQ ID NO:53第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,和
SEQ ID NO:67中第1-951位核苷酸,和
(iii)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,和
SEQ ID NO:65中第1-200位核苷酸,和
(e)具有纤维二糖水解酶I活性的(a)、(b)或(c)的片段。
2.根据权利要求1所述的多肽,包含选自下组所述的氨基酸序列:
与SEQ ID NO:2中第1-526位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:4中第1-529位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:6中第1-451位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:8中第1-457位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:10中第1-538位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:12中第1-415位氨基酸具有至少75%同一性、优选至少80%同一性、更优选至少90%同一性的氨基酸序列,
与SEQ ID NO:14中第1-447位氨基酸具有至少75%同一性、优选至少80%同一性、更优选至少90%同一性的氨基酸序列,
与SEQ ID NO:16中第1-452位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:38中第1-454位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:40中第1-458位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:42中第1-450位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:44中第1-446位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:46中第1-527位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:48中第1-455位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:50中第1-464位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:52中第1-460位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:54中第1-450位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:56中第1-532位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:58中第1-460位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:60中第1-525位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列,
与SEQ ID NO:66中第1-456位氨基酸具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的氨基酸序列。
3.根据权利要求1或2所述的多肽,其中包括选自下组所示的氨基酸序列:
与SEQ ID NO:2中第1-526位氨基酸,
与SEQ ID NO:4中第1-529位氨基酸,
与SEQ ID NO:6中第1-451位氨基酸,
与SEQ ID NO:8中第1-457位氨基酸,
与SEQ ID NO:10中第1-538位氨基酸,
与SEQ ID NO:12中第1-415位氨基酸,
与SEQ ID NO:14中第1-447位氨基酸,
与SEQ ID NO:16中第1-452位氨基酸,
与SEQ ID NO:38中第1-454位氨基酸,
与SEQ ID NO:40中第1-458位氨基酸,
与SEQ ID NO:42中第1-450位氨基酸,
与SEQ ID NO:44中第1-446位氨基酸,
与SEQ ID NO:46中第1-527位氨基酸,
与SEQ ID NO:48中第1-455位氨基酸,
与SEQ ID NO:50中第1-464位氨基酸,
与SEQ ID NO:52中第1-460位氨基酸,
与SEQ ID NO:54中第1-450位氨基酸,
与SEQ ID NO:56中第1-532位氨基酸,
与SEQ ID NO:58中第1-460位氨基酸,
与SEQ ID NO:60中第1-525位氨基酸,
与SEQ ID NO:66中第1-456位氨基酸。
4.根据权利要求1或2所述的多肽,该多肽是一种人工变异体,其中包括在相应于选自下组所示的氨基酸序列中含有至少一个氨基酸发生替代、缺失和/或插入的氨基酸序列:
与SEQ ID NO:2中第1-526位氨基酸,
与SEQ ID NO:4中第1-529位氨基酸,
与SEQ ID NO:6中第1-451位氨基酸,
与SEQ ID NO:8中第1-457位氨基酸,
与SEQ ID NO:10中第1-538位氨基酸,
与SEQ ID NO:12中第1-415位氨基酸,
与SEQ ID NO:14中第1-447位氨基酸,
与SEQ ID NO:16中第1-452位氨基酸,
与SEQ ID NO:38中第1-454位氨基酸,
与SEQ ID NO:40中第1-458位氨基酸,
与SEQ ID NO:42中第1-450位氨基酸,
与SEQ ID NO:44中第1-446位氨基酸,
与SEQ ID NO:46中第1-527位氨基酸,
与SEQ ID NO:48中第1-455位氨基酸,
与SEQ ID NO:50中第1-464位氨基酸,
与SEQ ID NO:52中第1-460位氨基酸,
与SEQ ID NO:54中第1-450位氨基酸,
与SEQ ID NO:56中第1-532位氨基酸,
与SEQ ID NO:58中第1-460位氨基酸,
与SEQ ID NO:60中第1-525位氨基酸,
与SEQ ID NO:66中第1-456位氨基酸。
5.根据权利要求1所述的多肽,其中包括选自下组所述的氨基酸序列:
与存在于保藏微生物CGMCC NO.0584中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0581中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0585中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0582中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0583中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CBS 109513中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CBS 14348中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0580中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0747中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0748中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0749中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物CGMCC NO.0750中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物DSM 15064中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物DSM 15065中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,
与存在于保藏微生物DSM 15066中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列,和
与存在于保藏微生物DSM 15067中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽具有至少80%同一性、优选至少90%同一性的氨基酸序列。
6.根据权利要求5所述的多肽,其中包含由插入进存在于选自下组保藏微生物中的质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCCNO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCCNO.0580,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750,DSM 15064,DSM 15065,DSM 15066和DSM 15067。
7.根据权利要求5或6所述的多肽,其中多肽由插入进存在于选自下组保藏微生物中的质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的多肽的氨基酸序列组成,其中所述保藏微生物为CGMCC NO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCCNO.0750,DSM 15064,DSM 15065,DSM 15066和DSM 15067。
8.根据权利要求5或6所述的多肽,其中多肽是一种人工变异体,与存在于选自下组保藏微生物中的由插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列编码的氨基酸序列相比,该变异体优选包括由具有至少一个氨基酸取代、缺失和/或插入的氨基酸序列组成,其中所述保藏微生物为CGMCCNO.0584,CGMCC NO.0581,CGMCC NO.0585,CGMCC NO.0582,CGMCC NO.0583,CBS 109513,DSM 14348,CGMCC NO.0580,CGMCC NO.0747,CGMCC NO.0748,CGMCC NO.0749,CGMCC NO.0750,DSM 15064,DSM 15065,DSM 15066和DSM 15067。
9.一种具有编码如权利要求1-8任一项所述多肽的核苷酸序列的多肽。
10.一种核酸构建体,该结构含有与一种或多种指导多肽在适合宿主中生产的调控序列可操作连接的权利要求9中所述的核苷酸序列。
11.一种含有权利要求10所述核酸构建体的重组表达载体。
12.一种含有权利要求11所述的核酸构建体的重组宿主细胞。
13.一种生产权利要求1-8中任一项所述多肽的方法,该方法包括:
(a)培养一种菌株来生产多肽,该菌株野生型形式能生产多肽;和
(b)回收多肽。
14.一种生产权利要求1-8中任一项所述多肽的方法,该方法包括:
(a)在适于生产多肽的条件下培养权利要求12所述的重组宿主细胞,和
(b)回收多肽。
15.一种原位生产权利要求1-8中任一项所述多肽的方法,该方法包括:
(a)在适于生产多肽的条件下培养权利要求12所述的重组宿主细胞,和
(b)将多肽与一种所要的底物接触,没有前预先回收多肽。
16.一种含有选自下组的核苷酸序列的多核苷酸:
与SEQ ID NO:1中第1-1578位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:3中第1-1587位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:5中第1-1353位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:7中第1-1371位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:9中第1-1614位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:11中第1-1245位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:13中第1-1341位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:15中第1-1356位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:37中第1-1365位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:39中第1-1377位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:41中第1-1353位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:43中第1-1341位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:45中第1-1584位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:47中第1-1368位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:49中第1-1395位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:51中第1-1383位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:53中第1-1353位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:55中第1-1599位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:57中第1-1383位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:59中第1-1578位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:65中第1-1371位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:1中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:3中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:5中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:7中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:9中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:11中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:13中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:15中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:37中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:39中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:41中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:43中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:45中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:47中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:49中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:51中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:53中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:55中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:57中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:59中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:65中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:17中第1-221位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:18中第1-239位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:19中第1-199位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:20中第1-191位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:21中第1-232位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:22中第1-467位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:23中第1-534位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:24中第1-563位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:25中第1-218位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:26中第1-492位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:27中第1-481位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:28中第1-463位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:29中第1-513位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:30中第1-579位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:31中第1-514位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:32中第1-477位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:33中第1-500位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:34中第1-470位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:35中第1-491位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:36中第1-221位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:61中第1-519位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:62中第1-497位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:63中第1-498位核苷酸具有至少80%同一性的核苷酸序列,
与SEQ ID NO:64中第1-525位核苷酸具有至少80%同一性的核苷酸序列,和
与SEQ ID NO:67中第1-951位核苷酸具有至少80%同一性的核苷酸序列。
17.一种含有选自下组所述核苷酸序列的多核苷酸:
与存在于保藏微生物CGMCC NO.0584中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0581中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0585中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0582中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0583中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CBS 109513中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CBS 14348中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0580中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0747中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0748中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0749中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物CGMCC NO.0750中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物DSM 15064中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物DSM 15065中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于保藏微生物DSM 15066中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,和
与存在于保藏微生物DSM 15067中的插入进质粒的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
18.一种含有选自下组所述核苷酸序列的多核苷酸:
与存在于微生物玫瑰单瑞孢IFO 5372中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物产黑色腐质霉CBS 819.73中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物Ciadorrhinum foecundissimum CBS 427.97中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物棉色二孢CBS 247.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物嗜热毁丝霉CBS 117.65中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物微小根毛霉CBS 109471中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物Meripilus giganteus CBS 521.95中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物黑耳CBS 2377.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物块团炭角菌CBS 284.96中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物长毛盘菌CBS 804.70中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物Acremonium sp中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物毛壳霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物Chaetomidium pingtungium中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物嗜热毁丝霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,
与存在于微生物肉桂色毁丝霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列,和
与存在于微生物Sporotrichum pruinosum中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物有小孢子囊的草根霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物小柱孢菌属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物曲霉属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物帚霉属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物镰孢属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物轮枝孢属中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
与存在于微生物疫霉中的纤维二糖水解酶I编码部分的核苷酸序列具有至少80%同一性的核苷酸序列。
19.具有编码有纤维二糖水解酶I活性的多肽的核苷酸序列的多核苷酸序列,其在高严谨条件下与选自下组所述的多核苷酸探针杂交:
(i)选自下组所示核苷酸的互补链:
SEQ ID NO:1中第1-1578位核苷酸,
SEQ ID NO:3中第1-1587位核苷酸,
SEQ ID NO:5中第1-1353位核苷酸,
SEQ ID NO:7中第1-1371位核苷酸,
SEQ ID NO:9中第1-1614位核苷酸,
SEQ ID NO:11中第1-1245位核苷酸,
SEQ ID NO:13中第1-1341位核苷酸,
SEQ ID NO:15中第1-1356位核苷酸,
SEQ ID NO:37中第1-1365位核苷酸,
SEQ ID NO:39中第1-1377位核苷酸,
SEQ ID NO:41中第1-1353位核苷酸,
SEQ ID NO:43中第1-1341位核苷酸,
SEQ ID NO:45中第1-1584位核苷酸,
SEQ ID NO:47中第1-1368位核苷酸,
SEQ ID NO:49中第1-1395位核苷酸,
SEQ ID NO:51中第1-1383位核苷酸,
SEQ ID NO:53中第1-1353位核苷酸,
SEQ ID NO:55中第1-1599位核苷酸,
SEQ ID NO:57中第1-1383位核苷酸,
SEQ ID NO:59中第1-1578位核苷酸,或
SEQ ID NO:65中第1-1371位核苷酸,
(ii)或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-500位核苷酸,
SEQ ID NO:3中第1-500位核苷酸,
SEQ ID NO:5中第1-500位核苷酸,
SEQ ID NO:7中第1-500位核苷酸,
SEQ ID NO:9中第1-500位核苷酸,
SEQ ID NO:11中第1-500位核苷酸,
SEQ ID NO:13中第1-500位核苷酸,
SEQ ID NO:15中第1-500位核苷酸,
SEQ ID NO:37中第1-500位核苷酸,
SEQ ID NO:39中第1-500位核苷酸,
SEQ ID NO:41中第1-500位核苷酸,
SEQ ID NO:43中第1-500位核苷酸,
SEQ ID NO:45中第1-500位核苷酸,
SEQ ID NO:47中第1-500位核苷酸,
SEQ ID NO:49中第1-500位核苷酸,
SEQ ID NO:51中第1-500位核苷酸,
SEQ ID NO:53中第1-500位核苷酸,
SEQ ID NO:55中第1-500位核苷酸,
SEQ ID NO:57中第1-500位核苷酸,
SEQ ID NO:59中第1-500位核苷酸,
SEQ ID NO:65中第1-500位核苷酸,
SEQ ID NO:17中第1-221位核苷酸,
SEQ ID NO:18中第1-239位核苷酸,
SEQ ID NO:19中第1-199位核苷酸,
SEQ ID NO:20中第1-191位核苷酸,
SEQ ID NO:21中第1-232位核苷酸,
SEQ ID NO:22中第1-467位核苷酸,
SEQ ID NO:23中第1-534位核苷酸,
SEQ ID NO:24中第1-563位核苷酸,
SEQ ID NO:25中第1-218位核苷酸,
SEQ ID NO:26中第1-492位核苷酸,
SEQ ID NO:27中第1-481位核苷酸,
SEQ ID NO:28中第1-463位核苷酸,
SEQ ID NO:29中第1-513位核苷酸,
SEQ ID NO:30中第1-579位核苷酸,
SEQ ID NO:31中第1-514位核苷酸,
SEQ ID NO:32中第1-477位核苷酸,
SEQ ID NO:33中第1-500位核苷酸,
SEQ ID NO:34中第1-470位核苷酸,
SEQ ID NO:35中第1-491位核苷酸,
SEQ ID NO:36中第1-221位核苷酸,
SEQ ID NO:61中第1-519位核苷酸,
SEQ ID NO:62中第1-497位核苷酸,
SEQ ID NO:63中第1-498位核苷酸,
SEQ ID NO:64中第1-525位核苷酸,或
SEQ ID NO:67中第1-951位核苷酸,或
(iii)或是选自下组所示核苷酸序列的互补链:
SEQ ID NO:1中第1-200位核苷酸,
SEQ ID NO:3中第1-200位核苷酸,
SEQ ID NO:5中第1-200位核苷酸,
SEQ ID NO:7中第1-200位核苷酸,
SEQ ID NO:9中第1-200位核苷酸,
SEQ ID NO:11中第1-200位核苷酸,
SEQ ID NO:13中第1-200位核苷酸,
SEQ ID NO:15中第1-200位核苷酸,
SEQ ID NO:37中第1-200位核苷酸,
SEQ ID NO:39中第1-200位核苷酸,
SEQ ID NO:41中第1-200位核苷酸,
SEQ ID NO:43中第1-200位核苷酸,
SEQ ID NO:45中第1-200位核苷酸,
SEQ ID NO:47中第1-200位核苷酸,
SEQ ID NO:49中第1-200位核苷酸,
SEQ ID NO:51中第1-200位核苷酸,
SEQ ID NO:53中第1-200位核苷酸,
SEQ ID NO:55中第1-200位核苷酸,
SEQ ID NO:57中第1-200位核苷酸,
SEQ ID NO:59中第1-200位核苷酸,或
SEQ ID NO:65中第1-200位核苷酸。
20.一种含有选自下组所述的修饰的核苷酸序列的多核苷酸:
含有至少一个修饰的SEQ ID NO:1的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:2第1-526位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:3的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:4第1-529位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:5的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:6第1-451位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:7的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:8第1-457位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:9的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:10第1-538位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:11的核苷酸序列,其中修饰的核苷酸序列编码一种由SEQ ID NO:12第1-415位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:13的核苷酸序列,其中修饰的核苷酸序列编码一种由SEQ ID NO:14第1-447位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:15的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:16第1-452位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:37的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:38第1-454位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:39的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:40第1-458位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:41的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:42第1-450位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:43的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:44第1-446位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:45的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:46第1-527位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:47的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:48第1-455位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:49的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:50第1-464位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:51的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:52第1-460位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:53的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:54第1-450位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:55的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:56第1-532位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:57的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:58第1-460位氨基酸组成的多肽,
含有至少一个修饰的SEQ ID NO:59的核苷酸序列,其中修饰的核苷酸序列编码由SEQ ID NO:60第1-525位氨基酸组成的多肽,
含有至少一种修饰的SEQ ID NO:65的核苷酸序列,其中修饰的核苷酸序列编码一种由SEQ ID NO:66第1-456位氨基酸组成的多肽,
21.一种由存在于下组所述的微生物中的纤维二糖水解酶I编码部分核苷酸序列编码的具有纤维二糖水解酶I活性的多肽:
一种微生物,该微生物属于接合菌门,优选属于毛霉菌属,更优选属于毛霉菌科或是笄霉科,最优选属于根毛霉属或poitrasia属,尤其是微小根毛霉或poitrasia circinans。
一种微生物,该微生物属于卵菌纲,优选腐霉目,更优选腐霉科,最优选疫霉属,尤其是蔓延疫霉。
一种微生物,该微生物属于Auriculariales,优选属于Exidiaceae科,最优选黑耳。
一种微生物,该微生物属于Xylariales,优选属于炭角菌科,更优选属于炭角菌属,最优选块团炭角菌。
一种微生物,该微生物属于Dothideales,优选属于Dothideaceae科,更优选属于色二孢属,最优选棉色二孢。
一种微生物,该微生物属于盘菌目,优选属于Pyronemataceae科,更优选属于长毛盘菌科或是Sarcosoma taceae科,更优选属于长毛盘菌属或假黑盘菌属,最优选囊状长毛盘菌或淡黑假黑盘菌。
一种微生物,该微生物属于Rigidiporaceae科,优选属于Meripilus属,更优选Meripilus giganteus。
一种微生物,该微生物属于皱孔菌科,优选属于孢子丝菌属,更优选Sporotrichum Pruinosum。
一种微生物,该微生物属于蘑菇科(在Basidiomycota,Hymenomycetes,蘑菇目下),更优选属于鬼伞属,最优选灰色鬼伞。
一种微生物,该微生物属于肉座菌科,优选属于支顶孢属或有丝分裂孢子的轮枝孢属,更优选嗜热支顶孢或幼嫩轮枝孢。
一种微生物,该微生物属Cladorrhinum属,优选Cladorrhinumfoecundissimum。
一种微生物,该微生物属于毁丝霉属,优选嗜热毁丝霉或肉桂色毁丝霉。
一种微生物,该微生物属于毛壳霉属,优选嗜热毛壳霉。
一种微生物,该微生物属于Chaetomidium属,优选Chaetomidiumpingtungium。
一种微生物,该微生物属于草根霉属,优选Thielavia australiensis或有孢子囊的草根霉。
一种微生物,该微生物属于热子囊菌属,优选橙黄色热子囊菌。
一种微生物,该微生物属于单瑞孢属,优选玫瑰单瑞孢,和
一种属于产黑色腐质霉种的微生物。
22.一种使用含有如权利要求9和16-20中任一项权利要求所定义的多核苷酸的DNA改组的方法。
23.一种可通过权利要求22所述方法获得的编码具有纤维二糖酶活性的多肽的多核苷酸。
24.一种由权利要求23所述的多核苷酸编码的具有纤维二糖活性的多肽。
25.如权利要求9和16-20中任一项权利要求所定义的多核苷酸在DNA改组中的用途。
26.一种从生物质中生产乙醇的方法,包括将生物质与权利要求1-8中任一项所定义的多肽接触。
27.权利要求1-8中任一项所定义的多肽在生产乙醇中的用途。
28.一种转基因植物、植物部分或植物细胞,其中已经转化了编码权利要求1-8中任一项所定义的具有纤维二糖水解酶I活性的多肽的核苷酸序列。
29.一种含有表面活性剂和权利要求1-8任一项所述多肽的去污剂。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DKPA200101000 | 2001-06-26 | ||
DKPA200101000 | 2001-06-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1620501A true CN1620501A (zh) | 2005-05-25 |
Family
ID=8160587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA028127684A Pending CN1620501A (zh) | 2001-06-26 | 2002-06-26 | 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸 |
Country Status (7)
Country | Link |
---|---|
US (10) | US7785853B2 (zh) |
EP (4) | EP2277997B1 (zh) |
CN (1) | CN1620501A (zh) |
AU (1) | AU2002316809A1 (zh) |
DK (4) | DK2298868T3 (zh) |
ES (4) | ES2438146T3 (zh) |
WO (1) | WO2003000941A2 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102666847A (zh) * | 2009-10-29 | 2012-09-12 | 诺维信股份有限公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN102947442A (zh) * | 2009-11-06 | 2013-02-27 | 诺维信股份有限公司 | 用于糖化纤维素材料的组合物 |
CN101384713B (zh) * | 2005-12-22 | 2013-03-20 | 罗尔公司 | 纤维素材料的处理和用于其中的酶 |
WO2013071871A1 (en) * | 2011-11-15 | 2013-05-23 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
CN101874109B (zh) * | 2007-09-28 | 2013-07-10 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN103517985A (zh) * | 2011-01-26 | 2014-01-15 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸 |
CN103534348A (zh) * | 2011-01-26 | 2014-01-22 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN104350148A (zh) * | 2011-11-15 | 2015-02-11 | 诺维信股份有限公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN104694517A (zh) * | 2009-11-06 | 2015-06-10 | 诺维信股份有限公司 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
CN104962537A (zh) * | 2007-05-10 | 2015-10-07 | 诺维信股份有限公司 | 用于增强含纤维素材料的降解或转化的组合物和方法 |
CN108949726A (zh) * | 2018-06-15 | 2018-12-07 | 河南农业大学 | 一种改组纤维素酶基因及其表达载体和应用 |
CN113151223A (zh) * | 2020-01-22 | 2021-07-23 | 山东宏业海洋科技股份有限公司 | 一种制备海带水解液的方法 |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7883872B2 (en) * | 1996-10-10 | 2011-02-08 | Dyadic International (Usa), Inc. | Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose |
WO2004056981A2 (en) * | 2002-12-20 | 2004-07-08 | Novozymes A/S | Polypeptides having cellobiohydrolase ii activity and polynucleotides encoding same |
CA2520636C (en) * | 2003-04-01 | 2012-05-08 | Genencor International, Inc. | Variant humicola grisea cbh1.1 |
AU2004254640B2 (en) | 2003-07-02 | 2010-08-26 | Bp Corporation North America Inc. | Glucanases, nucleic acids encoding them and methods for making and using them |
EP1660637A4 (en) | 2003-08-25 | 2009-10-21 | Novozymes Inc | VARIANTS OF GLYCOSIDE HYDROLASES |
CN1875098A (zh) * | 2003-10-30 | 2006-12-06 | 诺和酶股份有限公司 | 新家族的碳水化合物结合组件 |
EP2287179A3 (en) | 2004-01-09 | 2011-05-18 | Novozymes A/S | Increased bacillus YweA expression |
AU2005269084B2 (en) | 2004-08-06 | 2010-05-27 | Novozymes A/S | Polypeptides of Botryosphaeria rhodina |
ES2358243T5 (es) * | 2005-01-06 | 2014-06-09 | Novozymes, Inc. | Polipéptidos con actividad celobiohidrolasa y polinucleótidos que los codifican |
EP1861506B1 (en) | 2005-03-15 | 2015-04-15 | BP Corporation North America Inc. | Cellulases, nucleic acids encoding them and methods for making and using them |
NZ595499A (en) | 2006-02-10 | 2013-05-31 | Verenium Corp | Cellulolytic enzymes, nucleic acids encoding them and methods for making and using them |
ES2368608T3 (es) * | 2006-03-20 | 2011-11-18 | Novozymes, Inc. | Polipéptidos con actividad endoglucanasa y polinucleótidos codifcando los polipéptidos. |
BRPI0710217A2 (pt) | 2006-03-30 | 2011-08-02 | Novozymes Inc | polipeptìdeo, polinucleotìdeo, construção de ácido nucleico, vetor de expressão recombinante, célula hospedeira recombinante, métodos para produzir o polipeptìdeo, para produzir um mutante a partir de uma célula precursora, para produzir uma proteìna, para produzir um polinucleotìdeo, para degradar ou converter um material celulósico, para produzir uma substáncia e para inibir a expressão de um polinucleotìdeo em uma célula, célula mutante, planta transgênica, parte de planta ou célula de planta, e, molécula de rna de filamento duplo |
EP2007884B1 (en) * | 2006-04-13 | 2012-05-16 | AB Enzymes Oy | Cellulase fusion proteins and their use |
US7361487B2 (en) * | 2006-04-13 | 2008-04-22 | Ab Enzymes Oy | Enzyme fusion proteins and their use |
FI119434B (fi) * | 2006-04-13 | 2008-11-14 | Ab Enzymes Oy | Entsyymifuusioproteiineja ja niiden käyttö |
CA2658483A1 (en) | 2006-07-21 | 2008-01-24 | Xyleco, Inc. | Conversion systems for biomass |
BRPI0714876B1 (pt) | 2006-08-04 | 2022-04-19 | Verenium Corporation | Ácido nucleico isolado, sintético ou recombinante, cassete de expressão, vetor ou veículo de clonagem, célula bacteriana, fúngica ou de levedura transformada, polipeptídeo isolado, sintético ou recombinante, composição, bem como métodos de produção e de usos dos mesmos |
US8017373B2 (en) * | 2006-08-31 | 2011-09-13 | Iogen Energy Corporation | Process for enzymatic hydrolysis of pretreated lignocellulosic feedstocks |
US8017361B2 (en) * | 2007-08-30 | 2011-09-13 | Iogen Energy Corporation | Enzymatic hydrolysis of lignocellulosic feedstocks using accessory enzymes |
WO2009133035A1 (en) * | 2008-04-29 | 2009-11-05 | Dsm Ip Assets B.V. | Cellobiohydrolase 1 from penicillium chysogenum and uses thereof |
WO2009138877A2 (en) * | 2008-05-11 | 2009-11-19 | Universiteit Stellenbosch | Heterologous expression of fungal cellobiohydrolases in yeast |
US8658398B2 (en) | 2008-07-07 | 2014-02-25 | Mascoma Corporation | Heterologous expression of termite cellulases yeast |
DK2421965T3 (en) * | 2009-04-24 | 2016-09-05 | Dsm Ip Assets Bv | Carbohydratdegraderende polypeptide and uses thereof |
FI122937B (fi) | 2009-12-30 | 2012-09-14 | Roal Oy | Menetelmä selluloosamateriaalin käsittelemiseksi sekä tässä käyttökelpoiset CBH II/Cel6A entsyymit |
DK2357227T3 (en) | 2010-02-11 | 2015-09-14 | Süd Chemie Ip Gmbh & Co Kg | Optimized cellulase enzymes |
WO2011143632A2 (en) * | 2010-05-14 | 2011-11-17 | Codexis, Inc. | Cellobiohydrolase variants |
MX2013007720A (es) | 2011-01-26 | 2013-08-09 | Novozymes As | Polipeptidos que tienen actividad celobiohidrolasa y polinucleotidos que codifican para los mismos. |
BR112013019039A2 (pt) | 2011-01-26 | 2020-07-21 | Novozymes A/S | Célula hospedeira microbiana transgênica, métodos para produzir um polipeptídeo, para produzir um mutante de uma célula originária, para produzir uma proteína, para degradar um material celulósico, para produzir um produto de fermentação, 5 e parafermentar um material celulósico, construção de ácido nucleico ou vetor de expressão, polipeptídeo isolado, e polinucleotídeo isolado |
EP2748187A4 (en) | 2011-08-23 | 2015-03-04 | Codexis Inc | VARIANTS OF CELLOBIOHYDROLASE |
US20130109055A1 (en) | 2011-10-31 | 2013-05-02 | Bp Corporation North America Inc. | Use of mammalian promoters in filamentous fungi |
WO2013067026A1 (en) | 2011-10-31 | 2013-05-10 | Bp Corporation North America Inc. | Use of plant promoters in filamentous fungi |
WO2013138357A1 (en) * | 2012-03-12 | 2013-09-19 | Codexis, Inc. | Cbh1a variants |
TR201815368T4 (tr) * | 2012-08-16 | 2018-11-21 | Bangladesh Jute Res Institute | Macrophomina Phaseolina'dan elde edilen selüloz ve hemiselüloz parçalama enzimleri ve bunların kullanımları. |
WO2014070856A2 (en) | 2012-11-02 | 2014-05-08 | Bp Corporation North America Inc. | Thermotolerant beta-glucosidase variants |
US8778640B1 (en) * | 2013-02-12 | 2014-07-15 | Novozymes Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
US8778641B1 (en) * | 2013-02-12 | 2014-07-15 | Novozymes Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
US8993275B2 (en) * | 2013-02-12 | 2015-03-31 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
US8753860B1 (en) * | 2013-02-12 | 2014-06-17 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
US8771994B1 (en) * | 2013-02-12 | 2014-07-08 | Novozymes Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
WO2014145768A2 (en) | 2013-03-15 | 2014-09-18 | Bp Corporation North America Inc. | Use of non-fungal 5' utrs in filamentous fungi |
US11390898B2 (en) * | 2014-09-05 | 2022-07-19 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
Family Cites Families (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1296839A (zh) | 1969-05-29 | 1972-11-22 | ||
GB1372034A (en) | 1970-12-31 | 1974-10-30 | Unilever Ltd | Detergent compositions |
GB1483591A (en) | 1973-07-23 | 1977-08-24 | Novo Industri As | Process for coating water soluble or water dispersible particles by means of the fluid bed technique |
GB1590432A (en) | 1976-07-07 | 1981-06-03 | Novo Industri As | Process for the production of an enzyme granulate and the enzyme granuate thus produced |
DK187280A (da) | 1980-04-30 | 1981-10-31 | Novo Industri As | Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode |
DK263584D0 (da) | 1984-05-29 | 1984-05-29 | Novo Industri As | Enzymholdige granulater anvendt som detergentadditiver |
EP0218272B1 (en) | 1985-08-09 | 1992-03-18 | Gist-Brocades N.V. | Novel lipolytic enzymes and their use in detergent compositions |
EG18543A (en) | 1986-02-20 | 1993-07-30 | Albright & Wilson | Protected enzyme systems |
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
DE3750450T2 (de) | 1986-08-29 | 1995-01-05 | Novo Industri As | Enzymhaltiger Reinigungsmittelzusatz. |
NZ221627A (en) | 1986-09-09 | 1993-04-28 | Genencor Inc | Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios |
ES2076939T3 (es) | 1987-08-28 | 1995-11-16 | Novo Nordisk As | Lipasa recombinante de humicola y procedimiento para la produccion de lipasas recombinantes de humicola. |
JPS6474992A (en) | 1987-09-16 | 1989-03-20 | Fuji Oil Co Ltd | Dna sequence, plasmid and production of lipase |
DK6488D0 (da) | 1988-01-07 | 1988-01-07 | Novo Industri As | Enzymer |
ATE129523T1 (de) | 1988-01-07 | 1995-11-15 | Novo Nordisk As | Spezifische protease. |
JP3079276B2 (ja) | 1988-02-28 | 2000-08-21 | 天野製薬株式会社 | 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法 |
US5776757A (en) | 1988-03-24 | 1998-07-07 | Novo Nordisk A/S | Fungal cellulase composition containing alkaline CMC-endoglucanase and essentially no cellobiohydrolase and method of making thereof |
EP0406314B1 (en) | 1988-03-24 | 1993-12-01 | Novo Nordisk A/S | A cellulase preparation |
US5487989A (en) * | 1988-08-31 | 1996-01-30 | Bioenergy International, L.C. | Ethanol production by recombinant hosts |
GB8915658D0 (en) | 1989-07-07 | 1989-08-23 | Unilever Plc | Enzymes,their production and use |
US5120463A (en) * | 1989-10-19 | 1992-06-09 | Genencor International, Inc. | Degradation resistant detergent compositions based on cellulase enzymes |
NZ237549A (en) | 1990-03-23 | 1993-06-25 | Gist Brocades Nv | Production of enhanced levels of enzymes in the seeds of transgenic plants and the use of these seeds |
DK0528828T4 (da) | 1990-04-14 | 1998-08-31 | Genencor Internat Gmbh | Alkaliske bacillus-lipaser, DNA-sekvenser, der koder herfor, og bacilli der producerer sådanne lipaser |
EP0531372B2 (en) | 1990-05-09 | 2004-04-14 | Novozymes A/S | A cellulase preparation comprising an endoglucanase enzyme |
DK115890D0 (da) | 1990-05-09 | 1990-05-09 | Novo Nordisk As | Enzym |
AU657278B2 (en) | 1990-09-13 | 1995-03-09 | Novo Nordisk A/S | Lipase variants |
DE69133035T2 (de) | 1991-01-16 | 2003-02-13 | Procter & Gamble | Kompakte Waschmittelzusammensetzungen mit hochaktiven Cellulasen |
EP0511456A1 (en) | 1991-04-30 | 1992-11-04 | The Procter & Gamble Company | Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme |
HU213044B (en) | 1991-04-30 | 1997-01-28 | Procter & Gamble | Built liquid detergents with boric-polyol complex to inhibit proteolytic enzyme with additives improving detergent effect |
DE69226182T2 (de) | 1991-05-01 | 1999-01-21 | Novo Nordisk As | Stabilisierte enzyme und waschmittelzusammensetzungen |
DK72992D0 (da) | 1992-06-01 | 1992-06-01 | Novo Nordisk As | Enzym |
DK88892D0 (da) | 1992-07-06 | 1992-07-06 | Novo Nordisk As | Forbindelse |
ES2334590T3 (es) | 1992-07-23 | 2010-03-12 | Novozymes A/S | Alfa-amilasa mutante, detergente y agente de lavado de vajilla. |
JP3681750B2 (ja) | 1992-10-06 | 2005-08-10 | ノボザイムス アクティーゼルスカブ | セルラーゼ変異体 |
PL310326A1 (en) | 1993-02-11 | 1995-12-11 | Genencor Int | Novel oxidation-stable mutants of alpha-amylase as well as detergent and starch liquefaction compositions containing them |
JP3618748B2 (ja) | 1993-04-27 | 2005-02-09 | ジェネンコー インターナショナル インコーポレイテッド | 洗剤に使用する新しいリパーゼ変異体 |
DK52393D0 (zh) | 1993-05-05 | 1993-05-05 | Novo Nordisk As | |
CN1129011A (zh) * | 1993-07-12 | 1996-08-14 | 诺沃挪第克公司 | 含有两种纤维素酶成分的洗涤剂组合物 |
JP2859520B2 (ja) | 1993-08-30 | 1999-02-17 | ノボ ノルディスク アクティーゼルスカブ | リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物 |
KR100338786B1 (ko) | 1993-10-13 | 2002-12-02 | 노보자임스 에이/에스 | H2o2-안정한퍼록시다제변이체 |
JPH07143883A (ja) | 1993-11-24 | 1995-06-06 | Showa Denko Kk | リパーゼ遺伝子及び変異体リパーゼ |
GB9400623D0 (en) | 1994-01-14 | 1994-03-09 | Univ Leeds | Exploitation of the cellulase enzyme complex of neurospora |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
MX9603542A (es) | 1994-02-22 | 1997-03-29 | Novo Nordisk As | Metodo para preparar una variante de una enzima lipolitica. |
DK0749473T3 (da) | 1994-03-08 | 2006-02-27 | Novozymes As | Hidtil ukendte alkaliske cellulaser |
US6017866A (en) | 1994-05-04 | 2000-01-25 | Genencor International, Inc. | Lipases with improved surfactant resistance |
KR970703426A (ko) | 1994-06-03 | 1997-07-03 | 제임스 쉐한 | 정제된 Myceliophthora 락카제 및 그것을 암호화 하는 핵산(PURIFIED MYCELIOPHTHORA LACCASES AND NUCLEIC ACIDS ENCODING SAME) |
AU2884595A (en) | 1994-06-20 | 1996-01-15 | Unilever Plc | Modified pseudomonas lipases and their use |
WO1996000292A1 (en) | 1994-06-23 | 1996-01-04 | Unilever N.V. | Modified pseudomonas lipases and their use |
CN101659926A (zh) | 1994-06-30 | 2010-03-03 | 诺沃奇梅兹有限公司 | 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子 |
EP1995303A3 (en) | 1994-10-06 | 2008-12-31 | Novozymes A/S | Enzyme preparation with endoglucanase activity |
BE1008998A3 (fr) | 1994-10-14 | 1996-10-01 | Solvay | Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci. |
US5827719A (en) | 1994-10-26 | 1998-10-27 | Novo Nordisk A/S | Enzyme with lipolytic activity |
AR000862A1 (es) | 1995-02-03 | 1997-08-06 | Novozymes As | Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del |
JPH08228778A (ja) | 1995-02-27 | 1996-09-10 | Showa Denko Kk | 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法 |
CN101173263A (zh) | 1995-03-17 | 2008-05-07 | 诺沃奇梅兹有限公司 | 新的内切葡聚糖酶 |
ATE282087T1 (de) | 1995-07-14 | 2004-11-15 | Novozymes As | Modifiziertes enzym mit lipolytischer aktivität |
WO1997007205A1 (en) | 1995-08-11 | 1997-02-27 | Novo Nordisk A/S | Method for preparing polypeptide variants |
EP0851913B1 (en) | 1995-08-11 | 2004-05-19 | Novozymes A/S | Novel lipolytic enzymes |
DK0857216T3 (en) | 1995-10-17 | 2014-12-15 | Ab Enzymes Oy | Cellulases, GENES ENCODING THEM AND USES THEREOF |
US6184019B1 (en) * | 1995-10-17 | 2001-02-06 | Röhm Enzyme Finland OY | Cellulases, the genes encoding them and uses thereof |
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
US5763385A (en) | 1996-05-14 | 1998-06-09 | Genencor International, Inc. | Modified α-amylases having altered calcium binding properties |
WO1998008940A1 (en) | 1996-08-26 | 1998-03-05 | Novo Nordisk A/S | A novel endoglucanase |
EP0937138B1 (en) | 1996-09-17 | 2006-04-26 | Novozymes A/S | Cellulase variants |
CN1232384A (zh) | 1996-10-08 | 1999-10-20 | 诺沃挪第克公司 | 作为染料前体的二氨基苯甲酸衍生物 |
AU4773197A (en) | 1996-11-04 | 1998-05-29 | Novo Nordisk A/S | Subtilase variants and compositions |
KR100561826B1 (ko) | 1996-11-04 | 2006-03-16 | 노보자임스 에이/에스 | 섭틸라제 변종과 조성물 |
CN1208456C (zh) | 1996-12-20 | 2005-06-29 | 诺维信公司 | 体内重组 |
WO1998034946A1 (en) | 1997-02-12 | 1998-08-13 | Massachusetts Institute Of Technology | Daxx, a novel fas-binding protein that activates jnk and apoptosis |
JPH10242147A (ja) | 1997-02-27 | 1998-09-11 | Toshiba Corp | 半導体装置およびその製造方法ならびに半導体記憶装置およびその製造方法 |
US6159687A (en) | 1997-03-18 | 2000-12-12 | Novo Nordisk A/S | Methods for generating recombined polynucleotides |
EP1015575B1 (en) | 1997-03-18 | 2010-05-19 | Novozymes A/S | Shuffling of heterologous dna sequences |
US6159688A (en) | 1997-03-18 | 2000-12-12 | Novo Nordisk A/S | Methods of producing polynucleotide variants |
JP2001512024A (ja) * | 1997-07-31 | 2001-08-21 | デーエスエム・ナムローゼ・フェンノートシャップ | アスペルギルスのセルロース分解酵素 |
CA2379326A1 (en) * | 1999-07-13 | 2001-01-18 | Midwest Research Institute | Cellobiohydrolase reduced glycosylation variants: cbhin45a; cbhin270a; and cbhin384a |
AU4352700A (en) | 1999-10-06 | 2001-05-10 | Mark Aaron Emalfarb | High-throughput screening of expressed dna libraries in filamentous fungi |
JP4922524B2 (ja) * | 2000-04-13 | 2012-04-25 | ダイアデイツク・インターナシヨナル(ユーエスエイ)インコーポレーテツド | 糸状菌の分野における新規発現調節配列および発現産物 |
-
2002
- 2002-06-26 DK DK10179521.9T patent/DK2298868T3/en active
- 2002-06-26 CN CNA028127684A patent/CN1620501A/zh active Pending
- 2002-06-26 DK DK10179578.9T patent/DK2277997T3/da active
- 2002-06-26 EP EP10179578.9A patent/EP2277997B1/en not_active Expired - Lifetime
- 2002-06-26 AU AU2002316809A patent/AU2002316809A1/en not_active Abandoned
- 2002-06-26 EP EP02745180A patent/EP1421224B1/en not_active Expired - Lifetime
- 2002-06-26 WO PCT/DK2002/000429 patent/WO2003000941A2/en not_active Application Discontinuation
- 2002-06-26 EP EP10179594.6A patent/EP2295544B1/en not_active Expired - Lifetime
- 2002-06-26 ES ES10179578.9T patent/ES2438146T3/es not_active Expired - Lifetime
- 2002-06-26 DK DK02745180.6T patent/DK1421224T3/da active
- 2002-06-26 DK DK10179594.6T patent/DK2295544T3/en active
- 2002-06-26 US US10/481,179 patent/US7785853B2/en not_active Expired - Fee Related
- 2002-06-26 ES ES10179594.6T patent/ES2589831T3/es not_active Expired - Lifetime
- 2002-06-26 EP EP10179521.9A patent/EP2298868B1/en not_active Expired - Lifetime
- 2002-06-26 ES ES02745180T patent/ES2397267T3/es not_active Expired - Lifetime
- 2002-06-26 ES ES10179521.9T patent/ES2533923T3/es not_active Expired - Lifetime
-
2010
- 2010-06-18 US US12/818,861 patent/US8338156B2/en not_active Expired - Fee Related
-
2012
- 2012-05-30 US US13/483,389 patent/US8603793B2/en not_active Expired - Fee Related
- 2012-10-08 US US13/646,980 patent/US8507238B2/en not_active Expired - Fee Related
- 2012-11-20 US US13/681,490 patent/US8603794B2/en not_active Expired - Fee Related
-
2013
- 2013-10-28 US US14/064,457 patent/US8986969B2/en not_active Expired - Fee Related
- 2013-10-28 US US14/064,398 patent/US8993299B2/en not_active Expired - Fee Related
-
2015
- 2015-03-25 US US14/668,532 patent/US9187739B2/en not_active Expired - Fee Related
- 2015-10-27 US US14/923,710 patent/US9309504B2/en not_active Expired - Fee Related
-
2016
- 2016-03-04 US US15/061,694 patent/US9447399B2/en not_active Expired - Fee Related
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101384713B (zh) * | 2005-12-22 | 2013-03-20 | 罗尔公司 | 纤维素材料的处理和用于其中的酶 |
CN102174492B (zh) * | 2005-12-22 | 2014-01-01 | 罗尔公司 | 纤维素材料的处理和用于其中的酶 |
CN104962537A (zh) * | 2007-05-10 | 2015-10-07 | 诺维信股份有限公司 | 用于增强含纤维素材料的降解或转化的组合物和方法 |
CN101874109B (zh) * | 2007-09-28 | 2013-07-10 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN102666847B (zh) * | 2009-10-29 | 2015-12-09 | 诺维信股份有限公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN102666847A (zh) * | 2009-10-29 | 2012-09-12 | 诺维信股份有限公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN102947442A (zh) * | 2009-11-06 | 2013-02-27 | 诺维信股份有限公司 | 用于糖化纤维素材料的组合物 |
CN104694517B (zh) * | 2009-11-06 | 2019-06-28 | 诺维信股份有限公司 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
CN106167796B (zh) * | 2009-11-06 | 2019-06-04 | 诺维信股份有限公司 | 用于糖化纤维素材料的组合物 |
CN106167796A (zh) * | 2009-11-06 | 2016-11-30 | 诺维信股份有限公司 | 用于糖化纤维素材料的组合物 |
CN102947442B (zh) * | 2009-11-06 | 2016-03-09 | 诺维信股份有限公司 | 用于糖化纤维素材料的组合物 |
CN104694517A (zh) * | 2009-11-06 | 2015-06-10 | 诺维信股份有限公司 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
CN103517985A (zh) * | 2011-01-26 | 2014-01-15 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸 |
CN103620028A (zh) * | 2011-01-26 | 2014-03-05 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN103517985B (zh) * | 2011-01-26 | 2016-12-07 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸 |
CN103620028B (zh) * | 2011-01-26 | 2017-05-03 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN103534348B (zh) * | 2011-01-26 | 2018-04-10 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN103534348A (zh) * | 2011-01-26 | 2014-01-22 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
CN110628803A (zh) * | 2011-01-26 | 2019-12-31 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸 |
CN104350148A (zh) * | 2011-11-15 | 2015-02-11 | 诺维信股份有限公司 | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 |
WO2013071871A1 (en) * | 2011-11-15 | 2013-05-23 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
CN108949726A (zh) * | 2018-06-15 | 2018-12-07 | 河南农业大学 | 一种改组纤维素酶基因及其表达载体和应用 |
CN108949726B (zh) * | 2018-06-15 | 2021-11-16 | 河南农业大学 | 一种改组纤维素酶基因及其表达载体和应用 |
CN113151223A (zh) * | 2020-01-22 | 2021-07-23 | 山东宏业海洋科技股份有限公司 | 一种制备海带水解液的方法 |
CN113151223B (zh) * | 2020-01-22 | 2022-08-30 | 山东宏业海洋科技股份有限公司 | 一种制备海带水解液的方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1620501A (zh) | 具有纤维二糖水解酶i活性的多肽和编码多肽的多核苷酸 | |
CN1729287A (zh) | 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸 | |
CN1234854C (zh) | 具有碱性α-淀粉酶活性的多肽以及编码该多肽的核酸 | |
CN1509330A (zh) | 具有纤维二糖酶活性的多肽和编码其的多核苷酸 | |
CN1211483C (zh) | 具有分支酶活性的多肽及其编码核酸 | |
CN1902310A (zh) | 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸 | |
CN1875097A (zh) | 杂交酶 | |
CN1351657A (zh) | 具有碱性α-淀粉酶活性的多肽及其编码核酸 | |
CN1309700A (zh) | 葡糖淀粉酶变体 | |
CN1360630A (zh) | 葡糖淀粉酶变体 | |
CN101031643A (zh) | 具有α-葡糖苷酶活性的多肽及编码其的多核苷酸 | |
CN1195058C (zh) | 草酰乙酸水解酶缺陷型真菌宿主细胞 | |
CN1816631A (zh) | β-葡糖苷酶的变体 | |
CN101052721A (zh) | Botryosphaeria Rhodina的多肽 | |
CN1842596A (zh) | 用于淀粉加工的酶 | |
CN1137994C (zh) | 具有葡聚糖转移酶活性的多肽和编码该多肽的核酸 | |
CN1930285A (zh) | 脂环酸芽孢杆菌的多肽 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20050525 |