CN101253263A - 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 - Google Patents
具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 Download PDFInfo
- Publication number
- CN101253263A CN101253263A CN200680023158.4A CN200680023158A CN101253263A CN 101253263 A CN101253263 A CN 101253263A CN 200680023158 A CN200680023158 A CN 200680023158A CN 101253263 A CN101253263 A CN 101253263A
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- seq
- sequence
- polynucleotide
- mature polypeptide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 413
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 405
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 402
- 108010059892 Cellulase Proteins 0.000 title claims abstract description 147
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 110
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 110
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 110
- 230000000694 effects Effects 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 claims abstract description 108
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 37
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 37
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 37
- 125000003729 nucleotide group Chemical group 0.000 claims description 136
- 239000002773 nucleotide Substances 0.000 claims description 133
- 108090000623 proteins and genes Proteins 0.000 claims description 125
- 102000004190 Enzymes Human genes 0.000 claims description 63
- 108090000790 Enzymes Proteins 0.000 claims description 63
- 235000001014 amino acid Nutrition 0.000 claims description 62
- 150000001413 amino acids Chemical class 0.000 claims description 60
- 239000000203 mixture Substances 0.000 claims description 60
- 102000004169 proteins and genes Human genes 0.000 claims description 58
- 108020004414 DNA Proteins 0.000 claims description 56
- 235000018102 proteins Nutrition 0.000 claims description 56
- 229920002678 cellulose Polymers 0.000 claims description 36
- 239000001913 cellulose Substances 0.000 claims description 36
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 35
- 230000008859 change Effects 0.000 claims description 35
- 241000894006 Bacteria Species 0.000 claims description 34
- 230000001105 regulatory effect Effects 0.000 claims description 32
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 28
- 239000013612 plasmid Substances 0.000 claims description 28
- 230000001276 controlling effect Effects 0.000 claims description 27
- 238000009396 hybridization Methods 0.000 claims description 25
- 239000012634 fragment Substances 0.000 claims description 24
- 239000000758 substrate Substances 0.000 claims description 22
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 20
- 239000013604 expression vector Substances 0.000 claims description 20
- 239000003599 detergent Substances 0.000 claims description 19
- 239000002028 Biomass Substances 0.000 claims description 17
- 230000000295 complement effect Effects 0.000 claims description 17
- 230000000968 intestinal effect Effects 0.000 claims description 16
- 229920002488 Hemicellulose Polymers 0.000 claims description 14
- 235000013311 vegetables Nutrition 0.000 claims description 12
- 229920002307 Dextran Polymers 0.000 claims description 9
- 229920002000 Xyloglucan Polymers 0.000 claims description 9
- 238000003259 recombinant expression Methods 0.000 claims description 9
- 229920002101 Chitin Polymers 0.000 claims description 8
- 230000009261 transgenic effect Effects 0.000 claims description 8
- 229920001221 xylan Polymers 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 7
- 229920000018 Callose Polymers 0.000 claims description 6
- 150000004823 xylans Chemical class 0.000 claims description 6
- 239000013543 active substance Substances 0.000 claims description 3
- 239000013598 vector Substances 0.000 abstract description 5
- 210000004027 cell Anatomy 0.000 description 160
- 229940088598 enzyme Drugs 0.000 description 62
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 58
- 229940024606 amino acid Drugs 0.000 description 56
- 241000196324 Embryophyta Species 0.000 description 44
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 44
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 36
- 230000014509 gene expression Effects 0.000 description 32
- 240000006439 Aspergillus oryzae Species 0.000 description 29
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 29
- 238000006243 chemical reaction Methods 0.000 description 28
- 239000000047 product Substances 0.000 description 27
- 238000006460 hydrolysis reaction Methods 0.000 description 26
- 239000000463 material Substances 0.000 description 26
- 239000002299 complementary DNA Substances 0.000 description 24
- 238000011534 incubation Methods 0.000 description 24
- 239000000243 solution Substances 0.000 description 24
- 230000007062 hydrolysis Effects 0.000 description 23
- 238000005406 washing Methods 0.000 description 23
- 241000499912 Trichoderma reesei Species 0.000 description 22
- -1 methane amide Chemical class 0.000 description 22
- 238000002703 mutagenesis Methods 0.000 description 22
- 231100000350 mutagenesis Toxicity 0.000 description 22
- 239000000523 sample Substances 0.000 description 21
- 241000233866 Fungi Species 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 20
- 241000228245 Aspergillus niger Species 0.000 description 19
- 241001494489 Thielavia Species 0.000 description 19
- 230000001580 bacterial effect Effects 0.000 description 19
- 230000002538 fungal effect Effects 0.000 description 19
- 108091026890 Coding region Proteins 0.000 description 18
- 238000002360 preparation method Methods 0.000 description 18
- 241000351920 Aspergillus nidulans Species 0.000 description 17
- 229940106157 cellulase Drugs 0.000 description 17
- 235000015097 nutrients Nutrition 0.000 description 17
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 16
- 102000035195 Peptidases Human genes 0.000 description 16
- 108091005804 Peptidases Proteins 0.000 description 16
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 241000193830 Bacillus <bacterium> Species 0.000 description 15
- 108090001060 Lipase Proteins 0.000 description 15
- 102000004882 Lipase Human genes 0.000 description 15
- 239000004367 Lipase Substances 0.000 description 15
- 239000008103 glucose Substances 0.000 description 15
- 235000019421 lipase Nutrition 0.000 description 15
- 108010065511 Amylases Proteins 0.000 description 14
- 229920002498 Beta-glucan Polymers 0.000 description 14
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 14
- 241000223258 Thermomyces lanuginosus Species 0.000 description 14
- 239000002853 nucleic acid probe Substances 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- 239000004382 Amylase Substances 0.000 description 13
- 102000013142 Amylases Human genes 0.000 description 13
- 125000000539 amino acid group Chemical group 0.000 description 13
- 235000019418 amylase Nutrition 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 13
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 12
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 12
- 241000223218 Fusarium Species 0.000 description 12
- 239000007788 liquid Substances 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 12
- 244000005700 microbiome Species 0.000 description 12
- 238000011160 research Methods 0.000 description 12
- 102000003992 Peroxidases Human genes 0.000 description 11
- 229940072417 peroxidase Drugs 0.000 description 11
- 108040007629 peroxidase activity proteins Proteins 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 241000223259 Trichoderma Species 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 239000003795 chemical substances by application Substances 0.000 description 10
- 238000013016 damping Methods 0.000 description 10
- 239000012530 fluid Substances 0.000 description 10
- 239000003550 marker Substances 0.000 description 10
- 238000004321 preservation Methods 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 235000000346 sugar Nutrition 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 241000228212 Aspergillus Species 0.000 description 9
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 9
- 240000007594 Oryza sativa Species 0.000 description 9
- 235000007164 Oryza sativa Nutrition 0.000 description 9
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 9
- 108010048241 acetamidase Proteins 0.000 description 9
- 239000000654 additive Substances 0.000 description 9
- 239000002585 base Substances 0.000 description 9
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 9
- 230000008034 disappearance Effects 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 9
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- 235000009566 rice Nutrition 0.000 description 9
- 241000194108 Bacillus licheniformis Species 0.000 description 8
- 239000002253 acid Substances 0.000 description 8
- 238000010790 dilution Methods 0.000 description 8
- 239000012895 dilution Substances 0.000 description 8
- 238000000855 fermentation Methods 0.000 description 8
- 230000004151 fermentation Effects 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 230000014616 translation Effects 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 7
- 241000235395 Mucor Species 0.000 description 7
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 7
- 240000008042 Zea mays Species 0.000 description 7
- 108010047754 beta-Glucosidase Proteins 0.000 description 7
- 210000002421 cell wall Anatomy 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 230000002779 inactivation Effects 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 230000008488 polyadenylation Effects 0.000 description 7
- 101150054232 pyrG gene Proteins 0.000 description 7
- 238000002741 site-directed mutagenesis Methods 0.000 description 7
- 239000001632 sodium acetate Substances 0.000 description 7
- 235000017281 sodium acetate Nutrition 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 6
- 229920000742 Cotton Polymers 0.000 description 6
- 229920001503 Glucan Polymers 0.000 description 6
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 241000223198 Humicola Species 0.000 description 6
- 102000004157 Hydrolases Human genes 0.000 description 6
- 108090000604 Hydrolases Proteins 0.000 description 6
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 6
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 6
- 102000006995 beta-Glucosidase Human genes 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 230000002950 deficient Effects 0.000 description 6
- 230000029087 digestion Effects 0.000 description 6
- 238000007710 freezing Methods 0.000 description 6
- 230000008014 freezing Effects 0.000 description 6
- 230000007935 neutral effect Effects 0.000 description 6
- 229920001282 polysaccharide Polymers 0.000 description 6
- 239000005017 polysaccharide Substances 0.000 description 6
- 150000004804 polysaccharides Chemical class 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008521 reorganization Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 239000002023 wood Substances 0.000 description 6
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 244000025254 Cannabis sativa Species 0.000 description 5
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- 241000190932 Rhodopseudomonas Species 0.000 description 5
- 241000187747 Streptomyces Species 0.000 description 5
- 108090000787 Subtilisin Proteins 0.000 description 5
- 241001495429 Thielavia terrestris Species 0.000 description 5
- 230000000996 additive effect Effects 0.000 description 5
- 229940041514 candida albicans extract Drugs 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 235000013339 cereals Nutrition 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 239000000975 dye Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 235000016709 nutrition Nutrition 0.000 description 5
- 238000001556 precipitation Methods 0.000 description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 230000001810 trypsinlike Effects 0.000 description 5
- 239000012138 yeast extract Substances 0.000 description 5
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 4
- FJKROLUGYXJWQN-UHFFFAOYSA-N 4-hydroxybenzoic acid Chemical compound OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 4
- 241001513093 Aspergillus awamori Species 0.000 description 4
- 241001225321 Aspergillus fumigatus Species 0.000 description 4
- 241001480052 Aspergillus japonicus Species 0.000 description 4
- 241000193422 Bacillus lentus Species 0.000 description 4
- 108010022172 Chitinases Proteins 0.000 description 4
- 102000012286 Chitinases Human genes 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- 102000010911 Enzyme Precursors Human genes 0.000 description 4
- 108010062466 Enzyme Precursors Proteins 0.000 description 4
- 108091060211 Expressed sequence tag Proteins 0.000 description 4
- 241000223195 Fusarium graminearum Species 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- 108010029541 Laccase Proteins 0.000 description 4
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 4
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 4
- 108010056079 Subtilisins Proteins 0.000 description 4
- 102000005158 Subtilisins Human genes 0.000 description 4
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 229940091771 aspergillus fumigatus Drugs 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 108010089934 carbohydrase Proteins 0.000 description 4
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 4
- 238000004043 dyeing Methods 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 241001233957 eudicotyledons Species 0.000 description 4
- 125000003147 glycosyl group Chemical group 0.000 description 4
- 229910001385 heavy metal Inorganic materials 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 4
- 235000009973 maize Nutrition 0.000 description 4
- 210000001161 mammalian embryo Anatomy 0.000 description 4
- 239000001814 pectin Substances 0.000 description 4
- 229920001277 pectin Polymers 0.000 description 4
- 235000010987 pectin Nutrition 0.000 description 4
- 230000037039 plant physiology Effects 0.000 description 4
- 239000001965 potato dextrose agar Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 210000003491 skin Anatomy 0.000 description 4
- 239000011734 sodium Substances 0.000 description 4
- 229910021654 trace metal Inorganic materials 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 210000005239 tubule Anatomy 0.000 description 4
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 3
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 3
- 108010011619 6-Phytase Proteins 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- 229920000936 Agarose Polymers 0.000 description 3
- 241000220433 Albizia Species 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 108090000915 Aminopeptidases Proteins 0.000 description 3
- 102000004400 Aminopeptidases Human genes 0.000 description 3
- 241000235349 Ascomycota Species 0.000 description 3
- 241000228215 Aspergillus aculeatus Species 0.000 description 3
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 3
- 241000223651 Aureobasidium Species 0.000 description 3
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 3
- 241000193752 Bacillus circulans Species 0.000 description 3
- 241000193749 Bacillus coagulans Species 0.000 description 3
- 241000194107 Bacillus megaterium Species 0.000 description 3
- 244000063299 Bacillus subtilis Species 0.000 description 3
- 235000014469 Bacillus subtilis Nutrition 0.000 description 3
- 241000193388 Bacillus thuringiensis Species 0.000 description 3
- 108010023063 Bacto-peptone Proteins 0.000 description 3
- 241000219193 Brassicaceae Species 0.000 description 3
- 241000193764 Brevibacillus brevis Species 0.000 description 3
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 3
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 3
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 3
- 108010006303 Carboxypeptidases Proteins 0.000 description 3
- 102000005367 Carboxypeptidases Human genes 0.000 description 3
- 102000016938 Catalase Human genes 0.000 description 3
- 108010053835 Catalase Proteins 0.000 description 3
- 108010031396 Catechol oxidase Proteins 0.000 description 3
- 102000030523 Catechol oxidase Human genes 0.000 description 3
- 108010084185 Cellulases Proteins 0.000 description 3
- 241000146399 Ceriporiopsis Species 0.000 description 3
- 241000222511 Coprinus Species 0.000 description 3
- 244000251987 Coprinus macrorhizus Species 0.000 description 3
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 3
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 3
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 3
- 108010053770 Deoxyribonucleases Proteins 0.000 description 3
- 102000016911 Deoxyribonucleases Human genes 0.000 description 3
- 241001063191 Elops affinis Species 0.000 description 3
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 3
- 235000002756 Erythrina berteroana Nutrition 0.000 description 3
- 108090000371 Esterases Proteins 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 229920000926 Galactomannan Polymers 0.000 description 3
- 102100022624 Glucoamylase Human genes 0.000 description 3
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 3
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 3
- 240000005979 Hordeum vulgare Species 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- 241000235649 Kluyveromyces Species 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- 108090000856 Lyases Proteins 0.000 description 3
- 102000004317 Lyases Human genes 0.000 description 3
- 108010054377 Mannosidases Proteins 0.000 description 3
- 102000001696 Mannosidases Human genes 0.000 description 3
- 241000226677 Myceliophthora Species 0.000 description 3
- 241000221960 Neurospora Species 0.000 description 3
- 241000233654 Oomycetes Species 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 3
- 241000194109 Paenibacillus lautus Species 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- 241000589516 Pseudomonas Species 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 3
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 3
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 3
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 3
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 3
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 3
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 3
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 3
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 3
- 241001123227 Saccharomyces pastorianus Species 0.000 description 3
- 241000222480 Schizophyllum Species 0.000 description 3
- 241000235346 Schizosaccharomyces Species 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- 239000005864 Sulphur Substances 0.000 description 3
- 241000228341 Talaromyces Species 0.000 description 3
- 241001540751 Talaromyces ruber Species 0.000 description 3
- 108060008539 Transglutaminase Proteins 0.000 description 3
- 235000010749 Vicia faba Nutrition 0.000 description 3
- 240000006677 Vicia faba Species 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 229940054340 bacillus coagulans Drugs 0.000 description 3
- 229940097012 bacillus thuringiensis Drugs 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 102000005936 beta-Galactosidase Human genes 0.000 description 3
- AFYNADDZULBEJA-UHFFFAOYSA-N bicinchoninic acid Chemical compound C1=CC=CC2=NC(C=3C=C(C4=CC=CC=C4N=3)C(=O)O)=CC(C(O)=O)=C21 AFYNADDZULBEJA-UHFFFAOYSA-N 0.000 description 3
- 239000007844 bleaching agent Substances 0.000 description 3
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 3
- 239000004327 boric acid Substances 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 3
- 229960000846 camphor Drugs 0.000 description 3
- 230000004087 circulation Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 235000014113 dietary fatty acids Nutrition 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 108010091371 endoglucanase 1 Proteins 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 229930195729 fatty acid Natural products 0.000 description 3
- 239000000194 fatty acid Substances 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 235000011187 glycerol Nutrition 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 235000011073 invertase Nutrition 0.000 description 3
- 238000007834 ligase chain reaction Methods 0.000 description 3
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 3
- 150000004965 peroxy acids Chemical class 0.000 description 3
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 3
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 3
- 229940085127 phytase Drugs 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 230000002797 proteolythic effect Effects 0.000 description 3
- 210000001938 protoplast Anatomy 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 239000010902 straw Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 102000003601 transglutaminase Human genes 0.000 description 3
- 108010046845 tryptones Proteins 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- 229940090248 4-hydroxybenzoic acid Drugs 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 240000000073 Achillea millefolium Species 0.000 description 2
- 235000007754 Achillea millefolium Nutrition 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 102100027211 Albumin Human genes 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 208000000659 Autoimmune lymphoproliferative syndrome Diseases 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 108090000145 Bacillolysin Proteins 0.000 description 2
- 241000194103 Bacillus pumilus Species 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 241000589513 Burkholderia cepacia Species 0.000 description 2
- 101100494262 Caenorhabditis elegans best-12 gene Proteins 0.000 description 2
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 2
- 241001466517 Ceriporiopsis aneirina Species 0.000 description 2
- 241001057137 Chaetomium fimeti Species 0.000 description 2
- 229920001661 Chitosan Polymers 0.000 description 2
- 241000701248 Chlorella virus Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- RKWGIWYCVPQPMF-UHFFFAOYSA-N Chloropropamide Chemical compound CCCNC(=O)NS(=O)(=O)C1=CC=C(Cl)C=C1 RKWGIWYCVPQPMF-UHFFFAOYSA-N 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- 241001362614 Crassa Species 0.000 description 2
- 241000287781 Crassicarpon thermophilum Species 0.000 description 2
- GUBGYTABKSRVRQ-UHFFFAOYSA-N D-Cellobiose Natural products OCC1OC(OC2C(O)C(O)C(O)OC2CO)C(O)C(O)C1O GUBGYTABKSRVRQ-UHFFFAOYSA-N 0.000 description 2
- 101710132690 Endo-1,4-beta-xylanase A Proteins 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical group C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000234642 Festuca Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 108010068370 Glutens Proteins 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 101710094902 Legumin Proteins 0.000 description 2
- 229920002097 Lichenin Polymers 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- 241001344133 Magnaporthe Species 0.000 description 2
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 2
- 241001184659 Melanocarpus albomyces Species 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- QPCDCPDFJACHGM-UHFFFAOYSA-N N,N-bis{2-[bis(carboxymethyl)amino]ethyl}glycine Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(=O)O)CCN(CC(O)=O)CC(O)=O QPCDCPDFJACHGM-UHFFFAOYSA-N 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 241000233892 Neocallimastix Species 0.000 description 2
- 102000035092 Neutral proteases Human genes 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 108090000913 Nitrate Reductases Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- BPQQTUXANYXVAA-UHFFFAOYSA-N Orthosilicate Chemical compound [O-][Si]([O-])([O-])[O-] BPQQTUXANYXVAA-UHFFFAOYSA-N 0.000 description 2
- 101710157860 Oxydoreductase Proteins 0.000 description 2
- 241000364057 Peoria Species 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000235379 Piromyces Species 0.000 description 2
- 241000222350 Pleurotus Species 0.000 description 2
- 241000168225 Pseudomonas alcaligenes Species 0.000 description 2
- 241000589540 Pseudomonas fluorescens Species 0.000 description 2
- 241000589630 Pseudomonas pseudoalcaligenes Species 0.000 description 2
- 241000589774 Pseudomonas sp. Species 0.000 description 2
- 241000589614 Pseudomonas stutzeri Species 0.000 description 2
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 2
- 108091034057 RNA (poly(A)) Proteins 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 241001655322 Streptomycetales Species 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- 244000152045 Themeda triandra Species 0.000 description 2
- 241000183057 Thielavia microspora Species 0.000 description 2
- 241000182980 Thielavia ovispora Species 0.000 description 2
- 241000183053 Thielavia subthermophila Species 0.000 description 2
- 241000183072 Thielavia terricola Species 0.000 description 2
- 241001149964 Tolypocladium Species 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000651383 Variospora Species 0.000 description 2
- 235000002098 Vicia faba var. major Nutrition 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- LPQOADBMXVRBNX-UHFFFAOYSA-N ac1ldcw0 Chemical compound Cl.C1CN(C)CCN1C1=C(F)C=C2C(=O)C(C(O)=O)=CN3CCSC1=C32 LPQOADBMXVRBNX-UHFFFAOYSA-N 0.000 description 2
- 238000005903 acid hydrolysis reaction Methods 0.000 description 2
- 229920006243 acrylic copolymer Polymers 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- 125000005466 alkylenyl group Chemical group 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 102000005840 alpha-Galactosidase Human genes 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical group [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 2
- 230000003625 amylolytic effect Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 210000001367 artery Anatomy 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000001768 carboxy methyl cellulose Substances 0.000 description 2
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 2
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000036978 cell physiology Effects 0.000 description 2
- 239000002962 chemical mutagen Substances 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 230000001461 cytolytic effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000002979 fabric softener Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 150000002191 fatty alcohols Chemical class 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 239000004459 forage Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000003365 glass fiber Substances 0.000 description 2
- 229930182478 glucoside Natural products 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 239000008187 granular material Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 229910052736 halogen Inorganic materials 0.000 description 2
- 150000002367 halogens Chemical class 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 229940042795 hydrazides for tuberculosis treatment Drugs 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 150000003949 imides Chemical class 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 2
- 239000004310 lactic acid Substances 0.000 description 2
- 235000014655 lactic acid Nutrition 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 239000012160 loading buffer Substances 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 108010020132 microbial serine proteinases Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000010813 municipal solid waste Substances 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 235000019629 palatability Nutrition 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 238000005222 photoaffinity labeling Methods 0.000 description 2
- 239000003375 plant hormone Substances 0.000 description 2
- 239000010908 plant waste Substances 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920005646 polycarboxylate Polymers 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 2
- 229920000053 polysorbate 80 Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000011045 prefiltration Methods 0.000 description 2
- 235000013772 propylene glycol Nutrition 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000012807 shake-flask culturing Methods 0.000 description 2
- 239000002002 slurry Substances 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 229910052708 sodium Inorganic materials 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- 150000005846 sugar alcohols Chemical class 0.000 description 2
- 239000001117 sulphuric acid Substances 0.000 description 2
- 235000011149 sulphuric acid Nutrition 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- ASZCVNVMQXNJGH-ZYRRHWMLSA-N (1S,2R,9S,12S)-4,12-dimethyl-13-oxotetracyclo[10.2.1.01,9.03,8]pentadeca-3,5,7-triene-2-carboxylic acid Chemical compound Cc1cccc2[C@H]3CC[C@@]4(C)C[C@@]3(CC4=O)[C@@H](C(O)=O)c12 ASZCVNVMQXNJGH-ZYRRHWMLSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- SEFVRKXJJPMVHQ-YUMQZZPRSA-N (2s)-2-[[2-[[(2s)-2-[(2-aminoacetyl)amino]-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]butanedioic acid Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O SEFVRKXJJPMVHQ-YUMQZZPRSA-N 0.000 description 1
- JQFLYFRHDIHZFZ-RXMQYKEDSA-N (2s)-3,3-dimethylpyrrolidine-2-carboxylic acid Chemical compound CC1(C)CCN[C@@H]1C(O)=O JQFLYFRHDIHZFZ-RXMQYKEDSA-N 0.000 description 1
- CNPSFBUUYIVHAP-AKGZTFGVSA-N (2s)-3-methylpyrrolidine-2-carboxylic acid Chemical compound CC1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-AKGZTFGVSA-N 0.000 description 1
- FYGDTMLNYKFZSV-WFYNLLPOSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,3s,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-WFYNLLPOSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- LDVVTQMJQSCDMK-UHFFFAOYSA-N 1,3-dihydroxypropan-2-yl formate Chemical compound OCC(CO)OC=O LDVVTQMJQSCDMK-UHFFFAOYSA-N 0.000 description 1
- VOYXMQFJDIVEQN-UHFFFAOYSA-N 1,3-thiazolidine-2-carboxylic acid Chemical compound S1C(NCC1)C(=O)O.S1C(NCC1)C(=O)O VOYXMQFJDIVEQN-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- OMGHIGVFLOPEHJ-UHFFFAOYSA-N 2,5-dihydro-1h-pyrrol-1-ium-2-carboxylate Chemical compound OC(=O)C1NCC=C1 OMGHIGVFLOPEHJ-UHFFFAOYSA-N 0.000 description 1
- IEORSVTYLWZQJQ-UHFFFAOYSA-N 2-(2-nonylphenoxy)ethanol Chemical compound CCCCCCCCCC1=CC=CC=C1OCCO IEORSVTYLWZQJQ-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- GBIBYNIYVUFTIT-UHFFFAOYSA-N 2-[bis(carboxymethyl)amino]acetic acid Chemical compound OC(=O)CN(CC(O)=O)CC(O)=O.OC(=O)CN(CC(O)=O)CC(O)=O GBIBYNIYVUFTIT-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 101710134681 40 kDa protein Proteins 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- LXAHHHIGZXPRKQ-UHFFFAOYSA-N 5-fluoro-2-methylpyridine Chemical compound CC1=CC=C(F)C=N1 LXAHHHIGZXPRKQ-UHFFFAOYSA-N 0.000 description 1
- FRXSZNDVFUDTIR-UHFFFAOYSA-N 6-methoxy-1,2,3,4-tetrahydroquinoline Chemical compound N1CCCC2=CC(OC)=CC=C21 FRXSZNDVFUDTIR-UHFFFAOYSA-N 0.000 description 1
- 101150008391 A1 gene Proteins 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 241000743339 Agrostis Species 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 241001677738 Aleuron Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical class N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101710152845 Arabinogalactan endo-beta-1,4-galactanase Proteins 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- VWJFQGXPYOPXJH-ZLUOBGJFSA-N Asn-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)N VWJFQGXPYOPXJH-ZLUOBGJFSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- XAPPCWUWHNWCPQ-PBCZWWQYSA-N Asp-Thr-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XAPPCWUWHNWCPQ-PBCZWWQYSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- HEYOTMNUJRWBTC-UHFFFAOYSA-N C(=O)C1=CC=C(C=C1)B(O)O.C(=O)C1=CC=C(C=C1)OB(O)O Chemical compound C(=O)C1=CC=C(C=C1)B(O)O.C(=O)C1=CC=C(C=C1)OB(O)O HEYOTMNUJRWBTC-UHFFFAOYSA-N 0.000 description 1
- XTZPUTHTSOCFQT-UHFFFAOYSA-N C(C)CS(=O)(=O)O.CS(=O)(=O)OCC Chemical compound C(C)CS(=O)(=O)O.CS(=O)(=O)OCC XTZPUTHTSOCFQT-UHFFFAOYSA-N 0.000 description 1
- UMIIJMPTCKRAHG-UHFFFAOYSA-N CCCCCCCCC(O)=O.CCCCCCCCC(OC(C=CC=C1)=C1S(O)(=O)=O)=O.OS(C1=CC=CC=C1)(=O)=O Chemical compound CCCCCCCCC(O)=O.CCCCCCCCC(OC(C=CC=C1)=C1S(O)(=O)=O)=O.OS(C1=CC=CC=C1)(=O)=O UMIIJMPTCKRAHG-UHFFFAOYSA-N 0.000 description 1
- GAWIXWVDTYZWAW-UHFFFAOYSA-N C[CH]O Chemical group C[CH]O GAWIXWVDTYZWAW-UHFFFAOYSA-N 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100520142 Caenorhabditis elegans pin-2 gene Proteins 0.000 description 1
- 102100024423 Carbonic anhydrase 9 Human genes 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 229920002299 Cellodextrin Polymers 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 240000008886 Ceratonia siliqua Species 0.000 description 1
- 235000013912 Ceratonia siliqua Nutrition 0.000 description 1
- 241001646018 Ceriporiopsis gilvescens Species 0.000 description 1
- 241001277875 Ceriporiopsis rivulosa Species 0.000 description 1
- 241000524302 Ceriporiopsis subrufa Species 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 241000235457 Chytridium Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000020428 Colea Species 0.000 description 1
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- DVKQPQKQDHHFTE-ZLUOBGJFSA-N Cys-Cys-Asn Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)N DVKQPQKQDHHFTE-ZLUOBGJFSA-N 0.000 description 1
- 125000002353 D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000016559 DNA Primase Human genes 0.000 description 1
- 108010092681 DNA Primase Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101150060155 Dcc gene Proteins 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 101100437104 Drosophila melanogaster AttB gene Proteins 0.000 description 1
- 101710147028 Endo-beta-1,4-galactanase Proteins 0.000 description 1
- 101710157777 Endoglucanase EG-1 Proteins 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000146398 Gelatoporia subvermispora Species 0.000 description 1
- 241000726221 Gemma Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 239000005980 Gibberellic acid Substances 0.000 description 1
- ASZCVNVMQXNJGH-UHFFFAOYSA-N Gibberic acid Natural products C12CCC(C3)(C)C(=O)CC23C(C(O)=O)C2=C1C=CC=C2C ASZCVNVMQXNJGH-UHFFFAOYSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 1
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 1
- JNVGVECJCOZHCN-DRZSPHRISA-N Gln-Phe-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O JNVGVECJCOZHCN-DRZSPHRISA-N 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- HBGKOLSGLYMWSW-DCAQKATOSA-N His-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CS)C(=O)O HBGKOLSGLYMWSW-DCAQKATOSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101100165850 Homo sapiens CA9 gene Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 108700039609 IRW peptide Proteins 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- BZUOLKFQVVBTJY-SLBDDTMCSA-N Ile-Trp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BZUOLKFQVVBTJY-SLBDDTMCSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- KKJQZEWNZXRJFG-UHFFFAOYSA-N L-trans-4-Methyl-2-pyrrolidinecarboxylic acid Chemical compound CC1CNC(C(O)=O)C1 KKJQZEWNZXRJFG-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344131 Magnaporthe grisea Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- GMPKIPWJBDOURN-UHFFFAOYSA-N Methoxyamine Chemical compound CON GMPKIPWJBDOURN-UHFFFAOYSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 229920002274 Nalgene Polymers 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 1
- IGFHQQFPSIBGKE-UHFFFAOYSA-N Nonylphenol Natural products CCCCCCCCCC1=CC=C(O)C=C1 IGFHQQFPSIBGKE-UHFFFAOYSA-N 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 240000005373 Panax quinquefolius Species 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000222397 Phlebia radiata Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 244000208734 Pisonia aculeata Species 0.000 description 1
- 244000252132 Pleurotus eryngii Species 0.000 description 1
- 235000001681 Pleurotus eryngii Nutrition 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 244000292693 Poa annua Species 0.000 description 1
- 241000209049 Poa pratensis Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 235000010829 Prunus spinosa Nutrition 0.000 description 1
- 241000577556 Pseudomonas wisconsinensis Species 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101001076706 Saccharomyces cerevisiae Invertase 1 Proteins 0.000 description 1
- 101001053411 Saccharomyces cerevisiae Invertase 3 Proteins 0.000 description 1
- 101001053412 Saccharomyces cerevisiae Invertase 4 Proteins 0.000 description 1
- 101001053409 Saccharomyces cerevisiae Invertase 5 Proteins 0.000 description 1
- 101001053400 Saccharomyces cerevisiae Invertase 7 Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 239000012506 Sephacryl® Substances 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- SVWQEIRZHHNBIO-WHFBIAKZSA-N Ser-Gly-Cys Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CS)C(O)=O SVWQEIRZHHNBIO-WHFBIAKZSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 102000013275 Somatomedins Human genes 0.000 description 1
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 241001468239 Streptomyces murinus Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- BGRWYDHXPHLNKA-UHFFFAOYSA-N Tetraacetylethylenediamine Chemical compound CC(=O)N(C(C)=O)CCN(C(C)=O)C(C)=O BGRWYDHXPHLNKA-UHFFFAOYSA-N 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241000223257 Thermomyces Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241000222357 Trametes hirsuta Species 0.000 description 1
- 241000222355 Trametes versicolor Species 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- CFMGQWYCEJDTDG-XIRDDKMYSA-N Trp-Lys-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 CFMGQWYCEJDTDG-XIRDDKMYSA-N 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- OSXNCKRGMSHWSQ-ACRUOGEOSA-N Tyr-His-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSXNCKRGMSHWSQ-ACRUOGEOSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- JDLSRXWHEBFHNC-UHFFFAOYSA-N Ufenamate Chemical compound CCCCOC(=O)C1=CC=CC=C1NC1=CC=CC(C(F)(F)F)=C1 JDLSRXWHEBFHNC-UHFFFAOYSA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 229910021536 Zeolite Inorganic materials 0.000 description 1
- BDKZHNJTLHOSDW-UHFFFAOYSA-N [Na].CC(O)=O Chemical compound [Na].CC(O)=O BDKZHNJTLHOSDW-UHFFFAOYSA-N 0.000 description 1
- DPDMMXDBJGCCQC-UHFFFAOYSA-N [Na].[Cl] Chemical compound [Na].[Cl] DPDMMXDBJGCCQC-UHFFFAOYSA-N 0.000 description 1
- 238000011481 absorbance measurement Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010050181 aleurone Proteins 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- 150000004996 alkyl benzenes Chemical class 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 101150078331 ama-1 gene Proteins 0.000 description 1
- 101150069003 amdS gene Proteins 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 239000003945 anionic surfactant Substances 0.000 description 1
- 230000003373 anti-fouling effect Effects 0.000 description 1
- 230000000433 anti-nutritional effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- JXLHNMVSKXFWAO-UHFFFAOYSA-N azane;7-fluoro-2,1,3-benzoxadiazole-4-sulfonic acid Chemical compound N.OS(=O)(=O)C1=CC=C(F)C2=NON=C12 JXLHNMVSKXFWAO-UHFFFAOYSA-N 0.000 description 1
- QLULGSLAHXLKSR-UHFFFAOYSA-N azane;phosphane Chemical compound N.P QLULGSLAHXLKSR-UHFFFAOYSA-N 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 229940077388 benzenesulfonate Drugs 0.000 description 1
- 108010055059 beta-Mannosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000005282 brightening Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- FYGDTMLNYKFZSV-ZWSAEMDYSA-N cellotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-ZWSAEMDYSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011284 combination treatment Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 235000019628 coolness Nutrition 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 108010005400 cutinase Proteins 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000010612 desalination reaction Methods 0.000 description 1
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002478 diastatic effect Effects 0.000 description 1
- GSPKZYJPUDYKPI-UHFFFAOYSA-N diethoxy sulfate Chemical compound CCOOS(=O)(=O)OOCC GSPKZYJPUDYKPI-UHFFFAOYSA-N 0.000 description 1
- FFYPMLJYZAEMQB-UHFFFAOYSA-N diethyl pyrocarbonate Chemical compound CCOC(=O)OC(=O)OCC FFYPMLJYZAEMQB-UHFFFAOYSA-N 0.000 description 1
- HNPSIPDUKPIQMN-UHFFFAOYSA-N dioxosilane;oxo(oxoalumanyloxy)alumane Chemical compound O=[Si]=O.O=[Al]O[Al]=O HNPSIPDUKPIQMN-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000004851 dishwashing Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- GMSCBRSQMRDRCD-UHFFFAOYSA-N dodecyl 2-methylprop-2-enoate Chemical compound CCCCCCCCCCCCOC(=O)C(C)=C GMSCBRSQMRDRCD-UHFFFAOYSA-N 0.000 description 1
- 230000035620 dolor Effects 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000010410 dusting Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092413 endoglucanase V Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 230000001076 estrogenic effect Effects 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 108010000165 exo-1,3-alpha-glucanase Proteins 0.000 description 1
- 230000028023 exocytosis Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000000675 fabric finishing Substances 0.000 description 1
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009962 finishing (textile) Methods 0.000 description 1
- 238000005243 fluidization Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 239000002816 fuel additive Substances 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 1
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 1
- 150000002303 glucose derivatives Chemical class 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 150000008131 glucosides Chemical class 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 150000002337 glycosamines Chemical class 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010019407 glycyl-arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 108010002430 hemicellulase Proteins 0.000 description 1
- 229940059442 hemicellulase Drugs 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000000413 hydrolysate Substances 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 239000003752 hydrotrope Substances 0.000 description 1
- 230000003165 hydrotropic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 238000010813 internal standard method Methods 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 235000019626 lipase activity Nutrition 0.000 description 1
- 230000002366 lipolytic effect Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000000442 meristematic effect Effects 0.000 description 1
- 108010003855 mesentericopeptidase Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000005497 microtitration Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 229920000847 nonoxynol Polymers 0.000 description 1
- SNQQPOLDUKLAAF-UHFFFAOYSA-N nonylphenol Chemical compound CCCCCCCCCC1=CC=CC=C1O SNQQPOLDUKLAAF-UHFFFAOYSA-N 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000010893 paper waste Substances 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 239000006072 paste Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 229960003330 pentetic acid Drugs 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- MXVIRUOHPRXGTG-UHFFFAOYSA-N phenylboronic acid Chemical class OB(O)C1=CC=CC=C1.OB(O)C1=CC=CC=C1 MXVIRUOHPRXGTG-UHFFFAOYSA-N 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 150000003008 phosphonic acid esters Chemical class 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 229920006393 polyether sulfone Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 108060006613 prolamin Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000007873 sieving Methods 0.000 description 1
- 235000021309 simple sugar Nutrition 0.000 description 1
- RYMZZMVNJRMUDD-HGQWONQESA-N simvastatin Chemical compound C([C@H]1[C@@H](C)C=CC2=C[C@H](C)C[C@@H]([C@H]12)OC(=O)C(C)(C)CC)C[C@@H]1C[C@@H](O)CC(=O)O1 RYMZZMVNJRMUDD-HGQWONQESA-N 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- QUCDWLYKDRVKMI-UHFFFAOYSA-M sodium;3,4-dimethylbenzenesulfonate Chemical compound [Na+].CC1=CC=C(S([O-])(=O)=O)C=C1C QUCDWLYKDRVKMI-UHFFFAOYSA-M 0.000 description 1
- MWNQXXOSWHCCOZ-UHFFFAOYSA-L sodium;oxido carbonate Chemical compound [Na+].[O-]OC([O-])=O MWNQXXOSWHCCOZ-UHFFFAOYSA-L 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 235000013599 spices Nutrition 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000003019 stabilising effect Effects 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 150000003457 sulfones Chemical class 0.000 description 1
- 229910021653 sulphate ion Inorganic materials 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- 108010075550 termamyl Proteins 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 229960002203 tilactase Drugs 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229950010121 ufenamate Drugs 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000005418 vegetable material Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 239000010457 zeolite Substances 0.000 description 1
- 239000004711 α-olefin Substances 0.000 description 1
- 150000008498 β-D-glucosides Chemical class 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11D—DETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
- C11D3/00—Other compounding ingredients of detergent compositions covered in group C11D1/00
- C11D3/16—Organic compounds
- C11D3/38—Products with no well-defined composition, e.g. natural products
- C11D3/386—Preparations containing enzymes, e.g. protease or amylase
- C11D3/38636—Preparations containing enzymes, e.g. protease or amylase containing enzymes other than protease, amylase, lipase, cellulase, oxidase or reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8245—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
- C12N15/8246—Non-starch polysaccharides, e.g. cellulose, fructans, levans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01004—Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
Abstract
本发明涉及具有内切葡聚糖酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于制备和使用所述多肽的方法。
Description
对于在联邦资助的研究和开发下所进行发明的权利声明
本发明依据能源部(Department of Energy)授予的基本合同(Prime Contract)DE-AC36-98GO10337、NREL转包合同(Subcontract)No.ZCO-30017-02在政府支持下完成。政府对本发明具有一定的权利。
发明背景
发明领域
本发明涉及具有内切葡聚糖酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法。
相关领域描述
纤维素是单糖葡萄糖通过β-1,4-键共价连接的聚合物。许多微生物产生水解β-连接的聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(opening it)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖水解酶I是1,4-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)活性,其催化纤维素、cellotetriose或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解,从链的还原性末端释放纤维二糖。纤维二糖水解酶II是1,4-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)活性,其催化纤维素、cellotetriose或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解,从链的非还原性末端释放纤维二糖。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将纤维素原料转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的愿望,和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖将容易地由酵母发酵成乙醇。
Kvesitadaze et al.,1995,Applied Biochemistry and Biotechnology 50:137-143描述了来自土生梭孢霉(Thielavia terrestris)嗜热突变菌株的热稳定内切葡聚糖酶的分离和性质。Gilbert et al.,1992,Bioresource Technology 39:147-154描述了对土生梭孢霉255B的纤维素体系中存在的酶的表征。Breuil etal.,1986,Biotechnology Letters 8:673-676描述了来自土生梭孢霉菌株C464和NRRL 8126的纤维素酶和β-葡糖苷酶的产生和定位。
本领域中有利的是鉴定新的具有改进性质的内切葡聚糖酶,例如改进的水解速率、更好的热稳定性、对木质素的吸附减少,和除水解纤维素之外水解生物质的非纤维素成分例如半纤维素的能力。对半纤维素具有广泛副活性(side activity)的内切葡聚糖酶能够特别有益于改进复杂的、富含半纤维素的生物质底物的总水解产率。
本发明的目的是提供改进的具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸。
发明概述
本发明涉及具有内切葡聚糖酶活性的分离的多肽,所述多肽选自下组:
(a)多肽,其包含与SEQ ID NO:2的成熟多肽编码序列具有至少60%同一性的氨基酸序列;
(b)多肽,其由在至少中严紧条件下与以下序列杂交的核苷酸序列编码:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和
(c)SEQ ID NO:2的成熟多肽包含一个或多个氨基酸的保守取代、缺失和/或插入的变体。
本发明还涉及分离的多核苷酸,其编码具有内切葡聚糖酶活性的多肽,所述多核苷酸选自下组:
(a)多核苷酸,其编码的多肽包含与SEQ ID NO:2的成熟多肽具有至少60%同一性的氨基酸序列;
(b)多核苷酸,其与SEQ ID NO:1的成熟多肽编码序列具有至少60%同一性;和
(c)多核苷酸,其在至少低严紧条件下与以下序列杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链。
在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸18至336。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸52至1008。
本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体和重组宿主细胞。
本发明还涉及用于产生这些具有内切葡聚糖酶活性的多肽的方法,其包括:(a)在有益于产生该多肽的条件下培养包含核酸构建体的重组宿主细胞,所述核酸构建体包含编码所述多肽的多核苷酸;和(b)回收所述多肽。
本发明还涉及在洗涤剂中和在纤维素到葡萄糖的转化中使用具有内切葡聚糖酶活性的多肽的方法。
本发明进一步涉及包含编码蛋白质的基因的核酸构建体,其中将所述基因可操作地连接于编码信号肽的核苷酸序列,该信号肽包含SEQ ID NO:2的氨基酸1至17或由SEQ ID NO:2的氨基酸1至17组成,其中所述基因对于所述核苷酸序列是外源的。
附图简述
图1A和1B显示土生梭孢霉NRRL 8126内切葡聚糖酶(CEL7F)的cDNA序列和推导的氨基酸序列(分别为SEQ ID NO:1和2)。
图2显示pTter7F的限制图谱。
图3显示pAlLo1的限制图谱。
图4显示pBANe10的限制图谱。
图5显示pAlLo2的限制图谱。
图6显示pAlLo22的限制图谱。
图7显示在pH 5.5和60℃水解2小时之后,β-葡聚糖(1%w/v)的相对转化率。
图8显示在pH 5.5和60℃水解24小时之后,β-葡聚糖(1%w/v)的相对转化率。
定义
内切葡聚糖酶活性:术语“内切葡聚糖酶活性”在本文中定义为内-1,4-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan 4-glucanohydrolase)(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1,4-β-D-糖苷键、混合的β-1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖中的β-1,4键和含有纤维素成分的其它植物材料的内水解(endohydrolysis)。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法,使用羧甲基纤维素(CMC)水解来测定内切葡聚糖酶活性。将一单位的内切葡聚糖酶活性定义为:在50℃、pH 4.8,每分钟产生1.0微摩尔还原糖。
在优选的方面,具有内切葡聚糖酶活性的本发明的多肽还对选自下组的一种或多种底物具有酶活性:木聚糖、木葡聚糖、阿拉伯木聚糖、半乳聚糖、半乳甘露聚糖、葡聚糖和壳多糖。将具有内切葡聚糖酶活性的多肽对于这些多糖底物的活性测定为:将所述底物(5g每升)与本发明的具有内切葡聚糖酶活性的多肽(1mg蛋白质每g底物)一起在pH 5.0(50mM乙酸钠)和50℃无搅拌温育1和92小时之后,从不同AZCL染色的底物释放的染料的相对量。通过测量590nm的吸光度测定染料的释放。
在更优选的方面,具有内切葡聚糖酶活性的本发明的多肽进一步对木聚糖具有酶活性。在另外的更优选的方面,具有内切葡聚糖酶活性的本发明的多肽进一步对木葡聚糖具有酶活性。在另外的更优选的方面,具有内切葡聚糖酶活性的本发明的多肽进一步对阿拉伯木聚糖具有酶活性。在另外的更优选的方面,具有内切葡聚糖酶活性的本发明的多肽进一步对半乳聚糖具有酶活性。在另外的更优选的方面,具有内切葡聚糖酶活性的本发明的多肽进一步对半乳甘露聚糖具有酶活性。在另外的更优选的方面,具有内切葡聚糖酶活性的本发明的多肽进一步对葡聚糖具有酶活性。在另外的更优选的方面,具有内切葡聚糖酶活性的本发明的多肽进一步对壳多糖具有酶活性。在另外的更优选的方面,具有内切葡聚糖酶活性的本发明的多肽进一步对木聚糖、木葡聚糖、阿拉伯木聚糖、半乳聚糖、半乳甘露聚糖、葡聚糖和壳多糖具有酶活性。
本发明的多肽具有的内切葡聚糖酶活性是由SEQ ID NO:2的氨基酸18至336所示氨基酸序列组成的多肽的内切葡聚糖酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。
家族7糖苷水解酶或家族GH7:术语“家族7糖苷水解酶”或“家族GH7”或“CEL7F”在本文中定义为根据Henrissat B.,1991,A classification of glycosylhydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,和Henrissat B.,and Bairoch A.,1996,Updating the sequence-based classificationof glycosyl hydrolases,Biochem.J.316:695-696属于糖苷水解酶家族7的多肽。
分离的多肽:术语“分离的多肽”用于本文中指,如通过SDS-PAGE测定的,其为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多肽。
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。
本发明的多肽优选是基本上纯的形式。具体而言,优选所述多肽是“基本上(essentially)纯的形式”,即,所述多肽制备物基本上(essentially)不含与其天然结合的其它多肽材料。这能够通过以下方法实现,例如,通过公知的重组方法或由经典纯化方法制备多肽。
在本文中,术语“基本上纯的多肽”与术语“分离的多肽”和“分离形式的多肽”同义。
成熟多肽:术语“成熟多肽”在本文中定义为具有内切葡聚糖酶活性的多肽,所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在,所述修饰例如N-末端加工、C-末端截断、糖基化等。
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度通过Clustal方法(Higgins,1989,CABIOS 5:151-153)使用LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)来测定,使用同一性表和以下多重比对参数:缺口罚分(gap penalty)10和缺口长度罚分(gap length penalty)10。配对比对参数是K元组(Ktuple)=1,缺口罚分=3,窗口(windows)=5,并且对角线(diagonals)=5。
就本发明而言,两个核苷酸序列之间的同一性程度通过Wilbur-Lipman方法(Wilbur and Lipman,1983,Proceedings of the National Academy of ScienceUSA 80:726-730)使用LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)来测定,使用同一性表和以下多重比对参数:缺口罚分10和缺口长度罚分10。配对比对参数是K元组=3,缺口罚分=3,和窗口=20。
多肽片段:术语“多肽片段”在本文中定义为从SEQ ID NO:2的氨基和/或羧基末端缺失一个或多个氨基酸的多肽,或其同源序列;其中所述片段具有内切葡聚糖酶活性。优选地,片段含有至少270个氨基酸残基,更优选至少285个氨基酸残基,并且最优选至少300个氨基酸残基,例如,SEQ ID NO:2的氨基酸18至336。
亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1的5’和/或3’端缺失一个或多个核苷酸的核苷酸序列,或其同源序列;其中所述亚序列编码具有内切葡聚糖酶活性的多肽片段。优选地,亚序列含有至少810个核苷酸,更优选至少855个核苷酸,并且最优选至少900个核苷酸。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸:术语“分离的多核苷酸”用于本文中指,如通过琼脂糖电泳测定的,其为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多核苷酸。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式。具体而言,优选在本文公开的多核苷酸是“基本上(essentially)纯的形式”,即,所述多核苷酸制备物基本上不含与其天然结合的其它多核苷酸材料。在本文中,术语“基本上纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”同义。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为核苷酸序列,其编码具有内切葡聚糖酶活性的成熟多肽。
cDNA:术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(nototherwise exist)自然界中的方式修饰以含有核酸的片段。当所述核酸构建体含有本发明的编码序列表达所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的或有利的所有成分。各种调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各种调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的合适位置,使得调控序列指导多肽编码序列的表达。
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA或重组核苷酸序列。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。
修饰:术语“修饰”在本文的意思是,对由SEQ ID NO:2的成熟多肽或其同源序列组成的多肽的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或多个氨基酸的取代、缺失和/或插入,以及一个或多个氨基酸侧链的置换。
人工变体:当用在本文时,术语“人工变体”的意思是具有内切葡聚糖酶活性的多肽,所述多肽由表达SEQ ID NO:1或其同源序列的修饰的核苷酸序列或其成熟编码区的生物体产生。所述修饰的核苷酸序列通过人为干预(human intervention),通过修饰公开于SEQ ID NO:1或其同源序列的核苷酸序列或其成熟编码区来获得。
发明详述
具有内切葡聚糖酶活性的多肽
在第一个方面,本发明涉及包含下述氨基酸序列的分离的多肽,所述氨基酸序列与SEQ ID NO:2的成熟多肽具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少97%、98%或99%的同一性程度,所述多肽具有内切葡聚糖酶活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽具有的氨基酸序列与SEQ ID NO:2的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
本发明的多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体;或其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:2的氨基酸序列。在另外的优选方面,多肽包含SEQ ID NO:2的成熟多肽。在另外的优选方面,多肽包含SEQ ID NO:2的氨基酸18至336,或其等位变体;或其具有内切葡聚糖酶活性的片段。在另外的优选方面,多肽包含SEQ ID NO:2的氨基酸18至336。在另外的优选方面,多肽由SEQ ID NO:2的氨基酸序列或其等位变体组成;或由其具有内切葡聚糖酶活性的片段组成。在另外的优选方面,多肽由SEQ ID NO:2的氨基酸序列组成。在另外的优选方面,多肽由SEQ ID NO:2的成熟多肽组成。在另外的优选方面,多肽由SEQ ID NO:2的氨基酸18至335或其等位变体组成;或由其具有内切葡聚糖酶活性的片段组成。在另外的优选方面,多肽由SEQ ID NO:2的氨基酸18至336组成。
在第二个方面,本发明涉及具有内切葡聚糖酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下序列杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的互补链(J.Sambrook,E.F.Fritsch,and T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,2dedition,Cold Spring Harbor,New York)。SEQ ID NO:1的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶活性的多肽片段。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸52至1008。
SEQ ID NO:1的核苷酸序列或其亚序列,以及SEQ ID NO:2的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码具有内切葡聚糖酶活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针长度上可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。将这些探针包含于本发明中。
因而,可从由这些其它生物体制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有内切葡聚糖酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1或其亚序列同源的克隆或DNA,将所述载体材料用在Sounthern印迹中。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:1所示的核苷酸序列、包含SEQ ID NO:1的基因组DNA序列、它的互补链或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与核酸探针杂交的分子。
在优选的方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另外的优选方面,核酸探针是SEQ ID NO:1的核苷酸52至1008。在另外的优选方面,核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另外的优选方面,核酸探针是SEQ ID NO:1。在另外的优选方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另外的优选方面,核酸探针是包含在大肠杆菌NRRL B-30837中的质粒pTter7F中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有脂肪酶活性的多肽。在另外的优选方面,核酸探针是包含在大肠杆菌NRRL B-30837中的质粒pTter7F中含有的成熟多肽编码序列。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2%SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比根据Bolton和McCarthy计算法(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasicphosphate),0.1mM ATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6×SSC加0.1%SDS中洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度下洗涤两次,每次15分钟。
在第三个方面,本发明涉及人工变体,所述人工变体包含保守取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2或其同源序列;或其成熟多肽。优选氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能(例如多组氨酸序列(poly histidine tract)、抗原表位(antigenic epitope)或结合域(binding domain))来促进纯化的小延伸。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20个基本氨基酸,非基本氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham and Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,内切葡聚糖酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton et al.,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如de Vos et al.,1992,Science 255:306-312;Smith et al.,1992,J.Mol.Biol.224:899-904;Wlodaver etal.,1992,FEBS Lett.309:59-64。必需氨基酸的同一性也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson and Sauer,1988,Science 241:53-57;Bowieand Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625公开的那些方法来进行并测试单个或多个氨基酸取代。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman et al.,1991,Biochem.30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向的诱变(Derbyshire et al.,1986,Gene 46:145;Ner et al.,1988,DNA 7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness et al.,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。
SEQ ID NO:2的成熟多肽例如SEQ ID NO:2的氨基酸18至336的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
具有内切葡聚糖酶活性的多肽的来源
本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。
本发明的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽例如芽孢杆菌属(Bacillus)多肽,例如具有内切葡聚糖酶活性的嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽;或具有内切葡聚糖酶活性的链霉菌属(Streptomyces)多肽,例如,具有内切葡聚糖酶活性的浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)多肽;或革兰氏阴性细菌多肽,例如,具有内切葡聚糖酶活性的大肠杆菌或假单胞菌属菌种(Pseudomonas sp.)多肽。
本发明的多肽也可以是真菌多肽,并且更优选酵母多肽例如具有内切葡聚糖酶活性的念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选丝状真菌多肽例如具有内切葡聚糖酶活性的枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、Magnaporthe、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、Piromyces、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、Tolypocladium或木霉属(Trichoderma)多肽。
在优选的方面,所述多肽是具有内切葡聚糖酶活性的卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽。
在另外的优选方面,所述多肽是具有内切葡聚糖酶活性的棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichoderma viride)多肽。
在另外的优选方面,所述多肽是具有内切葡聚糖酶活性的Thielaviaachromatica、Thielavia albomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、Thielavia microspora、Thielavia ovispora、Thielavia peruviana、瘤孢梭孢壳(Thielavia spededonium)、毛梭孢壳(Thielavia setosa)、Thielaviasubthermophila、土生梭孢霉、Thielavia terricola、Thielavia thermophila、Thielavia variospora或Thielavia wareingii多肽。
在更优选的方面,所述多肽是具有内切葡聚糖酶活性的土生梭孢霉多肽,并且最优选是具有内切葡聚糖酶活性的土生梭孢霉NRRL 8126多肽,例如SEQ ID NO:2的多肽或其成熟多肽。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),无论它们已知的种名。本领域熟练技术人员将轻易地识别适合的等同物的同一性。
这些种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook et al.,1989,见上文)。
本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一种多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。
多核苷酸
本发明还涉及分离的多核苷酸,其包含编码具有内切葡聚糖酶活性的本发明的多肽的核苷酸序列,或由该核苷酸序列组成。
在优选的方面,核苷酸序列包含SEQ ID NO:1或由其组成。在另外的更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30837中所含质粒pTter7F中的序列,或由该序列其组成。在另外的优选方面,核苷酸序列包含SEQ ID NO:1的成熟多肽编码区或由其组成。在另外的优选方面,核苷酸序列包含SEQ IDNO:1的核苷酸52至1008或由其组成。在另外的更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30837中所含质粒pTter7F中的成熟多肽编码区或由其组成。本发明还包含编码下述多肽的核苷酸序列,所述多肽包含SEQ ID NO:2的氨基酸序列或其成熟多肽,或由SEQ ID NO:2的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:1或其成熟多肽编码序列。本发明还涉及SEQ ID NO:1的亚序列,所述亚序列编码具有内切葡聚糖酶活性的SEQ ID NO:2的片段。
本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQ ID NO:1的成熟多肽编码序列中包含至少一个突变,其中所述突变核苷酸序列编码SEQ IDNO:2的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸18至336。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis et al.,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其它核酸扩增方法,例如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从梭孢壳属(Thielavia)的菌株,或从其它或相关的生物体克隆多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。
本发明还涉及包含下述核苷酸序列的多核苷酸,所述核苷酸序列与SEQID NO:1的成熟多肽编码序列具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,甚至更优选至少95%,并且最优选至少97%同一性的同一性程度,所述多核苷酸编码活性多肽。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸52至1008。
修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可能是必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方面不同的人工变体。可以在作为SEQID NO:1的多肽编码区存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列:所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford et al.,1991,Protein Expression and Purification 2:95-107。
对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,例如定位诱变或丙氨酸分区诱变法(参见,例如,Cunninghamand Wells,1989,Science 244:1081-1085)来鉴定。在后一的技术中,将突变引入到分子中的每个正电残基处,并且测试所得突变分子的内切葡聚糖酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,de Vos et al.,1992,Science 255:306-312;Smith etal.,1992,Journal of Molecular Biology 224:899-904;Wlodaver et al.,1992,FEBS Letters 309:59-64)。
本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严紧条件下,优选低严紧条件,更优选中等严紧条件,更优选中-高严紧条件,甚至更优选高严紧条件,并且最优选非常高的严紧条件下,与以下序列杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;或它们的等位变体和亚序列(Sambrook et al.,1989,见上文),如本文所定义的。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸52至1008。
本发明还涉及分离的多核苷酸,所述分离的多核苷酸通过以下方法获得:(a)在非常低、低、中、中-高、高或非常高严紧条件下,将DNA的群体与以下序列杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和(b)分离杂交的多核苷酸,其编码具有内切葡聚糖酶活性的多肽。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸52至1008。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是合适的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截断的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff et al.,1978,Proceedings of the National Academy of SciencesUSA 75:3727-3731),以及tac启动子(DeBoer et al.,1983,Proceedings of theNational Academy of Sciences USA 80:21-25)。另外的启动子在″Useful proteinsfrom recombinant bacteria″in Scientific American,1980,242:74-94中;和在Sambrook et al.,1989,见上文中有所描述。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截断的和杂合的启动子。
在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos et al.,1992,Yeast 8:423-488描述。
调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos et al.,1992,见上文描述。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo and Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相联的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列是异源的信号肽编码区。异源信号肽编码区在编码序列不天然地含有信号肽编码区时可能是必需的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码区可在本发明中使用。
对于细菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen and Palva,1993,Microbiological Reviews 57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。
在优选的方面,信号肽是SEQ ID NO:2的氨基酸1至17。在另外的优选方面,信号肽编码区是SEQ ID NO:1的核苷酸1至51,其编码SEQ ID NO:2的氨基酸1至17。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码区由Romanos et al.,1992,见上文,描述。
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化成成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码区。
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(next to)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在合适的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与合适的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
本发明的载体优选地含有一个或多个选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应该优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems et al.,1991,Gene 98:61-67;Cullen et al.,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或包括与多核苷酸一起的可扩增的选择性标记基因,其中细胞含有选择性标记基因的扩增的拷贝,并且由此可通过在合适的选择剂(selectable agent)存在下培养细胞来选择多核苷酸的额外拷贝。
用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook et al.,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,所述重组宿主细胞包含本发明的多核苷酸,将其有利地用于多肽的重组产生中。将包含本发明多核苷酸的载体引入宿主细胞中,从而将该载体保留作为染色体整合体(chromosomal integrant)或作为前述的自复制的染色体外载体。术语“宿主细胞”包含亲本细胞的任何子代,其由于复制过程中发生的突变而与亲本细胞不相同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。
宿主细胞可以是单细胞微生物,例如,原核生物,或非单细胞微生物,例如,真核生物。
有用的单细胞微生物是细菌细胞,例如革兰氏阳性细菌,包括但不限于,芽孢杆菌属细胞,例如,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌;或链霉菌属细胞,例如,浅青紫链霉菌和鼠灰链霉菌,或革兰氏阴性细菌例如大肠杆菌和假单胞菌属菌种。在优选的方面,细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另外优选的方面,芽孢杆菌属细胞是嗜碱的芽孢杆菌属。
可通过如下方法实现将载体引入到细菌宿主细胞:例如原生质体转化(参见,例如,Chang and Cohen,1979,Molecular General Genetics 168:111-115),使用感受态细胞(参见,例如,Young and Spizizen,1961,Journal of Bacteriology81:823-829或Dubnau and Davidoff-Abelson,1971,Journal of MolecularBiology 56:209-221),电穿孔(参见,例如,Shigekawa and Dower,1988,Biotechniques 6:742-751)或接合(参见,例如,Koehler and Thorne,1987,Journalof Bacteriology 169:5771-5278)。
宿主细胞还可以是真核生物,例如哺乳动物、昆虫、植物或真菌细胞。
在优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth et al.,In,Ainsworth and Bisby’sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK所定义)以及卵菌门(Oomycota)(如Hawksworth et al.,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworthetal.,1995,见上)。
在更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在更加优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。
在最优选的方面,酵母宿主细胞是卡尔酵母,酿酒酵母,糖化酵母,道格拉氏酵母,克鲁弗酵母,诺地酵母或卵形酵母细胞。在另外最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另外最优选的方面,酵母宿主细胞是Yarrowia lipolytica细胞。
在另外更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth et al.,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、Ceriporiopsis、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属(Magnaporthe)、毛霉属、毁丝霉属、新考玛脂霉属(Neocallimastix)、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属细胞。
在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另外的最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另外最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、Ceriporiopsis aneirina、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、辐射射脉菌(Phlebia radiata)、Pleurotus eryngii、Thielaviaachromatica、Thielavia albomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、Thielavia microspora、Thielavia ovispora、Thielavia peruviana、瘤孢梭孢壳、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、Thielaviaterricola、Thielavia thermophila、Thielavia variospora、Thielavia wareingii、Trametes villosa、Trametes versicolor、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton et al.,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier et al.,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito et al.,1983,Journal of Bacteriology 153:163;和Hinnen et al.,1978,Proceedings of theNational Academy of Sciences USA 75:1920。
产生方法
本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收所述多肽。在优选的方面,所述细胞是梭孢壳属的细胞。在更优选的方面,所述细胞是土生梭孢霉。在最优选的方面,所述细胞是土生梭孢霉NRRL8126。
本发明还涉及用于产生本发明的多肽的方法,其包括:(a)在有益于产生多肽的条件下培养宿主细胞;和(b)回收所述多肽。
本发明还涉及用于产生本发明的多肽的方法,包括:(a)在有益于产生多肽的条件下培养宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQID NO:1的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码由SEQ ID NO:2的成熟多肽组成的多肽,和(b)回收所述多肽。在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸18至336。
在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的成分制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzyme assay)可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Jansonand Lars Ryden,editors,VCH Publishers,New York,1989)。
植物
本发明还涉及转基因植物、植物部分或植物细胞,将其用编码本发明的具有内切葡聚糖酶活性的多肽的核苷酸序列转化,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheological properties),或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperate grass),如Agrostis;和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧密相关的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyma)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。
表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码本发明多肽的一个或多个表达构建体并入植物宿主基因组或叶绿体基因组,并且繁殖所得的修饰植物或植物细胞成为转基因植物或植物细胞。
表达载体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸序列所必需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定宿主细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague et al.,1988,Plant Physiology 86:506所述。
对于组成性表达,可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck et al.,1980,Cell 21:285-294,Christensen et al.,1992,Plant Mo.Biol.18:675-689;Zhang et al.,1991,Plant Cell 3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards & Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito et al.,1994,PlantMol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,Plant and Cell Physiology 39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal ofPlant Physiology 152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子,或本技术领域公知的任何其他种子特异性的启动子,例如,在WO 91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000),小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,Plant Molecular Biology26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular andgeneral genetics 248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,Plant Molecular Biology 22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源应用的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisic acid)、赤霉酸(gibberellic acid)和/或重金属。
启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,将其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu et al.,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser et al.,1990,Science244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto et al.,1989,Nature338:274)。
目前,根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15-38),而且它也可以用于转化单子叶植物,虽然对于这些植物其他的转化方法是常用的。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developing embryos)(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current OpinionBiotechnology 5:158-162;Vasil et al.,1992,Bio/Technology 10:667-674)。转化单子叶植物的可供选择的方法,是基于原生质体转化,如由Omirulleh等,1993,Plant Molecular Biology 21:415-428所描述的。
转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有益于产生多肽的条件下培养转基因植物或植物细胞,其包含编码本发明具有内切葡聚糖酶活性的多肽的多核苷酸;和(b)回收所述多肽。
去除或减少内切葡聚糖酶活性
本发明还涉及用于产生亲本细胞突变体的方法,其包含破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。
可以使用本领域熟知的方法通过减少或消除编码本发明多肽的核苷酸序列的表达,例如,插入、破坏、取代或缺失来构建突变细胞。在优选的方面,所述核苷酸序列是失活的。待修饰或失活的核苷酸序列可以是,例如,编码区或其对活性关键的部分,或表达编码区必需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响核苷酸序列表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。
可以通过向亲本细胞施以诱变,并且选择其中已将所述核苷酸序列的表达减少或消除的突变细胞来进行核苷酸序列的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,可以通过使用这些诱变剂的任何组合来进行诱变。
适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethyl methane sulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。
当使用这些试剂时,通常通过如下方法来进行所述诱变:在合适条件下存在优选的诱变剂时孵育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。
通过导入、取代,或去除基因中的一个或多个核苷酸或其转录或翻译所必需的调控元件可以实现所述核苷酸序列的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰核苷酸序列的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。
消除或减少核苷酸序列通过细胞表达的便利方法的例子是基于基因取代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷性的核苷酸序列,随后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性核苷酸序列。理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中核苷酸序列被修饰或破坏的转化子。在特别优选的方面,用可选择的标记,如本文所述的那些来破坏所述核苷酸序列。
或者,可以使用与所述核苷酸序列互补的序列通过确定的反义或RNAi技术来进行所述核苷酸序列的修饰或失活。更具体地,通过导入与所述基因的核苷酸序列互补的序列可以减少或消除所述核苷酸序列通过细胞的表达,所述序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许所述互补反义核苷酸序列与mRNA杂交的条件下,由此减少或消除翻译的蛋白质的量。
本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的核苷酸序列或其调控序列的破坏或缺失,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。
这样生成的多肽缺陷型突变细胞作为表达同源和/或异源多肽的宿主细胞特别有用。所以,本发明进一步涉及生产同源或异源多肽的方法,其包括:(a)在有益于生产多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然蛋白,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然蛋白。
在另一方面,本发明涉及通过发酵可产生本发明的多肽以及目标蛋白产物的细胞来生产基本上无内切葡聚糖酶活性的蛋白质产品的方法:在发酵之前、之中,或发酵完成之后向发酵液(fermentation broth)中添加有效量的能够抑制内切葡聚糖酶活性的试剂,从发酵液中回收目标产物,并且任选地将回收的产物进行进一步纯化。
在另一方面,本发明涉及如下生产基本上无内切葡聚糖酶活性的蛋白质产品的方法:在允许产物表达的条件下培养细胞,将得到的培养液进行组合的pH和温度处理以基本上减少内切葡聚糖酶活性,和从发酵液中回收产物。或者,可以将从培养液回收的酶制备物进行组合的pH和温度处理。所述组合的pH和温度处理可任选地与内切葡聚糖酶抑制剂处理组合使用。
依照本发明的这个方面,可能去除至少60%,优选至少75%,更优选至少85%,还更优选至少95%,并且最优选至少99%的内切葡聚糖酶活性。可使用此方法获得内切葡聚糖酶活性的完全去除。
组合的pH和温度处理优选在2-3或10-11范围内的pH和至少75-85℃范围内的温度进行一段足够的时间以达到期望的效果,通常1至3小时是足够的。
用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。
用于产生基本上无内切葡聚糖酶产物的本发明的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。所述酶可以选自,例如,淀粉分解酶(amylolytic enzyme)、脂肪分解酶、蛋白水解酶、纤维素分解酶(cellulolytic enzyme)、氧化还原酶或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶(chitinase)、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、卤素过氧化酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。内切葡聚糖酶缺陷细胞也可以用于表达在制药上引起兴趣的异源蛋白质例如激素、生长因子、受体等。
可理解的是术语“真核多肽”不仅包括天然多肽,也包括多肽例如酶,其通过氨基酸取代、缺失或添加修饰,或通过其它这样的修饰以增强活性、热稳定性、pH耐受性等。
在另外的方面,本发明涉及基本上无内切葡聚糖酶活性的蛋白质产物,其通过本发明的方法产生。
组合物
本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的内切葡聚糖酶活性,例如,以至少1.1的富集因数(enrichment factor)增加。
所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属或种的微生物产生:曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。
可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以将包括于所述组合物中的多肽依照本领域内已知方法稳定。
以下提供的实施例是本发明多肽组合物的优选的用途。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法决定。
用途
本发明还涉及使用具有内切葡聚糖酶活性的多肽或其组合物的方法。
将生物质降解为单糖、二糖和多糖
本发明的具有内切葡聚糖酶活性的多肽和宿主细胞可用于产生单糖、二糖和多糖,它们作为来自生物质的化学或发酵原料用于产生乙醇、塑料或其它产品或中间物。具有内切葡聚糖酶活性的多肽可以是去除或不去除细胞的粗发酵液形式,或是半纯化或纯化的酶制剂形式。或者,本发明的宿主细胞可以在使用生物质的发酵方法中用作具有内切葡聚糖酶活性的多肽的来源。
生物质可以包括但不限于木材资源、城市固体废物、废纸和作物残余物(参见,例如Wiselogel et al.,1995,在Handbook on Bioethanol(编者Charles E.Wyman)中,第105-118页,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier et al.,1999,Recent Progress inBioconversion of Lignocellulosics,在Advances in BiochemicalEngineering/Biotechnology中,总编T.Scheper,第65卷,第23-40页,Springer-Verlag,New York)。
生物质初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过聚合木质素共价交联至半纤维素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是线性β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要作为平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。
将三种主要类别的糖水解酶(glycohydrolase)用于破坏纤维素生物质:
(1)“内切-1,4-β-葡聚糖酶”或1,4-β-D-葡聚糖-4-葡聚糖水解酶(EC3.2.1.4),其随机作用于可溶和不溶的1,4-β-葡聚糖底物。
(2)“外切-1,4-β-葡聚糖酶”包括1,4-β-D-葡聚糖葡糖水解酶(EC 3.2.1.74),其从1,4-β-D-葡聚糖释放D-葡萄糖并且缓慢水解D-纤维二糖;和纤维二糖水解酶(1,4-β-D-葡聚糖纤维二糖水解酶,EC 3.2.1.91),其从1,4-β-葡聚糖释放D-纤维二糖。
(3)“β-D-葡糖苷酶”或β-D-葡糖苷葡糖水解酶(EC 3.2.1.21),其作用于从纤维二糖和可溶的纤维糊精以及一系列糖苷释放D-葡萄糖单位。
这三个类别的酶一起协同地作用使来自生物质的天然纤维素有效解晶(decrystallization)和水解以产生还原糖。
本发明具有内切葡聚糖酶活性的多肽可以与上述酶一同使用以进一步降解生物质底物的纤维素成分(参见,例如,Brigham et al.,1995,在Handbook onBioethanol(编者Charles E.Wyman)中,第119-141页,Taylor & Francis,Washington D.C.;Lee,1997,Journal of Biotechnology 56:1-24)。
能够通过酶降解生物质并将释放的糖转化为乙醇来产生乙醇。这种乙醇通常称为生物乙醇或生物燃料。可将其以少于1%-多至100%(燃料替代品)的混合物作为燃料添加剂或补充剂(extender)使用。
洗涤剂(detergent)组合物
可以将本发明的具有内切葡聚糖酶活性的多肽添加至洗涤剂组合物,并且因此成为所述洗涤剂组合物的成分。
可以将本发明的洗涤剂组合物例如配制为手洗或机洗的洗涤剂组合物,包括适于预处理沾污织物的洗衣添加剂组合物和添加了漂洗剂的织物柔软剂组合物,或将其配制为用于通常家庭硬表面清理操作的洗涤剂组合物,或配制用于手洗或机洗的洗碟(dishwashing)操作。
在具体的方面,本发明提供包含本发明的具有内切葡聚糖酶活性的多肽的洗涤剂添加剂。所述洗涤剂添加剂以及洗涤剂组合物可以包含一个或多个其它酶,例如蛋白酶、脂肪酶、角质酶、淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶(arabinase)、半乳聚糖酶、木聚糖酶、氧化酶,例如,漆酶和/或过氧化物酶。
通常酶成分的性质应该与选择的洗涤剂相容(即,最适pH,与其它酶和非酶成分的相容性等),并且所述酶成分应该以有效量存在。
蛋白酶:合适的蛋白酶包括动物、植物或微生物来源的那些蛋白酶。微生物来源是优选的。其中包括化学修饰的或蛋白质工程化的突变体。所述蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的实例是枯草杆菌蛋白酶,特别是源自芽孢杆菌属的那些,例如,枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(在WO 89/06279中描述)。胰蛋白酶样蛋白酶的实例是胰蛋白酶(例如,猪或牛来源)和镰孢属蛋白酶,在WO 89/06270和WO 94/25583中描述。
有用的蛋白酶的实例是在WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中描述的变体,特别是在一个或多个以下位置具有取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
优选的商业上能够获得的蛋白酶包括AlcalaseTM、SavinaseTM、PrimaseTM、DuralaseTM、EsperaseTM和KannaseTM(Novozymes A/S)、MaxataseTM、MaxacalTM、MaxapemTM、ProperaseTM、PurafectTM、Purafect OxPTM、FN2TM和FN3TM(Genencor International Inc.)。
脂肪酶:合适的脂肪酶包括细菌或真菌来源的那些。包括化学修饰的或蛋白质工程化的突变体。有用的脂肪酶的实例包括来自如下的脂肪酶:腐质霉属(同物异名嗜热霉属(Thermomyces)),例如,来自疏棉状腐质霉(细毛嗜热霉(T.lanuginosus))如EP 258 068和EP 305 216中所述,或来自特异腐质霉如WO 96/13580中所述,假单胞菌属脂肪酶,例如,来自产碱假单胞菌(P.alcaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP 218 272)、洋葱假单胞菌(P.cepacia)(EP 331 376)、施氏假单胞菌(P.stutzeri)(GB 1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌属菌种(Pseudomonas sp.)菌株SD 705(WO95/06720和WO 96/27002)、P.wisconsinensis(WO 96/12012)、芽孢杆菌属脂肪酶,例如,来自枯草芽孢杆菌(Dartois et al.,1993,Biochemica etBiophysicaActa,1131,253-360)、嗜热脂肪芽孢杆菌(JP 64/744992)或短小芽孢杆菌(B.pumilus)(WO 91/16422)的脂肪酶。
其它实例是例如在WO 92/05249、WO 94/01541、EP 407 225、EP 260 105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202中描述的那些脂肪酶变体。
优选的商业上能够获得的脂肪酶包括LipolaseTM、LipexTM和LipolaseUltraTM(Novozymes A/S)。
淀粉酶:合适的淀粉酶(α和/或β)包括细菌和真菌来源的那些。包括化学修饰的或蛋白质工程化的变体。淀粉酶包括例如从芽孢杆菌属获得的α-淀粉酶,例如,地衣芽孢杆菌的特殊菌株,在GB 1,296,839中有更详细的描述。
有用的淀粉酶的实例是在WO 94/02597、WO 94/18314、WO 96/23873和WO 97/43424中描述的变体,特别在一个或多个以下位置具有取代的变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
商业上能够获得的淀粉酶是DuramylTM、TermamylTM、FungamylTM和BANTM(Novozymes A/S)、RapidaseTM和PurastarTM(来自Genencor InternationalInc.)。
纤维素酶:合适的纤维素酶包括细菌或真菌来源的那些。包括化学修饰或蛋白质工程的突变体。合适的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属或木霉属菌属的纤维素酶,例如,产生自特异腐质霉、嗜热毁丝霉和尖镰孢的真菌纤维素酶,其公开于美国专利号4,435,307、美国专利号5,648,263、美国专利号5,691,178、美国专利号5,776,757和WO 89/09259。
特别合适的纤维素酶是碱性或中性纤维素酶,其具有保护颜色的益处(colour care benefits)。这种纤维素酶的实例是在EP 0 495 257、EP 0 531 372、WO 96/11262、WO 96/29397、WO 98/08940中描述的纤维素酶。其它实例是纤维素酶变体,例如在WO 94/07998、EP 0 531 315、美国专利号5,457,046、美国专利号5,686,593、美国专利号5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299中描述的那些。
商业上能够获得的纤维素酶包括Celluclast、CelluzymeTM和CarezymeTM(Novozymes A/S)、ClazinaseTM和PuradaxHATM(Genencor International Inc.)和KAC-500(B)TM(Kao Corporation)。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌来源的那些。包括化学修饰或蛋白质工程的突变体。有用的过氧化物酶的实例包括来自鬼伞属的过氧化物酶,例如,来自灰盖鬼伞及其变体,如在WO93/24618、WO 95/10602和WO 98/15257中描述的那些。
商业上能够获得的过氧化物酶包括GuardzymeTM(Novozymes A/S)。
通过添加含有一种或多种酶的单独的添加剂,或通过添加包含所有这些酶的组合添加剂,可将酶成分包括在洗涤剂组合物中。可将本发明的洗涤剂添加剂(即单独的添加剂或组合的添加剂)配制成例如,颗粒、液体、浆等。优选的洗涤剂添加剂剂型是颗粒,具体为无粉尘(non-dusting)颗粒,液体,具体为稳定的液体,或浆。
例如,可以如美国专利号4,106,991和4,661,452中所公开的产生无粉尘颗粒,并且可以任选地通过本领域已知的方法包覆。蜡制包覆材料(waxy coatingmaterial)的实例是具有1000至20000的平均摩尔量的聚(环氧乙烷)产品(聚乙二醇,PEG);具有从16至50个的环氧乙烷单元的乙氧基化壬基酚;乙氧基化脂肪醇,其中醇含有从12至20个碳原子,并且其中具有15至80个环氧乙烷单元;脂肪醇;脂肪酸;和脂肪酸的单酸甘油酯和甘油二酯和甘油三酯。适合于流化床技术应用的成膜涂覆材料的实例提供于GB 1483591。例如,可根据已经建立的方法通过添加多元醇例如丙二醇、糖或糖醇、乳酸或硼酸来稳定液体酶制剂。可以根据公开于EP 238,216中的方法来制备保护酶。
本发明的洗涤剂组合物可以是任何方便的形式,例如,条、片剂、粉剂、颗粒、糊剂或液体。液体洗涤剂可以是含水的,通常含有多至70%的水和0-30%的有机溶剂,或非水的(non-aqueous)。
洗涤剂组合物包含一种或多种表面活性剂,其可以是非离子的,包括半极性的和/或阴离子的和/或阳离子的和/或两性离子的。所述表面活性剂通常以按重量计0.1%至60%的水平存在。
当包括于此时,所述洗涤剂将通常含有大约1%至大约40%的阴离子表面活性剂,例如线性烷基苯磺酸盐、α-烯烃磺酸酯(olefinsulfonate)、烷基硫酸盐(脂肪醇硫酸酯)、醇乙氧基硫酸盐(alcohol ethoxysulfate)、仲链烷磺酸盐(secondaryalkanesulfonate)、α-磺基脂肪酸甲酯、烷基-或烯基琥珀酸,或肥皂(soap)。
当包括于此时,洗涤剂将通常含有大约0.2%至大约40%的非离子表面活性剂,例如醇乙氧基化物、壬基苯酚乙氧基化物、烷基聚糖苷(alkylpolyglycoside)、烷基二甲基氧化胺(alkyldimethylamineoxide)、乙氧基化脂肪酸单乙醇酰胺(ethoxylated fatty acid monoethanolamide)、脂肪酸单乙醇酰胺、多羟基烷基脂肪酸酰胺或葡糖胺的N-酰基N-烷基衍生物(“葡糖酰胺(glucamide)”)。
洗涤剂可以含有0-65%的洗涤剂增清剂(builder)或复合剂例如沸石、二磷酸盐、三磷酸盐、膦酸酯(phosphonate)、碳酸盐(carbonate)、柠檬酸盐、氮川三乙酸(nitrilotriacetic acid)、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶硅酸盐或分层硅酸盐(例如来自Hoechst的SKS-6)。
洗涤剂可包含一种或多种聚合物。实例是羧甲基纤维素、聚(乙烯基吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯咪唑)、聚羧酸酯(polycarboxylates)例如聚丙烯酸酯(polyacrylates)、马来酸/丙烯酸共聚物和甲基丙烯酸月桂酯/丙烯酸共聚物。
洗涤剂可以含有漂白体系,其可以包含H2O2源例如过硼酸盐或过碳酸盐,其可以与形成过酸的漂白激活剂例如四乙酰乙二胺或壬酰氧苯磺酸酯(nonanoyloxybenzenesulfonate)组合。或者,漂白体系可以包含过氧酸,例如,酰胺、二酰亚胺(imide)或砜类型的过氧酸。
本发明的洗涤剂组合物的酶成分可以使用常规稳定剂稳定,例如,多元醇例如丙二醇或甘油、糖或糖醇、乳酸、硼酸或硼酸衍生物,例如,芳香硼酸酯,或苯基硼酸(phenyl boronic acid)衍生物例如4-甲酰苯基硼酸(4-formylphenylboronic acid),并可例如WO 92/19709和WO 92/19708中所述配制所述组合物。
洗涤剂还可以含有其它常规洗涤剂成分,例如,织物整理剂(fabricconditioner)包括粘土、泡沫促进剂、抑泡剂、防腐蚀剂、悬污剂、防污再沉积剂、染料、杀菌剂、光亮剂(optical brightener)、水溶助剂(hydrotrope)、晦暗抑制剂(tarnish inhibitors)或香料。
在洗涤剂组合物中的任何酶成分,特别是本发明的具有内切葡聚糖酶活性的多肽,可以按相当于每升洗涤液0.01-100mg酶蛋白,优选每升洗涤液0.05-5mg酶蛋白,特别是每升洗涤液0.1-1mg酶蛋白的量添加。
本发明的具有内切葡聚糖酶活性的多肽可以额外地并入公开于WO97/07202的洗涤剂配制物,WO 97/07202在本文中作为参考文献并入。
信号肽
本发明还涉及核酸构建体,所述核酸构建体包含编码蛋白质的基因,该基因与编码信号肽的核苷酸序列可操作地连接,所述信号肽包含SEQ ID NO:2的氨基酸1至17或由SEQ ID NO:2的氨基酸1至17组成,其允许蛋白质分泌到培养基中,其中所述基因对于该核苷酸序列是外源的。
在优选的方面,所述核苷酸序列包含SEQ ID NO:1的核苷酸1至51。在另外的优选方面,所述核苷酸序列由SEQ ID NO:1的核苷酸1至51组成。
本发明还涉及包含这种核酸构建体的重组表达载体和重组宿主细胞。
本发明还涉及用于产生蛋白质的方法,包括:(a)在适合于产生所述蛋白质的条件下培养这样的重组细胞;和(b)回收所述蛋白质。
所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此包含肽、寡肽和蛋白质。术语“蛋白质”还包含组合以形成编码产物的两种或两种以上多肽。所述蛋白质还包括杂合多肽,其包含部分或全部多肽序列的组合,所述多肽序列从至少两种不同的蛋白质获得,其中一个或多个对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质天然存在的等位基因变异和工程的变异。
优选蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报道蛋白(reporter)。在更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶。在更加优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
基因可以从任何原核、真核或其它来源获得。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
材料
作为缓冲液和底物使用的化学品是至少试剂等级的商业产品。
SDS-PAGE凝胶、上样缓冲液和电泳缓冲液获得自Invitrogen/Novex(Carlsbad,CA)。测序等级修饰的胰蛋白酶来自Princeton Separations(Aldelphia,NJ)。BioSafe Commassie Blue G250蛋白质染色剂(protein stain)获得自BioRadLaboratories(Hercules,CA)。
菌株
将米曲霉Jal250菌株(WO 99/61651)用于表达具有内切葡聚糖酶活性的土生梭孢霉多肽。将土生梭孢霉NRRL菌株8126用作具有内切葡聚糖酶活性的7F家族多肽(Family 7F polypeptide)的基因的来源。
培养基
PDA平板由每升39克马铃薯葡糖琼脂组成。
NNCYP培养基由如下物质组成:每升5.0g NH4NO3、0.5g MgSO4·7H2O、0.3g CaCl2、2.5g柠檬酸、1.0g细菌用蛋白胨(Bacto Peptone)、5.0g酵母提取物、1ml COVE痕量金属,和足够的K2HPO4以达到最终pH大约5.4。
NNCYPmod培养基由如下物质组成:每升1.0g NaCl、5.0g NH4NO3、0.2g MgSO4·7H2O、0.2g CaCl2、2.0g柠檬酸、1.0g细菌用蛋白胨、5.0g酵母提取物、1ml COVE痕量金属溶液,和足够的K2HPO4以达到最终pH大约5.4。
Cove痕量金属溶液由如下物质组成:每升0.04g Na2B4O7·10H2O、0.4gCuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O。
LB平板由如下物质组成:每升10g胰蛋白胨、5g酵母提取物、5g氯化钠和15g细菌用琼脂(Bacto Agar)。
MDU2BP培养基由下述物质组成:每升45g麦芽糖、1g MgSO4·7H2O、1g NaCl、2g K2HSO4、12g KH2PO4、2g尿素和500μl AMG痕量金属,将pH调节至5.0并且随后用0.22μm过滤装置过滤除菌。
AMG痕量金属由如下物质组成:每升14.3g ZnSO4·7H2O、2.5gCuSO4·5H2O、0.5g NiCl2·6H2O、13.8g FeSO4·7H2O、8.5g MnSO4·7H2O和3g柠檬酸。
SOC培养基由如下物质组成:2%胰蛋白胨、0.5%酵母提取物、10mMNaCl、2.5mM KCl、10mM MgCl2和10mM MgSO4;通过高压灭菌并且随后添加过滤除菌的葡萄糖至20mM。
冷冻培养基由60%SOC和40%甘油组成。
2X YT培养基由如下物质组成:每升16g胰蛋白胨、10g酵母提取物、5g NaCl和15g细菌用琼脂,通过高压灭菌。
实施例1:表达序列标签(EST)cDNA文库构建
将土生梭孢霉NRRL 8126在250ml摇瓶中补充1%葡萄糖的50mlNNCYPmod培养基中,在45℃、200rpm培养24小时。将来自所述24小时液体培养物的2ml等分试样用于接种500ml摇瓶,所述500ml摇瓶含有补无2%Sigmacell-20(Sigma Chemical Co.,St.Louis,MO)的100ml NNCYPmod培养基。将培养物在45℃、200rpm温育3天。通过过滤收获菌丝体,所述过滤通过具有玻璃纤维预过滤器的布氏漏斗(Buchner funnel)(Nalgene,Rochester NY)进行,将菌丝体用10mM Tris-HCl-1mM EDTA pH8(TE)洗涤两次,并且在液氮中快速冷冻。
使用如下方法分离总RNA。将土生梭孢霉NRRL 8126的冷冻菌丝体在电动咖啡研磨机中研磨。在50ml Falcon管中将研磨的材料与20ml Fenazol(Ambion,Inc.,Austin,TX)1∶1 v/v混合。一旦将菌丝体悬浮,使用氯仿提取并且使用苯酚-氯仿-异戊醇25∶24∶1 v/v/v的混合物提取三次。通过添加1/10体积的3M乙酸钠pH 5.2和1.25体积的异丙醇从所得水相沉淀RNA。通过在4℃ 12,000xg离心30分钟回收沉淀的RNA。将最终的沉淀用冷的70%乙醇洗涤,空气干燥,并且在500ml焦碳酸二乙酯处理的水(DEPC水)中重悬。
用Agilent Bioanalyzer 2100(Agilent Technologies,Inc.,Palo Alto,CA)评估纯化的RNA的质和量。将聚腺苷酸化mRNA从360μg总RNA中分离,所述分离借助Poly(A)Purist Magnetic Kit(Ambion,Inc.,Austin,TX)根据制造商的说明书进行。
为了产生cDNA文库,使用CloneMinerTM Kit(Invitrogen,Carlsbad,CA)来构建定向文库(directional library),其不需要使用限制酶克隆,因此降低嵌合克隆的数目和大小偏差(size bias)。
为了确保cDNA的第一链合成成功,平行进行具有两种不同浓度mRNA(2.2和4.4μg的聚(A)+mRNA)的两个反应。将mRNA样品与Biotin-attB2-Oligo(dt)引物(CloneMinerTM Kit,Invitrogen,Carlsbad,CA)、1X第一链缓冲液(Invitrogen,Carlsbad,CA)、2μl的0.1M二硫苏糖醇(DTT)、10mM各种dNTP和水分别混合至终体积18和16μl。将反应混合物小心地混合,随后添加2和4μl的SuperScriptTM反转录酶(Invitrogen,Carlsbad,CA),并且在45℃温育60分钟以合成第一互补链。
为了第二链的合成,向各个第一链反应添加30μl的5X第二链缓冲液(Invitrogen,Carlsbad,CA)、3μl的10mM各种dNTP、10单位大肠杆菌DNA连接酶(Invitrogen,Carlsbad,CA)、40单位大肠杆菌DNA聚合酶I(Invitrogen,Carlsbad,CA)和2单位大肠杆菌RNase H(Invitrogen,Carlsbad,CA)至总体积150μl。随后将混合物在16℃温育2小时。两小时温育之后,向各个反应添加2μl T4 DNA聚合酶(Invitrogen,Carlsbad,CA),并且在16℃温育5分钟以产生平端化的cDNA。使用苯酚-氯仿-异戊醇25∶24∶1 v/v/v的混合物提取cDNA反应物并且在20μg糖原、120μl 5M乙酸铵和660μl乙醇存在下沉淀。在4℃ 12,000xg离心30分钟之后,将cDNA沉淀用冷的70%乙醇洗涤,在真空中干燥2-3分钟,并且在18μl DEPC水中重悬。向各个重悬的cDNA样品中添加10μl 5X连接(adapted)缓冲液(Invitrogen,Carlsbad,CA)、10μg如下所示的attB1衔接头(adapter)(Invitrogen,Carlsbad,CA)、7μl 0.1 M DTT和5单位的T4 DNA连接酶(Invitrogen,Carlsbad,CA)。
attB1衔接头顶链(top strand):
5′-TCGTCGGGGACAACTTTGTACAAAAAAGTTGG-3′(SEQ ID NO:3)
attB1衔接头底链(bottom strand):
3′-CCCCTGTTGAAACATGTTTTTTCAACCp-5′(SEQ ID NO:4)
连接反应在16℃温育过夜。过量的衔接头通过在1ml SephacrylTM S-500HR树脂(Amersham Biosciences,Piscataway,NJ)中的大小排阻层析去除。根据CloneMinerTM Kit的说明书收集柱级分,并使用Agilent Bioanalyzer分析级分3至14以测定其中attB1衔接头开始洗脱的级分。这种分析显示衔接头在大约级分10或11开始洗脱。对于第一文库汇集级分6至11,而对于第二文库汇集级分4-11。
通过根据Gateway System规程(Invitrogen,Carlsbad,CA)的同源DNA重组,使用BP ClonaseTM(Invitrogen,Carlsbad,CA)作为重组酶来进行cDNA的克隆。每个BP ClonaseTM重组反应含有大约70ng的attB侧接的cDNA(attB-flanked-cDNA)、250ng pDONRTM222、2μl 5X BP ClonaseTM缓冲液、2μlTE缓冲液和3μl BP ClonaseTM。全部试剂获得自Invitrogen,Carlsbad,CA。将重组反应在25℃温育过夜。
随后将热失活的BP重组反应分成6个等分试样,并且使用BioRad GenePulser II(BioRad,Hercules,CA)用如下参数电穿孔入ElectroMaxTM DH10B电感受态细胞(Invitrogen,Carlsbad,CA)中:电压:2.0kV;电阻:200Ω;和电容25μF。将电穿孔的细胞在1ml SOC培养基中重悬,并且在37℃及200rpm的持续摇动下温育60分钟。温育期之后,汇集转化的细胞并且与冷冻培养基1∶1混合。将200μl等分试样取出用于文库滴定,并且随后将剩余的每种文库等分至1.8ml冷冻管(Wheaton Science Products,Millville,NJ)中,并在-80℃冷冻贮藏。
制备每个文库的四个系列的稀释物:1/100、1/1000、1/104、1/105。从每种稀释物将100μl涂布于补充50μg每ml卡那霉素的150mm LB平板上并且在37℃温育过夜。计数每个稀释平板上的菌落数目并且用于计算每个文库中转化体的总数。
显示第一文库具有540万独立克隆而第二文库显示具有900万独立克隆。
实施例2:模板制备和cDNA克隆的核苷酸测序
将来自两种文库的等分试样混合并且涂布到补充50μg每ml卡那霉素的25x25cm LB平板上。将单独克隆借助于Genetix QPix Robot(Genetix Inc.,Boston,MA)排列在96孔平板上,所述平板含有100μl补充50μg每ml卡那霉素的LB。从总共4320个单独克隆获得四十五个96孔平板。将平板在37℃以200rpm摇动温育过夜。温育过后,将100μl无菌的50%甘油添加至每个孔。将转化体借助96-针工具(Boekel,Feasterville,PA)复制到第二个深碟96孔微量培养平板(Advanced Genetic Technologies Corporation,Gaithersburg,MD)中,所述深碟96孔微量培养平板在每个孔中含有1ml补充50μg每ml卡那霉素的Magnificent BrothTM(MacConnell Research,San Diego,CA)。将原始的微量滴定板在-80℃冷冻贮藏。将第二深碟平板在旋转振荡器上以300rpm的剧烈搅拌于37℃温育过夜。为了避免溢出和交叉污染,并且使其充分通气,将每个第二培养平板用聚丙烯垫(Advanced Genetic Technologies Corporation,Gaithersburg,MD)和塑料微量滴定碟盖覆盖。使用MWG Robot-Smart 384(MWG Biotech Inc.,High Point,NC)和Montage Plasmid Miniprep Kits(Millipore,Billerica,MA)制备质粒DNA。
使用Big-DyeTM(Applied Biosystems,Inc.,Foster City,CA)终止子化学(terminator chemistry)(Giesecke et al.,1992,Journal of Virology Methods 38:47-60)和如下所示的M13 Forward(-20)测序引物进行测序反应。
5’-GTAAAACGACGGCCAG-3’(SEQ ID NO:5)
使用Robot-Smart 384(MWG Biotech Inc.,High Point,NC)以384孔形式进行测序反应,并且使用Millipore MultiScreen Seq384 Sequencing Clean-up Kits(Millipore,Billerica,MA)进行终止子去除(terminator removal)。反应含有6μl质粒DNA和4μl测序主混合物(master-mix),所述主混合物含有2μl 5x测序缓冲液(Millipore,Billerica,MA)、1μl Big-DyeTM终止子(Applied Biosystems,Inc.,Foster City,CA)、1.6pmol M13 Forward引物和1μl水。使用ABI PRISMAutomated DNA Sequencer Model 3700(Applied Biosystems,Foster City,CA)进行单通道DNA测序。
实施例3:cDNA克隆的DNA序列数据分析
在PHRED/PHRAP软件(University of Washington,Seattle,WA)的帮助下进行碱基判定(calling)、质量数值分配和载体修整(vector trimming)。使用ParcelTranscript Assembler v.2.6.2.(Paracel,Inc.,Pasadena,CA)进行EST的聚类分析(clustering analysis)。EST聚类分析显示395个独立簇。
使用BLOSUM 62矩阵(Henikoff,1992,Proc.Natl.Acad.Sci.USA 89:10915-10919)在32节点Linux群集(32-node Linux cluster)(Paracel,Inc.,Pasadena,CA)上,以Blastx程序(Altschul et.al.,1990,J.Mol.Biol.215:403-410)进行装配的EST序列针对PIR数据库的序列同源性分析。从395个簇中,246个对于公共的蛋白质数据库中的已知基因具有一致的blast结果(blast hit),并且149个对于这些数据库无显著一致的结果。在这246个基因中,13个具有针对充分表征的糖基水解酶基因同源物的一致的结果。
实施例4:编码家族7内切葡聚糖酶(CEL7F)的cDNA克隆的鉴定
编码家族7内切葡聚糖酶(CEL7F)的cDNA克隆最初通过其与来自长枝木霉(NREF NF00756647)的家族7内切葡聚糖酶EG-1蛋白质的同一性而鉴定。此分析显示两种蛋白质在蛋白质水平的113个氨基酸(339个碱基对)的延伸(stretch)内是44%同一的。在此初始鉴定之后,从原始冷冻原种(stock)平板恢复(retrieve)克隆Tter08C4,并且在补充50μg每ml卡那霉素的LB平板上划线。将平板在37℃温育过夜,并且在次日使用来自平板的单菌落接种3ml补充50μg每ml卡那霉素的LB。将液体培养物在37℃温育过夜,并且使用BioRobot 9600(QIAGEN,Inc.,Valencia,CA)制备质粒DNA。使用M13 Forward和如下所示的Poly-T引物测序克隆的3’端,采用如上所述的Big-DyeTM终止子化学再次测序克隆Tter08C4质粒DNA。
5′-TTTTTTTTTTTTTTTTTTTTTTTVN-3′(SEQ ID NO:6)
其中V=G、A、C和N=G、A、C、T
序列信息的Blastx同源性分析显示克隆Tter08C4编码的蛋白质与里氏木霉EG1蛋白质(NREF NF00494331)相似。这些蛋白质在365个氨基酸的延伸段(over a 365 amino acid stretch)是46%同一的。
使用Interproscan程序(Zdobnov and Apweiler,2001,Bioinformatics 17:847-8)分析克隆Tter08C4的推定蛋白质序列显示,所述基因含有家族7蛋白质的序列特征。从起始氨基酸甲硫氨酸的18个氨基酸存在这种称为Pfam模式PF00840(Bateman et.al.,2002,Nucleic Acids Research 30:276-280)的序列特征,这确认克隆Tter08C4编码家族7内切葡聚糖酶。
土生梭孢霉内切葡聚糖酶的cDNA序列(SEQ ID NO:1)和推导的氨基酸序列(SEQ ID NO:2)示于图1A和1B。cDNA克隆编码336氨基酸的多肽。基因的cDNA克隆的%G+C含量是67.5%,并且成熟蛋白质编码区域(SEQ ID NO:1的核苷酸55至1011)的%G+C含量是67.5%。使用SignalP软件程序(Nielsenet al.,1997,Protein Engineering 10:1-6)预测出17残基的信号肽。预测的成熟蛋白质含有319氨基酸具有33.3kDa的分子量。
通过Clustal W方法(Higgins,1989,见上文)测定内切葡聚糖酶家族7序列的比较比对(comparative alignment),所述方法使用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI),采用同一性表和下列多重比对参数:缺口罚分10和缺口长度罚分10。配对比对参数是K元组(Ktuple)=1、缺口罚分=3、窗口=5和对角线=5。比对显示成熟土生梭孢霉CEL7F基因的推导的氨基酸序列与里氏木霉内切葡聚糖酶I基因(NREF NF00494331,Uniprot Q5BMS5)催化区的推导的氨基酸序列享有46.7%的同一性,并且与全长里氏木霉内切葡聚糖酶I基因(NREF NF00494331,Uniprot Q5BMS5)的推导的氨基酸序列享有44.9%的同一性。对这些蛋白催化区的比对分析显示土生梭孢霉CEL7F内切葡聚糖酶缺少至少三个离散的序列基序,所述序列基序在来自真菌的糖基水解酶家族7的所有其它已知成员中是保守的。这些序列基序中的两种由多于10个氨基酸残基组成,并且含有高度保守的残基,所述高度保守残基不存在于土生梭孢霉CEL7F内切葡聚糖酶中。
一旦确定了克隆Tter08C4的性质,将定名为pTter7F(图2)的来自这种克隆的质粒DNA的0.5μl等分试样转移到大肠杆菌TOP10细胞的小管(Invitrogen,Carlsbad,CA)中,轻轻地混合,并且在冰上温育10分钟。随后将细胞在42℃热休克(heat-shock)30秒并且再次在冰上温育2分钟。将细胞在250μl SOC培养基中重悬,并且持续摇动(200rpm)在37℃温育60分钟。温育期之后,将两个30μl等分试样涂布于补充50μg每ml卡那霉素的LB平板上,并且在37℃温育过夜。次日挑取单菌落并且划线接种至三个1.8ml冷冻小管,所述冷冻小管含有大约1.5ml补充50μg每ml卡那霉素的LB琼脂糖。将小管用PetriSealTM(Diversified Biotech,Boston MA)密封,并作为NRRL B-30802保藏在农业研究机构专利培养物保藏中心(AgriculturalResearch Service Patent Culture Collection),北区研究中心(Northern RegionalResearch Center),1815 University Street,Peoria,Illinois,61604,保藏日期为2005年4月11日。
实施例5:pAlLo2表达载体的构建
通过修饰pBANe6(美国专利号6,461,837)构建表达载体pAlLo1,所述pBANe6包含来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶的基因启动子的杂合体(NA2-tpi启动子)、黑曲霉淀粉葡糖苷酶终止子序列(AMG终止子)和构巢曲霉乙酰胺酶基因(amdS)。使用所述的Big-DyeTM终止子化学通过测序验证所有诱变步骤。通过如下方法进行pBANe6的修饰:首先通过定位诱变从amdS选择标记消除在位置2051、2722和3397bp的三个Nco I限制位点。将所有改变设计为“沉默的”,保留amdS基因产物的实际蛋白质序列不变。根据制造商的说明书采用GeneEditorTM in vitro Site-Directed Mutagenesis Kit(Promega,Madison,WI),使用如下引物(加下划线的核苷酸代表改变的碱基)同时进行这三个位点的去除:
AMDS3NcoMut(2050):5’-GTGCCCCATGATACGCCTCCGG-3’(SEQ IDNO:7)
AMDS2NcoMut(2721):5’-GAGTCGTATTTCCAAGGCTCCTGACC-3’(SEQ ID NO:8)
AMDS1NcoMut(3396):5’-GGAGGCCATGAAGTGGACCAACGG-3’(SEQ ID NO:9)
随后使用QuickChangeTM Site-Directed Mutagenesis Kit(Stratagene,LaJolla,CA)将包含所有三种期望的序列改变的质粒进行定位诱变,以消除在AMG终止子末端在位置1643的Nco I限制位点。下列引物(加下划线的核苷酸代表改变的碱基)用于诱变:
诱变AMG终止子序列的Upper Primer:
5’-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3’(SEQ ID NO:10)
诱变AMG终止子序列的Lower Primer:
5’-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3’(SEQ ID NO:11)
修饰pBANe6的最后步骤是使用QuickChangeTM Site-DirectedMutagenesis Kit(Stratagene,La Jolla,CA)和以下引物(加下划线的核苷酸代表改变的碱基)在多接头的开始处添加新的Nco I限制位点以产生pAlLo1(图3)。
诱变NA2-tpi启动子的Upper Primer:
5’-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3’(SEQ ID NO:12)
诱变NA2-tpi启动子的Lower Primer:
5’-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3’(SEQ ID NO:13)
将pAlLo1的amdS基因与构巢曲霉pyrG基因交换(swap)。将质粒pBANe10(图4)用作作为选择标记的pyrG基因的来源。pBANe10的序列分析显示pyrG标记包含在Nsi I限制片段之内,并且不含有Nco I或Pac I限制位点。因为amdS也与Nsi I限制位点在侧翼连接,转变选择标记的策略是简单的交换Nsi I限制片段。使用限制酶Nsi I消化来自pAlLo1和pBANe10的质粒DNA,并且通过琼脂糖凝胶电泳纯化产物。将含有pyrG基因的来自pBANe10的Nsi I片段连接到pAlLo1的骨架中以取代原始含有amdS基因的Nsi I DNA片段。通过限制消化分析重组克隆以确定它们具有正确的插入物以及插入方向。选择具有以逆时针方向转录的pyrG基因的克隆。将新质粒定名为pAlLo2(图5)。
实施例6:将家族CEL7F内切葡聚糖酶基因克隆入米曲霉表达载体
设计以下所示两种合成寡核苷酸引物用于PCR扩增来自土生梭孢霉ESTTter08C4的全长开读框,其编码家族CEL7F内切葡聚糖酶。使用In-FusionCloning Kit(BD Biosciences,Palo Alto,CA)将片段直接克隆到pAlLo2中。
In-Fusion Forward引物:
5’-ACTGGATTACCATGACCCTACGGCTCCCTGTCATCA-3’(SEQ IDNO:14)
In-Fusion Reverse引物:
5’-TCACCTCTAGTTAATTAACTAGTTCTTCGTGGTAGACC-3’(SEQID NO:15)
粗体字母表示编码序列。剩余序列与pAlLo2的插入位点相比包含序列同一性。
将50皮摩尔的以上各种引物用在PCR反应中,所述反应在50μl终体积中含有50ng pTter11C9 DNA、1X Pfx Amplification Buffer(Invitrogen,Carlsbad,CA)、6μl 10mM dATP、dTTP、dGTP和dCTP的混合物、2.5单位Platinum PfxDNA Polymerase(Invitrogen,Carlsbad,CA)、1μl 50mM MgSO4和5μl 10XpCRx Enhancer溶液(Invitrogen,Carlsbad,CA)。使用Eppendorf Mastercycler5333(Eppendorf Scientific,Inc.,Westbury,NY)扩增片段,将程序设定为在98℃2分钟的一个循环;和94℃ 30秒、65℃ 30秒和68℃ 1.5分钟的35个循环。在35个循环之后,将反应在68℃温育10分钟,并且随后在10℃冷却直到进一步处理。使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液和每ml 0.1μg溴化乙锭在0.8%GTG琼脂糖凝胶(Cambrex Bioproducts OneMeadowlands Plaza East Rutherford,New Jersey 07073)上分离1.4kb的PCR反应产物。在Dark ReaderTM(Clare Chemical Research,Dolores,CO)的辅助下显现DNA条带以避免UV诱导的突变。使用一次性剃刀刀片(razor blade)切除1.4kb DNA条带并根据制造商的说明书使用Ultrafree-DA转杯(spin cup)(Millipore,Billerica,MA)将其纯化。
通过用Nco I和Pac I的消化将载体pAlLo2线性化。将片段通过如上所述的凝胶电泳和超滤纯化。将纯化的PCR片段克隆到线性化并且纯化的pAlLo2载体中,使用In-Fusion Cloning Kit(BD Biosciences,Palo Alto,CA)进行所述克隆。反应物(20μl)包含1X In-Fusion Buffer(BD Biosciences,Palo Alto,CA)、1X BSA(BD Biosciences,Palo Alto,CA)、1μl In-Fusion酶(1∶10稀释的)(BD Biosciences,Palo Alto,CA)、100ng用Nco I和Pac I消化的pAlLo2和50ng土生梭孢霉CEL7F的纯化PCR产物。将反应在室温温育30分钟。将反应的2μl样品用于根据制造商的说明书转化大肠杆菌XL10 SoloPacGold细胞(Stratagene,La Jolla,CA)。在恢复期(recovery period)之后,将来自转化反应的两个100μl等分试样涂布到补充100μg每ml的氨苄青霉素的150mm 2X YT平板上。将平板在37℃温育过夜。从选择平板中随机选择一组八个推定的重组克隆,并且使用BioRobot 9600从每个制备质粒DNA。将克隆通过Xho I限制消化分析。随后将具有期望的限制消化模式(restriction digest pattern)的两个克隆测序以确认在克隆的插入物中不存在突变。选择克隆#1并定名为pAlLo22(图6)。
实施例7:土生梭孢霉家族CEL7F内切葡聚糖酶基因在米曲霉JAL250中的表达
根据Christensen et al.,1988,Bio/Technology 6:1419-1422的方法制备米曲霉Jal250(WO 99/61651)原生质体。将5微克pAlLo22(以及作为载体对照的pAlLo2)用于转化米曲霉JAL250原生质体。
使用pAlLo2转化米曲霉Jal250产生大约50个转化体。将8个转化体分离到单独的PDA平板并且在34℃温育5天。
用5ml 0.01%Tween 80洗涤汇合孢子平板(confluent spore plate),并将孢子悬浮液用于接种125ml玻璃摇瓶中的25ml MDU2BP培养基。将转化体培养物以200rpm的持续摇动在34℃温育。在接种后的第五天,将培养物在6000xg离心并且收集它们的上清液。将5μl的每种上清液与等体积的2X上样缓冲液(10%β-巯基乙醇)混合,上样到1.5mm 8%-16%Tris-Glycine SDS-PAGE凝胶上并用Simply Blue SafeStain(Invitrogen,Carlsbad,CA)染色。培养液的SDS-PAGE分布显示八个转化体中的六个具有大约40kDa的新蛋白质条带。选择转化体7号用于进一步研究并且将其指定为米曲霉Jal250AlLo22。
实施例8:米曲霉Jal250AlLo22的大摇瓶培养
将米曲霉Jal250AlLo22孢子涂布到PDA平板上并且在34℃温育五天。用5ml 0.01%Tween 80将汇合孢子平板洗涤两次以使收集的孢子数最大化。随后将孢子悬浮液用于接种2升Fernbach烧瓶中的500ml MDU2BP培养基。将转化体培养物以持续摇动(200rpm)在34℃温育。在接种后的第五天,通过在孔大小0.45μm的500ml,75mm Nylon过滤装置上过滤来收集培养液,所述过滤装置具有玻璃纤维预过滤器。对培养液的5μl样品如上所述通过SDS-PAGE进行分析,以确认蛋白质分布与之前获得的相同。一旦培养液显示含有40kDa蛋白质条带,则对该培养液进行酶表征。
实施例9:土生梭孢霉CEL7F内切葡聚糖酶的表征
将实施例8中所述的米曲霉Jal250AlLo22培养液通过0.22μm孔大小的滤器(Millipore,Billerica,MA)过滤,使用配备PM10膜的Amicon搅拌杯(stirredcell)(Millipore,Billerica,MA)进行浓缩,并且使用Econo-Pac 10DG柱(BioRadLaboratories,Hercules,CA)脱盐。
将来自米曲霉Jal250(单独的载体)的培养液作为阴性对照进行与上述相同的处理。
用于评估土生梭孢霉CEL7F内切葡聚糖酶底物特异性的经染色的底物包括:AZCL-阿拉伯木聚糖(小麦)、AZCL-β-葡聚糖、AZCL-葡聚糖、AZCL-HE-纤维素、AZCL-马铃薯半乳聚糖、AZCL-半乳甘露聚糖(Carob)、AZCL-木聚糖(Birchwood)、AZCL-木葡聚糖(Megazyme,Bray,Ireland)和Chitin Azure(Sigma,St Louis,MO)。
在96深孔平板(Axygen Scientific,Union City,CA)中进行活性试验,所述平板由平板密封物(ALPS-300,Abgene,Epsom,UK)密封。将800μl上述底物(6.25g每升50mM乙酸钠pH 5.0)转移到96深孔平板的每个孔中,接着是180μl 50mM乙酸钠pH 5.0和20μl土生梭孢霉CEL7F内切葡聚糖酶溶液(0.25g/L)以开始反应。最终反应混合物中的底物浓度和酶上样量分别是5克每升和1mg酶每克底物。将米曲霉Jal250培养液作为阴性对照,与土生梭孢霉CEL7F内切葡聚糖酶培养液在相同条件下一起进行测试。将反应在50℃不进行混合地温育。取样前,将深孔平板在平板离心机(Sorvall RT7,GlobalMedical Instrumentation,Ramsey,MN)上以3000rpm离心5分钟。将150μl上清液的样品转移到96孔过滤平板(0.45μm孔大小,Millipore,Billerica,MA)中,抽真空(vacuum)并且收集滤出液。将100μl滤出液的样品转移到另外的96孔平板中,并且使用Spectra MAX340(Molecular Devices,Sunnyvale,CA)测量590nm的吸光度。
在1小时和92小时的温育之后,由土生梭孢霉CEL7F内切葡聚糖酶从不同经染色底物释放的染料作为相对的590nm数值示于表1(减去由米曲霉Jal250释放的染料之后)。
表1.土生梭孢霉内切葡聚糖酶与不同经染色底物一起在50℃、pH 5.0温育1小时和92小时之后的相对A590nm
时间小时 | AX | βG | Dex | HEC | Gal | GM | Xly | XG | ChitinAzure |
1 | 0.00 | 0.22 | 0.00 | 0.16 | 0.00 | 0.00 | 0.01 | 0.01 | 0.00 |
92 | 0.58 | 0.78 | 0.00 | 1.00 | 0.00 | 0.08 | 0.32 | 0.75 | 0.00 |
AX:AZCL-阿拉伯木聚糖 βG:AZCL-β-葡聚糖
Dex:AZCL-葡聚糖 HEC:AZCL-HE-纤维素
Gal:AZCL-马铃薯半乳聚糖 GM:AZCL-半乳甘露聚糖
Xly:AZCL-木聚糖 XG:AZCL-木葡聚糖
土生梭孢霉CEL7F内切葡聚糖酶在1小时后对AZCL-β-葡聚糖和AZCL-HE-纤维素具有活性。92小时温育之后,土生梭孢霉CEL7F内切葡聚糖酶还显示出对阿拉伯木聚糖、木聚糖和木葡聚糖染色底物的活性,和对半乳甘露聚糖染色底物的低活性。
实施例10:用土生梭孢霉CEL7F内切葡聚糖酶水解预处理的玉米秸秆
使用稀释的硫酸在U.S.Department of Energy National Renewable EnergyLaboratory(NREL)预处理玉米秸秆。将以下条件用于所述预处理:于190℃0.048克硫酸/克干的生物质和25%w/w干固体,持续大约1分钟。预处理的玉米秸秆(PCS)中的水不溶性固体含有52%纤维素、3.6%半纤维素和29.8%木质素。通过两阶段硫酸水解和后续通过高效液相色谱的糖分析,使用NRELStandard Analytical Procedure#002测定纤维素和半纤维素。在以硫酸水解纤维素和半纤维素级分之后,使用NREL Standard Analytical Procedure#003以重力分析法测定木质素。在酶水解之前,将PCS用大体积的重蒸馏水洗涤直至pH高于4.0,并且随后通过100目筛网筛滤,在121℃高压灭菌30分钟。
PCS的水解在96深孔平板中进行(Axygen Scientific,Union City,CA),将所述平板用平板密封物(ALPS-300,Abgene,Epsom,UK)密封,总反应体积为1.0ml。PCS(10mg/ml,于50mM乙酸钠pH 5.0缓冲液中)的水解使用1.25mg土生梭孢霉CEL7F内切葡聚糖酶(如实施例9中所述制备)每克PCS来进行。将来自米曲霉Jal250的培养液(如实施例9中所述制备)作为对照操作。PCS水解在50℃、pH 5.0进行。重复进行反应,并且在水解期间取得等分试样。通过将每种水解产物的20μl等分试样与180μl 0.11 M NaOH(终止试剂)混合来停止PCS水解反应。对于每种样品产生适当的系列稀释物,并且使用如下所述适合96孔微量培养板形式的对羟基苯甲酸酰肼(para-hydroxybenzoic acidhydrazide)(PHBAH,Sigma,St.Louis,MO)试验测定还原糖含量。简而言之,将适当稀释的样品的90μl等分试样置于96孔锥底微量培养板(conicalbottomed microplate)中。通过向每个孔中添加60μl2%NaOH中的1.5%(w/v)PHBAH来起始反应。将平板无覆盖地在95℃加热10分钟。使平板冷却至室温(RT),并且向每个孔添加50μl蒸馏H2O。将来自每个孔的100μl等分试样转移至平底96孔平板中,并且使用SpectraMax Microplate Reader(MolecularDevices,Sunnyvale,CA)测量A410nm的吸光度。使用葡萄糖标准(0.1-0.0125mg/ml,用0.4%氢氧化钠稀释)制备标准曲线,以将所得A410nm数值转化成葡萄糖当量。将所得当量用于计算每个反应的PCS纤维素转化百分比。使用以下等式计算纤维素转化成还原糖的程度(转化率,%):
转化率(%)=RS(mg/ml)*100*162/(纤维素(mg/ml)*180)
=RS(mg/ml)*100/(纤维素(mg/ml)*1.111)
在这个等式中,RS是以葡萄糖当量(mg/ml)测量的溶液中还原糖的浓度,而因子1.111反映出将纤维素转化成葡萄糖的重量增加。
土生梭孢霉CEL7F内切葡聚糖酶(1.25mg/g PCS)的PCS水解在120小时之后得到2.1%的纤维素转化率。米曲霉Jal250(1.25mg/g PCS)在120小时之后得到少于1%的转化率。
实施例11:土生梭孢霉内切葡聚糖酶对来自大麦的可溶性β-葡聚糖的水解
将土生梭孢霉Cel7F内切葡聚糖酶以实施例8中所述的米曲霉Jal250AlLo22培养液的形式进行测试。将培养液浓缩,并且使用来自Millipore(Bedford,MA)的带有Biomax-5聚醚砜膜(5000NMWL)的Centricon Plus-20离心滤器将培养液交换成50mM乙酸钠pH 5.0。将来自米曲霉Jal250的培养液同上处理。
使用Bicinchoninic Acid(BCA)微量培养板试验,依照BCA Protein AssayReagent Kit(Pierce Chemical Co.,Rockford,IL)的制造商说明书测定酶溶液中的蛋白质浓度。
在各反应之前从贮藏在-20℃的酶储液制备新鲜的酶稀释物。
土生梭孢霉Cel7F内切葡聚糖酶对来自大麦的可溶性β-葡聚糖(中等粘度,230kDa,Megazyme International Ireland Ltd.,Bray,Ireland)的活性在pH 5.5(具有0.02%叠氮化钠的50mM乙酸钠)和60℃测定。将结果与里氏木霉Cel7B(EGI)内切葡聚糖酶的结果进行比较。重组里氏木霉Cel7B(EGI)内切葡聚糖酶能够依照Takashima et al.,1998,Journal of Biotechnology 65:163-171制备。
水解反应中β-葡聚糖的初始浓度是1.0%(w/v)。将1ml反应在Eppendorf96 DeepWell Plates(1.2ml,VWR Scientific,West Chester,PA)中无搅拌地进行。将酶以三种蛋白质加载量(loading)使用:0.05、0.1和0.2mg每克葡聚糖。在对照试验中,将内切葡聚糖酶用50mM含有0.02%叠氮化钠的乙酸钠pH 5.5取代(缓冲液对照),或用不含重组表达酶的经过浓缩并且以缓冲液交换的米曲霉Jal250培养液取代(Jal250对照)。
在2小时和24小时从水解反应中移出等分试样,用去离子水稀释,并且使用对羟基苯甲酸酰肼(PHBAH)试验如实施例10中所述分析还原糖。将2小时和24小时两个温育时间的β-葡聚糖相对转化率作为蛋白质加载量的函数分别示于图7和8。将所述相对转化率显示为在以土生梭孢霉Cel7F内切葡聚糖酶(0.2mg蛋白质每克葡聚糖)水解β-葡聚糖24小时之后获得的转化率的百分比。
土生梭孢霉Cel7F内切葡聚糖酶与里氏木霉Cel7B内切葡聚糖酶相比显示较高的β-葡聚糖转化率,并且超过2小时温育时间之后继续产生新的还原端基团。与之相反,里氏木霉Cel7B内切葡聚糖酶显示2小时水解之后在还原糖浓度上几乎没有额外的增加。
生物材料的保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection),北方区研究中心(Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,给出了下述的登录号:
保藏物 登录号 保藏日期
大肠杆菌pTter7F NRRL B-30837 2005年4月11日
该菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37 C.F.R.§1.14和35 U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
此处,本发明中所描述的和要求的并非是要用本文所公开的具体方面来限定范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。事实上,从前面的说明中,对于本领域技术人员来说,除本文所显示和描述的之外,本发明的多种修改是显而易见的。这些修改也意欲落入所附的权利要求的范围之内。在冲突的情况下,将以包括定义部分的本公开为准。
本文引用了许多参考文献,其中公开的全部内容并入作为参考。
申请人或代理人档案号 10802.204-WO | 国际申请号 待给出 |
关于微生物保藏的说明
(细则13之二)
PCT/RO/134表(1992年7月)
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
<120>具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
<130>10802.204-WO
<150>60/675,601
<151>2005-04-27
<160>15
<170>PatentIn version 3.2
<210>1
<211>1011
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>1
atgaccctac ggctccctgt catcagectg ctggcctcgc tggcagcagg cgccgtcgtc 60
gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc 120
tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc 180
gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc 240
gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc 300
tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg 360
gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag 420
atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc 480
cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg 540
acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac 600
gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc 660
accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac 720
atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct 780
tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg 840
agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct 900
tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc 960
gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g 1011
<210>2
<211>336
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>2
Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala
1 5 10 15
Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr
20 25 30
Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val
35 40 45
Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg
50 55 60
Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala
65 70 75 80
Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala
85 90 95
Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met
100 105 110
Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu
115 120 125
Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp
130 135 140
Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys
145 150 155 160
Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met
165 170 175
Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg
180 185 190
Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr
195 200 205
Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr
210 215 220
Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr
225 230 235 240
Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys
245 250 255
Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu
260 265 270
Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln
275 280 285
Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly
290 295 300
Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val
305 310 315 320
Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn
325 330 335
<210>3
<211>32
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>3
tcgtcgggga caactttgta caaaaaagtt gg 32
<210>4
<211>27
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>4
cccctgttga aacatgtttt ttcaacc 27
<210>5
<211>16
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>5
gtaaaacgac ggccag 16
<210>6
<211>25
<212>DNA
<213>大肠杆菌(Escherichia coli)
<220>
<221>misc_feature
<222>(25)..(25)
<223>N=A,C,G或T
<400>6
tttttttttt tttttttttt tttvn 25
<210>7
<211>22
<212>DNA
<213>构巢曲霉(Aspergillus nidulans)
<400>7
gtgccccatg atacgcctcc gg 22
<210>8
<211>26
<212>DNA
<213>构巢曲霉(Aspergillus nidulans)
<400>8
gagtcgtatt tccaaggctc ctgacc 26
<210>9
<211>24
<212>DNA
<213>构巢曲霉(Aspergillus nidulans)
<400>9
ggaggccatg aagtggacca acgg 24
<210>10
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>10
caccgtgaaa gccatgctct ttccttcgtg tagaagacca gacag 45
<210>11
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>11
ctggtcttct acacgaagga aagagcatgg ctttcacggt gtctg 45
<210>12
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>12
ctatatacac aactggattt accatgggcc cgcggccgca gatc 44
<210>13
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>13
gatctgcggc cgcgggccca tggtaaatcc agttgtgtat atag 44
<210>14
<211>36
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>14
actggattac catgacccta cggctccctg tcatca 36
<210>15
<211>38
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>15
tcacctctag ttaattaact agttcttcgt ggtagacc 38
Claims (52)
1. 具有内切葡聚糖酶活性的分离的多肽,其选自下组:
(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有至少60%同一性的氨基酸序列;
(b)多肽,其由在至少中严紧条件下与以下序列杂交的多核苷酸编码:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和
(c)变体,包含保守取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2的成熟多肽。
2. 权利要求1的多肽,包含与SEQ ID NO:2的成熟多肽具有至少60%同一性的氨基酸序列。
3. 权利要求2的多肽,包含与SEQ ID NO:2的成熟多肽具有至少65%同一性的氨基酸序列。
4. 权利要求3的多肽,包含与SEQ ID NO:2的成熟多肽具有至少70%同一性的氨基酸序列。
5. 权利要求4的多肽,包含与SEQ ID NO:2的成熟多肽具有至少75%同一性的氨基酸序列。
6. 权利要求5的多肽,包含与SEQ ID NO:2的成熟多肽具有至少80%同一性的氨基酸序列。
7. 权利要求6的多肽,包含与SEQ ID NO:2的成熟多肽具有至少85%同一性的氨基酸序列。
8. 权利要求7的多肽,包含与SEQ ID NO:2的成熟多肽具有至少90%同一性的氨基酸序列。
9. 权利要求8的多肽,包含与SEQ ID NO:2的成熟多肽具有至少95%同一性的氨基酸序列。
10. 权利要求1的多肽,所述多肽包含SEQ ID NO:2的氨基酸序列,或其具有内切葡聚糖酶活性的片段。
11. 权利要求10的多肽,包含SEQ ID NO:2的氨基酸序列。
12. 权利要求11的多肽,包含SEQ ID NO:2的成熟多肽。
13. 权利要求1的多肽,由SEQ ID NO:2或其具有内切葡聚糖酶活性的片段组成。
14. 权利要求13的多肽,由SEQ ID NO:2组成。
15. 权利要求14的多肽,由SEQ ID NO:2的成熟多肽组成。
16. 权利要求1的多肽,所述多肽由多核苷酸编码,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链。
17. 权利要求16的多肽,所述多肽由多核苷酸编码,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链。
18. 权利要求17的多肽,所述多肽由多核苷酸编码,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链。
19. 权利要求1的多肽,所述多肽由质粒pTter7F中所含的多核苷酸编码,所述质粒包含在大肠杆菌NRRL B-30837中。
20. 权利要求1的多肽,其中所述多肽是变体,所述变体包含保守取代、缺失和/或插入一个或多个氨基酸的SEQ ID NO:2的氨基酸18至336。
21. 权利要求1-20中任一项的多肽,其中所述成熟多肽是SEQ ID NO:2的氨基酸18至336。
22. 权利要求1-20中任一项的多肽,其中所述成熟多肽编码序列是SEQID NO:1的核苷酸52至1008。
23. 权利要求1-22中任一项的多肽,还对一种或多种选自下组的底物具有酶活性:木聚糖、木葡聚糖、阿拉伯木聚糖、1,4-半乳聚糖、半乳甘露聚糖、葡聚糖和壳多糖。
24. 分离的多核苷酸,其包含编码权利要求1-23中任一项的多肽的核苷酸序列。
25. 权利要求24的分离的多核苷酸,其在SEQ ID NO:1的成熟多肽编码序列中包含至少一个突变,其中突变的核苷酸序列编码SEQ ID NO:2的成熟多肽。
26. 核酸构建体,其包含权利要求24或25的多核苷酸,所述多核苷酸与一个或多个调控序列可操作地连接,所述调控序列指导多肽在表达宿主中产生。
27. 重组表达载体,包含权利要求26的核酸构建体。
28. 重组宿主细胞,包含权利要求26的核酸构建体。
29. 用于产生权利要求1-23中任一项的多肽的方法,其包括:(a)在有益于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收所述多肽。
30. 用于产生权利要求1-23中任一项的多肽的方法,其包括:(a)在有益于所述多肽产生的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列;和(b)回收所述多肽。
31. 用于产生亲本细胞突变体的方法,所述方法包括破坏或缺失编码权利要求1-23中任一项的多肽的核苷酸序列,其导致突变体与亲本细胞相比产生较少的所述多肽。
32. 通过权利要求31的方法产生的突变细胞。
33. 权利要求32的突变细胞,所述突变细胞还包含编码天然或异源蛋白质的基因。
34. 用于产生蛋白质的方法,其包括:(a)在有益于蛋白质产生的条件下培养权利要求33的突变细胞;和(b)回收所述蛋白质。
35. 通过以下方法获得的分离的多核苷酸:(a)在中严紧条件下将DNA的群体与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和(b)分离杂交多核苷酸,所述多核苷酸编码具有内切葡聚糖酶活性的多肽。
36. 权利要求35的分离的多核苷酸,其通过以下方法获得:(a)在中-高严紧条件下将DNA的群体与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和(b)分离杂交多核苷酸,所述多核苷酸编码具有内切葡聚糖酶活性的多肽。
37. 权利要求36的分离的多核苷酸,其通过以下方法获得:(a)在高严紧条件下将DNA的群体与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和(b)分离杂交多核苷酸,所述多核苷酸编码具有内切葡聚糖酶活性的多肽。
38. 权利要求35-37中任一项的分离的多核苷酸,其中所述成熟多肽编码序列是SEQ ID NO:1的核苷酸52至1008。
39. 用于产生包含突变核苷酸序列的多核苷酸的方法,其包括:(a)将至少一种突变引入到SEQ ID NO:1的成熟多肽编码序列中,其中所述突变的核苷酸序列编码由SEQ ID NO:2的成熟多肽组成的多肽;和(b)回收包含突变核苷酸序列的多核苷酸。
40. 通过权利要求39的方法产生的突变多核苷酸。
41. 用于产生多肽的方法,其包括:(a)在有益于多肽产生的条件下培养细胞,所述细胞包含编码多肽的权利要求40的突变多核苷酸;和(b)回收所述多肽。
42. 核酸构建体,其包含编码蛋白质的基因,所述基因与编码信号肽的核苷酸序列可操作地连接,所述信号肽包含SEQ ID NO:2的氨基酸1-17或由SEQ ID NO:2的氨基酸1-17组成,其中所述基因对于该核苷酸序列是外源的。
43. 包含权利要求42的核酸构建体的重组表达载体。
44. 包含权利要求42的核酸构建体的重组宿主细胞。
45. 用于产生蛋白质的方法,其包括:(a)在有益于蛋白质产生的条件下培养权利要求44的重组宿主细胞;和(b)回收所述蛋白质。
46. 用于产生权利要求1-23中任一项的多肽的方法,其包括:(a)在有益于多肽产生的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码具有内切葡聚糖酶活性的多肽的多核苷酸;和(b)回收所述多肽。
47. 转基因植物、植物部分或植物细胞,其已经使用多核苷酸转化,所述多核苷酸编码权利要求1-23中任一项的多肽。
48. 洗涤剂组合物,所述洗涤剂组合物包含权利要求1-23中任一项的多肽和表面活性剂。
49. 用于降解含有纤维素和半纤维素的生物质的方法,其包括用有效量的权利要求1-23中任一项的多肽处理生物质和回收降解的生物质。
50. 权利要求49的方法,还包括用有效量的内切-1,4-β-葡聚糖酶、外切-1,4-β-D-葡聚糖酶和/或β-D-葡糖苷酶处理生物质。
51. 用于降解含有纤维素和半纤维素的生物质的方法,其包括用权利要求28的宿主细胞处理生物质和回收降解的生物质。
52. 权利要求51的方法,还包括用有效量的内切-1,4-β-葡聚糖酶、外切-1,4-β-D-葡聚糖酶和/或β-D-葡糖苷酶处理生物质。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67560105P | 2005-04-27 | 2005-04-27 | |
US60/675,601 | 2005-04-27 | ||
PCT/US2006/016244 WO2006116682A2 (en) | 2005-04-27 | 2006-04-27 | Polypeptides having endoglucanase activity and polynucleotides encoding same |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101253263A true CN101253263A (zh) | 2008-08-27 |
CN101253263B CN101253263B (zh) | 2014-07-02 |
Family
ID=37055753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200680023158.4A Expired - Fee Related CN101253263B (zh) | 2005-04-27 | 2006-04-27 | 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 |
Country Status (10)
Country | Link |
---|---|
US (2) | US7824884B2 (zh) |
EP (1) | EP1877551B2 (zh) |
CN (1) | CN101253263B (zh) |
AT (1) | ATE447013T1 (zh) |
BR (1) | BRPI0610031A2 (zh) |
CA (1) | CA2606475C (zh) |
DE (1) | DE602006010051D1 (zh) |
DK (1) | DK1877551T4 (zh) |
ES (1) | ES2336026T5 (zh) |
WO (1) | WO2006116682A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104968781A (zh) * | 2012-12-24 | 2015-10-07 | 诺维信公司 | 具有内切葡聚糖酶活性的多肽以及对其进行编码的多核苷酸 |
CN111593035A (zh) * | 2009-12-01 | 2020-08-28 | 诺维信公司 | 具有葡糖淀粉酶活性的多肽及其编码多核苷酸 |
US11512705B2 (en) | 2013-08-30 | 2022-11-29 | Edwards Japan Limited | Vacuum pump |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007115201A2 (en) * | 2006-03-30 | 2007-10-11 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
GB0802489D0 (en) * | 2008-02-11 | 2008-03-19 | Givaudan Sa | Product |
AU2010253848C1 (en) * | 2009-05-29 | 2015-02-19 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
CN102041252B (zh) * | 2009-10-26 | 2015-12-02 | 复旦大学 | 高效内切葡聚糖酶RuCelB,其编码基因、制备方法与应用 |
US9410135B2 (en) * | 2010-09-15 | 2016-08-09 | The Regents Of The University Of California | Thermophilic mutants of Trichoderma reesei endoglucanase I |
US8778639B1 (en) * | 2013-02-12 | 2014-07-15 | Novozymes Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
US8771993B1 (en) * | 2013-02-12 | 2014-07-08 | Novozymes A/S | Polypeptides having endoglucanse activity and polynucleotides encoding same |
US10258065B2 (en) * | 2014-07-10 | 2019-04-16 | Novozymes A/S | Polypeptides having xylanase activity and polynucleotides encoding same |
Family Cites Families (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1296839A (zh) | 1969-05-29 | 1972-11-22 | ||
GB1372034A (en) | 1970-12-31 | 1974-10-30 | Unilever Ltd | Detergent compositions |
GB1483591A (en) | 1973-07-23 | 1977-08-24 | Novo Industri As | Process for coating water soluble or water dispersible particles by means of the fluid bed technique |
GB1590432A (en) | 1976-07-07 | 1981-06-03 | Novo Industri As | Process for the production of an enzyme granulate and the enzyme granuate thus produced |
DK187280A (da) | 1980-04-30 | 1981-10-31 | Novo Industri As | Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode |
FI841500A0 (fi) * | 1984-04-13 | 1984-04-13 | Valtion Teknillinen | Foerfarande foer uppbygnande av cellulolytiska jaeststammar. |
DK263584D0 (da) | 1984-05-29 | 1984-05-29 | Novo Industri As | Enzymholdige granulater anvendt som detergentadditiver |
JPH0697997B2 (ja) | 1985-08-09 | 1994-12-07 | ギスト ブロカデス ナ−ムロ−ゼ フエンノ−トチヤツプ | 新規の酵素的洗浄剤添加物 |
EG18543A (en) | 1986-02-20 | 1993-07-30 | Albright & Wilson | Protected enzyme systems |
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
US4810414A (en) | 1986-08-29 | 1989-03-07 | Novo Industri A/S | Enzymatic detergent additive |
NZ221627A (en) | 1986-09-09 | 1993-04-28 | Genencor Inc | Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios |
ES2076939T3 (es) | 1987-08-28 | 1995-11-16 | Novo Nordisk As | Lipasa recombinante de humicola y procedimiento para la produccion de lipasas recombinantes de humicola. |
JPS6474992A (en) | 1987-09-16 | 1989-03-20 | Fuji Oil Co Ltd | Dna sequence, plasmid and production of lipase |
DK6488D0 (da) | 1988-01-07 | 1988-01-07 | Novo Industri As | Enzymer |
EP0471265B1 (en) | 1988-01-07 | 1995-10-25 | Novo Nordisk A/S | Specific protease |
JP3079276B2 (ja) | 1988-02-28 | 2000-08-21 | 天野製薬株式会社 | 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法 |
US5776757A (en) | 1988-03-24 | 1998-07-07 | Novo Nordisk A/S | Fungal cellulase composition containing alkaline CMC-endoglucanase and essentially no cellobiohydrolase and method of making thereof |
DE68911131T2 (de) | 1988-03-24 | 1994-03-31 | Novo Nordisk As | Cellulosezubereitung. |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
GB8915658D0 (en) | 1989-07-07 | 1989-08-23 | Unilever Plc | Enzymes,their production and use |
NZ237549A (en) | 1990-03-23 | 1993-06-25 | Gist Brocades Nv | Production of enhanced levels of enzymes in the seeds of transgenic plants and the use of these seeds |
KR100236540B1 (ko) | 1990-04-14 | 2000-01-15 | 레클로우크스 라우에르 | 알카리성 바실러스-리파제, 이를 코-딩하는 dna 서열 및 리파제를 생산하는 바실러스 균주 |
DE69107455T3 (de) | 1990-05-09 | 2004-09-23 | Novozymes A/S | Eine ein endoglucanase enzym enthaltende zellulasezubereitung. |
DK115890D0 (da) | 1990-05-09 | 1990-05-09 | Novo Nordisk As | Enzym |
KR930702514A (ko) | 1990-09-13 | 1993-09-09 | 안네 제케르 | 리파제 변체 |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
ATE219136T1 (de) | 1991-01-16 | 2002-06-15 | Procter & Gamble | Kompakte waschmittelzusammensetzungen mit hochaktiven cellulasen |
CZ285148B6 (cs) | 1991-04-30 | 1999-05-12 | The Procter And Gamble Company | Kapalné detergentní směsi s borito-polyolovým komplexem k inhibici proteolytického enzymu |
EP0511456A1 (en) | 1991-04-30 | 1992-11-04 | The Procter & Gamble Company | Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme |
ES2121014T3 (es) | 1991-05-01 | 1998-11-16 | Novo Nordisk As | Enzimas estabilizadas y composiciones detergentes. |
DK72992D0 (da) | 1992-06-01 | 1992-06-01 | Novo Nordisk As | Enzym |
DK88892D0 (da) | 1992-07-06 | 1992-07-06 | Novo Nordisk As | Forbindelse |
EP0651794B1 (en) | 1992-07-23 | 2009-09-30 | Novozymes A/S | MUTANT $g(a)-AMYLASE, DETERGENT AND DISH WASHING AGENT |
EP0663950B1 (en) | 1992-10-06 | 2004-03-17 | Novozymes A/S | Cellulase variants |
ATE175235T1 (de) | 1993-02-11 | 1999-01-15 | Genencor Int | Oxidativ stabile alpha-amylase |
AU673078B2 (en) | 1993-04-27 | 1996-10-24 | Genencor International, Inc. | New lipase variants for use in detergent applications |
DK52393D0 (zh) | 1993-05-05 | 1993-05-05 | Novo Nordisk As | |
JP2859520B2 (ja) | 1993-08-30 | 1999-02-17 | ノボ ノルディスク アクティーゼルスカブ | リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物 |
US5817495A (en) | 1993-10-13 | 1998-10-06 | Novo Nordisk A/S | H2 O2 -stable peroxidase variants |
JPH07143883A (ja) | 1993-11-24 | 1995-06-06 | Showa Denko Kk | リパーゼ遺伝子及び変異体リパーゼ |
DE4343591A1 (de) | 1993-12-21 | 1995-06-22 | Evotec Biosystems Gmbh | Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
JP3553958B2 (ja) | 1994-02-22 | 2004-08-11 | ノボザイムス アクティーゼルスカブ | 脂質分解酵素の変異体の製造方法 |
DK1632557T3 (da) | 1994-03-08 | 2011-05-16 | Novozymes As | Hidtil ukendte alkaliske cellulaser |
DK0755442T3 (da) | 1994-05-04 | 2003-04-14 | Genencor Int | Lipaser med forbedret resistens over for overfladeaktive midler |
DE69523052T2 (de) | 1994-06-03 | 2002-06-20 | Novo Nordisk Biotech Inc | Gereinigte myceliophthora laccasen und nukleinsäuren dafür kodierend |
WO1995035381A1 (en) | 1994-06-20 | 1995-12-28 | Unilever N.V. | Modified pseudomonas lipases and their use |
WO1996000292A1 (en) | 1994-06-23 | 1996-01-04 | Unilever N.V. | Modified pseudomonas lipases and their use |
CN1151762A (zh) | 1994-06-30 | 1997-06-11 | 诺沃诺尔迪斯克生物技术有限公司 | 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子 |
EP1995303A3 (en) | 1994-10-06 | 2008-12-31 | Novozymes A/S | Enzyme preparation with endoglucanase activity |
BE1008998A3 (fr) | 1994-10-14 | 1996-10-01 | Solvay | Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci. |
JPH10507642A (ja) | 1994-10-26 | 1998-07-28 | ノボ ノルディスク アクティーゼルスカブ | 脂肪分解活性を有する酵素 |
AR000862A1 (es) | 1995-02-03 | 1997-08-06 | Novozymes As | Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del |
JPH08228778A (ja) | 1995-02-27 | 1996-09-10 | Showa Denko Kk | 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法 |
CN1182451A (zh) | 1995-03-17 | 1998-05-20 | 诺沃挪第克公司 | 新的内切葡聚糖酶 |
EP0839186B1 (en) | 1995-07-14 | 2004-11-10 | Novozymes A/S | A modified enzyme with lipolytic activity |
AU6655196A (en) | 1995-08-11 | 1997-03-12 | Novo Nordisk A/S | Novel lipolytic enzymes |
DK0857216T3 (en) | 1995-10-17 | 2014-12-15 | Ab Enzymes Oy | Cellulases, GENES ENCODING THEM AND USES THEREOF |
US5763385A (en) | 1996-05-14 | 1998-06-09 | Genencor International, Inc. | Modified α-amylases having altered calcium binding properties |
AU3938997A (en) | 1996-08-26 | 1998-03-19 | Novo Nordisk A/S | A novel endoglucanase |
EP0937138B1 (en) | 1996-09-17 | 2006-04-26 | Novozymes A/S | Cellulase variants |
EP0963192B1 (en) | 1996-10-08 | 2003-01-08 | Novozymes A/S | Diaminobenzoic acid derivatives as dye precursors |
CN1530443A (zh) | 1996-11-04 | 2004-09-22 | ŵ����÷������˾ | 枯草杆菌酶变异体和组合物 |
EP2278001B1 (en) | 1996-11-04 | 2013-10-23 | Novozymes A/S | Protease variants and compositions |
US6159731A (en) | 1997-02-12 | 2000-12-12 | Massachusetts Institute Of Technology | Daxx, a Fas-binding protein that activates JNK and apoptosis |
WO1999061651A2 (en) | 1998-05-27 | 1999-12-02 | Novo Nordisk Biotech, Inc. | Methods for producing a polypeptide by modifying the copy number of a gene |
CN1197965C (zh) | 1998-10-26 | 2005-04-20 | 诺维信公司 | 在丝状真菌细胞内构建和筛选目的dna文库 |
JP4620253B2 (ja) | 1999-03-22 | 2011-01-26 | ノボザイムス,インコーポレイティド | 菌類細胞中で遺伝子を発現させるためのプロモーター |
US6500658B1 (en) * | 1999-08-17 | 2002-12-31 | Novozymes, A/S | Xyloglucanase from Malbranchea |
EP1250444A1 (en) | 1999-11-30 | 2002-10-23 | Novo Nordisk Biotech, Inc. | Methods for producing a polypeptide using a consensus translational initiator sequence |
CN101970471A (zh) * | 2007-12-19 | 2011-02-09 | 诺维信公司 | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 |
WO2009085868A1 (en) * | 2007-12-19 | 2009-07-09 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
EP2235173A2 (en) * | 2007-12-19 | 2010-10-06 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
CA2709367A1 (en) * | 2007-12-19 | 2009-07-09 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
-
2006
- 2006-04-27 US US11/413,022 patent/US7824884B2/en not_active Expired - Fee Related
- 2006-04-27 CN CN200680023158.4A patent/CN101253263B/zh not_active Expired - Fee Related
- 2006-04-27 DK DK06751769.8T patent/DK1877551T4/da active
- 2006-04-27 ES ES06751769.8T patent/ES2336026T5/es active Active
- 2006-04-27 AT AT06751769T patent/ATE447013T1/de not_active IP Right Cessation
- 2006-04-27 BR BRPI0610031-7A patent/BRPI0610031A2/pt not_active Application Discontinuation
- 2006-04-27 CA CA2606475A patent/CA2606475C/en not_active Expired - Fee Related
- 2006-04-27 WO PCT/US2006/016244 patent/WO2006116682A2/en active Application Filing
- 2006-04-27 EP EP06751769.8A patent/EP1877551B2/en not_active Not-in-force
- 2006-04-27 DE DE602006010051T patent/DE602006010051D1/de active Active
-
2010
- 2010-09-28 US US12/892,614 patent/US8119857B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111593035A (zh) * | 2009-12-01 | 2020-08-28 | 诺维信公司 | 具有葡糖淀粉酶活性的多肽及其编码多核苷酸 |
CN104968781A (zh) * | 2012-12-24 | 2015-10-07 | 诺维信公司 | 具有内切葡聚糖酶活性的多肽以及对其进行编码的多核苷酸 |
US11512705B2 (en) | 2013-08-30 | 2022-11-29 | Edwards Japan Limited | Vacuum pump |
Also Published As
Publication number | Publication date |
---|---|
DE602006010051D1 (de) | 2009-12-10 |
US20080289067A1 (en) | 2008-11-20 |
DK1877551T3 (da) | 2010-03-01 |
EP1877551A2 (en) | 2008-01-16 |
ES2336026T3 (es) | 2010-04-07 |
US8119857B2 (en) | 2012-02-21 |
ES2336026T5 (es) | 2014-05-20 |
CA2606475C (en) | 2015-06-16 |
EP1877551B1 (en) | 2009-10-28 |
EP1877551B2 (en) | 2014-02-26 |
US20110014707A1 (en) | 2011-01-20 |
BRPI0610031A2 (pt) | 2010-05-18 |
WO2006116682A2 (en) | 2006-11-02 |
CN101253263B (zh) | 2014-07-02 |
US7824884B2 (en) | 2010-11-02 |
ATE447013T1 (de) | 2009-11-15 |
CA2606475A1 (en) | 2006-11-02 |
DK1877551T4 (da) | 2014-03-31 |
WO2006116682A3 (en) | 2008-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101137750B (zh) | 具有纤维二糖水解酶活性的多肽和编码它的多核苷酸 | |
US9771569B2 (en) | Polypeptides having xylanase activity and polynucleotides encoding same | |
CN101874109B (zh) | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 | |
CN101253263B (zh) | 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
EP2195421B1 (en) | Polypeptides having acetylxylan esterase activity and polynucleotides encoding same | |
CN1902310B (zh) | 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸 | |
CN101287751A (zh) | 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸 | |
CN101460616A (zh) | 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
US8080386B2 (en) | Polypeptides having endoglucanase activity and polynucleotides encoding same | |
CN101454445A (zh) | 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
CN104204199A (zh) | 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140702 Termination date: 20180427 |
|
CF01 | Termination of patent right due to non-payment of annual fee |