CN102947458B - 用于丝状真菌中c4-二羧酸的改善的产生的方法 - Google Patents
用于丝状真菌中c4-二羧酸的改善的产生的方法 Download PDFInfo
- Publication number
- CN102947458B CN102947458B CN201180030913.2A CN201180030913A CN102947458B CN 102947458 B CN102947458 B CN 102947458B CN 201180030913 A CN201180030913 A CN 201180030913A CN 102947458 B CN102947458 B CN 102947458B
- Authority
- CN
- China
- Prior art keywords
- dicarboxylic acids
- sequence
- host cell
- seqidno
- transport protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 112
- 241000233866 Fungi Species 0.000 title description 30
- 230000006872 improvement Effects 0.000 title description 3
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 234
- 239000002157 polynucleotide Substances 0.000 claims abstract description 234
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 234
- 108010078791 Carrier Proteins Proteins 0.000 claims abstract description 230
- 102000014914 Carrier Proteins Human genes 0.000 claims abstract description 220
- BJEPYKJPYRNKOW-UHFFFAOYSA-N alpha-hydroxysuccinic acid Natural products OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 claims abstract description 62
- 239000001630 malic acid Substances 0.000 claims abstract description 62
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 claims abstract description 61
- 235000011090 malic acid Nutrition 0.000 claims abstract description 61
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 253
- 229920001184 polypeptide Polymers 0.000 claims description 244
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 243
- 108010026217 Malate Dehydrogenase Proteins 0.000 claims description 90
- 102000013460 Malate Dehydrogenase Human genes 0.000 claims description 88
- 150000001413 amino acids Chemical class 0.000 claims description 84
- 108010053763 Pyruvate Carboxylase Proteins 0.000 claims description 81
- 102100039895 Pyruvate carboxylase, mitochondrial Human genes 0.000 claims description 81
- 241000228212 Aspergillus Species 0.000 claims description 48
- 240000006439 Aspergillus oryzae Species 0.000 claims description 40
- 235000002247 Aspergillus oryzae Nutrition 0.000 claims description 40
- 239000001963 growth medium Substances 0.000 claims description 21
- 230000028327 secretion Effects 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims description 6
- 210000004027 cell Anatomy 0.000 description 216
- 235000001014 amino acid Nutrition 0.000 description 83
- 229940024606 amino acid Drugs 0.000 description 83
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 51
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 51
- 108090000623 proteins and genes Proteins 0.000 description 48
- 239000002253 acid Substances 0.000 description 47
- 239000012634 fragment Substances 0.000 description 45
- 239000002773 nucleotide Substances 0.000 description 40
- 125000003729 nucleotide group Chemical group 0.000 description 40
- 108020004414 DNA Proteins 0.000 description 37
- 230000000295 complement effect Effects 0.000 description 37
- 230000008034 disappearance Effects 0.000 description 31
- 108090000790 Enzymes Proteins 0.000 description 28
- 239000002609 medium Substances 0.000 description 28
- 102000004190 Enzymes Human genes 0.000 description 27
- 125000003275 alpha amino acid group Chemical group 0.000 description 27
- 229940088598 enzyme Drugs 0.000 description 27
- 238000009396 hybridization Methods 0.000 description 27
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 26
- 239000000523 sample Substances 0.000 description 26
- 230000001105 regulatory effect Effects 0.000 description 25
- 125000000539 amino acid group Chemical group 0.000 description 23
- 238000003780 insertion Methods 0.000 description 23
- 230000037431 insertion Effects 0.000 description 23
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 22
- 230000002538 fungal effect Effects 0.000 description 22
- 230000001276 controlling effect Effects 0.000 description 21
- 239000002299 complementary DNA Substances 0.000 description 20
- 241000894006 Bacteria Species 0.000 description 19
- 230000000694 effects Effects 0.000 description 19
- 230000004952 protein activity Effects 0.000 description 19
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 19
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 17
- 239000002853 nucleic acid probe Substances 0.000 description 17
- 150000007523 nucleic acids Chemical class 0.000 description 17
- 230000008859 change Effects 0.000 description 16
- 239000013604 expression vector Substances 0.000 description 16
- 244000005700 microbiome Species 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 16
- 108020004707 nucleic acids Proteins 0.000 description 16
- 239000000243 solution Substances 0.000 description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 description 15
- 241000589516 Pseudomonas Species 0.000 description 14
- 241000499912 Trichoderma reesei Species 0.000 description 14
- 230000001580 bacterial effect Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 14
- 230000004151 fermentation Effects 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 239000000047 product Substances 0.000 description 14
- 241000193830 Bacillus <bacterium> Species 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 210000001938 protoplast Anatomy 0.000 description 13
- 229940107700 pyruvic acid Drugs 0.000 description 13
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 13
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 12
- OFOBLEOULBTSOW-UHFFFAOYSA-N Malonic acid Chemical compound OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 12
- KHPXUQMNIQBQEV-UHFFFAOYSA-N oxaloacetic acid Chemical compound OC(=O)CC(=O)C(O)=O KHPXUQMNIQBQEV-UHFFFAOYSA-N 0.000 description 12
- 241000351920 Aspergillus nidulans Species 0.000 description 11
- 241000223218 Fusarium Species 0.000 description 11
- 239000001530 fumaric acid Substances 0.000 description 11
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 11
- 241001225321 Aspergillus fumigatus Species 0.000 description 10
- 241000235395 Mucor Species 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 230000008685 targeting Effects 0.000 description 10
- 229910001868 water Inorganic materials 0.000 description 10
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 9
- 108010076504 Protein Sorting Signals Proteins 0.000 description 9
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 9
- 239000007788 liquid Substances 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- 102000004169 proteins and genes Human genes 0.000 description 9
- 241000228245 Aspergillus niger Species 0.000 description 8
- 241001494489 Thielavia Species 0.000 description 8
- 241000223259 Trichoderma Species 0.000 description 8
- 229940091771 aspergillus fumigatus Drugs 0.000 description 8
- 239000002585 base Substances 0.000 description 8
- 239000008367 deionised water Substances 0.000 description 8
- 229910021641 deionized water Inorganic materials 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 239000012535 impurity Substances 0.000 description 8
- 238000011534 incubation Methods 0.000 description 8
- 241000223651 Aureobasidium Species 0.000 description 7
- 241000123346 Chrysosporium Species 0.000 description 7
- 241000222511 Coprinus Species 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- 241000223198 Humicola Species 0.000 description 7
- 241000226677 Myceliophthora Species 0.000 description 7
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 7
- 241000228143 Penicillium Species 0.000 description 7
- 241000222480 Schizophyllum Species 0.000 description 7
- 241000187747 Streptomyces Species 0.000 description 7
- 241000228341 Talaromyces Species 0.000 description 7
- 241001149964 Tolypocladium Species 0.000 description 7
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 150000007524 organic acids Chemical class 0.000 description 7
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 6
- 244000063299 Bacillus subtilis Species 0.000 description 6
- 235000014469 Bacillus subtilis Nutrition 0.000 description 6
- 241000222356 Coriolus Species 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 6
- 241000221960 Neurospora Species 0.000 description 6
- 241000222350 Pleurotus Species 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000002361 compost Substances 0.000 description 6
- 238000009795 derivation Methods 0.000 description 6
- -1 example 1-3 amino acid Chemical class 0.000 description 6
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 239000002689 soil Substances 0.000 description 6
- 229960005137 succinic acid Drugs 0.000 description 6
- 230000032258 transport Effects 0.000 description 6
- 210000003462 vein Anatomy 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 241000235349 Ascomycota Species 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 241000194108 Bacillus licheniformis Species 0.000 description 5
- 241000235457 Chytridium Species 0.000 description 5
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 5
- RGHNJXZEOKUKBD-SQOUGZDYSA-N D-gluconic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O RGHNJXZEOKUKBD-SQOUGZDYSA-N 0.000 description 5
- 101710088194 Dehydrogenase Proteins 0.000 description 5
- 241000605909 Fusobacterium Species 0.000 description 5
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 241001480714 Humicola insolens Species 0.000 description 5
- 241001344131 Magnaporthe grisea Species 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- 241000194017 Streptococcus Species 0.000 description 5
- 241001655322 Streptomycetales Species 0.000 description 5
- 241000223258 Thermomyces lanuginosus Species 0.000 description 5
- 108090000637 alpha-Amylases Proteins 0.000 description 5
- 210000001367 artery Anatomy 0.000 description 5
- 230000004087 circulation Effects 0.000 description 5
- 210000000172 cytosol Anatomy 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 230000035800 maturation Effects 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000011218 seed culture Methods 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 239000000779 smoke Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 241000228197 Aspergillus flavus Species 0.000 description 4
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 4
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 4
- 102000010911 Enzyme Precursors Human genes 0.000 description 4
- 108010062466 Enzyme Precursors Proteins 0.000 description 4
- 101000777550 Homo sapiens CCN family member 2 Proteins 0.000 description 4
- 241000209094 Oryza Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 241000235527 Rhizopus Species 0.000 description 4
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 4
- 241000222354 Trametes Species 0.000 description 4
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 4
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 4
- 235000011054 acetic acid Nutrition 0.000 description 4
- WNLRTRBMVRJNCN-UHFFFAOYSA-N adipic acid Chemical compound OC(=O)CCCCC(O)=O WNLRTRBMVRJNCN-UHFFFAOYSA-N 0.000 description 4
- 238000000246 agarose gel electrophoresis Methods 0.000 description 4
- 102000004139 alpha-Amylases Human genes 0.000 description 4
- 229940024171 alpha-amylase Drugs 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000006555 catalytic reaction Methods 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 150000001991 dicarboxylic acids Chemical class 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 102000047612 human CCN2 Human genes 0.000 description 4
- 239000002054 inoculum Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 239000000376 reactant Substances 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 235000002906 tartaric acid Nutrition 0.000 description 4
- 239000011975 tartaric acid Substances 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 239000002023 wood Substances 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- 240000000073 Achillea millefolium Species 0.000 description 3
- 235000007754 Achillea millefolium Nutrition 0.000 description 3
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 3
- 241000222518 Agaricus Species 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 241000228215 Aspergillus aculeatus Species 0.000 description 3
- 241000228193 Aspergillus clavatus Species 0.000 description 3
- 241000193752 Bacillus circulans Species 0.000 description 3
- 241001328122 Bacillus clausii Species 0.000 description 3
- 241000193747 Bacillus firmus Species 0.000 description 3
- 241000193422 Bacillus lentus Species 0.000 description 3
- 241000194107 Bacillus megaterium Species 0.000 description 3
- 241000194103 Bacillus pumilus Species 0.000 description 3
- 241000193388 Bacillus thuringiensis Species 0.000 description 3
- 241000193764 Brevibacillus brevis Species 0.000 description 3
- 241000589876 Campylobacter Species 0.000 description 3
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 3
- 108010059892 Cellulase Proteins 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- RGHNJXZEOKUKBD-UHFFFAOYSA-N D-gluconic acid Natural products OCC(O)C(O)C(O)C(O)C(O)=O RGHNJXZEOKUKBD-UHFFFAOYSA-N 0.000 description 3
- 108010000912 Egg Proteins Proteins 0.000 description 3
- 102000002322 Egg Proteins Human genes 0.000 description 3
- 241000194033 Enterococcus Species 0.000 description 3
- 241000589565 Flavobacterium Species 0.000 description 3
- 241000223195 Fusarium graminearum Species 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 241000726221 Gemma Species 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 102100027612 Kallikrein-11 Human genes 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- 241000194036 Lactococcus Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- BAWFJGJZGIEFAR-NNYOXOHSSA-O NAD(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-O 0.000 description 3
- 241000233654 Oomycetes Species 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 241000194109 Paenibacillus lautus Species 0.000 description 3
- 241000222385 Phanerochaete Species 0.000 description 3
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 241000235070 Saccharomyces Species 0.000 description 3
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 3
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 3
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 3
- 241001123227 Saccharomyces pastorianus Species 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- 241000235346 Schizosaccharomyces Species 0.000 description 3
- 241000191940 Staphylococcus Species 0.000 description 3
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 241000187392 Streptomyces griseus Species 0.000 description 3
- 241001540751 Talaromyces ruber Species 0.000 description 3
- 241000223260 Trichoderma harzianum Species 0.000 description 3
- 101710152431 Trypsin-like protease Proteins 0.000 description 3
- 241000202898 Ureaplasma Species 0.000 description 3
- 244000301083 Ustilago maydis Species 0.000 description 3
- 235000015919 Ustilago maydis Nutrition 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 239000003513 alkali Substances 0.000 description 3
- 229910021529 ammonia Inorganic materials 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 229940005348 bacillus firmus Drugs 0.000 description 3
- 229940097012 bacillus thuringiensis Drugs 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 239000007853 buffer solution Substances 0.000 description 3
- 239000012876 carrier material Substances 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 235000015165 citric acid Nutrition 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 239000000174 gluconic acid Substances 0.000 description 3
- 235000012208 gluconic acid Nutrition 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 150000004715 keto acids Chemical class 0.000 description 3
- 239000004310 lactic acid Substances 0.000 description 3
- 235000014655 lactic acid Nutrition 0.000 description 3
- 229940039696 lactobacillus Drugs 0.000 description 3
- 239000011785 micronutrient Substances 0.000 description 3
- 235000013369 micronutrients Nutrition 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 239000003208 petroleum Substances 0.000 description 3
- 239000001965 potato dextrose agar Substances 0.000 description 3
- 229940076788 pyruvate Drugs 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000001954 sterilising effect Effects 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- SMZOUWXMTYCWNB-UHFFFAOYSA-N 2-(2-methoxy-5-methylphenyl)ethanamine Chemical compound COC1=CC=C(C)C=C1CCN SMZOUWXMTYCWNB-UHFFFAOYSA-N 0.000 description 2
- NIXOWILDQLNWCW-UHFFFAOYSA-N 2-Propenoic acid Natural products OC(=O)C=C NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 2
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 2
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 241000220433 Albizia Species 0.000 description 2
- 241000223600 Alternaria Species 0.000 description 2
- 239000004382 Amylase Substances 0.000 description 2
- 108010065511 Amylases Proteins 0.000 description 2
- 102000013142 Amylases Human genes 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 102000035101 Aspartic proteases Human genes 0.000 description 2
- 108091005502 Aspartic proteases Proteins 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 241000131386 Aspergillus sojae Species 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 241000222490 Bjerkandera Species 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 241000146399 Ceriporiopsis Species 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 2
- 241001674013 Chrysosporium lucknowense Species 0.000 description 2
- 241001556045 Chrysosporium merdarium Species 0.000 description 2
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 2
- 241001674001 Chrysosporium tropicum Species 0.000 description 2
- 241000355696 Chrysosporium zonatum Species 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 244000251987 Coprinus macrorhizus Species 0.000 description 2
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 2
- 241000935926 Diplodia Species 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 2
- 241000221433 Exidia Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 241000006384 Jeotgalibacillus marinus Species 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 241001344133 Magnaporthe Species 0.000 description 2
- BOPGDPNILDQYTO-NNYOXOHSSA-L NADH(2-) Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP([O-])(=O)OP([O-])(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-L 0.000 description 2
- 241000233892 Neocallimastix Species 0.000 description 2
- 108090000913 Nitrate Reductases Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 241000123526 Peziza Species 0.000 description 2
- 241000222395 Phlebia Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000235379 Piromyces Species 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241000235402 Rhizomucor Species 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 101000693530 Staphylococcus aureus Staphylokinase Proteins 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 241000194048 Streptococcus equi Species 0.000 description 2
- 241000194054 Streptococcus uberis Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 239000005864 Sulphur Substances 0.000 description 2
- 239000008049 TAE buffer Substances 0.000 description 2
- 241001136494 Talaromyces funiculosus Species 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- 241000228178 Thermoascus Species 0.000 description 2
- 241000183057 Thielavia microspora Species 0.000 description 2
- 108010001244 Tli polymerase Proteins 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 2
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 2
- 241001523965 Xylaria Species 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 108010048241 acetamidase Proteins 0.000 description 2
- HGEVZDLYZYVYHD-UHFFFAOYSA-N acetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound CC(O)=O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O HGEVZDLYZYVYHD-UHFFFAOYSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 239000001361 adipic acid Substances 0.000 description 2
- 235000011037 adipic acid Nutrition 0.000 description 2
- 235000019418 amylase Nutrition 0.000 description 2
- 229940054340 bacillus coagulans Drugs 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 229910000019 calcium carbonate Inorganic materials 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 230000021523 carboxylation Effects 0.000 description 2
- 238000006473 carboxylation reaction Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 235000010980 cellulose Nutrition 0.000 description 2
- 235000013351 cheese Nutrition 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 210000000969 egg white Anatomy 0.000 description 2
- 235000014103 egg white Nutrition 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 229930182470 glycoside Natural products 0.000 description 2
- 150000002338 glycosides Chemical class 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 2
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 2
- 235000012736 patent blue V Nutrition 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 238000009938 salting Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 2
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 2
- 239000012064 sodium phosphate buffer Substances 0.000 description 2
- 229940048086 sodium pyrophosphate Drugs 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 229940115922 streptococcus uberis Drugs 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 2
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 150000003628 tricarboxylic acids Chemical class 0.000 description 2
- 210000002268 wool Anatomy 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- TWNIBLMWSKIRAT-RWOPYEJCSA-N (1r,2s,3s,4s,5r)-6,8-dioxabicyclo[3.2.1]octane-2,3,4-triol Chemical compound O1[C@@]2([H])OC[C@]1([H])[C@@H](O)[C@H](O)[C@@H]2O TWNIBLMWSKIRAT-RWOPYEJCSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- OCUSNPIJIZCRSZ-ZTZWCFDHSA-N (2s)-2-amino-3-methylbutanoic acid;(2s)-2-amino-4-methylpentanoic acid;(2s,3s)-2-amino-3-methylpentanoic acid Chemical compound CC(C)[C@H](N)C(O)=O.CC[C@H](C)[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O OCUSNPIJIZCRSZ-ZTZWCFDHSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- JAHNSTQSQJOJLO-UHFFFAOYSA-N 2-(3-fluorophenyl)-1h-imidazole Chemical compound FC1=CC=CC(C=2NC=CN=2)=C1 JAHNSTQSQJOJLO-UHFFFAOYSA-N 0.000 description 1
- YEJRWHAVMIAJKC-UHFFFAOYSA-N 4-Butyrolactone Chemical compound O=C1CCCO1 YEJRWHAVMIAJKC-UHFFFAOYSA-N 0.000 description 1
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 101150008391 A1 gene Proteins 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000432824 Asparagus densiflorus Species 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 241000308822 Aspergillus fumigatus Af293 Species 0.000 description 1
- 101001082821 Aspergillus niger Pyruvate carboxylase Proteins 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- 101900333744 Aspergillus terreus Pyruvate carboxylase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical compound OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101100494262 Caenorhabditis elegans best-12 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 241000324343 Causa Species 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241001466517 Ceriporiopsis aneirina Species 0.000 description 1
- 241001646018 Ceriporiopsis gilvescens Species 0.000 description 1
- 241001277875 Ceriporiopsis rivulosa Species 0.000 description 1
- 241000524302 Ceriporiopsis subrufa Species 0.000 description 1
- 241000259840 Chaetomidium Species 0.000 description 1
- 241001057137 Chaetomium fimeti Species 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000221760 Claviceps Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241001085790 Coprinopsis Species 0.000 description 1
- 241001509964 Coptotermes Species 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 241001362614 Crassa Species 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-WUJLRWPWSA-N D-xylulose Chemical compound OC[C@@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-WUJLRWPWSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- QXNVGIXVLWOKEQ-UHFFFAOYSA-N Disodium Chemical compound [Na][Na] QXNVGIXVLWOKEQ-UHFFFAOYSA-N 0.000 description 1
- 241000223924 Eimeria Species 0.000 description 1
- 241001063191 Elops affinis Species 0.000 description 1
- 235000007810 Eryngium campestre Nutrition 0.000 description 1
- 240000005980 Eryngium maritimum Species 0.000 description 1
- 235000003933 Eryngium maritimum Nutrition 0.000 description 1
- 235000002756 Erythrina berteroana Nutrition 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000146398 Gelatoporia subvermispora Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241001497663 Holomastigotoides Species 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 241000223199 Humicola grisea Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 108010020056 Hydrogenase Proteins 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- 241000222342 Irpex Species 0.000 description 1
- 241000222344 Irpex lacteus Species 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 108010029541 Laccase Proteins 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000222435 Lentinula Species 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241000986493 Magnaporthe oryzae 70-15 Species 0.000 description 1
- 108050000210 Malic acid transport proteins Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000183011 Melanocarpus Species 0.000 description 1
- 241001184659 Melanocarpus albomyces Species 0.000 description 1
- 241000123315 Meripilus Species 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241001072230 Oceanobacillus Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- 241000222397 Phlebia radiata Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- 241000233622 Phytophthora infestans Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 241001451060 Poitrasia Species 0.000 description 1
- 241000222640 Polyporus Species 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 240000004350 Prunus spinosa Species 0.000 description 1
- 235000010829 Prunus spinosa Nutrition 0.000 description 1
- 241000383860 Pseudoplectania Species 0.000 description 1
- 241001497658 Pseudotrichonympha Species 0.000 description 1
- 108010011939 Pyruvate Decarboxylase Proteins 0.000 description 1
- 240000005384 Rhizopus oryzae Species 0.000 description 1
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 101100076264 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MDH1 gene Proteins 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 235000017276 Salvia Nutrition 0.000 description 1
- 240000007164 Salvia officinalis Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241000182980 Thielavia ovispora Species 0.000 description 1
- 241000183053 Thielavia subthermophila Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000222357 Trametes hirsuta Species 0.000 description 1
- 241000222355 Trametes versicolor Species 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000215642 Trichophaea Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241001507667 Volvariella Species 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 101150078331 ama-1 gene Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 101150039403 ams gene Proteins 0.000 description 1
- 210000003423 ankle Anatomy 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- QLULGSLAHXLKSR-UHFFFAOYSA-N azane;phosphane Chemical compound N.P QLULGSLAHXLKSR-UHFFFAOYSA-N 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 210000003323 beak Anatomy 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 1
- WERYXYBDKMZEQL-UHFFFAOYSA-N butane-1,4-diol Chemical compound OCCCCO WERYXYBDKMZEQL-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N carbon dioxide Natural products O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013065 commercial product Substances 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000008473 connective tissue growth Effects 0.000 description 1
- 239000012531 culture fluid Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 108010091371 endoglucanase 1 Proteins 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 229940093915 gynecological organic acid Drugs 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 239000003317 industrial substance Substances 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000010829 isocratic elution Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000000622 liquid--liquid extraction Methods 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 229940049920 malate Drugs 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- LVHBHZANLOWSRM-UHFFFAOYSA-N methylenebutanedioic acid Natural products OC(=O)CC(=C)C(O)=O LVHBHZANLOWSRM-UHFFFAOYSA-N 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- QXYJCZRRLLQGCR-UHFFFAOYSA-N molybdenum(IV) oxide Inorganic materials O=[Mo]=O QXYJCZRRLLQGCR-UHFFFAOYSA-N 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 1
- 235000019799 monosodium phosphate Nutrition 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- 238000005373 pervaporation Methods 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 229920006393 polyether sulfone Polymers 0.000 description 1
- 229920000151 polyglycol Polymers 0.000 description 1
- 239000010695 polyglycol Substances 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010025 steaming Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229940076156 streptococcus pyogenes Drugs 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- HNBDQABBWNOTRU-UHFFFAOYSA-N thalline Chemical compound C1=CC=[Tl]C=C1 HNBDQABBWNOTRU-UHFFFAOYSA-N 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 229960003487 xylose Drugs 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
- C12P7/46—Dicarboxylic acids having four or less carbon atoms, e.g. fumaric acid, maleic acid
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/38—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Aspergillus
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- General Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
本发明涉及产生C4-二羧酸如苹果酸的方法,其包括:(a)培养包含编码C4-二羧酸转运蛋白的多核苷酸的宿主细胞;和(b)回收所述C4-二羧酸。本发明亦涉及增加C4-二羧酸产生的方法,以及包含所述多核苷酸的宿主细胞。
Description
涉及序列表
本申请包含计算机可读形式的序列表,其通过提述并入本文。
发明背景
技术领域
本发明涉及用于在丝状真菌中改善C4-二羧酸(例如苹果酸)的产生的方法。
背景技术
有机酸在多种工业中具有悠久历史的商业使用。举例而言,有机酸用于食品和饲料工业(柠檬酸、抗坏血酸、乳酸、乙酸和葡糖酸),作为用于产生多种聚合物的单体(己二酸、乳酸、丙烯酸和衣康酸),作为金属螯合剂(葡糖酸)和作为“绿色”溶剂(乙酸)(Sauer等,2008,TrendsinBiotechnology26:100-108)。有机酸自身可为商业产品或其可为用于制造其他化学品的化学构件(buildingblock)。除了专门用途之外,长久以来公认C4-二羧酸亦可充当构件化合物以供产生大体积的工业化学品,如1,4-丁二醇,四氢呋喃和γ-丁内酯。由于石油衍生构件的高成本,通过传统石油化学途径产生这些大体积工业化学品的成本显著增加。
有机酸在商业上是通过从石油衍生原料的化学合成(例如,延胡索酸、苹果酸、丙烯酸和己二酸)或通过微生物发酵(例如柠檬酸、乳酸、葡糖酸和衣康酸)产生的。一些有机酸如延胡索酸和苹果酸亦可通过微生物发酵来产生,但由于更低的生产成本,目前在商业上仍通过化学合成从石油化学原料产生。然而,石油衍生构件化学品的成本的日益升高,地缘政治的不稳定性对原油价格的影响,以及对实施利用来源于可再生资源的原料的制造工艺的期望,刺激了通过微生物发酵产生有机酸和其他化学品中的重建的兴趣。
虽然现在通过化学合成从石油化学原料商业性产生苹果酸,其亦可通过微生物发酵产生。苹果酸已在基因工程改造的酵母(酿酒酵母(Saccharomycescerevisia))(Zelle等,2008,Appl.Environ.Microbiol.74:2766-2777)和天然存在的丝状真菌如曲霉属菌种(Aspergillusspp.)(美国专利号3,063,910;Bercovitz等,1990,Appl.Environ.Microbiol.56:1594-1597)中以高水平产生。Abe等(美国专利号3,063,910)和Bercovitz等(1990,Appl.Environ.Microbiol.56:1594-1597)报道了在几种曲霉属菌种中高水平的苹果酸产生。而且,Battat等(1991,Biotechnol.Bioengineering,37:1108-1116)报道了在优化条件下在搅拌的发酵罐中由黄曲霉(Aspergillusflavus)产生了高至113g/L的苹果酸。在WO2010/003728中描述了在酵母中通过微生物发酵产生二羧酸。亦在WO2009/011974和WO2009/155382中描述了通过微生物发酵产生苹果酸。通过对曲霉属(Aspergillus)进行遗传工程改造改善苹果酸产生会使得能够通过发酵经济地商业性生产苹果酸。
在曲霉属菌种(Aspergillusspp.)中的苹果酸过量产生在特定的培养条件(有氧条件和高C:N比;碳酸钙亦作为中和剂和作为用于苹果酸生物合成的CO2源添加)下发生。在这些条件下,通过胞质溶胶的、还原性三羧酸(TCA)循环的溢出代谢(overflowmetabolism)导致增加的苹果酸生物合成和分泌入培养基。已在酿酒酵母中报道了通过使用遗传工程增加丙酮酸羧化酶(Bauer等,1999,FEMSMicrobiolLett.179:107-113)或苹果酸脱氢酶(Pines等,1997,Appl.Microbiol.Biotechnol.48:248-255)的水平和增加苹果酸转运蛋白的表达(Zelle等,2008,见上)增加苹果酸产生。基于生物化学证据,提出了在黄曲霉菌株ATCC13697中,苹果酸脱氢酶活性限制苹果酸产生(Peleg等,1988,Appl.Microbiol.Biotechnol.28:69-75)。2010年8月27日提交、标题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”的PCT申请号PCT/US10/47002(其内容通过提述以其整体并入本文)描述了在丝状真菌中的苹果酸产生。
在本领域中,在曲霉属中作为使用重组DNA技术的遗传工程改造的结果而改善C4-二羧酸产生如苹果酸产生会是有益的。本发明提供了用于改善C4-二羧酸产生(例如如苹果酸产生)的方法等。
发明内容
本发明涉及产生C4-二羧酸(例如苹果酸)的方法。在一个方面,该方法包括:(a)培养宿主细胞(例如丝状真菌宿主细胞),所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸;和(b)回收所述C4-二羧酸(例如苹果酸)。在另一个方面,该方法包括(a)将编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞(例如丝状真菌宿主细胞);(b)在培养基中培养经转化的生物;和(c)回收所述C4-二羧酸(例如苹果酸)。在所述方法的一些方面,所述宿主细胞进一步包含编码苹果酸脱氢酶和/或丙酮酸羧化酶的异源多核苷酸。
本发明还涉及宿主细胞(例如丝状真菌宿主细胞,如米曲霉(Aspergillusoryzae)),所述宿主细胞包含本文中所述的多核苷酸,其中所述宿主细胞分泌和/或能够分泌增加水平的C4-二羧酸(例如苹果酸)。在一些方面,所述宿主细胞进一步包含编码苹果酸脱氢酶和/或丙酮酸羧化酶的异源多核苷酸。
附图说明
图1显示pAcC4T的限制图谱。
图2显示pShTh60的限制图谱。
图3显示pShTh120AcC4T的限制图谱。
图4显示棒曲霉(Aspergillusclavatus)C4-二羧酸转运蛋白基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:1和2)。
图5显示pAfC4T的限制图谱。
图6显示pShTh121AfC4T的限制图谱。
图7显示烟曲霉(Aspergillusfumigates)C4-二羧酸转运蛋白基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:3和4)。
图8显示米曲霉(Aspergillusoryzae)NRRL3488苹果酸脱氢酶基因(mdh3)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:11和12)。
图9A和9B一同显示了米曲霉NRRL3488丙酮酸羧化酶(pyc)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:13和14)。
定义
C4-二羧酸转运蛋白:术语“C4-二羧酸转运蛋白”在本文中定义为可将苹果酸、琥珀酸、草酰乙酸、丙二酸和/或延胡索酸转运至细胞外的二羧酸通透酶(Grobler等,1995,Yeast11:1485-1491;Camarasa等,2001,AppliedandEnvironmentalMicrobiology67:4144-4151)。用于预测线粒体输入的蛋白及其靶向序列的计算方法由Claros和Vincens,1996,Eur.J.Biochem.241:779-786描述。
在一些方面,所述C4-二羧酸转运蛋白具有SEQIDNO:2的成熟多肽序列或SEQIDNO:4的成熟多肽序列的C4-二羧酸转运蛋白活性(例如苹果酸转运蛋白活性)的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%。
苹果酸脱氢酶:术语“苹果酸脱氢酶”在本文中定义为在NADH+H+的存在下催化将草酰乙酸还原为苹果酸和NAD+的苹果酸:NAD+氧还酶(EC1.1.1.37)。就本发明而言,根据下述步骤确定苹果酸脱氢酶活性。测定溶液由1mM草酰乙酸,100mMTrispH8.0,10mMNaHCO3,5mMMgCl2,和0.1mMNADH(SigmaChemicalCo.,St.Louis,MO,USA)组成。将不含草酰乙酸作为底物的测定溶液作为对照运行以测量背景NADH降解率。用双蒸水制备每种上清的1/100,1/500,1/2500和1/12500的稀释。将测定溶液的270μl的等分试样分配入96孔聚苯乙烯平底板。添加每种稀释的上清的30μl样品以起始测定。使用340PC读板器(MolecularDevices,Sunnyvale,CA,USA)以下述设定监测反应:340nm,动力学读取。使用NADH的浓度系列以构建标准曲线,并使用纯化的苹果酸脱氢酶(SigmaChemicalCo.,St.Louis,MO,USA)的稀释系列作为阳性对照。一单位的苹果酸脱氢酶活性等于能够在pH8.0,25℃每分钟将1微摩尔草酰乙酸和NADH+H+转化为苹果酸和NAD+的酶量。
在一些方面,所述苹果酸脱氢酶具有SEQIDNO:12的成熟多肽序列的苹果酸脱氢酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%。
丙酮酸羧化酶:术语“丙酮酸羧化酶”在本文中定义为在ATP和HCO3 -存在下催化将丙酮酸羧化为草酰乙酸、ADP和磷酸的丙酮酸:二氧化碳连接酶(ADP-形成)(EC6.4.1.1)。就本发明而言,根据针对丙酮酸羧化酶的QualityControlTest方法(SigmaChemicalCo.,St.Louis,MO,USA)的步骤确定丙酮酸羧化酶活性,只是该测定使用pH8.0的Tris缓冲液。一单位的丙酮酸羧化酶活性等于能够在pH7.8,30℃每分钟将1微摩尔的丙酮酸和CO2转化为草酰乙酸的酶量。
在一些方面,所述丙酮酸羧化酶具有SEQIDNO:14的成熟多肽序列的丙酮酸羧化酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%。
异源多核苷酸:术语“异源多核苷酸”在本文中定义为对于宿主细胞并非天然的多核苷酸;其中已对编码区进行结构修饰的天然多核苷酸;作为通过重组DNA技术(例如,不同的(外源)启动子)操纵DNA的结果其表达定量改变的天然多核苷酸;或其表达通过将一个或多个(例如,两个、几个)额外拷贝的多核苷酸导入宿主细胞而定量改变的天然多核苷酸。
分离的/纯化的:术语“分离的”和“纯化的”意指从至少一种与其天然结合(associated)的成分分离的多肽或多核苷酸。举例而言,如通过SDS-PAGE确定的,该多肽可为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,至少93%纯,至少95%纯,至少97%纯,至少98%纯,或至少99%纯;且如通过琼脂糖电泳确定的,该多核苷酸可为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,至少93%纯,至少95%纯,至少97%纯,至少98%纯,或至少99%纯。
编码序列:术语“编码序列”的意思是指定其蛋白产物的氨基酸序列的多核苷酸序列。编码序列的边界通常由开读框确定,所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是基因组DNA、cDNA、合成多核苷酸和/或重组多核苷酸。
cDNA序列:术语“cDNA序列”意指从得自真核细胞的成熟的、已剪接的mRNA分子在反转录之后所得的DNA。来自基因组DNA起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列包括剪接的步骤加工然后作为成熟的已剪接的mRNA出现。cDNA序列缺乏可存在于相应基因组DNA序列中的插入的内含子。相应地,短语“SEQIDNO:X的cDNA序列”意指将SEQIDNO:X中插入的内含子序列(若存在)去除之后所得的序列。在一些情况下—当参照的基因组DNA序列缺乏插入的内含子序列时—cDNA序列可与相应的基因组DNA序列完全相同。
基因组DNA序列:术语“基因组DNA序列”意指见于来源生物的基因组(例如真核或原核基因组)的DNA序列。在一些情况下,来自真核基因组的基因组DNA序列含有一个或多个插入的内含子序列,其作为RNA剪接的结果从初级RNA转录物去除。相应地,短语“SEQIDNO:Y的基因组DNA序列”意指来自来源生物的相应DNA序列,其含有在RNA剪接之前存在的插入的内含子序列(若存在)。
成熟多肽序列:术语“成熟多肽序列”意指参照的多核苷酸序列在任何翻译后序列修饰(如N端加工和/或C端截短)之后的部分。在一些情况下,所述成熟多肽序列可以与整个参照的多肽序列完全相同。在一个方面,基于预测SEQIDNO:2的氨基酸1至52为信号肽的Vector程序(Invitrogen,CA,USA),所述成熟多肽序列是SEQIDNO:2的氨基酸53至392。在另一个方面,所述成熟多肽序列是SEQIDNO:4的氨基酸1至393。
成熟多肽编码序列:术语“成熟多肽编码序列”意指参照的多核苷酸序列(例如基因组或cDNA序列)编码成熟多肽序列的部分。在一些情况下,所述成熟多肽编码序列可以与整个参照的多核苷酸序列完全相同。在一个方面,基于预测SEQIDNO:1的核苷酸1至156编码信号肽的Vector程序(Invitrogen,CA,USA),所述成熟多肽编码序列是SEQIDNO:1的核苷酸157至1179。在另一个方面,所述成熟多肽编码序列是SEQIDNO:3的核苷酸1至1182。
片段:术语“片段”意指从参照的多肽序列的氨基和/或羧基末端缺失了一个或多个(例如两个、几个)氨基酸的多肽。在一个方面,所述片段具有C4-二羧酸转运蛋白活性。在另一个方面,片段包含SEQIDNO:2的至少332个氨基酸残基,例如至少352个氨基酸残基或至少372个氨基酸残基。在另一个方面,片段包含SEQIDNO:4的至少332个氨基酸残基,例如至少352个氨基酸残基或至少372个氨基酸残基。
亚序列:术语“亚序列(subsequence)”意指从参照的核苷酸序列的5'和/或3'端缺失了一个或多个(例如两个、几个)核苷酸的多核苷酸。在一个方面,所述亚序列编码具有C4-二羧酸转运蛋白活性的片段。在另一个方面,亚序列包含SEQIDNO:1的至少996个核苷酸,例如至少1056个核苷酸或至少1116个核苷酸。在另一个方面,亚序列包含SEQIDNO:3的至少996个核苷酸,例如至少1056个核苷酸或至少1116个核苷酸。
等位变体(allelicvariant):术语“等位变体”意指占据相同染色体基因座的基因的任何两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
序列同一性:两个氨基酸序列间或两个核苷酸序列间的相关性由参数“序列同一性”所描述。
就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套组(TheEuropeanMolecularBiologyOpenSoftwareSuite),Rice等,2000,TrendsGenet.16:276-277)的Needle程序(优选为3.0.0版或之后的版本)中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)确定的。所用的可选参数为缺口开放罚分(gapopenpenalty)10,缺口延伸罚分(gapextensionpenalty)0.5,和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用标记为“最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算:
(相同的残基×100)/(比对长度-比对中缺口总数)
就本发明而言,两个脱氧核糖核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套组(TheEuropeanMolecularBiologyOpenSoftwareSuite),Rice等,2000,见上)的Needle程序(优选为3.0.0版或之后的版本)中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定的。所用的可选参数为缺口开放罚分10,缺口延伸罚分0.5,和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用标记为”最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算:
(相同的脱氧核糖核苷酸×100)/(比对长度-比对中缺口总数)。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,其分离自天然存在的基因,或经修饰以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段,或为合成的,其中所述核酸分子包含一个或多个(例如两个,几个)调控序列
调控序列(controlsequence):术语“调控序列”意指对于多肽表达必需的核酸序列。调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的,以及对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子序列、信号肽序列和转录终止子序列。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。
可操作地连接:术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。
表达载体:术语“表达载体”意指线性的或环状的DNA分子,其包含编码多肽的多核苷酸,并与调控序列可操作地连接,其中所述调控序列提供编码所述多肽的多核苷酸的表达。最少的情况,所述表达载体包含启动子序列,和转录和翻译终止信号序列。
宿主细胞:术语“宿主细胞”意指任何细胞类型,所述细胞类型对于用包含本发明的多核苷酸(例如编码C4-二羧酸转运蛋白的多核苷酸)的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖亲本细胞的任何后代,其由于在复制过程中发生的突变而不同于亲本细胞。
变体:术语“变体”意指在一个或多个位置包含变化即取代、插入和/或缺失一个或多个(例如两个、几个)氨基酸残基的,具有活性例如C4-二羧酸转运蛋白活性的多肽。取代意指将占据某位置的氨基酸用不同氨基酸替换;缺失意指去除占据某位置的氨基酸;而插入意指在占据某位置的氨基酸的相邻处添加一个或多个,例如1-3个氨基酸。
体积产量:术语“体积产量”指每单位时间每体积(例如,培养基及其中内含物的总体积)使用的系统所产生的参照的产物的量(例如,产生的C4-二羧酸的量)。
发酵培养基:术语“发酵培养基”指包含一种或多种(例如,两种,几种)糖如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性寡糖的培养基,其中所述培养基能够部分地通过宿主细胞转化(发酵)为所需产物,如C4-二羧酸。在一些情况下,所述发酵培养基源自天然来源,如甘蔗,淀粉,或纤维素,并可为通过酶水解(糖化)而预处理所述来源的结果。
在本文中,提及“约”某值或参数包括了涉及该值或参数本身的方面。举例而言,提及“约X”的描述包括了“X”的方面。
如用于本文中和所附权利要求中,除非上下文明确地表示相反,单数形式“一(个/种…)(a)”或“所述/该(the)”包括了对复数的提及。应理解本文中所述的发明的各方面包括了“由…组成(consisting)”和/或“基本上由…组成(consistingessentiallyof)”的方面。
除非另行定义或上下文明确指出,本文中使用的所有技术和科学术语具有与本发明所属领域的一般技术人员通常理解的相同的含意。
发明详述
本发明描述了特定基因在宿主细胞如丝状真菌(例如曲霉属(Aspergillus))中的过量表达以增强C4-二羧酸(例如苹果酸)的产生,其涵盖通过C4-二羧酸转运蛋白将C4-二羧酸转运至细胞外。在本发明中,所述C4-二羧酸转运蛋白可为任何适于实践本发明的、描述的C4-二羧酸转运蛋白。在一个方面,所述C4-二羧酸转运蛋白是在培养条件下过表达,以高效价产生C4-二羧酸的转运蛋白。所述重组宿主细胞可进一步包含编码苹果酸脱氢酶的异源多核苷酸和/或编码丙酮酸羧化酶的异源多核苷酸。
C4-二羧酸转运蛋白和编码C4-二羧酸转运蛋白的多核苷酸
在本文所述的重组宿主细胞和方法的一个方面,所述C4-二羧酸转运蛋白选自:(a)C4-二羧酸转运蛋白,其与SEQIDNO:2或SEQIDNO:4或其成熟多肽序列具有至少60%序列同一性;(b)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件下与SEQIDNO:1或3,或其成熟多肽编码序列,或前述序列的全长互补链杂交;(c)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链具有至少60%序列同一性;(d)SEQIDNO:2或SEQIDNO:4或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。
在一个方面,所述C4-二羧酸转运蛋白包含或组成为氨基酸序列,所述氨基酸序列与SEQIDNO:2或4,或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一个方面,所述C4-二羧酸转运蛋白包含氨基酸序列,所述氨基酸序列与SEQIDNO:2或4,或其成熟多肽序列相差不多于十个氨基酸,例如不多于五个氨基酸,不多于四个氨基酸,不多于三个氨基酸,不多于两个氨基酸,或一个氨基酸。
在一个方面,所述C4-二羧酸转运蛋白包含或组成为氨基酸序列,所述氨基酸序列与SEQIDNO:2或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在一个方面,所述C4-二羧酸转运蛋白包含氨基酸序列,所述氨基酸序列与SEQIDNO:2或其成熟多肽序列相差不多于十个氨基酸,例如不多于五个氨基酸,不多于四个氨基酸,不多于三个氨基酸,不多于两个氨基酸,或一个氨基酸。在另一个方面,所述C4-二羧酸转运蛋白包含氨基酸序列,所述氨基酸序列与SEQIDNO:4或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。在另一个方面,所述C4-二羧酸转运蛋白包含氨基酸序列,所述氨基酸序列与SEQIDNO:4或其成熟多肽序列相差不多于十个氨基酸,例如不多于五个氨基酸,不多于四个氨基酸,不多于三个氨基酸,不多于两个氨基酸,或一个氨基酸。
在一个方面,所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的氨基酸序列,SEQIDNO:2的成熟多肽序列,其等位变体,或前述序列的具有C4-二羧酸转运蛋白活性的序列。在另一个方面,所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的氨基酸序列。在另一个方面,所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的成熟多肽序列。在另一个方面,所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的氨基酸1至392。
在一个方面,所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:4的氨基酸序列,SEQIDNO:4的成熟多肽序列,其等位变体,或前述序列的具有C4-二羧酸转运蛋白活性的序列。在另一个方面,所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:4的氨基酸序列。在另一个方面,所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:4的成熟多肽序列。在另一个方面,所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:4的氨基酸1至393。
在一个方面,所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸在至少低严格条件,例如中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链(参见,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。
在一个方面,所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸在至少低严格条件,例如中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1,其成熟多肽编码序列;或前述序列的全长互补链。在另一个方面,所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸在至少低严格条件,例如中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:3,其成熟多肽编码序列;或前述序列的全长互补链。
在一个方面,所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸与SEQIDNO:1,其成熟多肽编码序列,或前述序列的全长互补链具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸与SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述C4-二羧酸转运蛋白由SEQIDNO:1或3,或其成熟多肽编码序列编码。在一个方面,所述C4-二羧酸转运蛋白由SEQIDNO:1或其成熟多肽编码序列编码。在一个方面,所述C4-二羧酸转运蛋白由SEQIDNO:1编码。在一个方面,所述C4-二羧酸转运蛋白由SEQIDNO:3或其成熟多肽编码序列编码。在一个方面,所述C4-二羧酸转运蛋白由SEQIDNO:3编码。在一个方面,所述C4-二羧酸转运蛋白由SEQIDNO:1或3的亚序列编码,其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面,所述C4-二羧酸转运蛋白由SEQIDNO:1的亚序列编码,其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面,所述C4-二羧酸转运蛋白由SEQIDNO:3的亚序列编码,其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。
在一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:2或4或其成熟多肽编码序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体。在一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:2的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:2的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:4的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:4的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或插入的变体。
优选地,氨基酸改变的性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
或者,氨基酸改变具有这样的性质:使多肽的物理化学性质改变。例如,氨基酸改变可改善多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的活性(例如C4-二羧酸转运蛋白活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来确定。参见例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断,所述多肽与参照的亲本多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法接着进行有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochemistry30:10832-10837;美国专利No.5,223,409;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域中的标准方法快速测序。这些方法允许快速确定多肽中单个氨基酸残基的重要性。
在一些方面,SEQIDNO:2或4,或其成熟多肽序列的氨基酸取代、缺失和/或插入的总数不多于10,例如不多于1,2,3,4,5,6,7,8或9。
在另一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:2或4,或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:2或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面,所述片段含有SEQIDNO:2的至少332个氨基酸残基,例如至少352个氨基酸残基,或至少372个氨基酸残基。在一个方面,所述片段含有C4-二羧酸转运蛋白域,例如,SEQIDNO:2的氨基酸39至337的推定的转运蛋白域。在另一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:4或其成熟多肽序列的片段,其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面,所述片段含有SEQIDNO:4的至少332个氨基酸残基,例如至少352个氨基酸残基,或至少372个氨基酸残基。在一个方面,所述片段含有C4-二羧酸转运蛋白域,例如,SEQIDNO:4的氨基酸41至338的推定的转运蛋白域。
所述C4-二羧酸转运蛋白可为融合多肽或可切割的融合多肽,其中另一种多肽融合于本发明多肽的N端或C端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的调控下。融合蛋白亦可使用内蛋白(intein)技术构建,其中融合物在翻译后产生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。
融合多肽还可以包含在两个多肽之间的切割位点。一旦分泌了融合多肽,就切割所述位点,释放所述两个多肽。切割位点的实例包括,但不限于,公开于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512);Collins-Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248;以及Stevens,2003,DrugDiscoveryWorld4:35-48中的位点。
用于分离或克隆编码用于本文中提及的任何方面的多核苷酸—例如编码C4-二羧酸转运蛋白的多核苷酸—以及其它多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆多核苷酸。参见,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从曲霉属(Aspergillus)菌株,或其他或相关生物体克隆所述多核苷酸,并且因此可为例如核苷酸序列的多肽编码区的等位基因变体或种变体(speciesvariant)。
SEQIDNO:1或3的多核苷酸,或亚序列,以及SEQIDNO:2或4的氨基酸序列,或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码C4-二羧酸转运蛋白的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组DNA或cDNA杂交,以鉴定和分离其中相应的基因。这些探针可明显短于完整序列,例如长度上为至少14个核苷酸,至少25个核苷酸,至少35个核苷酸,或至少70个核苷酸。所述核酸探针可以更长,例如至少100个核苷酸,至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,或至少500个核苷酸的长度,可使用甚至更长的探针,如至少600个核苷酸,例如至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸的长度。DNA和RNA探针二者均可使用。通常将探针标记以供检测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。
可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选与上述探针杂交并且编码具有C4-二羧酸转运蛋白活性的多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO:1或3的成熟多肽编码序列,或它们的亚序列同源的克隆或DNA,所述载体材料优选用于Sounthern印迹。
就本发明而言,杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO:1或3,SEQIDNO:1或3的成熟多肽编码序列,或其全长互补链;或前述序列的亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。
在一个方面,核酸探针是SEQIDNO:1或3。在另一个方面,核酸探针是SEQIDNO:1或3的成熟多肽编码序列。在另一个方面,核酸探针是SEQIDNO:1的成熟多肽编码序列。在另一个方面,核酸探针是SEQIDNO:1。在另一个方面,核酸探针是SEQIDNO:3的成熟多肽编码序列。在另一个方面,核酸探针是SEQIDNO:3。在另一个方面,核酸探针是编码SEQIDNO:2的多肽或其片段的多核苷酸。在另一个方面,核酸探针是编码SEQIDNO:4的多肽或其片段的多核苷酸。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5XSSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。使用2XSSC、0.2%SDS在45℃(非常低严格性),在50℃(低严格性),在55℃(中严格性),在60℃(中-高严格性),在65℃(高严格性),和在70℃(非常高严格性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比使用根据Bolton和McCarthy计算法(1962,Proc.Natl.Acad.Sci.USA48:1390)计算的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodiumpyrophosphate),1mM磷酸二氢钠(sodiummonobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。将所述载体材料在6×SSC加0.1%SDS中最终洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度洗涤两次,每次15分钟。
本发明C4-二羧酸转运蛋白可以获得自任何属的微生物。如用于本文,与给定的来源有关的术语“获得自”,意思应为由多核苷酸编码的多肽由所述来源产生,或由其中插入了来自所述来源的多核苷酸的细胞产生。
所述C4-二羧酸转运蛋白可以是细菌C4-二羧酸转运蛋白。例如,所述C4-二羧酸转运蛋白可以是革兰氏阳性细菌多肽例如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)C4-二羧酸转运蛋白;或革兰氏阴性细菌多肽,如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)C4-二羧酸转运蛋白。
在一个方面,所述C4-二羧酸转运蛋白是嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)C4-二羧酸转运蛋白。
在另一个方面,所述C4-二羧酸转运蛋白是似马链球菌(Streptococcusequisimilis)、酿脓链球菌(Streptococcuspyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽瘟亚种(Streptococcusequisubsp.Zooepidemicus)C4-二羧酸转运蛋白。
在另一个方面,所述C4-二羧酸转运蛋白是不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)C4-二羧酸转运蛋白。
所述C4-二羧酸转运蛋白可为真菌C4-二羧酸转运蛋白。在一个方面,所述真菌C4-二羧酸转运蛋白为酵母C4-二羧酸转运蛋白,如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)C4-二羧酸转运蛋白。
在另一个方面,所述C4-二羧酸转运蛋白是丝状真菌C4-二羧酸转运蛋白,如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cyphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)C4-二羧酸转运蛋白。
在另一个方面,所述C4-二羧酸转运蛋白是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)C4-二羧酸转运蛋白。
在另一个方面,所述C4-二羧酸转运蛋白是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、棒曲霉(Aspergillusclavatus)、泡盛曲霉(Aspergillusawamori)、黄曲霉、烟曲霉(Aspergillusfumigatus)、臭曲霉(Asperigullusfoetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉、酱油曲霉(Aspergillussojae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、毡金孢子菌(Chrysosporiumpannicola)、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、杆孢状镰孢(Fusariumbactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusariumroseum)、接骨木镰孢(Fusariumsambucinum)、肤色镰孢(Fusariumsarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusariumsulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusariumvenenatum)、灰腐质霉(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、白耙齿菌(Irpexlacteus)、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaetechrysosporium)、无色梭孢壳(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭孢壳(Thielaviaaustraleinsis)、Thielaviafimeti、小孢梭孢壳(Thielaviamicrospora)、卵孢梭孢壳(Thielaviaovispora)、Thielaviaperuviana、瘤孢梭孢壳(Thielaviaspededonium)、毛梭孢壳(Thielaviasetosa)、Thielaviasubthermophila、土生梭孢霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)C4-二羧酸转运蛋白。
在一个方面,所述C4-二羧酸转运蛋白是曲霉属C4-二羧酸转运蛋白,如棒曲霉C4-二羧酸转运蛋白或烟曲霉C4-二羧酸转运蛋白。在一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:2的棒曲霉C4-二羧酸转运蛋白。在另一个方面,所述C4-二羧酸转运蛋白是SEQIDNO:4的烟曲霉C4-二羧酸转运蛋白。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。
亦可使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物,或直接从自然材料(例如,土壤、堆肥、水等)获得的DNA样品鉴定和获得所述C4-二羧酸转运蛋白。用于从天然生境(habitat)分离微生物和DNA的技术是本领域内公知的。然后可通过相似地筛选另一种微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码C4-二羧酸转运蛋白的多核苷酸。一旦用如本文中所述的合适探针检测到编码C4-二羧酸转运蛋白的多核苷酸,就能够使用本领域普通技术人员已知的技术将所述序列分离或克隆(参见,例如,J.Sambrook,E.F.Fritsch和T.Maniatus,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。
苹果酸脱氢酶和编码苹果酸脱氢酶的多核苷酸
在重组宿主细胞及其使用方法的一些方面,所述宿主细胞具有苹果酸脱氢酶活性。在一些方面,所述宿主细胞包含编码苹果酸脱氢酶的异源多肽。所述苹果酸脱氢酶可为任何适于实践本发明的苹果酸脱氢酶。在一个方面,所述苹果酸脱氢酶是存在于宿主细胞胞质溶胶中的酶。
在本文所述的重组宿主细胞和方法的一个方面,所述苹果酸脱氢酶是:(a)苹果酸脱氢酶,其与SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性;(b)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:(i)SEQIDNO:11,或其成熟多肽编码序列,(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸与以下具有至少60%序列同一性:(iv)SEQIDNO:11,或其成熟多肽编码序列,(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链;(d)SEQIDNO:12或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的苹果酸脱氢酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段。
在一个方面,所述苹果酸脱氢酶包含或组成为氨基酸序列,所述氨基酸序列与SEQIDNO:12或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%序列同一性。在一个方面,所述苹果酸脱氢酶包含氨基酸序列,所述氨基酸序列与SEQIDNO:12或其成熟多肽序列相差不多于十个氨基酸,例如不多于五个氨基酸,不多于四个氨基酸,不多于三个氨基酸,不多于两个氨基酸,或一个氨基酸。
在一个方面,所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸序列,SEQIDNO:12的成熟多肽序列,其等位变体,或前述的具有苹果酸脱氢酶活性的序列。在另一个方面,所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸序列。在另一个方面,所述苹果酸脱氢酶包含或组成为SEQIDNO:12的成熟多肽序列。在另一个方面,所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸1至330。
在一个方面,所述苹果酸脱氢酶由多核苷酸编码,所述多核苷酸在至少低严格条件,例如中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:(i)SEQIDNO:11或其成熟多肽编码序列,(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链(参见,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,见上文)。
在一个方面,所述苹果酸脱氢酶由多核苷酸编码,所述多核苷酸与(iv)SEQIDNO:11或其成熟多肽编码序列,(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述苹果酸脱氢酶由SEQIDNO:11,或其成熟多肽编码序列编码。在一个方面,所述苹果酸脱氢酶由SEQIDNO:11编码。在一个方面,所述苹果酸脱氢酶由SEQIDNO:11的成熟多肽编码序列编码。在一个方面,所述苹果酸脱氢酶由SEQIDNO:11的亚序列编码,其中所述亚序列编码具有苹果酸脱氢酶活性的多肽。在一个方面,所述亚序列含有SEQIDNO:11的至少885个核苷酸,例如至少930个核苷酸或至少975个核苷酸。
在一个方面,所述苹果酸脱氢酶为SEQIDNO:12或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体,如上文所述。在一个方面,所述苹果酸脱氢酶为SEQIDNO:12的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面,所述苹果酸脱氢酶为SEQIDNO:12的成熟多肽序列的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一些方面,SEQIDNO:12或其成熟多肽序列的氨基酸取代、缺失和/或插入的总数不多于10,例如不多于1,2,3,4,5,6,7,8或9。
在另一个方面,所述苹果酸脱氢酶是SEQIDNO:12或其成熟多肽序列的片段,其中所述片段具有苹果酸脱氢酶活性。在一个方面,所述的片段含有SEQIDNO:12的至少295个氨基酸残基,例如至少310个氨基酸残基,或至少325个氨基酸残基。
所述苹果酸脱氢酶亦可为苹果酸脱氢酶的等位变体或人工变体。
所述苹果酸脱氢酶亦可包括融合多肽或可切割的融合多肽,如上文所述。
用于分离或克隆编码苹果酸脱氢酶的多核苷酸的技术如上文中所述。
SEQIDNO:11的多核苷酸;或其亚序列;以及SEQIDNO:12的氨基酸序列;或其片段;可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码苹果酸脱氢酶的DNA,如上文中所述。本发明涵盖此类探针。可对从此类其它生物制备的基因组DNA或cDNA筛选与如上所述的探针杂交并编码苹果酸脱氢酶的DNA,如上文中所述。
在一个方面,所述核酸探针为SEQIDNO:11。在另一个方面,所述核酸探针为SEQIDNO:11的成熟多肽编码序列。在另一个方面,所述核酸探针是多核苷酸序列,其编码SEQIDNO:12,其成熟多肽序列或前述序列的片段。
对于长度至少100个核苷酸的长探针,非常低至非常高的严格条件和洗涤条件如上文中所述定义。对于长度大约15个核苷酸至大约70个核苷酸的短探针,严格条件和洗涤条件如上文中所述定义。
所述苹果酸脱氢酶可获得自任何属的微生物。在一个方面,所述苹果酸脱氢酶可为从本文中所述的微生物获得的细菌、酵母或丝状真菌苹果酸脱氢酶。在另一个方面,所述苹果酸脱氢酶是米曲霉苹果酸脱氢酶,例如SEQIDNO:12的米曲霉苹果酸脱氢酶。
其它可用于实践本发明的苹果酸脱氢酶包括但不限于:构巢曲霉苹果酸脱氢酶(AN6717.1;SIMS等,2004,Mycol.Res.108:853-857);黑曲霉苹果酸脱氢酶(An16g00120;Pel等,2007,NatureBiotechnology25:221-231);Phytophthorainfestans苹果酸脱氢酶(PITG13614.1;Calcagno等,2009,MycologicalResearch113:771-781);酿酒酵母苹果酸脱氢酶(YKL085W;McAlister-Henn和Thompson,1987,JBacteriol.169:5157-5166);埃默森踝节菌苹果酸脱氢酶(AF439996,AF487682;Maloney等,2004,Eur.J.Biochem.271:3115-3126);以及玉蜀黍黑粉菌(Ustilagomaydis)苹果酸脱氢酶(um00403,um11161;McCann和Snetselaar,2008,FungalGeneticsandBiology45:S77–S87),SEQIDNO:16的米曲霉苹果酸脱氢酶(其由SEQIDNO:15的核苷酸序列所编码;参见美国申请号12/870,523,标题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”,2010年8月27日提交),或任何相应的参考文献中所述的苹果酸脱氢酶的任何方面。
本发明涵盖将本文中所述的序列同一性、杂交、变体和片段的任何方面适用于其它如上所述的苹果酸脱氢酶多肽序列和多核苷酸序列。举例而言,在一个方面,所述苹果酸脱氢酶是(a)苹果酸脱氢酶,其与SEQIDNO:16或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(b)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸在低严格条件,例如中等严格条件,中等-高严格条件,高严格条件或非常高严格条件下与以下杂交:(i)SEQIDNO:15或其成熟多肽编码序列,(ii)SEQIDNO:15的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸与(iv)SEQIDNO:15或其成熟多肽编码序列,(v)SEQIDNO:15的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;(d)SEQIDNO:16或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的苹果酸脱氢酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段。
所述苹果酸脱氢酶亦可从其它来源鉴定和获取,所述来源包括从自然界(例如土壤、堆肥、水等)分离的微生物或直接从自然材料(例如土壤、堆肥、水等)获得的DNA样品,如上文中所述。
丙酮酸羧化酶和编码丙酮酸羧化酶的多核苷酸
在重组宿主细胞及其使用方法的一些方面,所述宿主细胞具有丙酮酸羧化酶活性。在一些方面,所述宿主细胞包含编码丙酮酸羧化酶的异源多肽。所述丙酮酸羧化酶可为任何适于实践本发明的丙酮酸羧化酶。在一个方面,所述丙酮酸羧化酶是存在于宿主细胞胞质溶胶中的酶。
在本文所述的重组宿主细胞和方法的一个方面,所述丙酮酸羧化酶是:(a)丙酮酸羧化酶,其与SEQIDNO:14或其成熟多肽序列具有至少60%序列同一性;(b)丙酮酸羧化酶,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:(i)SEQIDNO:13,或其成熟多肽编码序列,(ii)SEQIDNO:13的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)丙酮酸羧化酶,其由多核苷酸编码,所述多核苷酸与以下具有至少60%序列同一性:(iv)SEQIDNO:13,或其成熟多肽编码序列,(v)SEQIDNO:13的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链;(d)SEQIDNO:14或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的丙酮酸羧化酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有丙酮酸羧化酶活性的片段。
在一个方面,所述丙酮酸羧化酶包含或组成为氨基酸序列,所述氨基酸序列与SEQIDNO:14或其成熟多肽序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%序列同一性。在一个方面,所述丙酮酸羧化酶包含氨基酸序列,所述氨基酸序列与SEQIDNO:14或其成熟多肽序列相差不多于十个氨基酸,例如不多于五个氨基酸,不多于四个氨基酸,不多于三个氨基酸,不多于两个氨基酸,或一个氨基酸。
在一个方面,所述丙酮酸羧化酶包含或组成为SEQIDNO:14的氨基酸序列,SEQIDNO:14的成熟多肽序列,其等位变体,或前述序列的具有丙酮酸羧化酶活性的序列。在另一个方面,所述丙酮酸羧化酶包含或组成为SEQIDNO:14的氨基酸序列。在另一个方面,所述丙酮酸羧化酶包含或组成为SEQIDNO:14的成熟多肽序列。在另一个方面,所述丙酮酸羧化酶包含或组成为SEQIDNO:14的氨基酸1至1193。
在一个方面,所述丙酮酸羧化酶由多核苷酸编码,所述多核苷酸在至少低严格条件,例如中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:(i)SEQIDNO:13或其成熟多肽编码序列,(ii)SEQIDNO:13的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链(参见,例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,见上文)。
在一个方面,所述丙酮酸羧化酶由多核苷酸编码,所述多核苷酸与(iv)SEQIDNO:13或其成熟多肽编码序列,(v)SEQIDNO:13的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
在一个方面,所述丙酮酸羧化酶由SEQIDNO:13,或其成熟多肽编码序列编码。在一个方面,所述丙酮酸羧化酶由SEQIDNO:13编码。在一个方面,所述丙酮酸羧化酶由SEQIDNO:13的成熟多肽编码序列编码。在一个方面,所述丙酮酸羧化酶由SEQIDNO:13的亚序列编码,其中所述亚序列编码具有丙酮酸羧化酶活性的多肽。在一个方面,所述亚序列含有SEQIDNO:13的至少3060个核苷酸,例如至少3240个核苷酸或至少3420个核苷酸。
在一个方面,所述丙酮酸羧化酶为SEQIDNO:14或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体,如上文所述。在一个方面,所述丙酮酸羧化酶为SEQIDNO:14的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面,所述丙酮酸羧化酶为SEQIDNO:14的成熟多肽序列的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一些方面,SEQIDNO:14或其成熟多肽序列的氨基酸取代、缺失和/或插入的总数不多于14,例如不多于1,2,3,4,5,6,7,8或9。
在另一个方面,所述丙酮酸羧化酶是SEQIDNO:14或其成熟多肽序列的片段,其中所述片段具有丙酮酸羧化酶活性。在一个方面,所述的片段含有SEQIDNO:14的至少1020个氨基酸残基,例如至少1080个氨基酸残基,或至少1140个氨基酸残基。
所述丙酮酸羧化酶亦可为丙酮酸羧化酶的等位变体或人工变体。
所述丙酮酸羧化酶亦可包括融合多肽或可切割的融合多肽,如上文所述。
所述丙酮酸羧化酶可为线粒体丙酮酸羧化酶的变体,使得体内输入线粒体减少,由此增加所述丙酮酸羧化酶在胞质溶胶中的水平。
用于分离或克隆编码丙酮酸羧化酶的多核苷酸的技术如上文中所述。
SEQIDNO:13的多核苷酸;或其亚序列;以及SEQIDNO:14的氨基酸序列;或其片段;可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码丙酮酸羧化酶的DNA,如上文中所述。本发明涵盖此类探针。可对从此类其它生物制备的基因组DNA或cDNA筛选与如上所述的探针杂交并编码丙酮酸羧化酶的DNA,如上文所述。
在一个方面,所述核酸探针为SEQIDNO:13。在另一个方面,所述核酸探针为SEQIDNO:13的成熟多肽编码序列。在另一个方面,所述核酸探针是多核苷酸序列,其编码SEQIDNO:14,其成熟多肽序列或前述序列的片段。
对于长度至少100个核苷酸的长探针,非常低至非常高的严格条件和洗涤条件如上文中所述定义。对于长度大约15个核苷酸至大约70个核苷酸的短探针,严格条件和洗涤条件如上文中所述定义。
所述丙酮酸羧化酶可获得自任何属的微生物。在一个方面,所述丙酮酸羧化酶可为从本文中所述的微生物获得的细菌、酵母或丝状真菌丙酮酸羧化酶。在另一个方面,所述丙酮酸羧化酶是米曲霉丙酮酸羧化酶,例如SEQIDNO:14的米曲霉丙酮酸羧化酶。
其它可用于实施本发明的丙酮酸羧化酶包括但不限于:棒曲霉(Aspergillusclavatus)NRRL1丙酮酸羧化酶(XP_001271664;DirectSubmission,Submitted(26-OCT-2006),TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA);烟曲霉Af293丙酮酸羧化酶(XP_752054;Nierman等,2005,Nature438:1151-1156);构巢曲霉FGSCA4丙酮酸羧化酶(XP_662066;Galagan等,2005,Nature438:1105-1115);黑曲霉丙酮酸羧化酶(An15g02820;Pel等,2007,NatureBiotechnology25:221-231;ASPNG5061;Panneman等,(JUL-1998)提交至EMBL/GenBank/DDBJ数据库);土曲霉丙酮酸羧化酶(O93918;DirectSubmission,Submitted(OCT-1998)TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA);Magnaporthegrisea70-15丙酮酸羧化酶(XP_367852;DirectSubmission,Submitted(26-SEP-2005)BroadInstituteofMITandHarvard,320CharlesStreet,Cambridge,MA02142,USA);粗糙脉孢菌OR74A丙酮酸羧化酶(XP_965636;Galagan等,2003,Nature422:859-868);米根霉(Rhizopusoryzae)丙酮酸羧化酶(RO3G_06931.1);酿酒酵母丙酮酸羧化酶(NP_009777;Gaffeau等,1996,Science274:546-547);粟酒裂殖酵母丙酮酸羧化酶(NP_595900;DirectSubmission,Submitted(29-JUN-2007)EuropeanSchizosaccharomycesgenomesequencingproject,SangerInstitute,TheWellcomeTrustGenomeCampus,Hinxton,CambridgeCB101SA);和玉蜀黍黑粉菌丙酮酸羧化酶(um01054;McCann和Snetselaar,2008,FungalGeneticsandBiology45:S77-S87)。本发明涵盖将本文中所述的序列同一性、杂交、变体和片段的任何方面适用于其它如上所述的丙酮酸羧化酶多肽序列和多核苷酸序列。
所述丙酮酸羧化酶亦可从其它来源鉴定和获取,所述来源包括从自然界(例如土壤、堆肥、水等)分离的微生物或直接从自然材料(例如土壤、堆肥、水等)获得的DNA样品,如上文中所述。
核酸构建体
本发明还涉及核酸构建体,所述核酸构建体包含编码C4-二羧酸转运蛋白的多核苷酸(或其它本文中所述的多核苷酸,如编码苹果酸脱氢酶和/或丙酮酸羧化酶的多核苷酸)与一个或多个(例如两个、几个)调控序列连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。此类核酸构建体可用于本文中所述的任何宿主细胞和方法。在一个方面,所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对该多核苷酸外源的启动子。在一个方面,编码苹果酸脱氢酶的第二异源多核苷酸可操作地连接于对该多核苷酸外源的启动子。在一个方面编码丙酮酸羧化酶的第三异源多核苷酸可操作地连接于对该多核苷酸外源的启动子。
可以用许多方式操作多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
调控序列可为启动子序列,其是由用于表达编码C4-二羧酸转运蛋白的多核苷酸(或其它本文中所述的多核苷酸,如编码苹果酸脱氢酶和/或丙酮酸羧化酶的多核苷酸)的宿主细胞所识别的多核苷酸。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)。另外的启动子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,见上文描述。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(一种修饰的启动子,其来自曲霉属中编码中性α-淀粉酶的基因,其中未翻译的前导序列已由曲霉属(Aspergilli)中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代;非限制性实例包括修饰的启动子,其来自黑曲霉中编码中性α-淀粉酶的基因,其中未翻译的前导序列已由构巢曲霉或米曲霉中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代);和它们的突变的、截短的和杂合的启动子。
在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423-488描述。
调控序列也可以是合适的转录终止子序列,其由宿主细胞识别以终止转录。所述终止子序列与编码所述多肽的多核苷酸的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是合适的前导序列,当被转录时其为对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的多核苷酸的5’-末端。可使用在所选宿主细胞中有功能的任何前导序列。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与多核苷酸的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在所选宿主细胞中有功能的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽的N端相连的信号肽,并且指导多肽进入细胞的分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列,其与编码所述多肽的编码序列的区段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,可使用指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码序列。
对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:芽孢杆菌属NCIB11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。
调控序列还可以是前肽编码序列,其编码位于多肽N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的,并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE),枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。
当信号肽和前肽序列二者均出现在多肽的N端时,将前肽序列置于紧接着(nextto)多肽N端,并且将信号肽序列置于紧接着前肽序列的N端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。
表达载体
本发明还涉及利用重组表达载体的重组宿主细胞和方法,所述重组表达载体包含编码C4-二羧酸转运蛋白的多核苷酸(或其它本文中所述的多核苷酸,如编码苹果酸脱氢酶和/或丙酮酸羧化酶的多核苷酸)、启动子和转录和翻译终止信号。多种核苷酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(例如两个、几个)方便的限制位点以允许在这些位点插入或取代编码多肽的多核苷酸。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的多核苷酸或核酸构建体来表达所述多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
在一个方面,每个编码本文中所述的C4-二羧酸转运蛋白,苹果酸脱氢酶,和/或丙酮酸羧化酶的多核苷酸包含于各自独立的载体上。在一个方面,两个所述多核苷酸包含于一个载体上。在一个方面,所有编码C4-二羧酸转运蛋白,苹果酸脱氢酶,和/或丙酮酸羧化酶的多核苷酸包含于一个载体上。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposon)。
载体优选含有一个或多个(例如两个、几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性如氨苄青霉素、氯霉素、卡那霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。
载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的多核苷酸,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,如100至10,000碱基对,400至10,000碱基对,和800至10,000碱基对,其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;WO00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
如本文中所述,本发明还涉及重组宿主细胞,其包含本文中所述的多核苷酸(例如编码C4-二羧酸转运蛋白,苹果酸脱氢酶,和/或丙酮酸羧化酶)的多核苷酸可操作地连接于一个或多个(例如两个、几个)调控序列,所述调控序列指导本文中所述的用于重组产生C4-二羧酸转运蛋白的多肽的产生。本发明还涵盖使用此类宿主细胞产生C4-二羧酸的方法。所述宿主细胞可包含任何一种或多种本文中所述的多核苷酸的组合。举例而言,在一个方面,所述重组宿主细胞包含编码C4-二羧酸转运蛋白的异源多肽,并任选地包含编码苹果酸脱氢酶的异源多核苷酸,和/或编码丙酮酸脱羧酶的异源多核苷酸;其中所述宿主细胞在相同条件下培养时与不含有所述编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比产生(或能够产生)更多量的C4-二羧酸。
在一个方面,所述重组宿主细胞包含:
(1)异源多核苷酸,其编码C4-二羧酸转运蛋白,如选自下组的C4-二羧酸转运蛋白:(a)C4-二羧酸转运蛋白,其与SEQIDNO:2或SEQIDNO:4或其成熟多肽序列具有至少60%序列同一性;(b)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件下与SEQIDNO:1或3,或其成熟多肽编码序列,或前述序列的全长互补链杂交;(c)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链具有至少60%序列同一性;(d)SEQIDNO:2或SEQIDNO:4或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段;
(2)任选的异源第二多核苷酸,其编码苹果酸脱氢酶,如选自下组的苹果酸脱氢酶:(a)苹果酸脱氢酶,其与SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性;(b)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:(i)SEQIDNO:11或其成熟多肽编码序列,(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)苹果酸脱氢酶,其由多核苷酸编码,所述多核苷酸与以下具有至少60%序列同一性:(iv)SEQIDNO:11或其成熟多肽编码序列,(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链;(d)SEQIDNO:12或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的苹果酸脱氢酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段;和
(3)任选的异源第三多核苷酸,其编码丙酮酸羧化酶,如选自下组的丙酮酸羧化酶:(a)丙酮酸羧化酶,其与SEQIDNO:14或其成熟多肽序列具有至少60%序列同一性;(b)丙酮酸羧化酶,其由多核苷酸编码,所述多核苷酸在低严格条件下与以下杂交:(i)SEQIDNO:13或其成熟多肽编码序列,(ii)SEQIDNO:13的cDNA序列或其成熟多肽编码序列,或(iii)(i)或(ii)的全长互补链;(c)丙酮酸羧化酶,其由多核苷酸编码,所述多核苷酸与以下具有至少60%序列同一性:(iv)SEQIDNO:13或其成熟多肽编码序列,(v)SEQIDNO:13的cDNA序列或其成熟多肽编码序列,或(vi)(iv)或(v)的全长互补链;(d)SEQIDNO:14或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的丙酮酸羧化酶变体;和(e)(a)、(b)、(c)或(d)的多肽具有丙酮酸羧化酶活性的片段;
其中所述宿主细胞在相同条件下培养时与不含有所述一种或多种多核苷酸(例如不含有编码C4-二羧酸转运蛋白的异源多核苷酸)的宿主细胞相比产生(或能够产生)更多量的C4-二羧酸。
在一个方面,所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1或3,或任何其所述的方面)和编码苹果酸脱氢酶的异源多核苷酸。在本发明中,所述苹果酸脱氢酶可为任何适于实践本发明的苹果酸脱氢酶,如上文所述。在另一个方面,所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1或3,或任何其所述的方面)和编码丙酮酸羧化酶的异源多核苷酸。在本发明中,所述丙酮酸羧化酶可为任何适于实践本发明的丙酮酸羧化酶,如上文所述。具体而言,所述丙酮酸羧化酶优选为存在于宿主细胞胞质溶胶中的酶。在一个方面,所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1或3,或任何其所述的方面),编码苹果酸脱氢酶的第二异源多核苷酸,和编码丙酮酸羧化酶的第三异源多核苷酸。
将包含多核苷酸的构建体或载体导入宿主细胞,使所述构建体或载体如前所述作为染色体整合体或者作为自复制的染色体外载体维持。术语“宿主细胞”涵盖任何亲本细胞的后代,其由于在复制中发生的突变而与亲本细胞不同。在一些情况下,宿主细胞的选择会很大程度上依赖于编码多肽的基因及其来源。下文中所述的方面适用于宿主细胞本身,以及使用宿主细胞的方法。
所述宿主细胞可为任何能够重组产生本发明的多肽的细胞,例如原核细胞或真核细胞,和/或任何能够重组产生C4-二羧酸(例如苹果酸)的细胞(例如任何丝状真菌细胞)。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于,弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:例如原生质体转化(参见,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),使用感受态细胞(参见,例如,Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(参见,例如,Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞:例如原生质体转化和电穿孔(参见,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞:例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞:例如天然感受态(naturalcompetence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68:189-207),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞的任何方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
所述宿主细胞可为真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby’sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用)和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上)。
所述真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)和属于半知菌类(FungiImperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。
所述酵母宿主细胞可为假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞,如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowialipolytica)细胞。
所述真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
所述丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
所述丝状真菌宿主细胞可为棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、虫拟蜡菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角质金孢子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium、毡金孢子菌、Chrysosporiumqueenslandicum、热带金孢子菌、Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
在一个方面,所述宿主细胞是曲霉属宿主细胞。在另一个方面,所述宿主细胞是米曲霉。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182-187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。
在一些方面,所述宿主细胞包含一种或多种(例如两种、几种)本文中所述的多核苷酸,其中所述宿主细胞在相同条件下培养时与不含有所述一种或多种多核苷酸的宿主细胞相比分泌(或能够分泌)增加水平的C4-二羧酸。在一些方面,所述宿主细胞在相同条件下培养时与不含有所述一种或多种多核苷酸(例如不含有编码C4-二羧酸转运蛋白的异源多核苷酸)的宿主细胞相比,分泌(或能够分泌)增加至少5%,例如至少10%,至少15%,至少20%,至少25%,至少50%,至少100%,至少150%,至少200%,至少300%,或500%水平的C4-二羧酸(例如苹果酸)。
在本文中所述的重组宿主细胞和方法的任何方面中,所述C4-二羧酸可为苹果酸、琥珀酸、草酰乙酸、丙二酸或延胡索酸,或其组合。在一些方面中,所述C4-二羧酸是苹果酸、琥珀酸或延胡索酸,或其组合。在一些方面中,所述C4-二羧酸是苹果酸或延胡索酸,或苹果酸和延胡索酸的组合。在一些方面中,所述C4-二羧酸是苹果酸。
在任何这些方面,所述宿主细胞产生(和/或能够产生)高于理论值至少10%,例如至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%或至少90%的产率。
在任何这些方面,所述重组宿主具有大于约0.1g/L每小时,例如,大于约0.2g/L每小时,0.5g/L每小时,0.6g/L每小时,0.7g/L每小时,0.8g/L每小时,0.9g/L每小时,1.0g/L每小时,1.1g/L每小时,1.2g/L每小时,1.3g/L每小时,1.5g/L每小时,1.75g/L每小时,2.0g/L每小时,2.25g/L每小时,2.5g/L每小时,或3.0g/L每小时;或约0.1g/L每小时至约2.0g/L每小时,例如,约0.3g/L每小时至约1.7g/L每小时,约0.5g/L每小时至约1.5g/L每小时,约0.7g/L每小时至约1.3g/L每小时,约0.8g/L每小时至约1.2g/L每小时,或约0.9g/L每小时至约1.1g/L每小时的C4-二羧酸体积产量(volumetricproductivity)(例如苹果酸体积产量)。
可将所述重组宿主细胞在适于产生C4-二羧酸转运蛋白、苹果酸脱氢酶或丙酮酸羧化酶的营养培养基中使用如下所述的本领域中公知的方法进行培养。
所述C4-二羧酸转运蛋白、苹果酸脱氢酶和丙酮酸羧化酶,及其活性,可使用本领域中公知的方法检测。这些检测方法可包括使用特异性抗体,酶产物的形成,或酶底物的消失。参见,例如Sambrook等,MolecularCloning:ALaboratoryManual,第3版,ColdSpringHarborLaboratory,NewYork(2001);Ausubel等,CurrentProtocolsinMolecularBiology,JohnWileyandSons,Baltimore,MD(1999);及Hanai等,Appl.Environ.Microbiol.73:7814-7818(2007))。
方法
本发明亦涉及使用本文中所述的重组宿主细胞产生C4-二羧酸的方法。在一个方面,本发明涵盖产生C4-二羧酸(例如苹果酸)的方法,其包括:(a)在合适的条件下在培养基中培养任一种本文中所述的重组宿主细胞(例如任何具有C4-二羧酸转运蛋白活性,和优选地,苹果酸脱氢酶和/或丙酮酸羧化酶活性的宿主细胞)以产生C4-二羧酸;和(b)回收所述C4-二羧酸。在一个方面,本发明涵盖产生C4-二羧酸(例如苹果酸)的方法,其包括:在合适的条件下在培养基中培养任一种本文中所述的重组宿主细胞,其中所述宿主细胞包含编码C4-二羧酸转运蛋白的异源多核苷酸和任选地,编码苹果酸脱氢酶的异源多核苷酸,和/或编码丙酮酸羧化酶的异源多核苷酸,以产生C4-二羧酸;和(b)回收所述C4-二羧酸。在一个方面,所述培养基是发酵培养基。
在所述方法的一个方面,以大于约10g/L,例如,大于约25g/L,50g/L,75g/L,100g/L,125g/L,150g/L,160g/L,170g/L,180g/L,190g/L,200g/L,210g/L,225g/L,250g/L,275g/L,300g/L,325g/L,350g/L,400g/L,或500g/L;或约10g/L至约500g/L,例如,约50g/L至约350g/L,约100g/L至约300g/L,约150g/L至约250g/L,约175g/L至约225g/L,或约190g/L至约210g/L的效价产生所述C4-二羧酸(例如苹果酸)。
在所述方法的一个方面,产生的C4-二羧酸(例如苹果酸)的量在相同条件下培养时与不含有编码所述C4-二羧酸转运蛋白的多核苷酸的宿主细胞相比,高至少5%,例如至少10%,至少15%,至少20%,至少25%,至少30%,至少50%,或至少100%。
在所述方法的一个方面,所述C4-二羧酸选自下组:苹果酸、琥珀酸、草酰乙酸、丙二酸和延胡索酸。在一个方面,所述C4-二羧酸是苹果酸。
所述重组的C4-二羧酸可任选地从发酵培养基使用任何本领域中已知的方法回收(参见例如,WO1998/022611和U.S.7,601,865),所述方法包括但不限于层析(例如大小排阻层析,吸附层析,离子交换层析),电泳方法,差示溶解度,渗透,蒸馏,提取(例如液液萃取),渗透蒸发,提取性过滤(extractivefiltration),膜过滤,膜分离,反相(reverse)或超滤。在一个实例中,所述C4-二羧酸从发酵培养基中的其它材料通过过滤来回收。
在所述方法的一些方面,在任选地纯化之前和/或之后的重组C4-二羧酸是基本上纯的。对于产生C4-二羧酸(或其具体C4-二羧酸,如苹果酸)的方法,“基本上纯的”意指含有不超过15%杂质的回收的C4-二羧酸制备物,其中杂质已知除了C4-二羧酸以外的化合物。在一个变化中,提供了基本上纯的C4-二羧酸制备物,其中所述制备物含有不超过25%杂质,或不超过20%杂质,或不超过10%杂质,或不超过5%杂质,或不超过3%杂质,或不超过1%杂质,或不超过0.5%杂质。
对本文中所述的产生方法和宿主细胞测试C4-二羧酸的产生的合适测定法可使用本领域中已知的方法来进行。举例而言,最终C4-二羧酸产物(例如苹果酸)和其它有机化合物,可通过如HPLC(高效液相色谱),GG-MS(气相色谱-质谱),和LC-MS(液相色谱-质谱)的方法或其它合适的分析方法使用本领域中公知的常规步骤进行分析。在发酵液中C4-二羧酸的释放亦可用培养上清进行测试。在发酵培养基中的副产物和剩余的糖(例如葡萄糖)可通过HPLC使用例如用于葡萄糖和醇类的折射率检测器,和用于有机酸的UV检测器(Lin等,Biotechnol.Bioeng.90:775-779(2005)),或本领域中公知的其它合适的测定和检测方法来定量。
本发明进一步通过下述实施例描述,其不应视为对本发明范围的限制。
实施例
用作缓冲液和底物是至少试剂级的商品。
菌株
使用棒曲霉NRRL1和烟曲霉((Sartoryafumigata)Af293作为C4-二羧酸转运蛋白基因的来源。使用米曲霉NRRL3488(或ATCC56747)作为丙酮酸羧化酶基因、苹果酸脱氢酶基因的来源,并用于产生C4-二羧酸。
培养基
YEG培养基组成为:20g葡萄糖,5g酵母提取物,和去离子水加至1升。
COVE平板组成为:1M蔗糖,2%COVE盐溶液,10mM乙酰胺,15mMCsCl,和25g/lAgarNoble。
COVE盐溶液组成为:26gKCl,26gMgSO4·7H2O,76gKH2PO4,50mlCOVE痕量元素溶液,和去离子水加至1升。
COVE痕量元素溶液组成为:0.04gNa2B4O7·10H2O,0.04gCuSO4·5H2O,1.2gFeSO4·7H2O,0.7gMnSO4·H2O,0.8gNa2MoO2·2H2O,10gZnSO4·7H2O和去离子水加至1升。
种子培养基组成为:40g葡萄糖,6gBacto-蛋白胨,750mgKH2PO4,750mgK2HPO4,100mgMgSO4·7H2O,100mgCaCl2·H2O,5mgFeSO4·7H2O,5mgNaCl,和去离子水加至1升。
种子培养基B组成为:30g葡萄糖,3gBactoPeptone,560mgKH2PO4,560mgK2HPO4,925mgNaH2PO4·H2O,820mgNa2HPO4,75mgMgSO4·7H2O,75mgCaCl2·H2O,0.75ml的1000X微量营养物溶液(MicronutrientSolution),和去离子水加至1升。
酸产生培养基C组成为:100g葡萄糖,80gCaCO3,6gBactoPeptone,150mgKH2PO4,150mgK2HPO4,100mgMgSO4·7H2O,100mgCaCl2·H2O,1ml1000X微量营养物溶液,和去离子水加至1升。
1000X微量营养物溶液组成为:5gNaCl,5gFeSO4·7H2O,1g柠檬酸,和去离子水加至1升。
PDA平板组成为:39g/l马铃薯右旋糖琼脂。
实施例1:棒曲霉NRRL1C4-二羧酸转运蛋白基因的克隆和表达载体pShTh120AcC4T的构建
将1179bpC4-二羧酸转运蛋白基因acc4t(ACLA_058030)人工构建入pAcC4T(图1;DNA2.0,MenloPark,CA,USA)。acc4t基因从pAcC4T使用下示的引物069735和069736扩增:
引物069735:
5’-GTGTGATAGAACATCGTCCATAATGTTCGAAAATCG-3’(SEQIDNO:5)
引物069736:
5’-GTCAGTCACCTCTAGTTAATTAACTAGTCTGCAGCATCCTCATC-3’(SEQIDNO:6)
PCR反应混合物组成为:50ngpAcC4T模板,200μMdNTP混合物,50pM引物069735,50pM引物069736,1XPol1反应缓冲液(NewEnglandBiolabs,MA,USA),和1单位的VentPolymerase(NewEnglandBiolabs),和去离子水加至50μl。将PCR反应物在EPPENDORF(EppendorfScientificInc.,Westbury,NewYork,USA)中温育,其程序如下:1个循环,在94℃进行3分钟;35个循环,每循环在94℃进行15秒,59℃进行30秒,和72℃进行1分钟,和1个循环,在72℃进行5分钟。PCR产物通过TAE缓冲液(50mMTris碱-50mM乙酸(盐)-0.1mMEDTA二钠盐)中的1%琼脂糖凝胶电泳纯化,并使用GelExtractionKit(QIAGENInc.,Valencia,CA,USA)纯化。
将质粒pShTh60(图2;亦参见PCR申请号PCT/US10/47002标题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”,2010年8月27日提交)用SexAI和PacI消化,然后通过TBE缓冲液(10.8g/LTris碱,5.5g/L硼酸,2mMEDTA,pH8.0)中的0.8%琼脂糖凝胶电泳分离,并使用GelExtractionKit纯化。然后将上述纯化的PCR产物使用In-FusionTMCloningKit(Clontech,MountainView,CA,USA)根据生产商的指示插入消化的pShTh60,得到pShTh120AcC4T(图3)。使用QIAfilterMaxiPlasmidIsolationKit(QIAGENInc.,Valencia,CA,USA)分离质粒pShTh120AcC4T。使用DNA序列分析使用下示的引物996270和065067使用ABI3130XLDNAAnalyzer(AppliedBiosystems,Inc.,FosterCity,CA,USA)和具有染料终止子化学的引物步移技术(Giesecke等,1992,J.Virol.Methods38:47-60)以确认acc4t编码序列的完整性。
引物996270:
5’-CTATAGCGAAATGGATTGATTGTCT-3’(SEQIDNO:7)
引物065067:
5’-TGACCTTCCACGCTGACCAC-3’(SEQIDNO:8)
棒曲霉acc4t基因的核苷酸序列(SEQIDNO:1)和推导的氨基酸序列(SEQIDNO:2)示于图4。1179bp的基因组编码序列(包括终止密码子)编码392个氨基酸的多肽,其具有预测的43.4kDa的分子量和7.85的等电点pH。该基因不含内含子。使用Vector程序(Invitrogen,CA,USA),预测了52个残基的信号肽,导致预测的成熟蛋白含有340个氨基酸。
实施例2:烟曲霉Af293C4-二羧酸转运蛋白基因的克隆和表达载体pShTh121AfC4T的构建。
将1182bp的C4-二羧酸转运蛋白基因序列afc4t(AFUA_8G04630)人工构建入pAfC4T(图5;DNA2.0)。afc4t基因从pAfC4T使用下示的引物069737和069738扩增。
引物069737:
5-GTGTGATAGAACATCGTCCATAATGTTCAACGATCATGATCA-3’(SEQIDNO:9)
引物069738:
5’-GTCAGTCACCTCTAGTTAATTAATTAATCTAGCACATCCTCGTC-3’(SEQIDNO:10)
PCR反应混合物组成为50ngpAtC4T模板,200μMdNTP混合物,50pM引物069737,50pM引物069738,1XPol1反应缓冲液,1单位VentPolymerase和去离子水加至50μl。PCR反应物在EPPENDORF中温育,其程序为:1个循环在94℃进行3分钟,35个循环,每循环在94℃进行15秒,59℃进行30秒,和72℃进行1分钟;和1个循环,在72℃进行5分钟。PCR产物在TAE缓冲液(50mMTris碱-50mM乙酸(盐)-0.1mMEDTA二钠)中的1%琼脂糖凝胶电泳纯化,并使用GelExtractionKit纯化。
质粒pShTh60(图2)如上所述消化并纯化。然后将上述纯化的PCR产物使用InFusionCloningKit根据生产商的指示插入消化的pShTh60,得到质粒pShTh121AfC4T(图6)。质粒pShTh121AfC4T使用QIAfilterMaxiPlasmidIsolationKit分离。使用DNA序列分析使用如上所述的引物996270和065067确认afc4t编码序列的完整性。
烟曲霉afc4t基因的核苷酸序列(SEQIDNO:3)和推导的氨基酸序列(SEQIDNO:4)示于图7。1182bp的基因组编码序列(包括终止密码子)编码393个氨基酸的多肽,其具有预测的43.8kDa的分子量和7.30的等电点pH。该基因不含内含子。
实施例3:将pShTh120AcC4T和pShTh121AfC4T的表达载体片段转化入米曲霉NRRL3488(ShTh1200和ShTh1210)
进行米曲霉NRRL3488的原生质体制备和转化,即将大约2x107个孢子接种入100mLYEG培养基,并将烧瓶在27℃以140rpm温育16-18小时。收集菌丝体,即将培养物倾倒透过衬有(Calbiochem,SanDiego,CA,USA)的灭菌漏斗,并用50mL的0.7MKCl漂洗。将经洗涤的菌丝体重悬于含有20mL原生质体化溶液的125mL烧瓶,所述溶液包含每mL0.7MKCl(经过滤灭菌)5mg的GLUCANEXTM(NovozymesA/S,Denmark)和0.5mg的壳多糖酶(SigmaChemicalCo.,St.Louis,MO,USA),并将该烧瓶在34℃以80rpm混合温育30分钟。将原生质体化溶液倾倒透过衬有的灭菌漏斗,并用50mL的STC缓冲液(1M山梨醇-10mMTris-HClpH6.5-10mMCaCl2)漂洗。将流过物在两个50mL聚丙烯管中收集。将管在室温在离心机以1300xg旋转10分钟。弃去上清并将原生质体沉淀重悬于20mL的STC缓冲液。洗涤原生质体,即进行两轮的将沉淀重悬于20mL的STC并在室温在1300xg离心10分钟。将最终沉淀重悬于2mL的STC。对原生质体进行计数,即移取10μl样品并在血细胞计数器(VWR,WestChester,PA,USA)中对其进行计数。用STC调整体积以获得2x107每mL的原生质体浓度。
通过用PmeI进行限制性消化制备质粒载体以供转化。对于每个构建体通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从载体序列分离大约5kb表达盒,并使用GelExtractionKit进行纯化。
对于每个表达载体准备了四个转化反应。对于每个反应,将100μL原生质体制备的溶液转移至12mL聚丙烯管,对其添加2~5μg上述限制性消化的质粒载体和250μl聚乙二醇溶液(60%w/v聚乙二醇(PEG),10mMTris6.5,10mMCaCl)接着进行轻柔地混合,并在37℃温育30分钟。将每个转化反应物用6mL的STC稀释,接着将三个不同的等分试样置于COVE平板上。然后将每个平板在34℃温育7-10日。将所得的转化体转移至单个COVE平板,并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物,即制备每个的甘油储液(800μl孢子储液,200μl0.1%80)并冻结于-80℃。含有pShTh120AcC4T的表达载体片段的转化体命名为ShTh1200。含有pShTh121AfC4T的表达载体片段的转化体命名为ShTh1210。
实施例4:在含有表达载体片段pShTh120AcC4T和pShTh121AfC4T的米曲霉转化体(ShTh1200和ShTh1210)的摇瓶培养中产生苹果酸
将来自如上所述的转化体ShTh1200和ShTh1210和作为对照的米曲霉NRRL3488的孢子铺板于单个COVE平板,并允许其在34℃进行5至7日的孢子形成。在0.1%80中收集孢子,并使用血细胞计数器进行计数。在含有100ml的种子培养基B的250ml烧瓶中制备种子培养物,并用总共2x108个孢子接种。将种子培养物在30℃以200rpm振荡生长大约17个小时。在含有50ml的酸产生培养基C和3ml的17小时种子培养物的250ml不带挡板的烧瓶中制备酸产生培养物。将培养物在30℃以200rpm振荡温育2-10日。
对于摇瓶培养转化体的苹果酸定量通过使用1200SeriesBinaryLCSystem和1200SeriesDiodeArrayDetector(DAD)(AgilentTechnologies,SantaClara,CAUSA)的ReversePhaseHighPressureLiquidChromatography(RP-HPLC)进行。使用Aqua5μC18205x4.6mmID柱和AQC184x3.0mmSecurityGuardCartridge(Phenomenex,Inc.,Torrance,CA,USA)进行反向分离。流动相由10%甲醇(HPLC级)和90%145mM磷酸盐pH1.5缓冲液组成。
移出全培养样品,并将其在由850ml的64mM磷酸盐缓冲液和150ml的甲醇pH1.65组成的HPLCRunningBuffer中以1∶10稀释。然后将样品透过25mm0.45微米聚醚砜膜(Whatman,FlorhamPark,NJ,USA)进行过滤,并将1.5ml滤过物置入HPLC小瓶进行酸分析。将剩余量的摇瓶培养物透过3层粗滤布(cheesecloth)过滤,并用10体积的双蒸无菌水漂洗三次以去除不溶的CaCO3。从粗滤布收获细胞沉淀,置入15ml培养管,并储藏于-20℃。
使用10μl的注入体积以0.7ml/分钟(等度洗脱)的流速以25℃的柱温度和11分钟的运行时间进行RP-HPLC。检测设定为210nm,8nm带宽,参照为360nm,40nm带宽。确定空白时间(voidtime)为3.8分钟。通过进行浓度范围为49.2至3.93mM的系列稀释的苹果酸标样的重复注入,对于苹果酸确定了反相方法的定量能力。对于重复注入的相对标准偏差(RSD)为≤5%。苹果酸显示R2≥0.9999。
含有pShTh120AcC4T的米曲霉转化体(菌株ShTh1200)与米曲霉NRRL3488对照菌株相比显示了苹果酸产生方面的改善,并与米曲霉ShTh1040菌株(参见2010年8月27日提交的PCR申请号PCT/US10/47002)相比显示相当的苹果酸产生。含有pShTh121AfC4T的米曲霉转化体(菌株ShTh1210)与米曲霉NRRL3488对照菌株相比显示了苹果酸产生方面的略微改善,并与米曲霉ShTh1040菌株相比显示较低的苹果酸产生。
实施例5:含有pShTh120AcC4T的表达载体片段的米曲霉转化体(ShTh1200)的发酵。
上述米曲霉转化体和对照转化体米曲霉ShTh1040(参见2010年8月27日提交的PCR申请号PCT/US10/47002)在32℃在PDA平板上生长大约7日。将5-6ml体积的含有0.1%80的灭菌的50mM磷酸钠缓冲液(pH6.8)添加至每个平板,并通过用接种环刮擦使孢子悬浮。通过移液将每个悬液转移至50ml锥形管。对于每个管,将25ml的灭菌的磷酸钠缓冲液添加至含有75ml的种子培养基的500ml不带挡板的烧瓶,然后将其用2ml的孢子悬液接种。然后将烧瓶在32℃和180rpm温育约24小时。合并所述种子烧瓶以供应每罐所需的144ml接种物。
通过导入144ml(8%)的来自米曲霉pShTh120AcC4T转化体或米曲霉ShTh1040转化体的合并的种子烧瓶的种子培养液来分别接种含有1.8升的培养基的三升发酵罐。将发酵罐平衡于32±0.1℃并以500rpm搅拌。入口空气流量维持在1v/v/m。每日取出样品,并就苹果酸产生进行分析,且发酵在大约7日之后完成。
发酵中苹果酸的定量如实施例4中所述进行。米曲霉pShTh120AcC4T(ShTh1200)转化体的相对苹果酸效价类似于米曲霉ShTh1040转化体,表明基于之前描述的ShTh1040和NRRL3488的比较,米曲霉pShTh120AcC4T转化体与米曲霉NRRL3488对照(其缺乏过表达的C4-二羧酸转运蛋白基因)相比性能更好。
本发明可进一步通过下述编号段落描述:
[1]一种产生C4-二羧酸的方法,其包括:
(a)培养宿主细胞,所述宿主细胞包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述转运蛋白选自:
(i)C4-二羧酸转运蛋白,其与SEQIDNO:2或4,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(ii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链;
(iii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(iv)SEQIDNO:2或4,或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(v)(i)、(ii)、(iii)或(iv)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;和
(b)回收所述C4-二羧酸。
[2]一种产生二羧酸的方法,其包括:
(a)培养宿主细胞,所述宿主细胞包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述转运蛋白选自:
(i)C4-二羧酸转运蛋白,其与SEQIDNO:2或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(ii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1,其成熟多肽编码序列,或前述序列的全长互补链;
(iii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(iv)SEQIDNO:2或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(v)(i)、(ii)、(iii)或(iv)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;和
(b)回收所述C4-二羧酸。
[3]一种产生C4-二羧酸的方法,其包括:
(a)培养宿主细胞,所述宿主细胞包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述转运蛋白选自:
(i)C4-二羧酸转运蛋白,其与SEQIDNO:4或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(ii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链;
(iii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(iv)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(v)(i)、(ii)、(iii)或(iv)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;和
(b)回收所述C4-二羧酸。
[4]段[1]-[3]任一项的方法,其中所述C4-二羧酸转运蛋白与SEQIDNO:2或4,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[5]段[1]-[4]任一项的方法,其中所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸在低严格条件,低-中等严格条件,中等严格条件,中等-高严格条件,高严格条件下,或非常高严格条件与以下杂交:SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链。
[6]段[1]-[5]任一项的方法,其中所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[7]段[1]-[6]任一项的方法,其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4。
[8]段[1]-[6]任一项的方法,其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4的成熟多肽序列。
[9]段[8]的方法,其中SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸53至392。
[10]段[8]或[9]的方法,其中所述SEQIDNO:4的成熟多肽是SEQIDNO:4的氨基酸1至393。
[11]段[1]-[6]任一项的方法,其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4的片段,其中所述片段具有C4-二羧酸转运蛋白活性。
[12]段[1]-[6]任一项的方法,其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4,或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体。
[13]段[1]-[12]任一项的方法,其中所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[14]段[1]-[13]任一项的方法,其中所述宿主细胞进一步包含编码苹果酸脱氢酶的异源第二多核苷酸(例如,SEQIDNO:11的苹果酸脱氢酶,或其任何描述的方面)。
[15]段[14]的方法,其中所述编码苹果酸脱氢酶的异源第二多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[16]段[1]-[15]任一项的方法,其中所述宿主细胞进一步包含编码丙酮酸羧化酶的异源第三多核苷酸(例如SEQIDNO:13的丙酮酸羧化酶,或其任何描述的方面)。
[17]段[16]的方法,其中所述编码丙酮酸羧化酶的异源第三多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[18]段[1]-[17]任一项的方法,其中所述宿主细胞是丝状真菌宿主细胞。
[19]段[18]的方法,其中所述丝状真菌宿主细胞选自:枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cyptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属(Trichoderma)细胞。
[20]段[19]的方法,其中所述宿主细胞是曲霉属宿主细胞。
[21]段[20]的方法,其中所述曲霉属宿主细胞是米曲霉宿主细胞。
[22]段[1]-[21]任一项的方法,其中C4-二羧酸的水平在相同条件下培养与不具有所述异源多核苷酸的宿主细胞相比时增加至少25%,例如至少50%,至少100%,至少150%,至少200%,至少300%,或500%。
[23]段[1]-[22]任一项的方法,其中所述C4-二羧酸选自苹果酸,琥珀酸,草酰乙酸,丙二酸,和延胡索酸。
[24]段[23]的方法,其中所述C4-二羧酸是苹果酸。
[25]一种增加C4-二羧酸产生的方法,其包括:
(a)将编码C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞,其中所述转运蛋白选自:
(i)C4-二羧酸转运蛋白,其与SEQIDNO:2或4,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(ii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链;
(iii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(iv)SEQIDNO:2或4,或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(v)(i)、(ii)、(iii)或(iv)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;和
(b)在培养基中培养转化的生物;和
(c)回收所述C4-二羧酸。
[26]一种增加C4-二羧酸产生的方法,其包括:
(a)将编码C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞,其中所述转运蛋白选自:
(i)C4-二羧酸转运蛋白,其与SEQIDNO:2的成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(ii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:1或其全长互补链;
(iii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1的成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(iv)SEQIDNO:2的成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(v)(i)、(ii)、(iii)或(iv)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;和
(b)在培养基中培养转化的生物;和
(c)回收所述C4-二羧酸。
[27]一种增加C4-二羧酸产生的方法,其包括:
(a)将编码C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞,其中所述转运蛋白选自:
(i)C4-二羧酸转运蛋白,其与SEQIDNO:4或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(ii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件与以下杂交:SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链;
(iii)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(iv)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(v)(i)、(ii)、(iii)或(iv)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;和
(b)在培养基中培养转化的生物;和
(c)回收所述C4-二羧酸。
[28]段[25]-[27]任一项的方法,其中所述C4-二羧酸转运蛋白与SEQIDNO:2或4,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[29]段[25]-[28]任一项的方法,其中所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸在低严格条件,低-中等严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链。
[30]段[25]-[29]任一项的方法,其中所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[31]段[25]-[30]任一项的方法,其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4。
[32]段[25]-[30]任一项的方法,其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4的成熟多肽序列。
[33]段[32]的方法,其中SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸53至392。
[34]段[32]或[33]的方法,其中SEQIDNO:2的成熟多肽是SEQIDNO:4的氨基酸1至393。
[35]段[25]-[30]任一项的方法,其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4的片段,其中所述片段具有C4-二羧酸转运蛋白活性。
[36]段[25]-[30]任一项的方法,其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4,或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体。
[37]段[25]-[36]任一项的方法,其中所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[38]段[25]-[37]任一项的方法,其中所述宿主细胞进一步包含编码苹果酸脱氢酶的异源第二多核苷酸(例如SEQIDNO:11的苹果酸脱氢酶,或其任何描述的方面)。
[39]段[38]的方法,其中所述编码苹果酸脱氢酶的异源第二多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[40]段[25]-[39]任一项的方法,其中所述宿主细胞进一步包含编码丙酮酸羧化酶的异源第三多核苷酸(例如SEQIDNO:13的丙酮酸羧化酶,或任何其描述的方面)。
[41]段[40]的方法,其中所述编码丙酮酸羧化酶的异源第三多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[42]段[25]-[41]任一项的方法,其中所述宿主细胞是丝状真菌宿主细胞。
[43]段[42]的方法,其中所述丝状真菌宿主细胞选自:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、根霉属、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞。
[44]段[43]的方法,其中所述宿主细胞是曲霉属宿主细胞。
[45]段[44]的方法,其中所述曲霉属宿主细胞是米曲霉宿主细胞。
[46]段[25]-[45]任一项的方法,其中C4-二羧酸的水平在相同条件下培养时与不具有所述编码异源多肽的多核苷酸的宿主细胞相比增加至少25%,例如至少50%,至少100%,至少150%,至少200%,至少300%,或至少500%。
[47]段[25]-[46]任一项的方法,其中所述C4-二羧酸选自苹果酸,琥珀酸,草酰乙酸,丙二酸,和延胡索酸。
[48]段[47]的方法,其中所述C4-二羧酸是苹果酸。
[49]一种宿主细胞,其包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述转运蛋白选自:
(a)C4-二羧酸转运蛋白,其与SEQIDNO:2或4,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(b)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链;
(c)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(d)SEQIDNO:2或4,或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(e)(a),(b),(c)或(d)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;
其中所述宿主细胞在相同条件下培养时,与不具有所述异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸。
[50]一种宿主细胞,其包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述转运蛋白选自:
(a)C4-二羧酸转运蛋白,其与SEQIDNO:2或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(b)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:SEQIDNO:1,其成熟多肽编码序列,或前述序列的全长互补链;
(c)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:1或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(d)SEQIDNO:2或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(e)(a),(b),(c)或(d)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;
其中所述宿主细胞在相同条件下培养时,与不具有所述异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸。
[51]一种宿主细胞,其包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述转运蛋白选自:
(a)C4-二羧酸转运蛋白,其与SEQIDNO:4或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(b)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:SEQIDNO:3,其成熟多肽编码序列,或前述序列的全长互补链;
(c)C4-二羧酸转运蛋白,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;
(d)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体;和
(e)(a),(b),(c)或(d)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段;
其中所述宿主细胞在相同条件下培养时,与不具有所述异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸。
[52]段[49]-[51]任一项的宿主细胞,其中所述C4-二羧酸转运蛋白与SEQIDNO:2或4,或其成熟多肽序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[53]段[49]-[52]任一项的宿主细胞,其中所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸在低严格条件,低-中等严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:SEQIDNO:1或3,其成熟多肽编码序列,或前述序列的全长互补链。
[54]段[49]-[53]任一项的宿主细胞,其中所述C4-二羧酸转运蛋白由多核苷酸编码,所述多核苷酸与SEQIDNO:1或3,或其成熟多肽编码序列具有至少65%,例如至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[55]段[49]-[54]任一项的宿主细胞,其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4。
[56]段[49]-[54]任一项的宿主细胞,其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的成熟多肽序列。
[57]段[56]的宿主细胞,其中SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸53至392。
[58]段[56]或[57]的宿主细胞,其中SEQIDNO:4的成熟多肽是SEQIDNO:2的氨基酸1至393。
[59]段[49]-[54]任一项的宿主细胞,其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4的片段,其中所述片段具有C4-二羧酸转运蛋白活性。
[60]段[49]-[54]任一项的宿主细胞,其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4的成熟多肽的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体。
[61]段[49]-[60]任一项的宿主细胞,其中所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[62]段[49]-[61]任一项的宿主细胞,其中所述宿主细胞进一步包含编码苹果酸脱氢酶的异源第二多核苷酸(例如SEQIDNO:11的苹果酸脱氢酶,或其任何描述的方面)。
[63]段[63]的宿主细胞,其中所述编码苹果酸脱氢酶的异源第二多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[64]段[49]-[63]任一项的宿主细胞,其中所述宿主细胞进一步包含编码丙酮酸羧化酶的异源第三多核苷酸(例如SEQIDNO:13的丙酮酸羧化酶,或其任何描述的方面)。
[65]段[64]的宿主细胞,其中所述编码丙酮酸羧化酶的异源第三多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
[66]段[49]-[64]任一项的宿主细胞,其中所述宿主细胞是丝状真菌宿主细胞。
[67]段[66]的宿主细胞,其中所述宿主细胞选自:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、根霉属、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞。
[68]段[67]的宿主细胞,其中所述宿主细胞是曲霉属宿主细胞。
[69]段[68]的宿主细胞,其中所述曲霉属宿主细胞是米曲霉宿主细胞。
[70]段[49]-[69]任一项的宿主细胞,其中所述宿主细胞在相同条件下培养时,与不具有所述编码异源多肽的多核苷酸的宿主细胞相比能够分泌至少25%,例如至少50%,至少100%,至少150%,至少200%,至少300%,或500%的增加水平的C4-二羧酸。
[71]段[49]-[70]任一项的宿主细胞,其中所述C4-二羧酸选自苹果酸,琥珀酸,草酰乙酸,丙二酸,和延胡索酸。
[72]段[71]的宿主细胞,其中所述C4-二羧酸是苹果酸。
Claims (11)
1.一种曲霉属(Aspergillus)宿主细胞,其包含编码C4-二羧酸转运蛋白的异源多核苷酸,其中所述转运蛋白选自:
(a)C4-二羧酸转运蛋白,其如SEQIDNO:2或4或它们的成熟多肽所示;和
(b)C4-二羧酸转运蛋白,其由SEQIDNO:1或3或它们的成熟多肽编码序列编码;
其中所述曲霉属宿主细胞在相同条件下培养时,与不具有所述编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸,其中所述C4-二羧酸是苹果酸。
2.权利要求1的宿主细胞,其中SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸53至392,而SEQIDNO:4的成熟多肽是SEQIDNO:4的氨基酸1至393。
3.权利要求1或2的宿主细胞,其中所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
4.权利要求1的宿主细胞,其中所述宿主细胞进一步包含编码苹果酸脱氢酶的异源第二多核苷酸。
5.权利要求4的宿主细胞,其中所述编码苹果酸脱氢酶的异源第二多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
6.权利要求1的宿主细胞,其中所述宿主细胞进一步包含编码丙酮酸羧化酶的异源第三多核苷酸。
7.权利要求6的宿主细胞,其中所述编码丙酮酸羧化酶的异源第三多核苷酸可操作地连接于对所述多核苷酸外源的启动子。
8.权利要求1的宿主细胞,其中所述曲霉属宿主细胞是米曲霉(Aspergillusoryzae)宿主细胞。
9.权利要求1的宿主细胞,其中所述宿主细胞在相同条件下培养时,与不具有所述编码C4-二羧酸转运蛋白的多核苷酸的宿主细胞相比能够分泌至少25%的增加水平的C4-二羧酸。
10.一种产生C4-二羧酸的方法,其包括:
(a)在培养基中培养权利要求1-9任一项的宿主细胞;和
(b)回收所述C4-二羧酸。
11.一种增加C4-二羧酸产生的方法,其包括:
(a)将编码C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞,得到权利要求1-9任一项的宿主细胞;
(b)在培养基中培养转化的宿主细胞;和
(c)回收所述C4-二羧酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US35700710P | 2010-06-21 | 2010-06-21 | |
US61/357,007 | 2010-06-21 | ||
PCT/US2011/041301 WO2011163270A1 (en) | 2010-06-21 | 2011-06-21 | Methods for improved c4-dicarboxylic acid production in filamentous fungi |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102947458A CN102947458A (zh) | 2013-02-27 |
CN102947458B true CN102947458B (zh) | 2016-05-04 |
Family
ID=44504321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180030913.2A Expired - Fee Related CN102947458B (zh) | 2010-06-21 | 2011-06-21 | 用于丝状真菌中c4-二羧酸的改善的产生的方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8497103B2 (zh) |
EP (1) | EP2582829B1 (zh) |
CN (1) | CN102947458B (zh) |
BR (1) | BR112012028031A2 (zh) |
IN (1) | IN2013CN00459A (zh) |
WO (1) | WO2011163270A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011028643A1 (en) * | 2009-09-01 | 2011-03-10 | Novozymes, Inc. | Methods for improving malic acid production in filamentous fungi |
WO2014142647A1 (en) * | 2013-03-14 | 2014-09-18 | Wageningen Universiteit | Fungals strains with improved citric acid and itaconic acid production |
WO2015200545A1 (en) | 2014-06-26 | 2015-12-30 | Lygos, Inc. | Recombinant host cells for the production of malonate |
WO2016127920A1 (zh) * | 2015-02-15 | 2016-08-18 | 中国科学院天津工业生物技术研究所 | 新的二元有机酸生产菌株及其制备和应用 |
CN106148208B (zh) * | 2015-03-23 | 2020-12-18 | 中国科学院天津工业生物技术研究所 | 新的二元有机酸生产菌株及其制备和应用 |
CN106148209B (zh) * | 2015-03-23 | 2020-11-20 | 中国科学院天津工业生物技术研究所 | 新的二元有机酸生产菌株及其制备和应用 |
JP6637712B2 (ja) * | 2015-10-13 | 2020-01-29 | 花王株式会社 | C4ジカルボン酸の製造方法 |
CN105754963A (zh) * | 2016-05-19 | 2016-07-13 | 江南大学 | 一种提高延胡索酸产量的方法 |
JP6970101B2 (ja) * | 2016-09-15 | 2021-11-24 | 花王株式会社 | 変異糸状菌、及びそれを用いたc4ジカルボン酸の製造方法 |
CN114806899B (zh) * | 2022-04-14 | 2024-04-02 | 王玮 | 一种生产l-苹果酸的里氏木霉工程菌及其应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009011974A1 (en) * | 2007-05-18 | 2009-01-22 | Microbia Precision Engineering, Inc. | Organic acid production by fungal cells |
CN101365782A (zh) * | 2005-11-21 | 2009-02-11 | 泰特&莱尔组分美国公司 | 重组酵母中的苹果酸生产 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1047002A (en) | 1911-04-03 | 1912-12-10 | James S Diehl | Scissors. |
US3063910A (en) | 1960-02-03 | 1962-11-13 | Kyowa Hakko Kogyo Kk | Method of producing l-malic acid by fermentation |
US5536661A (en) | 1987-03-10 | 1996-07-16 | Novo Nordisk A/S | Process for the production of protein products in aspergillus |
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
DE4343591A1 (de) | 1993-12-21 | 1995-06-22 | Evotec Biosystems Gmbh | Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
ATE206460T1 (de) | 1994-06-03 | 2001-10-15 | Novo Nordisk Biotech Inc | Gereinigte myceliophthora laccasen und nukleinsäuren dafür kodierend |
WO1996000787A1 (en) | 1994-06-30 | 1996-01-11 | Novo Nordisk Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
US5766439A (en) | 1996-10-10 | 1998-06-16 | A. E. Staley Manufacturing Co. | Production and recovery of organic acids |
US7504490B1 (en) * | 1998-10-16 | 2009-03-17 | Oscient Pharmaceuticals Corporation | Nucleic acid and amino acid sequences relating to Apergillus fumigatus for diagnostics and therapeutics |
AU6188599A (en) | 1998-10-26 | 2000-05-15 | Novozymes A/S | Constructing and screening a dna library of interest in filamentous fungal cells |
WO2000056900A2 (en) | 1999-03-22 | 2000-09-28 | Novo Nordisk Biotech, Inc. | Promoter sequences derived from fusarium venenatum and uses thereof |
MX306561B (es) | 2004-01-29 | 2013-01-09 | Zeachem Inc | Recuperacion de acidos organicos. |
WO2008144626A1 (en) | 2007-05-18 | 2008-11-27 | Microbia Precision Engineering, Inc. | Malic acid production in recombinant yeast |
WO2009065778A1 (en) | 2007-11-20 | 2009-05-28 | Dsm Ip Assets B.V. | Succinic acid production in a eukaryotic cell |
WO2009155382A1 (en) | 2008-06-17 | 2009-12-23 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of fumarate, malate, and acrylate |
BRPI0915534B1 (pt) | 2008-07-08 | 2021-04-20 | Dsm Ip Assets B.V. | produção de ácido succínico de ph baixo |
WO2010111344A2 (en) | 2009-03-24 | 2010-09-30 | Microbia, Inc. | Methods and microorganisms for production of c4-dicarboxylic acids |
JP2012223091A (ja) | 2009-08-25 | 2012-11-15 | Ajinomoto Co Inc | L−アミノ酸の製造法 |
WO2011028643A1 (en) | 2009-09-01 | 2011-03-10 | Novozymes, Inc. | Methods for improving malic acid production in filamentous fungi |
WO2011066304A2 (en) | 2009-11-25 | 2011-06-03 | Codexis, Inc. | Engineered beta-class carbonic anhydrase polypeptides and uses thereof |
-
2011
- 2011-06-21 WO PCT/US2011/041301 patent/WO2011163270A1/en active Application Filing
- 2011-06-21 US US13/165,719 patent/US8497103B2/en not_active Expired - Fee Related
- 2011-06-21 CN CN201180030913.2A patent/CN102947458B/zh not_active Expired - Fee Related
- 2011-06-21 EP EP11728507.2A patent/EP2582829B1/en not_active Not-in-force
- 2011-06-21 IN IN459CHN2013 patent/IN2013CN00459A/en unknown
- 2011-06-21 BR BR112012028031A patent/BR112012028031A2/pt not_active IP Right Cessation
-
2013
- 2013-06-25 US US13/926,421 patent/US20130288321A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101365782A (zh) * | 2005-11-21 | 2009-02-11 | 泰特&莱尔组分美国公司 | 重组酵母中的苹果酸生产 |
WO2009011974A1 (en) * | 2007-05-18 | 2009-01-22 | Microbia Precision Engineering, Inc. | Organic acid production by fungal cells |
Non-Patent Citations (3)
Title |
---|
Aspergillus clavatus NRRL1 1099423829736 genomic scaffold,whole genome shotgun sequence,登录号:NW_001517111.1;Nierman W C;《Genbank》;20090202;全文 * |
Aspergillus fumigatus Af293 chromosome 8,whole genome shotgun sequence,登录号:NC_007201.1;Nierman W C等;《Genbank》;20100414;全文 * |
Sequence 41942 from patent US 7504490,登录号为ACQ09725.1;Weinstock K G等;《Genbank》;20090429;全文 * |
Also Published As
Publication number | Publication date |
---|---|
BR112012028031A2 (pt) | 2019-09-24 |
WO2011163270A1 (en) | 2011-12-29 |
US20130288321A1 (en) | 2013-10-31 |
IN2013CN00459A (zh) | 2015-07-03 |
US8497103B2 (en) | 2013-07-30 |
EP2582829B1 (en) | 2016-11-30 |
CN102947458A (zh) | 2013-02-27 |
EP2582829A1 (en) | 2013-04-24 |
US20110312046A1 (en) | 2011-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102947458B (zh) | 用于丝状真菌中c4-二羧酸的改善的产生的方法 | |
JP5833553B2 (ja) | 糸状菌におけるリンゴ酸生成の改良方法 | |
CN103917649A (zh) | 用于生产c4-二羧酸的重组微生物 | |
US8735112B2 (en) | Dicarboxylic acid production in a recombinant yeast | |
CN103492551A (zh) | 用于生产c4-二羧酸的微生物 | |
CN107406821A (zh) | 用于生产3‑羟基丙酸的突变宿主细胞 | |
CA2771162C (en) | Dicarboxylic acid fermentation process | |
CN103857791A (zh) | 脱氢酶变体和编码它们的多核苷酸 | |
CN103080126B (zh) | 具有c4-二羧酸转运蛋白活性的多肽和编码该多肽的多核苷酸 | |
CN103003298B (zh) | 在丝状真菌中产生c4二羧酸 | |
CN101952303A (zh) | 提高目标蛋白质的表达产率的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160504 Termination date: 20170621 |