KR20230025010A - 개선된 시스테인 생산 균주 - Google Patents
개선된 시스테인 생산 균주 Download PDFInfo
- Publication number
- KR20230025010A KR20230025010A KR1020237001935A KR20237001935A KR20230025010A KR 20230025010 A KR20230025010 A KR 20230025010A KR 1020237001935 A KR1020237001935 A KR 1020237001935A KR 20237001935 A KR20237001935 A KR 20237001935A KR 20230025010 A KR20230025010 A KR 20230025010A
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- ppsa
- ala
- val
- gly
- Prior art date
Links
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 title description 95
- 235000018417 cysteine Nutrition 0.000 title description 95
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 176
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims abstract description 156
- 101150067185 ppsA gene Proteins 0.000 claims abstract description 149
- 102000004190 Enzymes Human genes 0.000 claims abstract description 79
- 108090000790 Enzymes Proteins 0.000 claims abstract description 79
- 230000000694 effects Effects 0.000 claims abstract description 54
- 230000000813 microbial effect Effects 0.000 claims abstract description 52
- 239000004201 L-cysteine Substances 0.000 claims abstract description 31
- 235000013878 L-cysteine Nutrition 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000002829 reductive effect Effects 0.000 claims abstract description 20
- 238000012262 fermentative production Methods 0.000 claims abstract description 14
- PWKSKIMOESPYIA-UHFFFAOYSA-N 2-acetamido-3-sulfanylpropanoic acid Chemical compound CC(=O)NC(CS)C(O)=O PWKSKIMOESPYIA-UHFFFAOYSA-N 0.000 claims abstract description 8
- 238000004519 manufacturing process Methods 0.000 claims description 65
- 241000588724 Escherichia coli Species 0.000 claims description 54
- 230000002255 enzymatic effect Effects 0.000 claims description 29
- 241000588696 Pantoea ananatis Species 0.000 claims description 28
- 238000000855 fermentation Methods 0.000 claims description 28
- 230000004151 fermentation Effects 0.000 claims description 28
- 230000035772 mutation Effects 0.000 claims description 25
- 108091026890 Coding region Proteins 0.000 claims description 10
- 241000588921 Enterobacteriaceae Species 0.000 claims description 4
- 241000186031 Corynebacteriaceae Species 0.000 claims description 2
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 2
- 108020004414 DNA Proteins 0.000 description 70
- 229930027917 kanamycin Natural products 0.000 description 45
- 229960000318 kanamycin Drugs 0.000 description 45
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 45
- 229930182823 kanamycin A Natural products 0.000 description 45
- 239000013612 plasmid Substances 0.000 description 39
- 238000006243 chemical reaction Methods 0.000 description 34
- 235000018102 proteins Nutrition 0.000 description 34
- 102000004169 proteins and genes Human genes 0.000 description 34
- 239000000047 product Substances 0.000 description 29
- 230000014509 gene expression Effects 0.000 description 27
- LEVWYRKDKASIDU-IMJSIDKUSA-N L-cystine Chemical compound [O-]C(=O)[C@@H]([NH3+])CSSC[C@H]([NH3+])C([O-])=O LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 26
- 229960003067 cystine Drugs 0.000 description 25
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 22
- 239000002609 medium Substances 0.000 description 22
- 235000002639 sodium chloride Nutrition 0.000 description 22
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 21
- 150000001413 amino acids Chemical class 0.000 description 21
- 239000002773 nucleotide Substances 0.000 description 21
- 125000003729 nucleotide group Chemical group 0.000 description 21
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 20
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 20
- 229910052799 carbon Inorganic materials 0.000 description 20
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 19
- 239000008103 glucose Substances 0.000 description 19
- 230000002779 inactivation Effects 0.000 description 19
- 239000003550 marker Substances 0.000 description 18
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 17
- 108010062110 water dikinase pyruvate Proteins 0.000 description 17
- 108010050848 glycylleucine Proteins 0.000 description 16
- 239000004158 L-cystine Substances 0.000 description 15
- 235000019393 L-cystine Nutrition 0.000 description 15
- 239000012634 fragment Substances 0.000 description 15
- 229940024606 amino acid Drugs 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 14
- 229940041514 candida albicans extract Drugs 0.000 description 14
- 239000012138 yeast extract Substances 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 13
- 229930006000 Sucrose Natural products 0.000 description 12
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 12
- 239000004098 Tetracycline Substances 0.000 description 12
- -1 for example Proteins 0.000 description 12
- 230000002441 reversible effect Effects 0.000 description 12
- 239000005720 sucrose Substances 0.000 description 12
- 239000011593 sulfur Substances 0.000 description 12
- 229910052717 sulfur Inorganic materials 0.000 description 12
- 229960002180 tetracycline Drugs 0.000 description 12
- 229930101283 tetracycline Natural products 0.000 description 12
- 235000019364 tetracycline Nutrition 0.000 description 12
- 150000003522 tetracyclines Chemical class 0.000 description 12
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 11
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 11
- 239000000284 extract Substances 0.000 description 11
- 108010037850 glycylvaline Proteins 0.000 description 11
- 238000002744 homologous recombination Methods 0.000 description 11
- 230000006801 homologous recombination Effects 0.000 description 11
- 229910052757 nitrogen Inorganic materials 0.000 description 11
- 150000003839 salts Chemical class 0.000 description 11
- 239000012137 tryptone Substances 0.000 description 11
- 238000003556 assay Methods 0.000 description 10
- 238000012224 gene deletion Methods 0.000 description 10
- 238000011534 incubation Methods 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 239000011780 sodium chloride Substances 0.000 description 10
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 9
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 9
- 229910019142 PO4 Inorganic materials 0.000 description 9
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 9
- 108010078144 glutaminyl-glycine Proteins 0.000 description 9
- 230000012010 growth Effects 0.000 description 9
- 230000005764 inhibitory process Effects 0.000 description 9
- 244000005700 microbiome Species 0.000 description 9
- 239000001301 oxygen Substances 0.000 description 9
- 229910052760 oxygen Inorganic materials 0.000 description 9
- 235000021317 phosphate Nutrition 0.000 description 9
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 9
- 239000010452 phosphate Substances 0.000 description 9
- 229960001153 serine Drugs 0.000 description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 8
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 8
- 230000003115 biocidal effect Effects 0.000 description 8
- 108700028369 Alleles Proteins 0.000 description 7
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 7
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 7
- 230000002238 attenuated effect Effects 0.000 description 7
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 7
- 238000012239 gene modification Methods 0.000 description 7
- 230000005017 genetic modification Effects 0.000 description 7
- 235000013617 genetically modified food Nutrition 0.000 description 7
- 230000000415 inactivating effect Effects 0.000 description 7
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 229920001817 Agar Polymers 0.000 description 6
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 6
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 6
- 108010046276 FLP recombinase Proteins 0.000 description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 6
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 6
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 6
- 239000008272 agar Substances 0.000 description 6
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 101150025220 sacB gene Proteins 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 239000004474 valine Substances 0.000 description 6
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 6
- 238000007399 DNA isolation Methods 0.000 description 5
- 241001646716 Escherichia coli K-12 Species 0.000 description 5
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 5
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010024607 phenylalanylalanine Proteins 0.000 description 5
- 239000011734 sodium Substances 0.000 description 5
- 150000003548 thiazolidines Chemical class 0.000 description 5
- 239000011573 trace mineral Substances 0.000 description 5
- 235000013619 trace mineral Nutrition 0.000 description 5
- 235000013311 vegetables Nutrition 0.000 description 5
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 4
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 4
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 4
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 4
- 239000002028 Biomass Substances 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- 108091022908 Serine O-acetyltransferase Proteins 0.000 description 4
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical class [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 4
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 4
- 229910021529 ammonia Inorganic materials 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 230000002074 deregulated effect Effects 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 230000004060 metabolic process Effects 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000002244 precipitate Substances 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 239000002994 raw material Substances 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- DHCDFWKWKRSZHF-UHFFFAOYSA-L thiosulfate(2-) Chemical class [O-]S([S-])(=O)=O DHCDFWKWKRSZHF-UHFFFAOYSA-L 0.000 description 4
- 108010009962 valyltyrosine Proteins 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 3
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 3
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 3
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 3
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 3
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 3
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 3
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 3
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 3
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 3
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 3
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 3
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 3
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- ZEBDYGZVMMKZNB-SRVKXCTJSA-N Arg-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N ZEBDYGZVMMKZNB-SRVKXCTJSA-N 0.000 description 3
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 3
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 3
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 3
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 3
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 3
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 3
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 3
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 3
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 3
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 3
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 3
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 3
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 3
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 3
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 3
- 101100052574 Bacillus subtilis (strain 168) ydeD gene Proteins 0.000 description 3
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 3
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 3
- XVLMKWWVBNESPX-XVYDVKMFSA-N Cys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N XVLMKWWVBNESPX-XVYDVKMFSA-N 0.000 description 3
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 3
- 101100498063 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) cysB gene Proteins 0.000 description 3
- 101100117976 Escherichia coli (strain K12) eamA gene Proteins 0.000 description 3
- 241000701959 Escherichia virus Lambda Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 229930091371 Fructose Natural products 0.000 description 3
- 239000005715 Fructose Substances 0.000 description 3
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 3
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 3
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 3
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 3
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 3
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 3
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 3
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 3
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 3
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 3
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 3
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 3
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 3
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 3
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 3
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 3
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 3
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 3
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 3
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 3
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 3
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 3
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 3
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 3
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 3
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 3
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 3
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 3
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 3
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 3
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 3
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 3
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 3
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 3
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 3
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 3
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 3
- AYLAAGNJNVZDPY-CYDGBPFRSA-N Ile-Met-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N AYLAAGNJNVZDPY-CYDGBPFRSA-N 0.000 description 3
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 3
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 3
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 3
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 3
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 3
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 3
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 3
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 3
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 3
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 3
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 3
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 3
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 3
- 108010036940 Levansucrase Proteins 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 3
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 3
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 3
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 3
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 3
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 3
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 3
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 3
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 3
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 3
- WYDFQSJOARJAMM-GUBZILKMSA-N Met-Pro-Asp Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WYDFQSJOARJAMM-GUBZILKMSA-N 0.000 description 3
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 3
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- VZXPDPZARILFQX-BYPYZUCNSA-N O-acetyl-L-serine Chemical compound CC(=O)OC[C@H]([NH3+])C([O-])=O VZXPDPZARILFQX-BYPYZUCNSA-N 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 239000001888 Peptone Substances 0.000 description 3
- 108010080698 Peptones Proteins 0.000 description 3
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 3
- UEEVBGHEGJMDDV-AVGNSLFASA-N Phe-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEEVBGHEGJMDDV-AVGNSLFASA-N 0.000 description 3
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 3
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 3
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 3
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 3
- 108010038555 Phosphoglycerate dehydrogenase Proteins 0.000 description 3
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 3
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 3
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 3
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 3
- 101100231695 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FRT1 gene Proteins 0.000 description 3
- 101100231696 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FRT2 gene Proteins 0.000 description 3
- 240000000111 Saccharum officinarum Species 0.000 description 3
- 235000007201 Saccharum officinarum Nutrition 0.000 description 3
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 3
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 3
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 3
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- 235000021536 Sugar beet Nutrition 0.000 description 3
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 3
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 3
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 3
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 3
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 3
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 3
- KDWZQYUTMJSYRJ-BHYGNILZSA-N Trp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O KDWZQYUTMJSYRJ-BHYGNILZSA-N 0.000 description 3
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 3
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 3
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 3
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 3
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 3
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 3
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 3
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 3
- YTUABZMPYKCWCQ-XQQFMLRXSA-N Val-His-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N YTUABZMPYKCWCQ-XQQFMLRXSA-N 0.000 description 3
- MCRPZFQGVZLTAI-UHFFFAOYSA-N Val-Leu-Trp-Tyr Natural products C=1NC2=CC=CC=C2C=1CC(NC(=O)C(NC(=O)C(N)C(C)C)CC(C)C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 MCRPZFQGVZLTAI-UHFFFAOYSA-N 0.000 description 3
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 3
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 3
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 3
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 3
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 101150044616 araC gene Proteins 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 3
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 238000003149 assay kit Methods 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 229960005091 chloramphenicol Drugs 0.000 description 3
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 239000012228 culture supernatant Substances 0.000 description 3
- 101150111114 cysE gene Proteins 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- FDZZZRQASAIRJF-UHFFFAOYSA-M malachite green Chemical compound [Cl-].C1=CC(N(C)C)=CC=C1C(C=1C=CC=CC=1)=C1C=CC(=[N+](C)C)C=C1 FDZZZRQASAIRJF-UHFFFAOYSA-M 0.000 description 3
- 229940107698 malachite green Drugs 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000009629 microbiological culture Methods 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 238000007254 oxidation reaction Methods 0.000 description 3
- 235000019319 peptone Nutrition 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- AKHNMLFCWUSKQB-UHFFFAOYSA-L sodium thiosulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=S AKHNMLFCWUSKQB-UHFFFAOYSA-L 0.000 description 3
- 235000019345 sodium thiosulphate Nutrition 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- LSNNMFCWUKXFEE-UHFFFAOYSA-L sulfite Chemical class [O-]S([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-L 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 3
- 229960003495 thiamine Drugs 0.000 description 3
- 150000004764 thiosulfuric acid derivatives Chemical class 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 108010000998 wheylin-2 peptide Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- OGYGFUAIIOPWQD-UHFFFAOYSA-N 1,3-thiazolidine Chemical compound C1CSCN1 OGYGFUAIIOPWQD-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical class OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 2
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 2
- 239000005695 Ammonium acetate Substances 0.000 description 2
- 239000004254 Ammonium phosphate Substances 0.000 description 2
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 2
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 2
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 2
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 2
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 2
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 2
- RYKWOUUZJFSJOH-FXQIFTODSA-N Asp-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N RYKWOUUZJFSJOH-FXQIFTODSA-N 0.000 description 2
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 2
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 2
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 2
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 2
- UIKLEGZPIOXFHJ-DLOVCJGASA-N Cys-Phe-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O UIKLEGZPIOXFHJ-DLOVCJGASA-N 0.000 description 2
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 2
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 2
- LLRJEFPKIIBGJP-DCAQKATOSA-N Gln-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LLRJEFPKIIBGJP-DCAQKATOSA-N 0.000 description 2
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 2
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 2
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 2
- ZGXGVBYEJGVJMV-HJGDQZAQSA-N Glu-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O ZGXGVBYEJGVJMV-HJGDQZAQSA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 2
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 2
- 229920002488 Hemicellulose Polymers 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- 101000787090 Lactobacillus delbrueckii subsp. bulgaricus Uncharacterized 33.9 kDa protein in glnA 5'region Proteins 0.000 description 2
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 2
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 2
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 2
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 2
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 2
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 2
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 2
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 2
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 2
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical class [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 2
- 102100040653 Tryptophan 2,3-dioxygenase Human genes 0.000 description 2
- 101710136122 Tryptophan 2,3-dioxygenase Proteins 0.000 description 2
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 2
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 2
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 2
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 2
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 2
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 229930003451 Vitamin B1 Natural products 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 229940043376 ammonium acetate Drugs 0.000 description 2
- 235000019257 ammonium acetate Nutrition 0.000 description 2
- 235000019270 ammonium chloride Nutrition 0.000 description 2
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 2
- 235000019289 ammonium phosphates Nutrition 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- XYXNTHIYBIDHGM-UHFFFAOYSA-N ammonium thiosulfate Chemical compound [NH4+].[NH4+].[O-]S([O-])(=O)=S XYXNTHIYBIDHGM-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108700003859 araC Genes Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 239000012131 assay buffer Substances 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000007398 colorimetric assay Methods 0.000 description 2
- 239000000306 component Substances 0.000 description 2
- 239000007859 condensation product Substances 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000001814 pectin Substances 0.000 description 2
- 229920001277 pectin Polymers 0.000 description 2
- 235000010987 pectin Nutrition 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 238000002731 protein assay Methods 0.000 description 2
- 108010009004 proteose-peptone Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 101150002295 serA gene Proteins 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- XOAAWQZATWQOTB-UHFFFAOYSA-N taurine Chemical compound NCCS(O)(=O)=O XOAAWQZATWQOTB-UHFFFAOYSA-N 0.000 description 2
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 235000010374 vitamin B1 Nutrition 0.000 description 2
- 239000011691 vitamin B1 Substances 0.000 description 2
- IVWWFWFVSWOTLP-YVZVNANGSA-N (3'as,4r,7'as)-2,2,2',2'-tetramethylspiro[1,3-dioxolane-4,6'-4,7a-dihydro-3ah-[1,3]dioxolo[4,5-c]pyran]-7'-one Chemical compound C([C@@H]1OC(O[C@@H]1C1=O)(C)C)O[C@]21COC(C)(C)O2 IVWWFWFVSWOTLP-YVZVNANGSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- JCAKCGQZNBEITC-UHFFFAOYSA-N 2-methyl-1,3-thiazolidine-2,4-dicarboxylic acid Chemical class OC(=O)C1(C)NC(C(O)=O)CS1 JCAKCGQZNBEITC-UHFFFAOYSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- HHDDCCUIIUWNGJ-UHFFFAOYSA-M 3-hydroxypyruvate Chemical compound OCC(=O)C([O-])=O HHDDCCUIIUWNGJ-UHFFFAOYSA-M 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- KQROHCSYOGBQGJ-UHFFFAOYSA-N 5-Hydroxytryptophol Chemical compound C1=C(O)C=C2C(CCO)=CNC2=C1 KQROHCSYOGBQGJ-UHFFFAOYSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- VGMNWQOPSFBBBG-XUXIUFHCSA-N Ala-Leu-Leu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VGMNWQOPSFBBBG-XUXIUFHCSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- RCAUJZASOAFTAJ-FXQIFTODSA-N Arg-Asp-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N RCAUJZASOAFTAJ-FXQIFTODSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- 101000755953 Bacillus subtilis (strain 168) Ribosome maturation factor RimP Proteins 0.000 description 1
- 101100002068 Bacillus subtilis (strain 168) araR gene Proteins 0.000 description 1
- 101100021490 Bacillus subtilis (strain 168) lnrK gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- GMOUVKABHMGZEC-UHFFFAOYSA-N C1CSCN1.OC(=O)C1(C)NC(C(O)=O)CS1 Chemical compound C1CSCN1.OC(=O)C1(C)NC(C(O)=O)CS1 GMOUVKABHMGZEC-UHFFFAOYSA-N 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 108010076010 Cystathionine beta-lyase Proteins 0.000 description 1
- 101710170257 Cystathionine beta-lyase MetC Proteins 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 101001036416 Escherichia coli (strain K12) Maltose regulon modulator Proteins 0.000 description 1
- 101100117984 Escherichia coli (strain K12) eamB gene Proteins 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- JKPGHIQCHIIRMS-AVGNSLFASA-N Gln-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N JKPGHIQCHIIRMS-AVGNSLFASA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- NVHJGTGTUGEWCG-ZVZYQTTQSA-N Gln-Trp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O NVHJGTGTUGEWCG-ZVZYQTTQSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- RVGMVLVBDRQVKB-UWVGGRQHSA-N Gly-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN RVGMVLVBDRQVKB-UWVGGRQHSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108010020056 Hydrogenase Proteins 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108010015268 Integration Host Factors Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- PWKSKIMOESPYIA-BYPYZUCNSA-N L-N-acetyl-Cysteine Chemical compound CC(=O)N[C@@H](CS)C(O)=O PWKSKIMOESPYIA-BYPYZUCNSA-N 0.000 description 1
- 125000000415 L-cysteinyl group Chemical group O=C([*])[C@@](N([H])[H])([H])C([H])([H])S[H] 0.000 description 1
- 150000008550 L-serines Chemical class 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 1
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 239000005913 Maltodextrin Substances 0.000 description 1
- 229920002774 Maltodextrin Polymers 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- JJIHLJJYMXLCOY-BYPYZUCNSA-N N-acetyl-L-serine Chemical compound CC(=O)N[C@@H](CO)C(O)=O JJIHLJJYMXLCOY-BYPYZUCNSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 1
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 102000018780 Replication Protein A Human genes 0.000 description 1
- 101710188003 Replication and maintenance protein Proteins 0.000 description 1
- 101710090029 Replication-associated protein A Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- GBFLZEXEOZUWRN-VKHMYHEASA-N S-carboxymethyl-L-cysteine Chemical compound OC(=O)[C@@H](N)CSCC(O)=O GBFLZEXEOZUWRN-VKHMYHEASA-N 0.000 description 1
- 108091006629 SLC13A2 Proteins 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- GQPQJNMVELPZNQ-GBALPHGKSA-N Thr-Ser-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O GQPQJNMVELPZNQ-GBALPHGKSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- 229920004482 WACKER® Polymers 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 108010048241 acetamidase Proteins 0.000 description 1
- 159000000021 acetate salts Chemical class 0.000 description 1
- 229960004308 acetylcysteine Drugs 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 101150097746 araB gene Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000036983 biotransformation Effects 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013000 chemical inhibitor Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000012043 crude product Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 150000001944 cysteine derivatives Chemical class 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- GRWZHXKQBITJKP-UHFFFAOYSA-L dithionite(2-) Chemical class [O-]S(=O)S([O-])=O GRWZHXKQBITJKP-UHFFFAOYSA-L 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000003746 feather Anatomy 0.000 description 1
- 239000012527 feed solution Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 238000010359 gene isolation Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 235000003969 glutathione Nutrition 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 238000000892 gravimetry Methods 0.000 description 1
- 230000009036 growth inhibition Effects 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 210000000003 hoof Anatomy 0.000 description 1
- 210000003284 horn Anatomy 0.000 description 1
- 239000000413 hydrolysate Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- AIHDCSAXVMAMJH-GFBKWZILSA-N levan Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@@H]1[C@@H](O)[C@H](O)[C@](CO)(CO[C@@H]2[C@H]([C@H](O)[C@@](O)(CO)O2)O)O1 AIHDCSAXVMAMJH-GFBKWZILSA-N 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- AGBQKNBQESQNJD-UHFFFAOYSA-M lipoate Chemical compound [O-]C(=O)CCCCC1CCSS1 AGBQKNBQESQNJD-UHFFFAOYSA-M 0.000 description 1
- 235000019136 lipoic acid Nutrition 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 229940035034 maltodextrin Drugs 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012533 medium component Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 229940121649 protein inhibitor Drugs 0.000 description 1
- 239000012268 protein inhibitor Substances 0.000 description 1
- 229930182852 proteinogenic amino acid Natural products 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 102220277134 rs776745497 Human genes 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 229960003080 taurine Drugs 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- 229960002663 thioctic acid Drugs 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 235000019158 vitamin B6 Nutrition 0.000 description 1
- 239000011726 vitamin B6 Substances 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1294—Phosphotransferases with paired acceptors (2.7.9)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/12—Methionine; Cysteine; Cystine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/09—Phosphotransferases with paired acceptors (2.7.9)
- C12Y207/09002—Pyruvate, water dikinase (2.7.9.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01095—Phosphoglycerate dehydrogenase (1.1.1.95)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/0103—Serine O-acetyltransferase (2.3.1.30)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 KEGG 데이터베이스의 번호 EC 2.7.9.2로 표시된 효소 부류의 상대적 효소 활성이 비활성화되거나, 또는 야생형 효소의 특이적 활성에 기초하여, 감소되며, KEGG 데이터베이스의 번호 EC 2.7.9.2로 표시된 효소 부류가 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하고, 이 효소 활성을 코딩하는 유전자가 ppsA로 표시되는 것을 특징으로 하는, L-시스테인의 발효 생산에 적합한 미생물 균주에 관한 것이다. 본 발명은 또한 이들 미생물 세포를 사용하여 L-시스테인을 생산하는 방법을 제공한다.
Description
본 발명은 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성이 비활성화되거나 또는 야생형 효소의 특이적 활성에 비해 감소되며, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하고, 상기 효소 활성을 코딩하는 유전자가 ppsA에 의해 식별되는 것을 특징으로 하는, L-시스테인의 발효 생산에 적합한 미생물 균주에 관한 것이다. 또한, 본 발명은 이들 미생물 세포를 사용하여 L-시스테인을 생산하는 공정을 제공한다.
Cys 또는 C로 약칭되는 시스테인은 측쇄 -CH2-SH를 갖는 α-아미노산이다. 자연적으로 발생하는 거울상이성질체 형태가 L-시스테인이고 이것만이 단백질생성 아미노산이기 때문에, 용어 시스테인이 기술(descriptor) 없이 사용될 때 의미하는 것은 본 발명의 맥락에서 L-시스테인이다. 설프하이드릴 기의 산화는 함께 디설파이드 결합을 형성하는 2개의 시스테인 잔기를 초래할 수 있고, 결과적으로 동일한 설명이 적용되는 시스틴을 형성하며, 즉 기술이 없는 경우 본 발명에서 의미하는 것은 L-거울상이성질체(또는 L-시스틴, 또는 (R,R)-3,3'-디티오비스(2-아미노프로피온산))이다. L-시스테인은 아미노산 메티오닌으로부터 형성될 수 있으므로, 인간에게 준필수 아미노산이다.
모든 유기체에서, 시스테인은 황 대사에서 중요한 위치를 차지하며, 단백질, 글루타티온, 비오틴, 리포산, 티아민, 타우린, 메티오닌 및 다른 황 함유 대사 산물의 합성에 사용된다. 또한, L-시스테인은 조효소 A(coenzyme A)의 생합성을 위한 전구체로서 역할을 한다.
시스테인의 생합성은 박테리아, 특히 엔테로박테리아(enterobacteria)에서 상세히 연구되었다. 시스테인 생합성의 요약은 문헌[Wada and Takagi, Appl. Microbiol. Biotechnol. (2006) 73: 48-54]에서 찾을 수 있다.
아미노산 L-시스테인은 경제적으로 중요하다. 그것은, 예를 들어 식품 첨가제로서(특히 제빵 산업에서), 화장품 원료로서, 그리고 활성 약제학적 성분(특히 N-아세틸시스테인 및 S-카르복시메틸시스테인)의 생산을 위한 출발 물질로서 사용된다.
머리카락, 강모(bristle), 뿔, 발굽 및 깃털과 같은 케라틴 함유 물질로부터 추출에 의하거나 또는 전구체의 효소적 전환을 통한 생물변형에 의한 시스테인의 고전적인 제조 외에도, 시스테인의 발효 생산을 위한 공정이 또한 있다. 미생물을 이용한 시스테인의 발효 제조에 관한 선행 기술은, 예를 들어 EP 0 858 510 B1, EP 0 885 962 B1, EP 1 382 684 B1, EP 1 220 940 B2, EP 1 769 080 B1 및 EP 2 138 585 B1에 개시되어 있다. 사용되는 박테리아 숙주 유기체는 코리네박테리움(Corynebacterium) 속의 균주 및 엔테로박테리아과(Enterobacteriaceae family)의 구성원, 예를 들어 에셰리키아 콜리(Escherichia co1i) 또는 판토에아 아나나티스(Pantoea ananatis)를 포함한다.
미생물 균주에서 시스테인 생산을 개선하기 위해 다양한 방법이 이용가능하다. 돌연변이 및 선택에 의해 개선된 시스테인 생산자를 얻는 고전적인 접근법 외에도, 균주들이 또한 시스테인의 효과적인 과잉생산을 달성하기 위해 특이적으로 유전적으로 변형되었다.
예를 들어, 시스테인에 의한 감소된 피드백 억제를 갖는 세린 O-아세틸트랜스퍼라제를 코딩하는 cysE 대립유전자의 도입은 시스테인 생산의 증가로 이어졌다(EP 0 858 510 B1; Nakamori et al., Appl. Env. Microbiol. (1998) 64: 1607-1611). 피드백 저항성 CysE 효소는 시스테인의 직접 전구체인 O-아세틸-L-세린의 형성을 세포 내의 시스테인 수준으로부터 크게 분리시킨다.
O-아세틸-L-세린은 L-세린과 아세틸-CoA로부터 형성된다. 따라서, 시스테인 생산을 위해 충분한 양의 L-세린을 제공하는 것이 매우 중요하다. 이는 L-세린에 의한 감소된 피드백 억제성을 갖는 3-포스포글리세레이트 데하이드로게나제를 코딩하는 serA 대립유전자를 도입함으로써 달성될 수 있다. 결과적으로, L-세린의 생합성 전구체인 3-하이드록시피루베이트의 형성은 세포 내의 L-세린 수준으로부터 크게 분리된다. 이러한 SerA 효소의 예는 EP 0 620 853 B1 및 EP 1 496 111 B1에 기재되어 있다. 대안적으로, 문헌[Bell et al., Eur. J. Biochem. (2002) 269: 4176-4184]은 효소 활성을 탈조절하기 위한 serA 유전자의 변형을 개시한다.
또한, 발효시 시스테인 수율은, 예를 들어 트립토파나제 TnaA 또는 시스타티오닌 β-리아제 MalY 또는 MetC와 같은 시스테인 분해 효소를 코딩하는 유전자를 약화시키거나 파괴시킴으로써 증가될 수 있다고 알려져 있다(EP 1 571 223 B1).
세포 밖으로 시스테인의 수송을 증가시키는 것은 배지 중의 생성물 수율을 증가시키는 또 다른 방법이다. 이것은 소위 유출 유전자(efflux gene)를 과발현시킴으로써 달성될 수 있다. 상기 유전자는 세포 밖으로 시스테인의 이출을 매개하는 막 결합 단백질을 코딩한다.
시스테인을 내보내기 위한 다양한 유출 유전자가 설명되었다(EP 0 885 962 B1, EP 1 382 684 B1). 세포 밖으로 발효 배지 내로의 시스테인의 이출은 몇 가지 장점이 있다:
1) L-시스테인은 세포내 반응 평형으로부터 지속적으로 제거되며, 그 결과 세포 내의 이 아미노산 수준이 낮게 유지되고 L-시스테인에 의한 민감한 효소의 피드백 억제가 중지된다:
(1) L-시스테인(세포내) <-> L-시스테인(배지)
2) 배지 내로 분비된 L-시스테인은 산화되어 배양 동안 배지 내로 도입된 산소의 존재 하에 디설파이드 L-시스틴을 형성한다(EP 0 885 962 B1).
(2) 2 L-시스테인 + 1/2 O2 -> L-시스틴 + H2O
중성 pH의 수용액 중의 L-시스틴의 용해도가 시스테인에 비해 매우 낮기 때문에, 디설파이드는 이미 저농도에서 침전되어 백색 침전물을 형성한다:
(3) L-시스틴(용해) -> L-시스틴(침전)
L-시스틴의 침전은 배지에 용해된 생성물의 수준을 낮추어, (1)의 반응 평형과 (2)의 반응 평형을 생성물 쪽으로 끌어당긴다.
3) 생성물이 세포내에 축적되고 세포 파괴가 먼저 요구되는 경우보다 아미노산이 발효 배지로부터 직접 수득될 수 있는 경우에, 생성물을 정제하는 것은 훨씬 덜 복잡하다.
시스테인 생산 균주의 유전적 변형 외에도, 발효 공정, 즉 세포가 배양되는 방법의 최적화는 또한 효율적인 생산 공정의 개발에 중요한 역할을 한다. 다양한 배양 매개변수, 예를 들어, 탄소 및 에너지원의 성질 및 계량, 온도, 산소의 공급(EP 2 707 492 B1), 배양 배지의 pH 및 조성은 시스테인의 발효 생산에서 생성물 수율 및/또는 생성물 스펙트럼에 영향을 미칠 수 있다.
원료 및 에너지 비용이 지속적으로 상승하고 있으므로, 공정의 경제성을 개선하기 위해 시스테인 생산에서 생성물 수율을 증가시킬 필요성이 지속적으로 존재한다.
본 발명의 목적은 선행 기술의 공지된 균주와 비교하여 발효에서 L-시스테인 또는 L-시스틴의 더 높은 수율이 달성될 수 있는, 시스테인의 발효 생산을 위한 미생물 균주를 제공하는 것이다.
상기 목적은 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성이 비활성화되거나 또는 야생형 효소의 특이적 활성에 비해 감소되며, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하고, 상기 효소 활성을 코딩하는 유전자가 ppsA에 의해 식별되는 것을 특징으로 하는, L-시스테인의 발효 생산에 적합한 미생물 균주에 의해 달성된다.
KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 효소 활성은 다음 식에 따른 가역적인 반응으로 포스포에놀피루베이트로부터 피루베이트를 생산할 수 있는 것으로 정의된다:
(4) 포스포에놀피루베이트 + 포스페이트 + AMP <-> 피루베이트 + H2O + ATP
(AMP: 아데노신 모노포스페이트; ATP: 아데노신 트리포스페이트)
따라서, 이러한 효소 활성은 포스포에놀피루베이트 합성효소(PEP 합성효소, EC 2.7.9.2) 또는 동의어로 피루베이트-H2O 디키나제로서 지칭된다. 이 단백질을 코딩하는 유전자는 본 발명의 맥락에서 ppsA로 약칭된다.
효소 활성의 검출(효소 분석, PEP 합성효소 분석):
미생물 균주의 PEP 합성효소 활성은 액체 배지 중의 배양물로부터 세포를 펠렛화하고, 상기 세포를 세척하고, 예를 들어 FastPrep-24™ 5G 세포 균질화기(MP Biomedicals)의 도움으로 세포 추출물을 제조함으로써 결정될 수 있다. 추출물의 단백질 함량은, 예를 들어 "Qubit® 단백질 분석 키트"(Thermo Fisher Scientific)에 의해 결정될 수 있다.
PEP 합성효소 효소 활성은, 예를 들어 "말라카이트 그린 포스페이트 분석 키트"(Sigma Aldrich)의 도움으로 식 (4)에 따른 피루베이트와 ATP의 반응으로부터 포스페이트의 화학량론적 생산에 의해 측정될 수 있다. 대안적으로, AMP 또는 포스포에놀피루베이트의 화학량론적 생산 또는 피루베이트 또는 ATP의 화학량론적 소모가 또한 결정될 수 있다(식 4 참조). 피루베이트의 ATP 의존적 소모를 통해 PEP 합성효소 효소 활성을 결정하기 위한 분석은, 예를 들어 문헌[Berman and Cohn, J. Biol. Chem. (1970) 245: 5309-5318]에 기재되어 있다. 포스포에놀피루베이트의 ATP 의존적 형성에 대한 분석이 마찬가지로 문헌[Berman and Cohn, J. Biol. Chem. (1970) 245: 5309-5318]에 기재되어 있다.
특이적 효소 활성은 효소 활성을 임의의 추가 정제 또는 처리 없이 세포 추출물의 총 단백질 1 mg을 기반으로 함으로써 계산된다(U/mg 단백질). 상이한 PEP 합성효소의 비교가 세포 추출물이 동일한 방식으로 제조될 것을 요구한다는 것을 명심해야 한다. 전술한 바와 같이, 세포 추출물은, 예를 들어 FastPrep-24™ 5G 세포 균질화기(MP Biomedicals)의 도움으로 제조될 수 있다.
대안적으로, 상이한 효소는 또한 동일한 방식으로 각각 정제된 효소 1 mg에 대한 특이적 활성을 기반으로 함으로써 비교될 수 있다(U/mg 정제된 단백질). PEP 합성효소를 정제하고 정제된 단백질의 특이적 활성을 결정하기 위한 방법은, 예를 들어 문헌[Berman and Cohn, J. Biol. Chem. (1970) 245: 5309-5318]에 기재되어 있다. 상대적인 효소 활성은 PEP 합성효소를 코딩하는 유전자와 관련하여 Wt 대립유전자를 보유하는 미생물 균주의 PEP 합성효소 분석에서 결정된 특이적 효소 활성을 100%로 설정함으로써 결정될 수 있다. 샘플의 특이적 효소 활성에 대한 PEP 합성효소 분석에서 측정된 값은 Wt 효소를 갖는 이 균주와 관련하여 백분율로서 지정된다.
오픈 리딩 프레임(ORF, cds 또는 코딩 서열과 동의어)은 시작 코돈으로 시작하여 정지 코돈으로 끝나고 단백질의 아미노산 서열을 코딩하는 DNA 또는 RNA의 영역을 지칭한다. ORF는 또한 코딩 영역 또는 구조 유전자로 지칭된다.
유전자는 생물학적 활성 RNA를 생산하기 위한 모든 기본 정보를 함유하는 DNA의 부분을 지칭한다. 유전자는 전사에 의해 단일 가닥 RNA 사본이 생산되는 DNA의 부분 및 또한 이러한 복제 공정의 조절에 관여하는 발현 신호를 함유한다. 발현 신호는 예를 들어 적어도 하나의 프로모터, 전사 개시, 번역 개시, 및 리보솜 결합 부위를 포함한다. 또한, 종결자 및 하나 이상의 오퍼레이터가 발현 신호로서 가능하다.
본 발명의 맥락에서, 단백질, 예를 들어 PpsA는 대문자로 시작하는 반면, 상기 단백질을 코딩하는 서열(cds)은 소문자(예를 들어, ppsA)에 의해 식별된다.
따라서, E. 콜리 ppsA는 서열번호: 1의 뉴클레오타이드 333-2711에 명시된 E. 콜리로부터의 ppsA 유전자의 cds를 지칭한다. E. 콜리 PpsA는 상기 cds(E. 콜리 ppsA)에 의해 코딩되고 서열번호: 2에 명시된 단백질을 지칭한다. 상기 단백질은 포스포에놀피루베이트 합성효소이다.
P. 아나나티스 ppsA는 서열번호: 3의 뉴클레오타이드 417-2801에 명시된 바와 같은 P. 아나나티스로부터의 ppsA 유전자의 cds를 지칭한다. P. 아나나티스 PpsA는 상기 cds(P. 아나나티스 ppsA)에 의해 코딩되고 서열번호: 4에 명시된 단백질을 지칭한다.
약어 WT(Wt)는 야생형을 지칭한다. 야생형 유전자는 진화를 통해 자연적으로 발생하고 야생형 게놈에 존재하는 유전자의 형태를 지칭한다. Wt 유전자의 DNA 서열은 NCBI와 같은 데이터베이스에서 공개적으로 접근가능하다.
대립유전자는 돌연변이에 의해, 즉 DNA의 뉴클레오타이드 서열에 대한 변화에 의해, 서로 전환될 수 있는 유전자의 상태를 정의한다. 미생물에서 자연적으로 발생하는 유전자는 야생형 대립유전자로 지칭되고, 이로부터 유래된 변이체는 유전자의 돌연변이된 대립유전자로 지칭된다.
상동성 유전자 또는 상동성 서열은 DNA의 상기 유전자 또는 부분의 DNA 서열들이 적어도 80% 동일하고, 바람직하게는 적어도 90% 동일하고, 특히 바람직하게는 적어도 95% 동일한 것을 의미하는 것으로 이해되어야 한다.
DNA 동일성의 정도는 http://blast.ncbi.nlm.nih.gov/에서 찾을 수 있고 blastn 알고리즘을 기반으로 하는 "nucleotide blast" 프로그램에 의해 결정된다. 기본 매개변수는 둘 이상의 뉴클레오타이드 서열의 정렬을 위한 알고리즘 매개변수로서 사용되었다. 기본 일반 매개변수는 최대 표적 서열 = 100; 짧은 쿼리 = "짧은 입력 서열에 대한 매개변수 자동 조정"; 예상 임계값 = 10; 단어 크기 = 28; 짧은 입력 서열에 대한 매개변수 자동 조정 = 0이다. 상응하는 기본 스코어링 매개변수는 매치/미스매치 스코어 = 1,-2; 갭 비용 = 선형이다.
단백질 서열은 http://blast.ncbi.nlm.nih.gov/에서 "protein blast" 프로그램을 사용하여 비교된다. 이 프로그램은 blastp 알고리즘을 사용한다. 기본 매개변수는 둘 이상의 단백질 서열의 정렬을 위한 알고리즘 매개변수로서 사용되었다. 기본 일반 매개변수는 최대 표적 서열 = 100; 짧은 쿼리 = "짧은 입력 서열에 대한 매개변수 자동 조정"; 예상 임계값 = 10; 단어 크기 = 3; 짧은 입력 서열에 대한 매개변수 자동 조정 = 0이다. 기본 스코어링 매개변수는 매트릭스 = BLOSUM62; 갭 비용 = 존재: 11 확장: 1; 구성 조정 = 조건부 구성 스코어 매트릭스 조정이다.
본 발명에 따른 미생물에서, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성은 비활성화되거나 야생형 효소의 특이적 활성에 비해 바람직하게는 적어도 10%, 특히 바람직하게는 적어도 25%, 특히 바람직하게는 적어도 60% 및 구체적으로 바람직하게는 적어도 70% 감소된다. 적어도 10%(또는 25%/60%/70%) 감소되는 ppsA 유전자에 의해 코딩되는 효소의 효소 활성은 또한 최대 90%(또는 75%/40%/30%)의 잔류 활성으로 지칭된다.
바람직한 구현예에서, 미생물 균주는 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 임의의 효소 활성을 더 이상 갖지 않는 것을 특징으로 하며, 즉, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성은 야생형 효소의 특이적 활성에 비해 100% 감소된다.
본 발명의 맥락에서, "(상응하는) 야생형 효소에 비해/와 비교하여/와 관련하여"는 미생물로부터의 유전자의 비돌연변이 형태에 의해, 즉 진화를 통해 자연적으로 발생하고 상기 미생물의 야생형 게놈에 존재하는 유전자에 의해 코딩되는 단백질의 활성과의 비교를 의미한다.
L-시스테인의 발효 생산에 적합한 미생물 균주는 시스테인, 시스틴 또는 그로부터 유래된 유도체의 합성을 야기하는 탈조절된 생합성 대사 경로(상동 또는 이종)를 함유하는 모든 미생물을 포함한다. 이러한 균주는, 예를 들어 EP 0 885 962 B1, EP 1 382 684 B1, EP 1 220 940 B2, EP 1 769 080 B1 및 EP 2 138 585 B1에 개시되어 있다.
L-시스테인의 발효 생산에 적합한 미생물은 바람직하게는 하기 변형 중 하나를 갖는 것을 특징으로 한다:
a) 미생물 균주는 상응하는 야생형 효소(예를 들어, EP 1 950 287 B1에 기재된 바와 같음)와 비교하여 적어도 2배 감소되는 L-세린에 의한 피드백 억제를 갖는 변형된 3-포스포글리세레이트 데하이드로게나제(serA)에 의해 구별된다.
상응하는 야생형 효소와 비교하여, 3-포스포글리세레이트 데하이드로게나제(serA)의 특히 바람직한 변이체는 적어도 5배, 특히 바람직하게는 적어도 10배, 및 더욱 바람직한 구현예에서, 적어도 50배로 감소되는 L-세린에 의한 피드백 억제를 갖는다.
b) 미생물 균주는 상응하는 야생형 효소와 비교하여, 적어도 2배로 감소되는 시스테인에 의한 피드백 억제를 갖는 세린 O-아세틸트랜스퍼라제(cysE)를 함유한다(예를 들어, EP 0 858 510 B1 또는 Nakamori et al., Appl. Env. Microbiol. (1998) 64: 1607-1611에 기재된 바와 같음).
상응하는 야생형 효소와 비교하여, 세린 O-아세틸트랜스퍼라제(cysE)의 특히 바람직한 변이체는 적어도 5배, 특히 바람직하게는 적어도 10배, 더욱 바람직한 구현예에서, 적어도 50배로 감소되는 시스테인에 의한 피드백 억제를 갖는다.
c) 미생물 균주는 상응하는 야생형 세포와 비교하여 유출 유전자의 과발현으로 인해 적어도 2배로 증가되는 세포 밖으로의 시스테인의 이출을 나타낸다.
야생형 세포와 비교하여, 유출 유전자의 과발현은 바람직하게는 적어도 5배, 특히 바람직하게는 적어도 10배 및 특히 바람직하게는 적어도 20배로 증가되는 세포 밖으로의 시스테인의 이출을 야기한다.
유출 유전자는 바람직하게는 E. 콜리로부터의 ydeD(EP 0 885 962 B1 참조), yfiK(EP 1 382 684 B1 참조), cydDC(W0 2004/113373 A1 참조), bcr(US 2005-221453 AA 참조) 및 emrAB(US 2005-221453 AA 참조) 또는 상이한 미생물로부터의 상응하는 상동성 유전자로 이루어진 군으로부터 유래된다.
이러한 균주는, 예를 들어 EP 0 858 510 B1 및 EP 0 885 962 B1로부터 공지되어 있다.
더욱이, L-시스테인의 발효 생산에 적합한 미생물 균주는 바람직하게는 세포가 야생형 세포와 비교하여 이러한 효소 활성의 최대 50%만을 함유할 정도로 적어도 하나의 시스테인 분해 효소가 약화되는 것을 특징으로 한다. 시스테인 분해 효소는 바람직하게는 트립토파나제(TnaA) 및 시스타티오닌 β-리아제(MalY, MetC)로 이루어진 군으로부터 유래된다.
이전 단락에 기술된 L-시스테인의 발효 생산에 적합한 미생물 균주는, 시스테인 대사에 관해 탈조절되지 않고 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하는 방식으로 이들의 시스테인 대사에 관해 탈조절된다. 시스테인 대사에 관해 탈조절되지 않고 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주의 세포에서, 배양물 내의 L-시스테인의 양은 약 0 g/l이므로(표 2 참조), 증가된 양은 배양 24시간 후 배양물에서 측정된 0.05 g/l L-시스테인을 초과하는 임의의 양을 의미한다.
바람직하게는, 미생물 균주는 상기 미생물 균주가 엔테로박테리아과 또는 코리네박테리아과(Corynebacteriaceae family)로부터의 균주, 특히 바람직하게는 엔테로박테리아과로부터의 균주인 것을 특징으로 한다. 이러한 균주는 그 중에서도 예를 들어 DSMZ-독일 생물자원센터(German Collection of Microbial and Cell Cultures GmbH(Braunschweig))로부터 상업적으로 이용가능하다.
바람직하게는, 미생물 균주는 에셰리키아 콜리, 판토에아 아나나티스 및 코리네박테리움 글루타미쿰으로 이루어진 군으로부터 선택되고, 특히 바람직하게는 에셰리키아 콜리 및 판토에아 아나나티스로 이루어진 군으로부터 선택된다. 특히 바람직하게는, 미생물 균주는 종 에셰리키아 콜리의 균주이다.
특히 바람직하게는, E. 콜리 균주는 E. 콜리 K12, 특히 바람직하게는 E. 콜리 K12 W3110으로부터 선택된다. 이러한 균주는 그 중에서도 예를 들어 DSMZ-독일 생물자원센터(German Collection of Microbial and Cell Cultures GmbH(Braunschweig))로부터 상업적으로 이용가능하며, E. 콜리 K12 W3110 DSM 5911(id. ATCC 27325) 및 판토에아 아나나티스 DSM 30070(id. ATCC 11530)을 포함한다. PpsA는 바람직하게는 서열번호: 2를 갖는 E. 콜리로부터의 PpsA 또는 서열번호: 4를 갖는 P. 아나나티스로부터의 PpsA이다.
바람직하게는, 미생물 균주는 ppsA 유전자 내에 적어도 하나의 돌연변이를 함유하는 것을 특징으로 한다. 동시에, 균주는 또한 본 바람직한 구현예에서 야생형 세포와 비교하여 증가된 양의 L-시스테인을 형성한다. 바람직하게는, ppsA 유전자에서의 유전적 변형은 상기 유전자에 의해 발현되는 단백질이 야생형 효소의 특이적 활성에 비해 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 감소된 상대적 효소 활성을 갖거나 이러한 효소 활성을 갖지 않도록 유발한다.
더욱이, 본 발명에 따른 생산 균주는 시스테인 생산의 추가 개선을 위해 더 최적화될 수 있다.
최적화는, 예를 들어, 생산 특성을 개선시키기에 적합한 하나 이상의 유전자를 추가적으로 발현시킴으로써 유전적으로 달성될 수 있다. 상기 유전자는 그 자체로 공지된 방식으로 별개의 유전자 작제물로서 또는 조합하여 발현 단위로서(소위 오페론으로서) 생산 균주에서 발현될 수 있다.
또한, 생산 균주는 ppsA 유전자 이외에 이의 유전자 산물이 시스테인 생산에 악영향을 미치는 추가의 유전자를 비활성화시킴으로써 최적화될 수 있다.
그러나, 최적화는 또한 돌연변이유발 및 개선된 시스테인 생산을 갖는 균주의 선택에 의해 그 자체로 공지된 방식으로도 가능하다.
본 발명의 맥락에서, ppsA 유전자에서의 유전적 변형은
a) ppsA 유전자의 코딩 서열이 부분적으로 또는 완전히 결실되거나,
b) ppsA 유전자의 코딩 서열이 하나 이상의 삽입 또는 5' 및/또는 3' 신장에 의해 변형되거나,
c) ppsA 구조 유전자가 약화된 효소 활성을 갖거나 완전히 비활성인 발현된 포스포에놀피루베이트 합성효소를 초래하는, 하나 이상의 돌연변이, 특히 점 돌연변이를 함유하거나,
d) ppsA 구조 유전자가 ppsA 발현의 강력한 약화 또는 완전한 억제 또는 mRNA 안정성의 감소를 초래하는, 하나 이상의 돌연변이, 특히 점 돌연변이를 함유하거나, 또는
e) ppsA 유전자의 발현 또는 ppsA mRNA의 번역이 5' 및/또는 3' 비코딩 ppsA 서열(프로모터, 5'-UTR, 샤인-달가르노 서열 및/또는 종결자)에 대한 유전적 변형으로 인해 약화되거나 완전히 억제되고
이러한 서열에 의해 발현된 단백질이 야생형 효소의 특이적 활성에 비해 감소된 상대적 PEP 합성효소 활성을 갖는다는 것을 의미하는 것으로서 정의된다.
본 발명의 맥락에서, a) 내지 e)에 열거된 ppsA 유전자 내의 유전적 변형의 임의의 조합이 또한 가능하다. 따라서, 요약하면, 본 발명의 맥락에서 더 적은 PpsA 단백질이 형성되거나 전혀 형성되지 않고/않거나 발현된 PpsA 단백질이 덜 활성이거나 비활성일 수 있다.
대안적인 접근법에서, 당업자에게 공지된 소위 "안티센스 RNA" 전략에 의해 유전자 전사 수준에서 ppsA 효소 활성을 약화시키거나 완전히 비활성화시키는 것도 가능하다. 또한 화학적 억제제이거나 단백질 억제제인 억제제를 첨가함으로써 ppsA 효소 활성이 약화되거나 완전히 비활성화되는 것을 생각할 수 있다.
바람직하게는, 본 발명에 따른 균주에서 ppsA 유전자를 변형시키는 것은 ppsA 구조 유전자의 완전 또는 부분적 결실, 효소 활성의 약화 또는 효소 비활성화를 유발하는 방식의 ppsA 구조 유전자의 돌연변이, 또는 ppsA 구조 유전자 및/또는이의 전사되지 않거나 번역되지 않은 유전자 영역의 돌연변이를 포함하며, 여기서 유전자 영역은 ppsA 유전자의 발현 또는 번역의 약화 또는 완전한 억제 또는 ppsA mRNA의 안정성의 감소를 유발하는 방식으로, 발현을 조절하고 5' 및 3' 측면에 있다.
특히 바람직하게는, 본 발명에 따른 균주에서 ppsA 유전자의 비활성화는 ppsA cds(즉, E. 콜리의 ppsA cds의 경우, 서열번호: 1의 뉴클레오타이드 333-2711, 또는 P. 아나나티스의 ppsA cds의 경우, 서열번호: 3의 뉴클레오타이드 417- 2801)의 완전 또는 부분적 결실에 의해 또는 효소 활성의 약화 또는 효소 비활성화 또는 mRNA 안정성의 감소를 유발하는 방식으로 ppsA 구조 유전자의 돌연변이에 의해 유발된다.
바람직한 구현예에서, 미생물 균주는 돌연변이된 유전자가 에셰리키아 콜리로부터의 ppsA 유전자, 판토에아 아나나티스로부터의 ppsA 유전자, 및 이들 유전자와 상동성인 유전자로 이루어진 군으로부터 선택되는 것을 특징으로 한다. E. 콜리로부터의 ppsA 유전자는 유전자 ID 946209로 NCBI 유전자 데이터베이스 내의 항목에 개시되어 있고, P. 아나나티스로부터의 ppsA 유전자는 유전자 ID 11796889로 NCBI 유전자 데이터베이스의 항목에 개시되어 있다. 용어 "상동성 유전자"에 대해, 상기 주어진 정의가 적용된다. 특히 바람직하게는, 돌연변이된 ppsA 유전자는 E. 콜리로부터의 ppsA 유전자이다. 추가적으로 바람직한 구현예에서, 상기 cds는 서열번호: 1 뉴클레오타이드 333-2711(서열번호: 2를 갖는 단백질을 코딩함)에 개시된 E. 콜리로부터의 ppsA 유전자의 cds 또는 서열번호: 3 뉴클레오타이드 417-2801(서열번호: 4를 갖는 단백질을 코딩함)에 개시된 판토에아 아나나티스로부터의 ppsA 유전자의 cds이다.
바람직한 구현예에서, 미생물 균주는 ppsA 유전자의 코딩 DNA 서열이 서열번호: 5 또는 그와 상동성인 서열, 특히 바람직하게는 서열번호: 5인 것을 특징으로 한다. 용어 "상동 서열"에 대해서는, 상기 주어진 정의가 적용된다.
이 경우, 서열번호: 1에 명시된 DNA 서열에서의 돌연변이는 서열번호: 2에 명시된 WT 단백질 서열에서의 3개의 아미노산의 돌연변이, 즉, 서열번호: 6에 개시된 바와 같은 아미노산 서열을 갖는 ppsA-MHI 단백질을 코딩하는, 서열번호: 5에서와 같은 DNA 서열을 갖는 ppsA-MHI 유전자에 따라, 메티오닌으로 돌연변이된 위치 126에서의 발린(V126M), 히스티딘으로 돌연변이된 위치 427에서의 아르기닌(R427H) 및 이소류신으로 돌연변이된 위치 434에서의 발린(V434I)를 초래한다.
ppsA 유전자를 비활성화시키고 돌연변이시키기 위한 다양한 방법이 당업자에게 공지되어 있다. 가장 간단한 경우에, 모 균주는 공지된 방식으로(예컨대, N-메틸-N'-니트로-N-니트로소구아니딘과 같은 돌연변이유발 화학물질에 의해 화학적으로 또는 UV 조사에 의해 물리적으로) 돌연변이유발될 수 있고, 돌연변이는 게놈 DNA에서 무작위로 생성된 다음, 원하는 ppsA 돌연변이체는, 예를 들어, 돌연변이체가 효소 활성에 기초한 색 반응의 부재에 의해 또는 결함이 있는 ppsA 유전자의 검출을 통한 유전적 수단에 의해 각각 단수화된 후, 생성된 다수의 돌연변이체로부터 선택된다.
복잡한 무작위 돌연변이유발 및 원하는 ppsA 돌연변이체의 선택과 대조적으로, ppsA 유전자는 비교적 간단한 방식으로, 예를 들어 상동 재조합의 공지된 메커니즘에 의해 표적화된 비활성화를 거칠 수 있다. 상동 재조합에 의한 표적화된 유전자 비활성화를 위한 클로닝 시스템은 당업자에게 공지되어 있고, 예를 들어, Gene Bridges GmbH로부터의 Red®/ET® 기술에 기초한 "Quick and Easy E. coli Gene Deletion Kit"의 사용자 매뉴얼에 개시된 바와 같이 상업적으로 이용가능하다("Technical Protocol, Quick & Easy E. coli Gene Deletion Kit, by Red®/ET® Recombination, Cat. No. K006, Version 2.3, June 2012" 및 그 안에 인용된 참고문헌 참조).
선행 기술에 따르면, ppsA 유전자 또는 상기 유전자의 일부는 단리될 수 있고, 외래 DNA가 ppsA 유전자 내로 클로닝되어 ppsA 유전자의 단백질 한정 오픈 리딩 프레임을 방해할 수 있다. 따라서 ppsA 유전자의 표적화된 비활성화에 적합한 DNA 작제물은 게놈 ppsA 유전자와 상동성인 DNA의 5' 부분, 이후에 외래 DNA를 포함하는 유전자 세그먼트, 이후에 게놈 ppsA 유전자와 다시 상동성인 DNA의 3' 부분으로 구성될 수 있다.
따라서 상동 재조합을 위한 ppsA 유전자 내의 가능한 영역은 포스포에놀피루베이트 합성효소를 코딩하는 영역만을 포함하는 것은 아닐 수 있다. 가능한 영역은 또한 ppsA 유전자에 측접하는 DNA 서열, 즉 코딩 영역의 시작 전의 5' 영역(유전자 전사 프로모터, 예를 들어 서열번호: 1에서의 뉴클레오타이드 1 - 332, 또는 서열번호: 3에서의 뉴클레오타이드 1-416) 및 코딩 영역의 말단 이후의 3' 영역(유전자 전사 종결자, 예를 들어 서열번호: 1에서의 뉴클레오타이드 2712 - 3000, 또는 서열번호: 3에서의 뉴클레오타이드 2802 - 3062)에 있는 DNA 서열을 포함할 수 있고, 상동 재조합에 의한 이의 변형은 코딩 영역의 변형과 마찬가지로 ppsA 유전자의 비활성화를 야기할 수 있다.
외래 DNA는 바람직하게는 선별 마커 발현 카세트이다. 그것은 실제 선별 마커 유전자에 기능적으로 연결된 유전자 전사 프로모터, 선택적으로 이후의 유전자 전사 종결자로 구성된다. 이 경우, 선별 마커는 또한 ppsA 유전자의 5' 및 3' 측접 상동성 서열을 함유한다.
바람직하게는, 선별 마커는 각각 적어도 30 뉴클레오타이드, 특히 바람직하게는 적어도 50 뉴클레오타이드의 길이를 갖는 ppsA 유전자의 5' 및 3' 측접 상동성 서열을 함유한다.
따라서, ppsA 유전자를 비활성화시키기 위한 DNA 작제물은, 5' 말단으로부터 시작하여, ppsA 유전자에 상동성인 서열, 이후에 예를 들어 항생제 내성 유전자의 부류로부터 선택된 선별 마커의 발현 카세트, 및 이후에 ppsA 유전자에 상동성인 추가의 서열로 구성될 수 있다.
바람직한 구현예에서, ppsA 유전자를 비활성화시키기 위한 DNA 작제물은, 5' 말단으로부터 시작하여, 적어도 30개 뉴클레오타이드 길이, 특히 바람직하게는 적어도 50개 뉴클레오타이드 길이의 ppsA 유전자와 상동성인 서열, 이후에 항생제 내성 유전자의 부류로부터 선택되는 선별 마커의 발현 카세트, 및 이후에 적어도 30개 뉴클레오타이드 길이, 특히 바람직하게는 적어도 50개 뉴클레오타이드 길이의 ppsA 유전자와 상동성인 추가의 서열로 구성된다.
선별 마커 유전자는 일반적으로 그 유전자 생성물이 원래의 부모 균주가 성장할 수 없는 선택적 조건 하에서 부모 균주가 성장할 수 있도록 하는 유전자이다.
바람직한 선별 마커 유전자는 항생제 내성 유전자, 예를 들어 암피실린 내성 유전자, 테트라사이클린 내성 유전자, 카나마이신 내성 유전자, 클로람페니콜 내성 유전자 또는 네오마이신 내성 유전자의 군으로부터 선택된다. 다른 바람직한 선별 마커 유전자는 대사 결함을 갖는 모 균주(예컨대, 아미노산 영양요구체)가 상기 선별 마커 유전자의 발현에 의한 대사 결함의 보정의 결과로서 선택적 조건 하에서 성장할 수 있게 한다. 마지막으로, 또 다른 가능성은 이의 유전자 생성물이 모 균주에 대해 본질적으로 독성이 있는 화합물을 화학적으로 변경하여 상기 화합물을 비활성화시키는 선별 마커 유전자이다(예컨대, 많은 미생물에 독성인 화합물 아세트아미드를 무독성 생성물 아세테이트 및 암모니아로 분리하는, 효소 아세트아미다아제의 유전자).
암피실린 내성 유전자, 테트라사이클린 내성 유전자, 카나마이신 내성 유전자 및 클로람페니콜 내성 유전자가 선별 마커 유전자 중에서 특히 바람직하다. 테트라사이클린 내성 유전자 및 카나마이신 내성 유전자가 특히 바람직하다.
표적 유전자 비활성화 외에도 게놈으로부터 선별 마커를 제거하여 이중 및 다중 돌연변이체를 생산할 수 있게 하는 옵션을 제공하는 상동 재조합을 기반으로 하는 시스템도 있다. 이러한 시스템은, 예를 들어, Gene Bridges GmbH의 Red®/ET® 기술을 기반으로 하는 "Quick and Easy E. coli Gene Deletion Kit"로 상업적으로 이용가능한 소위 람다 레드 기술이다("Technical Protocol, Quick & Easy E. coli Gene Deletion Kit, by Red®/ET® Recombination, Cat. No K006, Version 2.3, June 2012" 및 그 안에 인용된 참고문헌 참조).
비활성화된 ppsA 유전자를 갖는 본 발명에 따른 균주의 예는 실시예에 개시되어 있는 균주 E. 콜리 W3110-△ppsA 및 P. 아나나티스-△ppsA::kan이다. 두 균주는 그들의 ppsA 유전자가 상동 재조합에 의해 비활성화된 것을 특징으로 한다.
상동 재조합에 기초한 표적화된 유전자 비활성화를 위한 또 다른 이러한 시스템은 당업자에게 공지되어 있고 실시예 3에 기술되어 있으며 람다 레드 재조합과 역선택 스크리닝의 조합에 기초하는 유전자 비활성화 또는 유전자 변형을 위한 방법이다. 상기 시스템은, 예를 들어, 문헌[Sun et al., Appl. Env. Microbiol. (2008) 74: 4241-4245]에 기재되어 있다. 예를 들어, 5' 말단으로부터 시작하여, ppsA 유전자에 상동성인 서열, 이후에 a) 항생제 내성 유전자의 부류로부터 선택된 선별 마커의 발현 카세트 및 b) 효소 레반수크라제를 코딩하는 sacB 유전자의 발현 카세트로 구성되는, 임의의 순서의 2개의 발현 카세트, 및 마지막으로 이후에 ppsA 유전자와 상동성인 추가 서열로 구성되는, ppsA 유전자를 비활성화시키기 위한 DNA 작제물이 사용된다.
1단계에서, DNA 작제물이 생산 균주 내로 형질전환되고 항생제 내성 클론이 단리된다. 수득된 클론은 이들이 공동통합된 sacB 유전자로 인해 수크로스 상에서 성장할 수 없다는 사실에 의해 구별된다. 2개의 마커 유전자는 2단계에서 적합한 DNA 단편이 상동 재조합에 의해 2개의 마커 유전자를 대체한다는 점에서 역선택의 원리에 의해 제거될 수 있다. 그 다음, 이 단계에서 수득된 클론은 수크로스 상에서 성장하는 능력을 회복한 다음 항생제에 대한 이들의 민감성을 회복한다. 이 방법은 실시예 3에서 E. 콜리의 ppsA WT 유전자(서열번호: 1)를 하기 기재된 삼중 돌연변이 PPSA-MHI(서열번호: 5)로 교환하기 위해 사용된다.
E. 콜리 균주 W3110-ppsA-MHI는 ppsA 유전자의 코딩 서열의 돌연변이로 인해 약화된 PpsA 효소 활성을 갖는 본 발명에 따른 균주의 일 예로서 실시예에 개시되어 있다. W3110-ppsA-MHI는 PpsA 삼중 돌연변이체 PpsA-V126M-R427H-V434I(ppsA-MHI)의 cds를 포함한다. ppsA-MHI의 돌연변이된 유전자의 cds는 DNA 서열 서열번호: 5에 상응하며 서열번호: 6의 서열을 갖는 PpsA 단백질을 코딩한다. PpsA-MHI는 서열번호: 6의 서열을 갖는 단백질이, 서열번호: 2에 명시된 WT 서열과 비교하여, 아미노산 서열에서의 하기 변화를 함유하는 것을 특징으로 한다: 위치 126에서의 발린은 메티오닌으로 돌연변이되고(V126M), 위치 427에서의 아르기닌은 히스티딘으로 돌연변이되며(R427H), 위치 434에서의 발린은 이소류신으로 돌연변이된다(V434I).
이러한 돌연변이로 인해, PpsA-MHI 단백질은 특정 야생형 효소 활성과 비교하여 26.8%의 상대적 효소 활성만을 가지고 있었다(실시예 5, 표 1 참조).
E. 콜리 ppsA 유전자의 경우, cds에서의 돌연변이 중 적어도 하나가 서열번호: 2에서의 아미노산 서열에서 하기 변화: 위치 126에서의 발린, 위치 427에서의 아르기닌 및/또는 위치 434에서의 발린 중 적어도 하나를 야기하는 것이 바람직하며, 상기 3개의 아미노산 중 임의의 것은 임의의 다른 아미노산으로 교환될 수 있다.
서열번호: 2에 명시된 WT 단백질의 아미노산 서열 내의 3개의 아미노산의 동시 돌연변이를 야기하는 돌연변이가 특히 바람직하다.
본 발명에 따른 ppsA-MHI 유전자에서의 돌연변이는 그 자체로 공지된 방식으로, 예를 들어 Agilent의 "QuickChange II Site-Directed Mutagenesis Kit"에 대한 사용자 매뉴얼에 개시된 바와 같이, 예를 들어 상업적으로 이용가능한 클로닝 키트를 사용하는 소위 "부위 지향적" 돌연변이유발에 의해 ppsA WT 유전자 내로 도입된다. 대안적으로, 본 발명에 따른 ppsA-MHI 유전자는 또한 DNA 합성에 의해 공지된 방식으로 생산될 수 있다.
예를 들어, E. 콜리 ppsA-MHI 삼중 돌연변이체와 같이 효소 활성의 약화를 유발하는 방식의 ppsA 구조 유전자의 돌연변이를 특징으로 하는 본 발명에 따른 균주는, 실시예에 개시된 바와 같이, 람다 레드 재조합과 유전적 변형을 위한 역선택 스크리닝과의 상기 기재된 조합을 사용하여 생산될 수 있다(예를 들어, Sun et al., Appl. Env. Microbiol. (2008) 74: 4241-4245 참조).
특히 바람직한 균주는 E. 콜리 W3110 △ppsA(실시예 1에 기재됨) 및 E. 콜리 W3110 ppsA-MHI(실시예 3에 기재됨)이다 .
본 발명은 본 발명에 따른 미생물 세포가 사용되는 것을 특징으로 하는, L-시스테인을 생산하기 위한 발효 공정을 추가로 제공한다.
형성되는 본 발명에 따른 공정의 주요 생성물은 L-시스테인이며, 이로부터 화합물 L-시스틴 및 티아졸리딘이 형성될 수 있다. L-시스틴과 티아졸리딘은 발효 중에 형성되어 배양 상청액과 침전물 모두에서 축적된다. 티아졸리딘은 시스테인 생산의 부산물로서 형성될 수 있는 피루베이트 및 시스테인의 부가물인 2-메틸-2,4-티아졸리딘디카르복실산이다(EP 0 885 962 B1).
본 발명의 맥락에서, 총 시스테인의 수율은 생산된 시스테인, 시스틴 및 티아졸리딘의 총합으로서 정의된다. 이는 실시예 7에 기재된 바와 같이 전체 배양물로부터 결정된다. 그것은, 예를 들어, Gaitonde(Gaitonde, M. K. (1967) Biochem. J. 104, 627-633)에 의한 비색 분석으로 정량화될 수 있다.
선행 기술은 아미노산, 특히 시스테인의 생산이 포스포에놀피루베이트 합성효소 효소 활성을 약화시키거나 비활성화시킴으로써 개선될 수 있는 임의의 공정 또는 생산 균주를 개시하지 않는다.
본 출원의 실시예에 나타낸 바와 같이, 시스테인 생산에 적합한 미생물 균주에서 ppsA 효소 활성의 약화 또는 비활성화는 총 시스테인의 수율, 즉 발효 공정에서 생산된 시스테인, 시스틴 및 및 티아졸리딘의 총합을 유의하게 증가시킨다. 선행 기술로부터, 이것은 전혀 예상치 못한 것이었다.
실시예 7의 표 4에 요약된 바와 같이, 상응하는 야생형 균주와 비교하여 E. 콜리 W3110의 ppsA 돌연변이체의 발효에서 유의하게 더 높은 시스테인 수율이 달성되었다는 것은 놀라운 일이었다. 선행 기술과는 반대로 그리고 당업자에게 예상외로, 포스포에놀피루베이트 합성효소 활성의 약화 또는 비활성화는 개선된 시스테인 생산 균주를 초래하였다.
시스테인 생산 균주를 개선하기 위한 이러한 신규하고 진보적인 수단은 실시예 6의 표 2 및 표 3에 요약된 결과에 의해 확인되었으며, 여기서 에셰리키아 콜리에서 약화된 효소 활성을 갖는 PpsA 효소를 초래하는 ppsA 유전자의 비활성화, 또는 돌연변이된 ppsA 및 판토에아 아나나티스에서 ppsA 유전자의 비활성화는 이미 진탕 플라스크에서의 배양에서 개선된 시스테인 수율을 야기하였다.
따라서, 당업자에게, 포스포에놀피루베이트 합성효소 활성의 약화 또는 비활성화는 다른 시스테인 생산 균주에서 시스테인 생산을 개선하기 위한 신규한 유용한 수단이다.
따라서, 본 발명에 따르며 시스테인 생산에 적합한 미생물 균주에서, 생산 균주에서 ppsA 유전자에 의해 코딩되는 단백질의 효소 활성은 약화되거나 완전히 억제되며, 동시에 시스테인 생산은 증가된다. 실시예 7은 시스테인 생산이 가능하고 Wt 효소 대신 감소된 PpsA 효소 활성을 갖는 ppsA 돌연변이체 ppsA-MHI를 코딩하는 균주가 ppsA WT 유전자를 함유하는 균주보다 발효에서 유의하게 높은 시스테인 수율을 달성한다는 것을 입증한다.
문제의 발효 과정에서, 형성되는 것은 본 발명에 따른 생산 균주의 바이오매스뿐만 아니라, 시스테인 및 이의 산화 생성물 시스틴이다. 바이오매스와 시스테인의 형성은 일시적으로 상관될 수 있거나, 또는 바이오매스와 시스테인은 시간이 지남에 따라 상호 분리된 방식으로 형성될 수 있다. 배양은 당업자에게 익숙한 방식으로 수행된다. 이를 위해, 배양은 쉐이크 플라스크(실험실 규모)에서 또는 발효(생산 규모)에 의해 수행될 수 있다.
1 L 초과의 발효 부피를 갖는 발효에 의한 생산 규모 공정이 바람직하며, 10 L 초과의 생산 규모가 바람직하고, 1000 L 초과의 생산 규모가 특히 바람직하며, 10,000 L 초과의 발효 부피가 특히 바람직하다.
배양 배지는 미생물 배양의 실시로부터 당업자에게 익숙하다. 이들은 전형적으로 탄소원, 질소원, 및 첨가제, 예컨대 비타민, 염 및 미량 원소, 및 세포 성장 및 시스테인 생산을 최적화하는 황 공급원으로 구성된다.
탄소원은 시스테인 생성물의 형성을 위해 생산 균주에 의해 사용될 수 있는 것이다. 이들은 예를 들어 글루코스, 만노스, 프럭토스 또는 갈락토스와 같은 C6 당(헥소스) 및 예를 들어 자일로스, 아라비노스 또는 리보스와 같은 C5 당(펜토스)을 포함하는 모든 형태의 단당류를 포함한다.
그러나, 본 발명에 따른 생산 방법은 또한 이당류, 특히 수크로스, 락토스, 말토스 또는 셀로비오스의 형태의 모든 탄소원을 포함한다.
더욱이, 본 발명에 따른 생산 공정은 또한 2개 초과의 당 단위를 갖는 고급 당류, 글리코사이드 또는 탄수화물 형태의 모든 탄소원, 예를 들어 말토덱스트린, 전분, 셀룰로스, 헤미셀룰로스, 펙틴 또는 가수분해에 의해 (효소적 또는 화학적으로) 방출되는 단당류 또는 올리고머를 포함한다. 고급 탄소원의 가수분해는 본 발명에 따른 생산 공정의 상류일 수 있거나, 또는 본 발명에 따른 생산 공정 동안 원위치에서 일어날 수 있다.
당 또는 탄수화물 이외의 다른 이용가능한 탄소원은 아세트산(또는 그로부터 유래된 아세테이트 염), 에탄올, 글리세롤, 시트르산(및 그의 염) 또는 피루베이트(및 그의 염)이다. 그러나, 이산화탄소 또는 일산화탄소와 같은 기체 탄소원도 생각할 수 있다.
본 발명에 따른 생산 공정과 관련하여 탄소원은 분리된 순수한 물질 또는 경제적 효율을 증가시키기 위해 가수분해물로서 식물성 원료의 화학적 또는 효소적 소화에 의해 수득될 수 있는 바와 같이 추가의 정제 없이 개별 탄소원의 혼합물을 포함한다. 이들은, 예를 들어, 전분(글루코스 단당류), 사탕무(글루코스, 프럭토스 및 아라비노스 단당류), 사탕수수(수크로스 이당류), 펙틴(갈락투론산 단당류) 또는 리그노셀룰로오스(셀룰로스로부터의 글루코스 단당류, 헤미셀룰로오스로부터의 자일로스, 아라비노스, 만노스 및 갈락토스 단당류, 및 비탄수화물 리그닌)의 가수분해물을 포함한다. 또한, 식물성 원료의 소화로부터의 폐기물, 예를 들어 당밀(사탕무) 또는 바가스(사탕수수)가 또한 탄소원으로 사용될 수 있다.
생산 균주를 배양하기 위한 바람직한 탄소원은 글루코스, 프럭토스, 수크로스, 만노스, 자일로스, 아라비노스, 및 전분, 리그노셀룰로오스, 사탕수수 또는 사탕무로부터 수득될 수 있는 식물성 가수분해물이다.
특히 바람직한 탄소원은 단리된 형태 또는 식물성 가수분해물의 구성성분으로서 글루코스 및 수크로스이다.
특히 바람직한 탄소원은 글루코스이다.
질소원은 바이오매스의 형성을 위해 생산 균주에 의해 사용될 수 있는 것들이다. 이들은 기체 형태 또는 NH4OH와 같은 수용액 중의 암모니아, 또는 이의 염, 예를 들어 암모늄 설페이트, 암모늄 클로라이드, 암모늄 포스페이트, 암모늄 아세테이트 또는 암모늄 니트레이트를 포함한다. 더욱이, 적합한 질소원은 공지된 니트레이트 염, 예를 들어, KNO3, NaNO3, 암모늄 니트레이트, Ca(NO3)2, Mg(NO3)2 및 다른 질소원, 예컨대, 우레아이다. 질소원은 또한 아미노산의 복합 혼합물, 예를 들어 효모 추출물, 프로테오스 펩톤, 맥아 추출물, 대두 펩톤, 카사미노산, 옥수수 침지액(액체 또는 소위 CSD로서 건조됨) 및 또한 NZ 아민 및 효모 질소 염기를 포함한다.
배치(batch) 형태의 1회 첨가로서 또는 연속 공급물로서 황 공급원의 계량된 첨가가 시스테인 및 시스테인 유도체의 효율적인 생산에 필요하다. 연속적인 계량 첨가는 순수한 공급 용액으로서 또는 예를 들어 글루코스와 같은 추가 공급 구성요소와의 혼합물로 달성될 수 있다.
적합한 황 공급원은 설페이트, 설파이트, 디티오나이트, 티오설페이트 또는 설파이드의 염이며, 이는 주어진 안정성에서 각각의 산을 사용하는 것도 생각할 수 있다.
바람직한 황 공급원은 설페이트, 설파이트, 티오설페이트 및 설파이드의 염이다.
특히 바람직한 황 공급원은 설페이트 및 티오설페이트의 염이다.
특히 바람직한 것은 티오설페이트 염, 예를 들어 나트륨 티오설페이트 및 암모늄 티오설페이트이다.
배양은 소위 배치 모드로 수행될 수 있으며, 이는 생산 균주의 스타터 배양물로 배양 배지의 접종 후 영양소 공급원의 추가 공급 없는 세포 성장을 포함한다.
배양은 또한 소위 유가 방식으로 수행될 수 있으며, 이는 이의 소모를 보상하기 위해 배치 모드로 성장의 초기 단계 후에 영양소 공급원(공급물)의 추가 공급을 포함한다. 공급물은 탄소원, 질소원, 황 공급원, 생산에 중요한 하나 이상의 비타민 또는 미량 원소, 또는 전술한 것들의 조합으로 구성될 수 있다. 공급물 구성요소는 혼합물로서 함께 또는 개별 공급 섹션에서 별도로 계량될 수 있다. 또한, 시스테인 생산을 특이적으로 증가시키는 첨가제와 마찬가지로, 다른 배지 성분이 또한 공급물에 첨가될 수 있다. 공급물은 연속적으로 또는 부분적으로(불연속적으로) 공급될 수 있거나, 또는 연속적 및 불연속적 공급물의 조합으로 공급될 수 있다. 유가 방식의 배양이 바람직하다.
공급물 중의 바람직한 탄소원은 글루코스, 수크로스, 및 글루코스 또는 수크로스 함유 식물성 가수분해물, 및 임의의 혼합 비율의 바람직한 탄소원의 혼합물이다.
공급물에서 특히 바람직한 탄소원은 글루코스이다.
바람직하게는, 배양물의 탄소원은 생산 단계 동안 발효기 내의 탄소원의 함량이 10 g/L를 초과하지 않도록 계량된다. 2 g/L의 최대 농도가 바람직하고 0.5 g/L의 최대 농도가 특히 바람직하며, 0.1 g/L의 최대 농도가 특히 바람직하다.
공급물 중의 바람직한 질소원은 기체 형태 또는 NH4OH와 같은 수용액 중의 암모니아, 및 그의 염 암모늄 설페이트, 암모늄 포스페이트, 암모늄 아세테이트 및 암모늄 클로라이드, 및 추가적으로 우레아, KNO3, NaNO3 및 암모늄 니트레이트, 효모 추출물, 프로테오스 펩톤, 맥아 추출물, 대두 펩톤, 카사미노산, 옥수수 침지액 및 또한 NZ 아민 및 효모 질소 염기이다.
공급물 중의 특히 바람직한 질소원은 암모니아 또는 암모늄 염, 우레아, 효모 추출물, 대두 펩톤, 맥아 추출물 또는 옥수수 침지액(액체 또는 건조 형태)이다.
공급물 중의 바람직한 황 공급원은 설페이트, 설파이트, 티오설페이트 및 설파이드의 염이다.
공급물 중의 특히 바람직한 황 공급원은 설페이트 및 티오설페이트의 염이다.
공급물 중의 황 공급원으로서 특히 바람직한 것은 티오설페이트 염, 예를 들어 나트륨 티오설페이트 및 암모늄 티오설페이트이다.
추가의 배지 첨가제로서, 원소 인, 염소, 나트륨, 마그네슘, 질소, 칼륨, 칼슘, 철의 염 및 미량으로(즉, μM 농도로) 원소 몰리브덴, 붕소, 코발트, 망간, 아연, 구리 및 니켈의 염이 첨가될 수 있다. 또한, 유기산(예컨대, 아세테이트, 시트레이트), 아미노산(예컨대, 이소류신) 및 비타민(예컨대, 비타민 Bl, 비타민 B6)이 배지에 첨가될 수 있다.
배양은 생산 균주의 성장 및 시스테인 생산을 촉진하는 pH 및 온도 조건 하에서 수행된다. 유용한 pH 범위는 pH 5 내지 pH 9 범위이다. pH 5.5 내지 pH 8의 pH 범위가 바람직하다. pH 6.0 내지 pH 7.5의 pH 범위가 특히 바람직하다.
생산 균주의 성장에 바람직한 온도 범위는 20℃ 내지 40℃이다. 온도 범위는 특히 바람직하게는 25℃ 내지 37℃이고, 특히 바람직하게는 28℃ 내지 34℃이다.
생산 균주의 성장은 선택적으로 산소 공급 없이(혐기성 배양) 또는 산소 공급과 함께(호기성 배양) 발생할 수 있다. 산소를 이용한 호기성 배양이 바람직하다.
시스테인 생산을 위한 본 발명에 따른 균주의 호기성 배양의 경우, 산소 함량에 대해 적어도 10%(v/v), 바람직하게는 적어도 20%(v/v) 및 특히 바람직하게는 적어도 30%(v/v)의 포화가 설정된다. 선행 기술에 따르면, 배양물 중의 산소 포화는 기체 공급 및 교반 속도의 조합을 통해 자동으로 조절된다.
산소 공급은 압축 공기 또는 순수한 산소의 도입에 의해 보장된다. 압축 공기의 도입에 의한 호기성 배양이 바람직하다. 호기성 배양에서 압축 공기 공급의 유용한 범위는 0.05 vvm 내지 10 vvm이다(vvm: 분당 발효 부피 리터당 압축 공기 리터로 지정된 발효 배치 내로의 압축 공기의 도입). 0.2 vvm 내지 8 vvm의 압축 공기의 도입이 바람직하고, 0.4 내지 6 vvm의 압축 공기의 도입이 특히 바람직하며 0.8 내지 5 vvm의 압축 공기의 도입이 특히 바람직하다.
최대 교반 속도는 2500 rpm, 바람직하게는 2000 rpm 및 특히 바람직하게는 1800 rpm이다.
배양 시간은 10시간 내지 200시간이다. 20시간 내지 120시간의 배양 시간이 바람직하다. 30시간 내지 100시간의 배양 시간이 특히 바람직하다.
전술한 방법에 의해 수득된 배양 배치는 배양 상층액에 용해된 형태로, 또는 침전된 형태의 시스틴으로서 산화된 시스테인을 함유한다. 배양 배치에 함유된 시스테인 또는 시스틴은 추가 작업 없이 직접 추가로 사용될 수 있거나 배양 배치로부터 단리될 수 있다.
바람직하게는, 상기 공정은 형성된 시스테인이 단리되는 것을 특징으로 한다. 그 자체로 공지된 공정 단계가 시스테인 및 시스틴을 단리하는 데 이용가능하며, 이는 원심분리, 경사분리, 무기산을 이용한 미정제 생성물의 용해, 여과, 추출, 크로마토그래피 또는 결정화, 또는 침전을 포함한다. 상기 공정 단계는 원하는 순도로 시스테인을 단리하기 위해 임의의 형태로 조합될 수 있다. 원하는 순도의 정도는 추가 사용에 따라 달라진다.
작업에 의해 수득된 시스틴은 추가 사용을 위해 시스테인으로 환원될 수 있다. 전기화학적 공정에서 L-시스틴을 L-시스테인으로 환원시키는 공정이 EP 0 235 908에 개시되어 있다.
분광 광도법, NMR, 기체 크로마토그래피, HPLC, 질량 분광법, 중량측정법, 또는 이들 분석 방법의 조합을 포함하여, 시스테인 또는 시스틴 생성물을 확인하고, 정량화하고, 순도의 정도를 결정하기 위한 다양한 분석 방법이 이용가능하다.
본 발명은 또한 화합물의 발효 생산을 위한 개선된 미생물 균주를 생산하는데 사용될 수 있으며, 이의 생합성은 3-포스포글리세레이트로부터 시작하여 L-세린을 통해 L-시스테인 및 L-시스틴으로 이어진다. 이것은 또한 포스포세린, O-아세틸세린, N-아세틸세린 및 L-시스테인과 피루베이트의 축합 생성물인 티아졸리딘을 포함한, L-세린 및 L-시스테인의 유도체의 발효 생산을 위한 미생물 균주를 포함한다.
도면은 실시예에서 사용된 플라스미드를 보여준다.
도 1은 실시예 1 및 실시예 2에서 사용된 3.4 kb 벡터 pKD13을 나타낸다.
도 2는 실시예 1 및 실시예 3에서 사용된 6.3 kb 벡터 pKD46을 나타낸다.
도 3은 실시예 3에서 사용된 5 kb 벡터 pKan-SacB를 나타낸다.
도 4는 실시예 4에서 사용된 4.2 kb 벡터 pACYC184를 나타낸다.
도 1은 실시예 1 및 실시예 2에서 사용된 3.4 kb 벡터 pKD13을 나타낸다.
도 2는 실시예 1 및 실시예 3에서 사용된 6.3 kb 벡터 pKD46을 나타낸다.
도 3은 실시예 3에서 사용된 5 kb 벡터 pKan-SacB를 나타낸다.
도 4는 실시예 4에서 사용된 4.2 kb 벡터 pACYC184를 나타낸다.
본 발명은 하기 실시예에 의해 제한되지 않고 이에 의해 추가로 예시될 것이다:
실시예 1:
에셰리키아 콜리에서 ppsA 결실 돌연변이체의 생산
유전자 분리 및 균주 개발에 사용된 모 균주는 에셰리키아 콜리 K12 W3110(DSMZ-독일 생물자원센터 GmbH로부터 균주 번호 DSM 5911하에 상업적으로 이용가능함)이었다 .
유전자 비활성화의 표적은 E. 콜리로부터의 ppsA 유전자의 코딩 서열이었다. E. 콜리 K12로부터의 ppsA 유전자의 DNA 서열(Genbank GeneID: 946209)은 서열번호: 1에 개시되어 있다. 뉴클레오타이드 333-2711(E. 콜리 ppsA에 의해 식별됨)은 서열번호: 2(E. 콜리 PpsA)에 개시된 아미노산 서열을 갖는 포스포에놀피루베이트 합성효소 단백질을 코딩한다.
E. 콜리 ppsA 유전자를 하기에 상세히 설명된 바와 같이 Gene Bridges GmbH의 Red®/ET® 기술을 사용하여 비활성화시켰다("Quick and Easy E. coli Gene Deletion Kit"의 사용자 매뉴얼에 설명되어 있음, "Technical Protocol, Quick & Easy E. coli Gene Deletion Kit, by Red®/ET® Recombination, Cat. No. K006, Version 2.3, June 2012" 및 그 안에 인용된 참고문헌, 예컨대 Datsenko and Wanner, Proc. Natl. Acad. Sci. USA 97 (2000): 6640-6645 참조). 이를 위해, 플라스미드 pKD13, pKD46 및 pCP20을 사용하였다:
- 3.4 kb 플라스미드 pKD13(도 1)은 수탁번호 AY048744.1 하에 "GenBank" 유전자 데이터베이스에 개시되어 있다.
- 6.3 kb 플라스미드 pKD46(도 2)은 수탁번호 AY048746.1 하에 "GenBank" 유전자 데이터베이스에 개시되어 있다.
- 9.4 kb 플라스미드 pCP20은 문헌[Cherepanov and Wackernagel, Gene 158 (1995): 9-14]에 개시되어 있다.
람다 레드 시스템을 사용한 상동 재조합에 의해 E. 콜리 W3110에서 ppsA 유전자를 비활성화시키기 위해, 하기 단계를 수행하였다:
1. E. 콜리 W3110을 플라스미드 pKD46(소위 "레드 재조합효소" 플라스미드, 도 2)으로 형질전환시키고, 암피실린 내성 클론(W3110 x pKD46으로 지칭됨)을 단리하였다.
2. 이의 비활성화에 적합한 ppsA 특이적 DNA 단편을 플라스미드 pKD13의 DNA(도 1) 및 프라이머 pps-5f(서열번호: 7) 및 pps-6r(서열번호: 8)을 이용한 PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에서 생산하였다.
프라이머 pps-5f는 ppsA 유전자의 5' 영역으로부터 30개의 뉴클레오타이드(nt)(서열번호: 1에서 nt 333-362) 및 이에 연결된, 플라스미드 pKD13에 특이적인 20 nt(도 1에서 "pr-1"로 지칭됨)를 함유하였다.
프라이머 pps-6r은 ppsA 유전자의 3' 영역으로부터 30 nt(역상보적 형태로, 서열번호: 1에서 nt 2682-2711) 및 이에 연결된, 플라스미드 pKD13에 특이적인 20 nt(도 1에서 "pr-2"로 지칭됨)를 함유하였다 .
프라이머 pps-5f 및 pps-6r을 사용하여 5' 말단 및 3' 말단 모두에 E. 콜리 W3110으로부터의 ppsA 유전자에 특이적인 DNA의 30 nt 절편을 함유한 1.4 kb PCR 생성물을 생산하기 위해 플라스미드 pKD13의 DNA를 사용하였다. 또한, PCR 생성물은 pKD13에 함유된 카나마이신 내성 유전자의 발현 카세트를 함유하고, 카나마이신 발현 카세트의 5' 및 3' 말단에 측접하여, 항생제 마커 카나마이신의 제거를 위해 이후 작업 단계에서 "FLP 재조합효소"(플라스미드 pCP20에 함유)에 대한 인식 서열로서 사용되었던 DNA의 짧은 절편인 소위 "FRT 직접 반복"(도 1에서 "FRT1" 및 "FRT2"로 지칭됨)을 함유하였다.
3. 1.4 kb PCR 생성물을 단리하고, 잔류 pKD13 플라스미드 DNA를 제거하기 위해 당업자에게 친숙하고 메틸화된 DNA만을 절단하는 제한 엔도뉴클레아제 Dpn I로 처리하였다. PCR 반응으로부터의 비메틸화된 DNA는 분해되지 않는다.
4. ppsA 유전자에 특이적이고 카나마이신 내성 유전자에 대한 발현 카세트를 함유하는 1.4 kb PCR 생성물을 E. 콜리 W3110 x pKD46 내로 형질전환시키고, 카나마이신 내성 클론을 30℃에서 LBkan 플레이트 상에서 단리하였다. LBkan 플레이트는 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl), 1.5% 한천 및 15 mg/L 카나마이신을 함유하였다.
5. 수득된 카나마이신 내성 클론 중 10개를 LBkan 플레이트 상에서 정제하고(즉, 단수화에 의한 클론의 단리), PCR 반응에서 확인하여 카나마이신 내성 카세트가 ppsA 유전자에 정확하게 통합되었는지 여부를 결정하였다.
PCR 반응에 사용된 게놈 DNA("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)를 Lbkan 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl, 15 mg/L 카나마이신)에서 E. 콜리 W3110의 카나마이신 내성 클론의 배양으로부터의 세포로부터 DNA 분리 키트(Qiagen)를 사용하여 분리하였다. E. 콜리 W3110 야생형 균주의 게놈 DNA를 대조군으로 사용하였다. PCR 반응에 사용된 프라이머는 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)이었다. 프라이머 pps-7f는 서열번호: 1로부터 nt 167-188을 함유하였고, 프라이머 pps-8r은 역상보적 형태로 서열번호: 1로부터 nt 2779-2800을 함유하였다.
E. 콜리 W3110 야생형 DNA는 온전한 유전자에 대해 예상된 바와 같이 PCR 반응에서 2630 bp의 DNA 단편을 산출하였다. 대조적으로, 연구 중인 카나마이신 내성 클론은 1.4 kb PCR 생성물이 프라이머 pps-5f 및 pps-6r에 의해 정의된 부위에서 ppsA 유전자에 통합된 경우 예상된 바와 같이 PCR 반응에서 약 1660 bp의 DNA 단편을 산출하였다. 이 결과는 카나마이신 내성 유전자가 ppsA 유전자의 유전자좌에서 성공적으로 통합되었고 이에 따라 ppsA 유전자가 비활성화되었음을 보여주었다. 비활성화된 ppsA 유전자를 포함하는 클론을 선택하여 W3110-△ppsA::kan으로 명명하였다.
6. 카나마이신 선별 마커를 제거하기 위해, W3110-△ppsA::kan을 플라스미드 pCP20으로 형질전환시키고, 형질전환체를 30℃에서 선택하였다. 9.4 kb 벡터 pCP20은 문헌[Cherepanov and Wackernagel (1995), Gene 158: 9-14]에 개시되어 있다. 벡터 pCP20 상에는 FLP 재조합효소의 유전자가 존재한다. FLP 재조합효소는 카나마이신 내성 유전자의 발현 카세트에 측접하는 FRT 서열을 인식하고 카나마이신 발현 카세트를 제거한다. 이를 위해, 30℃에서 수득된 클론을 37℃에서 인큐베이션하였다. 이러한 조건 하에서, FLP 재조합효소의 발현을 유도하고, pCP20 벡터의 복제를 억제시켰다.
이 단계의 결과는 ppsA 유전자가 비활성화되고 카나마이신에 대한 민감성을 회복한(소위 항생제 선별 마커의 "큐어링(curing)") 클론이었다. △ppsA 돌연변이체의 게놈으로부터 카나마이신 카세트를 제거하는 것은 이중 또는 다중 돌연변이체를 생산하기 위한 추가 돌연변이의 도입을 허용한다.
W3110-△ppsA::kan은 pCP20 플라스미드로 처리한 후 카나마이신 민감성을 회복하였고, 이는 다음과 같이 확인되었다.
- LB 및 LBkan 플레이트 상에서 플레이팅함으로써:
LB 플레이트 상에서의 성장은 긍정적이었지만, LBkan 플레이트에서는 성장이 더 이상 관찰되지 않았으며, 이는 게놈으로부터 카나마이신 카세트의 성공적인 제거를 나타내었다.
- PCR 반응에 의해:
이를 위해, 게놈 DNA를 카나마이신 민감성 클론으로부터 단리하고(Qiagen DNA 단리 키트), 프라이머 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)을 사용한 PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에서 사용하였다. E. 콜리 W3110 야생형 DNA는 온전한 유전자에 대해 예상된 대로 PCR 반응에서 약 2630 bp의 DNA 단편을 산출하였다. 대조적으로, 카나마이신 민감성 클론은 PCR 반응에서 약 300 bp의 DNA 단편을 산출하였으며, 이는 상동 재조합 후에 남아있는 비활성화된 ppsA 유전자의 5' 및 3' 단편의 예상된 크기에 해당하였다.
이 단계로부터 단리된 균주를 E. 콜리 W3110-△ppsA로 명명하였다. 이 균주는 비활성화된 ppsA 유전자를 함유하였다는 사실 및 상기 균주가 항생제 카나마이신에 대한 민감성을 회복하였다는 사실에 의해 구별된다.
실시예 2 : 판토에아 아나나티스에서 ppsA 결실 돌연변이체의 생산
유전자 단리 및 균주 개발에 사용된 모 균주는 판토에아 아나나티스(DSMZ-독일 생물자원센터 GmbH로부터 균주 번호 DSM 30070 하에 상업적으로 이용가능함)였다.
유전자 비활성화의 표적은 판토에아 아나나티스로부터의 ppsA 유전자였다. P. 아나나티스로부터의 ppsA 유전자의 DNA 서열(Genbank GeneID: 31510655)은 서열번호: 3에 개시되어 있다. 뉴클레오타이드 417 - 2801(P. 아나나티스 ppsA에 의해 식별됨)은 서열번호: 4(P. 아나나티스 PpsA)에 개시된 아미노산 서열을 갖는 포스포에놀피루베이트 합성효소 단백질을 코딩한다.
P. 아나나티스 ppsA 유전자를 하기에 상세히 설명된 바와 같이 Gene Bridges GmbH의 Red®/ET® 기술을 사용하여 비활성화시켰다("Quick and Easy E. coli Gene Deletion Kit"의 사용자 설명서에 설명되어 있음, "Technical Protocol, Quick & Easy E. coli Gene Deletion Kit, by Red®/ET® Recombination, Cat. No. K006, Version 2.3, June 2012" 및 그 안에 인용된 참고문헌, 예컨대 Datsenko and Wanner, Proc. Natl. Acad. Sci. USA 97 (2000): 6640-6645 참조). 이를 위해, 플라스미드 pKD13 및 pRedET를 사용하였다:
- 3.4 kb 플라스미드 pKD13(도 1)은 수탁번호 AY048744.1 하에 "GenBank" 유전자 데이터베이스에 개시되어 있다.
- 상업적으로 이용가능한 9.3 kb 플라스미드 pRedET는 "Quick and Easy E. Coli Gene Deletion Kit"의 사용자 매뉴얼("Technical Protocol, Quick & Easy E. Coli Gene Deletion Kit, by Red®/ET® Recombination, Cat. No. K006, Version 2.3, June 2012" 참조)에 개시되어 있다.
람다 레드 시스템을 사용한 상동 재조합에 의해 P. 아나나티스에서 ppsA 유전자를 비활성화시키기 위해, 하기 단계를 수행하였다:
1. P. 아나나티스를 플라스미드 pRedET(소위 "레드 재조합효소" 플라스미드)로 형질전환시키고, 테트라사이클린 내성 클론을 단리하였다(P. 아나나티스 x pRedET로 지칭됨).
2. 이의 비활성화에 적합한 ppsA 특이적 DNA 단편을 플라스미드 pKD13의 DNA(도 1) 및 프라이머 ppsapa-3f(서열번호: 11) 및 ppsapa-4r(서열번호: 12)을 이용한 PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에서 생산하였다.
프라이머 ppsapa-3f는 ppsA 유전자의 5' 영역으로부터 49 nt(서열번호: 3에서 nt 417-465) 및 이에 연결된, 플라스미드 pKD13에 특이적인 20 nt(도 1에서 "pr-1"로 지칭됨)를 함유하였다.
프라이머 ppsapa-4r은 ppsA 유전자의 3' 영역으로부터 49 nt(역상보적 형태로, 서열번호: 3에서 nt 2753-2801) 및 이에 연결된, 플라스미드 pKD13에 특이적인 20 nt(도 1에서 "pr-2"로 지칭됨)를 함유하였다.
프라이머 ppsapa-3f 및 ppsapa-4r을 사용하여 5' 말단과 3' 말단 모두에 P. 아나나티스로부터의 ppsA 유전자에 특이적인 DNA의 49 nt 부분을 함유한 1.4 kb PCR 생성물을 생산하기 위해 플라스미드 pKD13의 DNA를 사용하였다. 더욱이, PCR 생성물은 pKD13에 함유된 카나마이신 내성 유전자의 발현 카세트를 함유하였고, 카나마이신 발현 카세트의 5' 및 3' 말단에 측접하여, 필요에 따라 ppsA 결실 돌연변이체에서 항생제 마커 카나마이신의 제거를 허용하는 DNA의 짧은 절편인 소위 "FRT 직접 반복"(도 1에서 "FRT1" 및 "FRT2"로 지칭됨)을 함유하였다.
3. 1.4 kb PCR 생성물을 단리하고, 잔류 pKD13 플라스미드 DNA를 제거하기 위해 당업자에게 친숙하고 메틸화된 DNA만을 절단하는 제한 엔도뉴클레아제 Dpn I으로 처리하였다. PCR 반응으로부터 비메틸화된 DNA는 분해되지 않는다.
4. ppsA 유전자에 특이적이고 카나마이신 내성 유전자에 대한 발현 카세트를 함유하는 1.4 kb PCR 생성물을 P. 아나나티스 x pRedET 내로 형질전환시키고, 카나마이신 내성 클론을 30℃에서 LBkan 플레이트 상에서 단리하였다. LBkan 플레이트는 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl), 1.5% 한천 및 15 mg/L 카나마이신을 함유하였다.
5. 카나마이신 내성 클론을 LBkan 플레이트 상에서 정제하고(즉, 단수화에 의한 클론의 단리), PCR 반응에서 확인하여 카나마이신 내성 카세트가 ppsA 유전자에 정확하게 통합되었는지 여부를 결정하였다.
PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에 사용된 게놈 DNA를 Lbkan 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl, 15 mg/L 카나마이신)에서 P. 아나나티스의 카나마이신 내성 클론의 배양으로부터의 세포로부터 DNA 단리 키트(Qiagen)를 사용하여 단리하였다. P. 아나나티스 야생형 균주의 게놈 DNA를 대조군으로 사용하였다. PCR 반응에 사용된 프라이머는 ppsapa-1f(서열번호: 13) 및 ppsapa-2r(서열번호: 14)이었다. 프라이머 ppsapa-1f는 서열번호: 3에서 nt 281-302를 함유하였고, 프라이머 ppsapa-2r은 역상보적 형태로 서열번호: 3에서 nt 2901-2922를 함유하였다.
P. 아나나티스 야생형 DNA는 온전한 유전자에 대해 예상된 바와 같이 PCR 반응에서 2640 bp의 DNA 단편을 산출하였다. 대조적으로, 연구 중인 카나마이신 내성 클론은 1.4 kb PCR 생성물이 프라이머 ppsapa-3f(서열번호: 11) 및 ppsapa-4r(서열번호: 12)에 의해 정의된 부위에서 ppsA 유전자에 통합된 경우 예상된 바와 같이, PCR 반응에서 약 1670 bp의 DNA 단편을 산출하였다. 이 결과는 카나마이신 내성 유전자가 ppsA 유전자의 유전자좌에 성공적으로 통합되었고 이에 따라 ppsA 유전자가 비활성화되었음을 보여주었다. 비활성화된 ppsA 유전자를 함유하는 클론을 선택하여 P. 아나나티스-△ppsA::kan으로 명명하였다.
실시예 3:
에셰리키아 콜리 W3110-ppsA-MHI의 생산
효소 활성의 약화를 유발하는 방식의 ppsA 구조 유전자의 돌연변이를 특징으로 하는 에셰리키아 콜리 W3110-ppsA-MHI를 람다 레드의 재조합 및 유전자 변형을 위한 역선택 스크리닝의 당업자에게 공지된 조합을 사용하여 생산하였다(예를 들어, Sun et al., Appl. Env. Microbiol. (2008) 74: 4241-4245 참조). 유전자 ppsA-MHI의 DNA 서열은 서열번호: 5(ppsA-MHI)에 개시되어 있으며, 이는 서열번호: 6(PpsA-MHI)에 명시된 서열을 갖는 단백질을 코딩한다.
절차는 다음과 같았다.
1. ppsA WT 유전자의 부분(서열번호: 1에서 nt 167 내지 nt 2800), 즉 cds 및 또한 5' 및 3' 측접 서열을 포함하는 2.6 kb DNA 단편을 프라이머 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)을 사용한 PCR에 의해 E. 콜리 W3110의 게놈 DNA로부터 단리하였다.
2. "부위 지향" 돌연변이유발에 의해 ppsA WT 유전자 내로 돌연변이를 연속적으로 도입함으로써 ppsA WT 유전자로부터 ppsA-MHI를 수득하였다. 이는 사용자 매뉴얼의 지침에 따라 Agilent의 상업적으로 이용가능한 클로닝 키트 "QuickChange II Site-Directed Mutagenesis Kit"를 사용하여 수행되었다.
3. E. 콜리 W3110의 ppsA WT 유전자를 ppsA-MHI로 교환하기 위해, 먼저 수행된 것은 프라이머 pps-9f(서열번호: 15) 및 pps-10r(서열번호: 16)을 사용한 PCR에 의해 플라스미드 pKan-SacB(도 3)로부터 3.2 kb Kan-sacB 카세트를 단리하는 것이었다.
플라스미드 pKan-sacB는 카나마이신(Kan) 내성 유전자 및 효소 레반수크라제를 코딩하는 sacB 유전자 모두에 대한 발현 카세트를 함유한다.
프라이머 pps-9f는 ppsA 유전자의 개시 ATG로부터 시작하는 30 nt(서열번호: 1에서 nt 333-362) 및 이에 연결된, 플라스미드 pKan-SacB에 특이적인 20 nt(도 3에서 "pr-f"로 지칭됨)를 함유하였다.
프라이머 pps-10r은 ppsA 유전자의 정지 코돈으로부터 30 nt(역상보적 형태로, 서열번호: 1에서 nt 2682-2711) 및, 이에 연결된, 플라스미드 pKan-SacB에 특이적인 21 nt(도 3에서 "pr-r"로 지칭됨)를 함유하였다.
4. E. 콜리 W3110 x pKD46(이의 생산을 위해, 실시예 1 참조)을 ppsA 특이적 3.2 kb PCR 생성물로 형질전환시키고, 카나마이신 내성 클론을 단리하였다.
5. 클론을 LBSC 플레이트(10 g/L 트립톤, 5 g/L 효모 추출물, 7% 수크로스, 1.5% 한천 및 15 mg/L 카나마이신)에 시딩하였다.
통합된 sacB 유전자를 함유하는 클론은 수크로스로부터 독성 레반을 생산하였고, 이는 성장 억제를 야기하였다. 이러한 클론을 선택하고, PCR 반응에서 확인하여 Kan-sacB 카세트가 ppsA 유전자에 정확히 통합되었는지 여부를 결정하였다. PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에 사용된 게놈 DNA를 Lbkan 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl, 15 mg/L 카나마이신)에서 E. 콜리 W3110의 카나마이신 내성 클론의 배양으로부터의 세포로부터 DNA 단리 키트(Qiagen)를 사용하여 이전에 수득하였다. E. 콜리 W3110 야생형 균주의 게놈 DNA를 대조군으로 사용하였다. PCR 반응에 사용된 프라이머는 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)이었다.
E. 콜리 W3110 야생형 DNA는 온전한 유전자에 대해 예상된 바와 같이 PCR 반응에서 2630 bp의 DNA 단편을 산출하였다. 대조적으로, 카나마이신 내성 클론은, 3.2 kb PCR 생성물이 프라이머 pps-9f(서열번호: 15) 및 pps-10r(서열번호: 16)에 의해 정의된 부위에서 ppsA 유전자에 통합된 경우 예상된 바와 같이 PCR 반응에서 약 3400 nt의 DNA 단편을 산출하였다. 이 결과는 Kan-sacB 카세트가 ppsA 유전자의 유전자좌에 성공적으로 통합되었고 이에 따라 ppsA 유전자가 비활성화되었음을 보여주었다. 통합된 Kan-sacB 카세트를 함유하는 클론을 선택하여 W3110-△ppsA::kan-sacB x pKD46으로 명명하였다.
6. 다음 단계에서, Kan-sacB 카세트를 ppsA-MHI 유전자로 교환하였다. 이를 위해, 프라이머 pps-11f(서열번호: 17) 및 pps-12r(서열번호: 18)을 사용한 PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에서 단계 2로부터의 ppsA-MHI DNA 단편으로부터 2.5 kb DNA 단편을 증폭시켰다. 프라이머 pps-11f는 서열번호: 1에서 nt 300-319를 함유하였고, 프라이머 pps-12r은 역상보적 형태로 서열번호: 1에서 nt 2743-2763를 함유하였다.
7. 2.5 kb ppsA-MHI 유전자를 E. 콜리 W3110-△ppsA::kan-sacB x pKD46 내로 형질전환시키고, 카나마이신이 없는 LBS 플레이트(10 g/L 트립톤, 5 g/L 효모 추출물, 7% 수크로스, 1.5% 한천) 상에서 클론을 선택하였다. 더 이상 활성 sacB 유전자를 함유하지 않는 클론만이 LBS 플레이트에서 성장할 수 있었다.
더 이상 활성 Kan 유전자를 함유하지 않고 카나마이신의 존재 하에서 이의 성장이 억제된 클론을 선택하기 위해, 이들 클론을 LBkan 플레이트 상에 시딩하였다.
수크로스의 존재 하에서 적극적인 성장을 나타내는 클론 및 카나마이신의 존재 하에서 부정적인 성장을 나타내는 클론을 선택하고 PCR 반응에서 확인하여 Kan-sacB 카세트가 ppsA-MHI 유전자에 의해 정확히 대체되었는지 여부를 결정하였다.
게놈 DNA를 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl)에서의 배양으로부터의 세포로부터 DNA 단리 키트(Qiagen)를 사용하여 수득하였다. E. 콜리 W3110 야생형 균주의 게놈 DNA를 대조군으로 사용하였다. PCR 반응에 사용된 프라이머는 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)이었다. 2630 nt의 예상된 크기의 PCR 생성물을 DNA 시퀀싱(Eurofins Genomics)에 의해 분석하였다. 정확하게 통합된 ppsA-MHI 유전자를 함유하는 클론은 서열번호: 5에 개시된 바와 같은 DNA 서열을 산출하였고, 이는 서열번호: 6으로부터의 서열에 상응하는 단백질을 코딩한다. 돌연변이 V126M, R427H 및 V434I를 함유하는 정확한 ppsA-MHI 유전자를 함유하는 클론을 선택하여 E. 콜리 W3110-ppsA-MHI로 명명하였다.
실시예 4:
시스테인 생산 균주의 생성
사용된 시스테인 특이적 생산 플라스미드는 모 벡터 pACYC184(도 4)로부터 유래된 플라스미드 pACYC184-cysEX-GAPDH-ORF306-serA317이었다. pACYC184-cysEX-GAPDH-ORF306-serA317은 EP 0 885 962 B1에 개시된 플라스미드 pACYC184-cysEX-GAPDH-ORF306의 유도체이다. 플라스미드 pACYC184-cysEX-GAPDH-ORF306은 복제 원점 및 테트라사이클린 내성 유전자(모 벡터 pACYC184)뿐만 아니라 시스테인에 의해 감소된 피드백 억제를 갖는 세린 O-아세틸트랜스퍼라제를 코딩하는 cysEX 대립유전자, 및 항시적 GAPDH 프로모터에 의해 그의 발현이 제어되는 유출 유전자 ydeD(ORF306)를 함유한다.
또한, pACYC184-cysEX-GAPDH-ORF306-serA317은 ydeD(ORF306) 유출 유전자 뒤에 클로닝되고 SerA 단백질(총 길이: 410개 아미노산) 중 N-말단 317개 아미노산을 코딩하는 serA317 유전자 단편을 추가로 함유한다. E. 콜리 serA 유전자는 유전자 ID 945258로 "GenBank" 유전자 데이터베이스에 개시되어 있다. serA317은 문헌 [Bell et al., Eur. J. Biochem. (2002) 269: 4176-4184]에 개시되어 있고, 상기 문헌에서 "NSD:317"로 지칭되며, 3-포스포글리세레이트 데하이드로게나제의 세린 피드백 내성 변이체를 코딩한다. serA317의 발현은 serA 프로모터에 의해 제어된다.
균주 E. 콜리 W3110, E. 콜리 W3110-△ppsA, E. 콜리 W3110-ppsA-MHI, P. 아나나티스 및 P. 아나나티스-△ppsA::kan을 각각 플라스미드 pACYC184-cysEX-GAPDH-ORF306-serA317(하기 실시예에서 pCYS로 지칭됨)로 형질전환시켰다. 형질전환을 EP 0 885 962 B1에 기재된 바와 같이 전기천공에 의해 선행 기술에 따라 수행하였다.
플라스미드 보유 형질전환체를 LBtet 한천 플레이트(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl, 1.5% 한천, 15 mg/L 테트라사이클린) 상에서 선택하였다. 선택된 형질전환체를 QIAprep 스핀 플라스미드 키트(Qiagen)에 의한 플라미스드 단리 및 제한 분석에 의해 형질전환된 pCYS 플라스미드에 대해 확인하였다. 정확하게 혼입된 플라스미드 pCYS를 함유하는 형질전환체를 배양하여 ppsA 효소 활성을 확인하고(실시예 5) 시스테인 생산을 확인하였다(실시예 6 및 실시예 7).
실시예 5:
ppsA 효소 활성의 결정
결정된 것은 각각 생산 플라스미드 pCYS(실시예 4)로 형질전환된 E. 콜리 균주 W3110, W3110-△ppsA, W3110-ppsA-MHI의 ppsA 효소 활성이었다. 50 ml의 SM1 배지(이의 조성의 경우, 실시예 6 참조)에서 3개의 균주의 쉐이크 플라스크 배양으로부터의 세포를 10분 동안 원심분리하여 펠렛화하고 10 ml의 0.9%(w/v) NaCl로 1회 세척하였다. 세포 펠렛을 10 ml의 분석 완충액(100 mM Tris-HCl, pH 8.0; 10 mM MgCl2)에서 용해시키고, 세포 추출물을 제조하였다.
MP Biomedicals의 세포 균질화기 FastPrep-24™ 5G를 사용하였다. 이를 위해, 2 x 1 ml의 세포 현탁액을 제조사에 의해 미리 제작되고 유리 비드("용해 매트릭스 B")를 함유하는 1.5 ml 튜브에서 파쇄하였다(간격 사이에 매번 30초 일시 중지와 함께 6000 rpm의 쉐이킹 빈도에서 3 x 20초). 생성된 균질액을 원심분리하고, 상층액을 활성을 결정하기 위한 세포 추출물로서 사용하였다.
추출물의 단백질 함량을 제조업체의 지침에 따라 "Qubit® Protein Assay Kit"를 사용하여 Thermo Fisher Scientific의 Qubit 3.0 형광계를 사용하여 결정하였다.
ppsA 효소 활성을 결정하기 위해, Sigma Aldrich의 포스페이트 검출 키트 "말라카이트 그린 포스페이트 분석 키트"(카탈로그 번호 MAK307)를 제조사의 지침에 따라 사용하였다. 그 기초는 ppsA 효소 활성에 의해 평형 반응 (4)에서 ATP를 이용하여 피루베이트를 전환시켜 포스포에놀피루베이트를 형성하는 것이다. 이것은 활성을 결정하는 데 사용되는 포스페이트의 화학량론적 양을 생산한다.
- 분석은 1 ml의 분석 완충액(100 mM Tris-HCl, pH 8.0; 10 mM MgCl2)에 100 μg의 세포 추출물, 4 mM Na 피루베이트 및 4 mM ATP를 함유하였다.
- 다양한 분석을 30℃에서 인큐베이션하였다.
- 인큐베이션 시작 0분, 10분, 20분, 30분 및 60분 후, 각 분석 50 μl를 제거하고, 750 μl의 H2O에 첨가하고, 마지막으로 "말라카이트 그린 포스페이트 분석 키트"로부터의 시약 200 μl와 혼합하였다.
- 인큐베이션 30분 후, 형성된 포스페이트의 양을 포스페이트 표준 곡선의 도움과 제조업체의 지침에 따라 620 nm에서의 흡광도의 결정에 의해 측광학적으로 결정하였다. 마지막으로, U/ml 추출물 내의 ppsA 효소 활성(1 U = μmol 기질 턴오버/분)을 각 분석으로부터의 샘플링 시간을 기초로 측정된 포스페이트 양으로부터 결정하였다. ppsA 효소 활성을 세포 추출물의 총 단백질 1 mg에 기반함으로써 특이적 ppsA 효소 활성을 계산하였다(U/mg 단백질).
표 1: ppsA 효소 활성의 결정
실시예 6:
쉐이크 플라스크에서 시스테인 생산
쉐이크 플라스크에서 배양하기 위한 예비배양물로서, 15 mg/L 테트라사이클린을 추가로 함유한 3 ml의 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 10 g/L NaCl)에 각 균주를 접종하고 16시간 동안 30℃ 및 135 rpm에서 쉐이커에서 인큐베이션하였다. 연구된 균주는 E. 콜리 W3110, W3110-△ppsA, W3110-ppsA-MHI였으며, 두 번째 실험에서는, 각각 생산 플라스미드 pCYS(실시예 4)로 형질전환된 P. 아나나티스 및 P. 아나나티스-△ppsA::kan이었다.
주 배양: 그 후, 각각의 예비배양물의 일부를 15 g/L 글루코스, 5 mg/L 비타민 B1 및 15 mg/L 테트라사이클린을 함유하는 30 ml의 SM1 배지를 함유하는 300 ml 엘렌마이어 플라스크(배플)로 옮겼다.
SM1 배지의 조성: 12 g/L K2HPO4, 3 g/L KH2PO4, 5 g/L (NH4)2SO4, 0.3 g/L MgSO4 x 7 H2O, 0.015 g/L CaCl2 x 2 H2O, 0.002 g/L FeSO4 x 7 H2O, 1 g/L Na3 시트레이트 x 2 H2O, 0.1 g/L NaCl; 1 ml/L 미량 원소 용액.
미량 원소 용액의 조성 : 0.15 g/L Na2MoO4 x 2 H2O, 2.5 g/L H3BO3, 0.7 g/L CoCl2 x 6 H2O, 0.25 g/L CuSO4 x 5 H2O, 1.6 g/L MnC12 x 4 H2O, 0.3 g/L ZnSO4 x 7 H2O.
주 배양물에 충분한 예비배양물을 접종하여 0.025/ml의 초기 세포 밀도 OD600/ml(600 nm에서 측정된 주 배양물의 광학 밀도)를 확립하였다. 이로부터 시작하여, 전체 30 ml 배치를 30℃ 및 135 rpm에서 24시간 동안 배양하였다.
24시간 후, 샘플을 채취하고, 세포 상층액 중의 세포 밀도 OD600/ml 및 총 시스테인 함량을 결정하였고, Gaitonde(Gaitonde, M. K. (1967), Biochem. J. 104, 627-633)에 의한 비색 분석을 시스테인의 정량적 결정에 사용하였다. 고산성 반응 조건 하에서, 이 분석은 시스테인과 시스테인 및 피루베이트의 축합 생성물인 EP 0 885 962 B1에 기재된 2-메틸티아졸리딘-2,4-디카르복실산(티아졸리딘)을 구별하지 못한다. 식 (2)에 따라 2개의 시스테인 분자의 산화에 의해 형성된 L-시스틴은 마찬가지로 pH 8.0에서 희석 용액에서 디티오트레이톨로 환원시킴으로써 분석에서 시스테인으로서 검출된다. 결과는 언급된 E. 콜리 균주에 대해 표 2에 보고되어 있고, P. 아나나티스 균주에 대해 표 3에 보고되어 있다.
표 2: 쉐이크 플라스크에서 24시간의 배양 시간 후 세포 밀도 및 총 시스테인 함량
표 3: 쉐이크 플라스크에서 24시간의 배양 시간 후 세포 밀도 및 총 시스테인 함량
실시예 7:
발효기에서 시스테인 생산:
생산 규모의 유가식 발효에서 E. 콜리 W3110 x pCYS, W3110-ppsA-MHI x pCYS 및 W3110-△ppsA x pCYS를 비교하였다.
예비배양물 1:
15 mg/L 테트라사이클린을 함유하는 LB 배지 20 ml에 100 ml 엘렌마이어 플라스크에서 각 균주를 접종하고, 셰이커(150 rpm, 30℃)에서 7시간 동안 인큐베이션하였다.
예비배양물 2:
그 후, 전체 예비배양물 1을 5 g/L 글루코스, 5 mg/L 비타민 B1 및 15 mg/L 테트라사이클린이 보충된 100 ml의 SM1 배지(SM1 배지의 조성에 대해서는, 실시예 6 참조)로 옮겼다.
배양물을 150 rpm에서 17시간 동안 30℃에서 엘렌마이어 플라스크(1 L 부피)에서 진탕시켰다. 이러한 인큐베이션 후, 세포 밀도 OD600/ml는 3 내지 5 사이였다.
주 배양:
발효를 Eppendorf의 "DASGIP® Parallel Bioreactor System for Microbiology" 발효기에서 수행하였다. 1.8 L의 총 부피를 갖는 배양 용기를 사용하였다. 발효 배지(900 ml)는 15 g/L 글루코스, 10 g/L 트립톤(Difco), 5 g/L 효모 추출물(Difco), 5 g/L (NH4)2SO4, 1.5 g/L KH2PO4, 0.5 g/L NaC1, 0.3 g/L MgSO4 x 7 H2O, 0.015 g/L CaCl2 x 2 H2O, 0.075 g/L FeSO4 x 7 H2O, 1 g/L Na3 시트레이트 x 2 H2O 및 1 ml의 미량 원소 용액(실시예 6 참조), 0.005 g/L 비타민 Bl 및 15 mg/L 테트라사이클린을 함유하였다.
발효기 내의 pH를 초기에 25% NH4OH 용액에서 펌핑하여 6.5로 조정하였다. 발효 동안, pH를 25% NH4OH로 자동 보정하여 6.5의 값으로 유지시켰다. 접종을 위해, 100 ml의 예비배양물 2를 발효기 용기 내로 펌핑하였다. 따라서 초기 부피는 약 1 L였다. 배양물을 초기에 400 rpm으로 교반하고, 2 vvm(분당 배양 배지 부피당 공기 부피)의 폭기 속도로 멸균 필터를 통해 멸균된 압축 공기로 폭기하였다. 이러한 시작 조건 하에서, 산소 프로브를 접종 전에 100% 포화로 보정하였다.
발효 동안 O2 포화를 위한 목표값을 30%로 설정하였다. O2 포화가 목표값 아래로 떨어진 후, O2 포화를 목표값으로 되돌리기 위해 조절 캐스케이드를 시작하였다. 이것은 먼저 기체 공급을 지속적으로(최대 5 vvm까지) 증가시킨 다음 교반 속도를 지속적으로(최대 1500 rpm까지) 증가시키는 것을 포함하였다.
발효를 30℃의 온도에서 수행하였다. 2시간의 발효 시간 후에, 나트륨 티오설페이트 x 5 H2O의 멸균된 60%(w/v) 스톡 용액 형태의 황 공급원을 시간당 1.5 ml의 속도로 공급하였다.
발효기 내의 글루코스 함량이 초기 15 g/L에서 약 2 g/L로 떨어지면, 56%(w/w) 글루코스 용액을 지속적으로 계량 주입하였다. 그 이후로 발효기 내의 글루코스 농도가 더 이상 2 g/L를 초과하지 않도록 공급 속도를 조정하였다. 글루코스를 YSI(Yellow Springs, Ohio, USA)의 글루코스 분석기를 사용하여 결정하였다.
발효 시간은 48시간이었다. 그 후, 발효 배치로부터 샘플을 채취하고, 배양 상청액(주로 L-시스테인 및 티아졸리딘) 및 침전물(L-시스틴)에서 L-시스테인 및 그로부터 유도된 유도체의 함량의 개별 결정을 수행하였다. 이를 위해, 각각의 경우에 Gaitonde에 의한 비색 분석을 사용하였다(Gaitonde, M.K. (1967), Biochem. J. 104, 627-633). 침전물에 존재하는 L-시스틴은 동일한 방식으로 정량화하기 전에 먼저 8%(v/v) 염산에 용해되어야 했다. 마지막으로, 시스테인의 총량을 펠렛과 상층액에서의 시스테인의 총합으로서 결정하였다.
표 4에 요약된 바와 같이, 연구된 균주의 세포 밀도 OD600/ml은 대조군 균주 W3110 x pCYS에 대해 다소 높았지만 비슷하였다. 대조적으로, 시스테인의 부피 생산량(g/L)은 야생형 ppsA 유전자를 함유하는 대조군 균주 W3110 x pCYS보다 W3110-ppsA-MHI x pCYS 및 W3110-△ppsA x pCYS 모두에서 유의하게 높았다(약 3배배에 의해).
따라서, 제어된 발효 조건 하에서, 생산 규모에 대해 달성된 결과는 ppsA 효소 활성에 대한 활성의 약화 또는 비활성화가 유의하게 개선된 시스테인 생산을 야기하고 따라서 균주를 개선하기 위한 적절한 수단이라는 것이며, 이 결과는 이전에 기술되지 않았고, 또한 선행 기술로 인해 당업자에게 예상치 못한 것이다.
표 4:
발효기에서 24시간의 배양 시간 후 세포 밀도 및 총 시스테인 함량
도면에 사용된 약어:
bla: 암피실린(β-락타마제)에 대한 내성을 부여하는 유전자
rrnB term: 전사를 위한 rrnB 종결자
kanR: 카나마이신에 대한 내성을 부여하는 유전자
ORI: 복제 원점
pr-1: 프라이머를 위한 결합 부위 1
pr-2: 프라이머를 위한 결합 부위 2
FRT1: FLP 재조합효소에 대한 인식 서열 1
FRT2: FLP 재조합효소에 대한 인식 서열 2
araC: araC 유전자(억제자 유전자)
P araC: araC 유전자의 프로모터
P araB: araB 유전자의 프로모터
Gam: 람다 파지 Gam 재조합 유전자
Bet: 람다 파지 Bet 재조합 유전자
Exo: 람다 파지 Exo 재조합 유전자
ORI101: 온도 민감성 복제 원점
RepA: 플라스미드 복제 단백질 A에 대한 유전자
sacB: 레반수크라제 유전자
pr-f: 프라이머를 위한 결합 부위 f(정방향)
pr-r: 프라이머를 위한 결합 부위 r(역방향)
OriC: 복제 원점 C
IHF: DNA 결합 단백질 IHF("통합 숙주 인자")에 대한 결합 부위
CamR: 클로람페니콜에 대한 내성을 부여하는 유전자
TetR: 테트라사이클린에 대한 내성을 부여하는 유전자
P15A ORI: 복제 원점
SEQUENCE LISTING
<110> Wacker Chemie AG
<120> Improved cysteine-producing strains
<130> xxx
<160> 18
<170> PatentIn version 3.5
<210> 1
<211> 3000
<212> DNA
<213> Escherichia coli
<400> 1
tttgttcttc ccgtgatgca gacataattc tatgaaagca taaattaaaa acgcacagaa 60
gcgtagaacg ttatgtctgg tttataaaat gaaccttcaa ttttattttt tatgaaaaca 120
gcatttcatt tttatggttt cgtttatacc gatggtttat gtggaaattg tcgaagagag 180
cagatttgcg caacgctggg atcagtctta aaaagtaaaa aaatatattt gcttgaacga 240
ttcaccgttt ttttcatccg gttaaatatg caaagataaa tgcgcagaaa tgtgtttctc 300
aaaccgttca tttatcacaa aaggattgtt cgatgtccaa caatggctcg tcaccgctgg 360
tgctttggta taaccaactc ggcatgaatg atgtagacag ggttgggggc aaaaatgcct 420
ccctgggtga aatgattact aatctttccg gaatgggtgt ttccgttccg aatggtttcg 480
ccacaaccgc cgacgcgttt aaccagtttc tggaccaaag cggcgtaaac cagcgcattt 540
atgaactgct ggataaaacg gatattgacg atgttactca gcttgcgaaa gcgggcgcgc 600
aaatccgcca gtggattatc gacactccct tccagcctga gctggaaaac gccatccgcg 660
aagcctatgc acagctttcc gccgatgacg aaaacgcctc ttttgcggtg cgctcctccg 720
ccaccgcaga agatatgccg gacgcttctt ttgccggtca gcaggaaacc ttcctcaacg 780
ttcagggttt tgacgccgtt ctcgtggcag tgaaacatgt atttgcttct ctgtttaacg 840
atcgcgccat ctcttatcgt gtgcaccagg gttacgatca ccgtggtgtg gcgctctccg 900
ccggtgttca acggatggtg cgctctgacc tcgcatcatc tggcgtgatg ttctccattg 960
ataccgaatc cggctttgac caggtggtgt ttatcacttc cgcatggggc cttggtgaga 1020
tggtcgtgca gggtgcggtt aacccggatg agttttacgt gcataaaccg acactggcgg 1080
cgaatcgccc ggctatcgtg cgccgcacca tggggtcgaa aaaaatccgc atggtttacg 1140
cgccgaccca ggagcacggc aagcaggtta aaatcgaaga cgtaccgcag gaacagcgtg 1200
acatcttctc gctgaccaac gaagaagtgc aggaactggc aaaacaggcc gtacaaattg 1260
agaaacacta cggtcgcccg atggatattg agtgggcgaa agatggccac accggtaaac 1320
tgttcattgt gcaggcgcgt ccggaaaccg tgcgctcacg cggtcaggtc atggagcgtt 1380
atacgctgca ttcacagggt aagattatcg ccgaaggccg tgctatcggt catcgcatcg 1440
gtgcgggtcc ggtgaaagtc atccatgaca tcagcgaaat gaaccgcatc gaacctggcg 1500
acgtgctggt tactgacatg accgacccgg actgggaacc gatcatgaag aaagcatctg 1560
ccatcgtcac caaccgtggc ggtcgtacct gtcacgcggc gatcatcgct cgtgaactgg 1620
gcattccggc ggtagtgggc tgtggagatg caacagaacg gatgaaagac ggtgagaacg 1680
tcactgtttc ttgtgccgaa ggtgataccg gttacgtcta tgcggagttg ctggaattta 1740
gcgtgaaaag ctccagcgta gaaacgatgc cggatctgcc gttgaaagtg atgatgaacg 1800
tcggtaaccc ggaccgtgct ttcgacttcg cctgcctacc gaacgaaggc gtgggccttg 1860
cgcgtctgga atttatcatc aaccgtatga ttggcgtcca cccacgcgca ctgcttgagt 1920
ttgacgatca ggaaccgcag ttgcaaaacg aaatccgcga gatgatgaaa ggttttgatt 1980
ctccgcgtga attttacgtt ggtcgtctga ctgaagggat cgcgacgctg ggtgccgcgt 2040
tttatccgaa gcgcgtcatt gtccgtctct ctgattttaa atcgaacgaa tatgccaacc 2100
tggtcggtgg tgagcgttac gagccagatg aagagaaccc gatgctcggc ttccgtggcg 2160
cgggccgcta tgtttccgac agcttccgcg actgtttcgc gctggagtgt gaagcagtga 2220
aacgtgtgcg caacgacatg ggactgacca acgttgagat catgatcccg ttcgtgcgta 2280
ccgtagatca ggcgaaagcg gtggttgaag aactggcgcg tcaggggctg aaacgtggcg 2340
agaacgggct gaaaatcatc atgatgtgtg aaatcccgtc caacgccttg ctggccgagc 2400
agttcctcga atatttcgac ggcttctcaa ttggctcaaa cgatatgacg cagctggcgc 2460
tcggtctgga ccgtgactcc ggcgtggtgt ctgaattgtt cgatgagcgc aacgatgcgg 2520
tgaaagcact gctgtcgatg gctatccgtg ccgcgaagaa acagggcaaa tatgtcggga 2580
tttgcggtca gggtccgtcc gaccacgaag actttgccgc atggttgatg gaagagggga 2640
tcgatagcct gtctctgaac ccggacaccg tggtgcaaac ctggttaagc ctggctgaac 2700
tgaagaaata aaataaatcc ccggcggcgt ttagtcgccg gggttatgtg atccccgaag 2760
atgaaactta ttcaatctct tcacagacat cctgcgttaa acgccgcata atatcttttc 2820
ttaacaaaaa cttttgtatt ttacctgagg tagttcgcgg tagtttttcg attaccacga 2880
tatgttcagg atatttatat tttgcgaccc gtttacggct aaaaaaagcc actacctctt 2940
ccagcgataa tgaatgatgc ggcgctttca gcacgacata agcgcatgat cgttcaccta 3000
<210> 2
<211> 792
<212> PRT
<213> Escherichia coli
<400> 2
Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu
1 5 10 15
Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly
20 25 30
Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly
35 40 45
Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly
50 55 60
Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp
65 70 75 80
Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile
85 90 95
Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr
100 105 110
Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Val Arg Ser
115 120 125
Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln
130 135 140
Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val
145 150 155 160
Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg
165 170 175
Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val
180 185 190
Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser
195 200 205
Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala
210 215 220
Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu
225 230 235 240
Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val
245 250 255
Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr
260 265 270
Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln
275 280 285
Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys
290 295 300
Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu
305 310 315 320
Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg
325 330 335
Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu
340 345 350
His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg
355 360 365
Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn
370 375 380
Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp
385 390 395 400
Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly
405 410 415
Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro
420 425 430
Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu
435 440 445
Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala
450 455 460
Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro
465 470 475 480
Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala
485 490 495
Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu
500 505 510
Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu
515 520 525
Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met
530 535 540
Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr
545 550 555 560
Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile
565 570 575
Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly
580 585 590
Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg
595 600 605
Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu
610 615 620
Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn
625 630 635 640
Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala
645 650 655
Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly
660 665 670
Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala
675 680 685
Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp
690 695 700
Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser
705 710 715 720
Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met
725 730 735
Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly
740 745 750
Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu
755 760 765
Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp
770 775 780
Leu Ser Leu Ala Glu Leu Lys Lys
785 790
<210> 3
<211> 3062
<212> DNA
<213> Pantoea ananatis
<400> 3
aagtcgtgcc tcgggcaggg aagtcgtaaa aacaagtgag ataatataag catgccttca 60
ggggcaagtg tagtctgggg catcgtttcc ctctcgcttt tgcatcatga cgtcacctgt 120
tcactctttt ttgcgccatt aaaaccgcct caggtgacag acaacgcctg tgtttgttgc 180
gcaacaaaaa cgccgcataa caggcagtaa aaaaaataat gagctaatta tcagcgtatt 240
agcaaaaaat aagggccttg cgcaacgctg aaaaaaacca ggcgcaattc tgaaactgtg 300
tctgagaatc tgctttaacg attcaacaga tcgtgtttaa tcagacgtta tgccaggctg 360
gatttgttaa tagcaggatt ttccatgtgc ccattcatta ataaaggatc agttcaatgt 420
ccaataaagg cgaacagccg ttagtacttt ggtacaacca gcttggcatg catgatgttg 480
atcgggtggg aggcaaaaat gcttctctgg gtgagatgat taccaatttg tcatctctgg 540
gcgtgtccgt tcccaacggt tttgcgacca cctcctgggc ctttaatcag tttcttgagc 600
agagcggtct gaaccagcgt atttatgctt tgctggatga caccaatatt gatgatgtgg 660
atcaactggc gaaggcgggt aagcagatac gccagtgggt agtcgaaacc ccgttccagc 720
ctgaactgga agccgcgatt ctttcggcct atgagcagct ctctgccgac gatgctgagg 780
catccttcgc cgtgcgctca tccgccaccg ccgaagatat gcctgacgcg tcctttgccg 840
gccagcagga aactttcctg aacgtgcagg gcatcgagtc agtcatggtg gcagtgaaac 900
acgtttatgc ctcactgttt aacgatcgcg ccatctccta tcgcgtccat cagggttacg 960
accatcgcgg cgtggcgctg tcggcgggga ttcagcgcat ggtgcgatcc gatctggcgt 1020
cctcaggggt catgttcacc attgataccg aatcgggctt tgatcaggtg gtgttcatta 1080
ccgccgcgtt gggcctgggt gaaatggtgg tacagggcgc ggtgaacccg gacgagtttt 1140
atgtgcacaa gccgacgctg gccgcgaaac gtcccgctat cgttcgccgc aacatgggct 1200
cgaaaaaggt gcggatggtt tacgccgact cgcgtgaaca tggcgagcag gtgcgcatcg 1260
aagatgtggc ggaagccgag cgcgatcgtt tctgtctgag cgatgccgaa gtggaggcgt 1320
tggcccatca ggcggtactg attgagcaac actacaagcg cccgatggat attgagtggg 1380
ccaaagacgg ccacaccggg aagttattta ttgtccaggc gcgccctgaa accgtgcgat 1440
ccaacggtca ggtcatggag cgttacagcc tgcagggaca gggcaaggtg gtgattgaag 1500
gccgtgcgat tggtcaccgc atcggcgccg gtaccgtcaa ggtcattcac gatatcagcg 1560
aaatgaaccg catcgaaaaa ggtgacgtgc tggtgaccga tatgaccgat cccgactggg 1620
aaccgatcat gaaaaaagcc tccgccattg tgacgaaccg cggcggccgt acctgccatg 1680
ccgcgattat cgcgcgtgag ctgggcatcc cggcggtggt tggctgtggc gatgccaccg 1740
agcggctgaa agagggacat accgttaccg tatcctgtgc tgagggcgat accggctatg 1800
tctacgatga actgctcgac ttcgacgtca ccagttcgca ggttgatacc atgccggacc 1860
tgccgcttaa aatcatgatg aacgtgggca acccggatcg cgcgttcgat ttcgcctgtt 1920
tgccaaacga aggggttggt ctggcgcggc tggaatttat tatcaaccgc atgatcggcg 1980
tgcatccaaa agcgttgctg gagttcgatc agcaaacccc tgaactgcag aagcagattc 2040
gtcagatgat gaaaggtttt gacgatccgg ttgagtttta catcgcccgt ctgaccgaag 2100
ggatcgcgac gctgggcgcg gcgttcgcgc cgaagcgcgt tattgtccgc ctgtcggatt 2160
ttaaaacgaa cgaatatgcc aatctggtgg gtggagaacg ttacgaaccc gaagaggaaa 2220
acccgatgct ggggttccgt ggcgcaggcc gctatgtctc cgagagtttc cgcgactgtt 2280
tcgcgctgga gtgcgaagcg gtgaagcgcg tacgcaacga gatggggctg accaacgtgg 2340
aaatcatggt gccctttgtg cgtacggtcg atcaggctca ggcggtggta gaggaattgg 2400
gtcgccaggg actgaagcgc ggcgagaacg ggctcaaggt cattatgatg tgtgaaatcc 2460
cctcgaatgc cctgctggcc gagcagtttt tacaacactt tgacggtttc tccatcggct 2520
ctaatgatat gactcagctg gcgctggggc tggatcgcga ctccggcgtg gtatctgcct 2580
tgtttgatga gcgtaatgag gcggtcaaag cgctgctgtc catggcgatt caggcggcga 2640
aaaaacaggg caaatacgta ggaatatgcg gtcaggggcc gtcagatcat caggatttcg 2700
cggcctggtt gatggagcag ggcatcgaca gtctgtctct gaatccggac accgtggtgg 2760
aaacctggtt aagcctggcg gcgctaaaca aacccgcctg aggtgatgga taacctccga 2820
tgccagaagg ccagcgcaag ctggcttttt tttttgtctt tttgacaggc aaaaaaaagc 2880
ccatcacagg ggatgggcaa agactacaca cagcaattct ttacgctact caggggaaat 2940
tagggcgttt agaaatcagt aacttgattt ccaacatagg aaacatggta ttcacacggc 3000
tcgctggcgt ctttaagaat cctcttatta gtttaaagga aataatattt tgacggctag 3060
gg 3062
<210> 4
<211> 794
<212> PRT
<213> Pantoea ananatis
<400> 4
Met Ser Asn Lys Gly Glu Gln Pro Leu Val Leu Trp Tyr Asn Gln Leu
1 5 10 15
Gly Met His Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly
20 25 30
Glu Met Ile Thr Asn Leu Ser Ser Leu Gly Val Ser Val Pro Asn Gly
35 40 45
Phe Ala Thr Thr Ser Trp Ala Phe Asn Gln Phe Leu Glu Gln Ser Gly
50 55 60
Leu Asn Gln Arg Ile Tyr Ala Leu Leu Asp Asp Thr Asn Ile Asp Asp
65 70 75 80
Val Asp Gln Leu Ala Lys Ala Gly Lys Gln Ile Arg Gln Trp Val Val
85 90 95
Glu Thr Pro Phe Gln Pro Glu Leu Glu Ala Ala Ile Leu Ser Ala Tyr
100 105 110
Glu Gln Leu Ser Ala Asp Asp Ala Glu Ala Ser Phe Ala Val Arg Ser
115 120 125
Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln
130 135 140
Glu Thr Phe Leu Asn Val Gln Gly Ile Glu Ser Val Met Val Ala Val
145 150 155 160
Lys His Val Tyr Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg
165 170 175
Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Ile
180 185 190
Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Thr
195 200 205
Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ala Ala
210 215 220
Leu Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu
225 230 235 240
Phe Tyr Val His Lys Pro Thr Leu Ala Ala Lys Arg Pro Ala Ile Val
245 250 255
Arg Arg Asn Met Gly Ser Lys Lys Val Arg Met Val Tyr Ala Asp Ser
260 265 270
Arg Glu His Gly Glu Gln Val Arg Ile Glu Asp Val Ala Glu Ala Glu
275 280 285
Arg Asp Arg Phe Cys Leu Ser Asp Ala Glu Val Glu Ala Leu Ala His
290 295 300
Gln Ala Val Leu Ile Glu Gln His Tyr Lys Arg Pro Met Asp Ile Glu
305 310 315 320
Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg
325 330 335
Pro Glu Thr Val Arg Ser Asn Gly Gln Val Met Glu Arg Tyr Ser Leu
340 345 350
Gln Gly Gln Gly Lys Val Val Ile Glu Gly Arg Ala Ile Gly His Arg
355 360 365
Ile Gly Ala Gly Thr Val Lys Val Ile His Asp Ile Ser Glu Met Asn
370 375 380
Arg Ile Glu Lys Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp
385 390 395 400
Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly
405 410 415
Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro
420 425 430
Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Leu Lys Glu Gly His
435 440 445
Thr Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Asp
450 455 460
Glu Leu Leu Asp Phe Asp Val Thr Ser Ser Gln Val Asp Thr Met Pro
465 470 475 480
Asp Leu Pro Leu Lys Ile Met Met Asn Val Gly Asn Pro Asp Arg Ala
485 490 495
Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu
500 505 510
Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Lys Ala Leu Leu
515 520 525
Glu Phe Asp Gln Gln Thr Pro Glu Leu Gln Lys Gln Ile Arg Gln Met
530 535 540
Met Lys Gly Phe Asp Asp Pro Val Glu Phe Tyr Ile Ala Arg Leu Thr
545 550 555 560
Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Ala Pro Lys Arg Val Ile
565 570 575
Val Arg Leu Ser Asp Phe Lys Thr Asn Glu Tyr Ala Asn Leu Val Gly
580 585 590
Gly Glu Arg Tyr Glu Pro Glu Glu Glu Asn Pro Met Leu Gly Phe Arg
595 600 605
Gly Ala Gly Arg Tyr Val Ser Glu Ser Phe Arg Asp Cys Phe Ala Leu
610 615 620
Glu Cys Glu Ala Val Lys Arg Val Arg Asn Glu Met Gly Leu Thr Asn
625 630 635 640
Val Glu Ile Met Val Pro Phe Val Arg Thr Val Asp Gln Ala Gln Ala
645 650 655
Val Val Glu Glu Leu Gly Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly
660 665 670
Leu Lys Val Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala
675 680 685
Glu Gln Phe Leu Gln His Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp
690 695 700
Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser
705 710 715 720
Ala Leu Phe Asp Glu Arg Asn Glu Ala Val Lys Ala Leu Leu Ser Met
725 730 735
Ala Ile Gln Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly
740 745 750
Gln Gly Pro Ser Asp His Gln Asp Phe Ala Ala Trp Leu Met Glu Gln
755 760 765
Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Glu Thr Trp
770 775 780
Leu Ser Leu Ala Ala Leu Asn Lys Pro Ala
785 790
<210> 5
<211> 2379
<212> DNA
<213> Escherichia coli
<400> 5
atgtccaaca atggctcgtc accgctggtg ctttggtata accaactcgg catgaatgat 60
gtagacaggg ttgggggcaa aaatgcctcc ctgggtgaaa tgattactaa tctttccgga 120
atgggtgttt ccgttccgaa tggtttcgcc acaaccgccg acgcgtttaa ccagtttctg 180
gaccaaagcg gcgtaaacca gcgcatttat gaactgctgg ataaaacgga tattgacgat 240
gttactcagc ttgcgaaagc gggcgcgcaa atccgccagt ggattatcga cactcccttc 300
cagcctgagc tggaaaacgc catccgcgaa gcctatgcac agctttccgc cgatgacgaa 360
aacgcctctt ttgcgatgcg ctcctccgcc accgcagaag atatgccgga cgcttctttt 420
gccggtcagc aggaaacctt cctcaacgtt cagggttttg acgccgttct cgtggcagtg 480
aaacatgtat ttgcttctct gtttaacgat cgcgccatct cttatcgtgt gcaccagggt 540
tacgatcacc gtggtgtggc gctctccgcc ggtgttcaac ggatggtgcg ctctgacctc 600
gcatcatctg gcgtgatgtt ctccattgat accgaatccg gctttgacca ggtggtgttt 660
atcacttccg catggggcct tggtgagatg gtcgtgcagg gtgcggttaa cccggatgag 720
ttttacgtgc ataaaccgac actggcggcg aatcgcccgg ctatcgtgcg ccgcaccatg 780
gggtcgaaaa aaatccgcat ggtttacgcg ccgacccagg agcacggcaa gcaggttaaa 840
atcgaagacg taccgcagga acagcgtgac atcttctcgc tgaccaacga agaagtgcag 900
gaactggcaa aacaggccgt acaaattgag aaacactacg gtcgcccgat ggatattgag 960
tgggcgaaag atggccacac cggtaaactg ttcattgtgc aggcgcgtcc ggaaaccgtg 1020
cgctcacgcg gtcaggtcat ggagcgttat acgctgcatt cacagggtaa gattatcgcc 1080
gaaggccgtg ctatcggtca tcgcatcggt gcgggtccgg tgaaagtcat ccatgacatc 1140
agcgaaatga accgcatcga acctggcgac gtgctggtta ctgacatgac cgacccggac 1200
tgggaaccga tcatgaagaa agcatctgcc atcgtcacca accgtggcgg tcgtacctgt 1260
cacgcggcga tcatcgctca tgaactgggc attccggcga tagtgggctg tggagatgca 1320
acagaacgga tgaaagacgg tgagaacgtc actgtttctt gtgccgaagg tgataccggt 1380
tacgtctatg cggagttgct ggaatttagc gtgaaaagct ccagcgtaga aacgatgccg 1440
gatctgccgt tgaaagtgat gatgaacgtc ggtaacccgg accgtgcttt cgacttcgcc 1500
tgcctaccga acgaaggcgt gggccttgcg cgtctggaat ttatcatcaa ccgtatgatt 1560
ggcgtccacc cacgcgcact gcttgagttt gacgatcagg aaccgcagtt gcaaaacgaa 1620
atccgcgaga tgatgaaagg ttttgattct ccgcgtgaat tttacgttgg tcgtctgact 1680
gaagggatcg cgacgctggg tgccgcgttt tatccgaagc gcgtcattgt ccgtctctct 1740
gattttaaat cgaacgaata tgccaacctg gtcggtggtg agcgttacga gccagatgaa 1800
gagaacccga tgctcggctt ccgtggcgcg ggccgctatg tttccgacag cttccgcgac 1860
tgtttcgcgc tggagtgtga agcagtgaaa cgtgtgcgca acgacatggg actgaccaac 1920
gttgagatca tgatcccgtt cgtgcgtacc gtagatcagg cgaaagcggt ggttgaagaa 1980
ctggcgcgtc aggggctgaa acgtggcgag aacgggctga aaatcatcat gatgtgtgaa 2040
atcccgtcca acgccttgct ggccgagcag ttcctcgaat atttcgacgg cttctcaatt 2100
ggctcaaacg atatgacgca gctggcgctc ggtctggacc gtgactccgg cgtggtgtct 2160
gaattgttcg atgagcgcaa cgatgcggtg aaagcactgc tgtcgatggc tatccgtgcc 2220
gcgaagaaac agggcaaata tgtcgggatt tgcggtcagg gtccgtccga ccacgaagac 2280
tttgccgcat ggttgatgga agaggggatc gatagcctgt ctctgaaccc ggacaccgtg 2340
gtgcaaacct ggttaagcct ggctgaactg aagaaataa 2379
<210> 6
<211> 792
<212> PRT
<213> Escherichia coli
<400> 6
Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu
1 5 10 15
Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly
20 25 30
Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly
35 40 45
Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly
50 55 60
Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp
65 70 75 80
Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile
85 90 95
Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr
100 105 110
Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Met Arg Ser
115 120 125
Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln
130 135 140
Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val
145 150 155 160
Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg
165 170 175
Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val
180 185 190
Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser
195 200 205
Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala
210 215 220
Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu
225 230 235 240
Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val
245 250 255
Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr
260 265 270
Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln
275 280 285
Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys
290 295 300
Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu
305 310 315 320
Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg
325 330 335
Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu
340 345 350
His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg
355 360 365
Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn
370 375 380
Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp
385 390 395 400
Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly
405 410 415
Gly Arg Thr Cys His Ala Ala Ile Ile Ala His Glu Leu Gly Ile Pro
420 425 430
Ala Ile Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu
435 440 445
Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala
450 455 460
Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro
465 470 475 480
Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala
485 490 495
Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu
500 505 510
Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu
515 520 525
Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met
530 535 540
Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr
545 550 555 560
Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile
565 570 575
Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly
580 585 590
Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg
595 600 605
Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu
610 615 620
Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn
625 630 635 640
Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala
645 650 655
Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly
660 665 670
Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala
675 680 685
Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp
690 695 700
Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser
705 710 715 720
Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met
725 730 735
Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly
740 745 750
Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu
755 760 765
Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp
770 775 780
Leu Ser Leu Ala Glu Leu Lys Lys
785 790
<210> 7
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 7
atgtccaaca atggctcgtc accgctggtg gtgtaggctg gagctgcttc 50
<210> 8
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 8
ttatttcttc agttcagcca ggcttaacca ctgtcaaaca tgagaattaa 50
<210> 9
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 9
attgtcgaag agagcagatt tg 22
<210> 10
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 10
ttaacgcagg atgtctgtga ag 22
<210> 11
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 11
atgtccaata aaggcgaaca gccgttagta ctttggtaca accagcttgg tgtaggctgg 60
agctgcttc 69
<210> 12
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 12
tcaggcgggt ttgtttagcg ccgccaggct taaccaggtt tccaccacgc tgtcaaacat 60
gagaattaa 69
<210> 13
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 13
ggcgcaattc tgaaactgtg tc 22
<210> 14
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 14
aaagaattgc tgtgtgtagt ct 22
<210> 15
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 15
atgtccaaca atggctcgtc accgctggtg cctcacgctg ccgcaagcac 50
<210> 16
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 16
ttatttcttc agttcagcca ggcttaacca agaacaactg ttcaccgtta g 51
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 17
caaaccgttc atttatcaca 20
<210> 18
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 18
catcttcggg gatcacataa c 21
Claims (12)
- - KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성이 비활성화되거나 또는 야생형 효소의 특이적 활성에 비해 감소되며,
- KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하고,
상기 효소 활성을 코딩하는 유전자가 ppsA에 의해 식별되는 것을 특징으로 하는 L-시스테인의 발효 생산에 적합한 미생물 균주. - 제1항에 있어서, 미생물 균주는 엔테로박테리아과(Enterobacteriaceae family) 또는 코리네박테리아과(Corynebacteriaceae family)로부터의 균주인 것을 특징으로 하는 미생물 균주.
- 제1항 또는 제2항에 있어서, 미생물 균주는 에셰리키아 콜리(Escherichia coli), 판토에아 아나나티스(Pantoea ananatis) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 미생물 균주.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 미생물 균주는 에셰리키아 콜리 및 판토에아 아나나티스로 이루어진 군으로부터 선택되는 것을 특징으로 하는 미생물 균주.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 미생물 균주는 종 에셰리키아 콜리의 균주인 것을 특징으로 하는 미생물 균주.
- 제1항 내지 제5항 중 어느 한 항에 있어서, ppsA 유전자 내에 적어도 하나의 돌연변이를 함유하는 것을 특징으로 하는 미생물 균주.
- 제6항에 있어서, 돌연변이된 유전자는 에셰리키아 콜리로부터의 ppsA 유전자, 판토에아 아나나티스로부터의 ppsA 유전자, 및 이들 유전자와 상동성인 유전자로 이루어진 군으로부터 선택되는 것을 특징으로 하는 미생물 균주.
- 제6항 또는 제7항에 있어서, ppsA 유전자의 코딩 DNA 서열은 서열번호: 5인 것을 특징으로 하는 미생물 균주.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이러한 균주에서, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성은 야생형 효소의 특이적 활성에 비해 적어도 25% 감소되는 것을 특징으로 하는 미생물 균주.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이러한 균주에서, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성은 야생형 효소의 특이적 활성에 비해 적어도 70% 감소되는 것을 특징으로 하는 미생물 균주.
- 제1항 내지 제8항 중 어느 한 항에 있어서, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 효소 활성을 갖지 않는 것을 특징으로 하는 미생물 균주.
- 제1항 내지 제11항 중 어느 한 항의 미생물 균주가 사용되는 것을 특징으로 하는, L-시스테인을 생산하기 위한 발효 방법.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2020/068021 WO2021259491A1 (de) | 2020-06-26 | 2020-06-26 | Verbesserte cystein produzierende stämme |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230025010A true KR20230025010A (ko) | 2023-02-21 |
Family
ID=71409393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237001935A KR20230025010A (ko) | 2020-06-26 | 2020-06-26 | 개선된 시스테인 생산 균주 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230265473A1 (ko) |
EP (1) | EP4172310A1 (ko) |
JP (1) | JP2023532871A (ko) |
KR (1) | KR20230025010A (ko) |
CN (1) | CN116018400A (ko) |
WO (1) | WO2021259491A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118742558A (zh) | 2022-03-01 | 2024-10-01 | 瓦克化学股份公司 | 改良的半胱氨酸生产菌株 |
WO2024125795A1 (de) | 2022-12-15 | 2024-06-20 | Wacker Chemie Ag | Verfahren zur isolierung von taurin aus taurin- und hypotaurin-haltigen fermentationsmedien mikrobieller fermentation |
WO2024125794A1 (de) | 2022-12-15 | 2024-06-20 | Wacker Chemie Ag | Verfahren zur fermentativen herstellung von hypotaurin |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8601582D0 (en) | 1986-01-23 | 1986-02-26 | Electricity Council | Production of l-cysteine |
TW313589B (ko) | 1991-12-12 | 1997-08-21 | Wacker Chemie Gmbh | |
DE19539952A1 (de) | 1995-10-26 | 1997-04-30 | Consortium Elektrochem Ind | Verfahren zur Herstellung von O-Acetylserin, L-Cystein und L-Cystein-verwandten Produkten |
DE19726083A1 (de) | 1997-06-19 | 1998-12-24 | Consortium Elektrochem Ind | Mikroorganismen und Verfahren zur fermentativen Herstellung von L-Cystein, L-Cystin, N-Acetyl-Serin oder Thiazolidinderivaten |
DE19949579C1 (de) | 1999-10-14 | 2000-11-16 | Consortium Elektrochem Ind | Verfahren zur fermentativen Herstellung von L-Cystein oder L-Cystein-Derivaten |
DE10232930A1 (de) | 2002-07-19 | 2004-02-05 | Consortium für elektrochemische Industrie GmbH | Verfahren zur fermentativen Herstellung von Aminosäuren und Aminosäure-Derivaten der Phosphoglycerat-Familie |
WO2004113373A1 (en) | 2003-06-21 | 2004-12-29 | University Of Sheffield | Overexpression of the cyddc transporter |
DE10331291A1 (de) | 2003-07-10 | 2005-02-17 | Consortium für elektrochemische Industrie GmbH | Varianten der 3-Phosphoglyceratdehydrogenase mit reduzierter Hemmung durch L-Serin und dafür codierende Gene |
JP4479283B2 (ja) | 2004-03-04 | 2010-06-09 | 味の素株式会社 | L−システイン生産菌及びl−システインの製造法 |
JP4604537B2 (ja) | 2004-03-31 | 2011-01-05 | 味の素株式会社 | L−システイン生産菌及びl−システインの製造法 |
DE102004035052A1 (de) | 2004-07-20 | 2006-02-16 | Basf Ag | Mikroorganismen zur Herstellung von schwefelhaltigen Verbindungen |
DE602009000714D1 (de) * | 2008-03-06 | 2011-03-24 | Ajinomoto Kk | L-Zystein-produzierendes Bakterium und Verfahren zur Herstellung von L-Zystein |
DE102011075656A1 (de) | 2011-05-11 | 2012-03-29 | Wacker Chemie Ag | Verfahren zur fermentativen Produktion von L-Cystin |
DE102012216527A1 (de) * | 2012-09-17 | 2014-03-20 | Wacker Chemie Ag | Verfahren zur fermentativen Produktion von L-Cystein und Derivaten dieser Aminosäure |
-
2020
- 2020-06-26 JP JP2022580253A patent/JP2023532871A/ja active Pending
- 2020-06-26 US US18/012,296 patent/US20230265473A1/en active Pending
- 2020-06-26 WO PCT/EP2020/068021 patent/WO2021259491A1/de unknown
- 2020-06-26 KR KR1020237001935A patent/KR20230025010A/ko not_active Application Discontinuation
- 2020-06-26 EP EP20735534.8A patent/EP4172310A1/de active Pending
- 2020-06-26 CN CN202080102380.3A patent/CN116018400A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4172310A1 (de) | 2023-05-03 |
WO2021259491A1 (de) | 2021-12-30 |
CN116018400A (zh) | 2023-04-25 |
JP2023532871A (ja) | 2023-08-01 |
US20230265473A1 (en) | 2023-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101944150B1 (ko) | 메티오닌의 발효적 생산을 위한 재조합 미생물 | |
US9150893B2 (en) | Compositions and methods of producing methionine | |
DK2314710T3 (en) | A process for the production of methionine by culturing a microorganism modified to enhance the production of cysteine | |
US20230265473A1 (en) | Improved cysteine-producing strains | |
JP5922036B2 (ja) | メチオニンの生産のための株および方法 | |
WO2007012078A1 (en) | Methionine producing recombinant microorganisms | |
CN109055289B (zh) | 一种高产l-甲硫氨酸的重组大肠杆菌及其应用 | |
JP2008529485A (ja) | 低いγ脱離活性を有する発現酵素を含む微生物 | |
EP3039153B1 (en) | Microorganism for methionine production with improved methionine synthase activity and methionine efflux | |
RU2723714C2 (ru) | Способ и микроорганизм для ферментативного продуцирования метионина с улучшенным выходом метионина | |
KR101770150B1 (ko) | 메티오닌 히드록시 유사체 (mha)의 발효 생산 | |
CN118742558A (zh) | 改良的半胱氨酸生产菌株 | |
US20230406817A1 (en) | Method for enzymatic oxidation of sulfinic acids to sulfonic acids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |