KR20230035565A - 구아니디노아세트산의 발효적 생산 방법 - Google Patents
구아니디노아세트산의 발효적 생산 방법 Download PDFInfo
- Publication number
- KR20230035565A KR20230035565A KR1020237000279A KR20237000279A KR20230035565A KR 20230035565 A KR20230035565 A KR 20230035565A KR 1020237000279 A KR1020237000279 A KR 1020237000279A KR 20237000279 A KR20237000279 A KR 20237000279A KR 20230035565 A KR20230035565 A KR 20230035565A
- Authority
- KR
- South Korea
- Prior art keywords
- microorganism
- leu
- glu
- gly
- lys
- Prior art date
Links
- BPMFZUMJYQTVII-UHFFFAOYSA-N guanidinoacetic acid Chemical compound NC(=N)NCC(O)=O BPMFZUMJYQTVII-UHFFFAOYSA-N 0.000 title claims abstract description 130
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012262 fermentative production Methods 0.000 title claims abstract description 11
- 244000005700 microbiome Species 0.000 claims abstract description 103
- CVSVTCORWBXHQV-UHFFFAOYSA-N creatine Chemical compound NC(=[NH2+])N(C)CC([O-])=O CVSVTCORWBXHQV-UHFFFAOYSA-N 0.000 claims abstract description 40
- 229960003624 creatine Drugs 0.000 claims abstract description 20
- 239000006046 creatine Substances 0.000 claims abstract description 20
- 108090000623 proteins and genes Proteins 0.000 claims description 120
- 230000000694 effects Effects 0.000 claims description 70
- 230000001965 increasing effect Effects 0.000 claims description 54
- 235000018102 proteins Nutrition 0.000 claims description 47
- 102000004169 proteins and genes Human genes 0.000 claims description 47
- 108010073791 Glycine amidinotransferase Proteins 0.000 claims description 45
- 102100040870 Glycine amidinotransferase, mitochondrial Human genes 0.000 claims description 45
- 102000004190 Enzymes Human genes 0.000 claims description 42
- 108090000790 Enzymes Proteins 0.000 claims description 42
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 claims description 40
- 229930064664 L-arginine Natural products 0.000 claims description 40
- 235000014852 L-arginine Nutrition 0.000 claims description 40
- 108010011677 glyoxylate aminotransferase Proteins 0.000 claims description 34
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 33
- 150000001413 amino acids Chemical group 0.000 claims description 27
- 241000588724 Escherichia coli Species 0.000 claims description 19
- 108020004687 Malate Synthase Proteins 0.000 claims description 18
- 102100034229 Citramalyl-CoA lyase, mitochondrial Human genes 0.000 claims description 15
- 230000002255 enzymatic effect Effects 0.000 claims description 14
- 238000000855 fermentation Methods 0.000 claims description 14
- 230000004151 fermentation Effects 0.000 claims description 13
- 239000004475 Arginine Substances 0.000 claims description 12
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 12
- 235000009697 arginine Nutrition 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 claims description 12
- 101150089004 argR gene Proteins 0.000 claims description 9
- 108010070742 Guanidinoacetate N-Methyltransferase Proteins 0.000 claims description 7
- 102000005756 Guanidinoacetate N-methyltransferase Human genes 0.000 claims description 7
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 claims description 6
- 102000009042 Argininosuccinate Lyase Human genes 0.000 claims description 4
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 claims description 4
- 230000006696 biosynthetic metabolic pathway Effects 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- 101710191958 Amino-acid acetyltransferase Proteins 0.000 claims description 3
- 102000053640 Argininosuccinate synthases Human genes 0.000 claims description 3
- 108700024106 Argininosuccinate synthases Proteins 0.000 claims description 3
- 241000589776 Pseudomonas putida Species 0.000 claims description 3
- 102000009661 Repressor Proteins Human genes 0.000 claims description 3
- 108010034634 Repressor Proteins Proteins 0.000 claims description 3
- 230000002238 attenuated effect Effects 0.000 claims description 3
- 101800001241 Acetylglutamate kinase Proteins 0.000 claims description 2
- 101710165738 Acetylornithine aminotransferase Proteins 0.000 claims description 2
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 claims description 2
- 101710113083 Carbamoyl-phosphate synthase Proteins 0.000 claims description 2
- 241000186216 Corynebacterium Species 0.000 claims description 2
- 241000588921 Enterobacteriaceae Species 0.000 claims description 2
- 101150099894 GDHA gene Proteins 0.000 claims description 2
- 102000016901 Glutamate dehydrogenase Human genes 0.000 claims description 2
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 claims description 2
- 108010072610 N-acetyl-gamma-glutamyl-phosphate reductase Proteins 0.000 claims description 2
- 102000001253 Protein Kinase Human genes 0.000 claims description 2
- 241000589516 Pseudomonas Species 0.000 claims description 2
- 101100217185 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aruC gene Proteins 0.000 claims description 2
- 101100022072 Sulfolobus acidocaldarius (strain ATCC 33909 / DSM 639 / JCM 8929 / NBRC 15157 / NCIMB 11770) lysJ gene Proteins 0.000 claims description 2
- 101150008194 argB gene Proteins 0.000 claims description 2
- 101150070427 argC gene Proteins 0.000 claims description 2
- 101150089042 argC2 gene Proteins 0.000 claims description 2
- 101150050866 argD gene Proteins 0.000 claims description 2
- 101150029940 argJ gene Proteins 0.000 claims description 2
- 238000001035 drying Methods 0.000 claims description 2
- 101150019455 gdh gene Proteins 0.000 claims description 2
- 108010050322 glutamate acetyltransferase Proteins 0.000 claims description 2
- 101150094164 lysY gene Proteins 0.000 claims description 2
- 101150039489 lysZ gene Proteins 0.000 claims description 2
- 108020004414 DNA Proteins 0.000 description 59
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 57
- 238000004519 manufacturing process Methods 0.000 description 37
- 239000004471 Glycine Substances 0.000 description 31
- 238000006243 chemical reaction Methods 0.000 description 31
- 238000003752 polymerase chain reaction Methods 0.000 description 29
- 229920001817 Agar Polymers 0.000 description 28
- 239000008272 agar Substances 0.000 description 28
- 239000013612 plasmid Substances 0.000 description 27
- HHLFWLYXYJOTON-UHFFFAOYSA-N glyoxylic acid Chemical compound OC(=O)C=O HHLFWLYXYJOTON-UHFFFAOYSA-N 0.000 description 25
- 238000010367 cloning Methods 0.000 description 21
- 239000013587 production medium Substances 0.000 description 19
- 229930027917 kanamycin Natural products 0.000 description 18
- 229960000318 kanamycin Drugs 0.000 description 18
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 18
- 229930182823 kanamycin A Natural products 0.000 description 18
- 239000002609 medium Substances 0.000 description 16
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- 241000282326 Felis catus Species 0.000 description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 14
- 229940024606 amino acid Drugs 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 14
- 108010034529 leucyl-lysine Proteins 0.000 description 14
- 108010009298 lysylglutamic acid Proteins 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- 229940041514 candida albicans extract Drugs 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- 238000011144 upstream manufacturing Methods 0.000 description 11
- 239000012138 yeast extract Substances 0.000 description 11
- 108700010070 Codon Usage Proteins 0.000 description 10
- 108090000340 Transaminases Proteins 0.000 description 10
- 241000219195 Arabidopsis thaliana Species 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 9
- 102000014898 transaminase activity proteins Human genes 0.000 description 9
- 108010033918 Alanine-glyoxylate transaminase Proteins 0.000 description 8
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 8
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 8
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 8
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 8
- RFMMMVDNIPUKGG-YFKPBYRVSA-N N-acetyl-L-glutamic acid Chemical compound CC(=O)N[C@H](C(O)=O)CCC(O)=O RFMMMVDNIPUKGG-YFKPBYRVSA-N 0.000 description 8
- 229930006000 Sucrose Natural products 0.000 description 8
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 8
- 229960003767 alanine Drugs 0.000 description 8
- 235000013681 dietary sucrose Nutrition 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 229960004793 sucrose Drugs 0.000 description 8
- 239000000725 suspension Substances 0.000 description 8
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- 230000002759 chromosomal effect Effects 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 238000009630 liquid culture Methods 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 6
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 6
- 238000001712 DNA sequencing Methods 0.000 description 6
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 6
- 101150036393 aceB gene Proteins 0.000 description 6
- 108010038633 aspartylglutamate Proteins 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 108010016616 cysteinylglycine Proteins 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 239000007858 starting material Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 5
- 229930195714 L-glutamate Natural products 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 5
- WOJYIMBIKTWKJO-KKUMJFAQSA-N Ser-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N WOJYIMBIKTWKJO-KKUMJFAQSA-N 0.000 description 5
- 241000205180 Thermococcus litoralis Species 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000001976 enzyme digestion Methods 0.000 description 5
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 108010012581 phenylalanylglutamate Proteins 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 4
- VYSRNGOMGHOJCK-GUBZILKMSA-N Arg-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N VYSRNGOMGHOJCK-GUBZILKMSA-N 0.000 description 4
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 4
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 4
- KYQJHBWHRASMKG-ZLUOBGJFSA-N Asn-Ser-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O KYQJHBWHRASMKG-ZLUOBGJFSA-N 0.000 description 4
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 4
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 4
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 4
- 241000131329 Carabidae Species 0.000 description 4
- 101100163308 Clostridium perfringens (strain 13 / Type A) argR1 gene Proteins 0.000 description 4
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 4
- 238000007702 DNA assembly Methods 0.000 description 4
- 241000588722 Escherichia Species 0.000 description 4
- 241001200922 Gagata Species 0.000 description 4
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 4
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 4
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 4
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 4
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 4
- BIRKKBCSAIHDDF-WDSKDSINSA-N Gly-Glu-Cys Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BIRKKBCSAIHDDF-WDSKDSINSA-N 0.000 description 4
- 108010011689 Glycine transaminase Proteins 0.000 description 4
- 101000997558 Homo sapiens Glutathione hydrolase 1 proenzyme Proteins 0.000 description 4
- 101000926208 Homo sapiens Inactive glutathione hydrolase 2 Proteins 0.000 description 4
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 4
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 4
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 4
- 239000006142 Luria-Bertani Agar Substances 0.000 description 4
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 4
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 4
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 4
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 4
- 108010064997 VPY tripeptide Proteins 0.000 description 4
- PFMAFMPJJSHNDW-ZKWXMUAHSA-N Val-Cys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PFMAFMPJJSHNDW-ZKWXMUAHSA-N 0.000 description 4
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 4
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 108010054813 diprotin B Proteins 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- YGPSJZOEDVAXAB-UHFFFAOYSA-N kynurenine Chemical compound OC(=O)C(N)CC(=O)C1=CC=CC=C1N YGPSJZOEDVAXAB-UHFFFAOYSA-N 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- WWZKQHOCKIZLMA-UHFFFAOYSA-N octanoic acid Chemical compound CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 229960003104 ornithine Drugs 0.000 description 4
- 230000002018 overexpression Effects 0.000 description 4
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 4
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 239000000600 sorbitol Substances 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 3
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 3
- 244000153158 Ammi visnaga Species 0.000 description 3
- 235000010585 Ammi visnaga Nutrition 0.000 description 3
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 3
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 3
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 3
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 3
- -1 Aromatic amino acid Chemical class 0.000 description 3
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 3
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 3
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 3
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 3
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 3
- 101100350224 Bacillus subtilis (strain 168) pdhB gene Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 101100236536 Corynebacterium glutamicum (strain ATCC 13032 / DSM 20300 / BCRC 11384 / JCM 1318 / LMG 3730 / NCIMB 10025) glcB gene Proteins 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 3
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 3
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 3
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 3
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 3
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 3
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 3
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 3
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 3
- RENBRDSDKPSRIH-HJWJTTGWSA-N Ile-Phe-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O RENBRDSDKPSRIH-HJWJTTGWSA-N 0.000 description 3
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 3
- 102100034061 Inactive glutathione hydrolase 2 Human genes 0.000 description 3
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 3
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 3
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 3
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 3
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 3
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 3
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 3
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241001413575 Moorea Species 0.000 description 3
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 3
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 3
- 101100406344 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceF gene Proteins 0.000 description 3
- 238000012181 QIAquick gel extraction kit Methods 0.000 description 3
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 3
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 3
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 3
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 3
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 3
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 3
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 3
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 3
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 3
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 3
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 3
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 102000006614 amidinotransferase Human genes 0.000 description 3
- 108020004134 amidinotransferase Proteins 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 239000007621 bhi medium Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 229960002173 citrulline Drugs 0.000 description 3
- 230000002301 combined effect Effects 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- DHNGCHLFKUPGPX-RMKNXTFCSA-N ethyl trans-p-methoxycinnamate Chemical compound CCOC(=O)\C=C\C1=CC=C(OC)C=C1 DHNGCHLFKUPGPX-RMKNXTFCSA-N 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 125000001487 glyoxylate group Chemical class O=C([O-])C(=O)[*] 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 108010068488 methionylphenylalanine Proteins 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 229960001153 serine Drugs 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 2
- XDEYHXABZOKKDZ-YFKLLHAASA-N (2s)-2-[[2-(diaminomethylideneamino)acetyl]-hydroxyamino]-n-[[(2r,3s,4r,5s)-5-(2,4-dioxo-1h-pyrimidin-5-yl)-3,4-dihydroxyoxolan-2-yl]methyl]pentanediamide Chemical compound O[C@@H]1[C@H](O)[C@@H](CNC(=O)[C@@H](N(O)C(=O)CN=C(N)N)CCC(=O)N)O[C@H]1C1=CNC(=O)NC1=O XDEYHXABZOKKDZ-YFKLLHAASA-N 0.000 description 2
- VTFWFHCECSOPSX-SFOWXEAESA-N (S)-2-ureidoglycine Chemical compound NC(=O)N[C@H]([NH3+])C([O-])=O VTFWFHCECSOPSX-SFOWXEAESA-N 0.000 description 2
- HHDDCCUIIUWNGJ-UHFFFAOYSA-M 3-hydroxypyruvate Chemical compound OCC(=O)C([O-])=O HHDDCCUIIUWNGJ-UHFFFAOYSA-M 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 2
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 2
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 2
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 2
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 2
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 2
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- BSGSDLYGGHGMND-IHRRRGAJSA-N Arg-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N BSGSDLYGGHGMND-IHRRRGAJSA-N 0.000 description 2
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 2
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 2
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 2
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 2
- KDZOASGQNOPSCU-WDSKDSINSA-N Argininosuccinic acid Chemical compound OC(=O)[C@@H](N)CCC\N=C(/N)N[C@H](C(O)=O)CC(O)=O KDZOASGQNOPSCU-WDSKDSINSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 2
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 2
- GYOHQKJEQQJBOY-QEJZJMRPSA-N Asn-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N GYOHQKJEQQJBOY-QEJZJMRPSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 2
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 2
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 2
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 2
- XHTUGJCAEYOZOR-UBHSHLNASA-N Asn-Ser-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XHTUGJCAEYOZOR-UBHSHLNASA-N 0.000 description 2
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 2
- KSZHWTRZPOTIGY-AVGNSLFASA-N Asn-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KSZHWTRZPOTIGY-AVGNSLFASA-N 0.000 description 2
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 2
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 2
- DZQKLNLLWFQONU-LKXGYXEUSA-N Asp-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O DZQKLNLLWFQONU-LKXGYXEUSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 2
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 2
- AKKUDRZKFZWPBH-SRVKXCTJSA-N Asp-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N AKKUDRZKFZWPBH-SRVKXCTJSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- 206010061764 Chromosomal deletion Diseases 0.000 description 2
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 2
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 2
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 2
- UCSXXFRXHGUXCQ-SRVKXCTJSA-N Cys-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N UCSXXFRXHGUXCQ-SRVKXCTJSA-N 0.000 description 2
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 2
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 2
- UVAOVENCIONMJP-GUBZILKMSA-N Gln-Cys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O UVAOVENCIONMJP-GUBZILKMSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 2
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 2
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 2
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 2
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 2
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 2
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 2
- YLABFXCRQQMMHS-AVGNSLFASA-N Gln-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YLABFXCRQQMMHS-AVGNSLFASA-N 0.000 description 2
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 2
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 2
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 2
- WVWZIPOJECFDAG-AVGNSLFASA-N Glu-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N WVWZIPOJECFDAG-AVGNSLFASA-N 0.000 description 2
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 2
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 2
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 2
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 2
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 2
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- 102100033366 Glutathione hydrolase 1 proenzyme Human genes 0.000 description 2
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 2
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 2
- VUUOMYFPWDYETE-WDSKDSINSA-N Gly-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VUUOMYFPWDYETE-WDSKDSINSA-N 0.000 description 2
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 2
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 2
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 2
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 2
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 2
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 2
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 2
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 2
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 2
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 2
- 108700039609 IRW peptide Proteins 0.000 description 2
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 2
- ZXJFURYTPZMUNY-VKOGCVSHSA-N Ile-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 ZXJFURYTPZMUNY-VKOGCVSHSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- WSSGUVAKYCQSCT-XUXIUFHCSA-N Ile-Met-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)O)N WSSGUVAKYCQSCT-XUXIUFHCSA-N 0.000 description 2
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 2
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 2
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 2
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 2
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-L L-glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 2
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 2
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- QKIBIXAQKAFZGL-GUBZILKMSA-N Leu-Cys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QKIBIXAQKAFZGL-GUBZILKMSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 2
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 2
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 2
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 2
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 2
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- KXYLFJIQDIMURW-IHPCNDPISA-N Lys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCCN)=CNC2=C1 KXYLFJIQDIMURW-IHPCNDPISA-N 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 2
- HLYIDXAXQIJYIG-CIUDSAMLSA-N Met-Gln-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HLYIDXAXQIJYIG-CIUDSAMLSA-N 0.000 description 2
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 2
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 2
- PPHLBTXVBJNKOB-FDARSICLSA-N Met-Ile-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PPHLBTXVBJNKOB-FDARSICLSA-N 0.000 description 2
- ILKCLLLOGPDNIP-RCWTZXSCSA-N Met-Met-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ILKCLLLOGPDNIP-RCWTZXSCSA-N 0.000 description 2
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 2
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 2
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 2
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 2
- 241001413577 Moorea producens Species 0.000 description 2
- JRLGPAXAGHMNOL-LURJTMIESA-N N(2)-acetyl-L-ornithine Chemical compound CC(=O)N[C@H](C([O-])=O)CCC[NH3+] JRLGPAXAGHMNOL-LURJTMIESA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 2
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 2
- XXAOSEUPEMQJOF-KKUMJFAQSA-N Phe-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XXAOSEUPEMQJOF-KKUMJFAQSA-N 0.000 description 2
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 2
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 2
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 2
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 2
- YTGGLKWSVIRECD-JBACZVJFSA-N Phe-Trp-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 YTGGLKWSVIRECD-JBACZVJFSA-N 0.000 description 2
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 2
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 2
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 2
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 2
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 2
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 2
- TYMBHHITTMGGPI-NAKRPEOUSA-N Pro-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 TYMBHHITTMGGPI-NAKRPEOUSA-N 0.000 description 2
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 2
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- APIAILHCTSBGLU-JYJNAYRXSA-N Pro-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@@H]2CCCN2 APIAILHCTSBGLU-JYJNAYRXSA-N 0.000 description 2
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 2
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 2
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 2
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 2
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 2
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- IUFQHOCOKQIOMC-XIRDDKMYSA-N Trp-Asn-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N IUFQHOCOKQIOMC-XIRDDKMYSA-N 0.000 description 2
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 2
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 2
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 2
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 2
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 2
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 2
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 2
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 2
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 2
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 2
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- BZOSBRIDWSSTFN-AVGNSLFASA-N Val-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N BZOSBRIDWSSTFN-AVGNSLFASA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- OBETXYAYXDNJHR-UHFFFAOYSA-N alpha-ethylcaproic acid Natural products CCCCC(CC)C(O)=O OBETXYAYXDNJHR-UHFFFAOYSA-N 0.000 description 2
- VZTDIZULWFCMLS-UHFFFAOYSA-N ammonium formate Chemical compound [NH4+].[O-]C=O VZTDIZULWFCMLS-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- KDZOASGQNOPSCU-UHFFFAOYSA-N argininosuccinate Chemical compound OC(=O)C(N)CCCN=C(N)NC(C(O)=O)CC(O)=O KDZOASGQNOPSCU-UHFFFAOYSA-N 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 108010054812 diprotin A Proteins 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 229960002989 glutamic acid Drugs 0.000 description 2
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 238000012269 metabolic engineering Methods 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 229960004452 methionine Drugs 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- KHPXUQMNIQBQEV-UHFFFAOYSA-N oxaloacetic acid Chemical compound OC(=O)CC(=O)C(O)=O KHPXUQMNIQBQEV-UHFFFAOYSA-N 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 238000007747 plating Methods 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 239000013615 primer Substances 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 230000001915 proofreading effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 102000037983 regulatory factors Human genes 0.000 description 2
- 108091008025 regulatory factors Proteins 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 2
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 2
- 229940038773 trisodium citrate Drugs 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 108010027345 wheylin-1 peptide Proteins 0.000 description 2
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 description 1
- 108030004788 (S)-ureidoglycine-glyoxylate transaminases Proteins 0.000 description 1
- KPGXRSRHYNQIFN-UHFFFAOYSA-L 2-oxoglutarate(2-) Chemical compound [O-]C(=O)CCC(=O)C([O-])=O KPGXRSRHYNQIFN-UHFFFAOYSA-L 0.000 description 1
- CAOVWYZQMPNAFJ-UHFFFAOYSA-N 4-(2-aminophenyl)-2,4-dioxobutanoic acid Chemical compound NC1=CC=CC=C1C(=O)CC(=O)C(O)=O CAOVWYZQMPNAFJ-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- SXFSQZDSUWACKX-UHFFFAOYSA-N 4-methylthio-2-oxobutanoic acid Chemical compound CSCCC(=O)C(O)=O SXFSQZDSUWACKX-UHFFFAOYSA-N 0.000 description 1
- QQKKFVXSQXUHPI-NBVRZTHBSA-N Acidissiminol epoxide Chemical compound O1C(C)(C)C1CC(O)C(/C)=C/COC(C=C1)=CC=C1CCNC(=O)C1=CC=CC=C1 QQKKFVXSQXUHPI-NBVRZTHBSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- 102000007610 Amino-acid N-acetyltransferase Human genes 0.000 description 1
- 108010032178 Amino-acid N-acetyltransferase Proteins 0.000 description 1
- 101100336546 Arabidopsis thaliana GGAT2 gene Proteins 0.000 description 1
- 101000926209 Arabidopsis thaliana Glutamate-glyoxylate aminotransferase 2 Proteins 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 1
- 108030001145 Aromatic-amino-acid-glyoxylate transaminases Proteins 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- TWVTVZUGEDBAJF-ACZMJKKPSA-N Asn-Cys-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N TWVTVZUGEDBAJF-ACZMJKKPSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- SAKCBXNPWDRWPE-BQBZGAKWSA-N Asp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N SAKCBXNPWDRWPE-BQBZGAKWSA-N 0.000 description 1
- WZUZGDANRQPCDD-SRVKXCTJSA-N Asp-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N WZUZGDANRQPCDD-SRVKXCTJSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- 241000020089 Atacta Species 0.000 description 1
- 101100096227 Bacteroides fragilis (strain 638R) argF' gene Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- GSNRZJNHMVMOFV-ACZMJKKPSA-N Cys-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N GSNRZJNHMVMOFV-ACZMJKKPSA-N 0.000 description 1
- VCIIDXDOPGHMDQ-WDSKDSINSA-N Cys-Gly-Gln Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VCIIDXDOPGHMDQ-WDSKDSINSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 108030001064 Glycine-oxaloacetate transaminases Proteins 0.000 description 1
- AEMRFAOFKBGASW-UHFFFAOYSA-N Glycolic acid Chemical class OCC(O)=O AEMRFAOFKBGASW-UHFFFAOYSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- 108010025076 Holoenzymes Proteins 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- 108020003285 Isocitrate lyase Proteins 0.000 description 1
- 108030001148 Kynurenine-glyoxylate transaminases Proteins 0.000 description 1
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- 229930195722 L-methionine Natural products 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- WLCYCADOWRMSAJ-CIUDSAMLSA-N Lys-Asn-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O WLCYCADOWRMSAJ-CIUDSAMLSA-N 0.000 description 1
- MLLKLNYPZRDIQG-GUBZILKMSA-N Lys-Cys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N MLLKLNYPZRDIQG-GUBZILKMSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- AHFOKDZWPPGJAZ-SRVKXCTJSA-N Lys-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N AHFOKDZWPPGJAZ-SRVKXCTJSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- XBZOQGHZGQLEQO-IUCAKERBSA-N Lys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN XBZOQGHZGQLEQO-IUCAKERBSA-N 0.000 description 1
- JPYPRVHMKRFTAT-KKUMJFAQSA-N Lys-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N JPYPRVHMKRFTAT-KKUMJFAQSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- FDGAMQVRGORBDV-GUBZILKMSA-N Met-Ser-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCSC FDGAMQVRGORBDV-GUBZILKMSA-N 0.000 description 1
- JHVNNUIQXOGAHI-KJEVXHAQSA-N Met-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N)O JHVNNUIQXOGAHI-KJEVXHAQSA-N 0.000 description 1
- 108030001138 Methionine-glyoxylate transaminases Proteins 0.000 description 1
- 101100354186 Mycoplasma capricolum subsp. capricolum (strain California kid / ATCC 27343 / NCTC 10154) ptcA gene Proteins 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 1
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- FQUUYTNBMIBOHS-IHRRRGAJSA-N Phe-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FQUUYTNBMIBOHS-IHRRRGAJSA-N 0.000 description 1
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 1
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- GNZCMRRSXOBHLC-JYJNAYRXSA-N Phe-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N GNZCMRRSXOBHLC-JYJNAYRXSA-N 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- 101150050559 SOAT1 gene Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- FCHAMFUEENBIDH-UHFFFAOYSA-N Severin Natural products CC1CCC2C(C)C3CCC4(O)C(CC5C4CC(O)C6CC(CCC56C)OC(=O)C)C3CN2C1 FCHAMFUEENBIDH-UHFFFAOYSA-N 0.000 description 1
- 108700014839 Streptococcus SAGP Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187132 Streptomyces kanamyceticus Species 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- 108010012715 Superoxide dismutase Proteins 0.000 description 1
- 241001399969 Syntheta Species 0.000 description 1
- 239000008049 TAE buffer Substances 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- LDMUNXDDIDAPJH-VMBFOHBNSA-N Trp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LDMUNXDDIDAPJH-VMBFOHBNSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- QNJYPWZACBACER-KKUMJFAQSA-N Tyr-Asp-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O QNJYPWZACBACER-KKUMJFAQSA-N 0.000 description 1
- NJLQMKZSXYQRTO-FHWLQOOXSA-N Tyr-Glu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NJLQMKZSXYQRTO-FHWLQOOXSA-N 0.000 description 1
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 1
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 1
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 1
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- HGEVZDLYZYVYHD-UHFFFAOYSA-N acetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound CC(O)=O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O HGEVZDLYZYVYHD-UHFFFAOYSA-N 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 150000004716 alpha keto acids Chemical class 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 235000019730 animal feed additive Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 101150056313 argF gene Proteins 0.000 description 1
- 101150118463 argG gene Proteins 0.000 description 1
- 101150094408 argI gene Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- NCEXYHBECQHGNR-UHFFFAOYSA-N chembl421 Chemical compound C1=C(O)C(C(=O)O)=CC(N=NC=2C=CC(=CC=2)S(=O)(=O)NC=2N=CC=CC=2)=C1 NCEXYHBECQHGNR-UHFFFAOYSA-N 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- JGBUYEVOKHLFID-UHFFFAOYSA-N gelred Chemical compound [I-].[I-].C=1C(N)=CC=C(C2=CC=C(N)C=C2[N+]=2CCCCCC(=O)NCCCOCCOCCOCCCNC(=O)CCCCC[N+]=3C4=CC(N)=CC=C4C4=CC=C(N)C=C4C=3C=3C=CC=CC=3)C=1C=2C1=CC=CC=C1 JGBUYEVOKHLFID-UHFFFAOYSA-N 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 230000004101 glyoxylate shunt pathway Effects 0.000 description 1
- 238000002013 hydrophilic interaction chromatography Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229940049920 malate Drugs 0.000 description 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-N malic acid Chemical compound OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 244000000010 microbial pathogen Species 0.000 description 1
- FEMOMIGRRWSMCU-UHFFFAOYSA-N ninhydrin Chemical compound C1=CC=C2C(=O)C(O)(O)C(=O)C2=C1 FEMOMIGRRWSMCU-UHFFFAOYSA-N 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- UWBHMRBRLOJJAA-UHFFFAOYSA-N oxaluric acid Chemical compound NC(=O)NC(=O)C(O)=O UWBHMRBRLOJJAA-UHFFFAOYSA-N 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000001121 post-column derivatisation Methods 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000001953 recrystallisation Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1018—Carboxy- and carbamoyl transferases (2.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
- C12Y206/01002—Alanine transaminase (2.6.1.2), i.e. alanine-aminotransferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
- C12Y206/01004—Glycine transaminase (2.6.1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
- C12Y206/01044—Alanine--glyoxylate transaminase (2.6.1.44)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01002—Guanidinoacetate N-methyltransferase (2.1.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/03—Carboxy- and carbamoyltransferases (2.1.3)
- C12Y201/03003—Ornithine carbamoyltransferase (2.1.3.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/04—Amidinotransferases (2.1.4)
- C12Y201/04001—Glycine amidinotransferase (2.1.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/03—Acyl groups converted into alkyl on transfer (2.3.3)
- C12Y203/03009—Malate synthase (2.3.3.9)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y403/00—Carbon-nitrogen lyases (4.3)
- C12Y403/02—Amidine-lyases (4.3.2)
- C12Y403/02001—Argininosuccinate lyase (4.3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y603/00—Ligases forming carbon-nitrogen bonds (6.3)
- C12Y603/04—Other carbon-nitrogen ligases (6.3.4)
- C12Y603/04005—Argininosuccinate synthase (6.3.4.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y603/00—Ligases forming carbon-nitrogen bonds (6.3)
- C12Y603/04—Other carbon-nitrogen ligases (6.3.4)
- C12Y603/04016—Carbamoyl-phosphate synthase (ammonia) (6.3.4.16)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
본 발명은 구아니디노아세트산 (GAA) 을 생산할 수 있도록 형질전환된 미생물 및 이러한 미생물을 사용하는 GAA 의 발효적 생산 방법에 관한 것이다. 본 발명은 또한 크레아틴의 발효적 생산 방법에 관한 것이다.
Description
본 발명은 구아니디노아세트산 (GAA) 을 생산할 수 있도록 형질전환된 미생물 및 이러한 미생물을 사용하는 GAA 의 발효적 생산 방법에 관한 것이다. 본 발명은 또한 크레아틴의 발효적 생산 방법에 관한 것이다.
GAA 은 동물 사료 첨가제로서 사용되는 유기 화합물이다 (US2011257075 A1). GAA 은 크레아틴의 선천 전구체이다 (예를 들어 Humm et al., Biochem. J. (1997) 322, 771-776). 그러므로, GAA 의 보충은 유기체에서 크레아틴의 최적의 공급을 허용한다.
본 발명은 출발 물질로서 산업용 공급 원료 (예를 들어 암모니아, 암모늄 염 및 글루코스 또는 당 함유 기질) 를 사용하는 발효 공정에 의해 GAA 을 생산하는 방법에 관한 것이다. 생물계에서 GAA 및 L-오르니틴은 출발 물질로서의 아르기닌 및 글라이신으로부터 L-아르기닌:글라이신-아미디노트랜스페라아제 (AGAT; EC 2.1.4.1) 의 촉매 작용에 의해 형성되며, 이는 크레아틴 생합성에서 제 1 단계이다:
Guthmiller et al. (J Biol Chem. 1994 Jul 1;269(26):17556-60) 은 래트 신장 AGAT 를 그 효소를 에스케리키아 콜라이 (Escherichia coli) 에서 클로닝하고 이종적으로 발현시킴으로써 특성분석했다. Muenchhoff et al. (FEBS Journal 277 (2010) 3844-3860) 은 또한 원핵생물로부터의 AGAT 를 그 효소를 에스케리키아 콜라이에서 클로닝하고 이종적으로 발현시킴으로써 제 1 특성분석을 보고한다. Sosio et al. (Cell Chemical Biology 25, 540-549, May 17, 2018) 은 스트렙토마이세스 (Streptomyces) 종에서 슈도우리디마이신에 대한 생합성 경로를 설명했다. 그들은 PumN, L-아르기닌:글라이신-아미디노트랜스페라아제 (AGAT) 에 의해 촉매작용되는 L-아르기닌과 글라이신의 반응에 의한 GAA 및 L-오르니틴의 형성을 중간 반응으로서 기술한다.
미생물, 특히 박테리아에서 GAA 합성의 출발 물질 중 하나, 즉 L-아르기닌의 생산을 증가시키기 위한 여러 접근법이 또한 문헌으로부터 알려져 있다. L-아르기닌 생산을 위한 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 의 대사 조작에 관한 개요가 Park et al. (NATURE COMMUNICATIONS | DOI: 10.1038/ncomms5618) 에 의해 제공되어 있다. 그들은 이미 L-아르기닌을 생산하는 코리네박테리움 글루타미쿰 균주, 예를 들어 ATCC 21831 의 L-아르기닌 생산자에 대한 무작위 돌연변이유발 및 스크리닝을 제안하며 (Nakayama and Yoshida 1974, US3849250 A), 대사의 시스템-와이드 분석에 기반하는 단계적 합리적 대사 조작은 균주 조작 단계 전체를 통하여 L-아르기닌 생산의 점진적 증가를 초래한다. Yim et al. (J Ind Microbiol Biotechnol (2011) 38:1911-1920) 은 코리네박테리움 글루타미쿰에서 염색체 argR 유전자를 파괴함으로써 L-아르기닌 생합성 경로를 제어하는 중심 리프레서 단백질 ArgR 에 대해 코딩하는 유전자인 argR 을 불활성화시키는 것이 개선된 아르기닌-생산 균주를 초래한다는 것을 보여줄 수 있었다. Ginesy et al. (Microbial Cell Factories (2015) 14:29) 은 증가된 아르기닌 생산을 위한 에스케리키아 콜라이의 성공적인 조작을 보고한다. 그 중에서도, 그들은 argR 리프레서 유전자의 결실을 제안했다.
아르기닌-생합성 오페론 argR 의 발현을 저해하는 유전자가 불활성화된 유전자 재조합 균주의 사용 방법이 Suga et al. (US20070031946 A1) 에 의해 보고된 바 있다. 특히, 아르기닌 오페론을 제어하는 argR 의 결실은 아르기닌 생산의 중요한 인자로서 여겨져 왔다.
Fan Wenchao 은 비병원성 미생물, 예컨대 코리네박테리움 글루타미쿰의 발효에 의한 크레아틴의 생산 방법을 개시한다 (CN106065411 A). 미생물은 하기 생체내 변화 기능을 갖는다: 글루코스의 L-글루탐산으로의 전환; L-글루탐산의 N-아세틸-L-글루탐산으로의 전환; N-아세틸-L-글루탐산의 N-아세틸-L-글루탐산 세미알데히드로의 전환; N-아세틸-L-글루탐산 세미알데히드의 N-아세틸-L-오르니틴으로의 전환; N-아세틸-L-오르니틴의 L-오르니틴으로의 전환; L-오르니틴의 L-시트룰린으로의 전환; L-시트룰린의 아르기니노-숙신산으로의 전환; 아르기니노-숙신산의 L-아르기닌으로의 전환; L-아르기닌의 구아니디노아세트산으로의 전환; 및, 마지막으로, 구아니디노아세트산의 크레아틴으로의 전환. Fan Wenchao 은 미생물이 N-아세틸글루타메이트-신타아제, N-아세틸오르니틴-δ-아미노트랜스페라아제, N-아세틸오르니티나아제, 오르니틴-카르바모일 트랜스페라아제, 아르기니노숙시네이트 신테타아제, 글라이신 아미디노-트랜스페라아제 (EC: 2.1. 4.1), 및 구아니디노아세테이트 N-메틸트랜스페라아제 (EC: 2.1.1.2) 로 이루어지는 군으로부터 선택되는 하나 이상의 효소를 과발현한다고 제안한다. 미생물은 바람직하게는 글라이신 아미디노트랜스페라아제 (L-아르기닌:글라이신 아미디노트랜스페라아제) 및 구아니디노아세테이트 N-메틸트랜스페라아제를 과발현한다.
GAA 생합성의 제 2 출발 물질에 관하여, L-아르기닌:글라이신 아미디노트랜스페라아제 (AGAT) 의 기능을 갖는 단백질에 대해 코딩하는 동종 유전자가 자연적으로 제공되어 있거나 또는 L-아르기닌:글라이신 아미디노트랜스페라아제 (AGAT) 의 기능을 갖는 단백질에 대해 코딩하는 이종 유전자가 제공된 미생물에서 GAA 생합성을 개선하기 위해서 글라이신의 공급을 증가시키는 것이 바람직할 것이다.
에스케리키아 콜라이 또는 코리네박테리움 글루타미쿰과 같은 미생물에 자연적으로 존재하는, 소위 글리옥실레이트 션트 (shunt) 경로는 트리카르본산 (TCA) 사이클 (Krebs 사이클) 의 부반응이고, 이소시트레이트 리아제에 의한 이소시트레이트로부터의 글리옥실레이트 및 숙시네이트의 형성 및 말레이트 신타아제에 의한 글리옥실레이트 및 아세틸-CoA 로부터의 말레이트의 형성을 포함한다 (Salusjaervi et al., Applied Microbiology and Biotechnology (2019) 103:2525-2535).
글리옥실레이트는 아미노 공여체, 예컨대 아미노산, 및 글리옥실레이트 트랜스아미나아제의 존재 하에서의 글라이신의 형성을 위한 출발 물질로서 사용될 수 있다. 글리옥실레이트 트랜스아미나아제는 아미노산으로부터 글리옥실레이트로의 아미노 기의 전달을 촉매작용한다. 이러한 전달의 산물은 글라이신 및 상응하는 α-케토산이다.
코리네박테리움 글루타미쿰에서 글리콜레이트의 생산을 개선하려는 시도에서 Zahoor et al. (Journal of Biotechnology 192 (2014) 366-375) 은 말레이트 신타아제 유전자 aceB 의 결실에 의해 그 중에서도 글리옥실레이트 전구체의 공급의 증가를 달성했다.
여러 글리옥실레이트 아미노 트랜스페라아제가 알려져 있고, 아미노 공여체에 대한 그들의 기질 특이성에서 다양하다 (예를 들어 Kameya et al. FEBS Journal 277 (2010) 1876-1885; Liepman and Olsen, Plant Physiol. Vol. 131, 2003, 215-227; Sakuraba et al., JOURNAL OF BACTERIOLOGY, Aug. 2004, p. 5513-5518; Takada and Noguchi, Biochem. J. (1985) 231, 157-163 참조). 대부분의 이들 글리옥실레이트 아미노트랜스페라아제는 상이한 아미노산을 아미노 공여체로서 사용할 수 있으므로, 그들은 상이한 EC 번호로 주석이 달린다. 그러나, 모든 이들 아미노트랜스페라아제는 그들이 글리옥실레이트를 수용체 분자로서 사용하거나, 또는, 역반응의 경우에, 글라이신을 공여체 분자로서 사용한다는 점을 공통으로 한다.
글리옥실레이트 아미노트랜스페라아제의 기능을 갖는 단백질의 예는 다음과 같다:
글라이신 트랜스아미나아제 (EC 2.6.1.4) 는 다음 반응을 촉매작용한다:
L-글루타메이트 + 글리옥실레이트 <=> 알파-케토글루타레이트 + 글라이신.
글라이신:옥살로아세테이트 트랜스아미나아제 (EC 2.6.1.35) 는 다음 반응을 촉매작용한다:
L-아스파르테이트 + 글리옥실레이트 <=> 옥살로아세테이트 + 글라이신.
알라닌:글리옥실레이트 트랜스아미나아제 (EC 2.6.1.44) 는 다음 반응을 촉매작용한다:
L-알라닌 + 글리옥실레이트 <=> 피루베이트 + 글라이신.
세린:글리옥실레이트 트랜스아미나아제 (EC 2.6.1.45) 는 다음 반응을 촉매작용한다:
L-세린 + 글리옥실레이트 <=> 3-히드록시-피루베이트 + 글라이신.
메티오닌:글리옥실레이트 트랜스아미나아제 (EC 2.6.1.73) 는 다음 반응을 촉매작용한다:
L-메티오닌 + 글리옥실레이트 <=> 4-(메틸술파닐)-2-케토-부타노에이트 + 글라이신.
방향족 아미노산:글리옥실레이트 트랜스아미나아제 (EC 2.6.1.60) 는 다음 반응을 촉매작용한다:
방향족 아미노산 + 글리옥실레이트 <=> 방향족 케토산 + 글라이신.
키뉴레닌:글리옥실레이트 트랜스아미나아제 (EC 2.6.1.63) 는 다음 반응을 촉매작용한다:
키뉴레닌 + 글리옥실레이트 <=> 4-(2-아미노페닐)-2,4-디케토-부타노에이트 + 글라이신.
(S)-우레이도-글라이신:글리옥실레이트 트랜스아미나아제 (EC 2.6.1.112) 는 다음 반응을 촉매작용한다:
(S)-우레이도-글라이신 + 글리옥실레이트 <=> N-카르바모일-2-케토-글라이신 + 글라이신.
그러나, 현재까지 에스케리키아 콜라이 및 코리네박테리움 글루타미쿰에 대해 내생 글리옥실레이트 아미노트랜스페라아제가 기재된 적이 없다. 게다가, 야생형에 비해 증가된 GAA 의 생산에 적합한 미생물 및 이러한 미생물을 사용하는 당해 GAA 의 생산 방법은 보고된 적이 없다.
그러므로, 본 발명의 기초가 되는 과제는 구아니디노아세트산 (GAA) 을 생산할 수 있도록 형질전환된 미생물, 특히 GAA 생합성의 출발 물질로서 글라이신을 제공하는 능력이 개선된 미생물, 및 이러한 미생물을 사용하는 GAA 의 발효적 생산 방법을 제공하는 것이다.
상기 과제는 L-아르기닌:글라이신 아미디노트랜스페라아제 (AGAT, 예를 들어 EC 2.1.4.1) 의 기능을 갖는 단백질에 대해 코딩하는 적어도 하나의 유전자를 포함하고 글리옥실레이트 아미노트랜스페라아제의 기능을 갖는 적어도 하나의 단백질을 포함하는 미생물에 의해 해결된다.
바람직하게는, 본 발명에 따른 미생물에서 글리옥실레이트 아미노트랜스페라아제의 기능을 갖는 적어도 하나의 단백질의 효소 활성은 야생형 미생물에서의 당해 효소 활성에 비해 활성이 증가된다.
본 발명에 따른 미생물은 글리옥실레이트 아미노트랜스페라아제의 효소 활성을 갖는 단백질을 코딩하는 적어도 하나의 유전자를 포함할 수 있다. 글리옥실레이트 아미노트랜스페라아제의 효소 활성을 갖는 적어도 하나의 단백질은 동종성 또는 이종성일 수 있다. 바람직하게는, 본 발명의 미생물에서 글리옥실레이트 아미노트랜스페라아제의 효소 활성을 갖는 단백질을 코딩하는 적어도 하나의 유전자가 과발현된다.
바람직하게는, 본 발명의 미생물은 야생형 미생물의 능력에 비해 증가된 L-아르기닌 생산 능력을 갖는다.
본 발명의 맥락에서, L-아르기닌 생산 능력이 증가된 미생물은 L-아르기닌을 그 자신의 필요를 초과하여 생산하는 미생물을 의미한다. 이러한 L-아르기닌 생산 미생물의 예는 예를 들어 코리네박테리움 글루타미쿰 ATCC 21831 또는 Park et al. (NATURE COMMUNICATIONS | DOI: 10.1038/ncomms5618) 또는 Ginesy et al. (Microbial Cell Factories (2015) 14:29) 에 의해 개시된 것들이다.
본 발명의 특별한 구현예에서, 미생물은 카르바모일포스페이트 신타아제 (EC 6.3.4.16) 의 기능을 갖는 효소의 활성이 야생형 미생물에서의 당해 효소 활성에 비해 증가된다.
본 발명에 따른 미생물에서 아르기니노숙시네이트 리아제 (E.C. 4.3.2.1) 의 기능을 갖는 효소의 활성은 야생형 미생물에서의 당해 효소 활성에 비해 증가될 수 있다.
게다가, 본 발명에 따른 미생물에서, 오르니틴 카르바모일트랜스페라아제 (EC 2.1.3.3) 의 기능을 갖는 효소의 활성은 야생형 미생물에서의 당해 효소 활성에 비해 증가될 수 있다.
본 발명에 따른 미생물에서, 아르기니노숙시네이트 신테타아제 (E.C. 6.3.4.5) 의 기능을 갖는 효소의 활성이 또한 야생형 미생물에서의 당해 효소 활성에 비해 증가될 수 있다.
미생물에서 효소 활성의 증가는, 예를 들어, 상응하는 내생 유전자의 돌연변이에 의해 달성될 수 있다. 효소 활성을 증가시키기 위한 추가의 조치는 당해 효소에 대해 코딩하는 mRNA 를 안정화시키는 것일 수 있다. 위에서 언급된 효소의 활성의 증가는 또한 당해 효소에 대해 코딩하는 유전자를 과발현시킴으로써 달성될 수 있다.
본 발명에 따른 미생물의 추가의 구현예에서 말레이트 신타아제의 기능을 갖는 단백질의 활성이 야생형 미생물에서의 당해 활성에 비해 감소된다.
말레이트 신타아제의 기능을 갖는 단백질의 활성은, 그 단백질을 야생형 단백질보다 효소 활성이 더 낮은 단백질로 돌연변이시킴으로써, 말레이트 신타아제의 기능을 갖는 효소를 코딩하는 유전자의 발현을 야생형 미생물에서의 당해 유전자의 발현에 비해 약화시킴으로써, 예를 들어 ATG 시작 코돈을 GTG 로 변화시키는 것에 의해, mRNA 의 5' 미번역 영역 내로 이차 구조를 도입하는 것에 의해 또는 코돈 사용법을 약화시키는 것에 의해 번역 효율을 감소시킴으로써 또는 말레이트 신타아제의 기능을 갖는 효소를 코딩하는 유전자를 결실시킴으로써 감소될 수 있다.
본 발명에 따른 미생물은 바람직하게는 또한 오르니틴 카르바모일트랜스페라아제 (EC 2.1.3.3) 의 기능을 갖는 단백질에 대해 코딩하는 유전자 (예를 들어 argF/argF2/argI), 아르기니노숙시네이트 신테타아제 (E.C. 6.3.4.5) 의 기능을 갖는 단백질에 대해 코딩하는 유전자 (예를 들어 argG), 및 아르기니노숙시네이트 리아제 (E.C. 4.3.2.1) 의 기능을 갖는 단백질에 대해 코딩하는 유전자 (예를 들어 argH) 로 이루어지는 군으로부터 선택되는 적어도 하나 이상의 과발현된 유전자를 포함한다.
게다가, 본 발명에 따른 미생물에서 아르기닌 오페론 (argCJBDFR) 은 과발현될 수 있다.
대안적으로, 본 발명에 따른 미생물에서 아르기닌 반응성 리프레서 단백질 ArgR 에 대해 코딩하는 argR 유전자는 약화 또는 결실될 수 있다.
본 발명의 추가의 구현예에서 및, 선택적으로 위에서 언급된 변경에 더하여, 각각 글루타메이트 데히드로게나아제, 오르니틴 아세틸트랜스페라아제, 아세틸글루타메이트 키나아제, 아세틸글루타밀포스페이트 리덕타아제 및 아세틸오르니틴 아미노트랜스페라아제에 대해 코딩하는 gdh, argJ, argB, argC 및/또는 argD 을 포함하는, L-아르기닌의 생합성 경로의 효소에 대해 코딩하는 유전자 중 적어도 하나 이상이 본 발명에 따른 미생물에서 과발현된다.
표 1 은 상이한 종, 즉 에스케리키아 콜라이, 코리네박테리움 글루타미쿰 및 슈도모나스 푸티다 (Pseudomonas putida) 에서 아르기닌 생합성에 관여하는 또는 기여하는 상이한 효소의 명칭을 보여준다.
표 1: 효소의 명칭
유전자의 과발현은 일반적으로 유전자의 카피수를 증가시킴으로써 및/또는 유전자를 강 프로모터와 기능적으로 연결시킴으로써 및/또는 리보솜 결합 자리를 증대시킴으로써 및/또는 시작 코돈 또는 전체 유전자의 코돈 사용법 최적화에 의해 또는 위에서 언급된 모든 방법 중 선별을 포함하는 조합에 의해 달성된다.
본 발명의 미생물의 본 발명의 추가의 구현예에서 L-아르기닌:글라이신 아미디노트랜스페라아제의 기능을 갖는 단백질에 대해 코딩하는 유전자는 이종성이다.
이종 유전자는 자연적으로 이 유전자를 갖지 않는 숙주 유기체 내로 유전자가 삽입된 것을 의미한다. 숙주 내의 이종 유전자의 삽입은 재조합 DNA 기술에 의해 수행된다. 재조합 DNA 기술을 적용한 미생물은 트랜스제닉, 유전자 변형 또는 재조합으로 호칭된다.
이종 단백질은 미생물에 자연적으로 존재하지 않는 단백질을 의미한다.
동종 또는 내생 유전자는 그러한 그것의 기능을 포함하는 유전자 또는 그 유전자의 뉴클레오티드 서열이 미생물에 자연적으로 존재하거나 또는 그 미생물에서 "선천적" 인 것을 의미한다.
동종 또는 선천 단백질은 미생물에 자연적으로 존재하는 단백질을 의미한다.
L-아르기닌:글라이신 아미디노트랜스페라아제 (AGAT) 의 기능을 갖는 단백질은 아미디노트랜스페라아제 패밀리에 속한다. 아미디노트랜스페라아제 패밀리는 크레아틴 및 스트렙토마이신 생합성 각각에 관여하는 효소인 글라이신 (EC:2.1.4.1) 및 이노사민 (EC:2.1.4.2) 아미디노트랜스페라아제를 포함한다. 이 패밀리는 또한 아르기닌 데이미나아제, EC:3.5.3.6 를 포함한다. 이들 효소는 다음 반응을 촉매작용한다: 아르기닌 + H2O <=> 시트룰린 + NH3. 이 패밀리에서 또한 발견되는 것은 스트렙토코쿠스 (Streptococcus) 항종양 당단백질이다. L-아르기닌:글라이신-아미디노트랜스페라아제 (AGAT) 활성을 갖는 효소 또는 단백질은 또한 PFAM 패밀리: Amidinotransf (PF02274) 에 속하는 보존된 도메인을 보유하는 것으로 기술되어 있으며 (Marchler-Bauer A et al. (2017), "CDD/SPARCLE: functional classification of proteins via subfamily domain architectures.", Nucleic Acids Res. 45(D1):D200-D203.), 이는 또한 하기 문헌에 기재되어 있다: Pissowotzki K et al., Mol Gen Genet 1991;231:113-123 (PUBMED:1661369 EPMC:1661369); D'Hooghe I et al., J Bacteriol 1997;179:7403-7409 (PUBMED:9393705 EPMC:9393705); Kanaoka M et al. , Jpn J Cancer Res 1987;78:1409-1414 (PUBMED:3123442 EPMC:3123442).
본 발명의 미생물에서 L-아르기닌:글라이신 아미디노트랜스페라아제의 기능을 갖는 단백질에 대해 코딩하는 유전자는 추가로 과발현될 수 있다. 유전자의 과발현은 일반적으로 유전자의 카피수를 증가시킴으로써 및/또는 유전자를 강 프로모터와 기능적으로 연결시킴으로써 및/또는 리보솜 결합 자리를 증대시킴으로써 및/또는 시작 코돈 또는 전체 유전자의 코돈 사용법 최적화에 의해 또는 위에서 언급된 모든 방법 중 선별을 포함하는 조합에 의해 달성된다.
본 발명의 미생물에서 L-아르기닌:글라이신 아미디노트랜스페라아제의 기능을 갖는 단백질은 SEQ ID NO: 11 에 따른 아미노산 서열과 적어도 80 % 상동성, 바람직하게는 적어도 90 % 상동성인 아미노산 서열을 포함할 수 있다. 본 발명의 추가의 구현예에서 L-아르기닌:글라이신 아미디노트랜스페라아제의 아미노산 서열은 SEQ ID NO: 11 에 따른 아미노산 서열과 동일하다.
본 발명의 특별한 구현예에서, 본 발명에 따른 미생물에서 글리옥실레이트 아미노트랜스페라아제의 효소 활성을 갖는 단백질은 SEQ ID NO: 2, SEQ ID NO: 5 또는 SEQ ID NO: 8 에 따른 아미노산 서열과 적어도 80 % 상동성인 아미노산 서열을 포함한다.
본 발명의 미생물은 코리네박테리움 (Corynebacterium) 속, 바람직하게는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 또는 엔테로박테리아세애 (Enterobacteriaceae) 속, 바람직하게는 에스케리키아 콜라이 (Escherichia coli), 또는 슈도모나스 (Pseudomonas) 속, 바람직하게는 슈도모나스 푸티다 (Pseudomonas putida) 에 속할 수 있다.
미생물에서, 특히 본 발명의 미생물에서 야생형 미생물에서의 당해 활성에 비해 증가된 단백질의 효소 활성은 예를 들어 단백질의 돌연변이에 의해, 특히 예를 들어 효소-촉매작용되는 반응의 산물에 대한 피드백 저항성을 단백질에 제공하는 돌연변이에 의해, 또는 야생형 미생물에서의 당해 유전자의 발현에 비해 증가된 그 효소 활성을 갖는 단백질을 코딩하는 유전자의 발현에 의해 달성될 수 있다.
미생물에서, 특히 본 발명의 미생물에서 야생형 미생물에서의 당해 활성에 비해 증가된 유전자의 발현 또는 과발현은 유전자의 카피수를 증가시킴으로써 및/또는 조절 인자의 증대에 의해, 예를 들어 유전자를 강 프로모터와 기능적으로 연결시킴으로써 및/또는 리보솜 결합 자리를 증대시킴으로써 및/또는 시작 코돈 또는 전체 유전자의 코돈 사용법 최적화에 의해 달성될 수 있다. 유전자 발현에 긍정적 영향을 미치는 조절 인자의 증대는, 예를 들어, 프로모터의 효과를 증가시키기 위해 구조 유전자의 상류에 있는 프로모터 서열을 변형시킴으로써 또는 상기 프로모터를 더욱 효과적인 또는 소위 강 프로모터로 완전히 대체함으로써 달성될 수 있다. 프로모터는 유전자의 상류에 위치한다. 프로모터는 약 40 내지 50 개의 염기쌍으로 이루어진 DNA 서열이고, RNA 폴리머라아제 홀로엔자임에 대한 결합 자리 및 전사 시작점을 구성하여, 이에 의해 제어되는 폴리뉴클레오티드 또는 유전자의 발현 강도가 영향을 받을 수 있다. 일반적으로, 강 프로모터를 선택함으로써, 예를 들어 원래의 프로모터를 강, 선천 (원래 다른 유전자에 할당됨) 프로모터로 대체함으로써 또는 주어진, 선천 프로모터의 특정 영역 (예를 들어 그것의 소위 -10 및 -35 영역) 을 공통 서열에 대해 변형시킴으로써 박테리아에서 유전자의 과발현 또는 발현의 증가를 달성할 수 있으며, 이는 예를 들어 코리네박테리움 글루타미쿰에 관해 M. Patek et al. (Microbial Biotechnology 6 (2013), 103-117) 에 의해 교시된 바와 같다. "강" 프로모터의 예는 슈퍼옥사이드 디스무타아제 (superoxide dismutase) (sod) 프로모터이다 ("Psod"; Z. Wang et al., Eng. Life Sci. 2015, 15, 73-82). "기능적 연결" 은 유전자의 전사를 초래하는 프로모터와 유전자의 순차적 배열을 의미하는 것으로 이해된다.
유전 부호는 축퇴되어 있으며, 이는 특정 아미노산이 다수의 상이한 트리플렛에 의해 코딩될 수 있음을 의미한다. 용어 코돈 사용법은 특정 유기체가 전형적으로 특정 아미노산에 대한 모든 가능한 코돈을 동일한 빈도로 사용하지 않을 것이라는 관찰을 나타낸다. 그 대신 유기체는 전형적으로 특정 코돈에 대한 특정 선호도를 보일 것이며, 이는 이들 코돈이 유기체의 전사된 유전자의 코딩 서열에서 더 빈번하게 발견됨을 의미한다. 그것의 미래의 숙주에 외래인, 즉 상이한 종으로부터 유래된 특정 유전자가 미래의 숙주 유기체에서 발현되어야 하는 경우에, 상기 유전자의 코딩 서열은 상기 미래의 숙주 유기체의 코돈 사용법에 맞춰 조정되어야 한다 (즉, 코돈 사용법 최적화).
위에서 언급된 과제는 추가로 구아니디노 아세트산 (GAA) 의 발효적 생산 방법으로서, a) 위에서 정의된 바와 같은 본 발명에 따른 미생물을 적합한 배지에서 적합한 조건 하에 배양하는 단계, 및 b) 배지에 GAA 을 축적시켜 GAA 함유 발효 브로쓰를 형성하는 단계를 포함하는 방법에 의해 해결된다.
본 발명의 방법은 발효 브로쓰로부터 GAA 을 단리하는 단계를 추가로 포함할 수 있다.
본 발명에 따른 방법은 GAA 함유 발효 브로쓰를 건조 및/또는 과립화하는 단계를 추가로 포함할 수 있다.
본 발명은 추가로 구아니디노아세테이트 N-메틸트랜스페라아제 (EC: 2.1.1.2) 의 활성을 갖는 효소에 대해 코딩하는 유전자를 추가로 포함하는 위에서 정의된 바와 같은 미생물에 관한 것이다. 바람직하게는, 구아니디노아세테이트 N-메틸트랜스페라아제의 활성을 갖는 효소에 대해 코딩하는 유전자는 과발현된다.
본 발명은 또한 크레아틴의 발효적 생산 방법으로서, 단계 a) 구아니디노아세테이트 N-메틸트랜스페라아제의 활성을 갖는 효소에 대해 코딩하는 유전자를 포함하는 본 발명에 따른 미생물을 적합한 배지에서 적합한 조건 하에 배양하는 단계, 및 b) 배지에 크레아틴을 축적시켜 크레아틴 함유 발효 브로쓰를 형성하는 단계를 포함하는 방법에 관한 것이다.
바람직하게는, 본 발명의 방법은 크레아틴 함유 발효 브로쓰로부터 크레아틴을 단리하는 단계를 추가로 포함한다. 크레아틴은 발효 브로쓰로부터 등전점 방법 및 / 또는 이온 교환 방법에 의해 추출될 수 있다. 대안적으로, 크레아틴은 물에서의 재결정화 방법에 의해 추가로 정제될 수 있다.
실험 부분
A) 물질 및 방법
화학물질
스트렙토마이세스 카나마이세티쿠스 (Streptomyces kanamyceticus) 로부터의 카나마이신 용액을 Sigma Aldrich (St. Louis, USA, Cat. No. K0254) 로부터 구입했다. IPTG (이소프로필 β-D-1-티오갈락토피라노사이드) 를 Carl-Roth (Karlsruhe, Germany, Cat. No. 2316.4.) 로부터 구입했다. 다르게 언급되지 않으면, 모든 다른 화학물질은 Merck (Darmstadt, Germany), Sigma Aldrich (St. Louis, USA) 또는 Carl-Roth (Karlsruhe, Germany) 로부터 분석적으로 순수하게 구입했다.
세포 증식을 위한 배양
다르게 언급되지 않으면, 배양 / 인큐베이션 절차는 다음과 같이 수행했다:
a.
Merck (Darmstadt, Germany; Cat. No. 110285) 로부터의 LB 브로쓰 (MILLER) 를 사용하여 액체 배지에서 에스케리키아 콜라이 균주를 배양했다. 액체 배양물 (배플이 3 개인 100 ㎖ 에를렌마이어 플라스크 당 10 ㎖ 액체 배지) 을 Infors GmbH (Bottmingen, Switzerland) 로부터의 Infors HT Multitron 표준 인큐베이터 셰이커에서 30℃ 및 200 rpm 에서 인큐베이션했다.
b.
Merck (Darmstadt, Germany, Cat. No. 110283) 로부터의 LB 아가 (MILLER) 를 사용하여 아가 플레이트 상에서 에스케리키아 콜라이 균주를 배양했다. 아가 플레이트를 VWR (Radnor, USA) 로부터의 INCU-Line® 미니 인큐베이터에서 30℃ 에서 인큐베이션했다.
c.
Merck (Darmstadt, Germany, Cat. No. 110493) 로부터의 뇌 심장 인퓨전 브로쓰 (BHI) 를 사용하여 액체 배지에서 코리네박테리움 글루타미쿰 균주를 배양했다. 액체 배양물 (배플이 3 개인 100 ㎖ 에를렌마이어 플라스크 당 10 ㎖ 액체 배지) 을 Infors GmbH (Bottmingen, Switzerland) 로부터의 Infors HT Multitron 표준 인큐베이터 셰이커에서 30℃ 및 200 rpm 에서 인큐베이션했다.
d.
Merck (Darmstadt, Germany, Cat. No. 113825) 로부터의 뇌 심장 아가 (BHI-agar) 를 사용하여 아가 플레이트 상에서 코리네박테리움 글루타미쿰 균주를 배양했다. 아가 플레이트를 Kelvitron® 온도 조절기 (Hanau, Germany) 가 있는 Heraeus Instruments 로부터의 인큐베이터에서 30℃ 에서 인큐베이션했다.
e.
전기천공 후에 코리네박테리움 글루타미쿰을 배양하기 위해서, BHI-아가 (Merck, Darmstadt, Germany, Cat. No. 113825) 에 134 g/ℓ 소르비톨 (Carl Roth GmbH + Co. KG, Karlsruhe, Germany), 2.5 g/ℓ 효모 추출물 (Oxoid/ThermoFisher Scientific, Waltham, USA, Cat. No. LP0021) 및 25 ㎎/ℓ 카나마이신을 보충했다. 아가 플레이트를 Kelvitron® 온도 조절기 (Hanau, Germany) 가 있는 Heraeus Instruments 로부터의 인큐베이터에서 30℃ 에서 인큐베이션했다.
박테리아 현탁액의 광학 밀도의 확인
a.
세이크 플라스크 배양물 중 박테리아 현탁액의 광학 밀도를 Eppendorf AG (Hamburg, Germany) 로부터의 BioPhotometer 를 사용하여 600 nm (OD600) 에서 확인했다.
b.
Wouter Duetz (WDS) 마이크로 발효 시스템 (24-웰 플레이트) 에서 생산된 박테리아 현탁액의 광학 밀도를 Tecan Group AG (Maennedorf, Switzerland) 로부터의 GENios™ 플레이트 리더로 660 nm (OD660) 에서 확인했다.
원심분리
a.
최대 부피 2 ㎖ 의 박테리아 현탁액을 1.5 ㎖ 또는 2 ㎖ 반응 튜브 (예를 들어 Eppendorf Tubes® 3810X) 에서 Eppendorf 5417 R 벤치탑 원심분리기 (13.000 rpm 에서 5 분) 를 사용하여 원심분리했다.
b.
최대 부피 50 ㎖ 의 박테리아 현탁액을 15 ㎖ 또는 50 ㎖ 원심분리기 튜브 (예를 들어 Falcon™ 50 ㎖ 원뿔형 원심분리기 튜브) 에서 Eppendorf 5810 R 벤치탑 원심분리기를 사용하여 10 분 동안 4.000 rpm 에서 원심분리했다.
DNA 단리
플라스미드 DNA 를 에스케리키아 콜라이 세포로부터 Qiagen (Hilden, Germany, Cat. No. 27106) 로부터의 QIAprep Spin Miniprep Kit 를 제조사의 지침에 따라 사용하여 단리했다.
폴리머라아제 연쇄 반응 (PCR)
프루프 리딩 (하이 피델리티) 폴리머라아제에 의한 PCR 을 사용하여 Sanger 시퀀싱 또는 DNA 어셈블리를 위한 DNA 의 원하는 분절을 증폭시켰다. 비-프루프 리딩 폴리머라아제 키트를 사용하여 에스케리키아 콜라이 또는 코리네박테리움 글루타미쿰 콜로니로부터 직접 원하는 DNA 단편의 존재 또는 부재를 확인했다.
a.
New England BioLabs Inc. (Ipswich, USA, Cat. No. M0530) 로부터의 Phusion® High-Fidelity DNA Polymerase Kit (Phusion Kit) 를 제조사의 지침에 따라 사용하여 선별된 DNA 영역을 템플레이트-코렉트 증폭시켰다 (표 2 참조).
표 2: New England BioLabs Inc. 로부터의 Phusion® High-Fidelity DNA Polymerase Kit 를 사용하는 PCR 에 관한 열순환 조건
b.
Qiagen (Hilden, Germany, Cat. No. 201203) 로부터의 Taq PCR Core Kit (Taq Kit) 를 사용하여 DNA 의 원하는 분절을 그것의 존재를 확인하기 위해 증폭시켰다. 키트를 제조사의 지침에 따라 사용했다 (표 3 참조).
표 3: Qiagen. 로부터의 Taq PCR Core Kit (Taq Kit) 를 사용하는 PCR 에 관한 열순환 조건
c.
Takara Bio Inc (Takara Bio Europe S.A.S., Saint-Germain-en-Laye, France, Cat. No. RR350A/B) 로부터의 SapphireAmp® Fast PCR Master Mix (Sapphire Mix) 를 대안적으로서 제조사의 지침에 따라 사용하여 에스케리키아 콜라이 또는 코리네박테리움 글루타미쿰 콜로니로부터 취한 세포에서 DNA 의 원하는 분절의 존재를 확인했다 (표 4 참조).
표 4: Takara Bio Inc. 로부터의 SapphireAmp® Fast PCR Master Mix (Sapphire Mix) 를 사용하는 PCR 에 관한 열순환 조건
d.
모든 올리고뉴클레오티드 프라이머는 Eurofins Genomics GmbH (Ebersberg, Germany) 에 의해 McBride and Caruthers (1983) 에 의해 기재된 포스포라미다이트 방법을 사용하여 합성되었다.
e.
PCR 주형으로서 단리된 플라스미드 DNA 또는 액체 배양물로부터 단리된 전체 DNA 또는 박테리아 콜로니 (콜로니 PCR) 에 함유된 전체 DNA 의 적합하게 희석된 용액을 사용했다. 상기 콜로니 PCR 을 위해 아가 플레이트 상의 콜로니로부터 이쑤시개로 세포 물질을 취하고, 세포 물질을 직접 PCR 반응 튜브 내로 배치함으로써 주형을 제조했다. 세포 물질을 SEVERIN Elektrogeraete GmbH (Sundern, Germany) 로부터의 마이크로웨이브 오븐 타입 Mikrowave & Grill 에서 800 W 로 10 초 동안 가열하고, 그 후 PCR 시약을 PCR 반응 튜브 내의 주형에 첨가했다.
f.
모든 PCR 반응을 Eppendorf AG (Hamburg, Germany) 로부터의 PCR 사이클러 타입 Mastercycler 또는 Mastercycler Nexus Gradient 에서 수행했다.
DNA 의 제한 효소 소화
제한 효소 소화를 위해 "FastDigest 제한 엔도뉴클레아제 (FD)" (ThermoFisher Scientific, Waltham, USA) 또는 New England BioLabs Inc. (Ipswich, USA) 로부터의 제한 엔도뉴클레아제를 사용했다. 반응을 제조사의 매뉴얼의 지침에 따라 수행했다.
DNA 단편의 크기의 확인
a.
작은 DNA 단편 (<1000 bps) 의 크기는 통상적으로 Qiagen (Hilden, Germany) 로부터의 QIAxcel 을 사용하여 자동 모세관 전기영동에 의해 확인되었다.
b.
DNA 단편이 단리될 필요가 있는 경우에 또는 DNA 단편이 >1000 bps 인 경우에 DNA 를 TAE 아가로스 겔 전기영동에 의해 분리하고 GelRed® Nucleic Acid Gel Stain (Biotium, Inc., Fremont, Canada) 으로 염색했다. 염색된 DNA 를 302 nm 에서 시각화했다.
PCR 증폭물 및 제한 단편의 정제
PCR 증폭물 및 제한 단편을 Qiagen (Hilden, Germany; Cat. No. 28106) 로부터의 QIAquick PCR Purification Kit 를 제조사의 지침에 따라 사용하여 세정했다. DNA 를 30 ㎕ 10 mM Tris*HCl (pH 8.5) 로 용리시켰다.
DNA 농도의 확인
PEQLAB Biotechnologie GmbH, since 2015 VWR brand (Erlangen, Germany) 로부터의 NanoDrop Spectrophotometer ND-1000 을 사용하여 DNA 농도를 측정했다.
어셈블리 클로닝
New England BioLabs Inc. (Ipswich, USA, Cat. No. E5520) 로부터 구입한 "NEBuilder HiFi DNA Assembly Cloning Kit" 를 사용하여 플라스미드 벡터를 어셈블했다. 선형 벡터 및 적어도 하나의 DNA 인서트를 함유하는 반응 믹스를 50℃ 에서 60 분 동안 인큐베이션했다. 0.5 ㎕ 의 어셈블리 혼합물을 각각의 형질전환 실험에 사용했다.
에스케리키아 콜라이의 화학적 형질전환
플라스미드 클로닝을 위해, 화학적으로 컴피턴트 (competent) 한 "NEB® Stable Competent E. coli (High Efficiency)" (New England BioLabs Inc., Ipswich, USA, Cat. No. C3040) 를 제조사의 프로토콜에 따라 형질전환시켰다. 성공적으로 형질전환된 세포를 25 ㎎/ℓ 카나마이신이 보충된 LB 아가 상에서 선별했다.
코리네박테리움 글루타미쿰의 형질전환
Ruan et al. (2015) 에 의해 기재된 바와 같이 "Gene Pulser Xcell" (Bio-Rad Laboratories GmbH, Feldkirchen, Germany) 을 사용하는 전기천공을 통해 플라스미드-DNA 에 의한 코리네박테리움 글루타미쿰의 형질전환을 수행했다. 전기천공을 1 mm 전기천공 큐베트 (Bio-Rad Laboratories GmbH, Feldkirchen, Germany) 에서 1.8 kV 및 5 ms 로 설정된 고정된 시간 상수에서 수행했다. 134 g/ℓ 소르비톨, 2.5 g/ℓ 효모 추출물 및 25 ㎎/ℓ 카나마이신을 함유하는 BHI-아가 상에서 형질전환된 세포를 선별했다.
뉴클레오티드 서열의 확인
DNA 분자의 뉴클레오티드 서열은 Sanger et al. (Proceedings of the National Academy of Sciences USA 74, 5463 - 5467, 1977) 의 디데옥시 사슬 종결 방법을 사용하여 사이클 시퀀싱에 의해 Eurofins Genomics GmbH (Ebersberg, Germany) 에 의해 확인되었다. Scientific & Educational Software (Denver, USA) 로부터의 Clonemanager Professional 9 소프트웨어를 사용하여 서열을 시각화하고 평가했다.
에스케리키아 콜라이 및 코리네박테리움 글루타미쿰 균주의 글리세롤 스톡
에스케리키아 콜라이- 및 코리네박테리움 글루타미쿰 균주의 장시간 저장을 위해 글리세롤 스톡을 제조했다. 선별된 에스케리키아 콜라이 클론을 2 g/ℓ 글루코스가 보충된 10 ㎖ LB 배지에서 배양했다. 선별된 코리네박테리움 글루타미쿰 클론을 2 g/ℓ 글루코스가 보충된 10 ㎖ 2배 농축된 BHI 배지에서 배양했다. 플라스미드 함유 에스케리키아 콜라이- 및 코리네박테리움 글루타미쿰 균주를 성장시키기 위한 배지에 25 ㎎/ℓ 카나마이신을 보충했다. 배지는 배플이 3 개인 100 ㎖ 에를렌마이어 플라스크에 함유되었다. 그것에 콜로니로부터 취한 세포의 루프를 접종했다. 배양물을 그 후 18 h 동안 30℃ 및 200 rpm 에서 인큐베이션했다. 상기 인큐베이션 기간 후에 1.2 ㎖ 85 % (v/v) 멸균 글리세롤을 배양물에 첨가했다. 얻어진 글리세롤 함유 세포 현탁액을 그 후 2 ㎖ 분량씩 앨리쿼트로 만들고, -80℃ 에서 저장했다.
밀리리터-규모 배양에서 GAA 생산
Duetz (2007) 에 따른 밀리리터-규모 배양 시스템을 사용하여 균주의 GAA-생산을 평가했다. 이 목적을 위해, 웰 마다 2.5 ㎖ 배지를 채운 EnzyScreen BV (Heemstede, Netherlands, Cat. No. CR1424) 로부터의 24-딥웰 마이크로플레이트 (24 웰 WDS 플레이트) 를 사용했다.
균주의 예비배양을 10 ㎖ 시드 배지 (SM) 에서 수행했다. 배지는 배플이 3 개인 100 ㎖ 에를렌마이어 플라스크에 함유되었다. 그것에 100 ㎕ 의 글리세롤 스톡 배양물을 접종하고, 배양물을 24 h 동안 30℃ 및 200 rpm 에서 인큐베이션했다. 시드 배지 (SM) 의 조성이 표 5 에 제시되어 있다.
표 5: 시드 배지 (SM)
상기 인큐베이션 기간 후에 예비배양물의 광학 밀도 OD600 를 확인했다. 0.1 의 OD600 까지 2.5 ㎖ 의 생산 배지 (PM) 를 접종하는데 필요한 부피를 예비배양물로부터 샘플채취하고, 원심분리하고 (8000 g 에서 1 분), 상청액을 폐기했다. 세포를 그 후 100 ㎕ 의 생산 배지에 재현탁시켰다.
24 웰 WDS-플레이트의 2.4 ㎖ 생산 배지 (PM) 함유 웰에 각각 예비배양물로부터의 재현탁된 세포 100 ㎕ 를 접종함으로써 주된 배양을 시작했다. 생산 배지 (PM) 의 조성이 표 6 에 제시되어 있다.
표 6: 생산 배지 (PM)
주된 배양물을 Infors GmbH (Bottmingen, Switzerland) 로부터의 Infors HT Multitron 표준 인큐베이터 셰이커에서 글루코스가 완전히 소모될 때까지 72 h 동안 30 ℃ 및 300 rpm 에서 인큐베이션했다. 현탁액 중의 글루코스 농도를 LifeScan (Johnson & Johnson Medical GmbH, Neuss, Germany) 로부터의 혈액 글루코스-미터 OneTouch Vita® 로 분석했다.
배양 후에 배양물 현탁액을 딥 웰 마이크로플레이트로 옮겼다. 배양물 현탁액의 일부를 OD660 을 측정하기 위해 적합하게 희석했다. 배양물의 또다른 일부를 원심분리하고, 상청액 중 GAA 의 농도를 하기와 같이 분석했다.
효모 펩톤 FM902 중 L-아르기닌 및 글라이신 함량의 확인
효모 추출물 FM902 (Angel Yeast Co.,LTD, Hubei, P.R.China) 는 다양한 펩티드 및 아미노산을 함유하므로, 그것의 L-아르기닌 및 글라이신 함량을 다음과 같이 측정했다.
유리 아미노산을 측정하기 위해서, 1 g 의 효모 추출물을 20 ㎖ 의 물에 용해시킴으로써 샘플을 제조했다. 용액에 전체 부피가 25 ㎖ 가 될 때까지 물을 채우고, 용액을 철저히 혼합하고, 0.2 μM 나일론 시린지 필터를 사용하여 여과했다.
전체 아미노산 (유리 아미노산 + 펩티드에 결합된 아미노산) 을 측정하기 위해, 10 ㎖ 6M HCl 에 1 g 효모 추출물을 용해시키고 24h 동안 110℃ 에서 인큐베이션하여 샘플을 제조했다. 그 후, 전체 부피가 25 ㎖ 가 될 때까지 물을 첨가했다. 용액을 철저히 혼합하고, 0.2 μM 나일론 시린지 필터를 사용하여 여과했다.
SYKAM Vertriebs GmbH (Fuerstenfeldbruck, Germany) 로부터의 SYKAM S433 아미노산 분석기를 사용하여 이온 교환 크로마토그래피에 의해 샘플 중의 L-아르기닌 및 글라이신의 농도를 확인했다. 고체 상으로서 SYKAM 로부터의 구형, 폴리스티렌계 양이온 교환기 (Peek LCA N04/Na, 치수 150 x 4.6 mm) 가 있는 칼럼을 사용했다. L-아미노산에 따라 용리를 위해 버퍼 A 및 B 의 혼합물을 사용하는 등용매 런 (run) 으로 또는 상기 버퍼를 사용하는 그래디언트 용리에 의해 분리를 수행한다. 버퍼 A 로서 20 ℓ 263 g 시트르산 삼나트륨, 120 g 시트르산, 1100 ㎖ 메탄올, 100 ㎖ 37 % HCl 및 2 ㎖ 옥탄산 (최종 pH 3.5) 을 함유하는 수용액을 사용했다. 버퍼 B 로서 20 ℓ 392 g 시트르산 삼나트륨, 100 g 붕산 및 2 ㎖ 옥탄산 (최종 pH 10.2) 을 함유하는 수용액을 사용했다. 유리 아미노산을 컬럼후 유도체화를 통해 닌히드린으로 염색하고 570 nm 에서 광도측정으로 검출했다.
표 7 은 효모 추출물 FM902 (Angel Yeast Co.,LTD, Hubei, P.R.China) 에서 확인된 유리 및 전체 L-아르기닌 및 글라이신의 함량, 뿐만 아니라 생산 배지 (PM) 에서의 결과적인 양을 보여준다.
표 7: 효모 추출물 (YE) FM902 에서의 L-아르기닌 및 글라이신의 함량 및 1.5 g/ℓ YE 을 함유하는 생산 배지 (PM) 에서의 결과적인 농도.
GAA 의 정량화
질량 분석기 "Triple Quad 6420" 와 커플링된 HPLC "Infinity 1260" 로 이루어지는 Agilent 로부터의 분석 시스템 (Agilent Technologies Inc., Santa Clara, USA) 으로 샘플을 분석했다. Atlantis HILIC Silica 칼럼, 4,6X250mm, 5μm (Waters Corporation, Milford, USA) 에서 35℃ 에서 크로마토그래피 분리를 수행했다. 이동상 A 는 10mM 암모늄 포르메이트 및 0,2% 포름산을 함유하는 물이었다. 이동상 B 는 90% 아세토니트릴 및 10 % 물의 혼합물이었고, 이 혼합물에 10 mM 암모늄 포르메이트를 첨가했다. HPLC 시스템을 100% B 로 시작했으며, 그 후 22 분 동안 0,6 mL/분의 일정한 유속으로 66% B 로의 선형 구배가 뒤따랐다. 질량 분석기를 ESI 양성 이온화 모드로 작동시켰다. GAA 의 검출을 위해 MRM 단편화 [M+H] + 118 - 76 를 사용하여 m/z 값을 모니터링했다. GAA 에 대한 정량화의 한계 (LOQ) 를 7 ppm 으로 고정했다.
B) 실험 결과
실시예 1: 아라비돕시스 탈리아나 (
Arabidopsis thaliana
) 로부터의 글리옥실레이트 아미노트랜스페라아제에 대해 코딩하는 유전자 GGT1 의 클로닝
아라비돕시스 탈리아나의 유전자 GGT1 (Genbank 접근 번호 NM_102180, SEQ ID NO:1) 는 글루타메이트:글리옥실레이트 아미노트랜스페라아제 (Genbank 접근 번호 NP_564192, SEQ ID NO:2) 에 대해 코딩한다. 이 단백질은 하기 반응을 촉진시키는 것으로 밝혀졌다: 글리옥실레이트 + L-알라닌 = 글라이신 + 피루베이트 (EC 2.6.1.44), 2-옥소글루타레이트 + L-알라닌 = L-글루타메이트 + 피루베이트 (EC 2.6.1.2), 및 2-옥소글루타레이트 + 글라이신 = 글리옥실레이트 + L-글루타메이트 (EC 2.6.1.4; Liepman AH, Olsen LJ., Plant Physiol. 2003 Jan;131(1):215-27. doi: 10.1104/pp.011460).
소프트웨어 툴 "Codon Optimization Tool" (Integrated DNA Technologies Inc., Coralville, Iowa, USA) 을 사용하여 GGT1 단백질의 아미노산 서열을 코리네박테리움 글루타미쿰의 코돈 사용법에 최적화된 DNA 서열로 역번역했다. Shine-Dalgarno-Sequenz 를 열린 해독틀 (AGGAAAGGAGAGGATTG; Shi F, Luan M, Li Y, AMB Express. 2018 Apr 18;8(1):61. doi: 10.1186/s13568-018-0595-2) 의 바로 상류에 첨가하고, 결과적인 서열의 말단을 후속적 서브클로닝을 위한 모티프로 확장시켰다. 결과적인 DNA 서열 AtGGT1_opt_RBS (SEQ ID NO:3) 을 유전자 합성을 위해 Eurofins Genomics GmbH (Ebersberg, Germany) 로부터 주문하고, 그것을 암피실린 내성을 부여하는 클로닝 플라스미드 (pEX-A258-AtGGT1_opt_RBS 로 명명됨) 의 일부로서 전달했다.
실시예 2: 아라비돕시스 탈리아나로부터의 글리옥실레이트 아미노트랜스페라아제에 대해 코딩하는 유전자 GGT2 의 클로닝
아라비돕시스 탈리아나의 유전자 AOAT2 (동의어: GGT2) (Genbank 접근 번호 NM_001036185, SEQ ID NO:4) 는 알라닌-2-옥소글루타레이트 아미노트랜스페라아제 2 (Genbank 접근 번호 NP_001031262, SEQ ID NO:5) 에 대해 코딩한다. 이 단백질은 하기 반응을 촉진시키는 것으로 밝혀졌다: 글리옥실레이트 + L-알라닌 = 글라이신 + 피루베이트 (EC 2.6.1.44), 2-옥소글루타레이트 + L-알라닌 = L-글루타메이트 + 피루베이트 (EC 2.6.1.2), 및 2-옥소글루타레이트 + 글라이신 = 글리옥실레이트 + L-글루타메이트 (EC 2.6.1.4; Liepman AH, Olsen LJ. (2003), Plant Physiol. 2003 Jan;131(1):215-27. doi: 10.1104/pp.011460).
소프트웨어 툴 "Codon Optimization Tool" (Integrated DNA Technologies Inc., Coralville, Iowa, USA) 을 사용하여 GGT2 단백질의 아미노산 서열을 코리네박테리움 글루타미쿰의 코돈 사용법에 최적화된 DNA 서열로 역번역했다. Shine-Dalgarno-Sequenz 를 열린 해독틀 (AGGAAAGGAGAGGATTG; Shi, 2018) 의 바로 상류에 첨가하고, 결과적인 서열의 말단을 후속적 서브클로닝을 위한 모티프로 확장시켰다. 결과적인 DNA 서열 AtGGT2_opt_RBS (SEQ ID NO:6) 을 유전자 합성을 위해 Eurofins Genomics GmbH (Ebersberg, Germany) 로부터 주문하고, 그것을 암피실린 내성을 부여하는 클로닝 플라스미드 (pEX-A258-AtGGT2_opt_RBS 로 명명됨) 의 일부로서 전달했다.
실시예 3: 테르모코쿠스 리토랄리스 (
Thermococcus litoralis
) 로부터의 글리옥실레이트 아미노트랜스페라아제에 대해 코딩하는 유전자 agt 의 클로닝
테르모코쿠스 리토랄리스의 유전자 agt (Genbank 접근 번호 AB033996, SEQ ID NO:7) 는 알라닌:글리옥실레이트 아미노트랜스페라아제 (Genbank 접근 번호 BAB40321, SEQ ID NO:8) 에 대해 코딩한다. 이 단백질은 하기 반응을 촉진시키는 것으로 밝혀졌다: 글리옥실레이트 + L-알라닌 = 글라이신 + 피루베이트 (EC 2.6.1.44) 및 글리옥실레이트 + L-세린 = 글라이신 + 3-히드록시피루베이트 (EC 2.6.1.45; Sakuraba, H. et al., J Bacteriol. 2004 Aug; 186(16): 5513-5518. doi: 10.1128/JB.186.16.5513-5518.2004).
소프트웨어 툴 "Codon Optimization Tool" (Integrated DNA Technologies Inc., Coralville, Iowa, USA) 을 사용하여 Agt 단백질의 아미노산 서열을 코리네박테리움 글루타미쿰의 코돈 사용법에 최적화된 DNA 서열로 역번역했다. Shine-Dalgarno-Sequenz 를 열린 해독틀 (AGGAAAGGAGAGGATTG; Shi F, Luan M, Li Y, AMB Express. 2018 Apr 18;8(1):61. doi: 10.1186/s13568-018-0595-2) 의 바로 상류에 첨가하고, 결과적인 서열의 말단을 후속적 서브클로닝을 위한 모티프로 확장시켰다. 결과적인 DNA 서열 (SEQ ID NO:9) 을 유전자 합성을 위해 Eurofins Genomics GmbH (Ebersberg, Germany) 로부터 주문하고, 그것을 암피실린 내성을 부여하는 클로닝 플라스미드 (pEX-A258-AGT_Tl_opt_RBS 로 명명됨) 의 일부로서 전달했다.
실시예 4: 무레아 프로두센스 (Moorea producens) 로부터의 L-아르기닌:글라이신 아미디노트랜스페라아제 (AGAT, EC 2.1.4.1) 에 대해 코딩하는 유전자 AGAT_Mp 의 클로닝
무레아 프로두센스는 사상 시아노박테리아이다. 무레아 프로두센스 균주 PAL-8-15-08-1 의 게놈은 Leao et al. (Leao T, Castelao G, Korobeynikov A, Monroe EA, Podell S, Glukhov E, Allen EE, Gerwick WH, Gerwick L, Proc Natl Acad Sci U S A. 2017 Mar 21;114(12):3198-3203. doi: 10.1073/pnas.1618556114; Genbank 접근 번호 CP017599.1) 에 의해 공개되었다. 그것은 추정상 L-아르기닌:글라이신 아미디노트랜스페라아제 (AGAT, EC 2.1.4.1; locus_tag BJP34_00300, SEQ ID NO:10 에 제시됨) 에 대해 코딩하는 열린 해독틀을 함유한다. SEQ ID NO:11 은 거기에서 유래하는 아미노산 서열 (Genbank 접근 번호 WP_070390602) 을 보여준다.
소프트웨어 툴 "GeneOptimizer" (Geneart/ThermoFisher Scientific, Waltham, USA) 을 사용하여 이 아미노산 서열을 코리네박테리움 글루타미쿰의 코돈 사용법에 최적화된 DNA 서열로 역번역했다. 그것의 말단을 어셈블리 클로닝을 위한 서열로 확장시키고, 열린 해독틀의 5 염기쌍 상류에 Shine-Dalgarno-Sequenz (AGGA) 를 부가했다. 결과적인 DNA 서열 (SEQ ID NO:12) 을 유전자 합성을 위해 Invitrogen/Geneart (Thermo Fisher Scientific, Waltham, USA) 로부터 구입하고, 그것을 클로닝 플라스미드 (pMA-T_AGAT_Mp 로 명명됨) 의 일부로서 전달했다.
실시예 5: 발현 플라스미드 pEC-XK99E 내로의 AGAT_Mp 의 클로닝
에스케리키아 콜라이-코리네박테리움 글루타미쿰 셔틀 플라스미드 pEC-XK99E (Genbank 접근 번호 AY219682) 를 제한 엔도뉴클레아제 SmaI 를 사용하여 소화시켰다. 말단 포스페이트를 "FastAP Thermosensitive Alkaline Phosphatase" (Thermo Fisher Scientific, Waltham, USA) 를 사용하여 제거했다. DNA 를 그 후 "QIAquick PCR Purification Kit" (Qiagen GmbH, Hilden, Germany) 로 정제했다.
클로닝 플라스미드 pMA-T_AGAT_Mp 를 MluI + AatII 로 소화시키고, 결과적인 단편을 "Fast DNA End Repair Kit" (Thermo Fisher Scientific, Waltham, USA) 을 사용하여 블런트 (blunt) 절단했다. 그들을 아가로스 겔 전기영동 (TAE 버퍼 중 0,8% 아가로스) 에 의해 분리하고, "AGAT_Mp" (1174 bp) 에 해당하는 밴드를 잘라냈다. 그것의 DNA 를 "QIAquick Gel Extraction Kit" (Qiagen GmbH, Hilden, Germany) 를 사용하여 정제했다.
AGAT_Mp 단편 및 선형화된 pEC-XK99E 를 "Ready-To-Go T4 DNA ligase" (GE Healthcare Europe GmbH, Freiburg, Germany) 를 사용하여 결찰시켰다. 결찰 산물을 "NEB Stable Competent E. coli (High Efficiency)" (New England Biolabs, Ipswich, USA) 내로 형질전환시키고, 25 ㎎/ℓ 카나마이신을 함유하는 LB 아가 상에서 세포를 성장시켰다. 적당한 클론을 제한 효소 소화 및 DNA 시퀀싱에 의해 식별했다. 결과적인 플라스미드를 pEC-XK99E_AGAT_Mp 로 명명했다.
실시예 6: 발현 플라스미드 pEC-XK99E_AGAT_Mp 내로의 글리옥실레이트 아미노트랜스페라아제 유전자의 클로닝
플라스미드 pEC-XK99E_AGAT_Mp 를 제한 엔도뉴클레아제 BamHI 를 사용하여 소화시키고, 말단 포스페이트를 "FastAP Thermosensitive Alkaline Phosphatase" (Thermo Fisher Scientific, Waltham, USA) 를 사용하여 제거했다. 소화된 DNA 를 그 후 "QIAquick Gel Extraction Kit" (Qiagen GmbH, Hilden, Germany) 를 사용하여 정제했다.
클로닝 플라스미드 pEX-A258-AtGGT1_opt_RBS, pEX-A258-AtGGT2_opt_RBS 및 pEX-A258-AGT_Tl_opt_RBS 를 각각 BamHI 및 BsaI 로 소화시켰다. 절단된 플라스미드를 "QIAquick PCR Purification Kit" (Qiagen GmbH, Hilden, Germany) 를 사용하여 정제했다.
소화된 pEC-XK99E_AGAT_Mp 를 "Ready-To-Go T4 DNA ligase" (GE Healthcare Europe GmbH, Freiburg, Germany) 를 사용하여 각각의 소화된 클로닝 플라스미드와 결찰시켰다. 결찰 산물을 "NEB Stable Competent E. coli (High Efficiency)" (New England Biolabs, Ipswich, USA) 내로 형질전환시키고, 25 ㎎/ℓ 카나마이신을 함유하는 LB 아가 상에서 세포를 성장시켰다. 적당한 클론을 제한 효소 소화 및 DNA 시퀀싱에 의해 식별했다. 결과적인 플라스미드가 표 8 에 제시되어 있다. 그들은 강 IPTG 유도성 trc-프로모터의 제어 하에 오페론 유사 구조에서 AGAT_Mp 유전자 및 당해 글리옥실레이트 아미노트랜스페라아제를 제공한다.
표 8: 유전자 발현에 사용된 에스케리키아 콜라이-코리네박테리움 글루타미쿰 셔틀 플라스미드.
실시예 7: ATCC13032 에서
carAB
오페론의 상류에 sod 프로모터의 염색체 삽입
L-아르기닌의 생산을 개선하기 위해서, 강 sod-프로모터를 ATCC13032 의 게놈 내로 carAB 오페론의 상류에 삽입했다. 그러므로, 플라스미드 pK18mobsacB_Psod-carAB 를 다음과 같이 구축했다. pK18mobsacB (Schaefer, A. et al., Gene. 1994 Jul 22;145(1):69-73. doi: 10.1016/0378-1119(94)90324-7) 를 EcoRI + HindIII 를 사용하여 절단하고, 선형화된 벡터 DNA (5670 bps) 를 아가로스 겔로부터 잘라냈다. "QIAquick PCR Purification Kit" (Qiagen GmbH, Hilden, Germany) 를 사용하여 DNA 를 추출했다.
인서트를 구축하기 위해서, 세 개의 DNA 단편을 하기 프라이머 쌍을 사용하여 PCR 에 의해 생성했다 (주형으로서 ATCC13032 의 게놈 DNA):
PsodcarAB-LA-F (SEQ ID NO:13) + PsodcarAB-LA-R (SEQ ID NO:14)
= 좌측 상동성 아암 (1025 bps)
PsodcarAB-F (SEQ ID NO:15) + PsodcarAB-R (SEQ ID NO:16)
= sod-프로모터 (250 bps)
PsodcarAB-RA-F SEQ ID NO:17) + PsodcarAB-RA-R (SEQ ID NO:18)
= 우측 상동성 아암 (944 bps)
DNA 산물을 "QIAquick PCR Purification Kit" (Qiagen GmbH, Hilden, Germany) 를 사용하여 정제했다. 선형화된 플라스미드 및 PCR 산물을 그 후 "NEBuilder HiFi DNA Assembly Cloning Kit" (New England BioLabs Inc., Ipswich, USA, Cat. No. E5520) 를 사용하여 조립했다. 적절한 플라스미드 클론을 제한 소화 및 DNA 시퀀싱에 의해 식별했다.
결과적인 플라스미드 pK18mobsacB_Psod-carAB 를 그 후 ATCC13032 내로 전기천공에 의해 형질전환시켰다. 염색체 통합 (제 1 재조합 이벤트로부터의 결과) 을 134 g/ℓ 소르비톨, 2.5 g/ℓ 효모 추출물 및 25 ㎎/ℓ 카나마이신이 보충된 BHI 아가 상에 플레이팅하여 선별했다. 아가 플레이트를 48 h 동안 33℃ 에서 인큐베이션했다.
개별 콜로니를 새로운 아가 플레이트 (25 ㎎/ℓ 카나마이신 함유) 상에 옮기고, 24 h 동안 33℃ 에서 인큐베이션했다. 이들 클론의 액체 배양물을 배플이 3 개인 100 ㎖ 에를렌마이어 플라스크에 함유된 10 ㎖ BHI 배지에서 24 h 동안 33℃ 에서 배양했다. 제 2 재조합 이벤트를 겪은 클론을 단리하기 위해서, 각각의 액체 배양물로부터 앨리쿼트를 취하고, 적합하게 희석하고, 10 % 사카로스가 보충된 BHI 아가 상에 플레이팅했다 (전형적으로 100 내지 200 ㎕). 이들 아가 플레이트를 48 h 동안 33℃ 에서 인큐베이션했다. 사카로스 함유 아가 플레이트 상에서 성장하는 콜로니를 그 후 카나마이신 민감도에 대해 조사했다. 이를 위해 이쑤시개를 사용하여 콜로니로부터 세포 물질을 제거하고, 그것을 25 ㎎/ℓ 카나마이신을 함유하는 BHI 아가 및 10 % 사카로스를 함유하는 BHI 아가 상에 옮겼다. 아가 플레이트를 60 h 동안 33℃ 에서 인큐베이션했다. 카나마이신에 민감하고 사카로스에 내성이 있는 것으로 입증된 클론을 PCR 및 DNA 시퀀싱에 의해 sod 프로모터의 적당한 통합에 대해 조사했다. 결과적인 균주를 ATCC13032_Psod-carAB 로 명명했다.
실시예 8:
코리네박테리움 글루타미쿰 ATCC13032_Psod-carAB 에서 유전자 aceB (NCgl2247) 의 염색체 결실.
글리옥실레이트에서 L-말레이트로의 대사 플럭스를 감소시키기 위해서, 말레이트 신타아제 (EC 2.3.3.9) 에 대해 코딩하는, 유전자 aceB (NCgl2247) 를 균주 ATCC13032_Psod-carAB 에서 결실시켰다.
그러므로, 플라스미드 pK18mobsacB_DaceB 를 다음과 같이 구축했다. 플라스미드 pK18mobsacB (Schaefer, 1994) 를 XbaI 를 사용하여 절단하고, 선형화된 벡터 DNA (5721 bps) 를 "QIAquick Gel Extraction Kit" (Qiagen GmbH, Hilden, Germany) 를 사용하여 정제했다.
인서트를 구축하기 위해서, 두 개의 DNA 단편을 하기 프라이머 쌍을 사용하여 PCR 에 의해 생성했다 (주형으로서 ATCC13032 의 게놈 DNA):
1f-aceB-D2_vec (SEQ ID NO:19) + 1r-aceB-D2_aceB (SEQ ID NO:20)
= 좌측 상동성 아암 (1065 bps)
2f-aceB-D2_aceB (SEQ ID NO:21) + 2r-aceB_D2_Vec (SEQ ID NO:22)
= 좌측 상동성 아암 (1080 bps)
DNA 산물을 "QIAquick PCR Purification Kit" (Qiagen GmbH, Hilden, Germany) 를 사용하여 정제했다. 선형화된 플라스미드 및 PCR 산물을 그 후 "NEBuilder HiFi DNA Assembly Cloning Kit" (New England BioLabs Inc., Ipswich, USA, Cat. No. E5520) 를 사용하여 조립했다. 결과적인 결실 벡터를 pK18mobsacB_DaceB 로 명명했다. 그것을 제한 효소 소화 및 DNA 시퀀싱에 의해 확인했다.
aceB 유전자를 결실시키기 위해서, pK18mobsacB_DaceB 를 ATCC13032_Psod-carAB 내로 전기천공에 의해 형질전환시켰다. 염색체 통합 (제 1 재조합 이벤트로부터의 결과) 을 134 g/ℓ 소르비톨, 2.5 g/ℓ 효모 추출물 및 25 ㎎/ℓ 카나마이신이 보충된 BHI 아가 상에 플레이팅하여 선별했다. 아가 플레이트를 48 h 동안 33℃ 에서 인큐베이션했다.
개별 콜로니를 새로운 아가 플레이트 (25 ㎎/ℓ 카나마이신 함유) 상에 옮기고, 24 h 동안 33℃ 에서 인큐베이션했다. 이들 클론의 액체 배양물을 배플이 3 개인 100 ㎖ 에를렌마이어 플라스크에 함유된 10 ㎖ BHI 배지에서 24 h 동안 33℃ 에서 배양했다. 제 2 재조합 이벤트를 겪은 클론을 단리하기 위해서, 각각의 액체 배양물로부터 앨리쿼트를 취하고, 적합하게 희석하고, 10 % 사카로스가 보충된 BHI 아가 상에 플레이팅했다 (전형적으로 100 내지 200 ㎕). 이들 아가 플레이트를 48 h 동안 33℃ 에서 인큐베이션했다. 사카로스 함유 아가 플레이트 상에서 성장하는 콜로니를 그 후 카나마이신 민감도에 대해 조사했다. 이를 위해 이쑤시개를 사용하여 콜로니로부터 세포 물질을 제거하고, 그것을 25 ㎎/ℓ 카나마이신을 함유하는 BHI 아가 및 10 % 사카로스를 함유하는 BHI 아가 상에 옮겼다. 아가 플레이트를 60 h 동안 33℃ 에서 인큐베이션했다. 카나마이신에 민감하고 사카로스에 내성이 있는 것으로 입증된 클론을 PCR 및 DNA 시퀀싱에 의해 sod 프로모터의 적당한 통합에 대해 조사했다. 결과적인 균주를 ATCC13032_Psod-carAB_DaceB 로 명명했다.
표 9: 균주의 목록
실시예 9:
다양한 발현 플라스미드에 의한 코리네박테리움 글루타미쿰 균주의 형질전환
하기 코리네박테리움 글루타미쿰 균주를 전기천공에 의해 플라스미드로 형질전환시켰다 (표 10). 플라스미드 함유 세포를 25 ㎎/ℓ 카나마이신으로 선별했다.
·
코리네박테리움 글루타미쿰 ATCC13032: 통상적으로 사용되는 야생형 균주 (Kinoshita et al., J. Gen. Appl. Microbiol. 1957; 3(3): 193-205)
·
코리네박테리움 글루타미쿰 ATCC13032_Psod-carAB: ATCC13032 에서 CarAB 의 상류에서 강 sod 프로모터의 염색체 통합으로 인해 L-아르기닌 생산 능력이 증가됨
·
코리네박테리움 글루타미쿰 ATCC13032_Psod-carAB_DaceB: ATCC13032 에서 aceB 유전자의 염색체 결실로 인해 말레이트 신타아제의 활성이 감소되고, CarAB 의 상류에서 강 sod 프로모터의 염색체 통합으로 인해 L-아르기닌 생산 능력이 증가됨
표 10: 플라스미드-함유 코리네박테리움 글루타미쿰 균주의 목록
실시예 10: GAA 생산에 대한 증가된 글리옥실레이트 아미노트랜스페라아제 활성의 영향.
GAA 생산에 대한 증가된 글리옥실레이트 아미노트랜스페라아제 효소 활성의 영향을 평가하기 위해서, 균주 ATCC13032/pEC-XK99E, ATCC13032/pEC-XK99E_AGAT_Mp, ATCC13032/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032/pEC-XK99E_AGAT_Mp_AtGGT2, 및 ATCC13032/pEC-XK99E_AGAT_Mp_AGT_Tl 를 Wouter Duetz 시스템에서 배양하고, 결과적인 GAA 역가를 확인했다. 생산 배지 (PM) 는 40 g/ℓ D-글루코스 및 1.90 g/ℓ L-아르기닌을 함유했으나, 부가적 글라이신은 함유하지 않았다.
표 11: 1.90 g/ℓ L-아르기닌의 존재 하에서의 GAA 생산에 대한 증가된 글리옥실레이트 아미노트랜스페라아제 효소 활성의 영향.
표 11 에 제시된 바와 같이, 균주 ATCC13032/pEC-XK99E 는 검출가능한 양의 GAA 을 생산하지 않았다.
균주 ATCC13032/pEC-XK99E_AGAT_Mp 는 효소 AGAT 활성을 제공하는 무레아 프로두센스로부터의 AGAT 에 대해 코딩하는 폴리뉴클레오티드를 갖는다. 그것은 122 ㎎/ℓ 의 GAA 를 생산했다.
균주 ATCC13032/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032/pEC-XK99E_AGAT_Mp_AtGGT2, 및 ATCC13032/pEC-XK99E_AGAT_Mp_AGT_Tl 는 효소 AGAT 활성 및 증가된 글리옥실레이트 아미노트랜스페라아제 효소 활성을 갖는다. 그들은 246 ㎎/ℓ, 255 ㎎/ℓ, 및 199 ㎎/ℓ 의 GAA 를 각각 생산했다.
본 발명자들은, 효소 AGAT 활성의 존재 하에서, 증가된 글리옥실레이트 아미노트랜스페라아제 효소 활성이 GAA 생산을 개선한다는 결론을 내렸다.
실시예 11:
GAA 생산에 대한 증가된 L-아르기닌 생산 능력과 조합된 증가된 글리옥실레이트 아미노트랜스페라아제 활성의 영향.
GAA 생산에 대한 증가된 L-아르기닌 생산 능력과 조합된 증가된 글리옥실레이트 아미노트랜스페라아제 활성의 영향을 평가하기 위해서, 균주 ATCC13032/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032/pEC-XK99E_AGAT_Mp_AtGGT2, ATCC13032/pEC-XK99E_AGAT_Mp_AGT_Tl, ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AtGGT2, 및 ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AGT_Tl 를 Wouter Duetz 시스템에서 배양하고, 결과적인 GAA 역가를 확인했다. 염색체 유전자 carA 및 carB 의 상류에 강 sod-프로모터의 삽입으로 인해, 마지막 세 개의 균주는 개선된 L-아르기닌 생산 능력을 갖는다. 생산 배지 (PM) 는 40 g/ℓ D-글루코스 및 1.90 g/ℓ L-아르기닌을 함유했으나, 부가적 글라이신은 함유하지 않았다.
표 12: 1.90 g/ℓ L-아르기닌의 존재 하에서의 GAA 생산에 대한 증가된 L-아르기닌 생산 능력과 조합된 증가된 글리옥실레이트 아미노트랜스페라아제 활성의 영향.
균주 ATCC13032/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032/pEC-XK99E_AGAT_Mp_AtGGT2, 및 ATCC13032/pEC-XK99E_AGAT_Mp_AGT_Tl 는 효소 AGAT 활성 및 증가된 글리옥실레이트 아미노트랜스페라아제 효소 활성을 갖는다. 표 12 에 제시된 바와 같이, 그들은 246 ㎎/ℓ, 255 ㎎/ℓ, 및 199 ㎎/ℓ 의 GAA 를 각각 생산했다.
균주 ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AtGGT2, 및 ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AGT_Tl 는 또한 효소 AGAT 활성 및 증가된 글리옥실레이트 아미노트랜스페라아제 효소 활성을 갖는다. 게다가, 그들은 증가된 L-아르기닌 생산 능력을 갖는다. 이들 균주는 325 ㎎/ℓ, 322 ㎎/ℓ, 및 316 ㎎/ℓ 의 GAA 를 각각 생산했다.
본 발명자들은, 효소 AGAT 활성의 존재 하에서, 증가된 글리옥실레이트 아미노트랜스페라아제 활성 및 증가된 L-아르기닌 생산 능력의 조합이 GAA 생산을 개선한다는 결론을 내렸다.
실시예 12: GAA 생산에 대한 증가된 글리옥실레이트 아미노트랜스페라아제 활성, 감소된 말레이트 신타아제 활성, 및 증가된 L-아르기닌 생산 능력의 조합된 영향.
GAA 생산에 대한 증가된 글리옥실레이트 아미노트랜스페라아제 활성, 감소된 말레이트 신타아제 활성, 및 증가된 L-아르기닌 생산 능력의 조합된 영향을 평가하기 위해서, 균주 ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AtGGT2, ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AGT_Tl, ATCC13032_Psod-carAB_DaceB/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032_Psod-carAB_DaceB/pEC-XK99E_AGAT_Mp_AtGGT2, 및 ATCC13032_Psod-carAB_DaceB/pEC-XK99E_AGAT_Mp_AGT_Tl 를 Wouter Duetz 시스템에서 배양하고, 결과적인 GAA 역가를 확인했다. aceB 유전자의 결실로 인해, 마지막 세 개의 균주는 감소된 말레이트 신타아제 활성을 갖는다. 생산 배지 (PM) 는 40 g/ℓ D-글루코스 및 1.90 g/ℓ L-아르기닌을 함유했으나, 부가적 글라이신은 함유하지 않았다.
표 13: 1.9 g/ℓ L-아르기닌의 존재 하에서의 GAA 생산에 대한 증가된 글리옥실레이트 아미노트랜스페라아제 활성, 감소된 말레이트 신타아제 활성, 및 증가된 L-아르기닌 생산 능력의 조합된 영향.
균주 ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AtGGT2, 및 ATCC13032_Psod-carAB/pEC-XK99E_AGAT_Mp_AGT_Tl 는 효소 AGAT 활성, 증가된 글리옥실레이트 아미노트랜스페라아제 효소 활성, 및 증가된 L-아르기닌 생산 능력을 갖는다. 표 13 에 제시된 바와 같이, 이들 균주는 325 ㎎/ℓ, 322 ㎎/ℓ, 및 316 ㎎/ℓ 의 GAA 를 각각 생산했다.
균주 ATCC13032_Psod-carAB_DaceB/pEC-XK99E_AGAT_Mp_AtGGT1, ATCC13032_Psod-carAB_DaceB/pEC-XK99E_AGAT_Mp_AtGGT2, 및 ATCC13032_Psod-carAB_DaceB/pEC-XK99E_AGAT_Mp_AGT_Tl 는 또한 효소 AGAT 활성, 증가된 글리옥실레이트 아미노트랜스페라아제 효소 활성, 및 증가된 L-아르기닌 생산 능력을 갖는다. 게다가, 그들은 감소된 말레이트 신타아제 효소 활성을 갖는다. 이들 균주는 362 ㎎/ℓ, 354 ㎎/ℓ, 및 331 ㎎/ℓ 의 GAA 를 각각 생산했다.
본 발명자들은 효소 AGAT 활성, 증가된 글리옥실레이트 아미노트랜스페라아제 활성, 감소된 말레이트 신타아제 활성, 및 증가된 L-아르기닌 생산 능력의 조합이 GAA 의 생산을 개선한다는 결론을 내렸다.
SEQUENCE LISTING
<110> Evonik Operations GmbH
<120> Method for the fermentative production of guanidinoacetic acid
<130> 201900349
<160> 23
<170> PatentIn version 3.5
<210> 1
<211> 2205
<212> DNA
<213> Arabidopsis thaliana
<220>
<221> CDS
<222> (425)..(1870)
<223> GGT1
<400> 1
ctcttcgtct ggaatctcca ccacattttt attctcttca aaaattatct gcttctattt 60
ttataattaa gcaagaacgg tcttcgtagc ataaaaacga gacacggata tagagatatc 120
gtgaattgac ttttgtctga caaatcctct tcgtcaattt cagtggctct gctgcttcct 180
ttgttgtgaa gccacataga ttagattgag gaatgatcca aactcatgtc atacacacat 240
ttgtaatctg ctacacaaaa tacttttaaa atcacacaca ctaatatttt aactctcccc 300
actctttgcc ttgcccttgg ctctagaacc gaacgtgact ctccagatag acttttggag 360
tcacaacatt gagtttgaag aggagggaag aagtgagcta gggattggtt cagagtgaac 420
ataa atg gct ctc aag gca tta gac tac gat act ctg aat gaa aac gtc 469
Met Ala Leu Lys Ala Leu Asp Tyr Asp Thr Leu Asn Glu Asn Val
1 5 10 15
aag aag tgt cag tat gcc gta aga ggt gaa ctt tat ctc cga gct tct 517
Lys Lys Cys Gln Tyr Ala Val Arg Gly Glu Leu Tyr Leu Arg Ala Ser
20 25 30
gag ctg cag aaa gaa ggc aaa aag att att ttc aca aac gtt ggg aac 565
Glu Leu Gln Lys Glu Gly Lys Lys Ile Ile Phe Thr Asn Val Gly Asn
35 40 45
cct cat gct tta gga cag aag cca ttg aca ttt cct cgc cag gtg gtt 613
Pro His Ala Leu Gly Gln Lys Pro Leu Thr Phe Pro Arg Gln Val Val
50 55 60
gcg ctt tgc caa gct ccg ttt cta cta gat gac cca aat gtt gga atg 661
Ala Leu Cys Gln Ala Pro Phe Leu Leu Asp Asp Pro Asn Val Gly Met
65 70 75
cta ttt cca gct gat gct att gca aga gct aaa cat tat ctt tcc ttg 709
Leu Phe Pro Ala Asp Ala Ile Ala Arg Ala Lys His Tyr Leu Ser Leu
80 85 90 95
act tca ggc ggt tta ggt gct tac agt gat tca aga ggc ctt cca gga 757
Thr Ser Gly Gly Leu Gly Ala Tyr Ser Asp Ser Arg Gly Leu Pro Gly
100 105 110
gtt agg aaa gag gtt gct gag ttc att caa cgg cgt gat ggg tat cca 805
Val Arg Lys Glu Val Ala Glu Phe Ile Gln Arg Arg Asp Gly Tyr Pro
115 120 125
agt gac cca gaa ctc atc ttt ctc act gat gga gct agc aaa ggt gtg 853
Ser Asp Pro Glu Leu Ile Phe Leu Thr Asp Gly Ala Ser Lys Gly Val
130 135 140
atg caa atc ttg aat tgt gtt ata cgc ggt aat gga gat ggg att cta 901
Met Gln Ile Leu Asn Cys Val Ile Arg Gly Asn Gly Asp Gly Ile Leu
145 150 155
gtt ccg gtt cca cag tat cca ctt tac tca gct acc ata tca ctg tta 949
Val Pro Val Pro Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Ser Leu Leu
160 165 170 175
ggt ggt act ctt gtt cct tac tat ctt gat gag tct gaa aac tgg gga 997
Gly Gly Thr Leu Val Pro Tyr Tyr Leu Asp Glu Ser Glu Asn Trp Gly
180 185 190
ctt gat gtt gct aac ctt cga caa tcc gtt gct cag gct cgt tct caa 1045
Leu Asp Val Ala Asn Leu Arg Gln Ser Val Ala Gln Ala Arg Ser Gln
195 200 205
ggg ata aca gta agg gca atg gtg atc att aac cct ggg aac cca act 1093
Gly Ile Thr Val Arg Ala Met Val Ile Ile Asn Pro Gly Asn Pro Thr
210 215 220
ggc cag tgt cta agc gaa gct aac ata aga gag ata ttg aag ttc tgt 1141
Gly Gln Cys Leu Ser Glu Ala Asn Ile Arg Glu Ile Leu Lys Phe Cys
225 230 235
tat aac gag aaa ctg gtt ctt ctg gga gac gag gtt tat cag cag aac 1189
Tyr Asn Glu Lys Leu Val Leu Leu Gly Asp Glu Val Tyr Gln Gln Asn
240 245 250 255
ata tac cag gat gag cgt ccc ttt atc agc tcc aag aag gtt ttg atg 1237
Ile Tyr Gln Asp Glu Arg Pro Phe Ile Ser Ser Lys Lys Val Leu Met
260 265 270
gaa atg ggt tcg ccg ttc agc aag gaa gtt cag ctt gta tct ttt cac 1285
Glu Met Gly Ser Pro Phe Ser Lys Glu Val Gln Leu Val Ser Phe His
275 280 285
aca gtc tct aaa gga tat tgg ggt gaa tgt gga cag cga ggt gga tac 1333
Thr Val Ser Lys Gly Tyr Trp Gly Glu Cys Gly Gln Arg Gly Gly Tyr
290 295 300
ttt gag atg acc aac ctc cct cca agg gtt gtt gag gag ata tac aag 1381
Phe Glu Met Thr Asn Leu Pro Pro Arg Val Val Glu Glu Ile Tyr Lys
305 310 315
gtt gca tca att gcc ctc agc cct aat gtc tct gcg caa atc ttt atg 1429
Val Ala Ser Ile Ala Leu Ser Pro Asn Val Ser Ala Gln Ile Phe Met
320 325 330 335
ggt ttg atg gtt aat cct cca aag cct gga gac att tca tat gac cag 1477
Gly Leu Met Val Asn Pro Pro Lys Pro Gly Asp Ile Ser Tyr Asp Gln
340 345 350
ttc gcc cgt gaa agc aag ggg att ctt gaa tct ttg aga aga aga gca 1525
Phe Ala Arg Glu Ser Lys Gly Ile Leu Glu Ser Leu Arg Arg Arg Ala
355 360 365
agg ctc atg aca gat gga ttc aac agc tgc aaa aac gtc gtg tgc aat 1573
Arg Leu Met Thr Asp Gly Phe Asn Ser Cys Lys Asn Val Val Cys Asn
370 375 380
ttc aca gaa ggt gca atg tat tcg ttt cct caa ata cgg tta cca acg 1621
Phe Thr Glu Gly Ala Met Tyr Ser Phe Pro Gln Ile Arg Leu Pro Thr
385 390 395
gga gct ctc caa gct gca aaa caa gct gga aaa gtg cca gac gtt ttc 1669
Gly Ala Leu Gln Ala Ala Lys Gln Ala Gly Lys Val Pro Asp Val Phe
400 405 410 415
tac tgt ctc aag ctc tta gaa gcc aca gga atc tcc aca gta cct ggc 1717
Tyr Cys Leu Lys Leu Leu Glu Ala Thr Gly Ile Ser Thr Val Pro Gly
420 425 430
tct gga ttt gga cag aaa gaa ggt gtg ttc cat ctg agg aca aca atc 1765
Ser Gly Phe Gly Gln Lys Glu Gly Val Phe His Leu Arg Thr Thr Ile
435 440 445
ctg cca gca gaa gat gag atg ccg gag atc atg gat agc ttc aag aag 1813
Leu Pro Ala Glu Asp Glu Met Pro Glu Ile Met Asp Ser Phe Lys Lys
450 455 460
ttc aac gac gag ttc atg act cag tat gat aat aac ttt ggt tat tcg 1861
Phe Asn Asp Glu Phe Met Thr Gln Tyr Asp Asn Asn Phe Gly Tyr Ser
465 470 475
aaa atg tga ttacttcttc ttctgaacga ctattgtgtt ctgctacact 1910
Lys Met
480
ctttaaagct aaatctctgt agtacactct ttctctttgc cctattctat aaaccatatc 1970
tctctctttg tgtctctttt ttttgggtgt aaactctctc ttgtgtctct atttctattt 2030
tcaattggaa actgattaag atcttttctc aatgaaatga agtttaggcc atagattatt 2090
ttttttaatc aacggtgata gccttttttt agtgtggcaa tgtgaaattt gtaattatgc 2150
taattatatt aaagaaaata ataataatcc atgtcctagt ttgtttttga ttatg 2205
<210> 2
<211> 481
<212> PRT
<213> Arabidopsis thaliana
<400> 2
Met Ala Leu Lys Ala Leu Asp Tyr Asp Thr Leu Asn Glu Asn Val Lys
1 5 10 15
Lys Cys Gln Tyr Ala Val Arg Gly Glu Leu Tyr Leu Arg Ala Ser Glu
20 25 30
Leu Gln Lys Glu Gly Lys Lys Ile Ile Phe Thr Asn Val Gly Asn Pro
35 40 45
His Ala Leu Gly Gln Lys Pro Leu Thr Phe Pro Arg Gln Val Val Ala
50 55 60
Leu Cys Gln Ala Pro Phe Leu Leu Asp Asp Pro Asn Val Gly Met Leu
65 70 75 80
Phe Pro Ala Asp Ala Ile Ala Arg Ala Lys His Tyr Leu Ser Leu Thr
85 90 95
Ser Gly Gly Leu Gly Ala Tyr Ser Asp Ser Arg Gly Leu Pro Gly Val
100 105 110
Arg Lys Glu Val Ala Glu Phe Ile Gln Arg Arg Asp Gly Tyr Pro Ser
115 120 125
Asp Pro Glu Leu Ile Phe Leu Thr Asp Gly Ala Ser Lys Gly Val Met
130 135 140
Gln Ile Leu Asn Cys Val Ile Arg Gly Asn Gly Asp Gly Ile Leu Val
145 150 155 160
Pro Val Pro Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Ser Leu Leu Gly
165 170 175
Gly Thr Leu Val Pro Tyr Tyr Leu Asp Glu Ser Glu Asn Trp Gly Leu
180 185 190
Asp Val Ala Asn Leu Arg Gln Ser Val Ala Gln Ala Arg Ser Gln Gly
195 200 205
Ile Thr Val Arg Ala Met Val Ile Ile Asn Pro Gly Asn Pro Thr Gly
210 215 220
Gln Cys Leu Ser Glu Ala Asn Ile Arg Glu Ile Leu Lys Phe Cys Tyr
225 230 235 240
Asn Glu Lys Leu Val Leu Leu Gly Asp Glu Val Tyr Gln Gln Asn Ile
245 250 255
Tyr Gln Asp Glu Arg Pro Phe Ile Ser Ser Lys Lys Val Leu Met Glu
260 265 270
Met Gly Ser Pro Phe Ser Lys Glu Val Gln Leu Val Ser Phe His Thr
275 280 285
Val Ser Lys Gly Tyr Trp Gly Glu Cys Gly Gln Arg Gly Gly Tyr Phe
290 295 300
Glu Met Thr Asn Leu Pro Pro Arg Val Val Glu Glu Ile Tyr Lys Val
305 310 315 320
Ala Ser Ile Ala Leu Ser Pro Asn Val Ser Ala Gln Ile Phe Met Gly
325 330 335
Leu Met Val Asn Pro Pro Lys Pro Gly Asp Ile Ser Tyr Asp Gln Phe
340 345 350
Ala Arg Glu Ser Lys Gly Ile Leu Glu Ser Leu Arg Arg Arg Ala Arg
355 360 365
Leu Met Thr Asp Gly Phe Asn Ser Cys Lys Asn Val Val Cys Asn Phe
370 375 380
Thr Glu Gly Ala Met Tyr Ser Phe Pro Gln Ile Arg Leu Pro Thr Gly
385 390 395 400
Ala Leu Gln Ala Ala Lys Gln Ala Gly Lys Val Pro Asp Val Phe Tyr
405 410 415
Cys Leu Lys Leu Leu Glu Ala Thr Gly Ile Ser Thr Val Pro Gly Ser
420 425 430
Gly Phe Gly Gln Lys Glu Gly Val Phe His Leu Arg Thr Thr Ile Leu
435 440 445
Pro Ala Glu Asp Glu Met Pro Glu Ile Met Asp Ser Phe Lys Lys Phe
450 455 460
Asn Asp Glu Phe Met Thr Gln Tyr Asp Asn Asn Phe Gly Tyr Ser Lys
465 470 475 480
Met
<210> 3
<211> 1560
<212> DNA
<213> synthetic DNA
<400> 3
ggtctcccaa gcttgcatgc ctgcaggtcg actctagagg atccgacgtc aggaaaggag 60
aggattgatg gcgctgaagg ccctcgatta cgacacgctg aatgagaacg tcaaaaaatg 120
ccaatatgct gtgcggggcg agttgtatct tcgtgcctcc gagctgcaaa aagagggcaa 180
aaagattatt ttcaccaacg taggaaatcc tcacgccttg ggccagaagc cacttacgtt 240
cccgcggcaa gttgttgcgc tttgccaagc accattcctg ctggatgatc ctaacgtagg 300
tatgttgttc ccggctgacg cgattgcccg ggctaagcat tacctgtctc tgacttcggg 360
tggtcttggc gcttactcgg attcacgcgg cttgccaggt gtccggaaag aggtggctga 420
gtttattcaa cggcgggacg gctacccatc agaccctgaa ctcatctttc ttacggatgg 480
tgcttctaaa ggtgtaatgc aaattctcaa ctgtgtgatt cgcggtaatg gagatggtat 540
ccttgtcccg gtcccacagt atccactgta ctccgcgact atttctcttc tcggcggaac 600
gctggttccg tattatttgg acgaatcgga gaattggggc ctcgacgtag ccaaccttcg 660
tcagagcgtc gcacaggcgc gttcacaagg catcactgtc cgggcgatgg ttattattaa 720
cccgggaaac ccgactggac aatgcttgag cgaagcaaat attcgtgaga tccttaaatt 780
ttgctacaac gagaagctgg tactcctcgg agatgaggtt taccaacaaa acatttatca 840
ggatgaacgg ccttttatct cgtcaaagaa ggtactgatg gagatgggtt ctcctttcag 900
caaagaagta cagctggtca gcttccatac tgtctctaag ggttattggg gtgaatgtgg 960
ccagcgcggc ggctacttcg aaatgactaa cctcccccct cgcgtcgtgg aagagatcta 1020
taaggttgca tctattgctt tgtcgcccaa cgtatcggcc cagatcttta tgggactgat 1080
ggtaaacccc cctaaacctg gagacattag ctacgaccag ttcgcgcgtg aatctaaggg 1140
tatccttgaa tcccttcgtc gccgcgcgcg tctgatgact gacggattca attcatgtaa 1200
gaacgtagta tgcaacttca cggaaggcgc gatgtactct ttcccccaga tccgtcttcc 1260
aaccggtgca ctccaggctg ctaagcaggc gggaaaggtg cccgatgtgt tttattgtct 1320
caaattgttg gaggcgaccg gcatctccac tgttccaggc agcggctttg gacagaagga 1380
gggagttttt catctgcgta cgactatcct tcctgccgag gatgagatgc ctgaaattat 1440
ggattctttc aagaagttta acgacgagtt catgactcaa tatgacaata atttcggata 1500
ctccaaaatg taataaggat ccccgggtac cgagctcgaa ttcactggcc gtcggagacc 1560
<210> 4
<211> 1817
<212> DNA
<213> Arabidopsis thaliana
<220>
<221> CDS
<222> (148)..(1593)
<223> GGT2
<400> 4
ataaaaaacc aatctttatg atcgactcaa taagtcaaat cttgttgtgt taagtgaaat 60
ctatagtagt gaaagggtct ccacttagct gtttgagggg aagtgaggaa tcattttgct 120
tttagctttg aaaagtaaat cctggaa atg tct ctc aag gcg tta gac tac gag 174
Met Ser Leu Lys Ala Leu Asp Tyr Glu
1 5
tcc ttg aat gaa aac gtg aag aat tgt cag tat gca gtc aga ggt gaa 222
Ser Leu Asn Glu Asn Val Lys Asn Cys Gln Tyr Ala Val Arg Gly Glu
10 15 20 25
ctt tat ctt cgt gct tct gag ctt cag aaa gaa ggc aaa aag att att 270
Leu Tyr Leu Arg Ala Ser Glu Leu Gln Lys Glu Gly Lys Lys Ile Ile
30 35 40
ttc aca aat gtt gga aac cct cat gct tta gga cag aaa cct ctg act 318
Phe Thr Asn Val Gly Asn Pro His Ala Leu Gly Gln Lys Pro Leu Thr
45 50 55
ttt cct cgt cag gtg gtt tct tta tgc caa gca cca ttt ctg tta gat 366
Phe Pro Arg Gln Val Val Ser Leu Cys Gln Ala Pro Phe Leu Leu Asp
60 65 70
gat cca aat gtt ggt atg ata ttc cca gca gat gct att gca aga gct 414
Asp Pro Asn Val Gly Met Ile Phe Pro Ala Asp Ala Ile Ala Arg Ala
75 80 85
aag cat tat ctt tcc ttg act tct ggt ggt ctt ggt gct tac agt gac 462
Lys His Tyr Leu Ser Leu Thr Ser Gly Gly Leu Gly Ala Tyr Ser Asp
90 95 100 105
tca aga ggt ctt ccg gga gtt cgg aaa gaa gtc gct gag ttc att gaa 510
Ser Arg Gly Leu Pro Gly Val Arg Lys Glu Val Ala Glu Phe Ile Glu
110 115 120
cgg cgt gat gga tat cca agc gat cca gaa ctc ata ttt cta act gat 558
Arg Arg Asp Gly Tyr Pro Ser Asp Pro Glu Leu Ile Phe Leu Thr Asp
125 130 135
gga gcg agc aaa ggt gtg atg caa atc ttg aat tgt gtc ata cgc ggt 606
Gly Ala Ser Lys Gly Val Met Gln Ile Leu Asn Cys Val Ile Arg Gly
140 145 150
cag aaa gac gga att ctg gtt cca gtt cca cag tat cca ctc tac tcg 654
Gln Lys Asp Gly Ile Leu Val Pro Val Pro Gln Tyr Pro Leu Tyr Ser
155 160 165
gct act ata tct ctg tta ggt ggt act ctt gtt cct tac tat ctt gaa 702
Ala Thr Ile Ser Leu Leu Gly Gly Thr Leu Val Pro Tyr Tyr Leu Glu
170 175 180 185
gag tct gaa aac tgg gga ctt gat gtt aac aac ctt cgc caa tct gtt 750
Glu Ser Glu Asn Trp Gly Leu Asp Val Asn Asn Leu Arg Gln Ser Val
190 195 200
gct caa gct cgc tct caa gga ata aca gta agg gca atg gtg att att 798
Ala Gln Ala Arg Ser Gln Gly Ile Thr Val Arg Ala Met Val Ile Ile
205 210 215
aac ccc gga aac cca act ggc cag tgt ctt agc gaa gct aac ata aga 846
Asn Pro Gly Asn Pro Thr Gly Gln Cys Leu Ser Glu Ala Asn Ile Arg
220 225 230
gag ata cta cgg ttc tgt tgt gat gag aga tta gtt ctt ctc gga gac 894
Glu Ile Leu Arg Phe Cys Cys Asp Glu Arg Leu Val Leu Leu Gly Asp
235 240 245
gaa gtg tat cag caa aat ata tac caa gat gaa cgt ccc ttt atc agt 942
Glu Val Tyr Gln Gln Asn Ile Tyr Gln Asp Glu Arg Pro Phe Ile Ser
250 255 260 265
tcc aag aag gtt ttg atg gat atg gga gca ccg atc agc aag gaa gtt 990
Ser Lys Lys Val Leu Met Asp Met Gly Ala Pro Ile Ser Lys Glu Val
270 275 280
cag ctc ata tct ttc cac acc gtt tcc aaa gga tac tgg ggc gaa tgt 1038
Gln Leu Ile Ser Phe His Thr Val Ser Lys Gly Tyr Trp Gly Glu Cys
285 290 295
ggg caa cgg gga ggt tac ttt gag atg aca aat atc cct ccc agg acc 1086
Gly Gln Arg Gly Gly Tyr Phe Glu Met Thr Asn Ile Pro Pro Arg Thr
300 305 310
gtt gag gag ata tac aag gtg gcc tct ata gct ctc agc ccc aac gtc 1134
Val Glu Glu Ile Tyr Lys Val Ala Ser Ile Ala Leu Ser Pro Asn Val
315 320 325
tct gcg cag ata ttt atg ggt tta atg gtt agc cca cca aag cct gga 1182
Ser Ala Gln Ile Phe Met Gly Leu Met Val Ser Pro Pro Lys Pro Gly
330 335 340 345
gac att tca tat gac caa ttc gtt cgt gag agc aag gga ata cta gaa 1230
Asp Ile Ser Tyr Asp Gln Phe Val Arg Glu Ser Lys Gly Ile Leu Glu
350 355 360
tca ctg aga aga aga gca agg atg atg act gat gga ttc aac agc tgc 1278
Ser Leu Arg Arg Arg Ala Arg Met Met Thr Asp Gly Phe Asn Ser Cys
365 370 375
aaa aac gtc gtc tgt aat ttc aca gaa ggt gct atg tat tca ttc cct 1326
Lys Asn Val Val Cys Asn Phe Thr Glu Gly Ala Met Tyr Ser Phe Pro
380 385 390
caa ata aag ttg ccg tcg aaa gca atc caa gca gca aaa caa gcc gga 1374
Gln Ile Lys Leu Pro Ser Lys Ala Ile Gln Ala Ala Lys Gln Ala Gly
395 400 405
aaa gtc cct gac gtt ttc tac tgc ctt aag ctc tta gaa gcc aca gga 1422
Lys Val Pro Asp Val Phe Tyr Cys Leu Lys Leu Leu Glu Ala Thr Gly
410 415 420 425
atc tcc aca gtt cca ggc tct gga ttt gga caa aaa gaa ggg gtg ttt 1470
Ile Ser Thr Val Pro Gly Ser Gly Phe Gly Gln Lys Glu Gly Val Phe
430 435 440
cat tta agg aca aca att ctg cca gca gaa gaa gaa atg cca gag att 1518
His Leu Arg Thr Thr Ile Leu Pro Ala Glu Glu Glu Met Pro Glu Ile
445 450 455
atg gac agt ttc aaa aag ttc aat gat gag ttt atg tct cag tac gct 1566
Met Asp Ser Phe Lys Lys Phe Asn Asp Glu Phe Met Ser Gln Tyr Ala
460 465 470
gat aac ttt ggt tac tcc aga atg tga aaaagaaagg acttagagtc 1613
Asp Asn Phe Gly Tyr Ser Arg Met
475 480
agagtcagag atcacttctt cttctttcac gacattatta ttgtctattc acactcttaa 1673
aaagcaataa gtactggtcc tactctgtgt caaactcttc ttggtgctct taaaaccttt 1733
gtatctattg ttaccaattt gtgtgactca cacacacaca cacacaaatc tctaatgttc 1793
aattatatgg taaatggttt attt 1817
<210> 5
<211> 481
<212> PRT
<213> Arabidopsis thaliana
<400> 5
Met Ser Leu Lys Ala Leu Asp Tyr Glu Ser Leu Asn Glu Asn Val Lys
1 5 10 15
Asn Cys Gln Tyr Ala Val Arg Gly Glu Leu Tyr Leu Arg Ala Ser Glu
20 25 30
Leu Gln Lys Glu Gly Lys Lys Ile Ile Phe Thr Asn Val Gly Asn Pro
35 40 45
His Ala Leu Gly Gln Lys Pro Leu Thr Phe Pro Arg Gln Val Val Ser
50 55 60
Leu Cys Gln Ala Pro Phe Leu Leu Asp Asp Pro Asn Val Gly Met Ile
65 70 75 80
Phe Pro Ala Asp Ala Ile Ala Arg Ala Lys His Tyr Leu Ser Leu Thr
85 90 95
Ser Gly Gly Leu Gly Ala Tyr Ser Asp Ser Arg Gly Leu Pro Gly Val
100 105 110
Arg Lys Glu Val Ala Glu Phe Ile Glu Arg Arg Asp Gly Tyr Pro Ser
115 120 125
Asp Pro Glu Leu Ile Phe Leu Thr Asp Gly Ala Ser Lys Gly Val Met
130 135 140
Gln Ile Leu Asn Cys Val Ile Arg Gly Gln Lys Asp Gly Ile Leu Val
145 150 155 160
Pro Val Pro Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Ser Leu Leu Gly
165 170 175
Gly Thr Leu Val Pro Tyr Tyr Leu Glu Glu Ser Glu Asn Trp Gly Leu
180 185 190
Asp Val Asn Asn Leu Arg Gln Ser Val Ala Gln Ala Arg Ser Gln Gly
195 200 205
Ile Thr Val Arg Ala Met Val Ile Ile Asn Pro Gly Asn Pro Thr Gly
210 215 220
Gln Cys Leu Ser Glu Ala Asn Ile Arg Glu Ile Leu Arg Phe Cys Cys
225 230 235 240
Asp Glu Arg Leu Val Leu Leu Gly Asp Glu Val Tyr Gln Gln Asn Ile
245 250 255
Tyr Gln Asp Glu Arg Pro Phe Ile Ser Ser Lys Lys Val Leu Met Asp
260 265 270
Met Gly Ala Pro Ile Ser Lys Glu Val Gln Leu Ile Ser Phe His Thr
275 280 285
Val Ser Lys Gly Tyr Trp Gly Glu Cys Gly Gln Arg Gly Gly Tyr Phe
290 295 300
Glu Met Thr Asn Ile Pro Pro Arg Thr Val Glu Glu Ile Tyr Lys Val
305 310 315 320
Ala Ser Ile Ala Leu Ser Pro Asn Val Ser Ala Gln Ile Phe Met Gly
325 330 335
Leu Met Val Ser Pro Pro Lys Pro Gly Asp Ile Ser Tyr Asp Gln Phe
340 345 350
Val Arg Glu Ser Lys Gly Ile Leu Glu Ser Leu Arg Arg Arg Ala Arg
355 360 365
Met Met Thr Asp Gly Phe Asn Ser Cys Lys Asn Val Val Cys Asn Phe
370 375 380
Thr Glu Gly Ala Met Tyr Ser Phe Pro Gln Ile Lys Leu Pro Ser Lys
385 390 395 400
Ala Ile Gln Ala Ala Lys Gln Ala Gly Lys Val Pro Asp Val Phe Tyr
405 410 415
Cys Leu Lys Leu Leu Glu Ala Thr Gly Ile Ser Thr Val Pro Gly Ser
420 425 430
Gly Phe Gly Gln Lys Glu Gly Val Phe His Leu Arg Thr Thr Ile Leu
435 440 445
Pro Ala Glu Glu Glu Met Pro Glu Ile Met Asp Ser Phe Lys Lys Phe
450 455 460
Asn Asp Glu Phe Met Ser Gln Tyr Ala Asp Asn Phe Gly Tyr Ser Arg
465 470 475 480
Met
<210> 6
<211> 1560
<212> DNA
<213> synthetic DNA
<400> 6
ggtctcccaa gcttgcatgc ctgcaggtcg actctagagg atccgacgtc aggaaaggag 60
aggattgatg tccctcaagg ctttggacta cgaatctttg aacgaaaacg ttaaaaattg 120
tcagtatgcg gtccggggtg aactctatct gcgtgcttcc gagttgcaaa aagagggtaa 180
aaaaatcatt tttactaacg tcggaaaccc acacgcattg ggacagaagc cacttacctt 240
tccacggcaa gttgtgtcgc tctgtcaggc tccttttttg ttggacgacc ccaacgtagg 300
tatgatcttt ccggcagatg ccatcgcccg ggcgaagcat tatttgtcac ttacctcggg 360
tggactcgga gcatattctg attcgcgggg actcccaggt gtacgtaaag aagtcgccga 420
gttcattgaa cgccgtgatg gctacccctc cgatccggaa ctcatttttc ttacggacgg 480
agcgtcgaaa ggagttatgc aaattctcaa ctgtgtgatt cgcggccaga aggatggtat 540
tctggtgcca gttccgcaat accctctgta ttccgcaact atttcgctcc tcggtggaac 600
gcttgtcccc tattatttgg aggagtccga gaattggggc ctcgacgtaa ataatctgcg 660
gcaatccgtt gctcaggccc ggtcgcaggg aattactgtt cgtgcgatgg tcatcatcaa 720
tcccggcaac ccgactggac aatgcctgtc cgaggctaac attcgcgaga ttctccgttt 780
ttgctgtgac gaacggttgg ttttgcttgg agatgaagtt tatcaacaaa atatttatca 840
ggacgagcgg ccattcatca gctcaaagaa ggtattgatg gatatgggcg ctccaattag 900
caaggaggtc cagcttatct catttcacac tgtttcgaag ggctactggg gcgaatgcgg 960
tcagcggggt ggttacttcg aaatgacgaa tatcccccca cgtaccgtgg aagagattta 1020
taaggttgcc tcgattgcac tttcgccaaa cgtatccgcg cagattttta tgggcctgat 1080
ggtatctccc ccaaagcccg gtgacatttc ctacgatcaa ttcgtgcggg aatcaaaagg 1140
aattcttgaa tcattgcgcc ggcgcgcccg tatgatgact gatggcttca atagctgcaa 1200
aaacgttgta tgcaacttta ccgagggtgc aatgtattct ttccctcaga ttaagctccc 1260
ttcgaaggct atccaggcgg cgaagcaagc gggaaaagtg ccagatgtct tttactgcct 1320
caaactgctg gaagcgaccg gaatctccac ggtcccgggc tctggattcg gccaaaagga 1380
aggagtattt catctccgga ctaccattct gccggccgag gaagaaatgc cagagatcat 1440
ggacagcttc aaaaaattca atgacgaatt tatgtcgcag tatgccgata acttcggcta 1500
ttcgcggatg taataaggat ccccgggtac cgagctcgaa ttcactggcc gtcggagacc 1560
<210> 7
<211> 2406
<212> DNA
<213> Thermococcus litoralis
<220>
<221> CDS
<222> (196)..(1419)
<223> AGT
<400> 7
tctagaagca ctccccgtgg aggtgccttc ggatctttcc agagttctat ttcatagaat 60
ttctcaatca tcttaattcc attttccgga atttgtcgtg ttataaacac cttgggcttc 120
atggtatttc cccttctaag ataatggtca aaacgtataa atatctttat gaagattagt 180
taatggtgat gttga atg gat tac aca aaa tac cta gcc gga agg gcg aat 231
Met Asp Tyr Thr Lys Tyr Leu Ala Gly Arg Ala Asn
1 5 10
tgg att aag ggc tca gct ttg gct gat gtg atg aaa aag gct tca gaa 279
Trp Ile Lys Gly Ser Ala Leu Ala Asp Val Met Lys Lys Ala Ser Glu
15 20 25
ctc caa aag aaa ggg gta aag cta att tct ctc gca gct gga gat cca 327
Leu Gln Lys Lys Gly Val Lys Leu Ile Ser Leu Ala Ala Gly Asp Pro
30 35 40
gat ccg gag tta att cca aga gct gtt ctt ggg gaa ata gca aaa gaa 375
Asp Pro Glu Leu Ile Pro Arg Ala Val Leu Gly Glu Ile Ala Lys Glu
45 50 55 60
gtt ctt gaa aag gaa cca aaa tcc gtt atg tat act ccg gca aat gga 423
Val Leu Glu Lys Glu Pro Lys Ser Val Met Tyr Thr Pro Ala Asn Gly
65 70 75
atc ccg gag ctt agg gaa gag ctg gca gca ttc ttg aaa aaa tac gac 471
Ile Pro Glu Leu Arg Glu Glu Leu Ala Ala Phe Leu Lys Lys Tyr Asp
80 85 90
cat tta gaa gtt tct cca gaa aac att gtt att aca ata gga gga acg 519
His Leu Glu Val Ser Pro Glu Asn Ile Val Ile Thr Ile Gly Gly Thr
95 100 105
gga gca ttg gat ctt ctt gga agg gtt ttg ata gac cct gga gat gtc 567
Gly Ala Leu Asp Leu Leu Gly Arg Val Leu Ile Asp Pro Gly Asp Val
110 115 120
gtg ata aca gag aac cca tcg tac ata aac aca tta ttg gca ttt gaa 615
Val Ile Thr Glu Asn Pro Ser Tyr Ile Asn Thr Leu Leu Ala Phe Glu
125 130 135 140
cag ttg gga gcc aaa att gag ggg gtt cca gtt gat aac gat ggg atg 663
Gln Leu Gly Ala Lys Ile Glu Gly Val Pro Val Asp Asn Asp Gly Met
145 150 155
agg gtt gat ctg ttg gag gag aaa ata aag gag ctt aaa gct aaa gga 711
Arg Val Asp Leu Leu Glu Glu Lys Ile Lys Glu Leu Lys Ala Lys Gly
160 165 170
cag aaa gtt aag ctg atc tac acc atc ccg act ggt cag aat cca atg 759
Gln Lys Val Lys Leu Ile Tyr Thr Ile Pro Thr Gly Gln Asn Pro Met
175 180 185
ggc gtc act atg agc atg gaa cgg aga aag gca cta ctt gag att gcc 807
Gly Val Thr Met Ser Met Glu Arg Arg Lys Ala Leu Leu Glu Ile Ala
190 195 200
tct aaa tac gac ctc cta ata att gag gac act gct tat aat ttc atg 855
Ser Lys Tyr Asp Leu Leu Ile Ile Glu Asp Thr Ala Tyr Asn Phe Met
205 210 215 220
aga tat gaa gga ggg gat ata gtc ccc tta aag gct ttg gac aat gaa 903
Arg Tyr Glu Gly Gly Asp Ile Val Pro Leu Lys Ala Leu Asp Asn Glu
225 230 235
gga aga gtt atc gtg gcg gga acg ctc agc aaa gtc ctt gga aca gga 951
Gly Arg Val Ile Val Ala Gly Thr Leu Ser Lys Val Leu Gly Thr Gly
240 245 250
ttc aga att gga tgg ata ata gca gag gga gaa atc ctc aaa aaa gtt 999
Phe Arg Ile Gly Trp Ile Ile Ala Glu Gly Glu Ile Leu Lys Lys Val
255 260 265
ctc atg cag aaa cag cca att gac ttc tgt gct cca gct att tcc caa 1047
Leu Met Gln Lys Gln Pro Ile Asp Phe Cys Ala Pro Ala Ile Ser Gln
270 275 280
tac att gcc cta gaa tac tta aag agg ggc tat ttt gag aag tat cac 1095
Tyr Ile Ala Leu Glu Tyr Leu Lys Arg Gly Tyr Phe Glu Lys Tyr His
285 290 295 300
ttg gaa gga gca ctg ctc ggt tat aaa gag aag agg gac atc atg ctg 1143
Leu Glu Gly Ala Leu Leu Gly Tyr Lys Glu Lys Arg Asp Ile Met Leu
305 310 315
aag gct ctt gaa aat cac ttg cca aat gca gaa ttt aca aag cca ata 1191
Lys Ala Leu Glu Asn His Leu Pro Asn Ala Glu Phe Thr Lys Pro Ile
320 325 330
gcg gga atg ttt gtt atg ttt ttc ctt cca gag gga gca gat ggc atc 1239
Ala Gly Met Phe Val Met Phe Phe Leu Pro Glu Gly Ala Asp Gly Ile
335 340 345
tca ttt gcc aac gag ctc atg gaa agg gag gga gtt gtg gta gtt cca 1287
Ser Phe Ala Asn Glu Leu Met Glu Arg Glu Gly Val Val Val Val Pro
350 355 360
gga aag cct ttc tac aca gac gag tct gga aag aat gct ata agg ctt 1335
Gly Lys Pro Phe Tyr Thr Asp Glu Ser Gly Lys Asn Ala Ile Arg Leu
365 370 375 380
aac ttc tca agg cca agc aag gaa gaa att cca ata gga atc aag aaa 1383
Asn Phe Ser Arg Pro Ser Lys Glu Glu Ile Pro Ile Gly Ile Lys Lys
385 390 395
ctt gct aag ctt tat aag gaa aag ttt ggc gag tga attctttgtt 1429
Leu Ala Lys Leu Tyr Lys Glu Lys Phe Gly Glu
400 405
tttacatttt cttctgggcc atcacattct cgatggagag aaggttagtt tgtttttaat 1489
gcactcagaa aagttctttt tggtgcgggg gcggggattt gaaccccgga acccctacgg 1549
gacgggaccc tcaatcccgc gcctttgacc aggctcggca acccccgcaa gagcgccgtt 1609
tatttgtctt cttagtttgt ttataaattt ttctgtcccc tttaaccggg gcgtgtttat 1669
agtaaccttt attagggttt ttgctgaatt ctttcaggtg gttgtcgtga tccccagatg 1729
ggatcacaaa ctcaaagacc ctgaaagcgt ggcattcata atcctcgacg ttttagcaga 1789
cttcgaatca gaaggaaagc tgaagaacct gccaaaaatc caaaaaattt ccagtaaaaa 1849
caatactggc aatactcctc tttaaacaat actacaacct acccctcaga gacgcccagc 1909
actacggcag aaaattcttc ggagcaaaca ttcactactc aaccctccac aactgggaga 1969
aaaagctgaa cctcgaagaa ctgacaaacc acctcctgaa aaaactccag aaattaccct 2029
acgccagcac tcaagcagac tcaaccatta tcacaaataa aaaaaggaca gaatagaagt 2089
tcaggcaata acgagaatcc tgccgggttt actgtatccg gttgctgtga agatcacaac 2149
ttctgagaac gagctgattg aactcctgcc ggagggttct gggaattttt atgctgatgg 2209
ggcttatgat tcaaagaaag ttctgaacac tgtggtggaa aagggttatc ggccgattgt 2269
taagaaaact aagaaccctc caggtggttt tggtagtaag aagagagata gagtgttttc 2329
tgaagaagag tacaggcata ggaatcctca tgaggggttc tggggtgcgt ttacaacgtg 2389
gtttggcagt aggatcc 2406
<210> 8
<211> 407
<212> PRT
<213> Thermococcus litoralis
<400> 8
Met Asp Tyr Thr Lys Tyr Leu Ala Gly Arg Ala Asn Trp Ile Lys Gly
1 5 10 15
Ser Ala Leu Ala Asp Val Met Lys Lys Ala Ser Glu Leu Gln Lys Lys
20 25 30
Gly Val Lys Leu Ile Ser Leu Ala Ala Gly Asp Pro Asp Pro Glu Leu
35 40 45
Ile Pro Arg Ala Val Leu Gly Glu Ile Ala Lys Glu Val Leu Glu Lys
50 55 60
Glu Pro Lys Ser Val Met Tyr Thr Pro Ala Asn Gly Ile Pro Glu Leu
65 70 75 80
Arg Glu Glu Leu Ala Ala Phe Leu Lys Lys Tyr Asp His Leu Glu Val
85 90 95
Ser Pro Glu Asn Ile Val Ile Thr Ile Gly Gly Thr Gly Ala Leu Asp
100 105 110
Leu Leu Gly Arg Val Leu Ile Asp Pro Gly Asp Val Val Ile Thr Glu
115 120 125
Asn Pro Ser Tyr Ile Asn Thr Leu Leu Ala Phe Glu Gln Leu Gly Ala
130 135 140
Lys Ile Glu Gly Val Pro Val Asp Asn Asp Gly Met Arg Val Asp Leu
145 150 155 160
Leu Glu Glu Lys Ile Lys Glu Leu Lys Ala Lys Gly Gln Lys Val Lys
165 170 175
Leu Ile Tyr Thr Ile Pro Thr Gly Gln Asn Pro Met Gly Val Thr Met
180 185 190
Ser Met Glu Arg Arg Lys Ala Leu Leu Glu Ile Ala Ser Lys Tyr Asp
195 200 205
Leu Leu Ile Ile Glu Asp Thr Ala Tyr Asn Phe Met Arg Tyr Glu Gly
210 215 220
Gly Asp Ile Val Pro Leu Lys Ala Leu Asp Asn Glu Gly Arg Val Ile
225 230 235 240
Val Ala Gly Thr Leu Ser Lys Val Leu Gly Thr Gly Phe Arg Ile Gly
245 250 255
Trp Ile Ile Ala Glu Gly Glu Ile Leu Lys Lys Val Leu Met Gln Lys
260 265 270
Gln Pro Ile Asp Phe Cys Ala Pro Ala Ile Ser Gln Tyr Ile Ala Leu
275 280 285
Glu Tyr Leu Lys Arg Gly Tyr Phe Glu Lys Tyr His Leu Glu Gly Ala
290 295 300
Leu Leu Gly Tyr Lys Glu Lys Arg Asp Ile Met Leu Lys Ala Leu Glu
305 310 315 320
Asn His Leu Pro Asn Ala Glu Phe Thr Lys Pro Ile Ala Gly Met Phe
325 330 335
Val Met Phe Phe Leu Pro Glu Gly Ala Asp Gly Ile Ser Phe Ala Asn
340 345 350
Glu Leu Met Glu Arg Glu Gly Val Val Val Val Pro Gly Lys Pro Phe
355 360 365
Tyr Thr Asp Glu Ser Gly Lys Asn Ala Ile Arg Leu Asn Phe Ser Arg
370 375 380
Pro Ser Lys Glu Glu Ile Pro Ile Gly Ile Lys Lys Leu Ala Lys Leu
385 390 395 400
Tyr Lys Glu Lys Phe Gly Glu
405
<210> 9
<211> 1338
<212> DNA
<213> synthetic DNA
<400> 9
ggtctcccaa gcttgcatgc ctgcaggtcg actctagagg atccgacgtc aggaaaggag 60
aggattgatg gactatacca aatatcttgc gggccgggct aattggatta agggctctgc 120
actcgcggac gtaatgaaaa aagcatccga attgcagaaa aagggcgtca aacttatttc 180
gctcgccgcc ggtgatcctg accccgaact gattccccgt gcagtgttgg gcgagattgc 240
aaaggaggtc ctcgaaaaag aacctaagtc ggtaatgtac actcccgcca acggcattcc 300
ggagcttcgg gaggagttgg ccgcttttct caagaagtat gaccaccttg aagtgtctcc 360
tgagaacatc gtcatcacca ttggcggtac tggtgcactc gatctgcttg gacgtgtact 420
gatcgatcct ggcgacgtag tcatcacgga aaatccatcg tacattaaca ccctcctcgc 480
tttcgaacaa ctcggagcaa aaattgaggg agtaccggtg gataacgacg gcatgcgggt 540
tgaccttctg gaagagaaga tcaaagagtt gaaggctaag ggtcaaaaag tgaaactgat 600
ttatacgatt ccaaccggac aaaatccaat gggtgtaacg atgtcaatgg aacggcgtaa 660
ggcgttgctg gagatcgcct caaaatacga tttgctgatc attgaggaca ctgcgtacaa 720
cttcatgcgg tacgaaggtg gtgatattgt cccgctcaag gcgttggata atgagggacg 780
tgtgatcgtg gccggaaccc tttcaaaggt actcggcact ggttttcgta ttggctggat 840
tatcgccgaa ggcgagattt tgaagaaggt tctcatgcag aaacaaccta tcgatttctg 900
cgcgcccgcg atttcgcagt atattgcgct cgaatatctg aagcgtggat acttcgagaa 960
gtaccacctt gagggtgcat tgttgggata taaggagaaa cgcgacatca tgctgaaggc 1020
ccttgagaat catctcccga acgcagaatt caccaagccc atcgcgggta tgttcgtcat 1080
gttcttcctg ccagaaggtg cggacggcat ctcctttgcg aacgagctca tggagcgcga 1140
gggcgtagtc gttgtccccg gaaaaccttt ctacactgac gaatccggta aaaacgccat 1200
tcggctgaat ttctcccgcc cttcaaaaga agagattccc attggaatta aaaaacttgc 1260
taaactgtat aaagaaaaat tcggtgagta ataaggatcc ccgggtaccg agctcgaatt 1320
cactggccgt cggagacc 1338
<210> 10
<211> 1146
<212> DNA
<213> Moorea producens
<220>
<221> CDS
<222> (1)..(1143)
<400> 10
atg tcg gaa aaa att gtt aat tcc tgg aat gaa tgg gat gaa ttg gaa 48
Met Ser Glu Lys Ile Val Asn Ser Trp Asn Glu Trp Asp Glu Leu Glu
1 5 10 15
gaa atg gtg gta gga att gca gac tat gct agc ttt gaa cca aaa gaa 96
Glu Met Val Val Gly Ile Ala Asp Tyr Ala Ser Phe Glu Pro Lys Glu
20 25 30
cca ggg aat cat ccg aaa tta aga aat caa aat tta gcg gaa atc att 144
Pro Gly Asn His Pro Lys Leu Arg Asn Gln Asn Leu Ala Glu Ile Ile
35 40 45
cct ttc ccc agt gga cct aaa gac cct aaa gtc ctt gaa aaa gct aat 192
Pro Phe Pro Ser Gly Pro Lys Asp Pro Lys Val Leu Glu Lys Ala Asn
50 55 60
gaa gaa tta aat gga ctg gct tat tta tta aaa gac cac gat gtg ata 240
Glu Glu Leu Asn Gly Leu Ala Tyr Leu Leu Lys Asp His Asp Val Ile
65 70 75 80
gta aga aga ccc gaa aaa att gat ttt act aaa tct cta aaa aca cct 288
Val Arg Arg Pro Glu Lys Ile Asp Phe Thr Lys Ser Leu Lys Thr Pro
85 90 95
tac ttt gaa gtt gca aat caa tac tgt gga gtc tgt cct cgg gat gtc 336
Tyr Phe Glu Val Ala Asn Gln Tyr Cys Gly Val Cys Pro Arg Asp Val
100 105 110
atg att acc ttt ggg aat gaa atc atg gaa gcg act atg tcg aag aga 384
Met Ile Thr Phe Gly Asn Glu Ile Met Glu Ala Thr Met Ser Lys Arg
115 120 125
gct aga ttt ttt gaa tac tta cct tac cgg aaa ttg gtc tat gaa tat 432
Ala Arg Phe Phe Glu Tyr Leu Pro Tyr Arg Lys Leu Val Tyr Glu Tyr
130 135 140
tgg aat aaa gac gag cat atg att tgg aat gct gcg cct aaa ccg act 480
Trp Asn Lys Asp Glu His Met Ile Trp Asn Ala Ala Pro Lys Pro Thr
145 150 155 160
atg cag gat agt atg tat cta gag aat ttc tgg gag ctg tct tta gaa 528
Met Gln Asp Ser Met Tyr Leu Glu Asn Phe Trp Glu Leu Ser Leu Glu
165 170 175
gaa cga ttt aag cgt atg cat gat ttt gaa ttt tgt att aca caa gat 576
Glu Arg Phe Lys Arg Met His Asp Phe Glu Phe Cys Ile Thr Gln Asp
180 185 190
gaa gta att ttt gat gcg gct gac tgt agc aga tta gga aag gat ata 624
Glu Val Ile Phe Asp Ala Ala Asp Cys Ser Arg Leu Gly Lys Asp Ile
195 200 205
tta gtt cag gaa tcg atg aca aca aat aga aca gga att cgg tgg tta 672
Leu Val Gln Glu Ser Met Thr Thr Asn Arg Thr Gly Ile Arg Trp Leu
210 215 220
aaa aag cac cta gaa cca aga gga ttt cgg gtt cac cct gtt cat ttt 720
Lys Lys His Leu Glu Pro Arg Gly Phe Arg Val His Pro Val His Phe
225 230 235 240
ccc ctt gat ttt ttc ccc tca cac att gac tgt acg ttt gtt cct ttg 768
Pro Leu Asp Phe Phe Pro Ser His Ile Asp Cys Thr Phe Val Pro Leu
245 250 255
cga cca ggt ctt att ttg aca aac cct gaa aga cct ata cgg gaa gag 816
Arg Pro Gly Leu Ile Leu Thr Asn Pro Glu Arg Pro Ile Arg Glu Glu
260 265 270
gag gag aag att ttt aaa gag aat ggc tgg gag ttg atc aca gtt cct 864
Glu Glu Lys Ile Phe Lys Glu Asn Gly Trp Glu Leu Ile Thr Val Pro
275 280 285
caa ccg act tgc tcg aat gat gaa atg cca atg ttt tgc cag tcc agt 912
Gln Pro Thr Cys Ser Asn Asp Glu Met Pro Met Phe Cys Gln Ser Ser
290 295 300
aag tgg ttg tca atg aat gtt ctg agt ata tca ccg aca aag gtt atc 960
Lys Trp Leu Ser Met Asn Val Leu Ser Ile Ser Pro Thr Lys Val Ile
305 310 315 320
tgt gag gaa aga gaa aaa cct ctc caa gaa ttg ttg gat aag cat gga 1008
Cys Glu Glu Arg Glu Lys Pro Leu Gln Glu Leu Leu Asp Lys His Gly
325 330 335
ttt gag gtt ttt cct tta ccc ttt aga cat gtc ttt gaa ttt ggg ggg 1056
Phe Glu Val Phe Pro Leu Pro Phe Arg His Val Phe Glu Phe Gly Gly
340 345 350
tct ttt cat tgt gca act tgg gat att cgc cga aaa ggt gag tgt gaa 1104
Ser Phe His Cys Ala Thr Trp Asp Ile Arg Arg Lys Gly Glu Cys Glu
355 360 365
gat tat tta cca aat tta aac tat caa ccg att tgt ggt taa 1146
Asp Tyr Leu Pro Asn Leu Asn Tyr Gln Pro Ile Cys Gly
370 375 380
<210> 11
<211> 381
<212> PRT
<213> Moorea producens
<400> 11
Met Ser Glu Lys Ile Val Asn Ser Trp Asn Glu Trp Asp Glu Leu Glu
1 5 10 15
Glu Met Val Val Gly Ile Ala Asp Tyr Ala Ser Phe Glu Pro Lys Glu
20 25 30
Pro Gly Asn His Pro Lys Leu Arg Asn Gln Asn Leu Ala Glu Ile Ile
35 40 45
Pro Phe Pro Ser Gly Pro Lys Asp Pro Lys Val Leu Glu Lys Ala Asn
50 55 60
Glu Glu Leu Asn Gly Leu Ala Tyr Leu Leu Lys Asp His Asp Val Ile
65 70 75 80
Val Arg Arg Pro Glu Lys Ile Asp Phe Thr Lys Ser Leu Lys Thr Pro
85 90 95
Tyr Phe Glu Val Ala Asn Gln Tyr Cys Gly Val Cys Pro Arg Asp Val
100 105 110
Met Ile Thr Phe Gly Asn Glu Ile Met Glu Ala Thr Met Ser Lys Arg
115 120 125
Ala Arg Phe Phe Glu Tyr Leu Pro Tyr Arg Lys Leu Val Tyr Glu Tyr
130 135 140
Trp Asn Lys Asp Glu His Met Ile Trp Asn Ala Ala Pro Lys Pro Thr
145 150 155 160
Met Gln Asp Ser Met Tyr Leu Glu Asn Phe Trp Glu Leu Ser Leu Glu
165 170 175
Glu Arg Phe Lys Arg Met His Asp Phe Glu Phe Cys Ile Thr Gln Asp
180 185 190
Glu Val Ile Phe Asp Ala Ala Asp Cys Ser Arg Leu Gly Lys Asp Ile
195 200 205
Leu Val Gln Glu Ser Met Thr Thr Asn Arg Thr Gly Ile Arg Trp Leu
210 215 220
Lys Lys His Leu Glu Pro Arg Gly Phe Arg Val His Pro Val His Phe
225 230 235 240
Pro Leu Asp Phe Phe Pro Ser His Ile Asp Cys Thr Phe Val Pro Leu
245 250 255
Arg Pro Gly Leu Ile Leu Thr Asn Pro Glu Arg Pro Ile Arg Glu Glu
260 265 270
Glu Glu Lys Ile Phe Lys Glu Asn Gly Trp Glu Leu Ile Thr Val Pro
275 280 285
Gln Pro Thr Cys Ser Asn Asp Glu Met Pro Met Phe Cys Gln Ser Ser
290 295 300
Lys Trp Leu Ser Met Asn Val Leu Ser Ile Ser Pro Thr Lys Val Ile
305 310 315 320
Cys Glu Glu Arg Glu Lys Pro Leu Gln Glu Leu Leu Asp Lys His Gly
325 330 335
Phe Glu Val Phe Pro Leu Pro Phe Arg His Val Phe Glu Phe Gly Gly
340 345 350
Ser Phe His Cys Ala Thr Trp Asp Ile Arg Arg Lys Gly Glu Cys Glu
355 360 365
Asp Tyr Leu Pro Asn Leu Asn Tyr Gln Pro Ile Cys Gly
370 375 380
<210> 12
<211> 1248
<212> DNA
<213> synthetic DNA
<400> 12
cgtctctgtg gataactgag cggataagtt cctagtacgc gtgcgagcag gaagaacatg 60
agcgagaaaa ttgtgaacag ctggaatgaa tgggatgaac tggaagaaat ggttgttggt 120
attgcagatt atgcaagctt tgaaccgaaa gaaccgggta atcatccgaa actgcgtaat 180
cagaatctgg cagaaattat tccgtttccg agcggtccga aagatccgaa agttctggaa 240
aaagcaaatg aagaactgaa tggtctggcc tatctgctga aagatcatga tgttattgtt 300
cgccgtccgg aaaaaatcga ctttaccaaa agcctgaaaa ccccgtattt cgaagttgcc 360
aatcagtatt gtggtgtttg tccgcgtgat gttatgatta cctttggcaa cgaaattatg 420
gaagccacca tgagcaaacg tgcccgtttt tttgaatatc tgccgtatcg taaactggtg 480
tatgagtatt ggaacaaaga tgagcatatg atctggaatg cagcaccgaa accgaccatg 540
caggatagca tgtatctgga aaacttttgg gaactgagcc tggaagaacg ttttaaacgt 600
atgcacgatt ttgagttttg catcacccag gatgaagtga tttttgatgc agcagattgt 660
agccgtctgg gtaaagatat tctggttcaa gaaagcatga ccaccaatcg taccggtatt 720
cgttggctga aaaaacatct ggaaccgcgt ggttttcgtg ttcatccggt tcattttccg 780
ctggattttt ttccgagcca tattgattgt acctttgttc cgctgcgtcc gggtctgatt 840
ctgaccaatc cggaacgtcc gattcgtgaa gaagaagaga aaatcttcaa agagaatggc 900
tgggagctga ttaccgttcc gcagccgacc tgtagcaatg atgaaatgcc gatgttttgt 960
cagagcagca aatggctgag catgaatgtt ctgagcatta gcccgaccaa agttatttgt 1020
gaagaacgtg aaaaaccgct gcaagaactg ctggataaac atggttttga agtgtttccg 1080
ctgccgtttc gtcatgtttt tgaatttggt ggtagctttc attgtgccac ctgggatatt 1140
cgtcgtaaag gtgaatgtga agattatctg ccgaatctga attatcagcc gatttgtggt 1200
taataagacg tccgcgaggg ccgtgttgcc ggtttcttca gagagacg 1248
<210> 13
<211> 46
<212> DNA
<213> synthetic oligonucleotide
<400> 13
ggaaacagct atgacatgat tacgcggtta tcgcggaatc cgtatg 46
<210> 14
<211> 25
<212> DNA
<213> synthetic oligonucleotide
<400> 14
ttaagcgttt tgtgcaactc cgtct 25
<210> 15
<211> 50
<212> DNA
<213> synthetic oligonucleotide
<400> 15
agacggagtt gcacaaaacg cttaaaccct acttagctgc caattattcc 50
<210> 16
<211> 50
<212> DNA
<213> synthetic oligonucleotide
<400> 16
ggtaggtggt ggtgtcttta ctcatgggta aaaaatcctt tcgtaggttt 50
<210> 17
<211> 25
<212> DNA
<213> synthetic oligonucleotide
<400> 17
atgagtaaag acaccaccac ctacc 25
<210> 18
<211> 46
<212> DNA
<213> synthetic oligonucleotide
<400> 18
gttgtaaaac gacggccagt gccaccggtg atgtggttct tcactg 46
<210> 19
<211> 51
<212> DNA
<213> synthetic oligonucleotide
<400> 19
gaattcgagc tcggtacccg gggatcctct ttcatacctt aacgcagtag t 51
<210> 20
<211> 37
<212> DNA
<213> synthetic oligonucleotide
<400> 20
gcgttgacgc gggctcgagc agtggtcgtc gacaagc 37
<210> 21
<211> 37
<212> DNA
<213> synthetic oligonucleotide
<400> 21
cgacgaccac tgctcgagcc cgcgtcaacg cgttcgg 37
<210> 22
<211> 48
<212> DNA
<213> synthetic oligonucleotide
<400> 22
caagcttgca tgcctgcagg tcgactttgg aacggagttc gctgggta 48
<210> 23
<211> 17
<212> DNA
<213> synthetic oligonucleotide
<220>
<221> RBS
<222> (1)..(17)
<223> Shi F, Luan M, Li Y, AMB Express. 2018 Apr 18;8(1):61. doi:
10.1186/s13568-018-0595-2
<400> 23
aggaaaggag aggattg 17
201900349A 3
Claims (28)
- L-아르기닌:글라이신 아미디노트랜스페라아제의 기능을 갖는 단백질에 대해 코딩하는 적어도 하나의 유전자를 포함하고 글리옥실레이트 아미노트랜스페라아제의 기능을 갖는 적어도 하나의 단백질을 포함하는 미생물.
- 제 1 항에 있어서, 글리옥실레이트 아미노트랜스페라아제의 기능을 갖는 적어도 하나의 단백질의 효소 활성이 야생형 미생물에서의 당해 효소 활성에 비해 증가된 미생물.
- 제 1 항 또는 제 2 항에 있어서, 미생물이 야생형 미생물의 능력에 비해 증가된 L-아르기닌 생산 능력을 갖는 미생물.
- 제 3 항에 있어서, 미생물이 야생형 미생물에서의 당해 효소 활성에 비해 증가된 카르바모일포스페이트 신타아제의 기능을 갖는 효소의 활성을 갖는 미생물.
- 제 3 항 또는 제 4 항에 있어서, 미생물이 야생형 미생물에서의 당해 효소 활성에 비해 활성이 증가된 아르기니노숙시네이트 리아제의 기능을 갖는 효소를 추가로 포함하는 미생물.
- 제 3 항 내지 제 5 항 중 어느 한 항에 있어서, 미생물이 야생형 미생물에서의 당해 효소 활성에 비해 활성이 증가된 오르니틴 카르바모일트랜스페라아제의 기능을 갖는 효소를 추가로 포함하는 미생물.
- 제 3 항 내지 제 6 항 중 어느 한 항에 있어서, 미생물이 야생형 미생물에서의 당해 효소 활성에 비해 활성이 증가된 아르기니노숙시네이트 신테타아제의 기능을 갖는 효소를 추가로 포함하는 미생물.
- 제 3 항 내지 제 7 항 중 어느 한 항에 있어서, 효소의 증가된 활성이 당해 효소를 코딩하는 유전자를 과발현시킴으로써 달성되는 미생물.
- 제 3 항 내지 제 8 항 중 어느 한 항에 있어서, 말레이트 신타아제의 기능을 갖는 단백질의 활성이 야생형 미생물에서의 당해 활성에 비해 감소된 미생물.
- 제 9 항에 있어서, 말레이트 신타아제의 기능을 갖는 단백질을 코딩하는 유전자의 발현이 야생형 미생물에서의 당해 유전자의 발현에 비해 약화되거나 또는 말레이트 신타아제의 기능을 갖는 단백질을 코딩하는 유전자가 결실된 미생물.
- 제 3 항 내지 제 10 항 중 어느 한 항에 있어서, 아르기닌 오페론 (argCJBDFR) 이 과발현되는 미생물.
- 제 3 항 내지 제 10 항 중 어느 한 항에 있어서, 아르기닌 반응성 리프레서 단백질 ArgR 에 대해 코딩하는 argR 유전자의 발현이 야생형 미생물에서의 argR 유전자의 발현에 비해 약화되거나 또는 argR 유전자가 결실된 미생물.
- 제 3 항 내지 제 10 항 또는 제 12 항 중 어느 한 항에 있어서, 각각 글루타메이트 데히드로게나아제, 오르니틴 아세틸트랜스페라아제, 아세틸글루타메이트 키나아제, 아세틸글루타밀포스페이트 리덕타아제 및 아세틸오르니틴 아미노트랜스페라아제에 대해 코딩하는 gdh, argJ, argB, argC 및/또는 argD 를 포함하는, L-아르기닌의 생합성 경로의 효소에 대해 코딩하는 유전자 중 적어도 하나 이상이 과발현되는 미생물.
- 제 1 항 내지 제 13 항 중 어느 한 항에 있어서, L-아르기닌:글라이신 아미디노트랜스페라아제의 기능을 갖는 단백질에 대해 코딩하는 유전자가 이종성인 미생물.
- 제 1 항 내지 제 14 항 중 어느 한 항에 있어서, L-아르기닌:글라이신 아미디노트랜스페라아제의 기능을 갖는 단백질에 대해 코딩하는 유전자가 과발현되는 미생물.
- 제 1 항 내지 제 15 항 중 어느 한 항에 있어서, L-아르기닌:글라이신 아미디노트랜스페라아제의 기능을 갖는 단백질이 SEQ ID NO: 11 에 따른 아미노산 서열과 적어도 80 % 상동성인 아미노산 서열을 포함하는 미생물.
- 제 1 항 내지 제 16 항 중 어느 한 항에 있어서, 글리옥실레이트 아미노트랜스페라아제의 효소 활성을 갖는 단백질이 SEQ ID NO:2, SEQ ID NO: 5 또는 SEQ ID NO: 8 에 따른 아미노산 서열과 적어도 80 % 상동성인 아미노산 서열을 포함하는 미생물.
- 제 1 항 내지 제 17 항 중 어느 한 항에 있어서, 미생물이 코리네박테리움 (Corynebacterium) 속, 엔테로박테리아세애 (Enterobacteriaceae) 속 또는 슈도모나스 (Pseudomonas) 속에 속하는 미생물.
- 제 18 항에 있어서, 미생물이 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 인 미생물.
- 제 18 항에 있어서, 미생물이 에스케리키아 콜라이 (Escherichia coli) 인 미생물.
- 제 18 항에 있어서, 미생물이 슈도모나스 푸티다 (Pseudomonas putida) 인 미생물.
- 구아니디노 아세트산 (GAA) 의 발효적 생산 방법으로서, a) 제 1 항 내지 제 21 항 중 어느 한 항에 정의된 바와 같은 미생물을 적합한 배지에서 적합한 조건 하에 배양하는 단계, 및 b) 배지에 GAA 을 축적시켜 GAA 함유 발효 브로쓰를 형성하는 단계를 포함하는 방법.
- 제 24 항에 있어서, GAA 함유 발효 브로쓰로부터 GAA 을 단리하는 단계를 추가로 포함하는 방법.
- 제 22 항 또는 제 23 항에 있어서, GAA 함유 발효 브로쓰를 건조 및/또는 과립화하는 단계를 추가로 포함하는 방법.
- 제 1 항 내지 제 21 항 중 어느 한 항에 있어서, 구아니디노아세테이트 N-메틸트랜스페라아제의 활성을 갖는 효소에 대해 코딩하는 유전자를 추가로 포함하는 미생물.
- 제 25 항에 있어서, 구아니디노아세테이트 N-메틸트랜스페라아제의 활성을 갖는 효소에 대해 코딩하는 유전자가 과발현되는 미생물.
- 크레아틴의 발효적 생산 방법으로서, a) 제 25 항 또는 제 26 항에 정의된 바와 같은 미생물을 적합한 배지에서 적합한 조건 하에 배양하는 단계, 및 b) 배지에 크레아틴을 축적시켜 크레아틴 함유 발효 브로쓰를 형성하는 단계를 포함하는 방법.
- 제 27 항에 있어서, 크레아틴 함유 발효 브로쓰로부터 크레아틴을 단리하는 단계를 추가로 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20184949 | 2020-07-09 | ||
EP20184949.4 | 2020-07-09 | ||
PCT/EP2021/067676 WO2022008280A1 (en) | 2020-07-09 | 2021-06-28 | Method for the fermentative production of guanidinoacetic acid |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230035565A true KR20230035565A (ko) | 2023-03-14 |
Family
ID=71575004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237000279A KR20230035565A (ko) | 2020-07-09 | 2021-06-28 | 구아니디노아세트산의 발효적 생산 방법 |
Country Status (13)
Country | Link |
---|---|
US (1) | US12065677B2 (ko) |
EP (1) | EP4179100A1 (ko) |
JP (1) | JP2023532784A (ko) |
KR (1) | KR20230035565A (ko) |
CN (1) | CN115803442A (ko) |
AR (1) | AR122914A1 (ko) |
AU (1) | AU2021304393A1 (ko) |
BR (1) | BR112022026755A2 (ko) |
IL (1) | IL299709A (ko) |
MX (1) | MX2023000342A (ko) |
TW (1) | TW202219268A (ko) |
WO (1) | WO2022008280A1 (ko) |
ZA (1) | ZA202301314B (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4179099A1 (en) | 2020-07-09 | 2023-05-17 | Evonik Operations GmbH | Method for the fermentative production of guanidinoacetic acid |
BR112022026755A2 (pt) | 2020-07-09 | 2023-01-24 | Evonik Operations Gmbh | Micro-organismo, método para a produção fermentativa de ácido acético de guanidino (gaa) e para a produção fermentativa de creatina |
WO2023232583A1 (en) | 2022-06-03 | 2023-12-07 | Evonik Operations Gmbh | Improved biotechnological method for producing guanidino acetic acid (gaa) by using nadh-dependent dehydrogenases |
WO2023232584A1 (en) * | 2022-06-03 | 2023-12-07 | Evonik Operations Gmbh | Method for producing guanidino acetic acid (gaa) |
KR20240013960A (ko) | 2022-07-21 | 2024-01-31 | 대상 주식회사 | L-아르기닌 또는 l-시트룰린 생산능이 향상된 코리네박테리움 속 미생물 및 이를 이용한 l-아르기닌 또는 l-시트룰린의 생산 방법 |
WO2024094481A1 (en) | 2022-11-03 | 2024-05-10 | Evonik Operations Gmbh | Improved biotechnological process to produce guanidinoacetic acid (gaa) by targeted introduction or by increasing the activity of a transmembrane exporter protein |
WO2024094483A1 (en) * | 2022-11-03 | 2024-05-10 | Evonik Operations Gmbh | Improved biotechnological process to produce guanidinoacetic acid (gaa) by targeted introduction or by increasing the activity of a transmembrane transport protein belonging to the amino acid-polyamine-organocation superfamily |
WO2024160791A1 (en) | 2023-02-01 | 2024-08-08 | Evonik Operations Gmbh | Method for the fermentative production of guanidinoacetic acid using a microorganism comprising a heterologous l-threonine 3-dehydrogenase gene (tdh) and a glycine c-acetyltransferase gene (kbl) |
WO2024160790A1 (en) | 2023-02-01 | 2024-08-08 | Evonik Operations Gmbh | Method for the fermentative production of guanidinoacetic acid using a microorganism comprising a heterologous l-threonine aldolase gene |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3849250A (en) | 1971-02-26 | 1974-11-19 | Kyowa Hakko Kogyo Kk | Process for producing l-arginine by fermentation |
US7160705B2 (en) | 2000-04-28 | 2007-01-09 | Ajinomoto Co., Inc. | Arginine repressor deficient strain of coryneform bacterium and method for producing L-arginine |
BR0313055A (pt) | 2002-08-09 | 2005-06-28 | Ajinomoto Kk | Planta, planta transgênica, método para aumentar um teor de aminoácido em uma planta ou em uma semente de plantas, semente das plantas transgênicas, método para produzir plantas, ração, e, método para produzir pelo menos um aminoácido |
US20070231370A1 (en) | 2004-06-09 | 2007-10-04 | Thomas Gastner | Guanidino Acetic Acid Used as an Animal Food Additive |
KR101835935B1 (ko) | 2014-10-13 | 2018-03-12 | 씨제이제일제당 (주) | L-아르기닌을 생산하는 코리네박테리움 속 미생물 및 이를 이용한 l-아르기닌의 제조 방법 |
CN106065411B (zh) | 2016-08-10 | 2021-12-07 | 洛阳华荣生物技术有限公司 | 发酵法生产肌酸 |
CN109952380B (zh) | 2016-10-26 | 2023-07-14 | 味之素株式会社 | 用于生产目标物质的方法 |
US11555209B2 (en) | 2017-12-19 | 2023-01-17 | Lanzatech, Inc. | Microorganisms and methods for the biological production of ethylene glycol |
CN110904018B (zh) | 2018-09-14 | 2022-09-09 | 中国科学院天津工业生物技术研究所 | 5-氨基乙酰丙酸生产菌株及其构建方法和应用 |
US11384369B2 (en) * | 2019-02-15 | 2022-07-12 | Braskem S.A. | Microorganisms and methods for the production of glycolic acid and glycine via reverse glyoxylate shunt |
CN111748506B (zh) | 2019-03-29 | 2022-07-05 | 中国科学院微生物研究所 | 产胍基乙酸的工程菌及其构建方法与应用 |
BR112022026755A2 (pt) | 2020-07-09 | 2023-01-24 | Evonik Operations Gmbh | Micro-organismo, método para a produção fermentativa de ácido acético de guanidino (gaa) e para a produção fermentativa de creatina |
EP4179099A1 (en) | 2020-07-09 | 2023-05-17 | Evonik Operations GmbH | Method for the fermentative production of guanidinoacetic acid |
BR112023024041A2 (pt) | 2021-05-21 | 2024-02-06 | Evonik Operations Gmbh | Micro-organismo, e método para a produção fermentativa de ácido guanidinoacético (gaa) e creatina |
-
2021
- 2021-06-28 BR BR112022026755A patent/BR112022026755A2/pt unknown
- 2021-06-28 MX MX2023000342A patent/MX2023000342A/es unknown
- 2021-06-28 CN CN202180048918.1A patent/CN115803442A/zh active Pending
- 2021-06-28 EP EP21736601.2A patent/EP4179100A1/en active Pending
- 2021-06-28 WO PCT/EP2021/067676 patent/WO2022008280A1/en active Application Filing
- 2021-06-28 KR KR1020237000279A patent/KR20230035565A/ko active Search and Examination
- 2021-06-28 IL IL299709A patent/IL299709A/en unknown
- 2021-06-28 AU AU2021304393A patent/AU2021304393A1/en active Pending
- 2021-06-28 US US18/004,327 patent/US12065677B2/en active Active
- 2021-06-28 JP JP2023501158A patent/JP2023532784A/ja active Pending
- 2021-07-06 TW TW110124748A patent/TW202219268A/zh unknown
- 2021-07-08 AR ARP210101922A patent/AR122914A1/es unknown
-
2023
- 2023-02-01 ZA ZA2023/01314A patent/ZA202301314B/en unknown
Also Published As
Publication number | Publication date |
---|---|
BR112022026755A2 (pt) | 2023-01-24 |
MX2023000342A (es) | 2023-02-09 |
WO2022008280A1 (en) | 2022-01-13 |
AU2021304393A1 (en) | 2023-03-09 |
TW202219268A (zh) | 2022-05-16 |
AR122914A1 (es) | 2022-10-12 |
US12065677B2 (en) | 2024-08-20 |
IL299709A (en) | 2023-03-01 |
EP4179100A1 (en) | 2023-05-17 |
ZA202301314B (en) | 2023-10-25 |
JP2023532784A (ja) | 2023-07-31 |
CN115803442A (zh) | 2023-03-14 |
US20230227795A1 (en) | 2023-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230035565A (ko) | 구아니디노아세트산의 발효적 생산 방법 | |
EP4077695B1 (en) | Method for the fermentative production of guanidinoacetic acid | |
KR20230035564A (ko) | 구아니디노아세트산의 발효적 생산 방법 | |
WO2022243116A1 (en) | Improved biotechnological method for producing guanidino acetic acid (gaa) by inactivation of an amino acid exporter | |
AU2004299729A1 (en) | Methods for the preparation of lysine by fermentation of corynebacterium glutamicum | |
WO2020208842A1 (ja) | 遺伝子組換え微生物及びこれを用いた目的物質の生産方法 | |
JP2021503307A (ja) | 宿主細胞におけるフレーバー化合物の生成 | |
EP3498854B1 (en) | Method for the fermentative production of l-lysine | |
WO2021048353A1 (en) | Coryneform bacteria with a heterologous threonine transporter and their use in the production of l-threonine | |
CN113166787A (zh) | 使用具有完全或部分缺失的whiB4基因的物种谷氨酸棒杆菌的L-赖氨酸分泌细菌发酵生产L-赖氨酸的方法 | |
WO2023232583A1 (en) | Improved biotechnological method for producing guanidino acetic acid (gaa) by using nadh-dependent dehydrogenases | |
RU2794946C1 (ru) | Новый промотор и способ получения желаемого вещества с его использованием | |
Xu et al. | Expression of the Escherichia Coli TdcB gene encoding threonine dehydratase in L-isoleucine-overproducing Corynebacterium Glutamicum Yilw | |
TW202417609A (zh) | 藉由使用胺甲酸激酶來製造胍基乙酸(gaa)的改良之生物技術方法 | |
WO2024094483A1 (en) | Improved biotechnological process to produce guanidinoacetic acid (gaa) by targeted introduction or by increasing the activity of a transmembrane transport protein belonging to the amino acid-polyamine-organocation superfamily | |
CN117355537A (zh) | 改善的通过氨基酸输出蛋白失活来生产胍基乙酸(gaa)的生物技术方法 | |
WO2024094481A1 (en) | Improved biotechnological process to produce guanidinoacetic acid (gaa) by targeted introduction or by increasing the activity of a transmembrane exporter protein | |
CN115028694A (zh) | 与l-谷氨酸产量相关的蛋白及其相关生物材料和应用 | |
WO2024149617A1 (en) | Fermentative production guanidinoacetic acid (gaa) from serine by attenuating l serine ammonia lyase activity in microorganisms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |