KR20220107795A - aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 - Google Patents
aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 Download PDFInfo
- Publication number
- KR20220107795A KR20220107795A KR1020210010911A KR20210010911A KR20220107795A KR 20220107795 A KR20220107795 A KR 20220107795A KR 1020210010911 A KR1020210010911 A KR 1020210010911A KR 20210010911 A KR20210010911 A KR 20210010911A KR 20220107795 A KR20220107795 A KR 20220107795A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- glu
- gly
- val
- Prior art date
Links
- 150000001413 amino acids Chemical class 0.000 title claims abstract description 131
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 83
- 101710131418 Phospho-2-dehydro-3-deoxyheptonate aldolase Proteins 0.000 title abstract description 6
- 101150076125 aroG gene Proteins 0.000 claims abstract description 127
- 101100002724 Thermus thermophilus aroH gene Proteins 0.000 claims abstract description 115
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 claims abstract description 84
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 claims abstract description 84
- 244000005700 microbiome Species 0.000 claims abstract description 79
- 150000005693 branched-chain amino acids Chemical class 0.000 claims abstract description 49
- 235000001014 amino acid Nutrition 0.000 claims description 142
- 229940024606 amino acid Drugs 0.000 claims description 141
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 103
- 108091033319 polynucleotide Proteins 0.000 claims description 98
- 102000040430 polynucleotide Human genes 0.000 claims description 98
- 239000002157 polynucleotide Substances 0.000 claims description 98
- 239000013598 vector Substances 0.000 claims description 88
- 230000000694 effects Effects 0.000 claims description 78
- 229960003136 leucine Drugs 0.000 claims description 60
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 39
- 229960000310 isoleucine Drugs 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 35
- 239000004395 L-leucine Substances 0.000 claims description 31
- 235000019454 L-leucine Nutrition 0.000 claims description 31
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 29
- 238000006467 substitution reaction Methods 0.000 claims description 23
- 229960004295 valine Drugs 0.000 claims description 23
- 229930182844 L-isoleucine Natural products 0.000 claims description 20
- 241000186216 Corynebacterium Species 0.000 claims description 19
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 19
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 18
- 235000004279 alanine Nutrition 0.000 claims description 17
- 229960003767 alanine Drugs 0.000 claims description 17
- 239000004475 Arginine Substances 0.000 claims description 13
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 13
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 11
- 238000012258 culturing Methods 0.000 claims description 11
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 9
- 239000004472 Lysine Substances 0.000 claims description 5
- 235000013922 glutamic acid Nutrition 0.000 claims description 5
- 239000004220 glutamic acid Substances 0.000 claims description 5
- 239000006227 byproduct Substances 0.000 abstract description 11
- 229920001184 polypeptide Polymers 0.000 description 115
- 108090000765 processed proteins & peptides Proteins 0.000 description 115
- 102000004196 processed proteins & peptides Human genes 0.000 description 115
- 230000035772 mutation Effects 0.000 description 96
- 108020004414 DNA Proteins 0.000 description 82
- 108090000623 proteins and genes Proteins 0.000 description 58
- 125000003275 alpha amino acid group Chemical group 0.000 description 52
- 239000002773 nucleotide Substances 0.000 description 43
- 125000003729 nucleotide group Chemical group 0.000 description 43
- 210000000349 chromosome Anatomy 0.000 description 40
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 39
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 38
- 230000014509 gene expression Effects 0.000 description 31
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 29
- 235000005772 leucine Nutrition 0.000 description 29
- 239000002609 medium Substances 0.000 description 29
- 239000012634 fragment Substances 0.000 description 28
- 101150095957 ilvA gene Proteins 0.000 description 28
- 210000004027 cell Anatomy 0.000 description 26
- 230000000875 corresponding effect Effects 0.000 description 26
- 230000004048 modification Effects 0.000 description 24
- 238000012986 modification Methods 0.000 description 24
- 230000001965 increasing effect Effects 0.000 description 21
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 20
- 229960005190 phenylalanine Drugs 0.000 description 20
- 101150063051 hom gene Proteins 0.000 description 19
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 19
- 235000014705 isoleucine Nutrition 0.000 description 19
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 18
- 229960004441 tyrosine Drugs 0.000 description 18
- 235000014393 valine Nutrition 0.000 description 17
- 239000004474 valine Substances 0.000 description 17
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 16
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 16
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 16
- 108010038633 aspartylglutamate Proteins 0.000 description 16
- 101150106096 gltA gene Proteins 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- 108010049041 glutamylalanine Proteins 0.000 description 15
- 206010064571 Gene mutation Diseases 0.000 description 14
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 14
- 238000004925 denaturation Methods 0.000 description 14
- 230000036425 denaturation Effects 0.000 description 14
- 101150087199 leuA gene Proteins 0.000 description 14
- 108010057821 leucylproline Proteins 0.000 description 14
- 238000006116 polymerization reaction Methods 0.000 description 14
- 108010093581 aspartyl-proline Proteins 0.000 description 13
- 101150042350 gltA2 gene Proteins 0.000 description 13
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 13
- 229960000318 kanamycin Drugs 0.000 description 13
- 229930182823 kanamycin A Natural products 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 12
- -1 Phospho Chemical class 0.000 description 12
- 108010047495 alanylglycine Proteins 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 108010078144 glutaminyl-glycine Proteins 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 229930027917 kanamycin Natural products 0.000 description 12
- 235000018102 proteins Nutrition 0.000 description 12
- 102000004169 proteins and genes Human genes 0.000 description 12
- 230000003321 amplification Effects 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 108010053725 prolylvaline Proteins 0.000 description 11
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 10
- 108010013835 arginine glutamate Proteins 0.000 description 10
- 238000010367 cloning Methods 0.000 description 10
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 10
- 238000004128 high performance liquid chromatography Methods 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 239000013587 production medium Substances 0.000 description 10
- 238000005215 recombination Methods 0.000 description 10
- 230000006798 recombination Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 9
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 9
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 9
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 9
- 108091081024 Start codon Proteins 0.000 description 9
- 238000007792 addition Methods 0.000 description 9
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 238000004520 electroporation Methods 0.000 description 9
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 9
- 108091008146 restriction endonucleases Proteins 0.000 description 9
- 101710102786 ATP-dependent leucine adenylase Proteins 0.000 description 8
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 8
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 8
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 8
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 8
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 8
- 239000004471 Glycine Substances 0.000 description 8
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 8
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 8
- 239000004473 Threonine Substances 0.000 description 8
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 8
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 8
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 8
- 108010041407 alanylaspartic acid Proteins 0.000 description 8
- 108010044940 alanylglutamine Proteins 0.000 description 8
- 108010011559 alanylphenylalanine Proteins 0.000 description 8
- 108010092854 aspartyllysine Proteins 0.000 description 8
- 238000012790 confirmation Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 108010070643 prolylglutamic acid Proteins 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 229960002898 threonine Drugs 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 7
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 7
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 7
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 7
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 7
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 7
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 7
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 7
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 7
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 7
- BMNVSPMWMICFRV-DCAQKATOSA-N Arg-His-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CN=CN1 BMNVSPMWMICFRV-DCAQKATOSA-N 0.000 description 7
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 7
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 7
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 7
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 7
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 7
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 7
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 7
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 7
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 7
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 7
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 7
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 7
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 7
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 7
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 7
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 7
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 7
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 7
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 7
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 7
- PAZQYODKOZHXGA-SRVKXCTJSA-N Glu-Pro-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O PAZQYODKOZHXGA-SRVKXCTJSA-N 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 7
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 7
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 7
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 7
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 7
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 7
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 7
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 7
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 7
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 7
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 7
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 7
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 7
- PMAOIIWHZHAPBT-HJPIBITLSA-N Ile-Tyr-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CS)C(=O)O)N PMAOIIWHZHAPBT-HJPIBITLSA-N 0.000 description 7
- 108010065920 Insulin Lispro Proteins 0.000 description 7
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 7
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 7
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 7
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 7
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 7
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 7
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 7
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 7
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 7
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 7
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 7
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 7
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 7
- WXJXYMFUTRXRGO-UWVGGRQHSA-N Met-His-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 WXJXYMFUTRXRGO-UWVGGRQHSA-N 0.000 description 7
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 7
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 7
- SPXWRYVHOZVYBU-ULQDDVLXSA-N Phe-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N SPXWRYVHOZVYBU-ULQDDVLXSA-N 0.000 description 7
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 7
- RTUWVJVJSMOGPL-KKUMJFAQSA-N Phe-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RTUWVJVJSMOGPL-KKUMJFAQSA-N 0.000 description 7
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 7
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 7
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 7
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 7
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 7
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 7
- 241000169446 Promethis Species 0.000 description 7
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 7
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 7
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 7
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 7
- BRIZMMZEYSAKJX-QEJZJMRPSA-N Ser-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N BRIZMMZEYSAKJX-QEJZJMRPSA-N 0.000 description 7
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 7
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 7
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 7
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 7
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 7
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 7
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 7
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 7
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 7
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 7
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 7
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 7
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 7
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 7
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 description 7
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 7
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 7
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 7
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 7
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 7
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 7
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 7
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 7
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 7
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 7
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 7
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 7
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 7
- 238000000137 annealing Methods 0.000 description 7
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 7
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 7
- 239000001963 growth medium Substances 0.000 description 7
- 108010092114 histidylphenylalanine Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 7
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 7
- 108010012058 leucyltyrosine Proteins 0.000 description 7
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 7
- 235000008729 phenylalanine Nutrition 0.000 description 7
- 108010012581 phenylalanylglutamate Proteins 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- HMUNWXXNJPVALC-UHFFFAOYSA-N 1-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C(CN1CC2=C(CC1)NN=N2)=O HMUNWXXNJPVALC-UHFFFAOYSA-N 0.000 description 6
- FSBCNCKIQZZASN-GUBZILKMSA-N Ala-Arg-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O FSBCNCKIQZZASN-GUBZILKMSA-N 0.000 description 6
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 6
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 6
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 6
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 6
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 6
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 6
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 6
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 6
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 6
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 6
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 6
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 6
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 6
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 6
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 6
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 6
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 6
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 6
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 6
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 6
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 6
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 6
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 6
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 6
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 6
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 6
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000001747 exhibiting effect Effects 0.000 description 6
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 6
- 108010005942 methionylglycine Proteins 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 235000015097 nutrients Nutrition 0.000 description 6
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 6
- 235000013930 proline Nutrition 0.000 description 6
- 229960002429 proline Drugs 0.000 description 6
- 235000008521 threonine Nutrition 0.000 description 6
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 5
- 235000018417 cysteine Nutrition 0.000 description 5
- 229960002433 cysteine Drugs 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 229960002449 glycine Drugs 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 5
- 238000001802 infusion Methods 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 4
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 4
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 4
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 4
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 4
- 108010064711 Homoserine dehydrogenase Proteins 0.000 description 4
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 108010006873 Threonine Dehydratase Proteins 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 238000004587 chromatography analysis Methods 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 230000004151 fermentation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000007789 gas Substances 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 235000006109 methionine Nutrition 0.000 description 4
- 235000013379 molasses Nutrition 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 235000002374 tyrosine Nutrition 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- LDXJRKWFNNFDSA-UHFFFAOYSA-N 2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound C1CN(CC2=NNN=C21)CC(=O)N3CCN(CC3)C4=CN=C(N=C4)NCC5=CC(=CC=C5)OC(F)(F)F LDXJRKWFNNFDSA-UHFFFAOYSA-N 0.000 description 3
- 108010030844 2-methylcitrate synthase Proteins 0.000 description 3
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 3
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 3
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 3
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 3
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 3
- 108020005544 Antisense RNA Proteins 0.000 description 3
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 3
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 3
- 108010071536 Citrate (Si)-synthase Proteins 0.000 description 3
- 102000006732 Citrate synthase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 3
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 3
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 3
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 102100023162 L-serine dehydratase/L-threonine deaminase Human genes 0.000 description 3
- 101710193388 L-serine dehydratase/L-threonine deaminase Proteins 0.000 description 3
- 101710125839 L-threonine dehydratase Proteins 0.000 description 3
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 3
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 3
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 3
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 3
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 3
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 101710170075 Serine dehydratase-like Proteins 0.000 description 3
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 3
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000003184 complementary RNA Substances 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 239000012153 distilled water Substances 0.000 description 3
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 101150099953 ilvE gene Proteins 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 229910000358 iron sulfate Inorganic materials 0.000 description 3
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 3
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 3
- 235000019341 magnesium sulphate Nutrition 0.000 description 3
- 229940099596 manganese sulfate Drugs 0.000 description 3
- 239000011702 manganese sulphate Substances 0.000 description 3
- 235000007079 manganese sulphate Nutrition 0.000 description 3
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 229910052697 platinum Inorganic materials 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 235000004400 serine Nutrition 0.000 description 3
- 229960001153 serine Drugs 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 230000003827 upregulation Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 2
- KPULXFNPTWGJQH-UHFFFAOYSA-N 3-hydroxy-4-oxo-4-propan-2-yloxybutanoic acid Chemical compound CC(C)OC(=O)C(O)CC(O)=O KPULXFNPTWGJQH-UHFFFAOYSA-N 0.000 description 2
- CONKBQPVFMXDOV-QHCPKHFHSA-N 6-[(5S)-5-[[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]methyl]-2-oxo-1,3-oxazolidin-3-yl]-3H-1,3-benzoxazol-2-one Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C[C@H]1CN(C(O1)=O)C1=CC2=C(NC(O2)=O)C=C1 CONKBQPVFMXDOV-QHCPKHFHSA-N 0.000 description 2
- PJWIPEXIFFQAQZ-PUFIMZNGSA-N 7-phospho-2-dehydro-3-deoxy-D-arabino-heptonic acid Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@H](O)CC(=O)C(O)=O PJWIPEXIFFQAQZ-PUFIMZNGSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 2
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 2
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 2
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 2
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 2
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 2
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 2
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 2
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 2
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 2
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 2
- 108010088278 Branched-chain-amino-acid transaminase Proteins 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 241001605246 Corynebacterium crudilactis Species 0.000 description 2
- 241000446654 Corynebacterium deserti Species 0.000 description 2
- 241000024402 Corynebacterium imitans Species 0.000 description 2
- 241000334675 Corynebacterium singulare Species 0.000 description 2
- 241000186308 Corynebacterium stationis Species 0.000 description 2
- NIXHTNJAGGFBAW-CIUDSAMLSA-N Cys-Lys-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N NIXHTNJAGGFBAW-CIUDSAMLSA-N 0.000 description 2
- ZOKPRHVIFAUJPV-GUBZILKMSA-N Cys-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O ZOKPRHVIFAUJPV-GUBZILKMSA-N 0.000 description 2
- NGHMDNPXVRFFGS-IUYQGCFVSA-N D-erythrose 4-phosphate Chemical compound O=C[C@H](O)[C@H](O)COP(O)(O)=O NGHMDNPXVRFFGS-IUYQGCFVSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 2
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 2
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 2
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 2
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 2
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 2
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 2
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 2
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 2
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 2
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 2
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 2
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 2
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 2
- KQJBFMJFUXAYPK-AVGNSLFASA-N His-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KQJBFMJFUXAYPK-AVGNSLFASA-N 0.000 description 2
- MRVZCDSYLJXKKX-ACRUOGEOSA-N His-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N MRVZCDSYLJXKKX-ACRUOGEOSA-N 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 2
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 2
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 2
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 2
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 2
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 2
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 2
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 2
- 108010021466 Mutant Proteins Proteins 0.000 description 2
- 102000008300 Mutant Proteins Human genes 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 2
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 2
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 2
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 2
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 2
- 108010073771 Soybean Proteins Proteins 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- BIENEHRYNODTLP-HJGDQZAQSA-N Thr-Glu-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O BIENEHRYNODTLP-HJGDQZAQSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 2
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 2
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 2
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 2
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 2
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 2
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 2
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 239000000074 antisense oligonucleotide Substances 0.000 description 2
- 238000012230 antisense oligonucleotides Methods 0.000 description 2
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- ZIWNLPKLQFDFEU-FJXQXJEOSA-N calcium;3-[[(2r)-2,4-dihydroxy-3,3-dimethylbutanoyl]amino]propanoic acid Chemical compound [Ca].OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O ZIWNLPKLQFDFEU-FJXQXJEOSA-N 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 239000007857 degradation product Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 150000002484 inorganic compounds Chemical class 0.000 description 2
- 229910010272 inorganic material Inorganic materials 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 229960003966 nicotinamide Drugs 0.000 description 2
- 235000005152 nicotinamide Nutrition 0.000 description 2
- 239000011570 nicotinamide Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 229910000160 potassium phosphate Inorganic materials 0.000 description 2
- 235000011009 potassium phosphates Nutrition 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 229940001941 soy protein Drugs 0.000 description 2
- 229960004793 sucrose Drugs 0.000 description 2
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 2
- 229960000344 thiamine hydrochloride Drugs 0.000 description 2
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 2
- 239000011747 thiamine hydrochloride Substances 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- JQMFQLVAJGZSQS-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-N-(2-oxo-3H-1,3-benzoxazol-6-yl)acetamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)NC1=CC2=C(NC(O2)=O)C=C1 JQMFQLVAJGZSQS-UHFFFAOYSA-N 0.000 description 1
- YJLUBHOZZTYQIP-UHFFFAOYSA-N 2-[5-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1=NN=C(O1)CC(=O)N1CC2=C(CC1)NN=N2 YJLUBHOZZTYQIP-UHFFFAOYSA-N 0.000 description 1
- QDGAVODICPCDMU-UHFFFAOYSA-N 2-amino-3-[3-[bis(2-chloroethyl)amino]phenyl]propanoic acid Chemical compound OC(=O)C(N)CC1=CC=CC(N(CCCl)CCCl)=C1 QDGAVODICPCDMU-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 1
- VVJTWSRNMJNDPN-IUCAKERBSA-N Arg-Met-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O VVJTWSRNMJNDPN-IUCAKERBSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 1
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 1
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- SJPZTWAYTJPPBI-GUBZILKMSA-N Asn-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SJPZTWAYTJPPBI-GUBZILKMSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 1
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 1
- NONWUQAWAANERO-BZSNNMDCSA-N Asp-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 NONWUQAWAANERO-BZSNNMDCSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000595586 Coryne Species 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- 241000186248 Corynebacterium callunae Species 0.000 description 1
- 241001644925 Corynebacterium efficiens Species 0.000 description 1
- 241001134763 Corynebacterium flavescens Species 0.000 description 1
- 241000291063 Corynebacterium halotolerans Species 0.000 description 1
- 241000128247 Corynebacterium pollutisoli Species 0.000 description 1
- 241000186249 Corynebacterium sp. Species 0.000 description 1
- 241000158523 Corynebacterium striatum Species 0.000 description 1
- 241000960580 Corynebacterium testudinoris Species 0.000 description 1
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 1
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 1
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- YADSXULAFMJZRL-QEJZJMRPSA-N Gln-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N YADSXULAFMJZRL-QEJZJMRPSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- ZSIDREAPEPAPKL-XIRDDKMYSA-N Glu-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N ZSIDREAPEPAPKL-XIRDDKMYSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 1
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 1
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 1
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 1
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 1
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- FRDFAWHTPDKRHG-ULQDDVLXSA-N His-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 FRDFAWHTPDKRHG-ULQDDVLXSA-N 0.000 description 1
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- XBZOQGHZGQLEQO-IUCAKERBSA-N Lys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN XBZOQGHZGQLEQO-IUCAKERBSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 1
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 1
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- CNTNPWWHFWAZGA-JYJNAYRXSA-N Met-Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CNTNPWWHFWAZGA-JYJNAYRXSA-N 0.000 description 1
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 1
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 235000004347 Perilla Nutrition 0.000 description 1
- 244000124853 Perilla frutescens Species 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- XXAOSEUPEMQJOF-KKUMJFAQSA-N Phe-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XXAOSEUPEMQJOF-KKUMJFAQSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- UCTIUWKCVNGEFH-OBJOEFQTSA-N Pro-Val-Gly-Pro Chemical compound N([C@@H](C(C)C)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 UCTIUWKCVNGEFH-OBJOEFQTSA-N 0.000 description 1
- 101150071661 SLC25A20 gene Proteins 0.000 description 1
- 101150099282 SPL7 gene Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 1
- YYXIWHBHTARPOG-HJXMPXNTSA-N Trp-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YYXIWHBHTARPOG-HJXMPXNTSA-N 0.000 description 1
- GQNCRIFNDVFRNF-BPUTZDHNSA-N Trp-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O GQNCRIFNDVFRNF-BPUTZDHNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 1
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- HFJJDMOFTCQGEI-STECZYCISA-N Tyr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HFJJDMOFTCQGEI-STECZYCISA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- KZOZXAYPVKKDIO-UFYCRDLUSA-N Tyr-Met-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KZOZXAYPVKKDIO-UFYCRDLUSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- XPYNXORPPVTVQK-SRVKXCTJSA-N Val-Arg-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N XPYNXORPPVTVQK-SRVKXCTJSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010031045 aspartyl-glycyl-aspartyl-alanine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 101150102633 cact gene Proteins 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000645 desinfectant Substances 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- FBAFATDZDUQKNH-UHFFFAOYSA-M iron chloride Chemical compound [Cl-].[Fe] FBAFATDZDUQKNH-UHFFFAOYSA-M 0.000 description 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001522 polyglycol ester Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 230000007398 protein translocation Effects 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010037335 tyrosyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/06—Alanine; Leucine; Isoleucine; Serine; Homoserine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/08—Lysine; Diaminopimelic acid; Threonine; Valine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01054—3-Deoxy-7-phosphoheptulonate synthase (2.5.1.54)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
Abstract
본 출원은 aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체, 이를 포함하는 미생물 및 이를 이용한 아미노산 생산 방법에 관한 것이다.
Description
본 출원은 aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법에 관한 것이다.
L-아미노산은 단백질의 기본 구성단위로서, 약품 원료와 식품첨가제, 동물 사료, 영양제, 살충제, 살균제 등의 중요 소재로 사용된다. 따라서 아미노산을 산업적으로 생산하는 것은 경제적으로 중요한 산업 공정이 되어 왔다.
아미노산을 효율적으로 생산하기 위한 다양한 연구, 예를 들어, 아미노산 고효율 생산 미생물이나 발효공정 기술을 개발하기 위한 노력이 이루어지고 있다. 구체적으로, 코리네박테리움 속 균주에서 아미노산 생합성에 관여하는 효소를 암호화하는 유전자의 발현을 증가시키거나 또는 아미노산 생합성에 불필요한 유전자를 제거하는 것과 같은 목적 물질 특이적인 접근 방법이 개발되었고(US 9109242 B2), 이러한 방법 이외에 아미노산 생산에 관여하지 않는 유전자를 제거하는 방법, 아미노산 생산에 있어 구체적으로 기능이 알려지지 않은 유전자를 제거하는 방법 또한 활용되고 있다.
한편 아미노산 중, 분지쇄 아미노산(branched-chain amino acid)은 발린, 류신, 이소류신의 3종을 지칭하며, 주로 근육에서 대사되어 활동 시에 에너지원으로 사용된다고 알려져 있다. 분지쇄 아미노산이 활동 시 근육 유지 및 증량에 중요한 역할을 한다고 알려지면서 그 사용량이 증가하고 있다. 그러나 분지쇄 아미노산 생합성 경로에서는 부산물이 다량 생성되게 되므로, 분지쇄 아미노산을 고수율, 고순도로 생산하기 위해서는 부산물의 생성량을 저감시키는 것이 중요하다.
이러한 배경 하에, 본 발명자들은 종래에 비해 수율이 우수하고 부산물 생산량이 적은 분지쇄 아미노산 생산방법 개발을 위해 예의 노력한 결과, 발린, 류신, 이소류신 생산능을 증가시키는 aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체를 발굴하여 본 출원을 완성하였다.
본 출원의 목적은 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체를 제공하는 것이다.
본 출원의 다른 목적은 상기 변이체를 코딩하는 폴리뉴클레오티드 및 이를 포함하는 벡터를 제공하는 것이다.
본 출원의 또 다른 목적은 상기 변이체, 폴리뉴클레오티드 및 벡터 중 하나 이상을 포함하는 코리네박테리움 속 미생물을 제공하는 것이다.
본 출원의 또 다른 목적은 상기 미생물을 배지에서 배양하는 단계를 포함하는, 분지쇄 아미노산 생산 방법을 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.
또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 출원에 기재된 본 출원의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 출원에 포함되는 것으로 의도된다.
본 출원의 하나의 양태는 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체를 제공한다.
상기 aroG 알돌라아제 변이체는, aroG 알돌라아제 활성을 갖는 폴리펩티드 또는 aroG 알돌라아제에서, 서열번호 1의 aroG 알돌라아제의 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된 변이체를 의미한다.
본 출원에서, "aroG 알돌라아제"는 다음의 반응을 촉매할 수 있는 효소이다.
phosphoenolpyruvate + D-erythrose 4-phosphate + H2O ↔ 3-deoxy-D-arabino-hept-2-ulosonate 7-phosphate + phosphate
본 출원의 aroG 알돌라아제는 본 출원에서 제공하는 aroG 알돌라아제 변이체를 제조하기 위해 변형이 가해지는 aroG 알돌라아제 또는 aroG 알돌라아제 활성을 갖는 폴리펩티드일 수 있다. 구체적으로, 자연적으로 발생하는 폴리펩티드 또는 야생형 폴리펩티드일 수 있고, 이의 성숙 폴리펩티드일 수 있으며, 이의 변이체 또는 기능적 단편을 포함할 수 있으나 본 출원의 aroG 알돌라아제 변이체의 모체(parent)가 될 수 있는 한 제한 없이 포함된다.
본 출원에서 상기 aroG 알돌라아제는 이에 제한되지는 않으나, 서열번호 1의 폴리펩티드일 수 있다. 일 구현예로, 서열번호 1의 폴리펩티드와 약 60%, 70%, 75%. 80%. 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 폴리펩티드일 수 있으며, 서열번호 1의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면 제한 없이 aroG 알돌라아제 범위에 포함된다.
본 출원의 aroG 알돌라아제는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있다. 구체적으로 aroG 유전자에 의해 코딩되는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원에서, "변이체"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)되어 상기 변이체의 변이 전 아미노산 서열과 상이하나 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 이러한 변이체는 일반적으로 상기 폴리펩티드의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 동정(identify)될 수 있다. 즉, 변이체의 능력은 변이 전 폴리펩티드에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. 상기 용어 "변이체"는 변이형, 변형, 변이형 폴리펩티드, 변이된 단백질, 변이 및 변이체 등의 용어(영문 표현으로는 modification, modified polypeptide, modified protein, mutant, mutein, divergent 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다.
또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 변이체의 N-말단에는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이동(translocation)에 관여하는 시그널(또는 리더) 서열이 컨쥬게이트 될 수 있다. 또한 상기 변이체는 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.
본 출원에서 제공하는 변이체는 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된 aroG 알돌라아제 변이체일 수 있다. 그 예로, 상기 위치 중 2 이상, 3 이상, 또는 4개의 아미노산 전부가 치환된 것일 수 있다. 그러나 이에 제한되지 않는다.
상기 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번 위치에 상응하는 아미노산은 아르기닌이거나; 310번 아미노산에 상응하는 아미노산은 라이신이거나; 403번 아미노산에 상응하는 아미노산은 아르기닌이거나; 및/또는 462번 아미노산에 상응하는 아미노산은 글루탐산 일 수 있다.
본 출원에서 제공하는 변이체는, 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번 위치에 상응하는 아미노산이 아르기닌 외의 아미노산으로 치환; 310번 아미노산에 상응하는 아미노산이 라이신 외의 아미노산으로 치환; 403번 아미노산에 상응하는 아미노산이 아르기닌 외의 아미노산으로 치환; 및 462번 아미노산에 상응하는 아미노산이 글루탐산 외의 아미노산으로 치환되는 것 중 1 이상의 치환을 포함할 수 있으나 이에 제한되지 않는다.
상기 "다른 아미노산"은 치환 전 아미노산과 치환 전의 아미노산과 다른 아미노산이면 제한되지 않는다. 한편, 본 출원에서 '특정 아미노산이 치환되었다'고 표현하는 경우, 다른 아미노산으로 치환되었다고 별도로 표기하지 않더라도 치환 전의 아미노산과 다른 아미노산으로 치환되는 것임은 자명하다.
일 구현예로 본 출원의 변이체는 참조(reference) 단백질인 서열번호 1의 아미노산 서열에서 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 소수성(hydrophobic) 아미노산 또는 지방족(Aliphatic) 아미노산 중 치환 전 아미노산과 다른 아미노산으로 치환된 변이체일 수 있다.
구체적으로 상기 변이체는 서열번호 1의 아미노산 서열에서 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 소수성(비극성) 아미노산 또는 지방족 아미노산 중 하나의 아미노산으로 치환된 변이체일 수 있다. 상기 지방족 아미노산은 예를 들어, 글리신, 알라닌, 발린, 류신, 및 이소류신으로 이루어지는 군에서 선택되는 아미노산일 수 있으나, 이에 제한되지 않는다. 상기 소수성(비극성) 아미노산은 예를 들어, 글리신, 메티오닌, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 티로신, 및 트립토판으로 이루어지는 군에서 선택되는 아미노산일 수 있으나, 이에 제한되지 않는다.
일 구현예로 본 출원의 변이체는 서열번호 1의 아미노산 서열에서 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 크기(size)가 작은 아미노산 중 치환 전 아미노산과 다른 아미노산으로 치환된 변이체일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어 "크기가 작은 아미노산"은 20종 아미노산 중 상대적으로 크기가 작은 아미노산인 글리신, 알라닌, 세린, 트레오닌, 시스테인, 발린, 류신, 이소류신, 프롤린, 및 아스파라긴을 포함하는 것으로, 구체적으로는 글리신, 알라닌, 세린, 트레오닌, 시스테인, 발린, 류신, 이소류신 및 프롤린을 의미할 수 있으나, 이에 제한되지 않으며, 보다 구체적으로는 글리신, 알라닌, 발린, 류신, 이소류신, 세린, 및 트레오닌을 의미하는 것일 수 있으나 이에 제한되지 않는다.
보다 구체적으로, 본 출원의 변이체에서 다른 아미노산으로의 치환은 알라닌으로의 치환일 수 있으나, 이에 제한되지 않는다.
본 출원에서, 용어 "상응하는(corresponding to)"은, 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다.
예를 들어, 임의의 아미노산 서열을 서열번호 1과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 1의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.
이러한 정렬에는 예를 들어 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지 않고 당업계에 알려진 서열 정렬 프로그램, 쌍 서열(pairwise sequence) 비교 알고리즘 등을 적절히 사용할 수 있다.
일 구현예로, 본 출원의 변이체는 서열번호 1의 폴리펩티드와 약 60%, 70%, 75%. 80%. 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가지고, 서열번호 1의 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다.
일 구현예로, 본 출원의 변이체는 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25으로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다.
구체적으로, 본 출원의 변이체는 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25으로 기재된 아미노산 서열을 가지거나(having), 포함하거나(comprising), 이루어지거나(consisting of), 상기 아미노산 서열로 필수적으로 이루어질(essentially consisting of) 수 있다.
일 구현예로, 본 출원의 변이체는 서열번호 1의 아미노산 서열을 기준으로 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 알라닌이고, 상기 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25으로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 변이체도 본 출원의 범위 내에 포함됨은 자명하다.
예를 들어, 상기 아미노산 서열 N-말단, C-말단 그리고/또는 내부에 본 출원의 변이체의 기능을 변경하지 않는 서열 추가 또는 결실, 자연적으로 발생할 수 있는 돌연변이, 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 가지는 경우이다.
상기 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 단백질 또는 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.
본 출원에서 용어, '상동성 (homology)' 또는 '동일성 (identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.
일 구현예로, 본 출원의 변이체는 aroG 알돌라아제 활성을 가질 수 있다. 일 구현예로, 본 출원의 변이체는 야생형 혹은 비변이 aroG 알돌라아제에 비해, 분지쇄 아미노산 생산능이 증가하도록 하는 활성을 가질 수 있다. 일 구현예로, 본 출원의 변이체는 야생형 혹은 비변이 aroG 알돌라아제에 비해, 분지쇄 아미노산 생산경로의 부산물 생산수준이 감소하도록 하는 활성을 가질 수 있다. 일 구현예로, 본 출원의 변이체는 야생형 혹은 비변이 aroG 알돌라아제에 비해, 약화된 활성을 가지는 것일 수 있다. 그러나 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공한다.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.
본 출원의 변이체를 코딩하는 폴리뉴클레오티드는 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25으로 기재된 아미노산 서열을 코딩하는 염기서열을 포함할 수 있다. 본 출원의 일 예로, 본 출원의 폴리뉴클레오티드는 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24 또는 서열번호 26의 서열을 가지거나 포함할 수 있다. 또한, 본 출원의 폴리뉴클레오티드는 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24, 또는 서열번호 26의 서열로 이루어지거나, 필수적으로 구성될 수 있다.
본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 변이체를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 본 출원의 변이체의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 본 출원의 폴리뉴클레오티드는 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24, 또는 서열번호 26의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24 또는 서열번호 26의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다.
이때, 상기 상동성 또는 동일성을 갖는 서열에서, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24 또는 서열번호 26의 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산을 코딩하는 코돈은, 알라닌을 코딩하는 코돈 중 하나일 수 있다.
또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 본 출원의 폴리뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이드리드화할 수 있는 서열이라면 제한없이 포함될 수 있다. 상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(J. Sambrook et al.,Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al.,Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8 참조)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1ХSSC, 0.1% SDS, 구체적으로 60℃, 0.1ХSSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1ХSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.
구체적으로, 본 출원의 폴리뉴클레오티드와 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
상기 폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(예컨대, J. Sambrook et al., 상동).
본 출원의 또 다른 하나의 양태는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다. 상기 벡터는 상기 폴리뉴클레오티드를 숙주세포에서 발현시키기 위한 발현 벡터일 수 있으나, 이에 제한되지 않는다.
본 출원의 "벡터"는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDC계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDC, pDCM2, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.
일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이체를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체, 본 출원의 폴리뉴클레오티드 및 본 출원의 벡터를 포함하는, 코리네박테리움 속 미생물을 제공한다.
본 출원의 미생물은 본 출원의 변이형 폴리펩티드, 상기 폴리펩티드를 암호화하는 폴리뉴클레오티드, 또는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 포함할 수 있다.
본 출원에서 용어, "미생물" 또는 "균주"는 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩티드, 단백질 또는 산물의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.
본 출원의 균주는 본 출원의 변이체, 본 출원의 폴리뉴클레오티드 및 본 출원의 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 균주; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하도록 변형된 균주; 본 출원의 변이체, 또는 본 출원의 폴리뉴클레오티드를 발현하는 균주 (예컨대, 재조합 균주); 또는 본 출원의 변이체 활성을 갖는 균주 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.
본 출원의 균주는 분지쇄 아미노산 생산능을 가진 균주일 수 있다.
본 출원의 균주는 자연적으로 aroG 알돌라아제 또는 분지쇄 아미노산 생산능을 가지고 있는 미생물, 또는 aroG 알돌라아제 또는 분지쇄 아미노산 생산능이 없는 모균주에 본 출원의 변이체 또는 이를 코딩하는 폴리뉴클레오티드 (또는 상기 폴리뉴클레오티드를 포함하는 벡터)가 도입되거나 및/또는 분지쇄 아미노산 생산능이 부여된 미생물일 수 있으나 이에 제한되지 않는다.
일 예로, 본 출원의 균주는 본 출원의 폴리뉴클레오티드 또는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어, 본 출원의 변이체를 발현하는 세포 또는 미생물로서, 본 출원의 목적상 본 출원의 균주는 본 출원의 변이체를 포함하여 분지쇄 아미노산을 생산할 수 있는 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 균주는 천연의 야생형 미생물 또는 분지쇄 아미노산을 생산하는 미생물에 본 출원의 변이체를 코딩하는 폴리뉴클레오티드가 도입됨으로써 aroG 알돌라아제 변이체가 발현되어, 분지쇄 아미노산 생산능이 증가된 재조합 균주일 수 있다. 상기 분지쇄 아미노산 생산능이 증가된 재조합 균주는, 천연의 야생형 미생물 또는 aroG 알돌라아제 비변형 미생물 (즉, 야생형 aroG 알돌라아제를 발현하는 미생물)에 비하여 분지쇄 아미노산 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다.
일 예로, 상기 분지쇄 아미노산 생산능의 증가 여부를 비교하는 대상 균주인, aroG 알돌라아제 비변형 미생물은 코리네박테리움 글루타미쿰 ATCC13032 균주 일 수 있다. 다른 예로, 상기 분지쇄 아미노산 생산능의 증가 여부를 비교하는 대상 균주인, aroG 알돌라아제 비변형 미생물은 CJL-8109, KCCM12739P(CA10-3101), KCCM11201P 일 수 있으나, 이에 제한되지 않는다.
일 예로, 상기 재조합 균주는 변이 전 모균주 또는 비변형 미생물의 분지쇄 아미노산 생산능에 비하여 약 1% 이상, 구체적으로는 약 3%, 약 5% 이상 높아진 것일 수 있으나, 변이 전 모균주 또는 비변형 미생물의 생산능에 비해 +값의 증가량을 갖는 한, 이에 제한되지 않는다.
다른 예로, 상기 재조합 균주는 변이 전 모균주 또는 비변형 미생물에 비하여 분지쇄 아미노산 생산 경로에서 생성되는 부산물의 생산량이 약 50% 이하, 구체적으로는 약 30% 이하, 약 10% 이하로 낮아진 것일 수 있고, 또는 부산물이 생산되지 않는 것일 수 있으나, 이에 제한되지 않는다.
상기 용어 "약(about)"은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.
본 출원에서 "분지쇄 아미노산" 은 곁사슬에 분지알킬기가 있는 아미노산을 말하며, 발린, 류신 및 이소류신을 포함한다. 구체적으로, 본 출원에서 상기 분지쇄 아미노산은 L-분지쇄 아미노산일 수 있고, 상기 L-분지쇄 아미노산은 L-발린, L-류신 및 L-이소류신 중에서 선택되는 1 이상 일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 분지쇄 아미노산 생산 경로에서 생성되는 부산물은, 분지쇄 아미노산 이외의 물질을 의미하며, 구체적으로는 방향족(aromatic) 아미노산, 보다 구체적으로는 L-타이로신 및 L-페닐알라닌 중에서 선택되는 1 이상일 수 있다. 그러나 이에 제한되지 않는다.
본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 출원의 aroG 알돌라아제 변이체가 도입되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 "변형 전 균주", "변형 전 미생물", "비변이 균주", "비변형 균주", "비변이 미생물" 또는 "기준 미생물"과 혼용될 수 있다.
일 구현예로, 본 출원의 미생물은 코리네박테리움 스테이셔니스(Corynebacterium stationis), 코리네박테리움 크루디락티스(Corynebacterium crudilactis), 코리네박테리움 데세르티(Corynebacterium deserti), 코리네박테리움 이피시엔스(Corynebacterium efficiens), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 싱굴라레(Corynebacterium singulare), 코리네박테리움 할로톨레란스(Corynebacterium halotolerans), 코리네박테리움 스트리아툼(Corynebacterium striatum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 폴루티솔리(Corynebacterium pollutisoli), 코리네박테리움 이미탄스(Corynebacterium imitans), 코리네박테리움 테스투디노리스(Corynebacterium testudinoris) 또는 코리네박테리움 플라베스센스(Corynebacterium flavescens)일 수 있다.
본 출원의 미생물은 분지쇄 아미노산 생산능을 증가하도록 하는 변이를 추가로 더 포함할 수 있다.
일 구현예로, 본 출원의 미생물은 이소프로필말레이트 신타제, 호모세린 디하이드로게나제, 쓰레오닌 디하이드라타제, 분지쇄 아미노산 아미노트랜스퍼라제, 시트레이트 신타아제 중 하나 이상의 활성 변경을 포함할 수 있다.
일 구현예로, 본 출원의 미생물은 이소프로필말레이트 신타제(isopropylmalate synthase), 분지쇄 아미노산 아미노트랜스퍼라제(branched amino acid aminotransferase), 호모세린 디하이드로게나제(homoserine dehydrogenase), 및 쓰레오닌 디하이드라타제(threonine dehydratase) 중 하나 이상의 활성이 추가적으로 강화된 미생물일 수 있다.
일 구현예로, 본 출원의 미생물은 시트레이트 신타아제(citrate synthase) 의 활성이 추가적으로 약화된 미생물일 수 있다.
그러나 전술한 내용에 제한되지 않고, 생산하고자 하는 분지쇄 아미노산에 따라 당업자는 미생물이 포함하는 추가적인 변형을 적절히 선택할 수 있다.
본 출원에서 용어, 폴리펩티드 활성의 "강화"는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 “내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "강화", "상향조절", "과발현" 또는 "증가"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다.
상기 강화는 외래의 폴리펩티드를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.
상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 폴리펩티드의 강화는
1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가;
2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체;
3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;
4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;
5) 폴리펩티드 활성이 강화도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형 (예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);
6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입;
7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화;
8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
보다 구체적으로,
상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.
상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.
공지된 강력한 프로모터의 예에는 cj1 내지 cj7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터 등이 있으나, 이에 제한되지 않는다.
상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.
상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.
상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.
상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.
이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 발현량가 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위 (engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, 폴리펩티드 활성의 "약화" 는 내재적 활성에 비하여 활성이 감소되거나 또는 활성이 없는 것을 모두 포함하는 개념이다. 상기 약화는 불활성화(inactivation), 결핍(deficiency), 하향조절(down-regulation), 감소(decrease), 저하(reduce), 감쇠(attenuation) 등의 용어와 혼용될 수 있다.
상기 약화는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드의 변이 등으로 폴리펩티드 자체의 활성이 본래 미생물이 가지고 있는 폴리펩티드의 활성에 비해 감소 또는 제거된 경우, 이를 코딩하는 폴리뉴클레오티드의 유전자의 발현 저해 또는 폴리펩티드로의 번역(translation) 저해 등으로 세포 내에서 전체적인 폴리펩티드 활성 정도 및/또는 농도(발현량)가 천연형 균주에 비하여 낮은 경우, 상기 폴리뉴클레오티드의 발현이 전혀 이루어지지 않은 경우, 및/또는 폴리뉴클레오티드의 발현이 되더라도 폴리펩티드의 활성이 없는 경우 역시 포함할 수 있다. 상기 "내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주, 야생형 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "불활성화, 결핍, 감소, 하향조절, 저하, 감쇠"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성에 비하여 낮아진 것을 의미한다.
이러한 폴리펩티드의 활성의 약화는, 당업계에 알려진 임의의 방법에 의하여 수행될 수 있으나 이로 제한되는 것은 아니며, 당해 분야에 잘 알려진 다양한 방법의 적용으로 달성될 수 있다(예컨대, Nakashima N et al., Bacterial cellular engineering by genome editing and gene silencing. Int J Mol Sci. 2014;15(2):2773-2793, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 폴리펩티드의 약화는
1) 폴리펩티드를 코딩하는 유전자 전체 또는 일부의 결손;
2) 폴리펩티드를 코딩하는 유전자의 발현이 감소하도록 발현조절영역(또는 발현조절서열)의 변형;
3) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 구성하는 아미노산 서열의 변형(예컨대, 아미노산 서열 상의 1 이상의 아미노산의 삭제/치환/부가);
4) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 코딩하는 유전자 서열의 변형 (예를 들어, 폴리펩티드의 활성이 제거 또는 약화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 핵산염기 서열 상의 1 이상의 핵산염기의 삭제/치환/부가);
5) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;
6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입;
7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가;
8) 폴리펩티드를 코딩하는 유전자 서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE); 또는
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
예컨대,
상기 1) 폴리펩티드를 코딩하는 상기 유전자 일부 또는 전체의 결손은, 염색체 내 내재적 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드 전체의 제거, 일부 뉴클레오티드가 결실된 폴리뉴클레오티드로의 교체 또는 마커 유전자로 교체일 수 있다.
또한, 상기 2) 발현조절영역(또는 발현조절서열)의 변형은, 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 발현조절영역(또는 발현조절서열) 상의 변이 발생, 또는 더욱 약한 활성을 갖는 서열로의 교체일 수 있다. 상기 발현조절영역에는 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 및 전사와 해독의 종결을 조절하는 서열을 포함하나, 이에 한정되는 것은 아니다.
또한, 상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 낮은 다른 개시코돈을 코딩하는 염기서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
또한, 상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은 폴리펩티드의 활성을 약화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 약한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 없도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 예를 들면, 폴리뉴클레오티드 서열 내 변이를 도입하여 종결 코돈을 형성시킴으로써, 유전자의 발현을 저해하거나 약화시킬 수 있으나, 이에 제한되지 않는다.
상기 6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입은 예를 들어 문헌 [Weintraub, H. et al., Antisense-RNA as a molecular tool for genetic analysis, Reviews - Trends in Genetics, Vol. 1(1) 1986]을 참고할 수 있다.
상기 7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가는 mRNA 번역을 불가능하게 하거나 속도를 저하시키는 것일 수 있다.
상기 8) 폴리펩티드를 코딩하는 유전자서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE)는 상기 폴리펩티드를 코딩하는 유전자의 전사체에 상보적인 안티센스 뉴클레오티드를 만들어 활성을 약화하는 것일 수 있다.
본 출원의 미생물에서, 변이체, 폴리뉴클레오티드, 벡터 및 분지쇄 아미노산에 대해서는 다른 양태에서 기재한 바와 같다.
본 출원의 다른 하나의 양태는 본 출원의 코리네박테리움 속 미생물을 배지에서 배양하는 단계를 포함하는, 분지쇄 아미노산 생산 방법을 제공한다.
본 출원에서, 용어 "배양"은 본 출원의 코리네박테리움 속 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, "배지"는 본 출원의 코리네박테리움 속 미생물을 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 코리네박테리움 속 미생물의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 코리네박테리움 속 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.
구체적으로, 코리네박테리움 속 미생물에 대한 배양 배지는 문헌["Manual of Methods for General Bacteriology" by the American Society for Bacteriology (Washington D.C., USA, 1981)]에서 찾아 볼 수 있다.
본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 리신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.
또한, 본 출원의 코리네박테리움 속 미생물의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.
본 출원의 배양에서 배양온도는 20 내지 45℃, 구체적으로는 25 내지 40℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 배양에 의하여 생산된 분지쇄 아미노산은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.
본 출원의 분지쇄 아미노산 생산방법은, 본 출원의 코리네박테리움 속 미생물을 준비하는 단계, 상기 균주를 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다.
본 출원의 분지쇄 아미노산 생산방법은, 상기 배양에 따른 배지(배양이 수행된 배지) 또는 본 출원의 코리네박테리움 속 미생물로부터 분지쇄 아미노산을 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.
상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 분지쇄 아미노산을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 분지쇄 아미노산을 회수할 수 있다.
또한, 본 출원의 분지쇄 아미노산 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 분지쇄 아미노산 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 이시적(또는 연속적)으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 방법에서, 변이체, 폴리뉴클레오티드, 벡터 및 미생물 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체, 상기 변이체를 코딩하는 폴리뉴클레오타이드, 상기 폴리뉴클레오타이드를 포함하는 벡터 또는 본 출원의 폴리뉴클레오티드를 포함하는 코리네박테리움 속 미생물; 이를 배양한 배지; 또는 이들 중 2 이상의 조합을 포함하는 분지쇄 아미노산 생산용 조성물을 제공하는 것이다.
본 출원의 조성물은 분지쇄 아미노산 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 조성물에서, 변이체, 폴리뉴클레오티드, 벡터, 균주, 배지 및 분지쇄 아미노산 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 다른 하나의 양태는 본 출원의 aroG 알돌라아제 변이체; 상기 aroG 알돌라아제 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는 미생물의, 분지쇄 아미노산 생산 용도를 제공한다.
본 출원의 용도에서, 변이체, 폴리뉴클레오티드, 벡터 및 미생물 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 aroG 알돌라아제 변이체를 이용하는 경우, 이를 이용하지 않는 경우에 비해 부산물 생산량이 저감되며 고수율의 분지쇄 아미노산 생산이 가능하다.
이하 본 출원을 실시예 및 실험예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예 및 실험예는 본 출원을 예시적으로 설명하기 위한 것으로 본 출원의 범위가 이들 실시예 및 실험예에 한정되는 것은 아니다.
이하 본 출원을 실시 예에 의해 보다 상세하게 설명한다. 그러나 이들 실시 예는 본 출원을 예시적으로 설명하기 위한 것으로, 본 출원의 범위가 이들 실시 예에 의해 제한되는 것은 아니며, 본 출원이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
실시예 1: aroG 알돌라아제 변이 발굴
실시예 1-1. aroG 알돌라아제를 포함하는 벡터 제작
Phospho-2-dehydro-3-deoxyheptonate aldolase의 활성을 가지는 aroG 알돌라아제 변이 라이브러리를 제작하기 위해 우선 aroG 알돌라아제를 포함하는 재조합 벡터를 제작하였다. 아생형 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 유래의 aroG 알돌라아제 (서열번호 1, KEGG ID: NCgl2098)을 암호화하는 aroG 유전자 (서열번호 2)를 증폭하기 위하여, 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) ATCC13032 야생주의 염색체를 주형으로 서열번호 11및 12의 프라이머를 94 ℃에서 1 분간 변성, 58 ℃에서 30 초간 결합, 72 ℃에서 1 분간 Pfu DNA 중합효소로 중합하는 조건을 25 회 반복하는 PCR방법을 을 수행하였다. 사용한 프라이머의 구체적인 서열은 표 1에 기재하였다. 상기 증폭산물을 TOPO Cloning Kit (Invitrogen)를 이용하여 대장균 벡터 pCR2.1에 클로닝하여 'pCR- aroG'를 얻었다.
서열번호 | 서열(5'->3') |
서열번호 11 | TGATGCGCGTCATAATTTAG |
서열번호 12 | CTCATCTCTGACTGGACGTG |
실시예 1-2. aroG 알돌라아제 변이 라이브러리 제작
상기 실시 예 1-1에서 제작된 벡터를 기반으로 error-prone PCR kit (clontech Diversify® PCR Random Mutagenesis Kit)를 이용하여 aroG 알돌라아제 변이 라이브러리를 제작하였다. 1000bp 당 0 내지 3개의 변이가 발생할 수 있는 조건에서, 서열번호 11 및 서열번호 12를 프라이머로 하여 PCR 반응을 수행하였다. 구체적으로, 94℃에서 30초 동안 프리-히팅(pre-heating) 후, 94℃에서 30초, 68℃에서 1분 30초의 과정을 25회(cycle) 반복하여 PCR 반응을 수행하였다. 이 때 얻어진 PCR 산물을 megaprimer (50~125ng) 로 하여 95℃에서 50초, 60℃에서 50초, 68 ℃에서 12분의 과정을 25회 반복 수행한 후 DpnI 처리하여, 대장균 DH5α에 열 충격방법을 통해 형질 전환하여 카나마이신 (25 mg/L) 이 포함된 LB 고체배지에 도말 하였다. 형질전환 된 콜로니 20종을 선별한 후 플라스미드를 획득하여 염기서열을 분석한 결과 2 mutations/kb 빈도로 서로 다른 위치에 변이가 도입된 것을 확인하였다. 약 20,000개의 형질전환 된 대장균 콜로니를 취하여 플라스미드를 추출하였고, 이를 'pTOPO-aroG-library' 로 명명하였다.
실시예 2: 제작한 라이브러리 평가 및 변이체 선별
실시예 2-1. L-류신 생산량이 증가된 변이 균주 선별
상기 실시예 1-2에서 제작된 pTOPO-aroG-library를 야생형 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) ATCC13032 에 전기천공법으로 형질 전환한 후, 카나마이신 25mg/L를 함유한 영양배지(표 2)에 도말하여 변이 유전자가 삽입된 균주 10,000개의 콜로니를 선별하였다. 선별된 각 콜로니를 ATCC13032/pTOPO_aroG(mt)1부터 ATCC13032/ pTOPO_aroG(mt) 10,000 로 명명하였다.
확보된 10,000개의 콜로니 중 L-류신 생산이 늘어나며 방향족 아미노산 중 L-타이로신 및 L-페닐알라닌이 감소되는 콜로니를 확인하기 위해 각각의 콜로니에 대해 하기와 같은 방법으로 발효 역가 평가를 진행하였다.
배지 종류 | 성분 |
생산배지 | 포도당 100g, (NH4)2SO4 40g, 대두 단백질(Soy Protein) 2.5g, 옥수수 침지 고형분(Corn Steep Solids) 5 g, 요소 3g, KH2PO4 1g, MgSO4·7H2O 0.5g, 바이오틴 100㎍, 티아민 염산염 1,000㎍, 칼슘-판토텐산 2000㎍, 니코틴아미드 3,000㎍, CaCO3 30g; (증류수 1리터 기준), pH 7.0 |
영양배지 | 포도당 10g, 육즙 5g, 폴리펩톤 10g, 염화나트륨 2.5g, 효모엑기스 5g, 한천 20g, 유레아 2g (증류수 1리터 기준) |
가압 살균한 생산배지 (표2) 25 ㎖에 25 ug/ml의 카나마이신을 함유하는 250 ㎖ 코너-바풀 플라스크에 각 콜로니를 백금이를 이용하여 접종한 후, 30 ℃에서 60 시간 동안 200 rpm으로 진탕 배양하였다. 배양 종료 후 고속 액체 크로마토그래피 (HPLC, SHIMAZDU LC20A)를 이용한 방법에 의해 L-류신 및 방향제 아미노산 중 L-타이로신 및 L-페닐알라닌을 측정하였다.
확보된 10,000개의 콜로니 중 야생형 코리네박테리움 글루타미쿰 균주(ATCC13032) 대비 L-류신 생산능이 가장 향상된 균주 (ATCC13032 /pTOPO_aroG(mt)2256, ATCC13032/pTOPO_aroG(mt)6531, ATCC13032 /pTOPO_aroG(mt)8316, ATCC13032/pTOPO_aroG(mt)9426 4종을 선별하였다. 선별된 균주에서 생산된 L-류신(Leu), L-타이로신(Tyr), L-페닐알라닌(Phe)의 농도는 아래 표 3와 같다.
균주명 | Leu (g/L) | Tyr (g/L) | Phe (g/L) |
ATCC13032 | 0.87 | 1.28 | 1.87 |
ATCC13032/pTOPO_aroG (mt)2256 | 1.25 | 0.43 | 0.57 |
ATCC13032/pTOPO_aroG (mt)6531 | 1.23 | 0.15 | 0.19 |
ATCC13032/pTOPO_aroG (mt)8316 | 1.31 | 0.54 | 0.63 |
ATCC13032/pTOPO_aroG (mt)9426 | 1.27 | 0.31 | 0.34 |
상기 표 3에 나타난 바와 같이, aroG 유전자에 변이가 있는 코리네박테리움 글루타미쿰 ATCC13032/pTOPO_aroG(mt)2256은 모균주인 코리네박테리움 글루타미쿰 ATCC13032에 비해 L-류신 생산능이 약 1.4배 향상됨을 확인하였다. ATCC13032 /pTOPO_aroG(mt)6531, ATCC13032 /pTOPO_aroG(mt)8316, ATCC13032 /pTOPO_aroG(mt)9426은 모균주 대비 L-류신 생산량이 각각 약 1.4배 향상됨을 확인하였다. ATCC13032/pTOPO_aroG(mt)2256, ATCC13032/pTOPO_aroG(mt)6531, ATCC13032/pTOPO_aroG(mt)8316, ATCC13032/pTOPO_aroG(mt)9426 4종 모두 L-타이로신이 2.4배 내지 8.5배, L-페닐알라닌이 3배 내지 10배 감소됨을 확인하였다.
실시예 2-2. L-류신 생산량 증가 및 방향제 아미노산 생산량 감소된 변이 균주의 변이 확인
선별된 변이 균주 4종의 aroG 유전자 변이를 확인하기 위하여, 표 1에 기재된 서열번호 11과 서열번호 12의 프라이머를 이용하여 각 변이 균주의 DNA를 주형으로 하여 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분의 조건으로 PCR을 수행하고 DNA시퀀싱을 진행하였다.
시퀀싱 결과, ATCC13032/pTOPO_aroG (mt)2256 균주는 aroG 유전자의 649번째, 650번째, 651번째 뉴클레오티드인 CGC가 GCG로 치환되어 있음을 확인하였다. 이는 aroG 알돌라아제의 217번째 아미노산인 아르기닌이 알라닌으로 치환된 변이체(이하, R217A)를 암호화할 수 있음을 의미한다. aroG 알돌라아제 변이체 (R217A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 3 및 4와 같다.
또한 ATCC13032/pTOPO_aroG(mt)6531 균주는 aroG 유전자의 928번째, 929번째 뉴클레오티드인 AA가 GC로 치환되어 있음을 확인하였다. 이는 aroG 알돌라아제의 310번째 아미노산인 라이신이 알라닌으로 치환된 변이체(이하, K310A)를 암호화할 수 있음을 의미한다. aroG 알돌라아제 변이체 (K310A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 5 및 6과 같다.
ATCC13032/pTOPO_aroG(mt)8316 균주는 aroG 유전자의 1207번째-1209번째 뉴클레오티드인 CGC가 GCG로 치환되어 있음을 확인하였다. 이는 aroG 알돌라아제의 403번째 아미노산인 아르기닌이 알라닌으로 치환된 변이체(이하, R403A)를 암호화할 수 있음을 의미한다. aroG 알돌라아제 변이체 (R403A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 7 및 8과 같다.
ATCC13032/pTOPO_aroG(mt)9426 균주는 DAHP 유전자의 1385번째-1386번째 뉴클레오티드인 AA가 CG로 치환되어 있음을 확인하였다. 이는 aroG 알돌라아제의 462번째 아미노산인 글루타메이트가 알라닌으로 치환된 변이체(이하, E462A)를 암호화할 수 있음을 의미한다. aroG 알돌라아제 변이체 (E462A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 9 및 10와 같다.
따라서, 이하 실시예에서는, 상기 변이(R217A, K310A, R403A, E462A)가 코리네 박테리움 속 미생물의 L-류신 및 방향족 아미노산 생산에 영향을 미치는지 확인하고자 하였다.
실시예 3: 선별된 변이 균주의 L-류신, L-타이로신, L-페닐알라닌 생산능 확인
실시예 3-1. aroG 알돌라아제 변이를 포함하는 삽입 벡터 제작
상기 실시 예 2에서 선별된 변이를 균주 내로 도입하기 위해 삽입용 벡터를 제작하고자 하였다. aroG (R217A, K310A, R403A, E462A) 변이 도입용 벡터 제작은 위치 지정 돌연변이 생성 (Site directed mutagenesis) 방법을 사용하였다. 코리네박테리움 글루타미쿰 ATCC13032 야생형의 염색체를 주형으로 R217A 변이를 생성하기 위해 서열번호 13 및 14의 프라이머, 서열번호 15 및 16의 프라이머 쌍을 이용하였고, K310A 변이를 생성하기 위해 서열번호 13 및 17의 프라이머, 서열번호 15 및 18의 프라이머 쌍을 이용하였고 PCR을 수행하였다. R403A 변이를 생성하기 위해 서열번호 13 및 19의 프라이머, 서열번호 15 및 20의 프라이머 쌍을 이용하였고, E462A 변이를 생성하기 위해 서열번호 13 및 21의 프라이머, 서열번호 15 및 22의 프라이머 쌍을 이용하였고 PCR을 수행하였다. 구체적으로, 94℃에서 5분간 변성 후에 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분의 조건으로 PCR을 수행하였다. 사용한 프라이머의 구체적인 서열은 표 4에 기재하였다.
서열번호 | 서열(5'->3') |
서열번호 13 | GTGAATTCGAGCTCGGTACCCAGTTGAATGCTACCAACTTG |
서열번호 14 | CACGAGCAAGAGCCTCGTAcgcTGCACCAGCTGGG |
서열번호 15 | GGTCGACTCTAGAGGATCCCCGCTGTTATTACTGTGCCTG |
서열번호 16 | GAACTCCCCAGCTGGTGCAgcgTACGAGGCTCTTGCTCG |
서열번호 17 | GGGTGATACCAGGACCAATcgcGATGCCGATTGGGTTAG |
서열번호 18 | CTCTAACCCAATCGGCATCgcgATTGGTCCTGGTATCAC |
서열번호 19 | CTGGGTGGGTGCCCAATGCcgcGTGGACCTCGAAGAAG |
서열번호 20 | GGGCTTCTTCGAGGTCCACgcgGCATTGGGCACCCAC |
서열번호 21 | AAGCTTAGTTACGCAGCATcgcTGCAACGAGGAAAGCC |
서열번호 22 | GTTGGCTTTCCTCGTTGCAgcgATGCTGCGTAACTAAGC |
그 결과 얻어진 PCR 산물을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터(한국공개특허 KR 10-2020-0136813 A)와 In-Fusion 효소를 이용해 DNA 단편 간의 말단 15 base의 상동서열을 fusion 시켜 클로닝하여 aroG의 아미노산을 치환하는 벡터 'pDCM2-aroG(R217A)', 'pDCM2-aroG (K310A)', 'pDCM2-aroG(R403A)', 및 'pDCM2-aroG(E462A)'를 제작하였다. 또한 변이체를 조합하여 진행하여 이에 따라 aroG의 217번, 310번, 403번 및 462번 아미노산을 치환하는 벡터 'pDCM2-aroG (R217A, K310A, E462A)', 'pDCM2-aroG (R217A, K310A, R403A, E462A)'를 제작하였다. aroG 알돌라아제 변이체 (R217A, K310A, E462A) 의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 23 및 24 와 같다. 또한 aroG 알돌라아제 변이체 (R217A, K310A, R403A, E462A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 25 및 26와 같다.
실시예 3-2. ATCC13032 균주 내 변이체 도입 및 평가
상기 실시예 3-1에서 제작한 pDCM2- aroG (R217A), pDCM2- aroG (K310A), pDCM2- aroG (R403A), pDCM2- aroG (E462A), pDCM2- aroG (R217A, K310A, E462A), pDCM2- aroG (R217A, K310A, R403A, E462A)벡터를 ATCC13032에 전기천공법으로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 aroG 유전자 변이 도입의 여부는 표1에 기재된 서열번호 11와 서열번호 12의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 변이가 도입 되었음을 확인하였다. 제작된 균주는 총 5종이며, ATCC13032 _aroG_R217A, ATCC13032 _aroG_K310A, ATCC13032 _aroG_R403A, ATCC13032 _aroG_E462A, ATCC13032 _aroG_(R217A, K310A, E462A), ATCC13032 _aroG_(R217A, K310A, R403A, E462A)로 명명하였다.
상기 제작된 총 6종의 균주 L-류신 및 방향족 아미노산 생산능을 평가하기 위해 플라스크 발효 역가 평가를 진행하였다. 각각의 생산배지 25 ㎖을 함유하는 250 ㎖ 코너-바풀 플라스크에 모균주인 코리네박테리움 글루타미쿰 ATCC13032 및 상기 제작한 ATCC13032 _aroG_R217A, ATCC13032 _aroG_K310A, ATCC13032 _aroG_R403A, ATCC13032 _aroG_E462A, ATCC13032 _aroG_(R217A, K310A, E462A), ATCC13032 _aroG_(R217A, K310A, R403A, E462A)을 각각 1백금이 접종한 후, 30 ℃에서 60 시간 동안 200 rpm으로 진탕 배양하여 L-류신을 생산하였다. 배양종료 후 HPLC로 L-류신, L-타이로신 및 L-페닐알라닌의 생산량을 측정하였다. 실험한 각 균주에 대한 배양액 중의 류신 농도는 아래 표 5와 같다.
균주명 | Leu (g/L) | Tyr (g/L) | Phe (g/L) |
ATCC13032 | 0.87 | 1.28 | 1.87 |
ATCC13032 _aroG_R217A | 1.17 | 0.41 | 0.54 |
ATCC13032 _aroG_K310A | 1.19 | 0.15 | 0.13 |
ATCC13032 _aroG_R403A | 1.25 | 0.48 | 0.65 |
ATCC13032 _aroG_E462A | 1.27 | 0.28 | 0.32 |
ATCC13032 _aroG_(R217A, K310A, E462A) | 1.35 | 0.32 | 0.25 |
ATCC13032 _aroG_(R217A, K310A, R403A, E462A) | 1.30 | 0.28 | 0.30 |
상기 표 5에 나타난 바와 같이, ATCC13032 _aroG_R217A, ATCC13032 _aroG_K310A, ATCC13032 _aroG_R403A, ATCC13032 _aroG_E462A, ATCC13032 _aroG_(R217A, K310A, E462A), ATCC13032 _aroG_(R217A, K310A, R403A, E462A)는 모균주인 코리네박테리움 글루타미쿰 ATCC13032 에 비해 L-류신의 수율이 약 1.35 배 내지 1.55배 향상됨을 확인하였다. 또한 L-타이로신의 수율이 2.5배 내지 8.5배 감소되었으며 L-페닐알라닌이 약 3.5배 내지 14배 감소 됨을 확인하였다.
실시예 4: 류신 생산주에서 aroG 선별 변이의 류신 및 타이로신, 페닐알라닌 생산능 확인
코리네박테리움 속 야생형의 균주는 류신을 생산하더라도 아주 극미량이 생산될 뿐이다. 이에 ATCC13032 유래의 류신 생산 균주를 제작하고, 선별한 변이를 도입하여 류신 및 타이로신, 페닐알라닌 생산능을 확인 하는 실험을 진행하였다. 구체적인 실험은 다음과 같다.
실시예 4-1. L-류신 생산주 CJL-8109 균주 제작
고농도의 L-류신 생산을 위한 균주로서 (1) leuA 유전자의 1673 번째 뉴클레오티드인 G가 A로 치환되어 LeuA 단백질의 558 번째 아미노산인 아르기닌이 히스티딘으로 치환되는 변이(R558H)와 (2) leuA 유전자의 1682 번째, 1683 번째 뉴클레오티드인 GC가 AT로 치환되어 561 번째 아미노산인 글리신이 아스파르트산으로 치환되는 변이(G561D)와 (3) leuA 유전자의 739번째, 740번째 뉴클레오티드인 CC 가 TG 로 치환되어 247번째 아미노산인 프롤린이 시스테인으로 치환되는 변이 (P247C) 를 포함하는 ATCC13032 유래의 균주를 제조하였다.
구체적으로 상기의 leuA 유전자 변이를 포함하는 pDCM2-leuA(P247C, R558H, G561D) 벡터를 코리네박테리움 글루타미쿰 ATCC13032 에 전기천공법으로 형질전환하고 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, leuA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 표 6의 서열번호 27와 서열번호 28의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회 반복, 72℃ 5분)을 수행하고 염기서열을 분석하여 P247C, R558H, G561D 변이가 도입된 것을 확인하였다. pDCM2-leuA(P247C, R558H, G561D) 벡터로 형질전환된 ATCC13032_leuA_(P247C, R558H, G561D) 균주를 ‘CJL-8105’으로 명명하였다.
서열번호 | 서열(5'->3') |
27 | TATGCTTCACCACATGACTTC |
28 | AAATCATTTGAGAAAACTCGAGG |
제작한 CJL-8105 균주에 L-류신 생산능을 높여주기 위해 분지쇄 아미노산 아미노트랜스퍼라제 (branched-chain amino acid aminotransferase)를 코딩하는 유전자인 ilvE 변이체 (V156A)가 도입된 균주를 제작하였다. (대한민국 등록특허 KR 10-2143964 B1). 구체적으로 상기의 ilvE 유전자 변이를 포함하는 pDCM2-ilvE(V156A) 벡터를 코리네박테리움 글루타미쿰 CJL-8105에 전기천공법으로 형질전환하고 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, ilvE 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 표 7의 서열번호 29와 서열번호 30의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회 반복, 72℃ 5분)을 수행하고 염기서열을 분석하여 V156A 변이가 도입된 것을 확인하였다. pDCM2-ilvE(V156A) 벡터로 형질전환된 균주를 ‘CJL-8108’로 명명하였다.
서열번호 | 서열(5'->3') |
29 | GTCACCCGATCGTCTGAAG |
30 | GTCTTAAAACCGGTTGAT |
제작한 CJL-8108 균주에 L-류신 생산능을 높여주기 위해 시트레이트 신타아제 (Citrate Synthase) 활성을 약화시킨 gltA 변이체 (M312I; 서열번호 41)가 도입된 균주를 제작하였다. 구체적으로 상기의 gltA 유전자 변이를 포함하는 pDCM2-gltA(M312I) 벡터를 코리네박테리움 글루타미쿰 CJL-8108에 전기천공법으로 형질전환하고 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, gltA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 표 8의 서열번호 31와 서열번호 32의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회 반복, 72℃ 5분)을 수행하고 염기서열을 분석하여 M312I 변이가 도입된 것을 확인하였다. pDCM2-gltA(M312I) 벡터로 형질전환된 균주를 ‘CJL-8109’로 명명하였다.
서열번호 | 서열(5'->3') |
31 | CAATGCTGGCTGCGTACGC |
32 | CTCCTCGCGAGGAACCAACT |
실시예 4-2. CJL-8109 균주 내 aroG 알돌라아제 변이체 도입 및 평가
류신 생산 균주인 CJL-8109을 상기 실시예 3-1에서 제작한 pDCM2-aroG(R217A), pDCM2-aroG(K310A), pDCM2-aroG(R403A), pDCM2-aroG(E462A), pDCM2-aroG(R217A, K310A, E462A), pDCM2-aroG(R217A, K310A, R403A, E462A)벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질 전환된 균주의 aroG 유전자 변이 도입의 여부는 서열번호 11과 서열번호 12의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 aroG 알돌라아제 변이가 도입 되었음을 확인하였다. 제작된 CJL-8109_aroG_R217A를 CJL-8110로, CJL-8109_aroG_K310A를 CJL-8111, CJL-8109_aroG_R403A를 CJL-8112, CJL-8109_aroG_E462A를 CJL-8113, CJL-8109_aroG_(R217A, K310A, E462A)를 CA13-8114로, CJL-8109_aroG_(R217A, K310A, R403A, E462A)를 CJL-8115로 명명하였다.
상기 제작된 CJL-8110, CJL-8111, CJL-8112, CJL-8113, CA13-8114, CJL-8115 및 ATCC13032, CJL-8109 균주의 류신 생산능을 평가하였다. 실시예 2와 같은 방식으로 플라스크 배양을 진행하였고 배양 종료 후 HPLC를 이용한 방법에 의해 류신 및 방향족 아미노산 생산량을 측정하였으며, 배양 결과는 하기 표 9과 같다.
균주명 | Leu (g/L) | Tyr (g/L) | Phe (g/L) |
ATCC13032 | 0.87 | 1.28 | 1.87 |
CJL-8109 | 2.77 | 1.08 | 1.57 |
CJL8109_aroG_R217A : CJL-8110 | 3.55 | 0.31 | 0.49 |
CJL8109_aroG_K310A : CJL-8111 | 3.36 | 0.12 | 0.10 |
CJL8109_aroG_R403A : CJL-8112 | 3.65 | 0.35 | 0.56 |
CJL8109_aroG_E462A : CJL-8113 | 3.78 | 0.21 | 0.25 |
CJL8109_aroG_(R217A, K310A, E462A) : CA13-8114 | 3.85 | 0.19 | 0.22 |
CJL-8109_aroG_(R217A, K310A, R403A, E462A) : CJL-8115 | 3.80 | 0.19 | 0.23 |
상기 표 9 에 나타난 바와 같이, aroG 유전자에 R217A, K310A, R403A, E462A 변이가 추가로 있는 L-류신 생산균주 코리네박테리움 글루타미쿰 CJL-8110, CJL-8111, CJL-8112, CJL-8113, CA13-8114, CJL-8115은 모균주인 코리네박테리움 글루타미쿰 ATCC13032에 비해 L-류신 생산능이 약 4 내지 5 배 향상됨을 확인하였다. 또한 L-류신 생산균주 코리네박테리움 글루타미쿰 CJL-8110, CJL-8111, CJL-8112, CJL-8113, CA13-8114, CJL-8115은 모균주인 코리네박테리움 글루타미쿰 CJL-8109에 비해 L-류신 생산능이 약 1.2 내지 1.6 배 향상되었으며 L-타이로신 및 L-페닐알라닌이 약 10배 내지 20배 감소됨을 확인하였다.
상기 결과를 통해 aroG 알돌라아제의 아미노산 서열 중 217번째, 310번째, 403번째, 462번째 위치의 아미노산이 L-류신 생산 및 방향족 아미노산인 L-타이로신 및 L- 페닐알라닌 생산에 중요한 위치임을 확인할 수 있다.
상기 제작한 균주 CA13-8114는 2021.01.18일자로 부다페스트 조약하의 국제기탁기관인 한국미생물보존센터(KCCM)에 국제기탁하여 KCCM12931P로 기탁번호를 부여받았다.
실시예 5. 이소류신 생산주에서 aroG 선별 변이의 류신 및 타이로신, 페닐알라닌 생산능 확인
류신과 대표적인 분지쇄 아미노산인 이소류신에 대하여도 선별된 변이가 효과를 나타내는지를 확인하고자 코리네박테리움 속 이소류신 생산 균주에 도입하여 이소류신 생산능을 확인 하는 실험을 진행하였다. 구체적인 실험은 다음과 같다.
실시예 5-1. L-이소류신 생산주 CA10-3101 균주 제작
야생형 코리네박테리움 글루타미쿰 ATCC13032 로부터 L-이소류신 생산 균주를 개발하였다. 구체적으로, 생합성 경로에서 이소류신의 전구체인 쓰레오닌의 피드백 저해 해소를 위해 호모세린 디하이드로게나제를 코딩하는 유전자인 hom의 407번째 아미노산인 아르기닌(Arginine)을 히스티딘(Histidine)으로 치환하였다 (US 2020-0340022 A1). 구체적으로, hom(R407H) 변이가 도입된 균주들을 제작하기 위해 코리네박테리움 글루타미쿰 ATCC13032의 염색체를 주형으로 하여 서열번호 33 및 서열번호 34 혹은 서열번호 35 및 서열번호 36의 프라이머를 이용하여 PCR을 각각 수행하였다. 여기에서 사용된 프라이머 서열은 하기 표 10와 같다.
서열번호 | 서열(5'->3') |
33 | TCGAGCTCGGTACCCCGCTTTTGCACTCATCGAGC |
34 | CACGATCAGATGTGCATCATCAT |
35 | ATGATGATGCACATCTGATCGTG |
36 | CTCTAGAGGATCCCCGAGCATCTTCCAAAACCTTG |
PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복하였다. 그 결과, hom 유전자의 변이를 중심으로 5' 상단 부위의 1000 bp DNA 단편과 3' 하단 부위의 1000 bp의 DNA 단편을 각각 수득하였다. 증폭된 두 가지의 DNA 절편을 주형으로 하여, 서열번호 34 및 서열번호 35의 프라이머로 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃ 30초 변성, 55℃ 30초 어닐링, 72℃ 2분 중합을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다.
그 결과, 407번째 아르기닌이 히스티딘으로 치환된 호모세린 디하이드로게나제 변이체를 코딩하는 hom 유전자의 변이를 포함하는 2 kb의 DNA 단편이 증폭되었다. 증폭 산물을 PCR 정제 키트(PCR Purification kit, QUIAGEN)를 사용하여 정제하여 벡터 제작을 위한 삽입 DNA 단편으로 사용하였다. 정제한 증폭 산물을 제한효소 smaI으로 처리한 후, 65℃에서 20분간 열처리한 pDCM2 벡터와 상기 증폭 산물인 삽입 DNA 단편의 몰농도(M) 비율이 1:2가 되도록 하고, 인퓨전 클로닝 키트(Infusion Cloning Kit, TaKaRa)를 사용하여 제공된 매뉴얼에 따라 클로닝함으로써 hom(R407H) 변이를 염색체상에 도입하기 위한 벡터 pDCM2-R407H를 제작하였다.
제작된 벡터를 전기천공법으로 코리네박테리움 글루타미쿰 ATCC13032에 형질전환하고, 2차 교차 과정을 거쳐 염색체 상에서 hom(R407H) 변이를 포함하는 균주를 얻었으며, 이를 코리네박테리움 글루타미쿰 ATCC13032 hom(R407H)로 명명하였다.
제작한 ATCC13032 hom(R407H) 균주에 L-이소류신에 피드백 해제와 활성을 높여주기 위해 L-쓰레오닌 디하이드라타아제를 코딩하는 유전자인 ilvA 변이체(T381A, F383A)가 도입된 균주를 제작하였다. 더 구체적으로, ilvA(T381A, F383A) 변이가 도입된 균주들을 제작하기 위해 코리네박테리움 글루타미쿰 ATCC13032의 염색체를 주형으로 하여 서열번호 37 및 서열번호 38 혹은 서열번호 39 및 서열번호 40의 프라이머를 이용하여 PCR을 각각 수행하였다. 여기에서 사용된 프라이머 서열은 하기 표 11와 같다.
서열번호 | 서열 (5'→ 3') |
37 | TCGAGCTCGGTACCCATGAGTGAAACATACGTGTC |
38 | GCGCTTGAGGTACTCtgcCAGCGcGATGTCATCATCCGG |
39 | CCGGATGATGACATCgCGCTGgcaGAGTACCTCAAGCGC |
40 | CTCTAGAGGATCCCCCGTCACCGACACCTCCACA |
PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복하였다. 그 결과, ilvA 유전자의 변이를 중심으로 5' 상단 부위의 1126 bp DNA 단편과 3' 하단 부위의 286 bp의 DNA 단편을 각각 수득하였다. 증폭된 두 가지의 DNA 절편을 주형으로 하여, 서열번호 37 및 서열번호 40의 프라이머로 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃ 30초 변성, 55℃ 30초 어닐링, 72℃ 2분 중합을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다.
그 결과, 381번째 쓰레오닌이 알라닌으로, 383번째 페닐알라닌이 알라닌으로 치환된 쓰레오닌 디하이드라타제 변이체를 코딩하는 ilvA 유전자의 변이를 포함하는 1.4 kb의 DNA 단편이 증폭되었다. 증폭 산물을 PCR 정제 키트(PCR Purification kit, QAIGEN)를 사용하여 정제하여 벡터 제작을 위한 삽입 DNA 단편으로 사용하였다. 정제한 증폭 산물을 제한효소 smaI으로 처리한 후, 65℃에서 20분간 열처리한 pDCM2 벡터와 상기 증폭 산물인 삽입 DNA 단편의 몰농도(M) 비율이 1:2가 되도록 하고, 인퓨전 클로닝 키트(Infusion Cloning Kit, TaKaRa)를 사용하여 제공된 매뉴얼에 따라 클로닝함으로써 ilvA(T381A, F383A) 변이를 염색체상에 도입하기 위한 벡터 pDCM2- ilvA(T381A, F383A) 를 제작하였다. 제작된 벡터를 전기천공법으로 코리네박테리움 글루타미쿰 ATCC13032 hom(R407H) 에 형질전환하고, 2차 교차 과정을 거쳐 염색체 상에서 ilvA(T381A, F383A) 변이를 포함하는 균주를 얻었으며, 이를 코리네박테리움 글루타미쿰 CA10-3101이라 명명하였다.
실시예 5-2. CA10-3101 균주 내 aroG 알돌라아제 변이체 도입 및 평가
L-이소류신 생산 균주인 CA10-3101을 상기 실시예 3-1에서 제작한 pDCM2-aroG (R217A), pDCM2-aroG(K310A), pDCM2-aroG(R403A), pDCM2-aroG(E462A), pDCM2-aroG(R217A, K310A, E462A), pDCM2-aroG(R217A, K310A, R403A, E462A)벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질 전환된 균주의 aroG 유전자 변이 도입의 여부는 서열번호 11과 서열번호 12의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 aroG 알돌라아제에 변이가 도입 되었음을 확인하였다.
제작된 균주를 CA10-3101_aroG_R217A, CA10-3101_aroG_K310A, CA10-3101_aroG_R403A, CA10-3101_aroG_E462A, CA10-3101_aroG_(R217A, K310A, E462A), CA10-3101_aroG_(R217A, K310A, R403A, E462A)로 명명하였다.
상기 제작된 CA10-3101_aroG_R217A, CA10-3101_aroG_K310A, CA10-3101_aroG_R403A, CA10-3101_aroG_E462A, CA10-3101_aroG_(R217A, K310A, E462A), CA10-3101_aroG_(R217A, K310A, R403A, E462A)및 ATCC13032, CA10-3101 균주의 L-이소류신 생산능을 평가하였다. 이소류신 생산배지 25 ㎖을 함유하는 250 ㎖ 코너-바풀 플라스크에 모균주 및 상기 aroG 알돌라아제 변이주를 접종한 후, 32℃에서 60시간동안 200 rpm으로 진탕 배양하여 L-이소류신을 제조하였다.
본 실시예 에서 사용한 생산배지의 조성은 하기와 같다.
<생산배지>
포도당 10%, 효모추출물 0.2%, 황산암모늄 1.6%, 제1인산칼륨 0.1%, 황산마그네슘7수염 0.1%, 황산철7수염 10mg/ℓ, 황산망간1수염 10 mg/ℓ, 비오틴 200 ㎍/ℓ, pH 7.2
배양종료 후, 액체고속크로마토그래피(HPLC)를 이용하여 L-이소류신 및 부산물의 생산량을 측정하였고, 실험한 각 균주에 대한 배양액 중의 L-이소류신과 부산물의 농도는 하기 표 12에 나타내었다.
L-이소류신농도(g/L) | L-Tyr 농도 (g/L) |
L-Phe 농도 (g/L) |
|
ATCC13032 | 0.0 | 1.2 | 1.5 |
CA10-3101(모균주) | 2.2 | 0.3 | 0.6 |
CA10-3101_aroG_R217A | 2.5 | 0.0 | 0.1 |
CA10-3101_aroG_K310A | 2.3 | 0.0 | 0.0 |
CA10-3101_aroG_R403A | 2.5 | 0.0 | 0.1 |
CA10-3101_aroG_E462A | 2.6 | 0.0 | 0.0 |
CA10-3101_aroG_(R217A, K310A, E462A) | 2.6 | 0.0 | 0.0 |
CA10-3101_aroG_(R217A, K310A, R403A, E462A) | 2.7 | 0.0 | 0.0 |
상기 표 12에 나타난 바와 같이, aroG 유전자에 R217A, K310A, R403A, E462A 변이가 추가로 있는 L-이소류신 생산균주는 모균주인 코리네 글루타미쿰 CA10-3101에 비해 L-이소류신 생산능이 약 1.1 내지 1.2 배 향상되었으며 L-타이로신 및 L-페닐알라닌이 감소됨을 확인하였다.
상기 결과를 통해 aroG 알돌라아제의 아미노산 서열 중 217번째, 310번째, 403번째, 462번째 위치의 아미노산이 L-이소류신 생산 및 방향족 아미노산인 L-타이로신 및 L- 페닐알라닌 생산에 중요한 위치임을 확인할 수 있다
실시예 6: 발린 생산주에서 aroG 선별 변이의 발린 생산능 확인
류신과 같은 대표적인 분지쇄 아미노산 L-발린에 대하여도 선별된 변이가 효과를 나타내는지를 확인하고자 코리네박테리움 속 발린 생산 균주 KCCM11201P에서도 선별한 변이를 도입하여 발린 생산능을 확인 하는 실험을 진행하였다. 구체적인 실험은 다음과 같다.
실시예 6-1. KCCM11201P 균주 내 aroG 알돌라아제 변이체 도입 및 평가
해당 변이가 발린 생산능 증가에 효과가 있는지를 확인하기 위하여 L-발린 생산 균주인 코리네박테리움 글루타미쿰 KCCM11201P(US 8465962 B2) 균주를 이용하였다. 발린 생산 균주인 KCCM11201P를 상기 실시예 3-1에서 제작한 pDCM2-aroG (R217A), pDCM2-aroG(K310A), pDCM2-aroG(R403A), pDCM2-aroG(E462A), pDCM2-aroG(R217A, K310A, E462A), pDCM2-aroG(R217A, K310A, R403A, E462A)벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25 mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질 전환된 균주의 aroG 유전자 변이 도입의 여부는 서열번호 11과 서열번호 12의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 aroG 알돌라아제 변이가 도입 되었음을 확인하였다. 제작된 균주를 KCCM11201P -aroG(R217A), KCCM11201P - aroG(K310A), KCCM11201P - aroG(R403A), KCCM11201P - aroG(E462A), KCCM11201P - aroG(R217A, K310A, E462A) 및 KCCM11201P - aroG(R217A, K310A, R403A, E462A)로 각각 명명하였다.
상기 제작된 KCCM11201P -aroG(R217A), KCCM11201P - aroG(K310A), KCCM11201P - aroG (R403A), KCCM11201P - aroG (E462A), KCCM11201P - aroG(R217A, K310A, E462A) 및 KCCM11201P - aroG(R217A, K310A, R403A, E462A)균주의 발린 생산능을 평가하였다. 실시예 2와 같은 방식으로 플라스크 배양을 진행하였고 배양 종료 후 HPLC를 이용한 방법에 의해 발린 생산량을 측정하였으며, 배양 결과는 하기 표 13와 같다.
균주명 | Val (g/L) | Tyr (mg/L) | Phe (mg/L) |
KCCM11201P | 2.60 | 58.25 | 146.62 |
KCCM11201P - aroG(R217A) | 2.67 | 16.72 | 45.76 |
KCCM11201P - aroG (K310A) | 2.81 | 6.47 | 9.34 |
KCCM11201P - aroG (R403A) | 2.74 | 18.88 | 52.30 |
KCCM11201P - aroG (E462A) | 2.84 | 11.33 | 23.35 |
KCCM11201P - aroG(R217A, K310A, E462A) | 2.85 | 10.25 | 21.34 |
KCCM11201P - aroG(R217A, K310A, R403A, E462A) | 2.89 | 10.25 | 20.55 |
상기 표 13에 나타난 바와 같이, aroG 유전자에 R217A, K310A, R403A, E462A 변이가 추가로 있는 L-발린 생산균주 코리네박테리움 글루타미쿰 KCCM11201P -aroG (R217A), KCCM11201P - aroG (K310A), KCCM11201P - aroG (R403A), KCCM11201P - aroG (E462A), KCCM11201P - aroG(R217A, K310A, E462A) 및 KCCM11201P - aroG (R217A, K310A, R403A, E462A)은 모균주인 코리네박테리움 글루타미쿰 KCCM11201P에 비해 발린 생산능이 최대 1.11 배 향상되었으며 L-타이로신 및 L-페닐알라닌이 약 10배 내지 20배 감소됨을 확인하였다.
상기 결과를 통해 aroG 알돌라아제의 아미노산 서열 중 217번째, 310번째, 403번째, 462번째 위치의 아미노산이 L-발린 생산 및 방향족 아미노산인 L-타이로신 및 L- 페닐알라닌 생산에 중요한 위치임을 확인할 수 있다.
참고예 1: gltA(M312I) 변이의 류신 생산에 대한 효과 확인
참고예 1-1. gltA 변이를 포함하는 삽입 벡터 제작
gltA(M312I; 서열번호 41) 변이 도입용 벡터 제작은 위치 지정 돌연변이 생성(Site directed mutagenesis) 방법을 사용하였다.
코리네박테리움 글루타미쿰 야생형의 염색체를 주형으로 서열번호 43 및 44의 프라이머 쌍, 서열번호 45 및 46의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR은 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다. 그 결과 얻어진 유전자 단편을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터와 인퓨전(In-Fusion) 효소를 이용해 DNA 단편간의 말단 15개 염기의 상동서열을 결합시켜 클로닝하여 312번째 아미노산인 메티오닌을 이소류신으로 치환하는 벡터 pDCM2-gltA(M312I)를 제작하였다.
서열번호 | 프라이머 | 서열(5'->3') |
43 | gltA M312I Up F | GTGAATTCGAGCTCGGTACCCGCGGGAATCCTGCGTTACCGC |
44 | gltA M312I Up R | TGTAAACGCGGTGTCCGAAGCCGATGAGGCGGACGCCGTCTT |
45 | gltA M312I Down F | AAGACGGCGTCCGCCTCATCGGCTTCGGACACCGCGTTTACA |
46 | gltA M312I Down R | GGTCGACTCTAGAGGATCCCCTTAGCGCTCCTCGCGAGGAAC |
참고예 1-2. ATCC13032 균주 내 변이체 도입 및 평가
상기 참고예 1-1에서 제작한 pDCM2-gltA(M312I)벡터를 야생형 ATCC13032에 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종 형질전환된 균주의 gltA 유전자 변이 도입의 여부는 서열번호 31 및 서열번호 32(실시예 4-1, 표 8)의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 변이(서열번호 42)가 도입되었음을 확인하였다. 제작된 균주는 ATCC13032_gltA_M312I로 명명하였다.
상기 제작된 ATCC13032_gltA_M312I 균주의 류신 생산능을 평가하기 위해 플라스크 발효역가 평가를 진행하였다. 생산배지를 각각 25 ㎖ 함유하는 250 ㎖ 코너-바풀 플라스크에 모균주인 코리네박테리움 글루타미쿰 ATCC13032 및 상기 제작한 ATCC13032_gltA_M312I을 각각 1백금이 접종한 후, 30℃에서 60 시간 동안 200 rpm으로 진탕 배양하여 류신을 생산하였다. 배양종료 후 HPLC로 류신의 생산량을 측정하였다. 실험한 각 균주에 대한 배양액 중의 류신 농도는 하기 표 15과 같다.
- 생산배지: 포도당 100 g, (NH4)2SO4 40 g, 대두 단백질(Soy Protein) 2.5 g, 옥수수 침지고형분(Corn Steep Solids) 5 g, 요소 3 g, KH2PO4 1 g, MgSO4·7H2O 0.5 g, 바이오틴 100 ㎍, 티아민 염산염 1,000 ㎍, 칼슘-판토텐산 2000 ㎍, 니코틴아미드 3,000 ㎍, CaCO3 30 g (증류수 1리터 기준), pH 7.0
균주명 | 류신 (g/L) |
ATCC13032 | 0.87 |
ATCC13032_gltA_M312I | 1.25 |
이로부터 gltA의 M312I 치환이 류신 생산증가에 유효한 변이임을 확인하였다.
참고예 2: ilvA(T381A, F383A) 변이의 이소류신 생산에 대한 효과 확인
참고예 2-1: pECCG117-ilvA(F383A) 제작
쓰레오닌 디하이드라타제(서열번호 47)를 코딩하는 유전자인 ilvA(서열번호 48)를 증폭하기 위하여, 기보고된 F383A 변이가 도입된 ilvA 서열(World J Microbiol Biotechnol (2015) 31:1369-1377)에 근거하여 프로모터 부위(개시코돈 상단 약 300bp)로부터 터미네이터 부위(종결코돈 하단 약 100bp)까지 증폭하기 위한 프라이머(서열번호 49 및 서열번호 50)의 양 말단에 BamHI 제한 효소 부위를 삽입하였다. 또한, ilvA에 F383A 변이를 도입하기 위한 프라이머(서열번호 51 및 서열번호 52)를 사용하였다. 여기에서 사용된 프라이머 서열은 하기 표 16과 같다.
서열번호 | 명칭 | 서열 |
49 | primer1 | ggatccGACTGAGCCTGGGCAACTGG |
50 | primer2 | ggatccCCGTCACCGACACCTCCACA |
51 | primer3 | ACATCACGCTGgcaGAGTACCTCAA |
52 | primer4 | TTGAGGTACTCtgcCAGCGTGATGT |
야생형 코리네박테리움 글루타미쿰(wild type Corynebacterium glutamicum) ATCC 13032의 염색체를 주형으로 하여 서열번호 49 및 서열번호 52, 서열번호 50 및 서열번호 51의 프라이머를 이용하여 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃ 30초 변성, 55℃ 30초 어닐링, 72℃ 90초 중합을 30회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다.
그 결과, ilvA 유전자의 변이를 중심으로 5' 상단 부위의 1460 bp의 DNA 단편과 3' 하단 부위의 276 bp DNA 단편을 수득하였다.
증폭된 두 가지의 DNA 절편을 주형으로 하여, 서열번호 49 및 서열번호 50의 프라이머로 PCR을 수행하였다.
그 결과, 383번째 페닐알라닌이 알라닌으로 치환된 ilvA 변이를 포함하는 1531 bp의 DNA 단편이 증폭되었다. pECCG117(대한민국 등록특허 제10-0057684호) 벡터와 ilvA DNA 단편을 제한 효소 BamHI으로 처리하고, DNA 접합 효소를 이용하여 연결한 후, 클로닝함으로써 플라스미드를 획득하였고 이를 pECCG117-ilvA(F383A)라 명명하였다.
참고예 2-2: pECCG117-ilvA(F383A)에 무작위 변이 추가 도입
L-쓰레오닌 디하이드라타제를 코딩하는 유전자의 변이체를 얻기 위해 무작위 돌연변이 키트(random mutagenesis kit, Agilent Technologies, 미국)를 이용하여 ilvA 변이체 유전자 플라스미드를 제조하였다. 참고예 2-1의 ilvA(F383A) 염색체를 주형으로 하여 서열번호 49 및 서열번호 50의 프라이머를 이용하여 PCR을 수행하였다. PCR 조건은 95℃에서 2분간 변성 후, 95℃ 30초 변성, 55℃ 30초 어닐링, 72℃ 90초 중합을 30회 반복한 후, 72℃에서 10분간 중합반응을 수행하였다.
그 결과, 383번째 페닐알라닌이 알라닌으로 치환된 변이 외에 추가적인 무작위 변이를 가진 L-쓰레오닌 디하이드라타제를 암호화할 수 있는 ilvA 변이체인 1531 bp의 DNA 단편이 증폭되었다. pECCG117 벡터와 ilvA 변이체 DNA 단편을 제한 효소 BamHI으로 처리하고, DNA 접합 효소를 이용하여 연결한 후, 클로닝함으로써 플라스미드군을 획득하였다.
참고예 2-3: CJILE-301 균주 제작
코리네박테리움 글루타미쿰 ATCC13032 hom(R407H) 균주에 pECCG117-ilvA(F383A)를 도입하였고, 제작한 플라스미드를 도입한 균주는 ATCC 13032 hom(R407H)/pECCG117-ilvA(F383A)로 명명하였다. 또한 참고예 2-2에서 얻어진 변이체 플라스미드군을 코리네박테리움 글루타미쿰 ATCC 13032 hom(R407H) 균주에 도입하였고, 최소배지에 도말하여 사멸율을 구해본 결과 사멸율은 70 %였으며 생존한 세포들을 종배지에 접종 배양, 최종적으로 ATCC13032 hom(R407H)/pECCG117-ilvA(F383A) 대조군보다 우수한 이소류신 생산능을 나타내는 변이주를 선별하여 코리네박테리움 글루타미쿰 CJILE-301(Corynebacterium glutamicum, CJILE-301)로 명명하였다.
CJILE-301균주로부터 플라스미드를 분리하여 ilvA 유전자를 시퀀싱 한 결과, ilvA 유전자의 1141번째 염기서열이 A에서 G로 치환되어 ilvA 단백질의 383번째 F가 A로 치환된 변이 외에 추가로 381번째 T가 A로 치환된 변이 단백질을 암호화할 수 있음을 확인하였으며 이는 서열번호 54으로 나타내었다.
참고예 2-4: ilvA 변이체(T381A, F383A) 도입
ilvA 변이체(T381A, F383A)를 야생형 균주로 도입하기 위하여 서열번호 49 및 서열번호 52 (실시예 5-1, 표 16)의 프라이머를 제작하였다.
ilvA 변이체(T381A, F383A)가 도입된 균주를 제작하기 위해 CJILE-301 균주로부터 추출한 플라스미드 DNA를 주형으로 서열번호 49 및 서열번호 52의 프라이머를 사용하여 PCR을 수행하였다.
PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복하였다.
그 결과, 1311bp인 ilvA 유전자의 약 100bp 터미네이터 부위를 포함한 1411bp의 유전자 단편을 각각 수득하였다.
증폭 산물을 PCR 정제 키트를 사용하여 정제하고, 벡터 제작을 위한 삽입 DNA 단편으로 사용하였다. 정제한 증폭 산물을 제한효소 smaI으로 처리한 후, 65℃에서 20분간 열처리한 pDCM2벡터와 상기 증폭 산물인 삽입 DNA 단편의 몰농도(M) 비율이 1:2가 되도록 하고 인퓨전 클로닝 키트를 사용하여 제공된 매뉴얼에 따라 클로닝함으로써 T381A, F383A 변이를 염색체상에 도입하기 위한 벡터 pDCM2-T381A_F383A를 제작하였다.
제작된 벡터를 전기천공법에 의해 코리네박테리움 글루타미쿰 ATCC13032 hom(R407H)에 형질전환하고, 2차 교차 과정을 거쳐 염색체 상에서 ilvA(T381A, F383A; 서열번호 53) 변이를 포함하는 균주를 얻었으며, 이를 CA10-3101으로 명명하였다.
상기 균주 CA10-3101은 2020년 5월 27일자로 부다페스트 조약하의 국제기탁기관인 한국미생물보존센터(KCCM)에 국제기탁하여 KCCM12739P로 기탁번호를 부여받았다.
상기 KCCM12739P 균주를 이소류신 생산배지 25 ㎖을 함유하는 250 ㎖ 코너-바풀 플라스크에 접종한 후, 32℃에서 60시간 동안 200 rpm으로 진탕 배양하여 L-이소류신을 제조하였다. 사용한 생산배지의 조성은 하기와 같다.
<생산배지>
포도당 10%, 효모추출물 0.2%, 황산암모늄 1.6%, 제1인산칼륨 0.1%, 황산마그네슘7수염 0.1%, 황산철7수염 10mg/L, 황산망간1수염 10 mg/L, 비오틴 200 ㎍/L, pH 7.2
배양종료 후, 고성능액체크로마토그래피(high-performance liquid chromatography, HPLC)를 이용하여 배양액 중의 L-이소류신과 L-쓰레오닌 농도를 측정하고, 그 결과를 하기 표 17에 나타내었다.
균주명 | L-이소류신 (g/L) | L-쓰레오닌(g/L) |
ATCC 13032 hom(R407H) | 0.0 | 3.8 |
ATCC 13032 hom(R407H) ilvA(WT) | 0.0 | 3.7 |
CA10-3101(ATCC 13032 hom(R407H) ilvA(T381A, F383A)) | 3.3 | 0.0 |
상기 표 17에 나타난 바와 같이, 모균주인 코리네박테리움 글루타미쿰 ATCC 13032 hom(R407H)은 L-이소류신을 생산하지 못하였으나 ATCC 13032 hom(R407H) ilvA(T381A, F383A) 변이주는 3.9 g/L의 농도로 L-이소류신을 생산하여, 모균주에 비해 L-이소류신 생산성이 현저하게 증가한 것을 확인하였다.
이로부터 ilvA(T381A, F383A) 변이가 이소류신 생산증가에 유효한 변이임을 확인하였다.
참고예 3: leuA(P247C, R558H, G561D)의 류신 생산에 대한 효과 확인
참고예 3-1. CJL-8100 균주 제작
KR 10-2018-0077008 A 에 공지된 leuA 유전자 변이를 포함하는 pDCM2-leuA(R558H, G561D) 벡터를 코리네박테리움 글루타미쿰 ATCC13032에 전기천공법으로 형질전환하고 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, leuA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 서열번호 55와 서열번호 56의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회 반복, 72℃ 5분)을 수행하고 염기서열을 분석하여 R558H, G561D 변이가 도입된 것을 확인하였다. pDCM2-leuA(R558H, G561D) 벡터로 형질전환된 ATCC13032_leuA_(R558H, G561D) 균주를 ‘CJL-8100’으로 명명하였다.
이하 참고예 3에서 사용한 프라이머 서열을 표 18에 나타내었다.
서열번호 | 서열(5'->3') |
서열번호 55 | AACACGACCGGCATCCCGTCGC |
서열번호 56 | AAATCATTTGAGAAAACTCGAGG |
서열번호 57 | GTGAATTCGAGCTCGGTACCCAAATCATTTGAGAAAACTCGAGGC |
서열번호 58 | GGTGATCATCTCAACGGTGGAACACAGGTTGATGATCATTGGGTT |
서열번호 59 | AACCCAATGATCATCAACCTGTGTTCCACCGTTGAGATGATCACC |
서열번호 60 | GGTCGACTCTAGAGGATCCCCAAGAAGGCAACATCGGACAGC |
서열번호 61 | ATCCATTCAATGGAGTCTGCG |
참고예 3-2.
leuA
변이를 포함하는 삽입 벡터 제작
LeuA에 2개의 변이(R558H, G561D)가 도입된 L-류신 생산 균주인 CJL-8100에 P247C 변이를 도입하기 위한 벡터를 제작하였다.
CJL-8100 균주의 염색체를 주형으로 서열번호 57 및 58의 프라이머, 서열번호 59 및 60의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR은 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다. 그 결과 얻어진 PCR 산물을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터와 In-Fusion 효소를 이용해 DNA 단편 간의 말단 15 base의 상동서열을 fusion 시켜 클로닝하여, 야생형 균주의 LeuA 아미노산 서열에서 558 번째 아미노산인 아르기닌이 히스티딘으로 치환되고, 561 번째 아미노산인 글리신이 아스파르트산으로 치환된 LeuA 변이체를 암호화하는 leuA변이를 포함하고, LeuA의 247 번째 아미노산인 프롤린(Pro)을 시스테인(Cys)으로 치환하는 벡터 pDCM2-leuA(P247C, R558H, G561D)를 제작하였다.
참고예 3-3. CJL-8100 균주 내 LeuA
변이체(P247C) 도입 및 평가
L-류신 생산 균주인 CJL-8100을 상기 참고예 3-2에서 제작한 pDCM2-leuA(P247C, R558H, G561D) 벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 leuA유전자 변이 도입의 여부는 서열번호 55과 서열번호 61의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회반복, 72℃ 5분)을 수행한 후 염기서열을 분석하였다. 염기서열 분석 결과, 균주 염색체 내leuA 유전자의 1673 번째 뉴클레오티드인 G가 A로 치환되고, 1682 번째, 1683 번째 뉴클레오티드인 GC가 AT로 치환되었으며, 739번째, 740번째 뉴클레오티드인 CC가 TG로 치환되어 LeuA 단백질의 558 번째 아미노산인 아르기닌이 히스티딘으로 치환되고, 561 번째 아미노산인 글리신이 아스파르트산으로 치환되고, 247 번째 아미노산인 프롤린(Pro)이 시스테인(Cys)으로 치환된 LeuA 변이체(P247C, R558H, G561D)를 암호화하는 leuA 변이가 균주 내에 도입된 것을 확인하였다.
제작된 CJL8100_leuA_P247C 를 'CA13-8105'로 명명하고 부다페스트 조약 하의 국제기탁기관인 한국미생물보존센터(Korean Culture Center of Microorganisms, KCCM)에 2020년 4월 29일자로 기탁하여 기탁번호 KCCM12709P를 부여 받았다.
상기 총 3종의 변이를 포함하는 LeuA 변이체(P247C, R558H, G561D)의 아미노산 서열 및 이를 암호화하는 leuA 변이체의 염기 서열은 각각 서열번호 62 및 서열번호 63과 같다.
ATCC13032, 제작된 CJL-8100, 및 CA13-8105 균주의 L-류신의 생산능을 평가하였다. 구체적으로, 실시예 2-1과 같은 방식으로 플라스크 배양을 진행하였고, 배양 종료 후 HPLC를 이용하여, 모균주 및 변이 균주의 L-류신 생산량을 측정하여 그 결과를 표 19에 기재하였다.
균주명 | L-류신 (g/L) |
ATCC13032 | 0.87 |
ATCC13032_leuA_(R558H, G561D) : CJL-8100 | 2.71 |
CJL8100_leuA_P247C: CA13-8105 | 3.52 |
상기 표 19에 나타난 바와 같이, L-류신 생산 균주인 코리네박테리움 글루타미쿰 CJL8100은 모균주인 ATCC13032에 비해 L-류신 생산능이 약 130 % 향상되었다. CJL8100 균주 내 leuA_P247C 변이를 추가적으로 도입한 CA13-8105 균주는 모균주인 CJL8100 대비 L-류신 생산능이 약 150 % 향상되었다.
이로부터 leuA(R558H, G561D, P247C) 변이가 류신 생산 증가에 유효한 변이임을 확인하였다.
이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.
<110> CJ CheilJedang Corporation
<120> Phospho-2-dehydro-3-deoxyheptonate aldolase variant and method
for producing branched amino acid using the same
<130> KPA201438-KR
<160> 63
<170> KoPatentIn 3.0
<210> 1
<211> 466
<212> PRT
<213> Unknown
<220>
<223> aroG_WT
<400> 1
Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu
1 5 10 15
Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp
20 25 30
Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln
35 40 45
Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val
50 55 60
Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn
65 70 75 80
Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu
85 90 95
Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln
100 105 110
Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met
115 120 125
Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp
130 135 140
Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu
145 150 155 160
Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala
165 170 175
Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser
180 185 190
Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe
195 200 205
Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu
210 215 220
Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu
225 230 235 240
Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val
245 250 255
Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn
260 265 270
Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg
275 280 285
Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser
290 295 300
Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala
305 310 315 320
Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu
325 330 335
Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro
340 345 350
Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln
355 360 365
Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys
370 375 380
Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu
385 390 395 400
Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe
405 410 415
Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr
420 425 430
Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu
435 440 445
Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu
450 455 460
Arg Asn
465
<210> 2
<211> 1401
<212> DNA
<213> Unknown
<220>
<223> aroG_WT
<400> 2
atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60
ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120
caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180
ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240
ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300
ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360
gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420
tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480
gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540
tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600
ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660
cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720
tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780
tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840
caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900
tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960
gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020
cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080
tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140
aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200
gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260
gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320
gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380
gcagaaatgc tgcgtaacta a 1401
<210> 3
<211> 466
<212> PRT
<213> Artificial Sequence
<220>
<223> aroG_R217A
<400> 3
Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu
1 5 10 15
Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp
20 25 30
Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln
35 40 45
Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val
50 55 60
Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn
65 70 75 80
Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu
85 90 95
Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln
100 105 110
Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met
115 120 125
Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp
130 135 140
Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu
145 150 155 160
Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala
165 170 175
Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser
180 185 190
Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe
195 200 205
Val Ala Asn Ser Pro Ala Gly Ala Ala Tyr Glu Ala Leu Ala Arg Glu
210 215 220
Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu
225 230 235 240
Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val
245 250 255
Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn
260 265 270
Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg
275 280 285
Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser
290 295 300
Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala
305 310 315 320
Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu
325 330 335
Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro
340 345 350
Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln
355 360 365
Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys
370 375 380
Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu
385 390 395 400
Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe
405 410 415
Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr
420 425 430
Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu
435 440 445
Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu
450 455 460
Arg Asn
465
<210> 4
<211> 1401
<212> DNA
<213> Artificial Sequence
<220>
<223> aroG_R217A_nt
<400> 4
atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60
ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120
caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180
ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240
ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300
ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360
gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420
tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480
gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540
tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600
ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcagc gtacgaggct 660
cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720
tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780
tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840
caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900
tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960
gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020
cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080
tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140
aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200
gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260
gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320
gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380
gcagaaatgc tgcgtaacta a 1401
<210> 5
<211> 466
<212> PRT
<213> Artificial Sequence
<220>
<223> aroG_K310A
<400> 5
Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu
1 5 10 15
Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp
20 25 30
Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln
35 40 45
Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val
50 55 60
Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn
65 70 75 80
Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu
85 90 95
Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln
100 105 110
Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met
115 120 125
Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp
130 135 140
Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu
145 150 155 160
Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala
165 170 175
Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser
180 185 190
Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe
195 200 205
Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu
210 215 220
Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu
225 230 235 240
Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val
245 250 255
Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn
260 265 270
Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg
275 280 285
Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser
290 295 300
Asn Pro Ile Gly Ile Ala Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala
305 310 315 320
Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu
325 330 335
Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro
340 345 350
Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln
355 360 365
Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys
370 375 380
Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu
385 390 395 400
Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe
405 410 415
Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr
420 425 430
Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu
435 440 445
Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu
450 455 460
Arg Asn
465
<210> 6
<211> 1401
<212> DNA
<213> Artificial Sequence
<220>
<223> aroG_K310A_nt
<400> 6
atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60
ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120
caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180
ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240
ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300
ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360
gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420
tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480
gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540
tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600
ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660
cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720
tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780
tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840
caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900
tccatgatct ctaacccaat cggcatcgcg attggtcctg gtatcacccc tgaagaggct 960
gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020
cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080
tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140
aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200
gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260
gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320
gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380
gcagaaatgc tgcgtaacta a 1401
<210> 7
<211> 466
<212> PRT
<213> Artificial Sequence
<220>
<223> aroG_R403A
<400> 7
Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu
1 5 10 15
Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp
20 25 30
Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln
35 40 45
Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val
50 55 60
Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn
65 70 75 80
Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu
85 90 95
Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln
100 105 110
Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met
115 120 125
Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp
130 135 140
Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu
145 150 155 160
Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala
165 170 175
Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser
180 185 190
Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe
195 200 205
Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu
210 215 220
Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu
225 230 235 240
Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val
245 250 255
Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn
260 265 270
Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg
275 280 285
Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser
290 295 300
Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala
305 310 315 320
Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu
325 330 335
Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro
340 345 350
Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln
355 360 365
Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys
370 375 380
Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu
385 390 395 400
Val His Ala Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe
405 410 415
Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr
420 425 430
Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu
435 440 445
Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu
450 455 460
Arg Asn
465
<210> 8
<211> 1401
<212> DNA
<213> Artificial Sequence
<220>
<223> aroG_R403A_nt
<400> 8
atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60
ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120
caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180
ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240
ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300
ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360
gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420
tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480
gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540
tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600
ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660
cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720
tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780
tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840
caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900
tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960
gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020
cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080
tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140
aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200
gtccacgcgg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260
gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320
gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380
gcagaaatgc tgcgtaacta a 1401
<210> 9
<211> 466
<212> PRT
<213> Artificial Sequence
<220>
<223> aroG_E462A
<400> 9
Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu
1 5 10 15
Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp
20 25 30
Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln
35 40 45
Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val
50 55 60
Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn
65 70 75 80
Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu
85 90 95
Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln
100 105 110
Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met
115 120 125
Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp
130 135 140
Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu
145 150 155 160
Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala
165 170 175
Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser
180 185 190
Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe
195 200 205
Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu
210 215 220
Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu
225 230 235 240
Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val
245 250 255
Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn
260 265 270
Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg
275 280 285
Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser
290 295 300
Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala
305 310 315 320
Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu
325 330 335
Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro
340 345 350
Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln
355 360 365
Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys
370 375 380
Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu
385 390 395 400
Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe
405 410 415
Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr
420 425 430
Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu
435 440 445
Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Ala Met Leu
450 455 460
Arg Asn
465
<210> 10
<211> 1401
<212> DNA
<213> Artificial Sequence
<220>
<223> aroG_E462A_nt
<400> 10
atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60
ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120
caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180
ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240
ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300
ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360
gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420
tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480
gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540
tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600
ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660
cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720
tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780
tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840
caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900
tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960
gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020
cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080
tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140
aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200
gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260
gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320
gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380
gcagcgatgc tgcgtaacta a 1401
<210> 11
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 11
tgatgcgcgt cataatttag 20
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 12
ctcatctctg actggacgtg 20
<210> 13
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 13
gtgaattcga gctcggtacc cagttgaatg ctaccaactt g 41
<210> 14
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 14
cacgagcaag agcctcgtac gctgcaccag ctggg 35
<210> 15
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 15
ggtcgactct agaggatccc cgctgttatt actgtgcctg 40
<210> 16
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 16
gaactcccca gctggtgcag cgtacgaggc tcttgctcg 39
<210> 17
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 17
gggtgatacc aggaccaatc gcgatgccga ttgggttag 39
<210> 18
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 18
ctctaaccca atcggcatcg cgattggtcc tggtatcac 39
<210> 19
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 19
ctgggtgggt gcccaatgcc gcgtggacct cgaagaag 38
<210> 20
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 20
gggcttcttc gaggtccacg cggcattggg cacccac 37
<210> 21
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 21
aagcttagtt acgcagcatc gctgcaacga ggaaagcc 38
<210> 22
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 22
gttggctttc ctcgttgcag cgatgctgcg taactaagc 39
<210> 23
<211> 466
<212> PRT
<213> Artificial Sequence
<220>
<223> aroG_R217A+K310A+E462A
<400> 23
Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu
1 5 10 15
Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp
20 25 30
Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln
35 40 45
Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val
50 55 60
Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn
65 70 75 80
Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu
85 90 95
Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln
100 105 110
Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met
115 120 125
Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp
130 135 140
Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu
145 150 155 160
Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala
165 170 175
Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser
180 185 190
Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe
195 200 205
Val Ala Asn Ser Pro Ala Gly Ala Ala Tyr Glu Ala Leu Ala Arg Glu
210 215 220
Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu
225 230 235 240
Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val
245 250 255
Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn
260 265 270
Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg
275 280 285
Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser
290 295 300
Asn Pro Ile Gly Ile Ala Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala
305 310 315 320
Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu
325 330 335
Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro
340 345 350
Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln
355 360 365
Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys
370 375 380
Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu
385 390 395 400
Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe
405 410 415
Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr
420 425 430
Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu
435 440 445
Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Ala Met Leu
450 455 460
Arg Asn
465
<210> 24
<211> 1401
<212> DNA
<213> Artificial Sequence
<220>
<223> aroG_R217A+K310A+E462A_nt
<400> 24
atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60
ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120
caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180
ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240
ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300
ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360
gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420
tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480
gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540
tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600
ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcagc gtacgaggct 660
cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720
tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780
tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840
caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900
tccatgatct ctaacccaat cggcatcgcg attggtcctg gtatcacccc tgaagaggct 960
gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020
cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080
tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140
aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200
gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260
gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320
gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380
gcagcgatgc tgcgtaacta a 1401
<210> 25
<211> 466
<212> PRT
<213> Artificial Sequence
<220>
<223> aroG_R217A+K310A+R403A+E462A
<400> 25
Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu
1 5 10 15
Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp
20 25 30
Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln
35 40 45
Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val
50 55 60
Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn
65 70 75 80
Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu
85 90 95
Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln
100 105 110
Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met
115 120 125
Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp
130 135 140
Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu
145 150 155 160
Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala
165 170 175
Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser
180 185 190
Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe
195 200 205
Val Ala Asn Ser Pro Ala Gly Ala Ala Tyr Glu Ala Leu Ala Arg Glu
210 215 220
Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu
225 230 235 240
Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val
245 250 255
Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn
260 265 270
Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg
275 280 285
Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser
290 295 300
Asn Pro Ile Gly Ile Ala Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala
305 310 315 320
Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu
325 330 335
Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro
340 345 350
Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln
355 360 365
Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys
370 375 380
Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu
385 390 395 400
Val His Ala Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe
405 410 415
Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr
420 425 430
Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu
435 440 445
Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Ala Met Leu
450 455 460
Arg Asn
465
<210> 26
<211> 1401
<212> DNA
<213> Artificial Sequence
<220>
<223> aroG_R217A+K310A+R403A+E462A_nt
<400> 26
atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60
ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120
caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180
ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240
ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300
ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360
gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420
tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480
gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540
tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600
ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcagc gtacgaggct 660
cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720
tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780
tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840
caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900
tccatgatct ctaacccaat cggcatcgcg attggtcctg gtatcacccc tgaagaggct 960
gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020
cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080
tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140
aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200
gtccacgcgg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260
gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320
gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380
gcagcgatgc tgcgtaacta a 1401
<210> 27
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 27
tatgcttcac cacatgactt c 21
<210> 28
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 28
aaatcatttg agaaaactcg agg 23
<210> 29
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 29
gtcacccgat cgtctgaag 19
<210> 30
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 30
gtcttaaaac cggttgat 18
<210> 31
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 31
caatgctggc tgcgtacgc 19
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 32
ctcctcgcga ggaaccaact 20
<210> 33
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 33
tcgagctcgg taccccgctt ttgcactcat cgagc 35
<210> 34
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 34
cacgatcaga tgtgcatcat cat 23
<210> 35
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 35
atgatgatgc acatctgatc gtg 23
<210> 36
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 36
ctctagagga tccccgagca tcttccaaaa ccttg 35
<210> 37
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 37
tcgagctcgg tacccatgag tgaaacatac gtgtc 35
<210> 38
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 38
gcgcttgagg tactctgcca gcgcgatgtc atcatccgg 39
<210> 39
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 39
ccggatgatg acatcgcgct ggcagagtac ctcaagcgc 39
<210> 40
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 40
ctctagagga tcccccgtca ccgacacctc caca 34
<210> 41
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> gltA_M312I
<400> 41
Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu
1 5 10 15
His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu
20 25 30
Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu
35 40 45
Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys
50 55 60
Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr
65 70 75 80
Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr
85 90 95
Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe
100 105 110
Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser
115 120 125
Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala
130 135 140
Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro
145 150 155 160
Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys
165 170 175
Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro
180 185 190
Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg
195 200 205
Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met
210 215 220
Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln
225 230 235 240
Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn
245 250 255
Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu
260 265 270
His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys
275 280 285
Ser Asn His Gly Gly Asp Ala Thr Glu Phe Met Asn Lys Val Lys Asn
290 295 300
Lys Glu Asp Gly Val Arg Leu Ile Gly Phe Gly His Arg Val Tyr Lys
305 310 315 320
Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile
325 330 335
Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu
340 345 350
Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr
355 360 365
Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe
370 375 380
Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly
385 390 395 400
Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile
405 410 415
Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val
420 425 430
Pro Arg Glu Glu Arg
435
<210> 42
<211> 1314
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA_M312I_nt
<400> 42
atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60
ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120
aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180
accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240
gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300
ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360
cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420
gcaaccttgg cttcctcggt taacattttg tctacctact accaggacca gctgaaccca 480
ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540
gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600
aatgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660
gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720
aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780
atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840
ctggagatgc tcgaagacat caagagcaac cacggtggcg acgcaaccga gttcatgaac 900
aaggtcaaga acaaggaaga cggcgtccgc ctcatcggct tcggacaccg cgtttacaag 960
aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020
ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080
tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140
gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200
tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260
caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314
<210> 43
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA M312I Up F
<400> 43
gtgaattcga gctcggtacc cgcgggaatc ctgcgttacc gc 42
<210> 44
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA M312I Up R
<400> 44
tgtaaacgcg gtgtccgaag ccgatgaggc ggacgccgtc tt 42
<210> 45
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA M312I Down F
<400> 45
aagacggcgt ccgcctcatc ggcttcggac accgcgttta ca 42
<210> 46
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> gltA M312I Down R
<400> 46
ggtcgactct agaggatccc cttagcgctc ctcgcgagga ac 42
<210> 47
<211> 436
<212> PRT
<213> Unknown
<220>
<223> ilvA_WT
<400> 47
Met Ser Glu Thr Tyr Val Ser Glu Lys Ser Pro Gly Val Met Ala Ser
1 5 10 15
Gly Ala Glu Leu Ile Arg Ala Ala Asp Ile Gln Thr Ala Gln Ala Arg
20 25 30
Ile Ser Ser Val Ile Ala Pro Thr Pro Leu Gln Tyr Cys Pro Arg Leu
35 40 45
Ser Glu Glu Thr Gly Ala Glu Ile Tyr Leu Lys Arg Glu Asp Leu Gln
50 55 60
Asp Val Arg Ser Tyr Lys Ile Arg Gly Ala Leu Asn Ser Gly Ala Gln
65 70 75 80
Leu Thr Gln Glu Gln Arg Asp Ala Gly Ile Val Ala Ala Ser Ala Gly
85 90 95
Asn His Ala Gln Gly Val Ala Tyr Val Cys Lys Ser Leu Gly Val Gln
100 105 110
Gly Arg Ile Tyr Val Pro Val Gln Thr Pro Lys Gln Lys Arg Asp Arg
115 120 125
Ile Met Val His Gly Gly Glu Phe Val Ser Leu Val Val Thr Gly Asn
130 135 140
Asn Phe Asp Glu Ala Ser Ala Ala Ala His Glu Asp Ala Glu Arg Thr
145 150 155 160
Gly Ala Thr Leu Ile Glu Pro Phe Asp Ala Arg Asn Thr Val Ile Gly
165 170 175
Gln Gly Thr Val Ala Ala Glu Ile Leu Ser Gln Leu Thr Ser Met Gly
180 185 190
Lys Ser Ala Asp His Val Met Val Pro Val Gly Gly Gly Gly Leu Leu
195 200 205
Ala Gly Val Val Ser Tyr Met Ala Asp Met Ala Pro Arg Thr Ala Ile
210 215 220
Val Gly Ile Glu Pro Ala Gly Ala Ala Ser Met Gln Ala Ala Leu His
225 230 235 240
Asn Gly Gly Pro Ile Thr Leu Glu Thr Val Asp Pro Phe Val Asp Gly
245 250 255
Ala Ala Val Lys Arg Val Gly Asp Leu Asn Tyr Thr Ile Val Glu Lys
260 265 270
Asn Gln Gly Arg Val His Met Met Ser Ala Thr Glu Gly Ala Val Cys
275 280 285
Thr Glu Met Leu Asp Leu Tyr Gln Asn Glu Gly Ile Ile Ala Glu Pro
290 295 300
Ala Gly Ala Leu Ser Ile Ala Gly Leu Lys Glu Met Ser Phe Ala Pro
305 310 315 320
Gly Ser Val Val Val Cys Ile Ile Ser Gly Gly Asn Asn Asp Val Leu
325 330 335
Arg Tyr Ala Glu Ile Ala Glu Arg Ser Leu Val His Arg Gly Leu Lys
340 345 350
His Tyr Phe Leu Val Asn Phe Pro Gln Lys Pro Gly Gln Leu Arg His
355 360 365
Phe Leu Glu Asp Ile Leu Gly Pro Asp Asp Asp Ile Thr Leu Phe Glu
370 375 380
Tyr Leu Lys Arg Asn Asn Arg Glu Thr Gly Thr Ala Leu Val Gly Ile
385 390 395 400
His Leu Ser Glu Ala Ser Gly Leu Asp Ser Leu Leu Glu Arg Met Glu
405 410 415
Glu Ser Ala Ile Asp Ser Arg Arg Leu Glu Pro Gly Thr Pro Glu Tyr
420 425 430
Glu Tyr Leu Thr
435
<210> 48
<211> 1311
<212> DNA
<213> Unknown
<220>
<223> ilvA_WT_nt
<400> 48
atgagtgaaa catacgtgtc tgagaaaagt ccaggagtga tggctagcgg agcggagctg 60
attcgtgccg ccgacattca aacggcgcag gcacgaattt cctccgtcat tgcaccaact 120
ccattgcagt attgccctcg tctttctgag gaaaccggag cggaaatcta ccttaagcgt 180
gaggatctgc aggatgttcg ttcctacaag atccgcggtg cgctgaactc tggagcgcag 240
ctcacccaag agcagcgcga tgcaggtatc gttgccgcat ctgcaggtaa ccatgcccag 300
ggcgtggcct atgtgtgcaa gtccttgggc gttcagggac gcatctatgt tcctgtgcag 360
actccaaagc aaaagcgtga ccgcatcatg gttcacggcg gagagtttgt ctccttggtg 420
gtcactggca ataacttcga cgaagcatcg gctgcagcgc atgaagatgc agagcgcacc 480
ggcgcaacgc tgatcgagcc tttcgatgct cgcaacaccg tcatcggtca gggcaccgtg 540
gctgctgaga tcttgtcgca gctgacttcc atgggcaaga gtgcagatca cgtgatggtt 600
ccagtcggcg gtggcggact tcttgcaggt gtggtcagct acatggctga tatggcacct 660
cgcactgcga tcgttggtat cgaaccagcg ggagcagcat ccatgcaggc tgcattgcac 720
aatggtggac caatcacttt ggagactgtt gatccctttg tggacggcgc agcagtcaaa 780
cgtgtcggag atctcaacta caccatcgtg gagaagaacc agggtcgcgt gcacatgatg 840
agcgcgaccg agggcgctgt gtgtactgag atgctcgatc tttaccaaaa cgaaggcatc 900
atcgcggagc ctgctggcgc gctgtctatc gctgggttga aggaaatgtc ctttgcacct 960
ggttctgtcg tggtgtgcat catctctggt ggcaacaacg atgtgctgcg ttatgcggaa 1020
atcgctgagc gctccttggt gcaccgcggt ttgaagcact acttcttggt gaacttcccg 1080
caaaagcctg gtcagttgcg tcacttcctg gaagatatcc tgggaccgga tgatgacatc 1140
acgctgtttg agtacctcaa gcgcaacaac cgtgagaccg gtactgcgtt ggtgggtatt 1200
cacttgagtg aagcatcagg attggattct ttgctggaac gtatggagga atcggcaatt 1260
gattcccgtc gcctcgagcc gggcacccct gagtacgaat acttgaccta a 1311
<210> 49
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 49
ggatccgact gagcctgggc aactgg 26
<210> 50
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 50
ggatccccgt caccgacacc tccaca 26
<210> 51
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 51
acatcacgct ggcagagtac ctcaa 25
<210> 52
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 52
ttgaggtact ctgccagcgt gatgt 25
<210> 53
<211> 436
<212> PRT
<213> Artificial Sequence
<220>
<223> ilvA_T381A+F383A
<400> 53
Met Ser Glu Thr Tyr Val Ser Glu Lys Ser Pro Gly Val Met Ala Ser
1 5 10 15
Gly Ala Glu Leu Ile Arg Ala Ala Asp Ile Gln Thr Ala Gln Ala Arg
20 25 30
Ile Ser Ser Val Ile Ala Pro Thr Pro Leu Gln Tyr Cys Pro Arg Leu
35 40 45
Ser Glu Glu Thr Gly Ala Glu Ile Tyr Leu Lys Arg Glu Asp Leu Gln
50 55 60
Asp Val Arg Ser Tyr Lys Ile Arg Gly Ala Leu Asn Ser Gly Ala Gln
65 70 75 80
Leu Thr Gln Glu Gln Arg Asp Ala Gly Ile Val Ala Ala Ser Ala Gly
85 90 95
Asn His Ala Gln Gly Val Ala Tyr Val Cys Lys Ser Leu Gly Val Gln
100 105 110
Gly Arg Ile Tyr Val Pro Val Gln Thr Pro Lys Gln Lys Arg Asp Arg
115 120 125
Ile Met Val His Gly Gly Glu Phe Val Ser Leu Val Val Thr Gly Asn
130 135 140
Asn Phe Asp Glu Ala Ser Ala Ala Ala His Glu Asp Ala Glu Arg Thr
145 150 155 160
Gly Ala Thr Leu Ile Glu Pro Phe Asp Ala Arg Asn Thr Val Ile Gly
165 170 175
Gln Gly Thr Val Ala Ala Glu Ile Leu Ser Gln Leu Thr Ser Met Gly
180 185 190
Lys Ser Ala Asp His Val Met Val Pro Val Gly Gly Gly Gly Leu Leu
195 200 205
Ala Gly Val Val Ser Tyr Met Ala Asp Met Ala Pro Arg Thr Ala Ile
210 215 220
Val Gly Ile Glu Pro Ala Gly Ala Ala Ser Met Gln Ala Ala Leu His
225 230 235 240
Asn Gly Gly Pro Ile Thr Leu Glu Thr Val Asp Pro Phe Val Asp Gly
245 250 255
Ala Ala Val Lys Arg Val Gly Asp Leu Asn Tyr Thr Ile Val Glu Lys
260 265 270
Asn Gln Gly Arg Val His Met Met Ser Ala Thr Glu Gly Ala Val Cys
275 280 285
Thr Glu Met Leu Asp Leu Tyr Gln Asn Glu Gly Ile Ile Ala Glu Pro
290 295 300
Ala Gly Ala Leu Ser Ile Ala Gly Leu Lys Glu Met Ser Phe Ala Pro
305 310 315 320
Gly Ser Val Val Val Cys Ile Ile Ser Gly Gly Asn Asn Asp Val Leu
325 330 335
Arg Tyr Ala Glu Ile Ala Glu Arg Ser Leu Val His Arg Gly Leu Lys
340 345 350
His Tyr Phe Leu Val Asn Phe Pro Gln Lys Pro Gly Gln Leu Arg His
355 360 365
Phe Leu Glu Asp Ile Leu Gly Pro Asp Asp Asp Ile Ala Leu Ala Glu
370 375 380
Tyr Leu Lys Arg Asn Asn Arg Glu Thr Gly Thr Ala Leu Val Gly Ile
385 390 395 400
His Leu Ser Glu Ala Ser Gly Leu Asp Ser Leu Leu Glu Arg Met Glu
405 410 415
Glu Ser Ala Ile Asp Ser Arg Arg Leu Glu Pro Gly Thr Pro Glu Tyr
420 425 430
Glu Tyr Leu Thr
435
<210> 54
<211> 1311
<212> DNA
<213> Artificial Sequence
<220>
<223> ilvA_T381A+F383A_nt
<400> 54
atgagtgaaa catacgtgtc tgagaaaagt ccaggagtga tggctagcgg agcggagctg 60
attcgtgccg ccgacattca aacggcgcag gcacgaattt cctccgtcat tgcaccaact 120
ccattgcagt attgccctcg tctttctgag gaaaccggag cggaaatcta ccttaagcgt 180
gaggatctgc aggatgttcg ttcctacaag atccgcggtg cgctgaactc tggagcgcag 240
ctcacccaag agcagcgcga tgcaggtatc gttgccgcat ctgcaggtaa ccatgcccag 300
ggcgtggcct atgtgtgcaa gtccttgggc gttcagggac gcatctatgt tcctgtgcag 360
actccaaagc aaaagcgtga ccgcatcatg gttcacggcg gagagtttgt ctccttggtg 420
gtcactggca ataacttcga cgaagcatcg gctgcagcgc atgaagatgc agagcgcacc 480
ggcgcaacgc tgatcgagcc tttcgatgct cgcaacaccg tcatcggtca gggcaccgtg 540
gctgctgaga tcttgtcgca gctgacttcc atgggcaaga gtgcagatca cgtgatggtt 600
ccagtcggcg gtggcggact tcttgcaggt gtggtcagct acatggctga tatggcacct 660
cgcactgcga tcgttggtat cgaaccagcg ggagcagcat ccatgcaggc tgcattgcac 720
aatggtggac caatcacttt ggagactgtt gatccctttg tggacggcgc agcagtcaaa 780
cgtgtcggag atctcaacta caccatcgtg gagaagaacc agggtcgcgt gcacatgatg 840
agcgcgaccg agggcgctgt gtgtactgag atgctcgatc tttaccaaaa cgaaggcatc 900
atcgcggagc ctgctggcgc gctgtctatc gctgggttga aggaaatgtc ctttgcacct 960
ggttctgtcg tggtgtgcat catctctggt ggcaacaacg atgtgctgcg ttatgcggaa 1020
atcgctgagc gctccttggt gcaccgcggt ttgaagcact acttcttggt gaacttcccg 1080
caaaagcctg gtcagttgcg tcacttcctg gaagatatcc tgggaccgga tgatgacatc 1140
gcgctggcag agtacctcaa gcgcaacaac cgtgagaccg gtactgcgtt ggtgggtatt 1200
cacttgagtg aagcatcagg attggattct ttgctggaac gtatggagga atcggcaatt 1260
gattcccgtc gcctcgagcc gggcacccct gagtacgaat acttgaccta a 1311
<210> 55
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 55
aacacgaccg gcatcccgtc gc 22
<210> 56
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 56
aaatcatttg agaaaactcg agg 23
<210> 57
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 57
gtgaattcga gctcggtacc caaatcattt gagaaaactc gaggc 45
<210> 58
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 58
ggtgatcatc tcaacggtgg aacacaggtt gatgatcatt gggtt 45
<210> 59
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 59
aacccaatga tcatcaacct gtgttccacc gttgagatga tcacc 45
<210> 60
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 60
ggtcgactct agaggatccc caagaaggca acatcggaca gc 42
<210> 61
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 61
atccattcaa tggagtctgc g 21
<210> 62
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> leuA_P247C+R558H+G561D
<400> 62
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser
545 550 555 560
Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 63
<211> 1851
<212> DNA
<213> Artificial Sequence
<220>
<223> leuA_P247C+R558H+G561D_nt
<400> 63
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaacgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggcttcaaag aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaaggg catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactccac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactaa tcaagaccat cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggtg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccgcggc aacggcccac tggccgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680
gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
Claims (13)
- 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체.
- 제1항에 있어서, 상기 변이체는 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번 위치에 상응하는 아미노산이 아르기닌 외의 아미노산으로 치환; 310번 아미노산에 상응하는 아미노산이 라이신 외의 아미노산으로 치환; 403번 아미노산에 상응하는 아미노산이 아르기닌 외의 아미노산으로 치환; 및 462번 아미노산에 상응하는 아미노산이 글루탐산 외의 아미노산으로 치환 중 1 이상의 치환을 포함하는, aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체.
- 제1항에 있어서, 상기 다른 아미노산으로의 치환은 비극성(nonpolar) 아미노산 또는 크기가 작은 아미노산으로의 치환인 것인, aroG 알돌라아제 변이체.
- 제1항에 있어서, 상기 다른 아미노산은 알라닌(Ala)인 것인, aroG 알돌라아제 변이체.
- 제1항에 있어서, 상기 aroG 알돌라아제 변이체는 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25와 99% 이상 상동성 또는 동일성을 갖는 것인, aroG 알돌라아제 변이체.
- 제1항에 있어서, 상기 aroG 알돌라아제 변이체는 서열번호 1의 aroG 알돌라아제 변이체에 비해 약화된 활성을 갖는 것인, aroG 알돌라아제 변이체.
- 제1항 내지 제6항 중 어느 한 항의 aroG 알돌라아제 변이체를 코딩하는 폴리뉴클레오티드.
- 제7항의 폴리뉴클레오티드를 포함하는 벡터.
- 제1항 내지 제6항 중 어느 한 항의 aroG 알돌라아제 변이체; 상기 aroG 알돌라아제 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는 코리네박테리움 속 미생물.
- 제9항에 있어서, 상기 미생물은 코리네박테리움 글루타미쿰인 것인, 미생물.
- 제9항의 미생물을 배지에서 배양하는 단계를 포함하는, 분지쇄 아미노산 생산 방법.
- 제11항에 있어서, 상기 방법은 분지쇄 아미노산을 미생물 또는 배지로부터 회수하는 단계를 더 포함하는, 분지쇄 아미노산 생산 방법.
- 제11항에 있어서, 상기 분지쇄 아미노산은 L-류신, L-이소류신 및 L-발린 중 선택되는 1 이상인 것인, 분지쇄 아미노산 생산 방법.
Priority Applications (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210010911A KR102495918B1 (ko) | 2021-01-26 | 2021-01-26 | aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 |
EP21923390.5A EP4249593A1 (en) | 2021-01-26 | 2021-11-18 | Arog aldolase variant and method for producing brached chain amino acid by using same |
CN202180089416.3A CN116867895A (zh) | 2021-01-26 | 2021-11-18 | aroG醛缩酶变体及利用其生产支链氨基酸的方法 |
US18/274,196 US20240093163A1 (en) | 2021-01-26 | 2021-11-18 | aroG Aldolase Variant and Method for Producing Branched Chain Amino Acids by Using Same |
JP2023541130A JP2024502989A (ja) | 2021-01-26 | 2021-11-18 | aroGアルドラーゼ変異体及びそれを用いた分枝鎖アミノ酸生産方法 |
CA3205759A CA3205759A1 (en) | 2021-01-26 | 2021-11-18 | Arog aldolase variant and method for producing branched chain amino acids by using same |
MX2023007935A MX2023007935A (es) | 2021-01-26 | 2021-11-18 | Variante de aldolasa arog y procedimiento para producir aminoacidos de cadena ramificada con el uso de la misma. |
PCT/KR2021/016966 WO2022163981A1 (ko) | 2021-01-26 | 2021-11-18 | Arog 알돌라아제 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 |
AU2021423180A AU2021423180A1 (en) | 2021-01-26 | 2021-11-18 | aroG aldolase variant and method for producing branched chain amino acid by using same |
ARP210103558A AR124413A1 (es) | 2021-01-26 | 2021-12-17 | Variante de aldolasa arog y procedimiento para producir aminoácidos de cadena ramificada con el uso de la misma |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210010911A KR102495918B1 (ko) | 2021-01-26 | 2021-01-26 | aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220107795A true KR20220107795A (ko) | 2022-08-02 |
KR102495918B1 KR102495918B1 (ko) | 2023-02-06 |
Family
ID=82654752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210010911A KR102495918B1 (ko) | 2021-01-26 | 2021-01-26 | aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20240093163A1 (ko) |
EP (1) | EP4249593A1 (ko) |
JP (1) | JP2024502989A (ko) |
KR (1) | KR102495918B1 (ko) |
CN (1) | CN116867895A (ko) |
AR (1) | AR124413A1 (ko) |
AU (1) | AU2021423180A1 (ko) |
CA (1) | CA3205759A1 (ko) |
MX (1) | MX2023007935A (ko) |
WO (1) | WO2022163981A1 (ko) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3185261B2 (ja) * | 1991-02-05 | 2001-07-09 | 味の素株式会社 | 発酵法による芳香族アミノ酸の製造法 |
JP3225597B2 (ja) * | 1992-06-15 | 2001-11-05 | 味の素株式会社 | 発酵法によるl−フェニルアラニンの製造法 |
KR20070087091A (ko) * | 1999-06-25 | 2007-08-27 | 바스프 악티엔게젤샤프트 | 탄소 대사 및 에너지 생산과 관련된 단백질을 코딩하는코리네박테리움 글루타미쿰 유전자 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2229514C2 (ru) * | 2000-11-13 | 2004-05-27 | Закрытое акционерное общество "Научно-исследовательский институт "Аджиномото-Генетика" | 3-дезокси-d-арабиногептулозонат-7-фосфатсинтаза и фрагмент днк, кодирующий 3-дезокси-d-арабиногептулозонат-7-фосфатсинтазу из methylophilus methylotrophus |
KR100620092B1 (ko) | 2004-12-16 | 2006-09-08 | 씨제이 주식회사 | 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법 |
EP3170889A1 (en) | 2006-09-15 | 2017-05-24 | CJ Cheiljedang Corporation | A corynebacteria having enhanced l-lysine productivity and a method of producing l-lysine using the same |
DE102008040352A1 (de) * | 2008-07-11 | 2010-01-14 | Evonik Degussa Gmbh | Verfahren zur Herstellung von L-Tryptophan unter Verwendung von verbesserten Stämmen der Familie Enterobacteriaceae |
KR101117022B1 (ko) | 2011-08-16 | 2012-03-16 | 씨제이제일제당 (주) | L-발린 생산능이 향상된 미생물 및 이를 이용한 l-발린 제조방법 |
KR101632642B1 (ko) | 2015-01-29 | 2016-06-22 | 씨제이제일제당 주식회사 | 신규한 프로모터 및 그의 용도 |
BR112019004161B1 (pt) | 2016-08-31 | 2021-07-27 | Cj Cheiljedang Corporation | Molécula de ácido nucleico que possui uma atividade promotora, cassete de expressão gênica, vetor recombinante, micro-organismo recombinante do gênero corynebacterium e método de produzir um produto-alvo |
CA3048802C (en) | 2016-12-28 | 2021-10-19 | Cj Cheiljedang Corporation | A novel isopropylmalate synthase variant and a method of producing l-leucine using the same |
KR101996769B1 (ko) | 2018-12-21 | 2019-10-01 | 씨제이제일제당 (주) | 변이형 호모세린 디하이드로게나제 및 이를 이용한 호모세린 또는 호모세린 유래 l-아미노산의 생산 방법 |
KR102143964B1 (ko) | 2019-12-06 | 2020-08-12 | 씨제이제일제당 주식회사 | 신규한 분지쇄 아미노산 아미노트랜스퍼라제 변이체 및 이를 이용한 류신 생산방법 |
KR102278000B1 (ko) | 2020-03-17 | 2021-07-15 | 씨제이제일제당 주식회사 | 프리페네이트 디하이드라타아제 활성 강화를 통한 l-트립토판을 생산하는 방법 |
-
2021
- 2021-01-26 KR KR1020210010911A patent/KR102495918B1/ko active IP Right Grant
- 2021-11-18 CA CA3205759A patent/CA3205759A1/en active Pending
- 2021-11-18 MX MX2023007935A patent/MX2023007935A/es unknown
- 2021-11-18 WO PCT/KR2021/016966 patent/WO2022163981A1/ko active Application Filing
- 2021-11-18 US US18/274,196 patent/US20240093163A1/en active Pending
- 2021-11-18 AU AU2021423180A patent/AU2021423180A1/en active Pending
- 2021-11-18 CN CN202180089416.3A patent/CN116867895A/zh active Pending
- 2021-11-18 JP JP2023541130A patent/JP2024502989A/ja active Pending
- 2021-11-18 EP EP21923390.5A patent/EP4249593A1/en active Pending
- 2021-12-17 AR ARP210103558A patent/AR124413A1/es unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3185261B2 (ja) * | 1991-02-05 | 2001-07-09 | 味の素株式会社 | 発酵法による芳香族アミノ酸の製造法 |
JP3225597B2 (ja) * | 1992-06-15 | 2001-11-05 | 味の素株式会社 | 発酵法によるl−フェニルアラニンの製造法 |
KR20070087091A (ko) * | 1999-06-25 | 2007-08-27 | 바스프 악티엔게젤샤프트 | 탄소 대사 및 에너지 생산과 관련된 단백질을 코딩하는코리네박테리움 글루타미쿰 유전자 |
Non-Patent Citations (1)
Title |
---|
NCBI, Genbank accession no. WP_011014936.1 (2020.12.16) * |
Also Published As
Publication number | Publication date |
---|---|
CN116867895A (zh) | 2023-10-10 |
WO2022163981A1 (ko) | 2022-08-04 |
MX2023007935A (es) | 2023-07-14 |
EP4249593A1 (en) | 2023-09-27 |
CA3205759A1 (en) | 2022-08-04 |
KR102495918B1 (ko) | 2023-02-06 |
US20240093163A1 (en) | 2024-03-21 |
JP2024502989A (ja) | 2024-01-24 |
AU2021423180A1 (en) | 2023-07-13 |
AR124413A1 (es) | 2023-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101592140B1 (ko) | 자일로즈 이용능이 부여된 코리네박테리움 속 미생물 및 이를 이용한 l-라이신의 생산방법 | |
KR102527096B1 (ko) | 프리페네이트 탈수 효소 (Prephenate dehydratase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 | |
KR102470602B1 (ko) | 신규한 분지 연쇄 아미노산 아미노트렌스퍼라아제 변이체 및 이를 이용한 이소류신 생산 방법 | |
KR102273638B1 (ko) | 신규한 포스포글리세린산 디하이드로게나제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102273639B1 (ko) | 신규한 이중기능성 메틸렌테트라히드로폴레이트 탈수소효소/메테닐테트라하이드로폴레이트 사이클로하이드롤라아제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102279696B1 (ko) | 신규한 l-세린 암모니아 분해 효소 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102527895B1 (ko) | GlxR 단백질 변이체 또는 이를 이용한 쓰레오닌 생산방법 | |
KR102287112B1 (ko) | 신규한 쿠퍼익스포팅 P-type 에이티피에이즈 A 변이체 및 이를 이용한 L-트립토판 생산 방법 | |
KR102363913B1 (ko) | L-쓰레오닌 디하이드라타아제의 신규 변이체 및 이를 이용한 l-이소류신 생산 방법 | |
KR20220127078A (ko) | 신규한 시트레이트 신타아제 변이체 및 이를 이용한 l-발린 생산 방법 | |
KR102495918B1 (ko) | aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 | |
KR102527102B1 (ko) | 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 | |
KR102635860B1 (ko) | L-아미노산을 생산하는 코리네박테리움 속 미생물 및 이를 이용한 l-아미노산의 생산 방법 | |
KR102619598B1 (ko) | 신규한 아세토하이드록시산 신타아제 소단위체 변이체 및 이를 이용한 l-발린 생산 방법 | |
KR102464883B1 (ko) | 신규한 감마-아미노부티르산 퍼미에이즈 변이체 및 이를 이용한 이소류신 생산 방법 | |
KR102419166B1 (ko) | 신규한 글루타민 가수분해 gmp 합성효소 변이체 및 이를 이용한 퓨린 뉴클레오티드의 생산방법 | |
KR102147381B1 (ko) | 아세토하이드록시산 신타제 신규 변이체 및 이를 포함하는 미생물 | |
KR102287113B1 (ko) | 신규한 하이드로레이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR20220139085A (ko) | L-아르기닌을 생산하는 코리네박테리움 속 미생물 및 이를 이용한 l-아르기닌 생산방법 | |
KR20230094761A (ko) | L-이소루신 생산 미생물 및 이를 이용한 l-이소루신 생산 방법 | |
KR20220069864A (ko) | L-글루타민 생산능이 향상된 미생물 및 이를 이용한 l-글루타민 생산 방법 | |
KR20220083557A (ko) | 변이형 atp-의존적 프로테아제 및 이를 이용한 l-아미노산의 생산 방법 | |
KR20230045990A (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR20230045989A (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR20230167496A (ko) | L-오르니틴 생산능을 가지는 미생물 및 이를 이용한 l-오르니틴 생산방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |