KR20240000169A - L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 - Google Patents
L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 Download PDFInfo
- Publication number
- KR20240000169A KR20240000169A KR1020220076773A KR20220076773A KR20240000169A KR 20240000169 A KR20240000169 A KR 20240000169A KR 1020220076773 A KR1020220076773 A KR 1020220076773A KR 20220076773 A KR20220076773 A KR 20220076773A KR 20240000169 A KR20240000169 A KR 20240000169A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- histidine
- val
- protein
- Prior art date
Links
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 title claims abstract description 431
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 241
- 229960002885 histidine Drugs 0.000 title claims abstract description 224
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 153
- 238000000034 method Methods 0.000 title claims description 47
- 238000004519 manufacturing process Methods 0.000 claims abstract description 79
- 244000005700 microbiome Species 0.000 claims abstract description 77
- 235000018102 proteins Nutrition 0.000 claims description 146
- 102000040430 polynucleotide Human genes 0.000 claims description 58
- 108091033319 polynucleotide Proteins 0.000 claims description 58
- 239000002157 polynucleotide Substances 0.000 claims description 58
- 150000001413 amino acids Chemical class 0.000 claims description 53
- 235000001014 amino acid Nutrition 0.000 claims description 48
- 229940024606 amino acid Drugs 0.000 claims description 47
- 241000186216 Corynebacterium Species 0.000 claims description 15
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical group NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 13
- 241000588724 Escherichia coli Species 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 9
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 8
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical group CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 8
- 239000004474 valine Chemical group 0.000 claims description 8
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical group CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 7
- 229930182817 methionine Chemical group 0.000 claims description 7
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 6
- 239000004471 Glycine Chemical group 0.000 claims description 6
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Chemical group OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 6
- 235000004279 alanine Nutrition 0.000 claims description 6
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical group OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical group C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical group CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 5
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical group CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 5
- 125000000539 amino acid group Chemical group 0.000 claims description 5
- 241000588722 Escherichia Species 0.000 claims description 3
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 3
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 3
- 230000029142 excretion Effects 0.000 description 69
- 239000013598 vector Substances 0.000 description 64
- 108020004414 DNA Proteins 0.000 description 59
- 239000012634 fragment Substances 0.000 description 52
- 239000002609 medium Substances 0.000 description 40
- 125000003275 alpha amino acid group Chemical group 0.000 description 39
- 238000006116 polymerization reaction Methods 0.000 description 39
- 230000000694 effects Effects 0.000 description 36
- 210000004027 cell Anatomy 0.000 description 30
- 241001032355 Helcobacillus massiliensis Species 0.000 description 24
- 238000000137 annealing Methods 0.000 description 21
- 210000000349 chromosome Anatomy 0.000 description 21
- 238000004925 denaturation Methods 0.000 description 21
- 230000036425 denaturation Effects 0.000 description 21
- 230000001965 increasing effect Effects 0.000 description 21
- 230000035772 mutation Effects 0.000 description 21
- 150000007523 nucleic acids Chemical group 0.000 description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 18
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 18
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 18
- 235000014304 histidine Nutrition 0.000 description 18
- 108091067553 AzlC family Proteins 0.000 description 15
- 238000012217 deletion Methods 0.000 description 14
- 230000037430 deletion Effects 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 14
- 102000004196 processed proteins & peptides Human genes 0.000 description 14
- 108090000765 processed proteins & peptides Proteins 0.000 description 14
- 241000844900 Dermabacter vaginalis Species 0.000 description 13
- 108010006533 ATP-Binding Cassette Transporters Proteins 0.000 description 12
- 102000005416 ATP-Binding Cassette Transporters Human genes 0.000 description 12
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 12
- 102100026655 Zinc finger protein castor homolog 1 Human genes 0.000 description 12
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 239000008103 glucose Substances 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 10
- 108091008146 restriction endonucleases Proteins 0.000 description 10
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 9
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 9
- 108010021466 Mutant Proteins Proteins 0.000 description 9
- 102000008300 Mutant Proteins Human genes 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 9
- 241000057638 Helcobacillus Species 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- 239000013611 chromosomal DNA Substances 0.000 description 8
- 230000012010 growth Effects 0.000 description 8
- 230000002401 inhibitory effect Effects 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 108010047495 alanylglycine Proteins 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 6
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 6
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 235000014393 valine Nutrition 0.000 description 6
- 102100031780 Endonuclease Human genes 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 5
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 5
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 5
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 5
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 5
- 229940041514 candida albicans extract Drugs 0.000 description 5
- 239000004202 carbamide Substances 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 239000012153 distilled water Substances 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 239000012138 yeast extract Substances 0.000 description 5
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 4
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 4
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 4
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 4
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 4
- 241000186308 Corynebacterium stationis Species 0.000 description 4
- 241001050521 Cupriavidus pinatubonensis Species 0.000 description 4
- NOCCABSVTRONIN-CIUDSAMLSA-N Cys-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N NOCCABSVTRONIN-CIUDSAMLSA-N 0.000 description 4
- 241001508502 Dermabacter Species 0.000 description 4
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 241000588773 Kluyvera cryocrescens Species 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 4
- 241000568286 Leucobacter salsicius Species 0.000 description 4
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 4
- MQWISMJKHOUEMW-ULQDDVLXSA-N Phe-Arg-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 MQWISMJKHOUEMW-ULQDDVLXSA-N 0.000 description 4
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000012136 culture method Methods 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- -1 molase Substances 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 239000011573 trace mineral Substances 0.000 description 4
- 235000013619 trace mineral Nutrition 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 3
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 3
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 3
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 3
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 3
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 3
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 3
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 3
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 3
- GBAWQWASNGUNQF-ZLUOBGJFSA-N Asp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N GBAWQWASNGUNQF-ZLUOBGJFSA-N 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108091092584 GDNA Proteins 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 3
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 3
- LPHQAFLNEHWKFF-QXEWZRGKSA-N Gly-Met-Ile Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LPHQAFLNEHWKFF-QXEWZRGKSA-N 0.000 description 3
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000917056 Herbaspirillum aquaticum Species 0.000 description 3
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 3
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 3
- ZIPOVLBRVPXWJQ-SPOWBLRKSA-N Ile-Cys-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N ZIPOVLBRVPXWJQ-SPOWBLRKSA-N 0.000 description 3
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 3
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 3
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 3
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 3
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 3
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 3
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 3
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 3
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 3
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 3
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 3
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 3
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 3
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 3
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 3
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 3
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 3
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 3
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 3
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- JTMZSIRTZKLBOA-NWLDYVSISA-N Trp-Thr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JTMZSIRTZKLBOA-NWLDYVSISA-N 0.000 description 3
- YMNSKLWJSOANFS-OYDLWJJNSA-N Trp-Trp-Met Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(O)=O YMNSKLWJSOANFS-OYDLWJJNSA-N 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 108010054812 diprotin A Proteins 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 239000013587 production medium Substances 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 102220052983 rs111513627 Human genes 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 2
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241001644925 Corynebacterium efficiens Species 0.000 description 2
- 241000337023 Corynebacterium thermoaminogenes Species 0.000 description 2
- 238000007702 DNA assembly Methods 0.000 description 2
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 description 2
- QFXNFFZTMFHPST-DZKIICNBSA-N Gln-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)N)N QFXNFFZTMFHPST-DZKIICNBSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 2
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 2
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 2
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 2
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 2
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 2
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 2
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 2
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 2
- VWFHWJGVLVZVIS-QXEWZRGKSA-N Met-Val-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O VWFHWJGVLVZVIS-QXEWZRGKSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 2
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 2
- APECKGGXAXNFLL-RNXOBYDBSA-N Phe-Trp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 APECKGGXAXNFLL-RNXOBYDBSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 2
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 2
- BJCILVZEZRDIDR-PMVMPFDFSA-N Tyr-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 BJCILVZEZRDIDR-PMVMPFDFSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 2
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- DFPAKSUCGFBDDF-ZQBYOMGUSA-N [14c]-nicotinamide Chemical compound N[14C](=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-ZQBYOMGUSA-N 0.000 description 2
- 241000319304 [Brevibacterium] flavum Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009697 arginine Nutrition 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 229910000019 calcium carbonate Inorganic materials 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- ZIWNLPKLQFDFEU-FJXQXJEOSA-N calcium;3-[[(2r)-2,4-dihydroxy-3,3-dimethylbutanoyl]amino]propanoic acid Chemical compound [Ca].OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O ZIWNLPKLQFDFEU-FJXQXJEOSA-N 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 101150020288 hisL gene Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- 239000013028 medium composition Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 235000019796 monopotassium phosphate Nutrition 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011218 seed culture Methods 0.000 description 2
- 235000004400 serine Nutrition 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 229960003495 thiamine Drugs 0.000 description 2
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 2
- 235000008521 threonine Nutrition 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- PQGCEDQWHSBAJP-TXICZTDVSA-N 5-O-phosphono-alpha-D-ribofuranosyl diphosphate Chemical compound O[C@H]1[C@@H](O)[C@@H](O[P@](O)(=O)OP(O)(O)=O)O[C@@H]1COP(O)(O)=O PQGCEDQWHSBAJP-TXICZTDVSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- ODLLXUGPBCQRPF-UHFFFAOYSA-N Ala-Met-Met-Tyr Chemical compound CSCCC(NC(=O)C(C)N)C(=O)NC(CCSC)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 ODLLXUGPBCQRPF-UHFFFAOYSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- ZFSIGJMSVGZVGP-DHATWTDPSA-N Arg-Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCN=C(N)N)[C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZFSIGJMSVGZVGP-DHATWTDPSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108010023063 Bacto-peptone Proteins 0.000 description 1
- 239000005996 Blood meal Substances 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 1
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 1
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 1
- ZOMMHASZJQRLFS-IHRRRGAJSA-N Cys-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N ZOMMHASZJQRLFS-IHRRRGAJSA-N 0.000 description 1
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 1
- LEGMTEAZGRRIMY-ZKWXMUAHSA-N Gly-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN LEGMTEAZGRRIMY-ZKWXMUAHSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- MSASLZGZQAXVFP-PEDHHIEDSA-N Ile-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N MSASLZGZQAXVFP-PEDHHIEDSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 1
- HQPHMEPBNUHPKD-XIRDDKMYSA-N Leu-Cys-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N HQPHMEPBNUHPKD-XIRDDKMYSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 1
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 102000003939 Membrane transport proteins Human genes 0.000 description 1
- 108090000301 Membrane transport proteins Proteins 0.000 description 1
- QDMUMFDBUVOZOY-GUBZILKMSA-N Met-Arg-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N QDMUMFDBUVOZOY-GUBZILKMSA-N 0.000 description 1
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- ORRNBLTZBBESPN-HJWJTTGWSA-N Met-Ile-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ORRNBLTZBBESPN-HJWJTTGWSA-N 0.000 description 1
- AFVOKRHYSSFPHC-STECZYCISA-N Met-Ile-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFVOKRHYSSFPHC-STECZYCISA-N 0.000 description 1
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- NRKNYPRRWXVELC-NQCBNZPSSA-N Phe-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NRKNYPRRWXVELC-NQCBNZPSSA-N 0.000 description 1
- DEZCWWXTRAKZKJ-UFYCRDLUSA-N Phe-Phe-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DEZCWWXTRAKZKJ-UFYCRDLUSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- OLZVAVSJEUAOHI-UNQGMJICSA-N Phe-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O OLZVAVSJEUAOHI-UNQGMJICSA-N 0.000 description 1
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 1
- BTAIJUBAGLVFKQ-BVSLBCMMSA-N Phe-Trp-Val Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C(C)C)C(O)=O)C1=CC=CC=C1 BTAIJUBAGLVFKQ-BVSLBCMMSA-N 0.000 description 1
- GLUYKHMBGKQBHE-JYJNAYRXSA-N Phe-Val-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 GLUYKHMBGKQBHE-JYJNAYRXSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- MCPXQHVVCPTRIM-HJOGWXRNSA-N Pro-Trp-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)[C@@H]1CCCN1 MCPXQHVVCPTRIM-HJOGWXRNSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 208000007107 Stomach Ulcer Diseases 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- LKEKWDJCJSPXNI-IRIUXVKKSA-N Thr-Glu-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LKEKWDJCJSPXNI-IRIUXVKKSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 1
- WPSYJHFHZYJXMW-JSGCOSHPSA-N Trp-Gln-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O WPSYJHFHZYJXMW-JSGCOSHPSA-N 0.000 description 1
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- BOMYCJXTWRMKJA-RNXOBYDBSA-N Trp-Phe-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N BOMYCJXTWRMKJA-RNXOBYDBSA-N 0.000 description 1
- CSOBBJWWODOYGW-ILWGZMRPSA-N Trp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O CSOBBJWWODOYGW-ILWGZMRPSA-N 0.000 description 1
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- ADMHZNPMMVKGJW-BPUTZDHNSA-N Trp-Ser-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ADMHZNPMMVKGJW-BPUTZDHNSA-N 0.000 description 1
- GBEAUNVBIMLWIB-IHPCNDPISA-N Trp-Ser-Phe Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 GBEAUNVBIMLWIB-IHPCNDPISA-N 0.000 description 1
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 1
- UOXPLPBMEPLZBW-WDSOQIARSA-N Trp-Val-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 UOXPLPBMEPLZBW-WDSOQIARSA-N 0.000 description 1
- MXKUGFHWYYKVDV-SZMVWBNQSA-N Trp-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(C)C)C(O)=O MXKUGFHWYYKVDV-SZMVWBNQSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- FMOSEWZYZPMJAL-KKUMJFAQSA-N Tyr-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N FMOSEWZYZPMJAL-KKUMJFAQSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 1
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 1
- NUQZCPSZHGIYTA-HKUYNNGSSA-N Tyr-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NUQZCPSZHGIYTA-HKUYNNGSSA-N 0.000 description 1
- JRMCISZDVLOTLR-BVSLBCMMSA-N Tyr-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CC=C(C=C3)O)N JRMCISZDVLOTLR-BVSLBCMMSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- BZOSBRIDWSSTFN-AVGNSLFASA-N Val-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N BZOSBRIDWSSTFN-AVGNSLFASA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010031014 alanyl-histidyl-leucyl-leucine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000012501 ammonium carbonate Nutrition 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 150000007514 bases Chemical class 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000003240 coconut oil Substances 0.000 description 1
- 235000019864 coconut oil Nutrition 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 101150091570 gapA gene Proteins 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 201000005917 gastric ulcer Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 230000003832 immune regulation Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 229910000358 iron sulfate Inorganic materials 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- SURQXAFEQWPFPV-UHFFFAOYSA-L iron(2+) sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Fe+2].[O-]S([O-])(=O)=O SURQXAFEQWPFPV-UHFFFAOYSA-L 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 235000020778 linoleic acid Nutrition 0.000 description 1
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 1
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- LVCQAASWWXWFTQ-UHFFFAOYSA-L magnesium;sulfate;pentahydrate Chemical compound O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O LVCQAASWWXWFTQ-UHFFFAOYSA-L 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 229940111688 monobasic potassium phosphate Drugs 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 235000014593 oils and fats Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 230000007065 protein hydrolysis Effects 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 235000020238 sunflower seed Nutrition 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/24—Proline; Hydroxyproline; Histidine
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 출원은 L-히스티딘 배출능을 갖는 히스티딘 배출 단백질 또는 이의 변이체를 발굴하고, 이를 L-히스티딘의 생산능을 가지는 미생물에서 발현시킨 결과, L-히스티딘 생산량을 획기적으로 향상시킬 수 있다.
Description
히스티딘 배출 활성을 갖는 신규 단백질, 상기 단백질이 발현되도록 변형된 L-히스티딘 생산 미생물, 및 상기 미생물을 이용하여 L-히스티딘을 생산하는 방법에 관한 것이다.
L-히스티딘은 20개의 표준 아미노산들 가운데 하나의 아미노산으로, 영양학적인 관점에서 볼 때 성인에게는 많은 양이 요구되지 않지만, 성장기 어린이들에게는 해당하는 필수 아미노산으로 분류된다. 또한, L-히스티딘은 항산화와 면역 조절 등 중요한 생리적 과정에 관여하여 위장 궤양 치료제, 순환기계 치료제의 원료 및 아미노산 수액 제제 등 의학 산업에 사용된다.
L-히스티딘은 특히 헤모글로빈에 많이 들어 있어서, 혈분을 원료로 하는 단백질 가수 분해 추출법을 통해 주로 생산된다. 그러나, 이러한 방법은 낮은 효율과 환경 오염 등의 단점을 지니고 있다. 반면, 미생물 발효법을 통하여 L-히스티딘을 생산하는 것은 가능하나, 대규모 공업화는 아직 이루어지지 않았다. 이는 L-히스티딘의 생합성이 뉴클레오타이드 합성 전구체인 포스포리보실 피로인산 (PRPP)과 경쟁 관계를 가지며, 고 에너지를 요구하는 복잡한 생합성 과정 및 조절 메커니즘을 가지고 있기 때문이다.
다른 종류의 아미노산의 배출능을 갖는 단백질의 발현 및/또는 기능이 강화되면 해당 아미노산의 생산이 증가되는 예는 알려져 있으나, L-히스티딘 특이적 배출능을 갖는 단백질에 대한 선행 연구는 거의 진행된 바 없다.
이러한 배경하에서, 히스티딘 특이적 배출능을 갖는 단백질의 발굴 및 이를 이용한 히스티딘 생산 기술의 개발이 요구된다.
본 출원의 목적은 (1) 서열번호 43의 아미노산 서열의 72번째 아미노산 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나,
(2) 서열번호 43의 아미노산 서열의 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나,
(3) 상기 (1) 및 (2)가 모두 치환된, 변이형 L-히스티딘 배출 단백질을 제공하는 것이다.
본 출원의 다른 목적은 상기 단백질 또는 상기 단백질을 암호화하는 폴리뉴클레오타이드를 포함하는 미생물을 제공하는 것이다.
본 출원의 또 다른 목적은 상기 단백질, 상기 단백질을 암호화하는 폴리뉴클레오타이드, 또는 상기 미생물을 포함하는 L-히스티딘 생산용 조성물을 제공하는 것이다.
본 출원의 또 다른 목적은, 상기 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산 방법을 제공하는 것이다.
본 출원은 L-히스티딘 배출능을 갖는 히스티딘 배출 단백질의 변이체를 발굴하고, 이를 L-히스티딘의 생산능을 가지는 미생물에서 발현시킨 결과, L-히스티딘 생산량을 획기적으로 향상시킬 수 있음을 제안한다.
본 명세서에서, 헬코바실러스 마시리엔시스 (Helcobacillus massiliensis) 유래의 AzlC 계열 ABC 수송체 투과효소 (AzlC family ABC transporter permease)를 발현하는 미생물이 L-히스티딘 생산능이 우수함을 확인하고, 상기 AzlC 계열 ABC 수송체 투과효소의 특정 위치에 아미노산 치환 변이가 도입되는 경우, L-히스티딘 생산능이 보다 증가하는 것을 확인하였다.
단백질, 폴리뉴클레오타이드, 및 재조합 벡터
일 양상은 L-히스티딘 배출 활성을 갖는 변이형 단백질(또는 폴리펩타이드)을 제공한다. 상기 단백질은 L-히스티딘 특이적 배출능을 갖는 단백질일 수 있다. 본 명세서에서, 상기 변이형 단백질은 변이형 L-히스티딘 배출 단백질로 표현될 수 있다. 상기 변이형 단백질은 AzlC 계열 ABC 수송체 투과 활성을 가지는 것일 수 있다.
일 예에서 상기 변이형 단백질은 야생형 L-히스티딘 배출 단백질 (예컨대, AzlD 도메인-함유 단백질 (AzlD domain-containing protein), 또는 AzlC 계열 ABC 수송체 투과효소 단백질 (AzlC family ABC transporter permease) 등)과 동등하거나 보다 강화된 L-히스티딘 배출 활성을 가지는 것일 수 있다. 상기 AzlD 도메인-함유 단백질 또는 AzlC 계열 ABC 수송체 투과효소 단백질은 헬코바실러스 마시리엔시스 (Helcobacillus massiliensis) 유래의 것일 수 있다. 본 명세서에서, 헬코바실러스 마시리엔시스 유래의 AzlD 도메인-함유 단백질은 HmaE 단백질 (또는 HmaE), 헬코바실러스 마시리엔시스 유래의 AzlC 계열 ABC 수송체 투과효소 단백질은 HmaF 단백질 (또는 HmaF)로 기재될 수 있다.
일 예에서, 상기 변이형 단백질 (예컨대, AzlD 도메인-함유 단백질의 변이형 단백질, 구체적으로 헬코바실러스 마시리엔시스 유래의 AzlD 도메인-함유 단백질의 변이형 단백질)은 AzlC 계열 ABC 수송체 투과효소 단백질과 동일한 오페론 유전자에서 함께 발현되는 것일 수 있다. 일 예에서, 상기 변이형 단백질은 상기 AzlC 계열 ABC 수송체 투과효소 단백질과 결합하여 L-히스티딘 배출 활성을 갖는 것일 수 있다.
일 예에서 상기 변이형 단백질은 헬코바실러스 마시리엔시스 (Helcobacillus massiliensis) 유래의 AzlC 계열 ABC 수송체 투과효소 단백질의 변이형 단백질일 수 있다.
상기 변이형 단백질은, 헬코바실러스 마시리엔시스 유래의 야생형 AzlC 계열 ABC 수송체 투과효소 단백질의 하나 이상의 아미노산 잔기가 치환, 결실, 또는 삽입된 변이가 도입된 변이형 단백질일 수 있다.
상기 헬코바실러스 마시리엔시스 유래의 야생형 AzlC 계열 ABC 수송체 투과효소 단백질은 서열번호 43의 아미노산 서열(WP_055090792.1)을 포함하거나 상기 서열로 이루어지는 것일 수 있다.
일 예에서, 상기 변이형 단백질은 서열번호 43의 아미노산 서열에서 N-말단으로부터 (1) 72번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나,
(2) 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나, 또는
(3) 상기 (1) 및 (2)가 모두 치환된 아미노산 서열을 포함하는 것일 수 있다.
상기와 같이 아미노산 서열에서 N-말단으로부터 아미노산을 계수하는 것은, 개시코돈으로부터 번역된 메티오닌(Met, M)을 1번째 아미노산으로 하여 계수하는 것을 의미할 수 있다.
일 예에서, 상기 변이형 단백질은 서열번호 43의 아미노산 서열에서 N-말단으로부터 (1) 72번째 잔기에 상응하는 아미노산이 다른 아미노산, 즉 원래의 아미노산과 상이한 아미노산으로서, 류신(Leu, L), 아르기닌(Arg, R), 히스티딘(His, H), 리신(Lys, K), 아스파르트산(Asp, D), 글루탐산(Glu, E), 세린(Ser, S), 트레오닌(Thr, T), 아스파라긴(Asn, N), 글루타민(Gln, Q), 시스테인(Cys, C), 글리신(Gly, G), 프롤린(Pro, P), 알라닌(Ala, A), 발린(Val, V), 메티오닌(Met, M), 페닐알라닌(Phe, F), 타이로신(Tyr, Y), 또는 트립토판(Trp, W)으로 치환된 서열을 포함하거나,
(2) 124번째 잔기에 상응하는 아미노산이 다른 아미노산, 즉 원래의 아미노산과 상이한 아미노산으로서, 발린, 아르기닌, 히스티딘, 리신, 아스파르트산, 글루탐산, 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 글리신, 프롤린, 알라닌, 류신, 메티오닌, 페닐알라닌, 타이로신, 또는 트립토판으로 치환된 서열을 포함하거나,
(3) 상기 (1) 및 (2)가 모두 치환된 서열을 포함하는 것일 수 있다.
일 예에서, 상기 변이형 단백질은 서열번호 43의 아미노산 서열에서 N-말단으로부터 (1) 72번째 잔기에 상응하는 아미노산이 류신, 글리신, 프롤린, 알라닌, 발린, 또는 메티오닌으로 치환되거나;
(2) 124번째 잔기에 상응하는 아미노산이 발린, 글리신, 프롤린, 알라닌, 류신, 또는 메티오닌으로 치환되거나; 또는
(3) 상기 (1) 및 (2)가 모두 치환된 서열을 포함하는 것일 수 있다.
일 구체예에서, 상기 변이형 단백질은 서열번호 43의 아미노산 서열에서 N-말단으로부터 72번째 잔기에 상응하는 아미노산이 류신으로 치환되고, 124번째 잔기에 상응하는 아미노산이 발린으로 치환된 것일 수 있다. 상기 변이형 단백질 중 서열번호 43의 N-말단으로부터 72번째 및/또는 124번째 아미노산 잔기에 상응하는 아미노산을 제외한 일부 아미노산 서열이 결실, 변형, 치환 또는 부가되더라도 AzlC 계열 ABC 수송체 투과효소 활성을 나타내는 한 본 출원의 변이형 단백질에 포함될 수 있음은 자명하다.
또한, 일 예에서 상기 변이형 단백질은 서열번호 43로 기재되는 아미노산 서열과 적어도 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 서열 상동성 또는 서열 동일성을 가지는 아미노산 서열에서, 서열번호 43의 아미노산 서열에서 N-말단으로부터 (1) 72번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나, (2) 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나, 또는 (3) 상기 (1) 및 (2)가 모두 치환된 폴리펩타이드를 포함할 수 있다. 즉 서열번호 43의 아미노산 서열에서 N-말단으로부터 72번째 및/또는 124번째 잔기에 상응하는 위치에서 다른 아미노산으로의 치환을 포함하고 서열번호 43의 아미노산 서열과 적어도 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 서열 상동성 또는 서열 동일성을 가지며 AzlC 계열 ABC 수송체 투과효소 활성을 가지는 폴리펩타이드는 본 출원의 변이형 단백질에 포함될 수 있다.
일 구체예에서 상기 변이형 단백질은 서열번호 56의 아미노산 서열을 포함하거나 상기 서열로 이루어지는 것일 수 있으나 이에 제한되는 것은 아니다. 상기 서열번호 56의 아미노산 서열로 이루어진 변이형 단백질에서 서열번호 56의 아미노산 서열에서 N-말단으로부터 72번째 및/또는 124번째 잔기에 상응하는 아미노산을 제외한 일부 아미노산 서열이 결실, 변형, 치환 또는 부가되더라도 AzlC 계열 ABC 수송체 투과효소 활성을 나타내는 한 본 출원의 변이형 단백질에 포함될 수 있음은 자명하다. 또한 일 예에서 상기 변이형 단백질은 서열번호 56의 아미노산 서열에서 N-말단으로부터 72번째 및/또는 124번째 잔기에 상응하는 아미노산은 고정되고, 서열번호 56의 아미노산 서열과 적어도 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 서열 상동성 또는 서열 동일성을 가지는 폴리펩타이드를 포함할 수 있다. 즉, 서열번호 56의 아미노산 서열에서 N-말단으로부터 72번째 및/또는 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되고, 서열번호 56의 아미노산 서열과 적어도 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 상동성 또는 동일성을 가지는, AzlC 계열 ABC 수송체 투과효소 활성을 가지는 폴리펩타이드는 본 출원의 변이형 단백질 포함될 수 있다.
일 예에서, 상기 변이형 단백질은 야생형 단백질 (예컨대, 야생형 AzlD 도메인-함유 단백질)보다 L-히스티딘 배출 활성이 보다 강화된 것일 수 있다. 일 예에서, 상기 변이형 단백질은 야생형 AzlC 계열 ABC 수송체 투과효소 단백질과 함께 발현되는 경우, L-히스티딘 배출 활성이 보다 강화될 수 있다.
상기 야생형 L-히스티딘 배출 단백질은 서열번호 43 (헬코바실러스 마시리엔시스 유래의 야생형 AzlC 계열 ABC 수송체 투과효소 단백질), 서열번호 44 (헬코바실러스 마시리엔시스 유래의 야생형 AzlD 도메인-함유 단백질) 또는 이들의 조합과 60% 이상의 서열 상동성을 갖는 단백질일 수 있다. 예컨대, 일 구체예에서, 상기 야생형 L-히스티딘 배출 단백질은 서열번호 43, 44, 또는 이의 조합과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 상동성을 갖는 것일 수 있다. 상기 서열번호 43으로 표현되는 단백질은 서열번호 45의 핵산서열에 의하여 암호화되고, 서열번호 44로 표현되는 단백질은 서열번호 46의 핵산서열에 의하여 암호화되거나, 서열번호 43 및/또는 서열번호 44으로 표현되는 단백질은 서열번호 47 핵산서열 (서열번호 45의 3' 말단과 서열번호 46의 5' 말단의 중복 부위에서 융합된 오페론 서열임)에 의하여 암호화되는 것일 수 있다.
다른 양상은, 상기 변이형 단백질을 암호화하는 (코딩하는) 폴리뉴클레오타이드를 제공한다.
본 출원에서 용어, "폴리뉴클레오타이드"는 뉴클레오타이드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오타이드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이형 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 단편을 의미한다.
본 출원의 변이형 단백질을 코딩하는 폴리뉴클레오타이드는 서열번호 56의 아미노산 서열을 코딩하는 염기서열을 포함할 수 있다.
본 명세서에서, 폴리뉴클레오타이드("유전자"와 혼용될 수 있음) 또는 폴리펩타이드("단백질"과 혼용될 수 있음)가 "특정 핵산 서열 또는 아미노산 서열을 포함한다, 특정 핵산 서열 또는 아미노산 서열로 이루어진다, 또는 특정 핵산 서열 또는 아미노산 서열로 표현된다" 함은 상기 폴리뉴클레오타이드 또는 폴리펩타이드가 상기 특정 핵산 서열 또는 아미노산 서열을 필수적으로 포함하는 것을 의미할 수 있으며, 상기 폴리뉴클레오타이드 또는 폴리펩타이드의 본래의 기능 및/또는 목적하는 기능을 유지하는 범위에서 상기 특정 핵산 서열 또는 아미노산 서열에 변이(결실, 치환, 변형, 및/또는 부가)가 가해진 "실질적으로 동등한 서열"을 포함하는 것(또는 상기 변이를 배제하지 않는 것)으로 해석될 수 있다.
일 예에서, 본 명세서에서 제공되는 핵산 서열 또는 아미노산 서열은 이들의 본래의 기능 또는 목적하는 기능을 유지하는 범위에서 통상적인 돌연변이 유발법, 예를 들면 방향성 진화법(direct evolution) 및/또는 부위특이적 돌연변이법(site-directed mutagenesis) 등에 의하여 변형된 것을 포함할 수 있다. 일 예에서, 폴리뉴클레오타이드 또는 폴리펩타이드가 "특정 핵산 서열 또는 아미노산 서열을 포함한다 또는 특정 핵산 서열 또는 아미노산 서열로 이루어진다" 함은 상기 폴리뉴클레오타이드 또는 폴리펩타이드가 (i) 상기 특정 핵산 서열 또는 아미노산 서열을 필수적으로 포함하거나, 또는 (ii) 상기 특정 핵산 서열 또는 아미노산 서열과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 상동성을 갖는 아미노산 서열로 이루어지거나 이를 필수적으로 포함하고 본래의 기능 및/또는 목적하는 기능을 유지하는 것을 의미할 수 있다. 본 명세서에서, 상기 목적하는 기능은 미생물의 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 부여하거나, 증가시키는 기능을 의미할 수 있다.
본 명세서에 기재된 핵산 서열은 코돈의 축퇴성(degeneracy)으로 인하여 상기 단백질을 발현시키고자 하는 미생물에서 선호되는 코돈을 고려하여, 코딩영역으로부터 발현되는 단백질의 아미노산 서열 및/또는 기능을 변화시키지 않는 범위 내에서 코딩영역에 다양한 변형이 이루어질 수 있다.
본 명세서에서, 용어 "상동성(identity)"은 주어진 핵산 서열 또는 아미노산 서열과 일치하는 정도를 의미하며 백분율(%)로 표시될 수 있다. 핵산 서열에 대한 상동성의 경우, 예를 들면, 문헌에 의한 알고리즘 BLAST(참조: Karlin 및 Altschul, Pro. Natl. Acad. Sci. USA, 90, 5873, 1993)나 Pearson에 의한 FASTA(참조: Methods Enzymol., 183, 63, 1990)를 사용하여 결정할 수 있다. 이러한 알고리즘 BLAST에 기초하여, BLASTN이나 BLASTX라고 불리는 프로그램이 개발되어 있다(참조: http://www.ncbi.nlm.nih.gov).
일 예에서, 본 명세서에 제공되는 특정 핵산 서열을 포함하는 폴리뉴클레오타이드는 상기 특정 핵산 서열 또는 이와 실질적으로 동등한 핵산 서열뿐만 아니라, 상기 특정 핵산 서열에 상보적인 핵산 서열을 포함하는 폴리뉴클레오타이드 단편을 포함하는 것으로 해석될 수 있다. 구체적으로, 상기 상보성을 가지는 폴리뉴클레오타이드는 목적에 따라 당업자에 의해 적절히 조절 가능한 Tm 값, 예컨대, 55℃, 60℃, 63℃ 또는 65℃의 Tm 값에서 혼성화하고, 후술하는 조건에서 분석할 수 있다: 이러한 조건은 공지의 문헌에 구체적으로 기재되어 있다. 예를 들어, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 높은 상보성을 갖는 유전자끼리 혼성화하고, 그보다 낮은 상보성을 갖는 유전자끼리는 혼성화하지 않는 조건, 또는 통상의 써던 하이브리드화의 세척 조건인 60℃, 1x SSC(saline-sodium citrate buffer), 및 0.1%(w/v) SDS (Sodium Dodecyl Sulfate); 60℃, 0.1x SSC, 및 0.1% SDS; 또는 68℃, 0.1x SSC, 및 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세척하는 조건을 열거할 수 있으나, 이에 제한되는 것은 아니다. 혼성화에는 두 개의 뉴클레오타이드가 상보적 서열을 가질 것이 요구되거나, 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 허용될 수 있다. 상기 용어 "상보적"은 서로 혼성화가 가능한 뉴클레오타이드 염기 간의 관계를 기술하기 위하여 사용될 수 있다. 예를 들면, DNA의 경우, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 폴리뉴클레오타이드를 혼성화하는 적절한 엄격도는 폴리뉴클레오타이드의 길이 및 상보성 정도에 의존하고, 이는 관련 기술분야에 잘 알려져 있다 (Sambrook et al., supra,9.50-9.51, 11.7-11.8 참조).
상기 폴리뉴클레오타이드 또는 벡터의 도입은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있다. 본 명세서에서, 용어 "형질전환"은 특정 폴리뉴클레오타이드 또는 이를 포함하는 벡터를 숙주 세포 내로 도입하는 과정으로 형질전환된 폴리뉴클레오타이드는 숙주 세포 내에서 염색체 내에 삽입되어 위치하거나 염색체 외에 위치할 수 있다. 일 예로 형질전환은 표적 단백질(외래 단백질)을 암호화하는 폴리뉴클레오타이드나 이를 포함하는 벡터를 숙주 세포 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오타이드가 암호화하는 단백질이 발현할 수 있도록 하는 것일 수 있다. 또한, 상기 폴리뉴클레오타이드는 표적 단백질을 코딩하는 DNA 및/또는 RNA를 포함할 수 있다. 상기 폴리뉴클레오타이드는 숙주 세포 내로 도입되어 발현될 수 있는 것이면, 그 도입되는 형태는 제한이 없다. 예를 들면, 상기 폴리뉴클레오타이드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트 (expression cassette)의 형태로 숙주 세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오타이드에 작동 가능하게 연결되어 있는 프로모터 (promoter), 전사 종결신호, 리보좀 결합부위 및/또는 번역 종결신호 등의 발현 조절 요소를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오타이드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있다. 상기에서 용어 "작동 가능하게 연결"된 것이란 발현조절 요소가 목적 단백질(외래 단백질)을 암호화하는 폴리뉴클레오타이드의 전사 조절 (예, 전사 개시)를 수행할 수 있도록 발현조절 요소 (예, 프로모터)와 폴리뉴클레오타이드가 기능적으로 연결되어 있는 것을 의미할 수 있다. 작동 가능한 연결은 당업계의 공지된 유전자 재조합 기술을 이용하여 수행할 수 있으며, 예컨대, 통상적인 부위-특이적 DNA 절단 및 연결에 의하여 수행될 수 있으나, 이에 제한되지 않는다.
상기 폴리뉴클레오타이드를 숙주 세포에 형질전환 하는 방법은 핵산을 세포(미생물) 내로 도입하는 어떠한 방법으로도 수행 가능하며, 숙주 세포에 따라 당 분야에서 공지된 형질전환 기술을 적절히 선택하여 수행할 수 있다. 상기 공지된 형질전환 방법으로 전기천공법 (electroporation), 인산칼슘 (CaPO4) 침전법, 염화칼슘 (CaCl2) 침전법, 미세주입법 (microinjection), 폴리에틸렌글리콜 (PEG) 침전법(polyethylene glycol-mediated uptake), DEAE-덱스트란법, 양이온 리포좀법, 리포펙션(lipofection), 초산 리튬-DMSO법 등이 예시될 수 있으나, 이에 제한되는 것은 아니다.
상기 폴리뉴클레오타이드의 숙주 세포 유전체 (염색체) 내 도입 (삽입)은 공지된 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 예컨대, RNA-가이드 엔도뉴클레아제 시스템 (RNA-guided endonuclease system 또는 CRISPR system; 예컨대, (a) RNA-가이드 엔도뉴클레아제(예, Cas9 단백질 등), 이의 암호화 유전자, 또는 상기 유전자를 포함하는 벡터; 및 (b) 가이드 RNA (예, single guide RNA (sgRNA) 등), 이의 암호화 DNA, 또는 상기 DNA를 포함하는 벡터를 포함하는 혼합물(예컨대, RNA-가이드 엔도뉴클레아제 단백질과 가이드 RNA의 혼합물 등), 복합체 (예컨대, 리보핵산 융합단백질 (RNP), 재조합 벡터 (예컨대, RNA-가이드 엔도뉴클레아제 암호화 유전자 및 가이드 RNA 암호화 DNA를 함께 포함하는 벡터 등) 등으로 이루어진 군에서 선택된 하나 이상)을 사용하여 수행될 수 있으나, 이에 제한되는 것은 아니다.
다른 양상은, 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터를 제공한다. 상기 재조합 벡터는 상기 폴리펩타이드의 발현 벡터로서 사용될 수 있다. 상기 재조합 벡터는 상기 폴리뉴클레오타이드를 숙주세포의 유전체에 삽입 또는 숙주 세포 유전체의 대응 유전자를 대체하기 위한 것일 수 있다.
본 명세서에서, 용어 "벡터"는 적합한 숙주 내에서 목적 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 상기 목적 단백질을 암호화하는 폴리뉴클레오타이드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 암호화하는 서열, 및/또는 전사 및/또는 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주 세포 내로 형질전환된 후, 숙주 세포의 게놈(유전체)과 무관하게 발현되거나, 숙주 세포의 게놈 내에 통합될 수 있다.
본 명세서에서 사용가능한 벡터는 숙주 세포 내에서 복제 가능한 것이면 특별히 한정되지 않으며, 통상 사용되는 모든 벡터들 중에서 선택될 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스, 박테리오파지 등을 들 수 있다. 예를 들어, 상기 벡터로서, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 예시할 수 있으나, 이에 제한되지 않는다.
본 명세서에서 사용 가능한 벡터는 공지된 발현 벡터 및/또는 폴리뉴클레오타이드의 숙주 세포 염색체 내 삽입용 벡터일 수 있다. 상기 폴리뉴클레오타이드의 숙주 세포 염색체 내 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합 또는 CRISPR 시스템에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 벡터는 상기 염색체 내 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉, 상기 폴리뉴클레오타이드의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 단백질의 발현과 같은 선택가능 표현형을 부여하는 유전자들 중에서 선택되어 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
미생물
다른 양상은, 상기 변이형 단백질, 상기 변이형 단백질을 암호화하는 폴리뉴클레오타이드, 및 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터로 이루어진 군에서 선택된 하나 이상(1종, 2종, 또는 3종 모두)를 포함하는 미생물을 제공한다. 상기 미생물은 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 가지는 것일 수 있다. 상기 미생물은 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 상기 변이형 단백질, 상기 변이형 단백질을 암호화하는 폴리뉴클레오타이드, 및 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터로 이루어지는 군에서 선택된 1종 이상을 포함하지 않는 미생물과 비교하여 강화된(또는 증가된, 향상된) 것일 수 있다.
상기 변이형 단백질은 외래의 것일 수 있다. 본 명세서에서 "외래의 것"은 미생물 내재적으로 존재하는 것이 아니라, 상기 미생물과 다른 종으로부터 유래한 것을 의미하는 것일 수 있다.
본 명세서에서, "L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된 미생물"은 앞서 설명한 변이형 단백질을 발현하도록 조작(변이)됨으로써, L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 없던 미생물이 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 갖게 되거나, 본래의 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능보다 높은 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 갖게된 것일 수 있다.
본 명세서에서 "미생물"은 단세포 박테리아를 포괄하는 것으로, "세포"와 혼용될 수 있다.
본 출원에서 용어, "미생물(또는, 균주)"는 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩타이드, 단백질 또는 산물(예컨대, L-히스티딘)의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.
본 출원의 미생물은 L-히스티딘 배출 단백질 또는 이를 코딩하는 폴리뉴클레오타이드의 활성이 강화되도록 벡터를 통해 유전적으로 변형된 미생물(예컨대, 재조합 미생물)일 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.
본 명세서에서, 상기 변이형 단백질을 발현하도록 변이되기 전의 미생물을 상기 변이된 미생물과 구별하기 위하여, "모균주 (parent microorganism or parent strain) 또는 숙주 세포 (host cell)"로 표현될 수 있다.
상기 미생물(또는 균주, 재조합 세포)이 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 갖거나, L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된다는 것은, L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 없는 비변형 미생물, 재조합 전의 세포, 모균주, 및/또는 야생형 균주와는 달리 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 부여된 것이거나, 비변형 미생물, 재조합 전의 세포, 모균주, 및/또는 야생형 균주와 비교하여 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 향상된 것을 의미할 수 있다.
본 출원의 미생물은 본 출원의 변이형 단백질, 본 출원의 변이형 단백질을 암호화하는 폴리뉴클레오타이드 및 본 출원의 폴리뉴클레오타이드를 포함하는 벡터 중 어느 하나 이상을 포함하는 미생물; 본 출원의 변이형 단백질 또는 본 출원의 폴리뉴클레오타이드를 발현하도록 변형된 미생물; 본 출원의 변이형 단백질, 또는 본 출원의 폴리뉴클레오타이드를 발현하는 미생물 (예컨대, 재조합 균주); 또는 본 출원의 변이형 단백질 활성을 갖는 미생물 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.
일 예에서, 상기 미생물은 코리네박테리움 속 (the genus Corynebacterium) 미생물, 에세리키아 속 (Escherichia) 미생물 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 상기 코리네박테리움 속 미생물은 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 코리네박테리움 암모니아게네스 (Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘텀 (Brevibacterium lactofermentum), 브레비박테리움 플라범 (Brevibacterium flavum), 코리네박테리움 써모아미노게네스 (Corynebacterium thermoaminogenes), 코리네박테리움 에피션스 (Corynebacterium efficiens) 등을 포함할 수 있으나, 반드시 이에 한정되는 것은 아니다. 보다 더욱 구체적으로는, 상기 코리네박테리움 속 미생물은 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)일 수 있다. 상기 에세리키아 속 균주는 대장균 (Escherichia coli)일 수 있다.
상기 미생물은 변이형 단백질, 상기 변이형 단백질을 암호화하는 폴리뉴클레오타이드, 및 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터로 이루어진 군에서 선택된 하나 이상(1종, 2종, 또는 3종 모두)을 포함하는 것일 수 있다. 일 예에서, 상기 변이형 단백질을 발현하도록 하는 변이는 앞서 설명한 변이형 단백질을 암호화하는 폴리뉴클레오타이드, 또는 이를 포함하는 재조합 벡터를 도입하는 것에 의하여 수행되거나, 또는 인공 돌연변이 (예컨대, Error-prone PCR 등) 등에 의하여 수행되는 것일 수 있다. 이와 같이 모균주에 도입되는 변이형 단백질을 암호화하는 폴리뉴클레오타이드는 모균주 내재의 AzlC 계열 ABC 수송체 투과효소 암호화 유전자를 대체하거나 이에 더하여 추가로 포함되는 것일 수 있다.
일 예에서, 상기 미생물은, 상기 변이형 단백질을 야생형 AzlC 계열 ABC 수송체 투과효소 단백질과 함께 포함하는 경우, L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 보다 강화될 수 있다.
일 예에서, 상기 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된 미생물은 변이 전 모균주, 비변형 미생물, 야생형 L-히스티딘 배출 단백질을 포함하는 미생물과 비교하여 L-히스티딘 생산능이 약 10% 이상, 15% 이상, 20% 이상, 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 또는 80% 이상 증가된 것일 수 있으나 이에 제한되는 것은 아니다.
다른 예에서, 상기 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된 미생물은 변이 전 모균주, 비변형 미생물, 야생형 L-히스티딘 배출 단백질을 포함하는 미생물과 비교하여 L-히스티딘 생산능이 약 1 g/L 이상, 1.5 g/L 이상, 2 g/L 이상, 2.5 g/L 이상, 3 g/L 이상, 3.5 g/L 이상, 또는 4 g/L 이상 증가된 것일 수 있으나 이에 제한되는 것은 아니다.
상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.
다른 양상은, 상기 변이형 단백질, 상기 폴리뉴클레오타이드, 상기 재조합 벡터, 또는 상기 미생물을 포함하는 L-히스티딘 생산용 조성물을 제공한다.
다른 양상은, 상기 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산(제조) 방법을 제공한다. 상기 제조 방법은 상기 배양하는 단계 이후에, 배양된 미생물, 배지, 또는 이들 모두로부터 L-히스티딘을 회수하는 단계를 추가로 포함할 수 있다.
다른 양상은, 미생물의 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 강화시키는 단계를 포함하는, 상기 미생물의 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 증가시키는 방법, 또는 상기 미생물에 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 부여하는 방법을 제공한다.
상기 변이를 도입하는 단계는 변이형 단백질을 암호화하는 폴리뉴클레오타이드 또는 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터를 미생물에 도입(형질전환)시키는 단계를 포함하거나, 인공적으로 돌연변이를 발생시키는 단계 (예컨대, Error-prone PCR 등)를 포함할 수 있다.
다른 예는 상기 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산 방법을 제공한다. 상기 방법은 상기 배양하는 단계 이후에, 상기 배양된 미생물, 배지, 또는 이들 모두로부터 L-히스티딘을 회수하는 단계를 추가로 포함할 수 있다.
상기 방법에 있어서, 상기 미생물을 배양하는 단계는, 특별히 이에 제한되지 않으나, 공지된 회분식 배양방법, 연속식 배양방법, 유가식 배양방법 등에 의해 수행될 수 있다. 이때, 배양조건은, 특별히 이에 제한되지 않으나, 염기성 화합물 (예: 수산화나트륨, 수산화칼륨 또는 암모니아) 또는 산성 화합물 (예: 인산 또는 황산)을 사용하여 적정 pH (예컨대, pH 5 내지 9, 구체적으로는 pH 6 내지 8)를 조절할 수 있고, 산소 또는 산소-함유 가스 혼합물을 배양물에 도입시켜 호기성 조건을 유지할 수 있다. 배양온도는 20 내지 45℃, 또는 25 내지 40℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 제한되는 것은 아니다. 상기 배양에 의하여 생산된 L-히스티딘은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.
상기 배양에 사용 가능한 배지는 탄소 공급원으로 당 및 탄수화물 (예: 글루코오스, 슈크로오스, 락토오스, 프럭토오스, 말토오스, 몰라세, 전분 및 셀룰로오스), 유지 및 지방 (예: 대두유, 해바라기씨유, 땅콩유 및 코코넛유), 지방산 (예: 팔미트산, 스테아르산 및 리놀레산), 알코올 (예: 글리세롤 및 에탄올), 유기산 (예: 아세트산) 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 질소 공급원으로는 질소-함유 유기 화합물 (예: 펩톤, 효모 추출액, 육즙, 맥아 추출액, 옥수수 침지액, 대두 박분 및 우레아), 무기 화합물 (예: 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 및 질산암모늄) 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 인 공급원으로 인산이수소칼륨, 인산수소이칼륨, 이에 상응하는 나트륨 함유 염 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 또한, 상기 배지는 기타 금속염 (예: 황산마그네슘 또는 황산철), 아미노산, 및/또는 비타민 등과 같은 필수성장-촉진 물질을 포함할 수 있다.
상기 L-히스티딘을 회수하는 단계는 배양방법에 따라 당해 분야에 공지된 적합한 방법을 이용하여 배지, 배양액, 또는 미생물로부터 목적하는 아미노산을 수집하는 것일 수 있다. 예를 들어, 상기 회수하는 단계는 원심분리, 여과, 음이온 교환 크로마토그래피, 결정화, HPLC 등에서 선택된 하나 이상의 방법으로 수행될 수 있다. 상기 L-히스티딘을 회수하는 방법은, 그 이전, 동시, 또는 그 이후에, 정제단계를 추가적으로 포함할 수 있다.
본 출원은 L-히스티딘 배출능을 갖는 히스티딘 배출 단백질 또는 이의 변이체를 발굴하고, 이를 L-히스티딘의 생산능을 가지는 미생물에서 발현시킨 결과, L-히스티딘 생산량을 획기적으로 향상시킬 수 있다.
이하 본 발명을 다음의 실시예에 의하여 보다 구체적으로 설명하고자 한다. 그러나 이들은 본 발명을 예시하기 위한 것일 뿐이며, 본 발명의 범위가 이들 실시예에 의하여 제한되는 것은 아니다.
실시예 1. 외래 히스티딘 배출 유전자 탐색 및 후보 선별
L-히스티딘 특이 배출능을 갖는 단백질 후보를 선별하기 위하여 분류별 아미노산(염기 아미노산: L-라이신(L-lys), 방향족 아미노산: 트립토판(Trp), 곁가지 아미노산: 이소류신(Ile))에 대한 배출 단백질(LysE(Arch Microbiol 180: 155-160), Wex(대한민국 등록특허 제10-1968317호), BrnFE(Arch Microbiol 180: 155-160))의 아미노산 서열을 query 서열로 하고, NCBI와 Kegg database를 기반으로 PSI-BLAST 탐색 결과, L-히스티딘을 배출할 가능성이 있는 막단백질로 예측되는 후보 유전자들과 이를 보유하는 미생물을 선정하였다.
이 중 생산 균주에 적용 가능한 정도의 생물 안전도 (Biosafety level)와 확보 가능성을 고려하여, 아래 표 1 과 같이 LysE 기반 1종, Wex 기반 3종, BrnFE 기반 2종의 단백질, 이를 암호화하는 유전자, 및 이를 포함하는 미생물을 선정하였다:
No. | 균 주 | Protein Ref Seq. | gDNA Ref Seq. | 생물 안전도 | 아미노산 서열 | 핵산 서열 | |
Wex 기반 | 1 | Herbaspirillum aquaticum (KCTC42001) |
WP_088757482.1 | NZ_NJGV01000035.1 | 1 | 서열번호 1 | 서열번호 2 |
2 | Cupriavidus pinatubonensis (KCTC22125) |
WP_041680244.1 | CP000091.1 | 1 | 서열번호 3 | 서열번호 4 | |
3 | Kluyvera cryocrescens(KCTC2580) | WP_052283291.1 | NZ_LGHZ01000014.1 | 1 | 서열번호 5 | 서열번호 6 | |
LysE 기반 | 4 | Corynebacterium stationis (ATCC6872) |
WP_066837457.1 | CP014279.1 | 1 | 서열번호 7 | 서열번호 8 |
BrnFE 기반 | 5 | Leucobacter salsicius (KCTC19904) |
WP_026139602.1 | NZ_AOCN01000022.1 | 1 | 서열번호 9 | 서열번호 11 |
WP_083879221.1 | 서열번호 10 | ||||||
6 | Dermabacter vaginalis (KCTC39585) |
WP_065248528.1 (DvaF) | NZ_CP012117.1 | 1 | 서열번호 12 | 서열번호 14 | |
WP_065248527.1(DvaE) | 서열번호 13 | 서열번호 15 | |||||
DvaFE | 서열번호 12 및 13 | 서열번호 16 (DvaFE 오페론) |
(상기 표 1에서, 생물안전도는 미국의 Centers for Disease Control and Prevention에서 정의한 미생물 병원성 지표 (level 1~4)에 따른 것임 (level이 낮을수록 안전함)
실시예 2. 외래 L-히스티딘 배출 유전자 후보 도입 벡터 및 이를 도입한 재조합 코리네박테리움 속 균주 제작
상기 실시예 1에서 선정한 외래 L-히스티딘 배출 유전자 후보 6종을 코리네박테리움 속 균주에 도입하기 위한 벡터 6종을 제작하였다.
실시예 2-1. 타겟 유전자 삽입용 벡터 pDZΔN2131 제작
외래 L-히스티딘 배출 유전자 후보들을 도입하기 위하여, 코리네박테리움 글루타미쿰의 트렌스포존을 코딩하는 유전자 중 NCgl2131 유전자를 삽입 site로 사용하였다(Journal of Biotechnology 104, 5-25 Jorn Kalinowski et al, 2003). 또한 외래 L-히스티딘 배출 유전자 후보들이 코리네박테리움 유래 gapA 유전자의 프로모터(이하, PgapA, 서열번호 17) 하에서 발현되도록 설계하였다.
NCgl2131 유전자를 배출자 유전자들로 치환하기 위하여 NCgl2131 결손 및 타겟 유전자 삽입 벡터를 제작하였다. 벡터를 제작하기 위해, 코리네박테리움 글루타미쿰 균주 ATCC13032의 염색체를 주형으로 하여 서열번호 18 과 서열번호 19, 서열번호 20과 서열번호 21의 프라이머 쌍을 각각 이용하여 PCR을 각각 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 각각 531bp의 del-N2131L(서열번호 22)와 555bp의 del-N2131R(서열번호 23)의 DNA 단편을 수득하였다. 수득한 DNA 산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 pDZ 벡터(대한민국 등록특허 제10-0924065호)와 다카라(TaKaRa)의 Infusion Cloning Kit를 사용하여 클로닝하여, NCgl2131유전자결손 및 타겟 유전자 삽입용 벡터 pDZΔN2131을 제작하였다.
실시예 2-2. 외래 L-히스티딘 배출 유전자 후보 도입 벡터 6종 제작
Herbaspirillum aquaticum 유래 단백질(이하, Haq, 서열번호 1)를 코딩하는 유전자(이하, haq, 서열번호 2)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. haq를 증폭시키기 위하여 Herbaspirillum aquaticum 균주(KCTC42001)의 염색체 DNA를 주형으로 하여 서열번호 24와 서열번호 25의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 945bp의 haq (서열번호 2)를 포함한 977bp의 haq 단편을 수득하였다. haq와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 26과 서열번호 27의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 haq 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 (DG Gibson et al., NATURE METHODS, VOL.6 NO.5, MAY 2009, NEBuilder HiFi DNA Assembly Master Mix) 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Haq로 명명하였다.
Cupriavidus pinatubonensis 유래 단백질(이하, Cpi, 서열번호 3)를 코딩하는 유전자(이하, cpi, 서열번호 4)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Cupriavidus pinatubonensis 유래 cpi를 증폭시키기 위하여, Cupriavidus pinatubonensis 균주(KCTC22125)의 염색체 DNA를 주형으로 하여 서열번호 28와 서열번호 29의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 945bp의 cpi(서열번호 4)를 포함한 977bp의 cpi 단편을 수득하였다. cpi와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 26과 서열번호 30의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 cpi 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Cpi로 명명하였다.
Kluyvera cryocrescens 유래 단백질(이하, Kcr, 서열번호 5)를 코딩하는 유전자(이하, kcr, 서열번호 6)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Kluyvera cryocrescens 유래 kcr를 증폭시키기 위하여, Kluyvera cryocrescens 균주(KCTC2580)의 염색체 DNA를 주형으로 하여 서열번호 31와 서열번호 32의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 882bp의 kcr(서열번호 6)를 포함한 914bp의 kcr단편을 수득하였다. kcr와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 33의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 kcr 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Kcr로 명명하였다.
Corynebacterium stationis 유래 단백질(이하, Cst, 서열번호 7)를 코딩하는 유전자(이하, cst, 서열번호 8)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Corynebacterium stationis 유래 cst를 증폭시키기 위하여, Corynebacterium stationis 균주(ATCC6872)의 염색체 DNA를 주형으로 하여 서열번호 34와 서열번호 35의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 717bp의 cst (서열번호 8)를 포함한 749bp의 cst 단편을 수득하였다. cst 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 36의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다. 그 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 cst 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Cst로 명명하였다.
Leucobacter salsicius 유래 단백질(이하, LsaFE, 서열번호 9, 10)를 코딩하는 오페론(이하, lsa, 서열번호 11)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Leucobacter salsicius 유래 lsa 를 증폭시키기 위하여 Leucobacter salsicius 균주(KCTC19904)의 염색체 DNA를 주형으로 하여 서열번호 37와 서열번호 38의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 1048bp의 lsa (서열번호 11)를 포함한 1080bp의 lsa 단편을 수득하였다. lsa 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 39의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 lsa 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Lsa로 명명하였다.
Dermabacter vaginalis 유래 단백질(이하, DvaFE, 서열번호 12, 13)를 코딩하는 오페론(이하, dva, 서열번호 16)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Dermabacter vaginalis 유래 dva 를 증폭시키기 위하여, Dermabacter vaginalis 균주(KCTC39585)의 염색체 DNA를 주형으로 하여 서열번호 40와 서열번호 41의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 1081bp의 dva (서열번호 16)를 포함한 1113bp의 dva 단편을 수득하였다. dva 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 42의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 dva 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Dva로 명명하였다.
실시예 2-3. 재조합 코리네박테리움 속 균주 제작
상기 외래 L-히스티딘 배출 유전자 후보들의 L-히스티딘 배출능을 확인하기 위하여, 상기 제작된 NCgl2131 결손 벡터(pDZΔN2131), 외래 L-히스티딘 배출 유전자 후보 도입 벡터 6종(pDZΔN2131-PgapA-Haq, pDZΔN2131-PgapA-Cpi, pDZΔN2131-PgapA-Kcr, pDZΔN2131-PgapA-Cst, pDZΔN2131-PgapA-Lsa, pDZΔN2131-PgapA-Dva)을 각각 코리네박테리움 글루타미쿰 ATCC13032 균주에 도입하였다. 보다 구체적으로, 상기 벡터들을 각각 ATCC13032 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손 되거나 L-히스티딘 배출유전자 후보로 치환되어 있는 7종의 재조합 균주를 제작하였으며, 이들을 각각 ATCC13032ΔN2131 (N2131 유전자 결손), ATCC13032ΔN2131::Haq (N2131 유전자가 haq로 치환), ATCC13032ΔN2131::Cpi (N2131 유전자가 cpi로 치환), ATCC13032ΔN2131::Kcr (N2131 유전자가 kcr로 치환), ATCC13032ΔN2131::Cst (N2131 유전자가 cst로 치환), ATCC13032ΔN2131::Lsa (N2131 유전자가 lsa로 치환), 및 ATCC13032ΔN2131::Dva (N2131 유전자가 dva로 치환)로 명명하였다.
실시예 3. 외래 L-히스티딘 배출 유전자 후보 도입 코리네박테리움 속 균주들의 MIC 측정
상기 실시예 2에서 제작된 7종의 재조합 코리네박테리움 글루타미쿰 균주 (ATCC13032ΔN2131, ATCC13032ΔN2131::Haq, ATCC13032ΔN2131::Cpi, ATCC13032ΔN2131::Kcr, ATCC13032ΔN2131::Cst, ATCC13032ΔN2131::Lsa, 및 ATCC13032ΔN2131::Dva)들의 L-히스티딘 배출능 활성의 보유여부 확인을 위하여, L-히스티딘을 이용한 최소저지농도 (minimum inhibitory concentration, MIC) 실험을 수행하였다. 7종의 균주들을 최소 액체 배지에 30℃에서 24시간 동안 배양한 후, 1 X 103과 1 X 104 개의 세포로 희석하여 L-히스티딘이 첨가된 최소 고체 배지에서 스포팅 (spotting) 배양하였다. 상기 사용된 최소 고체 배지 조성은 다음과 같다:
최소 배지 (pH 7.2)
포도당 10 g, KH2PO4 1 g, K2HPO4 2 g, MgSO4 7H2O 0.4 g, 요소 2 g, (NH4)2SO4 5 g, NaCl 0.5 g, 니코틴아미드 5 ㎍, 칼슘-판토텐산 0.1 ㎍, 비오틴 0.2 ㎍, 티아민 HCl 3 ㎍, Trace elements solution* 1ml (증류수 1 리터 기준), Agar 20 g
*Trace elements solution
Na2B4O7 10H2O 0.09 g, (NH4)6Mo7O27 4H2O 0.04 g, ZnSO4 7H2O 0.01 g, CuSO4 5H2O 0.27 g, MnCl2 4H2O 0.01 g, FeCl3 6H2O 1 g, CaCl2 0.01 g (증류수 1 리터 기준)
최소저지농도 실험을 위해, 1 g/L의 L-히스티딘을 최소 고체 배지에 첨가하였고, 48시간 후 세포의 성장을 관찰하여, 그 결과를 하기의 표 2에 나타내었다:
균주 | L-히스티딘 미포함 최소배지 | L-히스티딘 1 g/L 포함 최소배지 |
ATCC13032ΔN2131 | ++++ | + |
ATCC13032ΔN2131::Haq | ++++ | + |
ATCC13032ΔN2131::Cpi | ++++ | + |
ATCC13032ΔN2131::Kcr | ++++ | + |
ATCC13032ΔN2131::Cst | ++++ | + |
ATCC13032ΔN2131::Lsa | ++++ | + |
ATCC13032ΔN2131::Dva | ++ | +++ |
(표 2에서, + 개수는 균주들의 상대적 성장 정도를 나타내는 것으로, 각각 다음을 나타냄:+ : single colony는 형성되지 못하나 heavy(single colony로 성장되지 못하고 뭉쳐서 자라는 형태)는 형성됨;
++ : heavy 형성되고 single colony 5개 미만 형성됨;
+++ : heavy 형성되고 single colony 50개 미만 형성됨;
++++ : heavy가 single colony 구분되지 않게 형성됨)
상기 표 2에 나타난 바와 같이, ATCC13032ΔN2131::Dva 균주를 제외한 모든 균주가 L-히스티딘 미포함 최소배지에서 원활히 성장하였다. 그러나 L-히스티딘이 1g/L 포함된 최소배지에서는 대부분의 L-히스티딘 배출 후보 유전자들이 도입된 균주들의 성장이 미미했으며, Dermabacter vaginalis 유래 유전자가 도입된 ATCC13032ΔN2131::Dva 균주만 ATCC13032ΔN2131 대비 월등한 성장을 보였다. 이는, 도입된 Dermabacter vaginalis 유래 단백질이 최소저지농도 이상의 L-히스티딘 포함 배지에서도 L-히스티딘 배출능을 가질 수 있음을 보여준다.
이로부터 Dermabacter vaginalis 유래 단백질 Dva를 코리네박테리움 균주에 최소저지농도 이상의 L-히스티딘에 대한 내성을 부여하며 L-히스티딘 특이 배출능을 갖는 단백질로 선택하였다.
실시예 4. 코리네박테리움 유래 L-히스티딘 생산 균주(KCCM 80179) 기반
Dermabacter vaginalis
유래 유전자(
dva)
도입 균주 제작 및 L-히스티딘 생산능 평가
Dermabacter vaginalis 유래 단백질 Dva의 L-히스티딘 배출능을 확인하기 위하여, Dermabacter vaginalis 유래 유전자 dva를 L-히스티딘 생산균주 KCCM 80179(대한민국 공개특허 제10-2019-0065984호) 균주에 도입하였다.
이를 위하여, 실시예 2에서 제작된 벡터 pDZΔN2131, 및 pDZΔN2131-PgapA-Dva를 각각 KCCM80179 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손 되거나 L-히스티딘 배출 유전자 후보 (dva)로 치환되어 있는 균주 2종을 제작하였으며, 이를 각각 KCCM 80179ΔN2131 (NCgl2131 유전자가 결손) 및 KCCM 80179ΔN2131-PgapA-Dva (NCgl2131 유전자가 dva로 치환)으로 명명하였다.
상기 제작된 KCCM 80179ΔN2131 및 KCCM 80179ΔN2131-PgapA-Dva 균주의 L-히스티딘 생산능을 확인하기 위하여, 다음과 같은 방법으로 배양하였다: KCCM 80179ΔN2131 및 KCCM 80179ΔN2131-PgapA-Dva 균주를 활성화 배지에서 16시간 동안 배양한 후, 종 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 각 균주들을 접종하고, 30 ℃에서 20 시간 동안, 200 rpm으로 진탕 배양하였다. 그런 다음, 생산 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 1 ㎖의 종 배양액을 접종하고 30 ℃에서 48시간 동안, 200 rpm에서 진탕 배양하였다. 상기 배양에 사용된 배지 조성은 다음과 같다:
<활성화 배지>
육즙 1%(w/v), 폴리펩톤 1%(w/v), 소듐클로라이드 0.5%(w/v), 효모엑기스 1%(w/v), 한천 2%(w/v), pH 7.2
<종 배지>
포도당 5%(w/v), 박토펩톤 1%(w/v), 소듐클로라이드 0.25%(w/v), 효모엑기스 1%(w/v), 요소 0.4%(w/v), pH 7.2
<생산 배지>
포도당 10%(w/v), 황산암모늄 2%(w/v), 제1인산칼륨 0.1%(w/v), 황산마그네슘7수염 0.05%(w/v), CSL(옥수수 침지액) 2.0%(w/v), 비오틴 200 ㎍/L, 탄산칼슘, pH 7.2,
배양 종료 후, HPLC에 의해 L-히스티딘 생산량 (배지 내 히스티딘 함량)을 측정하여, 그 결과를 다음의 표 3에 나타내었다:
Cell OD 600 |
사용한
포도당 (g/L) |
히스티딘
생산량 (g/L) |
|
KCCM 80179 | 51.4 | 100 | 14.1 |
KCCM 80179ΔN2131 | 51.6 | 100 | 13.9 |
KCCM 80179ΔN2131-PgapA-Dva | 42.6 | 100 | 17.1 |
상기 표 3에 나타난 바와 같이, NCgl2131 결손 균주는 모균주인 KCCM 80179 균주와 동등 정도의 L-히스티딘 생산능을 가지는 반면, Dermabacter vaginalis 유래 유전자가 도입된 KCCM 80179ΔN2131-PgapA-Dva 균주는 NCgl2131 결손 균주 및 모균주인 KCCM 80179 균주 대비 L-히스티딘 생산능이 각각 23% 및 21% 이상 증가됨을 확인하였다.
상기 실시예 3 및 4의 결과를 통해, Dermabacter vaginalis 유래 유전자 도입을 통해 최소저해농도 이상의 L-히스티딘 농도에 대한 내성이 증가될 뿐만 아니라, L-히스티딘 생산능도 크게 증가됨을 확인하였다. 이러한 결과는 Dermabacter vaginalis 유래 단백질이 L-히스티딘을 특이적으로 배출할 수 있는 L-히스티딘 배출 단백질임을 입증한다.
실시예 5.
Dermabacter vaginalis
유래 L-히스티딘 배출자 유사 단백질 추가 확보
상기 실시예 3과 4에서 Dermabacter vaginalis 유래 단백질의 L-히스티딘 배출능을 확인하였으므로, 상기 단백질과 아미노산 서열 상동성이 높은 유사 단백질을 추가로 확보하기 위하여, DvaFE 중 DvaF의 서열(서열번호 12)을 query로 이용하여 BLAST 탐색을 수행하였다 (표 4 참조).
상기 BLAST 탐색 결과를 바탕으로 60% 이상의 서열 상동성을 나타내고 Dermabacter 속에 속하지 않는 L-히스티딘 배출자 후보 1종을 추가로 선정하여, 다음의 표 5에 나타내었다:
No. | 균 주 | Protein Ref Seq. | gDNA Ref Seq. | 생물 안전도 | 단백질 서열 | 유전자 서열 |
7 | Helcobacillus massiliensis | WP_055090792.1 (HmaF) |
NZ_CYUG01000017.1 | 2 | 서열번호 43 | 서열번호 45 |
WP_055090293.1 (HmaE) |
서열번호 44 | 서열번호 46 | ||||
HmaFE | 서열번호 43 및 44 | 서열번호 47(HmaFE 오페론) |
실시예 6. 추가 외래 L-히스티딘 배출 유전자 후보 도입 벡터 제작
상기 실시예 5에서 추가 선정된 L-히스티딘 배출 유전자 후보 2종을 코리네박테리움 속 균주에 도입하기 위한 벡터를 제작하였다. 실시예 2와 동일하게 NCgl2131 유전자를 결손 site로, PgapA를 프로모터로 사용하였다.
Helcobacillus massiliensis 유래 단백질(이하, HmaFE, 서열번호 43, 44)을 코딩하는 오페론(이하, hma, 서열번호 47)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. haq DNA를 수득하기 위하여 Bionics 사(社)의 진합성 서비스를 이용하여 DNA를 합성하였다. 합성된 DNA를 증폭하기 위하여 서열번호 48와 서열번호 49의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1081bp의 hma (서열번호 47)를 포함한 1113bp의 hma 단편을 수득하였다. hma 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 50의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 hma 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Hma로 명명하였다.
실시예 7. L-히스티딘 생산 균주(KCCM 80179) 기반
Helcobacillus massiliensis
유래 유전자 도입(
hma
) 균주 제작 및 L-히스티딘 생산능 평가
Helcobacillus massiliensis 유래 단백질 Hma의 L-히스티딘 배출능을 확인하기 위하여 L-히스티딘 생산균주 KCCM 80179 균주에 도입하였다.
이를 위해 실시예 6에서 제작된 벡터 pDZΔN2131-PgapA-Hma를 KCCM80179 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 L-히스티딘 배출유전자 후보로 치환되어 있는 균주를 제작하였으며, 이를 KCCM 80179ΔN2131-PgapA-Hma (NCgl2131 유전자가 hma로 치환)으로 명명하였다.
상기 제작된 KCCM 80179ΔN2131-PgapA-Hma 균주의 L-히스티딘 생산능을 확인하기 위하여, 상기 균주를 실시예 4에서 수행한 방법으로 배양하고 L-히스티딘 생산량을 측정하였다. 대조군으로 실시예 4에서 제작된 KCCM 80179ΔN2131 균주와 KCCM 80179ΔN2131-PgapA-Dva 균주에 대하여 동일한 방법으로 배양 및 L-히스티딘 생산량(배지 내 히스티딘 함량) 측정을 수행하였다. 상기 얻어진 결과를 표 6에 나타내었다.
OD |
사용한
포도당 (g/L) |
히스티딘
생산량 (g/L) |
|
KCCM 80179 | 50.3 | 100 | 14.0 |
KCCM 80179ΔN2131 | 51.5 | 100 | 13.9 |
KCCM 80179ΔN2131-PgapA-Dva | 40.8 | 100 | 17.3 |
KCCM 80179ΔN2131-PgapA-Hma | 43.1 | 100 | 16.6 |
표 6에 나타난 바와 같이, KCCM 80179ΔN2131-PgapA-Hma 균주는 NCgl2131 결손 균주(KCCM 80179ΔN2131) 및 모균주인 KCCM 80179 균주 대비 L-히스티딘 생산량이 각각 19%, 19% 증가하였다. 이러한 결과는 Helcobacillus massiliensis 유래 단백질도 L-히스티딘을 특이적으로 배출할 수 있는 L-히스티딘 배출자로 선별될 수 있음을 보여준다.
실시예 8: 인공돌연변이법을 이용한 Hma 변이 라이브러리 제작
L-히스티딘 배출능이 증가된 변이형 Hma를 획득하기 위하여 1차 crossover용 변이 단백질 발현 벡터 라이브러리를 제작하였다. 이를 위하여 상기 제작된 pDZ ΔN2131-PgapA-Hma를 주형으로 하여 서열번호 48와 서열번호 49의 프라이머 쌍을 이용한 Error-prone PCR법으로 염기치환변이가 무작위적으로 도입된 hma 오페론들을 획득하였다. Error-prone PCR은 GenemorphII Random Mutagenesis Kit(Stratagene)을 사용하여 증폭된 유전자 단편 내에 변이가 1kb당 0 내지 3.5개가 도입되는 조건으로 PCR 수행하였으며, PCR 조건은 변성 96℃, 30초; 어닐링 53℃, 30초; 및 중합반응 72℃, 2분을 30회 반복하였다. hma와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 26과 서열번호 50의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하여 PgapA 단편을 수득하였다. 상기 수득된 돌연변이 hma 오페론들과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 (DG Gibson et al., NATURE METHODS, VOL.6 NO.5, MAY 2009, NEBuilder HiFi DNA Assembly Master Mix) 방법을 이용하여 클로닝하였고, DH5α에 형질전환하여 카나마이신(25mg/L)이 포함된 LB 고체배지에 도말하였다. 형질전환된 콜로니 20종을 선별한 후 플라스미드를 획득하여 염기서열을 분석한 결과 평균 2 mutations/kb 빈도로 서로 다른 위치에 변이가 도입된 것을 확인하였다. 약 10,000개의 형질전환된 대장균 콜로니를 취하여 플라스미드를 추출하였고, 이를 pDZΔN2131-PgapA-Hma(mt) 라이브러리로 명명하였다.
실시예 9: Hma 인공돌연변이 라이브러리 도입 및 L-히스티딘 생산능 증가 균주 선별
상기 제작된 ATCC13032ΔN2131 균주를 모균주로 하여 상기 제작된 pDZΔN2131-PgapA-Hma(mt) 라이브러리를 상동염색체 재조합에 의해 형질전환하고 카나마이신(25mg/L)이 포함된 복합평판배지에 도말하여 약 7000개의 콜로니를 확보하였으며, 각 콜로니를 ATCC13032ΔN2131-PgapA-Hma(mt)-1 부터 ATCC13032ΔN2131-PgapA-Hma(mt)-7000까지로 명명하였다.
<복합평판배지 (pH 7.0)>
포도당 10g, Peptone 10g, Beef extract 5g, Yeast extract 5g, Brain Heart Infusion 18.5g, NaCl 2.5g, Urea 2g, Sorbitiol 91g, Agar 20g(증류수 1 리터 기준)
확보된 7000개의 콜로니를 상기 실시예 3에서 수행한 L-히스티딘에 대한 최소저지농도 (minimum inhibitory concentration, MIC) 실험을 수행하였다. 효율적인 스크리닝을 위하여 3g의 L-히스티딘을 포함하는 액체 최소배지를 기반으로 수행하였다. colony를 바로 액체 최소배지 300ul에 접종하여 96-딥 웰 플레이트에서 32˚C, 1000rpm으로 약 18시간 동안 배양한 후 OD600 값을 측정하여 성장이 우수한 colony를 선별하였다. 대조군으로는 상기 제작된 ATCC13032ΔN2131 균주와 ATCC13032ΔN2131::Hma 균주를 사용하였으며 1차 실험을 통하여 251개를 선별하고, 재반복 실험을 통해서 36개의 colony를 선별하였으며, 사용된 배지 성분은 하기와 같다.
액체 최소 배지 (pH 7.2)
포도당 10g, KH2PO4 1 g, K2HPO4 2 g, MgSO4 7H2O 0.4 g, 요소 2 g, (NH4)2SO4 5 g, NaCl 0.5 g, 니코틴아미드 5 ㎍, 칼슘-판토텐산 0.1 ㎍, 비오틴 0.2 ㎍, 티아민 HCl 3 ㎍, Trace elements solution* 1ml (증류수 1 리터 기준)
*Trace elements solution
Na2B4O7 10H2O 0.09 g, (NH4)6Mo7O27 4H2O 0.04 g, ZnSO4 7H2O 0.01 g, CuSO4 5H2O 0.27 g, MnCl2 4H2O 0.01 g, FeCl3 6H2O 1 g, CaCl2 0.01 g (증류수 1 리터 기준)
최소저지농도 실험을 위해, 3 g/L의 L-히스티딘을 배지에 첨가하여 18hr 배양함
상기 선별된 36개의 colony를 실시예 3에서 수행한 방법으로 고체 배지 기반 스크리닝을 수행하여 L-히스티딘 배출능이 증가된 6종의 colony를 최종 스크리닝 하였으며, 그 결과를 하기의 표 7에 나타내었다:
균주 | L-히스티딘 미포함 최소배지 | L-히스티딘 1 g/L 포함 최소배지 |
ATCC13032ΔN2131 | ++++ | + |
ATCC13032ΔN2131::Hma | ++++ | +++ |
ATCC13032ΔN2131-PgapA-Hma(mt)-1216 | ++++ | ++++ |
ATCC13032ΔN2131-PgapA-Hma(mt)-2305 | ++++ | ++++ |
ATCC13032ΔN2131-PgapA-Hma(mt)-3411 | ++++ | ++++ |
ATCC13032ΔN2131-PgapA-Hma(mt)-4426 | ++++ | ++++ |
ATCC13032ΔN2131-PgapA-Hma(mt)-5714 | ++++ | ++++ |
ATCC13032ΔN2131-PgapA-Hma(mt)-6718 | ++++ | ++++ |
(표 7에서, + 개수는 균주들의 상대적 성장 정도를 나타내는 것으로, 각각 다음을 나타냄:+ : single colony는 형성되지 못하나 heavy(single colony로 성장되지 못하고 뭉쳐서 자라는 형태)는 형성됨;
++ : heavy 형성되고 single colony 5개 미만 형성됨;
+++ : heavy 형성되고 single colony 50개 미만 형성됨;
++++ : heavy가 single colony 구분되지 않게 형성됨)
상기 표 7에 나타난 바와 같이, NCgl2131 결손 균주(ATCC13032ΔN2131)는 L-히스티딘 1 g/L 포함 최소배지에서 원활하게 성장하지 못하였으나, Helcobacillus massiliensis 유래 유전자가 도입된 ATCC13032ΔN2131::Hma 균주는 원활하게 성장하였고 고체 배지 기반 스크리닝을 수행하여 L-히스티딘 배출능이 증가된 6종의 균주(ATCC13032ΔN2131-PgapA-Hma(mt)-1216, ATCC13032ΔN2131-PgapA-Hma(mt)-2305, ATCC13032ΔN2131-PgapA-Hma(mt)-3411, ATCC13032ΔN2131-PgapA-Hma(mt)-4426, ATCC13032ΔN2131-PgapA-Hma(mt)-5714, 및 ATCC13032ΔN2131-PgapA-Hma(mt)-6718 균주)는 히스티딘 1 g/L 포함 최소배지에서 보다 높은 성장 정도를 확인하였다.
실시예 10. 코리네박테리움 유래 L-히스티딘 생산 균주(KCCM 80179) 기반 선별 라이브러리 도입균주 제작 및 L-히스티딘 생산능 평가
실시예 9에서 선별된 colony 6종이 포함하고 있는 변이형 hma를 L-히스티딘 생산균주에 도입하기 위한 벡터를 제작하였다. 이를 위하여 ATCC13032ΔN2131-PgapA-Hma(mt)-1216, ATCC13032ΔN2131-PgapA-Hma(mt)-2305, ATCC13032ΔN2131-PgapA-Hma(mt)-3411, ATCC13032ΔN2131-PgapA-Hma(mt)-4426, ATCC13032ΔN2131-PgapA-Hma(mt)-5714, ATCC13032ΔN2131-PgapA-Hma(mt)-6718의 염색체 DNA를 주형으로 하여 서열번호 48와 서열번호 49의 프라이머 쌍을 이용한 PCR을 수행하여 변이형 hma종을 획득하였다. PCR 조건은 변성 96℃, 30초; 어닐링 53℃, 30초; 및 중합반응 72℃, 2분을 30회 반복하였다. 변이형 hma과 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 26과 서열번호 50의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하여 PgapA 단편을 수득하였다. 상기 수득된 돌연변이 hma 6종 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여 재조합 플라스미드를 획득하였으며, 이를 유래 라이브러리 colony에 따라 pDZΔN2131-PgapA-Hma(mt)-1216, pDZΔN2131-PgapA-Hma(mt)-2315, pDZΔN2131- PgapA-Hma(mt)-3411, pDZΔN2131-PgapA-Hma(mt)-4426, pDZΔN2131-PgapA-Hma(mt)-5714, pDZΔN2131-PgapA-Hma(mt)-6718으로 명명하였다.
이후 제작된 벡터를 KCCM 80179 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 변이 hma 6종이 각각 도입된 균주 6종을 제작하였으며, 이를 각각 KCCM80179ΔN2131-PgapA-Hma(mt)-1216, KCCM80179ΔN2131-PgapA-Hma(mt)-2315, KCCM80179ΔN2131-PgapA-Hma(mt)-3411, KCCM80179ΔN2131-PgapA-Hma(mt)-4426, KCCM80179ΔN2131-PgapA-Hma(mt)-5714, KCCM80179ΔN2131-PgapA-Hma(mt)-6718으로 명명하였다.
상기 제작된 균주 6 종의 L-히스티딘 생산능을 확인하기 위하여, 상기 실시예 7에서 제작된 KCCM 80179ΔN2131-PgapA-Hma 균주를 대조군으로 사용하여 실시예 4와 같은 방법으로 측정하였으며, 그 결과를 표 8에 나타내었다:
Cell OD 600 |
사용한
포도당 (g/L) |
히스티딘
생산량 (g/L) |
|
KCCM 80179 | 51.0 | 100 | 13.9 |
KCCM 80179ΔN2131 | 51.1 | 100 | 14.0 |
KCCM 80179ΔN2131-PgapA-Hma | 43.5 | 100 | 16.5 |
KCCM 80179ΔN2131-PgapA-Hma(mt)-1216 | 50.1 | 100 | 15.1 |
KCCM 80179ΔN2131-PgapA-Hma(mt)-2315 | 45.8 | 100 | 16.2 |
KCCM80179ΔN2131-PgapA-Hma(mt)-3411 | 40.1 | 100 | 16.4 |
KCCM80179ΔN2131-PgapA-Hma(mt)-4426 | 44.0 | 100 | 16.2 |
KCCM80179ΔN2131-PgapA-Hma(mt)-5714 | 41.5 | 100 | 17.1 |
KCCM80179ΔN2131-PgapA-Hma(mt)-6718 | 40.7 | 100 | 18.5 |
상기 표 8에 나타난 바와 같이, NCgl2131 결손 균주(KCCM 80179ΔN2131)는 모균주인 KCCM 80179 균주와 동등 정도의 L-히스티딘 생산능을 가지는 반면, Helcobacillus massiliensis 유래 유전자가 도입된 ATCC13032ΔN2131::Hma 균주는 NCgl2131 결손 균주 및 모균주인 KCCM 80179 균주 대비 L-히스티딘 생산능이 증가하였다.
변이 hma 6종이 각각 도입된 6종의 균주는 NCgl2131 결손 균주 및 모균주인 KCCM 80179 균주 대비 KCCM 80179ΔN2131-PgapA-Hma 균주와 동등하거나 그 이상의 수준으로 L-히스티딘 생산능이 증가하였으며, 특히 KCCM80179ΔN2131-PgapA-Hma(mt)-5714 및 KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주는 L-히스티딘 생산능이 야생형 hma가 도입된 KCCM 80179ΔN2131-PgapA-Hma 대비 각각 3.6%, 12.1% 증가함을 확인하였다.
실시예 11. L-히스티딘 생산능 증가 변이형 Hma 유전자 변이 확인
상기 실시예 10에서 L-히스티딘 생산능 증가 효과가 확인된 KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주의 Hma에 도입된 변이를 확인하기 위하여 Hma 변이체의 염기서열을 분석하였다. 염기서열을 결정하기 위해 KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주의 gDNA를 주형으로 서열번호 18 및 서열번호 21의 프라이머 쌍을 사용하여 PCR을 수행하였다. 염기서열 분석을 통하여 변이형 hma 오페론의 염기서열 및 HmaF 또는 HmaE의 단백질 서열을 확인하고 서열번호 43 또는 서열번호 44의 아미노산 서열과 비교하였으며, 이를 통해 확인된 변이형 HmaFE의 아미노산 서열의 변이 정보를 표 9에 나타내었다.
균주 |
HmaF
(서열번호 43) |
HmaE
(서열번호 44) |
KCCM80179ΔN2131-PgapA-Hma(mt)-6718 | I72L, I124V | 변이 X |
시퀀스 확인 결과, KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주에 도입된 변이형 HmaFE는 HmaF에 I72L(서열번호 43의 72번째 이소류신(Ile, I)이 류신(Leu, L)으로 변이), I124V(서열번호 43의 124번째 이소류신(Ile, I)이 발린(Val, V)으로 변이) 변이가 도입되어 L-히스티딘 배출능이 증가된 변이형 배출자임을 확인하였다.
상기 결과를 통해, Helcobacillus massiliensis 유래 변이형 배출자 도입을 통해 야생형 대비 최소저해농도 이상의 L-히스티딘 농도에 대한 내성이 증가될 뿐만 아니라, L-히스티딘 생산능도 크게 증가됨을 확인하였다. 이러한 결과는 선별된 Helcobacillus massiliensis 유래 변이 단백질이 L-히스티딘을 특이적으로 배출할 수 있는 변이형 L-히스티딘 배출 단백질임을 입증한다.
실시예 12. L-히스티딘 생산 균주(CA14-737) 기반
Helcobacillus massiliensis
유래 변이 유전자 도입 균주 제작 및 L-히스티딘 생산능 평가
상기 Helcobacillus massiliensis 유래 단백질 Hma 변이체의 L-히스티딘 배출능을 다시 한번 확인하기 위하여, 야생형의 코리네박테리움 글루타미쿰 ATCC13032 유래로 L-히스티딘에 의한 피드백 제한 해소 HisG 폴리펩티드 변이 도입, L-히스티딘 생합성 유전자가 강화된 L-히스티딘 생산균주 CA14-737(KCCM 12411P, 대한민국 공개특허 제10-2019-0065984호) 균주에 도입하였다.
이를 위해 실시예 2와 10에서 제작된 벡터 3종(pDZΔN2131, pDZΔN2131-PgapA-Hma, pDZΔN2131-PgapA-Hma(mt)-6718)을 각각 CA14-737 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손되거나 L-히스티딘 배출유전자로 치환되어 있는 균주 3종을 제작하였으며, 이를 각각 CA14-737ΔN2131, CA14-737ΔN2131-PgapA-Hma, CA14-737ΔN2131-PgapA-Hma(mt)-6718으로 명명하였다.
상기 제작된 CA14-737ΔN2131, CA14-737ΔN2131-PgapA-Hma, CA14-737ΔN2131-PgapA-Hma(mt)-6718 균주의 L-히스티딘 생산능을 확인하기 위하여, 실시예 4에서 수행한 방법으로 배양하고 L-히스티딘 생산량(배지 내 히스티딘 함량)을 측정하여, 그 결과를 다음의 표 10에 나타내었다:
OD |
사용한
포도당 (g/L) |
히스티딘
생산량 (g/L) |
|
CA14-737 | 90.3 | 100 | 4.1 |
CA14-737ΔN2131 | 90.5 | 100 | 4.0 |
CA14-737ΔN2131-PgapA-Hma | 71.1 | 100 | 6.3 |
CA14-737ΔN2131-PgapA-Hma(mt)-6718 | 61.5 | 100 | 7.3 |
표 10에 나타난 바와 같이, Helcobacillus massiliensis 유래 유전자가 도입된 CA14-737ΔN2131-PgapA-Hma 균주는 NCgl2131 결손 균주(CA14-737ΔN2131) 및 모균주인 CA14-737 균주 대비 L-히스티딘 생산량이 54% 증가하였고, 변이형 hma가 도입된 CA14-737ΔN2131-PgapA-Hma(mt)-6718 균주는 78% 증가하였다.
이를 통해 Helcobacillus massiliensis 유래 야생형 및 변이형 단백질 모두 L-히스티딘을 특이적으로 배출할 수 있으며, 선별된 변이형 단백질의 경우 야생형 단백질보다 더 높은 배출능을 갖는 L-히스티딘 배출자임을 다시 한번 확인하였다.
실시예 13.
Helcobacillus massiliensis
유래 야생형 유전자 및 변이체 대장균 발현용 벡터 제작
상기 Helcobacillus massiliensis 유래 단백질 Hma 및 변이체의 L-히스티딘 배출능을 다양한 균주에 확인하기 위하여 대장균에서 야생형 Hma 및 Hma 변이체를 각각 발현시킬 수 있는 벡터를 제작하였다. 각각의 유전자는 대장균 발현 벡터인 pCC1BAC(이하, pBAC, Epicenter corp.)에 클로닝 되었으며, 외래 L-히스티딘 배출 유전자 후보들이 대장균 균주 MG1655 유래 yccA 유전자의 프로모터(이하. PyccA, 서열번호 51) 하에서 발현되도록 설계하였다.
Helcobacillus massiliensis 유래 단백질 Hma 및 변이형 유전자 단편을 확보하기 위하여 ATCC13032ΔN2131-PgapA-Hma 및 ATCC13032Δ N2131-PgapA-Hma(mt)-6718의 염색체 DNA를 주형으로 하여 서열번호 52와 서열번호 53의 프라이머 쌍을 이용한 각각 PCR을 수행하여 야생형 및 변이형 hma DNA 단편을 획득하였다. PCR 조건은 변성 96℃, 30초; 어닐링 53℃, 30초; 및 중합반응 72℃, 2분을 30회 반복하였다. PyccA 단편을 수득하기 위하여, MG1655의 염색체를 주형으로 하여 서열번호 54과 서열번호 55의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하여 PyccA 단편을 수득하였다. 상기 수득된 야생형 및 돌연변이 hma 단편과 PyccA 단편, 그리고 EcoRI 제한효소로 절단된 pBAC 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여 재조합 플라스미드를 획득하였으며, 이를 pBAC-PyccA-Hma, pBAC-PyccA-Hma(mt)-6718으로 명명하였다.
실시예 14. 대장균 유래 L-히스티딘 생산 균주 기반
Helcobacillus massiliensis
유래 Hma 야생형 유전자 및 변이체 도입 균주 제작 및 L-히스티딘 생산능 평가
대장균 유래 L-히스티딘 생산 균주를 기반으로 Helcobacillus massiliensis 유래 단백질 Hma 변이체의 L-히스티딘 배출능을 확인하기 위하여, 실시예 13에서 제작된 벡터 2종과 pBAC 벡터를 기 보고된 유전자형(purR 결손, hisL 결손, hisGr; The directed modification of Escherichia coli MG1655 to obtain histidine-producing mutants; Applied Biochemistry and Microbiology, 2013, Vol. 49, No. 2, pp. 130-135)을 갖는 CA14-9003e 균주 (MG1655+ hisGr hisL'_Δ ΔpurR)에 도입한 균주 3종을 제작하였으며, 이를 각각 CA14-9003e/pBAC, CA14-9003e/pBAC-PyccA-Hma, CA14-9003e/pBAC-PyccA-Hma(mt)-6718으로 명명하였다.
상기 제작된 CA14-9003e/pBAC, CA14-9003e/pBAC-PyccA-Hma, CA14-9003e/pBAC-PyccA-Hma(mt)-6718 균주의 L-히스티딘 생산능을 확인하기 위하여, 다음과 같은 방법으로 배양하였다. 균주들을 LB 고체 배지(클로람페니콜 25㎍/ml 포함)에서 16시간 동안 배양한 후, LB 액체 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 각 균주들을 접종하고, 37 ℃에서 20 시간 동안, 200 rpm으로 진탕 배양하였다. 그런 다음, 대장균 생산 배지(Applied Biochemistry and Microbiology, 2013, Vol. 49, No. 2, pp. 130-135) 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 1 ㎖의 종 배양액을 접종하고 37 ℃에서 48시간 동안, 200 rpm에서 진탕 배양하였다. 상기 배양에 사용된 배지는 다음과 같다:
<대장균 생산배지>
포도당 4%(w/v), 효모추출액 0.2%(w/v), 황산암모늄 1.6%(w/v), 제2인산칼륨3수염 0.06%(w/v), 황산철7수염 0.0005%(w/v), 황산마그네슘 5수염 0.0005%(w/v), 탄산칼슘, pH 7.2,
배양 종료 후 HPLC에 의해 L-히스티딘 생산량(배지 내 히스티딘 함량)을 측정하여 그 결과를 다음의 표 11에 나타내었다
OD |
사용한
포도당 (g/L) |
히스티딘
생산량 (g/L) |
|
CA14-9003e/pBAC | 24.5 | 40 | 2.9 |
CA14-9003e/pBAC-PyccA-Hma | 17.1 | 40 | 3.7 |
CA14-9003e/pBAC-PyccA-Hma(mt)-6718 | 14.5 | 40 | 4.8 |
표 11에 나타난 바와 같이, 변이형 Hma가 도입된 CA14-9003e/pBAC-PyccA-Hma(mt)-6718 균주는 야생형 Hma 도입주 CA14-9003e/pBAC-PyccA-Hma 균주 대비 L-히스티딘 생산능이 30% 증가됨을 확인하였다.
상기 결과를 통해, Helcobacillus massiliensis 유래 L-히스티딘 배출자 변이체를 코리네박테리움 속 균주 이외의 미생물에 도입시에도 세포 밖으로의 L-히스티딘 배출능이 크게 증가됨을 확인하였다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> CJ CheilJedang Corporation
<120> L-Histidine Export Protein and Method of Producing L-Histidine
Using the Same
<130> DPP20213974KR
<160> 56
<170> koPatentIn 3.0
<210> 1
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_Haq protein
<400> 1
Met Lys Ser Lys Asn Ala Thr Leu Val Gly Leu Ser Ala Val Val Leu
1 5 10 15
Trp Ser Ala Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Ala Ile Tyr Thr Val Ala Ser Leu Ile Leu
35 40 45
Leu Val Ser Val Gly Phe Pro Arg Leu Ala Ser Phe Pro Arg Arg Tyr
50 55 60
Leu Leu Trp Gly Ser Val Leu Phe Val Ala Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Ser Ile Gly Tyr Ala His Thr Gly Arg Gln Ala Ile Glu Val Gly
85 90 95
Met Val Asn Tyr Leu Trp Pro Thr Phe Thr Leu Val Ala Ala Ile Leu
100 105 110
Phe Gly Gly Gln Arg Ala Thr Leu Leu Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Met Leu Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Pro Ser Gly Met Leu Ala Asn Ile Arg Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Ile Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Thr Arg Ile Ala Gln Gly Gln Asn Gly Val Thr Pro Phe Phe Met Leu
180 185 190
Val Ala Leu Ala Leu Trp Val Lys Val Leu Leu Gly Gly His Val Ala
195 200 205
Glu Leu Ser Phe Ser Val Pro Ala Leu Val Tyr Leu Val Leu Ala Ala
210 215 220
Ala Ala Met Gly Leu Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His
225 230 235 240
Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Phe
245 250 255
Ser Ser Ala Leu Ser Ala Leu Leu Leu Arg Ala Pro Leu Pro Thr Ser
260 265 270
Phe Trp Val Gly Ala Ala Leu Val Cys Ala Gly Ser Ile Leu Cys Trp
275 280 285
Arg Ala Thr Arg Ser Leu Asp Leu Ser Lys Glu Pro Ala Ala Arg Ala
290 295 300
Ala Arg Pro Glu Gly Pro Pro Gln Asn Gln
305 310
<210> 2
<211> 945
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Haq gene encoding Haq protein
<400> 2
atgaagagca agaacgcaac cctggtcgga ttgagcgcgg tggtactgtg gagtgccatc 60
gtgggcctga tccgtggcgt gagcgagcat ctcggagcca ccggcggggc ggcggccatt 120
tacacggtgg cttcgctgat cctgctggtg tcggtgggat tcccgcgcct ggcgagtttc 180
ccgcgcaggt atctgctatg gggcagcgtg ctgttcgtgg cttatgaatt gtgcctgtcg 240
ctctcgatcg gttatgccca taccggccgc caggccatcg aagtcggcat ggtcaattac 300
ctctggccga ccttcaccct ggtggcggcc atcctcttcg gaggccagcg cgccacgctg 360
ctggtggtgc caggcttcat cctttccatg ctgggcatct gctgggtgct cgggggcgac 420
caggggctgg atccttccgg catgctggcc aatatccgtg acaatccgct gagctacggc 480
ctggccttca tcggggcctt gatctgggcg gcctactgca ccgtgactac ccgcatcgcc 540
caaggccaga acggggtgac gcctttcttc atgctggtgg cattggcatt gtgggtgaag 600
gtgctgctgg gcgggcatgt ggctgaacta tccttcagtg tgcccgcact ggtctacctg 660
gtgctggctg cggcggcgat ggggctgggc tatgcggcct ggaacgtggg catcctgcat 720
ggcaatgtga cagtgctggc cggtgcctcg tatttcatcc cggtcttttc ttcggccttg 780
tcggccttgc tgctacgtgc gccgctgccc acctcgttct gggtgggcgc tgcgctggtg 840
tgcgccgggt cgatcctgtg ctggcgggct acccgcagcc tggatttgtc aaaagaacct 900
gcagcgcggg cggcacgtcc cgaaggccca cctcagaacc aatag 945
<210> 3
<211> 312
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_Cpi protein
<400> 3
Met Gln Ser Thr Arg Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Leu
1 5 10 15
Leu Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu Ser Leu
20 25 30
Gly Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Val Leu
35 40 45
Leu Met Leu Thr Val Gly Phe Val Arg Leu Arg Glu Phe Pro Arg Arg
50 55 60
Tyr Leu Val Trp Gly Ser Ile Leu Phe Val Ser Tyr Glu Leu Cys Leu
65 70 75 80
Ser Leu Ser Ile Gly Tyr Ser His Ser Gly Arg Gln Ala Ile Glu Val
85 90 95
Gly Met Val Asn Tyr Leu Trp Pro Ser Phe Thr Met Leu Cys Ala Ile
100 105 110
Ala Phe Asn Lys Gln Lys Ala Asn Val Leu Ile Val Pro Gly Phe Leu
115 120 125
Ile Ala Ile Leu Gly Ile Cys Leu Val Leu Gly Gly Glu Gln Gly Leu
130 135 140
Asp Val Ala Gly Met Val Ala Asn Val Arg Asp Asn Pro Leu Ser Tyr
145 150 155 160
Gly Leu Ala Leu Ala Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val
165 170 175
Thr Asn Arg Ile Ala Gly Gly Asn Asn Gly Val Thr Leu Phe Phe Met
180 185 190
Leu Thr Ala Met Ala Leu Trp Ile Lys Tyr Phe Thr Gly Asp His Ala
195 200 205
Pro Met Ala Phe Thr Tyr His Ala Val Ile Tyr Leu Ala Leu Ala Ala
210 215 220
Ser Ala Met Gly Phe Gly Tyr Pro Ala Trp Asn Val Gly Ile Leu His
225 230 235 240
Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Ile
245 250 255
Ser Ala Ala Leu Ala Gly Leu Leu Leu His Ile Pro Leu Ser Leu Ala
260 265 270
Phe Trp Lys Gly Ala Ser Leu Val Cys Ala Gly Ser Val Leu Cys Trp
275 280 285
Leu Ala Thr Arg Ala Arg Lys Val Ala Ala Thr Pro Asp Arg Ala Pro
290 295 300
Val Arg Asp Arg Val Trp Lys Gln
305 310
<210> 4
<211> 939
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Cpi gene encoding Cpi protein
<400> 4
atgcaaagca cgcgtaaggc cacgttgatc gggctcattg cgatcctgtt gtggagttcc 60
atcgtcggcc tgatccgcgg cgtcagtgaa agcctcggcg cgaccggtgg cgccgccatg 120
atgtactcgg ttgcctccgt cctgcttatg ctgacggttg gcttcgtgcg tctgcgcgaa 180
tttccgcggc gctatctggt ctggggcagc atcctgttcg tctcctacga actgtgcctg 240
tcgctgtcca tcggctattc gcacagcggc aggcaggcga tcgaggtggg gatggtcaat 300
tacctctggc cgtctttcac catgttgtgc gccatcgcct tcaacaagca gaaggcgaac 360
gttctgatcg tgccgggctt cctgattgcg atcctgggta tctgcctggt gctgggcggc 420
gagcagggtc tggatgttgc aggcatggtg gccaatgtca gggacaatcc gctcagctac 480
ggcctcgctt tagcgggcgc gctgatctgg gcggcctatt gcaccgtgac caacaggatt 540
gccggcggca acaacggcgt cacgctgttt ttcatgctca ccgcaatggc gctgtggatc 600
aagtacttca ccggcgacca tgcgccgatg gctttcacat accacgccgt catctacctg 660
gcactggcag cgtcggcgat gggcttcggc tacccggcgt ggaacgtggg catcctgcac 720
ggcaacgtaa cggtgcttgc cggcgcgtcg tatttcatcc ctgtgatttc agccgcactg 780
gctggcttgc tcttgcatat accgctttcg ctggcgttct ggaaaggcgc gtcgctggta 840
tgcgcggggt ccgtgctgtg ctggttggcg acgcgcgcgc gcaaggtggc tgcaacgccc 900
gaccgtgctc cggtccgcga ccgtgtctgg aagcaatga 939
<210> 5
<211> 293
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_Kcr protein
<400> 5
Met Asp Lys Lys Arg Ala Thr Leu Ile Gly Phe Ser Ala Ile Ile Leu
1 5 10 15
Trp Ser Thr Met Val Gly Leu Ile Arg Gly Val Ser Glu Gly Leu Gly
20 25 30
Pro Val Gly Gly Ala Ala Met Ile Tyr Ser Leu Ser Gly Leu Leu Leu
35 40 45
Ile Phe Thr Val Gly Phe Pro Gln Leu Arg Gln Ile Pro Pro Arg Tyr
50 55 60
Leu Leu Val Gly Ser Leu Phe Phe Val Ser Tyr Glu Met Cys Leu Ala
65 70 75 80
Leu Ser Leu Gly Tyr Ala Gly Thr Arg Gln Gln Ala Ile Glu Val Gly
85 90 95
Met Val Asn Tyr Leu Trp Pro Ser Leu Thr Ile Leu Phe Ala Ile Ile
100 105 110
Phe Asn Gly Gln Lys Thr Thr Trp Leu Val Ile Pro Gly Leu Leu Leu
115 120 125
Ser Ile Val Gly Val Thr Trp Val Leu Gly Gly Glu His Gly Leu Asp
130 135 140
Leu Ala Glu Ile Arg Ser Asn Val Ile Ser Ser Pro Leu Ser Tyr Ile
145 150 155 160
Leu Ala Phe Val Gly Ala Phe Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Lys Tyr Ala Lys Gly Lys Asn Gly Ile Thr Leu Phe Val Leu Phe
180 185 190
Thr Ala Leu Ala Leu Trp Val Lys Phe Leu Met Ser Glu Gln Pro Pro
195 200 205
Met Ile Phe Ser Trp Pro Val Val Ile Lys Leu Val Thr Cys Ala Leu
210 215 220
Ala Leu Gly Phe Ala Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Ser Leu Leu Ala Ala Ala Ser Tyr Phe Thr Pro Val Leu Ser
245 250 255
Ser Ala Leu Ala Ala Phe Leu Leu Ser Ala Ala Leu Ser Trp Ser Phe
260 265 270
Trp Gln Gly Ala Ala Met Val Cys Gly Gly Ser Leu Leu Cys Trp Tyr
275 280 285
Ala Thr Arg Arg Pro
290
<210> 6
<211> 371
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Kcr gene encoding Kcr protein
<400> 6
atggataaga aaagagcgac gctcattgga tttagcgcca ttattttgtg gagtacgatg 60
gtgggtctga ttcgcggcgt aagcgaaggg ctcggcccgg tgggcggagc cgcaatgatt 120
tacagcctca gcggcctgct gctgattttt accgttggct tcccacaatt gcgccaaatt 180
ccaccgcgct atttgctggt aggtagcctg ttttttgtca gctacgaaat gtgcctcgcg 240
ctctcattag gctatgccgg cactcgccaa caggccatcg aagtcggcat ggtgaattat 300
ctctggccta gcctgacgat tttatttgcg attatcttta atggtcaaaa aaccacctgg 360
ctggttatcc c 371
<210> 7
<211> 238
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_Cst protein
<400> 7
Met Ser Thr Leu Ser Ile Leu Ile Ala Gly Phe Ala Leu Gly Leu Ser
1 5 10 15
Leu Ile Val Ala Ile Gly Pro Gln Asn Ala Leu Leu Ile Lys Gln Gly
20 25 30
Ile Lys Arg Glu His Val Trp Val Val Ile Ala Ile Cys Ala Val Ser
35 40 45
Asp Ile Ile Leu Ile Ser Gly Gly Thr Ala Gly Val Gly Tyr Leu Val
50 55 60
Glu Thr Phe Pro Thr Ala Leu Val Val Leu Lys Tyr Leu Gly Ala Ile
65 70 75 80
Tyr Leu Ala Tyr Phe Thr Tyr Leu Cys Phe Arg Asp Ala Leu Arg Asp
85 90 95
Lys Val Glu Thr Leu Ser Pro Ala Gln Ile Glu Pro Asn Lys Thr Gln
100 105 110
Gln Ile Asp Ala Phe Asp Gly Gly Asp Leu Gly Gly Ser Ser Val Asp
115 120 125
Thr Arg Arg Arg Thr Thr Arg Leu Arg Gln Gln Val Arg Gln Ser Thr
130 135 140
Trp Val Lys Pro Ala Leu Ala Thr Leu Ala Ile Cys Trp Leu Asn Pro
145 150 155 160
Ala Ala Tyr Val Asp Val Leu Val Met Ile Gly Gly Leu Ala Asn Gln
165 170 175
Tyr Gly Glu Thr Gly Arg Trp Phe Phe Ala Ala Gly Ala Ile Ala Ala
180 185 190
Ser Met Leu Trp Phe Pro Ser Val Gly Leu Ala Ala Ala Lys Phe Ser
195 200 205
His Val Leu Ser Arg Pro Ala Val Trp Arg Gly Ile Asn Phe Gly Ile
210 215 220
Gly Cys Ile Met Ala Leu Leu Thr Ile Lys Leu Leu Leu Thr
225 230 235
<210> 8
<211> 717
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Cst gene encoding Cst protein
<400> 8
atgtcaacgc tgtctatcct catcgccggt ttcgcactag ggctctcact tatcgtagcg 60
attggcccgc aaaatgctct gctgatcaaa cagggcatta aacgcgagca cgtgtgggta 120
gtcattgcga tttgcgcggt gtccgacatt attttgatta gcggtggcac cgcgggggtg 180
ggctatctgg tggagacttt cccgaccgca ctggtggtgc tgaagtatct gggcgcgatt 240
tatctggctt actttactta tctgtgcttt cgcgatgcgt tgcgcgacaa ggttgaaact 300
ctctcccctg cgcagatcga gccgaataag acgcagcaga tcgatgcatt cgatggcggc 360
gacttgggcg gttcttctgt tgatacccgg cggcgcacca cgcgtctgcg ccagcaagta 420
cgccaatcga cctgggtgaa gccagctctt gcgaccttgg cgatttgctg gctgaacccg 480
gcagcttatg tcgatgtgct ggtaatgatt ggcggacttg ccaaccaata cggcgaaacc 540
ggccgatggt tttttgctgc cggtgccatt gcagcgagca tgctgtggtt tcccagcgtt 600
ggtcttgctg ccgcgaagtt ctcgcacgta ctttcgcgcc ctgcggtatg gcgcggcatc 660
aacttcggca ttggctgcat catggcgctg ctgaccatta agctgctgtt gacctag 717
<210> 9
<211> 242
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_LsaF protein
<400> 9
Met Ser Pro Ser His Asp Pro Leu Pro Arg Arg Ala Gly Ala Ala Ala
1 5 10 15
Gly Leu Arg Asp Ser Leu Gly Val Gly Leu Gly Ile Phe Pro Leu Gly
20 25 30
Ile Ala Leu Gly Ile Leu Val Ile Gln Ala Gly Leu Pro Trp Trp Leu
35 40 45
Ala Pro Ala Leu Ser Ile Gly Ile Phe Ala Gly Ser Val Glu Leu Leu
50 55 60
Leu Val Ser Met Leu Ala Ala Ala Thr Pro Leu Val Thr Ile Ala Ala
65 70 75 80
Thr Val Phe Ala Val Asn Phe Arg His Val Phe Tyr Ala Phe Ser Phe
85 90 95
Pro Leu Ser Arg Val Arg Pro Gly Leu Pro Arg Ala Tyr Ser Ile Tyr
100 105 110
Ala Met Ile Asp Glu Ala Tyr Ala Thr Tyr Val Leu Met Asp Pro Asp
115 120 125
Arg Leu Ser Ser Ala Arg Met Val Thr Gly Gln Leu Ala Met Gln Leu
130 135 140
Tyr Trp Val Leu Gly Gly Phe Val Gly Ile Met Ile Ala Asn Val Leu
145 150 155 160
Pro Ala Pro Ile Glu Gly Phe Glu Phe Ala Leu Val Ala Leu Phe Val
165 170 175
Val Met Ser Met Asp Ala Ile Arg Gly Lys Arg Glu Leu Pro Ser Ala
180 185 190
Leu Leu Ala Cys Leu Ala Val Thr Val Ala Ile Leu Val Ala Gly Asp
195 200 205
Asn Ala Leu Leu Val Ala Leu Ala Leu Tyr Ser Gly Leu Leu Gly Leu
210 215 220
Arg Tyr Phe Leu Thr Lys Arg Thr Thr Asp Thr Ala Glu Glu Gly Glu
225 230 235 240
Arg Ala
<210> 10
<211> 140
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_LsaE protein
<400> 10
Met Arg Cys Trp Ser Arg Leu Arg Cys Thr Pro Gly Tyr Trp Gly Cys
1 5 10 15
Ala Ile Ser Ser Pro Ser Glu Pro Arg Thr Leu Arg Arg Arg Ala Ser
20 25 30
Val Pro Ser Thr Glu Tyr Leu Ile Ala Gly Val Val Val Ala Gly Leu
35 40 45
Ile Thr Leu Ala Leu Arg Ala Leu Pro Phe Ala Ala Leu Lys Pro Leu
50 55 60
Arg Lys Ser Lys Leu Val Gln Ala Leu Gly Arg Trp Met Pro Ala Gly
65 70 75 80
Ile Leu Val Ile Leu Ala Val Val Val Leu Arg Asp Gln Leu Ile Ser
85 90 95
Gln Gln Gly Arg Val Trp Pro Val Leu Val Ala Thr Ala Ile Thr Ala
100 105 110
Leu Ala His Leu Leu Ser Lys Arg Arg Ala Leu Val Ser Ile Ala Ala
115 120 125
Gly Thr Ala Cys Tyr Val Leu Leu Leu Asn Phe Phe
130 135 140
<210> 11
<211> 1048
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Isa gene
<400> 11
atgtctccgt cacacgatcc tttaccgcgc cgcgcgggcg ccgcggccgg ccttcgagat 60
tctctcgggg tcggcctcgg cattttcccc ttgggcattg ccctcggaat tcttgtcatt 120
caggcgggac ttccctggtg gctcgccccg gccctctcga ttggtatctt cgcgggatct 180
gtcgagctgc tcctggtcag catgctcgcc gccgcgactc cgctcgtgac gatcgccgcg 240
accgtgttcg ccgtgaactt tcggcacgta ttctacgcgt tctcgtttcc gctttcgcgg 300
gtgcgaccgg gtctaccccg ggcgtactcc atctacgcaa tgatcgacga ggcctacgcc 360
acctatgtgc tgatggatcc ggatcgcctg agctcagccc gcatggtaac cggccagctc 420
gcgatgcagc tctattgggt gctcggcggc ttcgtcggca tcatgattgc gaacgtgctc 480
cctgccccca ttgagggctt tgagtttgca ctcgtggcgc tcttcgtggt gatgtcgatg 540
gatgcgattc gcggcaagcg cgagctccca tcggccttgc tggcttgcct cgctgtcacg 600
gttgcaatac tggtcgctgg cgacaatgcg ctgctggtcg cgcttgcgct gtactccggg 660
ctactggggc tgcgctattt cctcaccaag cgaaccacgg acactgcgga ggagggcgag 720
cgtgcctagc accgaatatc taatcgcggg cgtcgtcgtc gcgggcctca tcaccctggc 780
gctgcgcgca ctcccgtttg cggcgctcaa accgctgcgc aaatctaagc tcgtgcaggc 840
gctcgggcgc tggatgcccg ctggcatcct cgttatcctc gccgtcgtcg tactgcgcga 900
tcagctcata tcgcagcagg gccgggtgtg gccggtgctc gtcgcgaccg cgatcacggc 960
cctcgctcac ttgctctcaa agcgacgcgc gctcgtgagc atcgcggctg gcaccgcctg 1020
ctacgtgctg ctgctcaact ttttctag 1048
<210> 12
<211> 251
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_DvaF protein
<400> 12
Met Ser Val Glu Ala Gln Pro Gly Ala Asn Asp Arg Pro Tyr Ser Val
1 5 10 15
Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu
20 25 30
Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser
35 40 45
Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala
50 55 60
Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro
65 70 75 80
Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val
85 90 95
Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Thr Asn Pro Phe Leu
100 105 110
Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr
115 120 125
Val Ala Asn Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly
130 135 140
Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu
145 150 155 160
Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu
165 170 175
Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln
180 185 190
Glu Ile Pro Ser Leu Leu Leu Gly Ala Ala Ala Phe Gly Phe Ala Leu
195 200 205
Leu Leu Leu Pro Ser Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val
210 215 220
Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro
225 230 235 240
Leu Pro Ala Glu Met Glu Ser Asp Asp Ala Ala
245 250
<210> 13
<211> 111
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_DvaE protein
<400> 13
Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile
1 5 10 15
Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu
20 25 30
Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met
35 40 45
Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr
50 55 60
Leu Ala Glu Glu Pro Gly Gly Leu Val His Leu Leu Ile Ala Ser Gly
65 70 75 80
Val Thr Ile Ala Val His Leu Phe Gly Gly Arg Arg Thr Leu Val Ser
85 90 95
Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe
100 105 110
<210> 14
<211> 756
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_DvaF gene encoding DvaF protein
<400> 14
atgagcgttg aggcgcagcc tggcgcaaac gaccgaccct atagcgtgcg ccacgagatc 60
acgcagggcg cactcctgat tctccccgca gggctcggaa tgattccgat cggcattgcc 120
ttcggcctgc ttgtggtgca atcggggctc ccgtggtgga tggcacccgc cctttcgttc 180
ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacgccg 240
cttgtaacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttt 300
aatttcccgc tcaaggtcgt cacgaacccg ttcttgaagt tctacgcgat gtactccctc 360
accgacgaga tcttcgcggt aacggttgcc aatccaaagg ggtggacgca gccgcgcgtg 420
atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480
ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540
atcacgctga ccctcgatgc gtgccgcacg aaacaggaga tcccgtcact tctcctcggt 600
gctgccgcct tcggtttcgc gctccttttg ctcccgagcc agccgatctt cgccgcgatg 660
attggcttcg tggcgaccct cgccgcgcgc tacacgatcg ccgtgcgcct cacgaggcca 720
ctcccggcag agatggagag cgacgatgca gcttga 756
<210> 15
<211> 335
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_DvaE gene encoding DvaE protein
<400> 15
atgcagcttg acatcccctt ctggtatctc gcctcggttc tcctcatcgc cttcgccgtg 60
accttcacgc tgcgcgcgct cccgttcgcg attctcgaac cactgcgcaa atcgcaattc 120
gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tgatcctcgc gctcgcgacc 180
tttaagagca ccctcgccga ggaacccggt ggtctcgttc acctgctgat cgcctcagga 240
gtcacgattg ccgtgcacct cttcggtggt cgccgcaccc tcgtgagcgt cgccgcgggc 300
accctcgcct tcgtgctgct cgtgaacttt ttcta 335
<210> 16
<211> 1081
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_DvaFE gene
<400> 16
atgagcgttg aggcgcagcc tggcgcaaac gaccgaccct atagcgtgcg ccacgagatc 60
acgcagggcg cactcctgat tctccccgca gggctcggaa tgattccgat cggcattgcc 120
ttcggcctgc ttgtggtgca atcggggctc ccgtggtgga tggcacccgc cctttcgttc 180
ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacgccg 240
cttgtaacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttt 300
aatttcccgc tcaaggtcgt cacgaacccg ttcttgaagt tctacgcgat gtactccctc 360
accgacgaga tcttcgcggt aacggttgcc aatccaaagg ggtggacgca gccgcgcgtg 420
atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480
ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540
atcacgctga ccctcgatgc gtgccgcacg aaacaggaga tcccgtcact tctcctcggt 600
gctgccgcct tcggtttcgc gctccttttg ctcccgagcc agccgatctt cgccgcgatg 660
attggcttcg tggcgaccct cgccgcgcgc tacacgatcg ccgtgcgcct cacgaggcca 720
ctcccggcag agatggagag cgacgatgca gcttgacatc cccttctggt atctcgcctc 780
ggttctcctc atcgccttcg ccgtgacctt cacgctgcgc gcgctcccgt tcgcgattct 840
cgaaccactg cgcaaatcgc aattcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900
cctcgtgatc ctcgcgctcg cgacctttaa gagcaccctc gccgaggaac ccggtggtct 960
cgttcacctg ctgatcgcct caggagtcac gattgccgtg cacctcttcg gtggtcgccg 1020
caccctcgtg agcgtcgccg cgggcaccct cgccttcgtg ctgctcgtga actttttcta 1080
a 1081
<210> 17
<211> 409
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA
<400> 17
tctgagactt taatttgtgg attcacgggg gtgtaatgta gttcataatt aaccccattc 60
gggggagcag atcgtagtgc gaacgatttc aggttcgttc cctgcaaaaa ctatttagcg 120
caagtgttgg aaatgccccc gtttggggtc aatgtccatt tttgaatgtg tctgtatgat 180
tttgcatctg ctgcgaaatc tttgtttccc cgctaaagtt gaggacaggt tgacacggag 240
ttgactcgac gaattatcca atgtgagtag gtttggtgcg tgagttggaa aaattcgcca 300
tactcgccct tgggttctgt cagctcaaga attcttgagt gaccgatgct ctgattgacc 360
taactgcttg acacattgca tttcctacaa tctttagagg agacacaac 409
<210> 18
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_primer
<400> 18
gtacccgggg atcctctaga caaagccgaa gagaagttgg 40
<210> 19
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_primer
<400> 19
gcatagagta ctcggcgccc ataaatttca 30
<210> 20
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_primer
<400> 20
gcgccgagta ctctatgccg agaagttgaa 30
<210> 21
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_primer
<400> 21
gcctgcaggt cgactctaga ctgggcatca cactattttt 40
<210> 22
<211> 531
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_del-N2131L
<400> 22
gtacccgggg atcctctaga caaagccgaa gagaagttgg cttgacggac ccgaaattcc 60
agctgatttt gacgatcctg atgcacccgg caggtggcct ggcgaaaagt tggggcttcc 120
tcaagaaggg gccggctctc tgtcctcagt ggctcgtcgt atcggcgggg tctgcgtgga 180
ctggggtgtt tcctgggtta ttgctattgt gctgtccaat ttcacggatg tgctgggcga 240
tgtagcgaca tccacgctca ttattttcgt gatcctgggt tggcttaccg gttggatctt 300
tgctcgcacc ccaggtcatg ccgtgtttgg catgggcctt gcgcgtgtgg atgcagagga 360
acgtgtgggc tggtggcgtg cgctggttcg cccactgctg acgatcttga ttctgcctgc 420
cgtgatggtg gatgctgacg gccgtgggct ccacgacaag gcaacgggaa ctgcagttat 480
ccgcgggtaa tttgtcttga gtgaaattta tgggcgccga gtactctatg c 531
<210> 23
<211> 555
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_del-N2131R
<400> 23
gcgccgagta ctctatgccg agaagttgaa cagcaatctt gcagcaactc ctcagtattc 60
acaccagccc caatggacac aaaaacatca gccccagaat cgcccctaag ggcctcaaat 120
acacgatctg gaccaactag tcatcgggaa aacccaaccc cttaaatcgc cttctgcgct 180
taaggggtca atgctagata agtaggaaca acaacgtttg ggcggccagg atctttgcga 240
tcatcgccag cggatacaca gaggtataac ccatggcagg gagctcgttg cgggaggcat 300
ctgacacata actcagcaca gcagggtggg tttgcgtacc ggcgaggatg ccagcggttt 360
caccgaaggg gattttcatc agtttgtggc caacgaacag caccgtgatg gagatgaaca 420
aagtgagcag cgcaccgaag ccgatgatgg tgagtgattg ggggtcgctg atcgctgatc 480
gaaatcctgc gcccgctgag gtaccgatgg cagccaaaaa tagtgtgatg cccagtctag 540
agtcgacctg caggc 555
<210> 24
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Haq-F
<400> 24
aggagacaca acatgaagag caagaacgca 30
<210> 25
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Haq-R
<400> 25
tcaacttctc ggcatagagt ctattggttc tgaggtgggc 40
<210> 26
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA-F
<400> 26
gaaatttatg ggcgccgagt tctgagactt taatttgtgg 40
<210> 27
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA-R
<400> 27
cttgctcttc atgttgtgtc tcctctaaag 30
<210> 28
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Cpi-F
<400> 28
aggagacaca acatgcaaag cacgcgtaag 30
<210> 29
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Cpi-R
<400> 29
tcaacttctc ggcatagagt tcattgcttc cagacacggt 40
<210> 30
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA-R
<400> 30
cgtgctttgc atgttgtgtc tcctctaaag 30
<210> 31
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Kcr-F
<400> 31
aggagacaca acatggataa gaaaagagcg 30
<210> 32
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Kcr-R
<400> 32
tcaacttctc ggcatagagt ttagggacgg cgggtggcgt 40
<210> 33
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA-R
<400> 33
tttcttatcc atgttgtgtc tcctctaaag 30
<210> 34
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Cst-F
<400> 34
aggagacaca acatgtcaac gctgtctatc 30
<210> 35
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Cst-R
<400> 35
tcaacttctc ggcatagagt ctaggtcaac agcagcttaa 40
<210> 36
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA-R
<400> 36
cagcgttgac atgttgtgtc tcctctaaag 30
<210> 37
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Isa-F
<400> 37
aggagacaca acatgtctcc gtcacacgat 30
<210> 38
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Isa-R
<400> 38
tcaacttctc ggcatagagt ctagaaaaag ttgagcagca 40
<210> 39
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA-R
<400> 39
tgacggagac atgttgtgtc tcctctaaag 30
<210> 40
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Dva-F
<400> 40
aggagacaca acatgagcgt tgaggcgcag 30
<210> 41
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_Dva-R
<400> 41
tcaacttctc ggcatagagt ttagaaaaag ttcacgagca 40
<210> 42
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA-R
<400> 42
ctcaacgctc atgttgtgtc tcctctaaag 30
<210> 43
<211> 251
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_HmaF protein
<400> 43
Met Ser Val Ala Ala Gln Pro Ser Ala His Glu His Pro Tyr Ser Val
1 5 10 15
Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu
20 25 30
Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser
35 40 45
Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala
50 55 60
Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro
65 70 75 80
Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val
85 90 95
Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Lys Asn Pro Phe Leu
100 105 110
Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr
115 120 125
Val Ala His Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly
130 135 140
Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu
145 150 155 160
Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu
165 170 175
Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln
180 185 190
Glu Leu Pro Ser Leu Val Leu Gly Ala Ala Ala Phe Gly Leu Ala Leu
195 200 205
Leu Leu Met Pro Gly Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val
210 215 220
Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro
225 230 235 240
Leu Pro Ala Glu Met Glu Gly Asp Asp Ala Ala
245 250
<210> 44
<211> 111
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_HmaE protein
<400> 44
Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile
1 5 10 15
Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu
20 25 30
Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met
35 40 45
Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr
50 55 60
Leu Ala Glu Glu Pro Gly Ser Val Ile His Leu Leu Ile Ala Ser Ala
65 70 75 80
Val Thr Ile Ala Val His Leu Leu Phe Gly Arg Arg Thr Leu Val Ser
85 90 95
Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe
100 105 110
<210> 45
<211> 756
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_HmaF gene encoding hmaF protein
<400> 45
atgagcgttg cggcgcagcc tagcgcacat gagcatccct attcggtgcg ccatgaaatc 60
acgcaggggg cgctcttgat tctccccgcg ggcctcggca tgatcccgat tggcatcgct 120
tttggccttc ttgttgtgca gtccggactt ccgtggtgga tggcacccgc cctctcattc 180
ttcgcgtacg cgggctcgct cgagcttttg ctcatcacac tcatcacatc gctcacgccg 240
ctcgtgacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ttacgcgttc 300
aacttcccgc tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtactcgctt 360
accgacgaga tcttcgcggt gacggtcgcg cacccgaagg ggtggacgca gccacgcgtc 420
atctccgcgg gcgccgtact ccagatctgc tgggtgggag gcggcctcat gggcgtgctc 480
ctctcgagtt tcattccctt ccagatccgc ggtttgagct tcgccctgtg cgcgcttttc 540
atcaccctga ctctcgatgc gtgccgcacg aagcaagaac ttccgtcgct agttctcggc 600
gccgcggcct tcggtctcgc cctgctcctc atgcccgggc agccgatctt tgccgcgatg 660
atcggcttcg ttgcaacgct cgccgcgcgg tacacgatcg ccgtgcgcct tacgaggccg 720
ctaccggcgg aaatggaggg cgacgatgca gcttga 756
<210> 46
<211> 336
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_HmaE gene encoding HmaE protein
<400> 46
atgcagcttg acatcccctt ctggtacctt gcctcggttc tcctcattgc cttcgccgtc 60
acctttacgc tgcgcgcgct cccgttcgcg atcctcgaac cgctgcgcaa atcccagttc 120
gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tcattctcgc gctcgcgacc 180
ttcaaaagca ccctcgctga ggaacccggc agcgtcattc atttgctcat tgcctcggcc 240
gtcacgatcg ctgtgcatct tctctttggg cgccgaaccc tcgtgagtgt cgccgcgggt 300
accctcgcct tcgtgctcct cgtgaacttc ttctaa 336
<210> 47
<211> 1081
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_HmaFE gene encoding HmaFE protein
<400> 47
atgagcgttg cggcgcagcc tagcgcacat gagcatccct attcggtgcg ccatgaaatc 60
acgcaggggg cgctcttgat tctccccgcg ggcctcggca tgatcccgat tggcatcgct 120
tttggccttc ttgttgtgca gtccggactt ccgtggtgga tggcacccgc cctctcattc 180
ttcgcgtacg cgggctcgct cgagcttttg ctcatcacac tcatcacatc gctcacgccg 240
ctcgtgacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ttacgcgttc 300
aacttcccgc tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtactcgctt 360
accgacgaga tcttcgcggt gacggtcgcg cacccgaagg ggtggacgca gccacgcgtc 420
atctccgcgg gcgccgtact ccagatctgc tgggtgggag gcggcctcat gggcgtgctc 480
ctctcgagtt tcattccctt ccagatccgc ggtttgagct tcgccctgtg cgcgcttttc 540
atcaccctga ctctcgatgc gtgccgcacg aagcaagaac ttccgtcgct agttctcggc 600
gccgcggcct tcggtctcgc cctgctcctc atgcccgggc agccgatctt tgccgcgatg 660
atcggcttcg ttgcaacgct cgccgcgcgg tacacgatcg ccgtgcgcct tacgaggccg 720
ctaccggcgg aaatggaggg cgacgatgca gcttgacatc cccttctggt accttgcctc 780
ggttctcctc attgccttcg ccgtcacctt tacgctgcgc gcgctcccgt tcgcgatcct 840
cgaaccgctg cgcaaatccc agttcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900
cctcgtcatt ctcgcgctcg cgaccttcaa aagcaccctc gctgaggaac ccggcagcgt 960
cattcatttg ctcattgcct cggccgtcac gatcgctgtg catcttctct ttgggcgccg 1020
aaccctcgtg agtgtcgccg cgggtaccct cgccttcgtg ctcctcgtga acttcttcta 1080
a 1081
<210> 48
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_hma-F
<400> 48
aggagacaca acatgagcgt tgcggcgcag 30
<210> 49
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_hma-R
<400> 49
tcaacttctc ggcatagagt ttagaagaag ttcacgagga 40
<210> 50
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PgapA-R
<400> 50
cgcaacgctc atgttgtgtc tcctctaaag 30
<210> 51
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PyccA
<400> 51
ttccagatca aatgcgtaaa gatgggtaaa acttctgggt gcccttacgc attatcatta 60
tgctgcttaa ttaattacat ctgtcataga gagtgactca 100
<210> 52
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_dva-F
<400> 52
ctgtcataga gagtgactca atgagcgttg cggcgcag 38
<210> 53
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_dva-R
<400> 53
cgggtaccga gctcgaattc ttagaagaag ttcacgagga 40
<210> 54
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PyccA-F
<400> 54
actcactata gggcgaattc ttccagatca aatgcgtaaa 40
<210> 55
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic_PyccA-R
<400> 55
tgagtcactc tctatgacag atgtaattaa 30
<210> 56
<211> 251
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic_HmaF protein (I72L, I124V var.)
<400> 56
Met Ser Val Ala Ala Gln Pro Ser Ala His Glu His Pro Tyr Ser Val
1 5 10 15
Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu
20 25 30
Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser
35 40 45
Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala
50 55 60
Gly Ser Leu Glu Leu Leu Leu Leu Thr Leu Ile Thr Ser Leu Thr Pro
65 70 75 80
Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val
85 90 95
Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Lys Asn Pro Phe Leu
100 105 110
Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Val Phe Ala Val Thr
115 120 125
Val Ala His Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly
130 135 140
Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu
145 150 155 160
Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu
165 170 175
Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln
180 185 190
Glu Leu Pro Ser Leu Val Leu Gly Ala Ala Ala Phe Gly Leu Ala Leu
195 200 205
Leu Leu Met Pro Gly Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val
210 215 220
Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro
225 230 235 240
Leu Pro Ala Glu Met Glu Gly Asp Asp Ala Ala
245 250
Claims (11)
- (1) 서열번호 43의 아미노산 서열의 72번째 아미노산 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나,
(2) 서열번호 43의 아미노산 서열의 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나, 또는
(3) 상기 (1) 및 (2)가 모두 치환된,
변이형 L-히스티딘 배출 단백질. - 제1항에 있어서,
(1) 서열번호 43의 아미노산 서열의 72번째 아미노산 잔기에 상응하는 아미노산이 류신, 글리신, 프롤린, 알라닌, 발린 또는 메티오닌으로 치환되거나,
(2) 서열번호 43의 아미노산 서열의 124번째 잔기에 상응하는 아미노산이 발린, 글리신, 프롤린, 알라닌, 류신 또는 메티오닌으로 치환되거나, 또는,
(3) 상기 (1) 및 (2)가 모두 치환된, 단백질. - 제1항에 있어서, 상기 단백질은 서열번호 56의 아미노산 서열과 99% 이상의 서열 상동성을 가지는 것인, 단백질.
- 제1항 내지 제3항 중 어느 한 항의 단백질을 암호화하는 폴리뉴클레오타이드.
- 제1항 내지 제3항 중 어느 한 항의 단백질 또는 상기 단백질을 암호화하는 폴리뉴클레오타이드를 포함하는, 미생물.
- 제5항에 있어서, 상기 미생물은 L-히스티딘 생산능을 갖는 것인, 미생물.
- 제5항에 있어서, 상기 미생물은 코리네박테리움 속 또는 에스케리키아 속인, 미생물.
- 제7항에 있어서, 상기 미생물은 코리네박테리움 글루타미쿰 또는 에스케리키아 콜라이인, 미생물.
- 제1항 내지 제3항 중 어느 한 항의 단백질,
상기 단백질을 암호화하는 폴리뉴클레오타이드, 또는
상기 폴리뉴클레오타이드를 포함하는 재조합 미생물을 포함하는, L-히스티딘 생산용 조성물. - 제1항 내지 제3항 중 어느 한 항의 단백질 또는 상기 단백질을 암호화하는 폴리뉴클레오타이드를 포함하는 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산 방법.
- 제10항에 있어서, 상기 배양하는 단계 이후에, 배양된 미생물 또는 배지로부터 L-히스티딘을 회수하는 단계를 추가로 포함하는, L-히스티딘 생산 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220076773A KR20240000169A (ko) | 2022-06-23 | 2022-06-23 | L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 |
PCT/KR2023/008656 WO2023249421A1 (ko) | 2022-06-23 | 2023-06-22 | L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220076773A KR20240000169A (ko) | 2022-06-23 | 2022-06-23 | L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240000169A true KR20240000169A (ko) | 2024-01-02 |
Family
ID=89380270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220076773A KR20240000169A (ko) | 2022-06-23 | 2022-06-23 | L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20240000169A (ko) |
WO (1) | WO2023249421A1 (ko) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2331956T3 (es) * | 2004-01-30 | 2010-01-21 | Ajinomoto Co., Inc. | Microorganismo que produce l-aminoacidos y procedimiento para producir l-aminoacidos. |
KR101968317B1 (ko) * | 2018-02-23 | 2019-04-11 | 씨제이제일제당 주식회사 | 신규 l-트립토판 배출 단백질 및 이를 이용한 l-트립토판을 생산하는 방법 |
KR102204917B1 (ko) * | 2019-04-22 | 2021-01-20 | 씨제이제일제당 주식회사 | L-히스티딘 생산능이 강화된 미생물 및 이를 이용한 히스티딘 생산방법 |
KR102221040B1 (ko) * | 2019-05-09 | 2021-03-03 | 씨제이제일제당 주식회사 | L-아미노산을 생산하는 미생물 및 이를 이용한 l-아미노산을 생산하는 방법 |
KR102183209B1 (ko) * | 2019-09-09 | 2020-11-26 | 씨제이제일제당 주식회사 | L-쓰레오닌 배출 단백질의 변이체 및 이를 이용한 l-쓰레오닌 생산 방법 |
KR102617168B1 (ko) * | 2020-12-09 | 2023-12-21 | 씨제이제일제당 (주) | 쉬와넬라 오네이덴시스 유래 단백질을 발현하는 미생물, 및 이를 이용한 l-아미노산 생산 방법 |
-
2022
- 2022-06-23 KR KR1020220076773A patent/KR20240000169A/ko unknown
-
2023
- 2023-06-22 WO PCT/KR2023/008656 patent/WO2023249421A1/ko unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023249421A1 (ko) | 2023-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11066687B2 (en) | 5′-inosinic acid dehydrogenase and method of preparing 5′-inosinic acid using the same | |
KR102028554B1 (ko) | 신규한 프로모터 및 이를 이용한 l-아미노산 생산 방법 | |
JP2021510298A (ja) | クエン酸シンターゼの活性が弱化された変異型ポリペプチド及びそれを用いたl−アミノ酸生産方法 | |
EP3272860B1 (en) | Pyruvate dehydrogenase mutant, microorganism comprising mutant, and method for producing l-amino acid by using microorganism | |
KR20220081824A (ko) | 쉬와넬라 오네이덴시스 유래 단백질을 발현하는 미생물, 및 이를 이용한 l-아미노산 생산 방법 | |
KR102589135B1 (ko) | 3-메틸-2-옥소뷰타노에이트 하이드록시 메틸트랜스퍼라아제의 활성이 강화된 미생물, 및 이의 용도 | |
KR102527895B1 (ko) | GlxR 단백질 변이체 또는 이를 이용한 쓰레오닌 생산방법 | |
KR102134375B1 (ko) | 사이토크롬 c 활성이 강화된 l-라이신 생산 미생물 및 이를 이용한 l-라이신 생산방법 | |
CN115500080A (zh) | 新型双功能亚甲基四氢叶酸脱氢酶/亚甲基四氢叶酸环水解酶变体及使用其生产xmp或gmp的方法 | |
KR20240000169A (ko) | L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 | |
KR20240000168A (ko) | L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 | |
KR102434925B1 (ko) | 3-메틸-2-옥소뷰타노에이트 하이드록시 메틸트랜스퍼라아제의 활성이 강화된 미생물, 및 이의 용도 | |
KR101768390B1 (ko) | L-라이신 생산능이 향상된 미생물 및 이를 이용한 l-라이신 생산방법 | |
KR102673796B1 (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR101755767B1 (ko) | L-라이신 생산능이 향상된 미생물 및 이를 이용한 l-라이신 생산방법 | |
KR102668767B1 (ko) | L-라이신 생산능이 향상된 코리네박테리움 글루타미쿰 변이주 및 이를 이용한 l-라이신의 생산 방법 | |
KR102314882B1 (ko) | 신규한 막단백질 TerC 변이체 및 이를 이용한 L-라이신 생산 방법 | |
KR20230149787A (ko) | L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법 | |
KR102281371B1 (ko) | 신규한 글리세르알데히드-3-인산탈수소효소 변이체 및 이를 이용한 l-발린 생산 방법 | |
KR102527102B1 (ko) | 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 | |
JP2024014656A (ja) | L-アルギニンまたはl-シトルリン生産能が向上したコリネバクテリウム属微生物およびこれを用いたl-アルギニンまたはl-シトルリンの生産方法 | |
CN115851802A (zh) | 谷氨酸高产菌株的构建方法及其在谷氨酸生产中的应用 | |
KR20230045990A (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR20230053351A (ko) | L-라이신 생산능이 향상된 코리네박테리움 글루타미쿰 변이주 및 이를 이용한 l-라이신의 생산 방법 | |
KR20230136447A (ko) | 거짓쌀도둑거저리 유래 아스파테이트 1-디카복실레이스의 변이체 및 이를 포함하는 미생물 |