KR20220034218A - 대장균 기반 재조합 균주 및 이의 구축 방법과 응용 - Google Patents
대장균 기반 재조합 균주 및 이의 구축 방법과 응용 Download PDFInfo
- Publication number
- KR20220034218A KR20220034218A KR1020227005071A KR20227005071A KR20220034218A KR 20220034218 A KR20220034218 A KR 20220034218A KR 1020227005071 A KR1020227005071 A KR 1020227005071A KR 20227005071 A KR20227005071 A KR 20227005071A KR 20220034218 A KR20220034218 A KR 20220034218A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- seq
- ile
- arg
- Prior art date
Links
- 241000588724 Escherichia coli Species 0.000 title claims abstract description 54
- 238000010276 construction Methods 0.000 title description 40
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims abstract description 84
- 230000035772 mutation Effects 0.000 claims abstract description 56
- 239000004473 Threonine Substances 0.000 claims abstract description 47
- 229960002898 threonine Drugs 0.000 claims abstract description 47
- 101150078007 mntP gene Proteins 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 30
- 101150080180 kdtA gene Proteins 0.000 claims abstract description 24
- 101150076547 spoT gene Proteins 0.000 claims abstract description 23
- 239000002773 nucleotide Substances 0.000 claims description 73
- 125000003729 nucleotide group Chemical group 0.000 claims description 73
- 239000013612 plasmid Substances 0.000 claims description 50
- 108091026890 Coding region Proteins 0.000 claims description 36
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 22
- 238000004519 manufacturing process Methods 0.000 claims description 22
- 150000001413 amino acids Chemical group 0.000 claims description 19
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 16
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 16
- 238000000855 fermentation Methods 0.000 claims description 15
- 230000004151 fermentation Effects 0.000 claims description 15
- 108090000623 proteins and genes Proteins 0.000 claims description 13
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 8
- 229930024421 Adenine Natural products 0.000 claims description 7
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 7
- 229960000643 adenine Drugs 0.000 claims description 7
- 229940113082 thymine Drugs 0.000 claims description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 3
- 238000002741 site-directed mutagenesis Methods 0.000 abstract 1
- 239000012634 fragment Substances 0.000 description 69
- 108020004414 DNA Proteins 0.000 description 48
- 239000007787 solid Substances 0.000 description 21
- 238000012408 PCR amplification Methods 0.000 description 19
- 238000000246 agarose gel electrophoresis Methods 0.000 description 18
- 101100234243 Aquifex aeolicus (strain VF5) kdtA gene Proteins 0.000 description 17
- 101150040194 waaA gene Proteins 0.000 description 17
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 15
- 229960005091 chloramphenicol Drugs 0.000 description 15
- 239000007788 liquid Substances 0.000 description 15
- 241001646716 Escherichia coli K-12 Species 0.000 description 14
- 238000012163 sequencing technique Methods 0.000 description 14
- 238000000137 annealing Methods 0.000 description 12
- 238000001962 electrophoresis Methods 0.000 description 12
- PAWALTXRSMCTAC-ODTHDHSBSA-N (2S)-2-[[(2R)-2-[[(2S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]propanoyl]amino]-3-hydroxypropanoyl]amino]-3-sulfanylpropanoyl]amino]-3-sulfanylpropanoyl]amino]-4-methylpentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-sulfanylpropanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-sulfanylpropanoyl]amino]-3-(1H-imidazol-5-yl)propanoic acid Chemical compound CC(C)C[C@H](NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CO)NC(=O)[C@H](C)NC(=O)CNC(=O)CN)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1c[nH]cn1)C(O)=O PAWALTXRSMCTAC-ODTHDHSBSA-N 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- 108700028369 Alleles Proteins 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- 238000004925 denaturation Methods 0.000 description 9
- 230000036425 denaturation Effects 0.000 description 9
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 9
- 238000002703 mutagenesis Methods 0.000 description 9
- 231100000350 mutagenesis Toxicity 0.000 description 9
- 108700026244 Open Reading Frames Proteins 0.000 description 8
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 239000000203 mixture Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 239000004471 Glycine Substances 0.000 description 6
- 241000880493 Leptailurus serval Species 0.000 description 6
- 238000012220 PCR site-directed mutagenesis Methods 0.000 description 6
- 108010044940 alanylglutamine Proteins 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 238000002744 homologous recombination Methods 0.000 description 6
- 230000006801 homologous recombination Effects 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 239000013641 positive control Substances 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 4
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 4
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 4
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 4
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 4
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 4
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 4
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010053037 kyotorphin Proteins 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- 101150063416 add gene Proteins 0.000 description 3
- 239000000853 adhesive Substances 0.000 description 3
- 230000001070 adhesive effect Effects 0.000 description 3
- 229940024606 amino acid Drugs 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000009629 microbiological culture Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 235000018102 proteins Nutrition 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 2
- 108010044087 AS-I toxin Proteins 0.000 description 2
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 2
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 2
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 2
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 2
- GRIFPSOFWFIICX-GOPGUHFVSA-N Ala-His-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GRIFPSOFWFIICX-GOPGUHFVSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- RGDKRCPIFODMHK-HJWJTTGWSA-N Ala-Leu-Leu-His Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RGDKRCPIFODMHK-HJWJTTGWSA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 2
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 2
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 2
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 2
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 2
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 2
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 2
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 2
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 2
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 2
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 2
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 2
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 2
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 2
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 2
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 2
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 2
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 2
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 2
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 2
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 2
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 2
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 2
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 2
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 2
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 2
- PRVVCRZLTJNPCS-FXQIFTODSA-N Cys-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N PRVVCRZLTJNPCS-FXQIFTODSA-N 0.000 description 2
- XGIAHEUULGOZHH-GUBZILKMSA-N Cys-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N XGIAHEUULGOZHH-GUBZILKMSA-N 0.000 description 2
- LDIKUWLAMDFHPU-FXQIFTODSA-N Cys-Cys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LDIKUWLAMDFHPU-FXQIFTODSA-N 0.000 description 2
- MJOYUXLETJMQGG-IHRRRGAJSA-N Cys-Tyr-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJOYUXLETJMQGG-IHRRRGAJSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 2
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 2
- SSWAFVQFQWOJIJ-XIRDDKMYSA-N Gln-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N SSWAFVQFQWOJIJ-XIRDDKMYSA-N 0.000 description 2
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 2
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 2
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 2
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 2
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 2
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 2
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 2
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 2
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 2
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 2
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 2
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 2
- JJSVALISDCNFCU-SZMVWBNQSA-N Glu-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JJSVALISDCNFCU-SZMVWBNQSA-N 0.000 description 2
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 2
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 2
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 2
- RUDRIZRGOLQSMX-IUCAKERBSA-N Gly-Met-Met Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O RUDRIZRGOLQSMX-IUCAKERBSA-N 0.000 description 2
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 2
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 2
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 2
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 2
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 2
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 2
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 2
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 2
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 2
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 2
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 2
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 2
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 2
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 2
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 2
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 2
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 2
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 2
- XVUAQNRNFMVWBR-BLMTYFJBSA-N Ile-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N XVUAQNRNFMVWBR-BLMTYFJBSA-N 0.000 description 2
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 2
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 2
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 2
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 2
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 2
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 2
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 2
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 2
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 2
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 2
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 2
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 2
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 2
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 2
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 2
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 2
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 2
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 2
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 2
- RVYDCISQIGHAFC-ZPFDUUQYSA-N Met-Ile-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O RVYDCISQIGHAFC-ZPFDUUQYSA-N 0.000 description 2
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 2
- FTQOFRPGLYXRFM-CYDGBPFRSA-N Met-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCSC)N FTQOFRPGLYXRFM-CYDGBPFRSA-N 0.000 description 2
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 2
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 2
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 2
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 2
- OXUMFAOVGFODPN-KKUMJFAQSA-N Phe-Asn-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OXUMFAOVGFODPN-KKUMJFAQSA-N 0.000 description 2
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 2
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 2
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 2
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 2
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- SZYBZVANEAOIPE-UBHSHLNASA-N Phe-Met-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SZYBZVANEAOIPE-UBHSHLNASA-N 0.000 description 2
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 2
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 2
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 2
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- VUSAEKOXGNEYNE-PBCZWWQYSA-N Thr-His-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VUSAEKOXGNEYNE-PBCZWWQYSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 2
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 2
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 2
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 2
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 2
- XKGZEDNYGPNJAR-XIRDDKMYSA-N Trp-Asn-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N XKGZEDNYGPNJAR-XIRDDKMYSA-N 0.000 description 2
- IJRXQJVGFBSKIV-ZFWWWQNUSA-N Trp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N IJRXQJVGFBSKIV-ZFWWWQNUSA-N 0.000 description 2
- YYXIWHBHTARPOG-HJXMPXNTSA-N Trp-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YYXIWHBHTARPOG-HJXMPXNTSA-N 0.000 description 2
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 2
- MPYZGXUYLNPSNF-NAZCDGGXSA-N Trp-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O MPYZGXUYLNPSNF-NAZCDGGXSA-N 0.000 description 2
- WDIJBEWLXLQQKD-ULQDDVLXSA-N Tyr-Arg-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O WDIJBEWLXLQQKD-ULQDDVLXSA-N 0.000 description 2
- FFCRCJZJARTYCG-KKUMJFAQSA-N Tyr-Cys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O FFCRCJZJARTYCG-KKUMJFAQSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 2
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 2
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 2
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- WOCYUGQDXPTQPY-FXQIFTODSA-N Val-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N WOCYUGQDXPTQPY-FXQIFTODSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- VDPRBUOZLIFUIM-GUBZILKMSA-N Val-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N VDPRBUOZLIFUIM-GUBZILKMSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 2
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 2
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 2
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- PPTAQBNUFKTJKA-BJDJZHNGSA-N Leu-Cys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PPTAQBNUFKTJKA-BJDJZHNGSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 1
- FDGAMQVRGORBDV-GUBZILKMSA-N Met-Ser-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCSC FDGAMQVRGORBDV-GUBZILKMSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 239000003194 amino acid receptor blocking agent Substances 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 102200037435 rs121908539 Human genes 0.000 description 1
- 102200067131 rs75321043 Human genes 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1081—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1235—Diphosphotransferases (2.7.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/08—Lysine; Diaminopimelic acid; Threonine; Valine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/99—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
- C12Y204/99012—Lipid IVA 3-deoxy-D-manno-octulosonic acid transferase (2.4.99.12)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/06—Diphosphotransferases (2.7.6)
- C12Y207/06005—GTP diphosphokinase (2.7.6.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/07—Diphosphoric monoester hydrolases (3.1.7)
- C12Y301/07002—Guanosine-3',5'-bis(diphosphate) 3'-diphosphatase (3.1.7.2)
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
대장균 균주 K12 또는 이의 유도체 균주를 기반으로 부위 특이적 돌연변이 후의 재조합 균주 및 이의 구축 방법과 응용을 제공한다. 상기 재조합 균주는 kdtA 유전자, spoT 유전자 또는 yebN 유전자에 대해 부위 특이적 돌연변이를 거친 것이며, 돌연변이되지 않은 야생형 균주에 비해 더 높은 농도의 L-트레오닌을 생산할 수 있다.
Description
관련 출원의 상호 참조
본 발명은 2019년 09월 27일 중국 국가지식재산권국에 제출한 특허 출원 번호가 2019109262958인 선행 출원의 우선권, 2019년 08월 28일 중국 국가지식재산권국에 제출한 특허 출원 번호가 2019108046792인 선행 출원의 우선권, 및 2019년 08월 28일 중국 국가지식재산권국에 제출한 특허 출원 번호가 2019108046881인 선행 출원의 우선권을 주장하는 바, 상기 선행 출원의 전문은 참조로서 본 발명에 인용된다.
본 발명은 유전자 공학 및 미생물 기술 분야에 속하며, 구체적으로 kdtA 유전자에 의해 변형된 재조합 균주 및 이의 구축 방법과 응용에 관한 것이다.
L-트레오닌은 8가지 필수 아미노산 중 하나로, 인간과 동물이 스스로 합성할 수 없는 아미노산이다. L-트레오닌은 곡물의 흡수를 강화하고 체내 대사 균형을 조절하며 신체의 성장과 발달을 촉진할 수 있고, 사료, 의약 및 식품 산업에 널리 사용된다.
현재, L-트레오닌의 생산은 주로 화학적 합성법, 단백질 가수분해법 및 미생물 발효법이 있으며, 여기서 미생물 발효법은 생산 비용이 낮고 생산 강도가 높으며 환경 오염이 적기 때문에, 현재 L-트레오닌의 공업적 생산에 가장 널리 사용되는 방법이다. 다양한 박테리아가 L-트레오닌의 미생물 발효 생산에 사용될 수 있는데, 예를 들어 대장균, 코리네박테리움(Corynebacterium), 세라티아(Serratia) 등 야생형 유도에 의해 획득된 돌연변이 균주를 생산 균주로 사용할 수 있다. 구체적인 구현예로는 항 아미노산 유사체 돌연변이 균주 또는 메티오닌(methionine), 트레오닌(threonine), 이소류신(isoleucine)과 같은 다양한 영양 요구체를 포함한다. 그러나, 전통적인 돌연변이 육종은 랜덤 돌연변이로 인해 균주의 성장이 느리고 더 많은 부산물을 생성하여 높은 수율의 균주를 획득하기 어렵다. 따라서, 대사 공학 수단을 사용하여 재조합 대장균을 구축하는 것은 L-트레오닌을 생산하는 효과적인 경로이다. 현재, 발현 플라스미드에 의해 매개되는 아미노산 합성 경로 및 경쟁 경로에서 핵심적 효소 유전자의 과발현 또는 약화를 이용하는 것은 대장균의 유전자 변형을 위한 주요 수단이다. 그러나, 고수율로 L-트레오닌을 보다 경제적으로 생산하기 위한 방법의 개발이 여전히 필요하다.
대장균은 외인성 유전자 발현의 숙주로서, 유전적 배경이 명확하고 기술 조작과 배양 조건이 간단하며 대규모 발효가 경제적이고 유전공학 전문가들의 높은 평가를 받고 있다. 대장균의 게놈 DNA는 핵양체 중의 고리형 분자로, 동시에 다수의 고리형 플라스미드 DNA가 있을 수 있다. 대장균 세포의 핵양체에는 1개의 DNA 분자가 있고, 길이는 약 4700000개의 염기쌍이며, DNA 분자에는 약 4400개의 유전자가 분포되어 있고, 각 유전자의 평균 길이는 약 1000개의 염기쌍이다. 분자생물학에서 일반적으로 사용되는 대장균 균주는 소수 예를 제외하고 DNA 재조합 실험에 사용되는 대부분 균주는 대장균 균주 K12 및 이의 유도체이다.
본 발명은 대장균 균주 K12 또는 이의 유도체 기반의 재조합 균주, 이의 재조합 구축 방법 및 아미노산의 발효 및 생산에서의 응용을 제공한다.
본 발명은 E.coli K12 균주 및 이의 유도체 균주(예를 들면 MG1655, W3110 등) 중의 야생형 kdtA 유전자(ORF 서열은 Genbank 수탁 번호 CP032667.1 중의 서열 73556-74833으로 표시된 바와 같음), 야생형 spoT 유전자(ORF 서열은 Genbank 수탁 번호 AP009048.1 중의 서열3815907-3818015로 표시된 바와 같음), 및 야생형 yebN 유전자(ORF 서열은 Genbank 수탁 번호 AP009048.1 중의 서열1907402-1907968로 표시된 바와 같음)에 착안하여, 상기 유전자의 부위 특이적 돌연변이 후 획득된 돌연변이 유전자 및 상기 유전자를 포함하는 재조합 균주가 L-트레오닌의 생산에 사용될 수 있고, 획득된 균주가 돌연변이되지 않은 야생형 균주에 비해 L-트레오닌의 수율을 크게 증가시킬 수 있으며, 균주의 안정성이 우수하여 L-트레오닌 생산 균주로서 생산 비용을 절감할 수 있다는 것을 발견하였다.
상기 발명을 기반으로, 본 발명은 아래와 같은 세 부분의 기술적 해결수단을 제공한다.
제1 부분은 뉴클레오티드 서열로, 상기 뉴클레오티드 서열은 서열번호 1로 표시되는 야생형 kdtA 유전자 코딩 서열 82번째 염기의 돌연변이에 의해 형성된 서열을 포함한다.
본 발명에 따르면, 상기 돌연변이는 해당 부위의 염기/뉴클레오티드의 변화를 의미하고, 상기 돌연변이 방법은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나로부터 선택될 수 있다.
본 발명에 따르면, 상기 돌연변이는 서열번호 1의 82번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이이고; 구체적으로, 상기 돌연변이된 뉴클레오티드 서열은 서열번호 2로 표시된 바와 같다.
본 발명은 또한 상기와 같은 뉴클레오티드 서열에 의해 코딩된 재조합 단백질을 제공한다.
본 발명에 따른 재조합 단백질은 서열번호 4로 표시되는 아미노산 서열을 포함한다.
본 발명은 또한 상기 뉴클레오티드 서열 또는 재조합 단백질을 포함하는 재조합 벡터를 제공한다.
본 발명에 따른 재조합 벡터는 상기 뉴클레오티드 서열을 플라스미드에 도입하여 구축된 것이고, 하나의 실시형태로서, 상기 플라스미드는 pKOV 플라스미드이다. 구체적으로, 상기 뉴클레오티드 서열 및 상기 플라스미드를 엔도뉴클레아제로 절단하여 상보적인 접착성 말단을 형성할 수 있고, 양자를 연결하여 재조합 벡터로 구축할 수 있다.
본 발명은 또한 코딩 서열에 점돌연변이가 있는 kdtA 유전자 코딩 뉴클레오티드 서열을 포함하는 재조합 균주를 제공한다.
본 발명에 따른 재조합 균주는 상기와 같은 뉴클레오티드 서열을 포함한다.
본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 2로 표시되는 뉴클레오티드 서열을 포함한다.
본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 4로 표시되는 아미노산 서열을 포함한다.
본 발명에 따른 재조합 균주는 상기 재조합 벡터를 숙주 균주에 도입하여 재조합으로 형성된 것이고; 상기 숙주 균주는 특별히 한정되지 않으며, 본 기술분야에서 공지된 kdtA 유전자를 보유하는 L-트레오닌 생산 균주로부터 선택될 수 있고, 예를 들어 대장균 중 적어도 하나로부터 선택될 수 있다. 본 발명의 일 실시형태로서, 상기 숙주 균주는 E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주이다.
본 발명에 따른 재조합 균주는 pKOV 플라스미드를 벡터로 한다.
본 발명에 따른 재조합 균주는 다른 변형을 더 포함하거나 포함하지 않을 수 있다.
본 발명은 또한 서열번호 1로 표시되는 야생형 kdtA 유전자 코딩 영역의 뉴클레오티드 서열을 변형하여 82번째 염기를 돌연변이시켜, 돌연변이 kdtA 코딩 유전자를 포함하는 L-트레오닌 생산 재조합 균주를 획득하는 단계를 포함하는 재조합 균주의 구축 방법을 제공한다.
본 발명에 따른 구축 방법에서, 상기 변형은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나를 포함한다.
본 발명에 따른 구축 방법에서, 상기 돌연변이는 서열번호 1의 82번째 구아닌(G)이 아데닌(A)으로 돌연변이된 것을 의미하고; 구체적으로, 상기 돌연변이된 뉴클레오티드 서열은 서열번호 2로 표시된 바와 같다.
또한, 상기 구축 방법은,
(1) 서열번호 1로 표시되는 야생형 kdtA 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 변형하여 82번째 염기를 돌연변이시켜, 돌연변이된 kdtA 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 획득하는 단계;
(2) 상기 돌연변이된 뉴클레오티드 서열과 플라스미드를 연결하여 재조합 벡터를 구축하는 단계; 및
(3) 상기 재조합 벡터를 숙주 균주에 도입하여 점돌연변이를 포함하는 상기 L-트레오닌 생산 재조합 균주를 획득하는 단계를 포함한다.
본 발명에 따른 구축 방법에서, 상기 단계 (1)은, 점돌연변이된 kdtA 유전자 코딩 영역의 구축, 즉 kdtA 유전자 코딩 서열에 따라 kdtA 유전자 코딩 영역 단편을 증폭하는 2쌍의 프라이머를 합성하고, PCR 부위 특이적 돌연변이 방법을 통해 야생형 kdtA 유전자 코딩 영역(서열번호 1)에 점돌연변이를 도입하여, 점돌연변이된 kdtA 유전자 코딩 영역 뉴클레오티드 서열(서열번호 2)을 획득하며, kdtA (G82A)로 기록하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 단계 (1)에서 상기 프라이머는 하기와 같다.
P1: 5' CGGGATCCACCAGTGAACCGCCAACA 3'(서열번호 5)
P2: 5' TGCGCGGACGTAAGACTC 3'(서열번호 6)
P3: 5' GAGTCTTACGTCCGCGCA 3'(서열번호 7)
P4: 5' AAGGAAAAAAGCGGCCGCTTCCCGCACCTTTATTG 3'(서열번호 8)
본 발명의 일 실시형태에서, 상기 단계 (1)은, E.coli K12를 주형으로 하고, 각각 프라이머 P1/P2 및 P3/P4로 PCR 증폭을 수행하여, kdtA 유전자 코딩 영역을 포함하는 927 bp 및 695 bp 크기의 DNA 단편(kdtA Up 및 kdtA Down) 2개를 획득하는 단계; 및 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 상기 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, 오버랩 PCR(Overlap PCR) 증폭을 통해 kdtAG82A-Up-Down을 획득하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 kdtAG82A-Up-Down 뉴클레오티드 서열의 크기는 1622 bp이다.
본 발명의 일 실시형태에서, 상기 PCR 증폭은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행된다.
본 발명의 일 실시형태에서, 상기 오버랩 PCR 증폭은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행된다.
본 발명에 따른 구축 방법에서, 상기 단계 (2)는, 재조합 벡터의 구축, 즉 상기 kdtA (G82A)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드를 각각 BamH I/Not I로 이중 절단하고, 절단된 kdtA (G82A)-Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 재조합 벡터 pKOⅤ-kdtA (G82A)를 획득하는 단계를 포함한다.
본 발명에 따른 구축 방법에서, 상기 단계 (3)은, 재조합 균주의 구축, 즉 재조합 벡터 pKOⅤ-kdtA (G82A)를 숙주 균주로 형질전환하여 재조합 균주를 획득하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 단계 (3)의 형질전환은 전기 형질전환 방법이고; 예시적으로, 상기 단계 (3)에서 재조합 벡터를 상기 숙주 균주로 형질전환하는 것이다.
본 발명에 따른 구축 방법에서, 또한 재조합 균주를 스크리닝하는 단계를 더 포함하고; 예시적으로, 클로람페니콜(Chloramphenicol) 배지를 사용하여 스크리닝한다.
본 발명은 또한 상기와 같은 구축 방법에 의해 획득된 재조합 균주를 제공한다.
본 발명은 또한 L-트레오닌의 제조 또는 L-트레오닌의 발효량 증가에서 상기 재조합 균주의 응용을 제공한다.
L-트레오닌의 제조에서 본 발명에 따른 재조합 균주의 응용은 상기 재조합 균주로 발효하여 L-트레오닌을 제조 및 획득하는 것을 포함한다.
제2 부분에서, 본 발명은 뉴클레오티드 서열을 제공하고, 상기 뉴클레오티드 서열은 서열번호 13으로 표시되는 spoT 유전자 코딩 서열 520번째 염기의 돌연변이에 의해 형성된 서열을 포함한다.
본 발명에 따르면, 상기 돌연변이는 해당 부위의 염기/뉴클레오티드의 변화를 의미하고, 상기 돌연변이 방법은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나로부터 선택될 수 있다.
본 발명에 따르면, 상기 돌연변이는 서열번호 13의 520번째 염기가 구아닌(G)에서 티민(T)으로의 돌연변이이고; 구체적으로, 상기 돌연변이된 뉴클레오티드 서열은 서열번호 14로 표시된 바와 같다.
본 발명은 상기와 같은 뉴클레오티드 서열에 의해 코딩된 재조합 단백질을 제공한다.
본 발명에 따른 재조합 단백질은 서열번호 16으로 표시되는 아미노산 서열을 포함하고; 구체적으로, 상기 재조합 단백질은 서열번호 15로 표시되는 아미노산 서열의 174번째 글리신이 시스테인으로 치환된 것을 포함한다.
본 발명은 상기 뉴클레오티드 서열 또는 재조합 단백질을 포함하는 재조합 벡터를 제공한다.
본 발명에 따른 재조합 벡터는 상기 뉴클레오티드 서열을 플라스미드에 도입하여 구축된 것이고, 하나의 실시형태로서, 상기 플라스미드는 pKOV 플라스미드이다. 구체적으로, 상기 뉴클레오티드 서열 및 상기 플라스미드를 엔도뉴클레아제로 절단하여 상보적인 접착성 말단을 형성할 수 있고, 양자를 연결하여 재조합 벡터로 구축할 수 있다.
본 발명은 또한 코딩 서열에 점돌연변이가 있는 spoT 유전자 코딩 뉴클레오티드 서열을 포함하는 재조합 균주를 제공하고, 예를 들어 서열번호 13으로 표시되는 spoT 유전자 코딩 뉴클레오티드 서열 520번째 염기에는 점돌연변이가 존재한다.
본 발명에 따른 재조합 균주에서, 상기 서열번호 13의 520번째 염기는 구아닌(G)에서 티민(T)으로 돌연변이된다.
본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 14로 표시되는 뉴클레오티드 서열을 포함한다.
본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 16으로 표시되는 아미노산 서열을 포함한다.
본 발명에 따른 재조합 균주는 상기 재조합 벡터를 숙주 균주에 도입하여 재조합으로 형성된 것이고; 상기 숙주 균주는 특별히 한정되지 않으며, 본 기술분야에서 공지된 spoT 유전자를 보유하는 L-트레오닌 생산 균주로부터 선택될 수 있고, 예를 들어 대장균으로부터 선택될 수 있다. 본 발명의 일 실시형태로서, 상기 숙주 균주는 E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주이다.
본 발명에 따른 재조합 균주는 pKOV 플라스미드를 벡터로 한다.
본 발명에 따른 재조합 균주는 다른 변형을 더 포함하거나 포함하지 않을 수 있다.
본 발명은 서열번호 13으로 표시되는 spoT 유전자 코딩 영역의 뉴클레오티드 서열을 변형하여 520번째 염기를 돌연변이시켜, 돌연변이 spoT 코딩 유전자를 포함하는 재조합 균주를 획득하는 단계를 포함하는 재조합 균주의 구축 방법을 제공한다.
본 발명에 따른 구축 방법에서, 상기 변형은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나를 포함한다.
본 발명에 따른 구축 방법에서, 상기 돌연변이는 서열번호 13의 520번째 염기가 구아닌(G)에서 티민(T)으로의 돌연변이인 것을 의미하고; 구체적으로, 돌연변이된 뉴클레오티드 서열은 서열번호 14로 표시된 바와 같다.
또한, 상기 구축 방법은,
(1) 서열번호 13으로 표시되는 야생형 spoT 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 변형하여 520번째 염기를 돌연변이시켜, 돌연변이된 뉴클레오티드 서열을 획득하는 단계;
(2) 상기 돌연변이된 뉴클레오티드 서열과 플라스미드를 연결하여 재조합 벡터를 구축하는 단계; 및
(3) 상기 재조합 벡터를 숙주 균주에 도입하여 점돌연변이를 포함하는 상기 재조합 균주를 획득하는 단계를 포함한다.
본 발명에 따른 구축 방법에서, 상기 단계 (1)은, 점돌연변이된 spoT 유전자 코딩 영역의 구축, 즉 spoT 유전자 코딩 서열에 따라 spoT 유전자 코딩 영역 단편을 증폭하는 2쌍의 프라이머를 합성하고, PCR 부위 특이적 돌연변이 방법을 통해 야생형 spoT 유전자 코딩 영역(서열번호 13)에 점돌연변이를 도입하여, 점돌연변이된 spoT 유전자 코딩 영역 뉴클레오티드 서열(서열번호 14)을 획득하며, spoT (G520T)로 기록하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 단계 (1)에서 상기 프라이머는 하기와 같다.
P1: 5' CGGGATCCGAACAGCAAGAGCAGGAAGC 3'(서열번호 17)
P2: 5' TGTGGTGGATACATAAACG 3'(서열번호 18)
P3: 5' GCACCGTTTATGTATCCACC 3'(서열번호 19)
P4: 5' AAGGAAAAAAGCGGCCGCACGACAAAGTTCAGCCAAGC 3'(서열번호 20)
본 발명의 일 실시형태에서, 상기 단계 (1)은, E.coli K12를 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이된 spoT 유전자 코딩 영역을 포함하는 620 bp 및 880 bp 크기의 DNA 단편(spoT (G520T)-Up 및 spoT (G520T)-Down 단편) 2개를 획득하는 단계; 및 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 상기 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, 오버랩 PCR(Overlap PCR) 증폭을 통해 spoT (G520T)-Up-Down 단편을 획득하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 spoT (G520T)-Up-Down 단편 뉴클레오티드 서열의 크기는 1500 bp이다.
본 발명의 일 실시형태에서, 상기 PCR 증폭은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행된다.
본 발명의 일 실시형태에서, 상기 오버랩 PCR 증폭은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행된다.
본 발명에 따른 구축 방법에서, 상기 단계 (2)는, 재조합 벡터의 구축, 즉 상기 spoT (G520T)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드를 각각 BamH I/Not I로 이중 절단하고, 절단된 spoT (G520T) -Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 재조합 벡터 pKOV-spoT (G520T)를 획득하는 단계를 포함한다.
본 발명에 따른 구축 방법에서, 상기 단계 (3)은, 재조합 균주의 구축, 즉 재조합 벡터 pKOV-spoT (G520T)를 숙주 균주에 도입하여 재조합 균주를 획득하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 단계 (3)의 도입은 전기 형질전환 방법이다.
본 발명에 따른 구축 방법에서, 또한 재조합 균주를 스크리닝하는 단계를 더 포함하고; 예시적으로, 클로람페니콜 함유 배지를 사용하여 스크리닝한다.
본 발명은 또한 상기와 같은 구축 방법에 의해 획득된 재조합 균주를 제공한다.
본 발명은 L-트레오닌의 제조에서 상기와 같은 재조합 균주의 응용을 제공한다.
L-트레오닌의 제조에서 본 발명에 따른 뉴클레오티드 서열, 재조합 단백질, 재조합 벡터, 재조합 균주의 응용은 상기 재조합 균주로 발효하여 L-트레오닌을 제조 및 획득하는 것을 포함한다.
제3 부분에서, 본 발명은 서열번호 23으로 표시되는 야생형 yebN 유전자 코딩 서열 74번째 염기의 돌연변이에 의해 형성된 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열을 제공한다.
본 발명에 따르면, 상기 돌연변이는 서열번호 23의 74번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이이고; 구체적으로, 상기 뉴클레오티드 서열은 서열번호 24로 표시된 바와 같다. 상기 돌연변이는 해당 부위의 염기/뉴클레오티드의 변화를 의미하고, 상기 돌연변이 방법은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나로부터 선택될 수 있다.
본 발명은 상기와 같은 뉴클레오티드 서열에 의해 코딩된 재조합 단백질을 제공한다.
본 발명에 따른 재조합 단백질은 서열번호 26으로 표시되는 아미노산 서열을 포함하고; 구체적으로, 상기 재조합 단백질은 서열번호 25로 표시되는 아미노산 서열의 25번째 글리신이 아스파르트산으로 치환된 것을 포함한다.
본 발명은 상기 뉴클레오티드 서열 또는 재조합 단백질을 포함하는 재조합 벡터를 제공한다.
본 발명에 따른 재조합 벡터는 상기 뉴클레오티드 서열을 플라스미드에 도입하여 구축된 것이고, 하나의 실시형태로서, 상기 플라스미드는 pKOV 플라스미드이다. 구체적으로, 상기 뉴클레오티드 서열 및 상기 플라스미드를 엔도뉴클레아제로 절단하여 상보적인 접착성 말단을 형성할 수 있고, 양자를 연결하여 재조합 벡터로 구축할 수 있다.
본 발명은 또한 코딩 서열에 점돌연변이가 있는 yebN 유전자 코딩 뉴클레오티드 서열을 포함하는 재조합 균주를 제공하고, 예를 들어 서열번호 23의 74번째 염기에는 점돌연변이가 존재한다.
본 발명에 따른 재조합 균주에서, 상기 yebN 유전자 코딩 뉴클레오티드 서열은 서열번호 23의 74번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이를 포함한다.
본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 24로 표시되는 뉴클레오티드 서열을 포함한다.
본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 26으로 표시되는 아미노산 서열을 포함한다.
본 발명에 따른 재조합 균주는 상기 재조합 벡터를 숙주 균주에 도입하여 재조합으로 형성된 것이고; 상기 숙주 균주는 특별히 한정되지 않으며, 본 기술분야에서 공지된 yebN 유전자를 보유하는 L-트레오닌 생산 균주로부터 선택될 수 있고, 예를 들어 대장균으로부터 선택될 수 있다. 본 발명의 일 실시형태로서, 상기 숙주 균주는 E.coli K12, 이의 유도체 균주 E.coli K12(W3110) 균주 또는 E.coli CGMCC 7.232 균주이다.
본 발명에 따른 재조합 균주는 pKOV 플라스미드를 벡터로 한다.
본 발명에 따른 재조합 균주는 다른 변형을 더 포함하거나 포함하지 않을 수 있다.
본 발명은 서열번호 23으로 표시되는 야생형 yebN 유전자 코딩 영역의 뉴클레오티드 서열을 변형하여 74번째 염기를 돌연변이시켜, 돌연변이 yebN 코딩 유전자를 포함하는 재조합 균주를 획득하는 단계를 포함하는 재조합 균주의 구축 방법을 제공한다.
본 발명에 따른 구축 방법에서, 상기 변형은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나를 포함한다.
본 발명에 따른 구축 방법에서, 상기 돌연변이는 서열번호 23의 74번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이인 것을 의미하고; 구체적으로, 상기 돌연변이된 뉴클레오티드 서열은 서열번호 14로 표시된 바와 같다.
또한, 상기 구축 방법은,
(1) 서열번호 23으로 표시되는 야생형 yebN 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 변형하여 74번째 염기를 돌연변이시켜, 돌연변이된 yebN 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 획득하는 단계;
(2) 상기 돌연변이된 뉴클레오티드 서열과 플라스미드를 연결하여 재조합 벡터를 구축하는 단계; 및
(3) 상기 재조합 벡터를 숙주 균주에 도입하여 점돌연변이를 포함하는 상기 재조합 균주를 획득하는 단계를 포함한다.
본 발명에 따른 구축 방법에서, 상기 단계 (1)은, 점돌연변이된 yebN 유전자 코딩 영역의 구축, 즉 yebN 유전자 코딩 서열에 따라 yebN 유전자 코딩 영역 단편을 증폭하는 2쌍의 프라이머를 합성하고, PCR 부위 특이적 돌연변이 방법을 통해 야생형 yebN 유전자 코딩 영역(서열번호 23)에 점돌연변이를 도입하여, 점돌연변이된 yebN 유전자 코딩 영역 뉴클레오티드 서열(서열번호 24)을 획득하며, yebN (G74A)으로 기록하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 단계 (1)에서 상기 프라이머는 하기와 같다.
P1: 5' CGGGATCCCTTCGCCAATGTCTGGATTG 3'(서열번호 27)
P2: 5' ATGGAGGGTGGCATCTTTAC 3'(서열번호 28)
P3: 5' TGCATCAATCGGTAAAGATG 3'(서열번호 29)
P4: 5' AAGGAAAAAAGCGGCCGCCAACTCCGCACTCTGCTGTA 3'(서열번호 30)
본 발명의 일 실시형태에서, 상기 단계 (1)은, E.coli K12를 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이된 yebN 유전자 코딩 영역을 포함하는 690 bp 및 700 bp 크기의 DNA 단편(yebN (G74A)-Up 및 yebN (G74A)-Down 단편) 2개를 획득하는 단계; 및 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 상기 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, 오버랩 PCR(Overlap PCR) 증폭을 통해 yebN (G74A)-Up-Down 단편을 획득하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 yebN (G74A)-Up-Down 단편 뉴클레오티드 서열의 크기는 1340 bp이다.
본 발명의 일 실시형태에서, 상기 PCR 증폭은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행된다.
본 발명의 일 실시형태에서, 상기 오버랩 PCR 증폭은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행된다.
본 발명에 따른 구축 방법에서, 상기 단계 (2)는, 재조합 벡터의 구축, 즉 상기 yebN (G74A)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드를 각각 BamH I/Not I로 이중 절단하고, 절단된 yebN (G74A) -Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 재조합 벡터 pKOV-yebN (G74A)을 획득하는 단계를 포함한다.
본 발명에 따른 구축 방법에서, 상기 단계 (3)은, 재조합 균주의 구축, 즉 재조합 벡터 pKOV-yebN (G74A)을 숙주 균주에 도입하여 재조합 균주를 획득하는 단계를 포함한다.
본 발명의 일 실시형태에서, 상기 단계 (3)의 도입은 전기 형질전환 방법이다.
본 발명에 따른 구축 방법에서, 또한 재조합 균주를 스크리닝하는 단계를 더 포함하고; 예시적으로, 클로람페니콜 함유 배지를 사용하여 스크리닝한다.
본 발명은 또한 상기와 같은 구축 방법에 의해 획득된 재조합 균주를 제공한다.
본 발명은 L-트레오닌의 제조에서 상기와 같은 뉴클레오티드 서열, 재조합 단백질, 재조합 벡터, 재조합 균주의 응용을 제공한다.
L-트레오닌의 제조에서 본 발명에 따른 재조합 균주의 응용은 상기 재조합 균주로 발효하여 L-트레오닌을 제조 및 획득하는 것을 포함한다.
이하, 본 발명의 실시예에 대한 설명을 통해 본 발명의 상술한 특징 및 장점 또는 다른 특징 및 장점을 보다 더 상세하게 해석하고 설명할 것이다. 이해해야 할 것은, 하기 실시예는 본 발명의 기술적 해결수단을 예시적으로 설명하기 위한 것이며, 청구범위 및 등가물에 의해 한정되는 본 발명의 보호범위를 한정하기 위한 것이 아니다.
다른 설명이 없는 한, 본문 중의 재료 및 시약은 모두 시중에 판매되고 있는 제품이거나 또는 당업자가 선행 기술에 따라 제조될 수 있는 것이다.
실시예 1
(1) kdtA 유전자 코딩 영역의 부위 특이적 돌연변이(G82A) 플라스미드 pKOⅤ-kdtA (G82A)의 구축
(야생형 코딩 단백질에 대응되는 아미노산 서열에서 서열번호 3의 28번째 알라닌은 트레오닌으로 치환(A28T), 서열번호 4로 표시된 바와 같음)
3-데옥시 D-만노스-술팜산(3-deoxy D-mannose-sulfamic acid) 전이효소는 kdtA 유전자에 의해 코딩되고, E.coli K12 균주 및 이의 유도체 균주(예를 들면, MG1655 등)에서 야생형 kdtA 유전자 ORF 서열은 Genbank 수탁 번호 CP032667.1 중 서열 73556-74833으로 표시된 바와 같다. 상기 서열에 따라 kdtA를 증폭하는 2쌍의 프라이머를 설계 및 합성하고, 출발 균주에서 kdtA 유전자 코딩 영역 서열 82번째 염기 G를 A로 변경하는 벡터를 구축하였다. 프라이머의 설계는 하기와 같다(상하이 invitrogen에서 합성).
P1: 5' CGGGATCCACCAGTGAACCGCCAACA 3'(서열번호 5)
P2: 5' TGCGCGGACGTAAGACTC 3'(서열번호 6)
P3: 5' GAGTCTTACGTCCGCGCA 3'(서열번호 7)
P4: 5' AAGGAAAAAAGCGGCCGCTTCCCGCACCTTTATTG 3'(서열번호 8)
구축 방법은 다음과 같다. 야생형 균주 E.coli K12 게놈을 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이를 포함하는 927 bp 및 695 bp 길이의 DNA 단편(kdtA (G82A)-Up 및 kdtA (G82A)-Down 단편) 2개를 획득하였다. PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 정제된 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, Overlap PCR을 통해 약 1622 bp 길이의 단편(kdtA (G82A)-Up-Down 단편)을 증폭하였다. Overlap PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 kdtA (G82A)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드(Addgene에서 구입)를 각각 BamH I/Not I로 이중 절단하고, 절단된 kdtA (G82A)-Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 벡터 pKOⅤ-kdtA (G82A)를 획득하였다. 벡터 pKOⅤ-kdtA (G82A)를 시퀀싱 회사에 보내어 시퀀싱 및 동정을 진행하였고, 시퀀싱 결과는 서열번호 11과 같으며, 정확한 점돌연변이(kdtA (G82A))를 포함하는 벡터 pKOⅤ-kdtA (G82A)를 비축하였다.
(2) 점돌연변이 유전자 kdtA (G82A)를 포함하는 조작된 균주의 구축
야생형 대장균 균주 E.coli K12(W3110) 및 L-트레오닌 생산이 높은 균주 E.coli CGMCC 7.232(China General Microbiological Culture Collection Center에 수탁)는 모두 염색체에 야생형 kdtA 유전자를 보유한다. 구축된 플라스미드 pKOⅤ-kdtA (G82A)를 E.coli K12(W3110) 및 E.coli CGMCC 7.232로 각각 형질전환시키고, 대립유전자의 치환을 통해 이 두 균주의 염색체에 있는 kdtA 유전자 서열의 82번째 염기 G를 A로 변경하였다. 구체적인 과정은 다음과 같다. 플라스미드 pKOⅤ-kdtA (G82A)를 전기천공법으로 숙주균의 컴피턴트 세포로 형질전환시킨 후 0.5 mL의 SOC 액체 배지를 첨가하고; 30℃, 100 rpm의 진탕기에서 2 h 동안 소생시키며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 mg/mL인 LB 고체 배지에 코팅하고 30℃에서 18 h 동안 배양하며; 성장한 단클론 집락을 선택하여 10 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 8 h 동안 배양하며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 mg/mL인 LB 고체 배지에 코팅하고 42℃에서 12 h 동안 배양하며; 1 ~ 5개의 단일 집락을 선택하여 1 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 4 h 동안 배양하며; 100 μL의 배양액을 취하여 10% 자당 함유 LB 고체 배지에 코팅하고 30℃에서 24 h 동안 배양하며; 단클론을 선택하고 LB 고체 배지 및 클로람페니콜 함량이 34 mg/mL인 LB 고체 배지에 일대일로 대응되게 스트리킹하며; LB 고체 배지에서 성장시키고, 동시에 클로람페니콜 함량이 34 mg/mL인 LB 고체 배지에서 성장할 수 없는 해당 균주를 PCR 증폭 및 동정하였다. PCR 증폭은 하기와 같은 프라이머(상하이 invitrogen에서 합성)를 사용하였다.
P5: 5' CTTCCCGAAAGCCGATTG 3'(서열번호 9)
P6: 5' ACAAAATATACTTTAATC 3'(서열번호 10)
상기 PCR 증폭 산물에 대해 SSCP(외가닥구조다형성, Single-Strand Conformation Polymorphism) 전기영동을 수행하고, 플라스미드 pKOⅤ-kdtA (G82A) 증폭 단편을 양성 대조군으로, 야생형 대장균 증폭 단편을 음성 대조군으로, 물을 블랭크 대조군으로 사용하였다. SSCP 전기영동에서 길이가 동일하나 서열 배열이 상이한 단쇄 올리고뉴클레오티드 사슬은 아이스 배스에서 형성된 공간 구조가 상이하고, 전기영동시 이동 속도도 차이가 있다. 따라서, 단편 전기영동 위치는 음성 대조군 단편 위치와 일치하지 않고, 양성 대조군 단편 위치와 일치한 균주는 대립유전자 대체가 성공적인 균주이다. 대립유전자 대체가 성공적인 균주를 주형으로 하고, 프라이머 P5 및 P6을 사용하여 PCR로 다시 타깃 단편을 증폭시키고 타깃 단편을 pMD19-T 벡터에 연결시켜 시퀀싱하였다. 시퀀싱 결과의 서열 비교를 통해 kdtA 유전자 코딩 영역 서열 82번째 염기 G가 A로 변경된 재조합체는 변형이 성공적인 균주이고, 시퀀싱 결과는 서열번호 12와 같다. E.coli K12(W3110)에서 유래된 재조합체를 YPThr07로 명명하고, E.coli CGMCC 7.232에서 유래된 재조합체를 YPThr08로 명명하였다.
(3) 트레오닌 발효 실험
E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주 및 돌연변이 균주 YPThr07, YPThr08을 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 12 h 동안 배양하였다. 그 다음, 각 균주의 배양물을 1 mL 취하여 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 36 h 동안 발효 배양하였다. HPLC로 L-트레오닌의 함량을 측정하고, 각 균주를 3개의 평행선으로 만들어 평균값을 계산하며, 검출 결과는 표 2와 같다.
[표 1]
[표 2]
표 2의 결과에 나타낸 바와 같이, L-트레오닌의 생산이 높거나 낮은 원시 균주에 관계없이, kdtA 유전자의 아미노산 서열 28번째 알라닌이 트레오닌으로 치환된 후 모두 L-트레오닌 수율의 향상에 도움이 된다.
실시예 2
(1) spoT 유전자 코딩 영역 부위 특이적 돌연변이(G520T)(코딩 단백질에 대응되는 아미노산 서열에서 서열번호 15의 174번째 글리신이 시스테인으로 치환(G174C), 서열번호 16)를 위한 플라스미드 pKOV-spoT (G520T)의 구축
SPOT 효소는 spoT 유전자에 의해 코딩되고, E.coli K12 균주 및 이의 유도체 균주(예를 들면, W3110 등)에서 야생형 spoT 유전자 ORF 서열은 Genbank 수탁 번호 AP009048.1 중 서열 3815907-3818015로 표시된 바와 같다. 상기 서열에 따라 spoT를 증폭하는 2쌍의 프라이머를 설계 및 합성하고, 출발 균주에서 spoT 유전자 코딩 영역 서열 520번째 염기 G를 T로 변경하는 벡터를 구축하였다. 프라이머의 설계는 하기와 같다(상하이 invitrogen에서 합성).
P1: 5' CGGGATCCGAACAGCAAGAGCAGGAAGC 3'(밑줄 친 부분은 제한효소인식부위 BamH I임)(서열번호 17)
P2: 5' TGTGGTGGATACATAAACG 3'(서열번호 18)
P3: 5' GCACCGTTTATGTATCCACC 3'(서열번호 19)
P4: 5' AAGGAAAAAAGCGGCCGCACGACAAAGTTCAGCCAAGC 3'(밑줄 친 부분은 제한효소인식부위 Not I임)(서열번호 20).
구축 방법은 다음과 같다. 야생형 균주 E.coli K12 게놈을 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이를 포함하는 620 bp 및 880 bp 길이의 DNA 단편(spoT (G520T)-Up 및 spoT (G520T)-Down 단편) 2개를 획득하였다. PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg2+(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 정제된 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, Overlap PCR을 통해 약 1500 bp 길이의 단편(spoT (G520T)-Up-Down 단편)을 증폭하였다. PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg2(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 Overlap PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 spoT (G520T)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드(Addgene에서 구입)를 각각 BamH I/Not I로 이중 절단하고, 절단된 spoT (G520T)-Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 DNA 리가아제를 통해 연결하여, 벡터 pKOV-spoT (G520T)를 획득하였다. 벡터 pKOV-spoT (G520T)를 시퀀싱 회사에 보내어 시퀀싱 및 동정을 진행하였고, 정확한 점돌연변이(spoT (G520T))를 포함하는 벡터 pKOV-spoT (G520T)를 비축하였다.
(2) 점돌연변이 유전자 spoT (G520T)를 포함하는 조작된 균주의 구축
야생형 대장균 균주 E.coli K12(W3110) 및 L-트레오닌 생산이 높은 균주 E.coli CGMCC 7.232(China General Microbiological Culture Collection Center에 수탁)는 모두 염색체에 야생형 spoT 유전자를 보유한다. 구축된 플라스미드 pKOV-spoT (G520T)를 E.coli K12(W3110) 및 E.coli CGMCC 7.232로 각각 형질전환시키고, 대립유전자의 치환을 통해 이 두 균주의 염색체에 있는 spoT 유전자 서열의 520번째 염기 G를 T로 변경하였다. 구체적인 과정은 다음과 같다. 플라스미드 pKOV-spoT (G520T)를 전기천공법으로 숙주균의 컴피턴트 세포로 형질전환시킨 후 0.5 mL의 SOC 액체 배지를 첨가하고; 30℃, 100 rpm의 진탕기에서 2 h 동안 소생시키며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 코팅하고 30℃에서 18 h 동안 배양하며; 성장한 단클론 집락을 선택하여 10 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 8 h 동안 배양하며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 코팅하고 42℃에서 12 h 동안 배양하며; 1 ~ 5개의 단일 집락을 선택하여 1 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 4 h 동안 배양하며; 100 μL의 배양액을 취하여 10% 자당 함유 LB 고체 배지에 코팅하고 30℃에서 24 h 동안 배양하며; 단클론을 선택하고 LB 고체 배지 및 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 일대일로 대응되게 스트리킹하며; LB 고체 배지에서 성장시키고, 동시에 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에서 성장할 수 없는 해당 균주를 PCR 증폭 및 동정하였다. PCR 증폭은 하기와 같은 프라이머(상하이 invitrogen에서 합성)를 사용하였다.
P5: 5' ctttcgcaagatgattatgg 3'(서열번호 21)
P6: 5' cacggtattcccgcttcctg 3'(서열번호 22)
상기 PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg2+(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 PCR 증폭은 다음과 방식으로 수행되었다. 94℃에서 5 min 동안 초기 변성하고, (94℃에서 30 s 동안 변성, 52℃에서 30 s 동안 어닐링, 72℃에서 90 s 동안 연장, 30 주기), 72℃에서 10 min 동안 과도 연장하며, PCR 증폭 산물에 대해 SSCP(외가닥구조다형성, Single-Strand Conformation Polymorphism) 전기영동을 수행하고, 플라스미드 pKOV-spoT (G520T) 증폭 단편을 양성 대조군으로, 야생형 대장균 증폭 단편을 음성 대조군으로, 물을 블랭크 대조군으로 사용하였다. SSCP 전기영동에서 길이가 동일하나 서열 배열이 상이한 단쇄 올리고뉴클레오티드 사슬은 아이스 배스에서 형성된 공간 구조가 상이하고, 전기영동시 이동 속도도 차이가 있다. 따라서, 단편 전기영동 위치는 음성 대조군 단편 위치와 일치하지 않고, 양성 대조군 단편 위치와 일치한 균주는 대립유전자 대체가 성공적인 균주이다. 대립유전자 대체가 성공적인 균주를 주형으로 하고, 프라이머 P5 및 P6을 사용하여 PCR로 다시 타깃 단편을 증폭시키고 타깃 단편을 pMD19-T 벡터에 연결시켜 시퀀싱하였다. 시퀀싱 결과의 서열 비교를 통해 spoT 유전자 코딩 영역 서열 520번째 염기 G가 T로 변경된 재조합체는 변형이 성공적인 균주이다. E.coli K12(W3110)에서 유래된 재조합체를 YPThr03으로 명명하고, E.coli CGMCC 7.232에서 유래된 재조합체를 YPThr04로 명명하였다.
(3) 트레오닌 발효 실험
E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주 및 돌연변이 균주 YPThr03, YPThr04를 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 12 h 동안 배양하였다. 그 다음, 각 균주의 배양물을 1 mL 취하여 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 36 h 동안 발효 배양하였다. HPLC로 L-트레오닌의 함량을 측정하고, 각 균주를 3개의 평행선으로 만들어 평균값을 계산하며, 검출 결과는 표 2와 같다.
[표 1]
[표 2]
트레오닌 발효 실험 결과
표 2의 결과에 나타낸 바와 같이, L-트레오닌의 생산이 높거나 낮은 원시 균주에 관계없이, spoT 유전자의 아미노산 서열 174번째 글리신이 시스테인으로 치환된 후 모두 L-트레오닌 수율의 향상에 도움이 된다.
실시예 3
(1) yebN 유전자 코딩 영역 부위 특이적 돌연변이(G74A)(코딩 단백질에 대응되는 아미노산 서열에서 서열번호 25의 25번째 글리신이 아스파르트산으로 치환(G25D), 치환 후 서열번호 26으로 표시된 바와 같음)를 위한 플라스미드 pKOV-yebN (G74A)의 구축
YEBN 효소는 yebN 유전자에 의해 코딩되고, E.coli K12 균주 및 이의 유도체 균주(예를 들면, W3110 등)에서 야생형 yebN 유전자 ORF 서열은 Genbank 수탁 번호 AP009048.1 중 서열 1907402-1907968로 표시된 바와 같다. 상기 서열에 따라 yebN을 증폭하는 2쌍의 프라이머를 설계 및 합성하고, 출발 균주에서 yebN 유전자 코딩 영역 서열 74번째 염기 G를 A로 변경하는 벡터를 구축하였다. 프라이머의 설계는 하기와 같다(상하이 invitrogen에서 합성).
P1: 5' CGGGATCCCTTCGCCAATGTCTGGATTG 3'(밑줄 친 부분은 제한효소인식부위 BamH I임)(서열번호 27)
P2: 5' ATGGAGGGTGGCATCTTTAC 3'(서열번호 28)
P3: 5' TGCATCAATCGGTAAAGATG 3'(서열번호 29)
P4: 5' AAGGAAAAAAGCGGCCGCCAACTCCGCACTCTGCTGTA 3'(밑줄 친 부분은 제한효소인식부위 Not I임)(서열번호 30)
구축 방법은 다음과 같다. 야생형 균주 E.coli K12 게놈을 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이를 포함하는 690 bp 및 700 bp 길이의 DNA 단편(yebN (G74A)-Up 및 yebN (G74A)-Down 단편) 2개를 획득하였다. PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg2+(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 정제된 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, Overlap PCR을 통해 약 1340 bp 길이의 단편(yebN (G74A)-Up-Down 단편)을 증폭하였다.
PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg2(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 Overlap PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행되었다.
상기 yebN (G74A)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드(Addgene에서 구입)를 각각 BamH I/Not I로 이중 절단하고, 절단된 yebN (G74A)-Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 벡터 pKOV-yebN (G74A)을 획득하였다. 벡터 pKOV-yebN (G74A)을 시퀀싱 회사에 보내어 시퀀싱 및 동정을 진행하였고, 정확한 점돌연변이(yebN (G74A))를 포함하는 벡터 pKOV-yebN (G74A)을 비축하였다.
(2) 점돌연변이 유전자 yebN (G74A)를 포함하는 조작된 균주의 구축
야생형 대장균 균주 E.coli K12(W3110) 및 L-트레오닌 생산이 높은 균주 E.coli CGMCC 7.232(China General Microbiological Culture Collection Center에 수탁)는 모두 염색체에 야생형 yebN 유전자를 보유한다. 구축된 플라스미드 pKOV-yebN (G74A)을 E.coli K12(W3110) 및 E.coli CGMCC 7.232로 각각 형질전환시키고, 대립유전자의 치환을 통해 이 두 균주의 염색체에 있는 yebN 유전자 서열의 74번째 염기 G를 A로 변경하였다.
구체적인 과정은 다음과 같다. 플라스미드 pKOV-yebN (G74A)을 전기천공법으로 숙주균의 컴피턴트 세포로 형질전환시킨 후 0.5 mL의 SOC 액체 배지를 첨가하고; 30℃, 100 rpm의 진탕기에서 2 h 동안 소생시키며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 코팅하고 30℃에서 18 h 동안 배양하며; 성장한 단클론 집락을 선택하여 10 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 8 h 동안 배양하며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 코팅하고 42℃에서 12 h 동안 배양하며; 1 ~ 5개의 단일 집락을 선택하여 1 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 4 h 동안 배양하며; 100 μL의 배양액을 취하여 10% 자당 함유 LB 고체 배지에 코팅하고 30℃에서 24 h 동안 배양하며; 단클론을 선택하고 LB 고체 배지 및 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 일대일로 대응되게 스트리킹하며; LB 고체 배지에서 성장시키고, 동시에 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에서 성장할 수 없는 해당 균주를 PCR 증폭 및 동정하였다. PCR 증폭은 하기와 같은 프라이머(상하이 invitrogen에서 합성)를 사용하였다.
P5: 5' CCATCACGGCTTGTTGTTC 3'(서열번호 31)
P6: 5' ACGAAAACCCTCAATAATC 3'(서열번호 32)
상기 PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg2+(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 PCR 증폭은 다음과 방식으로 수행되었다. 94℃에서 5 min 동안 초기 변성하고, (94℃에서 30 s 동안 변성, 52℃에서 30 s 동안 어닐링, 72℃에서 90 s 동안 연장, 30 주기), 72℃에서 10 min 동안 과도 연장하며, PCR 증폭 산물에 대해 SSCP(외가닥구조다형성, Single-Strand Conformation Polymorphism) 전기영동을 수행하고, 플라스미드 pKOV-yebN (G74A) 증폭 단편을 양성 대조군으로, 야생형 대장균 증폭 단편을 음성 대조군으로, 물을 블랭크 대조군으로 사용하였다. SSCP 전기영동에서 길이가 동일하나 서열 배열이 상이한 단쇄 올리고뉴클레오티드 사슬은 아이스 배스에서 형성된 공간 구조가 상이하고, 전기영동시 이동 속도도 차이가 있다. 따라서, 단편 전기영동 위치는 음성 대조군 단편 위치와 일치하지 않고, 양성 대조군 단편 위치와 일치한 균주는 대립유전자 대체가 성공적인 균주이다. 대립유전자 대체가 성공적인 균주를 주형으로 하고, 프라이머 P5 및 P6을 사용하여 PCR로 다시 타깃 단편을 증폭시키고 타깃 단편을 pMD19-T 벡터에 연결시켜 시퀀싱하였다. 시퀀싱 결과의 서열 비교를 통해 yebN 유전자 코딩 영역 서열 74번째 염기 G가 T로 변경된 재조합체는 변형이 성공적인 균주이다. E.coli K12(W3110)에서 유래된 재조합체를 YPThr05로 명명하고, E.coli CGMCC 7.232에서 유래된 재조합체를 YPThr06으로 명명하였다.
(3) 트레오닌 발효 실험
E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주 및 돌연변이 균주 YPThr05, YPThr06을 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 12 h 동안 배양하였다. 그 다음, 각 균주의 배양물을 1 mL 취하여 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 36 h 동안 발효 배양하였다. HPLC로 L-트레오닌의 함량을 측정하고, 각 균주를 3개의 평행선으로 만들어 평균값을 계산하며, 검출 결과는 표 2와 같다.
[표 1]
배지 배합
[표 2]
트레오닌 발효 실험 결과
표 2의 결과에 나타낸 바와 같이, L-트레오닌의 생산이 높거나 낮은 원시 균주에 관계없이, yebN 유전자의 아미노산 서열 25번째 글리신이 아스파르트산으로 치환된 후 모두 L-트레오닌 수율의 향상에 도움이 된다.
이상, 본 발명의 실시형태에 대해 설명하였다. 그러나, 본 발명은 상기 실시형태에 한정되지 않는다. 본 발명의 사상과 원리 내에 이루어진 그 어떠한 수정, 등가 대체, 개선 등도 모두 본 발명의 보호범위에 포함되어야 한다.
<110> HEILONGJIANG EPPEN BIOTECH CO., LTD.
<120> ESCHERICHIA COLI-BASED RECOMBINANT STRAIN, CONSTRUCTION METHOD
THEREFOR AND USE THEREOF
<130> CPWO20110939
<160> 32
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1278
<212> DNA
<213> Escherichia coli
<400> 1
atgctcgaat tgctttacac cgcccttctc taccttattc agccgctgat ctggatacgg 60
ctctgggtgc gcggacgtaa ggctccggcc tatcgaaaac gctggggtga acgttacggt 120
ttttaccgcc atccgctaaa accaggcggc attatgctgc actccgtctc cgtcggtgaa 180
actctggcgg caatcccgtt ggtgcgcgcg ctgcgtcatc gttatcctga tttaccgatt 240
accgtaacaa ccatgacgcc aaccggttcg gagcgcgtac aatcggcttt cgggaaggat 300
gttcagcacg tttatctgcc gtatgatctg cccgatgcac tcaaccgttt cctgaataaa 360
gtcgacccta aactggtgtt gattatggaa accgaactat ggcctaacct gattgcggcg 420
ctacataaac gtaaaattcc gctggtgatc gctaacgcgc gactctctgc ccgctcggcc 480
gcaggttatg ccaaactggg taaattcgtc cgtcgcttgc tgcgtcgtat tacgctgatt 540
gctgcgcaaa atgaagaaga tggtgcacgt tttgtggcgc tgggcgcaaa aaataatcag 600
gtgaccgtta ccggtagcct gaaattcgat atttctgtaa cgccgcagtt ggctgctaaa 660
gccgtgacgc tgcgccgcca gtgggcacca caccgcccgg tatggattgc caccagcact 720
cacgaaggcg aagagagtgt ggtgatcgcc gcacatcagg cattgttaca gcaattcccg 780
aatttattgc tcatcctggt accccgtcat ccggaacgct tcccggatgc gattaacctt 840
gtccgccagg ctggactaag ctatatcaca cgctcttcag gggaagtccc ctccaccagc 900
acgcaggttg tggttggcga tacgatgggc gagttgatgt tactgtatgg cattgccgat 960
ctcgcctttg ttggcggttc actggttgaa cgtggtgggc ataatccgct ggaagctgcc 1020
gcacacgcta ttccggtatt gatggggccg catactttta actttaaaga catttgcgcg 1080
cggctggagc aggcaagcgg gctgattacc gttaccgatg ccactacgct tgcaaaagag 1140
gtttcctctt tactcaccga cgccgattac cgtagtttct atggccgtca tgccgttgaa 1200
gtactgtatc aaaaccaggg cgcgctacag cgtctgcttc aactgctgga accttacctg 1260
ccaccgaaaa cgcattga 1278
<210> 2
<211> 1278
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 2
atgctcgaat tgctttacac cgcccttctc taccttattc agccgctgat ctggatacgg 60
ctctgggtgc gcggacgtaa gactccggcc tatcgaaaac gctggggtga acgttacggt 120
ttttaccgcc atccgctaaa accaggcggc attatgctgc actccgtctc cgtcggtgaa 180
actctggcgg caatcccgtt ggtgcgcgcg ctgcgtcatc gttatcctga tttaccgatt 240
accgtaacaa ccatgacgcc aaccggttcg gagcgcgtac aatcggcttt cgggaaggat 300
gttcagcacg tttatctgcc gtatgatctg cccgatgcac tcaaccgttt cctgaataaa 360
gtcgacccta aactggtgtt gattatggaa accgaactat ggcctaacct gattgcggcg 420
ctacataaac gtaaaattcc gctggtgatc gctaacgcgc gactctctgc ccgctcggcc 480
gcaggttatg ccaaactggg taaattcgtc cgtcgcttgc tgcgtcgtat tacgctgatt 540
gctgcgcaaa atgaagaaga tggtgcacgt tttgtggcgc tgggcgcaaa aaataatcag 600
gtgaccgtta ccggtagcct gaaattcgat atttctgtaa cgccgcagtt ggctgctaaa 660
gccgtgacgc tgcgccgcca gtgggcacca caccgcccgg tatggattgc caccagcact 720
cacgaaggcg aagagagtgt ggtgatcgcc gcacatcagg cattgttaca gcaattcccg 780
aatttattgc tcatcctggt accccgtcat ccggaacgct tcccggatgc gattaacctt 840
gtccgccagg ctggactaag ctatatcaca cgctcttcag gggaagtccc ctccaccagc 900
acgcaggttg tggttggcga tacgatgggc gagttgatgt tactgtatgg cattgccgat 960
ctcgcctttg ttggcggttc actggttgaa cgtggtgggc ataatccgct ggaagctgcc 1020
gcacacgcta ttccggtatt gatggggccg catactttta actttaaaga catttgcgcg 1080
cggctggagc aggcaagcgg gctgattacc gttaccgatg ccactacgct tgcaaaagag 1140
gtttcctctt tactcaccga cgccgattac cgtagtttct atggccgtca tgccgttgaa 1200
gtactgtatc aaaaccaggg cgcgctacag cgtctgcttc aactgctgga accttacctg 1260
ccaccgaaaa cgcattga 1278
<210> 3
<211> 425
<212> PRT
<213> Escherichia coli
<400> 3
Met Leu Glu Leu Leu Tyr Thr Ala Leu Leu Tyr Leu Ile Gln Pro Leu
1 5 10 15
Ile Trp Ile Arg Leu Trp Val Arg Gly Arg Lys Ala Pro Ala Tyr Arg
20 25 30
Lys Arg Trp Gly Glu Arg Tyr Gly Phe Tyr Arg His Pro Leu Lys Pro
35 40 45
Gly Gly Ile Met Leu His Ser Val Ser Val Gly Glu Thr Leu Ala Ala
50 55 60
Ile Pro Leu Val Arg Ala Leu Arg His Arg Tyr Pro Asp Leu Pro Ile
65 70 75 80
Thr Val Thr Thr Met Thr Pro Thr Gly Ser Glu Arg Val Gln Ser Ala
85 90 95
Phe Gly Lys Asp Val Gln His Val Tyr Leu Pro Tyr Asp Leu Pro Asp
100 105 110
Ala Leu Asn Arg Phe Leu Asn Lys Val Asp Pro Lys Leu Val Leu Ile
115 120 125
Met Glu Thr Glu Leu Trp Pro Asn Leu Ile Ala Ala Leu His Lys Arg
130 135 140
Lys Ile Pro Leu Val Ile Ala Asn Ala Arg Leu Ser Ala Arg Ser Ala
145 150 155 160
Ala Gly Tyr Ala Lys Leu Gly Lys Phe Val Arg Arg Leu Leu Arg Arg
165 170 175
Ile Thr Leu Ile Ala Ala Gln Asn Glu Glu Asp Gly Ala Arg Phe Val
180 185 190
Ala Leu Gly Ala Lys Asn Asn Gln Val Thr Val Thr Gly Ser Leu Lys
195 200 205
Phe Asp Ile Ser Val Thr Pro Gln Leu Ala Ala Lys Ala Val Thr Leu
210 215 220
Arg Arg Gln Trp Ala Pro His Arg Pro Val Trp Ile Ala Thr Ser Thr
225 230 235 240
His Glu Gly Glu Glu Ser Val Val Ile Ala Ala His Gln Ala Leu Leu
245 250 255
Gln Gln Phe Pro Asn Leu Leu Leu Ile Leu Val Pro Arg His Pro Glu
260 265 270
Arg Phe Pro Asp Ala Ile Asn Leu Val Arg Gln Ala Gly Leu Ser Tyr
275 280 285
Ile Thr Arg Ser Ser Gly Glu Val Pro Ser Thr Ser Thr Gln Val Val
290 295 300
Val Gly Asp Thr Met Gly Glu Leu Met Leu Leu Tyr Gly Ile Ala Asp
305 310 315 320
Leu Ala Phe Val Gly Gly Ser Leu Val Glu Arg Gly Gly His Asn Pro
325 330 335
Leu Glu Ala Ala Ala His Ala Ile Pro Val Leu Met Gly Pro His Thr
340 345 350
Phe Asn Phe Lys Asp Ile Cys Ala Arg Leu Glu Gln Ala Ser Gly Leu
355 360 365
Ile Thr Val Thr Asp Ala Thr Thr Leu Ala Lys Glu Val Ser Ser Leu
370 375 380
Leu Thr Asp Ala Asp Tyr Arg Ser Phe Tyr Gly Arg His Ala Val Glu
385 390 395 400
Val Leu Tyr Gln Asn Gln Gly Ala Leu Gln Arg Leu Leu Gln Leu Leu
405 410 415
Glu Pro Tyr Leu Pro Pro Lys Thr His
420 425
<210> 4
<211> 425
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 4
Met Leu Glu Leu Leu Tyr Thr Ala Leu Leu Tyr Leu Ile Gln Pro Leu
1 5 10 15
Ile Trp Ile Arg Leu Trp Val Arg Gly Arg Lys Thr Pro Ala Tyr Arg
20 25 30
Lys Arg Trp Gly Glu Arg Tyr Gly Phe Tyr Arg His Pro Leu Lys Pro
35 40 45
Gly Gly Ile Met Leu His Ser Val Ser Val Gly Glu Thr Leu Ala Ala
50 55 60
Ile Pro Leu Val Arg Ala Leu Arg His Arg Tyr Pro Asp Leu Pro Ile
65 70 75 80
Thr Val Thr Thr Met Thr Pro Thr Gly Ser Glu Arg Val Gln Ser Ala
85 90 95
Phe Gly Lys Asp Val Gln His Val Tyr Leu Pro Tyr Asp Leu Pro Asp
100 105 110
Ala Leu Asn Arg Phe Leu Asn Lys Val Asp Pro Lys Leu Val Leu Ile
115 120 125
Met Glu Thr Glu Leu Trp Pro Asn Leu Ile Ala Ala Leu His Lys Arg
130 135 140
Lys Ile Pro Leu Val Ile Ala Asn Ala Arg Leu Ser Ala Arg Ser Ala
145 150 155 160
Ala Gly Tyr Ala Lys Leu Gly Lys Phe Val Arg Arg Leu Leu Arg Arg
165 170 175
Ile Thr Leu Ile Ala Ala Gln Asn Glu Glu Asp Gly Ala Arg Phe Val
180 185 190
Ala Leu Gly Ala Lys Asn Asn Gln Val Thr Val Thr Gly Ser Leu Lys
195 200 205
Phe Asp Ile Ser Val Thr Pro Gln Leu Ala Ala Lys Ala Val Thr Leu
210 215 220
Arg Arg Gln Trp Ala Pro His Arg Pro Val Trp Ile Ala Thr Ser Thr
225 230 235 240
His Glu Gly Glu Glu Ser Val Val Ile Ala Ala His Gln Ala Leu Leu
245 250 255
Gln Gln Phe Pro Asn Leu Leu Leu Ile Leu Val Pro Arg His Pro Glu
260 265 270
Arg Phe Pro Asp Ala Ile Asn Leu Val Arg Gln Ala Gly Leu Ser Tyr
275 280 285
Ile Thr Arg Ser Ser Gly Glu Val Pro Ser Thr Ser Thr Gln Val Val
290 295 300
Val Gly Asp Thr Met Gly Glu Leu Met Leu Leu Tyr Gly Ile Ala Asp
305 310 315 320
Leu Ala Phe Val Gly Gly Ser Leu Val Glu Arg Gly Gly His Asn Pro
325 330 335
Leu Glu Ala Ala Ala His Ala Ile Pro Val Leu Met Gly Pro His Thr
340 345 350
Phe Asn Phe Lys Asp Ile Cys Ala Arg Leu Glu Gln Ala Ser Gly Leu
355 360 365
Ile Thr Val Thr Asp Ala Thr Thr Leu Ala Lys Glu Val Ser Ser Leu
370 375 380
Leu Thr Asp Ala Asp Tyr Arg Ser Phe Tyr Gly Arg His Ala Val Glu
385 390 395 400
Val Leu Tyr Gln Asn Gln Gly Ala Leu Gln Arg Leu Leu Gln Leu Leu
405 410 415
Glu Pro Tyr Leu Pro Pro Lys Thr His
420 425
<210> 5
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 5
cgggatccac cagtgaaccg ccaaca 26
<210> 6
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 6
tgcgcggacg taagactc 18
<210> 7
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 7
gagtcttacg tccgcgca 18
<210> 8
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 8
aaggaaaaaa gcggccgctt cccgcacctt tattg 35
<210> 9
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 9
cttcccgaaa gccgattg 18
<210> 10
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 10
acaaaatata ctttaatc 18
<210> 11
<211> 1596
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 11
accagtgaac cgccaacaaa ggcgagatcg gcaatgccat acagtaacat caactcgccc 60
atcgtatcgc caaccacaac ctgcgtgctg gtggagggga cttcccctga agagcgtgtg 120
atatagctta gtccagcctg gcggacaagg ttaatcgcat ccgggaagcg ttccggatga 180
cggggtacca ggatgagcaa taaattcggg aattgctgta acaatgcctg atgtgcggcg 240
atcaccacac tctcttcgcc ttcgtgagtg ctggtggcaa tccataccgg gcggtgtggt 300
gcccactggc ggcgcagcgt cacggcttta gcagccaact gcggcgttac agaaatatcg 360
aatttcaggc taccggtaac ggtcacctga ttattttttg cgcccagcgc cacaaaacgt 420
gcaccatctt cttcattttg cgcagcaatc agcgtaatac gacgcagcaa gcgacggacg 480
aatttaccca gtttggcata acctgcggcc gagcgggcag agagtcgcgc gttagcgatc 540
accagcggaa ttttacgttt atgtagcgcc gcaatcaggt taggccatag ttcggtttcc 600
ataatcaaca ccagtttagg gtcgacttta ttcaggaaac ggttgagtgc atcgggcaga 660
tcatacggca gataaacgtg ctgaacatcc ttcccgaaag ccgattgtac gcgctccgaa 720
ccggttggcg tcatggttgt tacggtaatc ggtaaatcag gataacgatg acgcagcgcg 780
cgcaccaacg ggattgccgc cagagtttca ccgacggaga cggagtgcag cataatgccg 840
cctggtttta gcggatggcg gtaaaaaccg taacgttcac cccagcgttt tcgataggcc 900
ggagacttac gtccgcgcac ccagagccgt atccagatca gcggctgaat aaggtagaga 960
agggcggtgt aaagcaattc gagcatagta aatagctgac ttatggatgt gctggggatt 1020
ctatgtattt agctgtggct ttaccattac ttttcccgtt tttgacttaa atagcttcag 1080
tttggtctga tctgccgcta catcttcatt ttttttgtat ttttatgcga ttcattgaaa 1140
ctcggcccca ttttcaaatc tacataggcc gtactgacat tatcgaaatg ctatttttta 1200
tctatttgat ttttatgatt aaagtatatt ttgtgtataa aaatcattcg ggtcggattg 1260
ctgcgaaaga aatgatacac tagcacgtca aagtaagtgc gttatcagta ttcaggtagc 1320
tgttgagcct ggggcggtag cgtgcttttt tctgcttaac ttaaccagac aatcacacaa 1380
aagagtcgct agtggaaaag ccatttcgaa aaatcctggt cataaagatg cgatatcatg 1440
gggatatgtt attaactact cctgtcatca gtacgctcaa gcagaattat cctgatgcaa 1500
aaatcgatat gctgctttat caggacacca tccctatttt gtctgaaaac ccggaaatta 1560
atgcgctcta tgggataagc aataaaggtg cgggaa 1596
<210> 12
<211> 544
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 12
cttcccgaaa gccgattgta cgcgctccga accggttggc gtcatggttg ttacggtaat 60
cggtaaatca ggataacgat gacgcagcgc gcgcaccaac gggattgccg ccagagtttc 120
accgacggag acggagtgca gcataatgcc gcctggtttt agcggatggc ggtaaaaacc 180
gtaacgttca ccccagcgtt ttcgataggc cggagactta cgtccgcgca cccagagccg 240
tatccagatc agcggctgaa taaggtagag aagggcggtg taaagcaatt cgagcatagt 300
aaatagctga cttatggatg tgctggggat tctatgtatt tagctgtggc tttaccatta 360
cttttcccgt ttttgactta aatagcttca gtttggtctg atctgccgct acatcttcat 420
tttttttgta tttttatgcg attcattgaa actcggcccc attttcaaat ctacataggc 480
cgtactgaca ttatcgaaat gctatttttt atctatttga tttttatgat taaagtatat 540
tttg 544
<210> 13
<211> 2109
<212> DNA
<213> Escherichia coli
<400> 13
atgtatctgt ttgaaagcct gaatcaactg attcaaacct acctgccgga agaccaaatc 60
aagcgtctgc ggcaggcgta tctcgttgca cgtgatgctc acgaggggca aacacgttca 120
agcggtgaac cctatatcac gcacccggta gcggttgcct gcattctggc cgagatgaaa 180
ctcgactatg aaacgctgat ggcggcgctg ctgcatgacg tgattgaaga tactcccgcc 240
acctaccagg atatggaaca gctttttggt aaaagcgtcg ccgagctggt agagggggtg 300
tcgaaacttg ataaactcaa gttccgcgat aagaaagagg cgcaggccga aaactttcgc 360
aagatgatta tggcgatggt gcaggatatc cgcgtcatcc tcatcaaact tgccgaccgt 420
acccacaaca tgcgcacgct gggctcactt cgcccggaca aacgtcgccg catcgcccgt 480
gaaactctcg aaatttatag cccgctggcg caccgtttag gtatccacca cattaaaacc 540
gaactcgaag agctgggttt tgaggcgctg tatcccaacc gttatcgcgt aatcaaagaa 600
gtggtgaaag ccgcgcgcgg caaccgtaaa gagatgatcc agaagattct ttctgaaatc 660
gaagggcgtt tgcaggaagc gggaataccg tgccgcgtca gtggtcgcga gaagcatctt 720
tattcgattt actgcaaaat ggtgctcaaa gagcagcgtt ttcactcgat catggacatc 780
tacgctttcc gcgtgatcgt caatgattct gacacctgtt atcgcgtgct gggccagatg 840
cacagcctgt acaagccgcg tccgggccgc gtgaaagact atatcgccat tccaaaagcg 900
aacggctatc agtctttgca cacctcgatg atcggcccgc acggtgtgcc ggttgaggtc 960
cagatccgta ccgaagatat ggaccagatg gcggagatgg gtgttgccgc gcactgggct 1020
tataaagagc acggcgaaac cagtactacc gcacaaatcc gcgcccagcg ctggatgcaa 1080
agcctgctgg agctgcaaca gagcgccggt agttcgtttg aatttatcga gagcgttaaa 1140
tccgatctct tcccggatga gatttacgtt ttcacaccgg aagggcgcat tgtcgagctg 1200
cctgccggtg caacgcccgt cgacttcgct tatgcagtgc ataccgatat cggtcatgcc 1260
tgcgtgggcg cacgcgttga ccgccagcct tacccgctgt cgcagccgct taccagcggt 1320
caaaccgttg aaatcattac cgctccgggc gctcgcccga atgccgcttg gctgaacttt 1380
gtcgttagct cgaaagcgcg cgccaaaatt cgtcagttgc tgaaaaacct caagcgtgat 1440
gattctgtaa gcctgggccg tcgtctgctc aaccatgctt tgggtggtag ccgtaagctg 1500
aatgaaatcc cgcaggaaaa tattcagcgc gagctggatc gcatgaagct ggcaacgctt 1560
gacgatctgc tggcagaaat cggacttggt aacgcaatga gcgtggtggt cgcgaaaaat 1620
ctgcaacatg gggacgcctc cattccaccg gcaacccaaa gccacggaca tctgcccatt 1680
aaaggtgccg atggcgtgct gatcaccttt gcgaaatgct gccgccctat tcctggcgac 1740
ccgattatcg cccacgtcag ccccggtaaa ggtctggtga tccaccatga atcctgccgt 1800
aatatccgtg gctaccagaa agagccagag aagtttatgg ctgtggaatg ggataaagag 1860
acggcgcagg agttcatcac cgaaatcaag gtggagatgt tcaatcatca gggtgcgctg 1920
gcaaacctga cggcggcaat taacaccacg acttcgaata ttcaaagttt gaatacggaa 1980
gagaaagatg gtcgcgtcta cagcgccttt attcgtctga ccgctcgtga ccgtgtgcat 2040
ctggcgaata tcatgcgcaa aatccgcgtg atgccagacg tgattaaagt cacccgaaac 2100
cgaaattaa 2109
<210> 14
<211> 2109
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 14
atgtatctgt ttgaaagcct gaatcaactg attcaaacct acctgccgga agaccaaatc 60
aagcgtctgc ggcaggcgta tctcgttgca cgtgatgctc acgaggggca aacacgttca 120
agcggtgaac cctatatcac gcacccggta gcggttgcct gcattctggc cgagatgaaa 180
ctcgactatg aaacgctgat ggcggcgctg ctgcatgacg tgattgaaga tactcccgcc 240
acctaccagg atatggaaca gctttttggt aaaagcgtcg ccgagctggt agagggggtg 300
tcgaaacttg ataaactcaa gttccgcgat aagaaagagg cgcaggccga aaactttcgc 360
aagatgatta tggcgatggt gcaggatatc cgcgtcatcc tcatcaaact tgccgaccgt 420
acccacaaca tgcgcacgct gggctcactt cgcccggaca aacgtcgccg catcgcccgt 480
gaaactctcg aaatttatag cccgctggcg caccgtttat gtatccacca cattaaaacc 540
gaactcgaag agctgggttt tgaggcgctg tatcccaacc gttatcgcgt aatcaaagaa 600
gtggtgaaag ccgcgcgcgg caaccgtaaa gagatgatcc agaagattct ttctgaaatc 660
gaagggcgtt tgcaggaagc gggaataccg tgccgcgtca gtggtcgcga gaagcatctt 720
tattcgattt actgcaaaat ggtgctcaaa gagcagcgtt ttcactcgat catggacatc 780
tacgctttcc gcgtgatcgt caatgattct gacacctgtt atcgcgtgct gggccagatg 840
cacagcctgt acaagccgcg tccgggccgc gtgaaagact atatcgccat tccaaaagcg 900
aacggctatc agtctttgca cacctcgatg atcggcccgc acggtgtgcc ggttgaggtc 960
cagatccgta ccgaagatat ggaccagatg gcggagatgg gtgttgccgc gcactgggct 1020
tataaagagc acggcgaaac cagtactacc gcacaaatcc gcgcccagcg ctggatgcaa 1080
agcctgctgg agctgcaaca gagcgccggt agttcgtttg aatttatcga gagcgttaaa 1140
tccgatctct tcccggatga gatttacgtt ttcacaccgg aagggcgcat tgtcgagctg 1200
cctgccggtg caacgcccgt cgacttcgct tatgcagtgc ataccgatat cggtcatgcc 1260
tgcgtgggcg cacgcgttga ccgccagcct tacccgctgt cgcagccgct taccagcggt 1320
caaaccgttg aaatcattac cgctccgggc gctcgcccga atgccgcttg gctgaacttt 1380
gtcgttagct cgaaagcgcg cgccaaaatt cgtcagttgc tgaaaaacct caagcgtgat 1440
gattctgtaa gcctgggccg tcgtctgctc aaccatgctt tgggtggtag ccgtaagctg 1500
aatgaaatcc cgcaggaaaa tattcagcgc gagctggatc gcatgaagct ggcaacgctt 1560
gacgatctgc tggcagaaat cggacttggt aacgcaatga gcgtggtggt cgcgaaaaat 1620
ctgcaacatg gggacgcctc cattccaccg gcaacccaaa gccacggaca tctgcccatt 1680
aaaggtgccg atggcgtgct gatcaccttt gcgaaatgct gccgccctat tcctggcgac 1740
ccgattatcg cccacgtcag ccccggtaaa ggtctggtga tccaccatga atcctgccgt 1800
aatatccgtg gctaccagaa agagccagag aagtttatgg ctgtggaatg ggataaagag 1860
acggcgcagg agttcatcac cgaaatcaag gtggagatgt tcaatcatca gggtgcgctg 1920
gcaaacctga cggcggcaat taacaccacg acttcgaata ttcaaagttt gaatacggaa 1980
gagaaagatg gtcgcgtcta cagcgccttt attcgtctga ccgctcgtga ccgtgtgcat 2040
ctggcgaata tcatgcgcaa aatccgcgtg atgccagacg tgattaaagt cacccgaaac 2100
cgaaattaa 2109
<210> 15
<211> 702
<212> PRT
<213> Escherichia coli
<400> 15
Met Tyr Leu Phe Glu Ser Leu Asn Gln Leu Ile Gln Thr Tyr Leu Pro
1 5 10 15
Glu Asp Gln Ile Lys Arg Leu Arg Gln Ala Tyr Leu Val Ala Arg Asp
20 25 30
Ala His Glu Gly Gln Thr Arg Ser Ser Gly Glu Pro Tyr Ile Thr His
35 40 45
Pro Val Ala Val Ala Cys Ile Leu Ala Glu Met Lys Leu Asp Tyr Glu
50 55 60
Thr Leu Met Ala Ala Leu Leu His Asp Val Ile Glu Asp Thr Pro Ala
65 70 75 80
Thr Tyr Gln Asp Met Glu Gln Leu Phe Gly Lys Ser Val Ala Glu Leu
85 90 95
Val Glu Gly Val Ser Lys Leu Asp Lys Leu Lys Phe Arg Asp Lys Lys
100 105 110
Glu Ala Gln Ala Glu Asn Phe Arg Lys Met Ile Met Ala Met Val Gln
115 120 125
Asp Ile Arg Val Ile Leu Ile Lys Leu Ala Asp Arg Thr His Asn Met
130 135 140
Arg Thr Leu Gly Ser Leu Arg Pro Asp Lys Arg Arg Arg Ile Ala Arg
145 150 155 160
Glu Thr Leu Glu Ile Tyr Ser Pro Leu Ala His Arg Leu Gly Ile His
165 170 175
His Ile Lys Thr Glu Leu Glu Glu Leu Gly Phe Glu Ala Leu Tyr Pro
180 185 190
Asn Arg Tyr Arg Val Ile Lys Glu Val Val Lys Ala Ala Arg Gly Asn
195 200 205
Arg Lys Glu Met Ile Gln Lys Ile Leu Ser Glu Ile Glu Gly Arg Leu
210 215 220
Gln Glu Ala Gly Ile Pro Cys Arg Val Ser Gly Arg Glu Lys His Leu
225 230 235 240
Tyr Ser Ile Tyr Cys Lys Met Val Leu Lys Glu Gln Arg Phe His Ser
245 250 255
Ile Met Asp Ile Tyr Ala Phe Arg Val Ile Val Asn Asp Ser Asp Thr
260 265 270
Cys Tyr Arg Val Leu Gly Gln Met His Ser Leu Tyr Lys Pro Arg Pro
275 280 285
Gly Arg Val Lys Asp Tyr Ile Ala Ile Pro Lys Ala Asn Gly Tyr Gln
290 295 300
Ser Leu His Thr Ser Met Ile Gly Pro His Gly Val Pro Val Glu Val
305 310 315 320
Gln Ile Arg Thr Glu Asp Met Asp Gln Met Ala Glu Met Gly Val Ala
325 330 335
Ala His Trp Ala Tyr Lys Glu His Gly Glu Thr Ser Thr Thr Ala Gln
340 345 350
Ile Arg Ala Gln Arg Trp Met Gln Ser Leu Leu Glu Leu Gln Gln Ser
355 360 365
Ala Gly Ser Ser Phe Glu Phe Ile Glu Ser Val Lys Ser Asp Leu Phe
370 375 380
Pro Asp Glu Ile Tyr Val Phe Thr Pro Glu Gly Arg Ile Val Glu Leu
385 390 395 400
Pro Ala Gly Ala Thr Pro Val Asp Phe Ala Tyr Ala Val His Thr Asp
405 410 415
Ile Gly His Ala Cys Val Gly Ala Arg Val Asp Arg Gln Pro Tyr Pro
420 425 430
Leu Ser Gln Pro Leu Thr Ser Gly Gln Thr Val Glu Ile Ile Thr Ala
435 440 445
Pro Gly Ala Arg Pro Asn Ala Ala Trp Leu Asn Phe Val Val Ser Ser
450 455 460
Lys Ala Arg Ala Lys Ile Arg Gln Leu Leu Lys Asn Leu Lys Arg Asp
465 470 475 480
Asp Ser Val Ser Leu Gly Arg Arg Leu Leu Asn His Ala Leu Gly Gly
485 490 495
Ser Arg Lys Leu Asn Glu Ile Pro Gln Glu Asn Ile Gln Arg Glu Leu
500 505 510
Asp Arg Met Lys Leu Ala Thr Leu Asp Asp Leu Leu Ala Glu Ile Gly
515 520 525
Leu Gly Asn Ala Met Ser Val Val Val Ala Lys Asn Leu Gln His Gly
530 535 540
Asp Ala Ser Ile Pro Pro Ala Thr Gln Ser His Gly His Leu Pro Ile
545 550 555 560
Lys Gly Ala Asp Gly Val Leu Ile Thr Phe Ala Lys Cys Cys Arg Pro
565 570 575
Ile Pro Gly Asp Pro Ile Ile Ala His Val Ser Pro Gly Lys Gly Leu
580 585 590
Val Ile His His Glu Ser Cys Arg Asn Ile Arg Gly Tyr Gln Lys Glu
595 600 605
Pro Glu Lys Phe Met Ala Val Glu Trp Asp Lys Glu Thr Ala Gln Glu
610 615 620
Phe Ile Thr Glu Ile Lys Val Glu Met Phe Asn His Gln Gly Ala Leu
625 630 635 640
Ala Asn Leu Thr Ala Ala Ile Asn Thr Thr Thr Ser Asn Ile Gln Ser
645 650 655
Leu Asn Thr Glu Glu Lys Asp Gly Arg Val Tyr Ser Ala Phe Ile Arg
660 665 670
Leu Thr Ala Arg Asp Arg Val His Leu Ala Asn Ile Met Arg Lys Ile
675 680 685
Arg Val Met Pro Asp Val Ile Lys Val Thr Arg Asn Arg Asn
690 695 700
<210> 16
<211> 702
<212> PRT
<213> Escherichia coli
<400> 16
Met Tyr Leu Phe Glu Ser Leu Asn Gln Leu Ile Gln Thr Tyr Leu Pro
1 5 10 15
Glu Asp Gln Ile Lys Arg Leu Arg Gln Ala Tyr Leu Val Ala Arg Asp
20 25 30
Ala His Glu Gly Gln Thr Arg Ser Ser Gly Glu Pro Tyr Ile Thr His
35 40 45
Pro Val Ala Val Ala Cys Ile Leu Ala Glu Met Lys Leu Asp Tyr Glu
50 55 60
Thr Leu Met Ala Ala Leu Leu His Asp Val Ile Glu Asp Thr Pro Ala
65 70 75 80
Thr Tyr Gln Asp Met Glu Gln Leu Phe Gly Lys Ser Val Ala Glu Leu
85 90 95
Val Glu Gly Val Ser Lys Leu Asp Lys Leu Lys Phe Arg Asp Lys Lys
100 105 110
Glu Ala Gln Ala Glu Asn Phe Arg Lys Met Ile Met Ala Met Val Gln
115 120 125
Asp Ile Arg Val Ile Leu Ile Lys Leu Ala Asp Arg Thr His Asn Met
130 135 140
Arg Thr Leu Gly Ser Leu Arg Pro Asp Lys Arg Arg Arg Ile Ala Arg
145 150 155 160
Glu Thr Leu Glu Ile Tyr Ser Pro Leu Ala His Arg Leu Cys Ile His
165 170 175
His Ile Lys Thr Glu Leu Glu Glu Leu Gly Phe Glu Ala Leu Tyr Pro
180 185 190
Asn Arg Tyr Arg Val Ile Lys Glu Val Val Lys Ala Ala Arg Gly Asn
195 200 205
Arg Lys Glu Met Ile Gln Lys Ile Leu Ser Glu Ile Glu Gly Arg Leu
210 215 220
Gln Glu Ala Gly Ile Pro Cys Arg Val Ser Gly Arg Glu Lys His Leu
225 230 235 240
Tyr Ser Ile Tyr Cys Lys Met Val Leu Lys Glu Gln Arg Phe His Ser
245 250 255
Ile Met Asp Ile Tyr Ala Phe Arg Val Ile Val Asn Asp Ser Asp Thr
260 265 270
Cys Tyr Arg Val Leu Gly Gln Met His Ser Leu Tyr Lys Pro Arg Pro
275 280 285
Gly Arg Val Lys Asp Tyr Ile Ala Ile Pro Lys Ala Asn Gly Tyr Gln
290 295 300
Ser Leu His Thr Ser Met Ile Gly Pro His Gly Val Pro Val Glu Val
305 310 315 320
Gln Ile Arg Thr Glu Asp Met Asp Gln Met Ala Glu Met Gly Val Ala
325 330 335
Ala His Trp Ala Tyr Lys Glu His Gly Glu Thr Ser Thr Thr Ala Gln
340 345 350
Ile Arg Ala Gln Arg Trp Met Gln Ser Leu Leu Glu Leu Gln Gln Ser
355 360 365
Ala Gly Ser Ser Phe Glu Phe Ile Glu Ser Val Lys Ser Asp Leu Phe
370 375 380
Pro Asp Glu Ile Tyr Val Phe Thr Pro Glu Gly Arg Ile Val Glu Leu
385 390 395 400
Pro Ala Gly Ala Thr Pro Val Asp Phe Ala Tyr Ala Val His Thr Asp
405 410 415
Ile Gly His Ala Cys Val Gly Ala Arg Val Asp Arg Gln Pro Tyr Pro
420 425 430
Leu Ser Gln Pro Leu Thr Ser Gly Gln Thr Val Glu Ile Ile Thr Ala
435 440 445
Pro Gly Ala Arg Pro Asn Ala Ala Trp Leu Asn Phe Val Val Ser Ser
450 455 460
Lys Ala Arg Ala Lys Ile Arg Gln Leu Leu Lys Asn Leu Lys Arg Asp
465 470 475 480
Asp Ser Val Ser Leu Gly Arg Arg Leu Leu Asn His Ala Leu Gly Gly
485 490 495
Ser Arg Lys Leu Asn Glu Ile Pro Gln Glu Asn Ile Gln Arg Glu Leu
500 505 510
Asp Arg Met Lys Leu Ala Thr Leu Asp Asp Leu Leu Ala Glu Ile Gly
515 520 525
Leu Gly Asn Ala Met Ser Val Val Val Ala Lys Asn Leu Gln His Gly
530 535 540
Asp Ala Ser Ile Pro Pro Ala Thr Gln Ser His Gly His Leu Pro Ile
545 550 555 560
Lys Gly Ala Asp Gly Val Leu Ile Thr Phe Ala Lys Cys Cys Arg Pro
565 570 575
Ile Pro Gly Asp Pro Ile Ile Ala His Val Ser Pro Gly Lys Gly Leu
580 585 590
Val Ile His His Glu Ser Cys Arg Asn Ile Arg Gly Tyr Gln Lys Glu
595 600 605
Pro Glu Lys Phe Met Ala Val Glu Trp Asp Lys Glu Thr Ala Gln Glu
610 615 620
Phe Ile Thr Glu Ile Lys Val Glu Met Phe Asn His Gln Gly Ala Leu
625 630 635 640
Ala Asn Leu Thr Ala Ala Ile Asn Thr Thr Thr Ser Asn Ile Gln Ser
645 650 655
Leu Asn Thr Glu Glu Lys Asp Gly Arg Val Tyr Ser Ala Phe Ile Arg
660 665 670
Leu Thr Ala Arg Asp Arg Val His Leu Ala Asn Ile Met Arg Lys Ile
675 680 685
Arg Val Met Pro Asp Val Ile Lys Val Thr Arg Asn Arg Asn
690 695 700
<210> 17
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 17
cgggatccga acagcaagag caggaagc 28
<210> 18
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 18
tgtggtggat acataaacg 19
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 19
gcaccgttta tgtatccacc 20
<210> 20
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 20
aaggaaaaaa gcggccgcac gacaaagttc agccaagc 38
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 21
ctttcgcaag atgattatgg 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 22
cacggtattc ccgcttcctg 20
<210> 23
<211> 567
<212> DNA
<213> Escherichia coli
<400> 23
atgaatatca ctgctactgt tcttcttgcg tttggtatgt cgatggatgc atttgctgca 60
tcaatcggta aaggtgccac cctccataaa ccgaaatttt ctgaagcatt gcgaaccggc 120
cttatttttg gtgccgtcga aaccctgacg ccgctgatcg gctggggaat gggcatgtta 180
gccagccggt ttgtccttga atggaaccac tggattgcgt ttgtgctgct gatattcctc 240
ggcgggcgaa tgattattga gggttttcgt ggcgcagatg atgaagatga agagccgcgc 300
cgtcgacacg gtttctggct actggtaacc accgcgattg ccaccagcct ggatgccatg 360
gctgtgggtg ttggtcttgc tttcctgcag gtcaacatta tcgcgaccgc attggccatt 420
ggttgtgcaa ccttgattat gtcaacatta gggatgatgg ttggtcgctt tatcggctca 480
attattggga aaaaagcgga aattctcggc gggctggtgc tgatcggcat cggcgtccag 540
atcctctgga cgcacttcca cggttaa 567
<210> 24
<211> 567
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 24
atgaatatca ctgctactgt tcttcttgcg tttggtatgt cgatggatgc atttgctgca 60
tcaatcggta aagatgccac cctccataaa ccgaaatttt ctgaagcatt gcgaaccggc 120
cttatttttg gtgccgtcga aaccctgacg ccgctgatcg gctggggaat gggcatgtta 180
gccagccggt ttgtccttga atggaaccac tggattgcgt ttgtgctgct gatattcctc 240
ggcgggcgaa tgattattga gggttttcgt ggcgcagatg atgaagatga agagccgcgc 300
cgtcgacacg gtttctggct actggtaacc accgcgattg ccaccagcct ggatgccatg 360
gctgtgggtg ttggtcttgc tttcctgcag gtcaacatta tcgcgaccgc attggccatt 420
ggttgtgcaa ccttgattat gtcaacatta gggatgatgg ttggtcgctt tatcggctca 480
attattggga aaaaagcgga aattctcggc gggctggtgc tgatcggcat cggcgtccag 540
atcctctgga cgcacttcca cggttaa 567
<210> 25
<211> 188
<212> PRT
<213> Escherichia coli
<400> 25
Met Asn Ile Thr Ala Thr Val Leu Leu Ala Phe Gly Met Ser Met Asp
1 5 10 15
Ala Phe Ala Ala Ser Ile Gly Lys Gly Ala Thr Leu His Lys Pro Lys
20 25 30
Phe Ser Glu Ala Leu Arg Thr Gly Leu Ile Phe Gly Ala Val Glu Thr
35 40 45
Leu Thr Pro Leu Ile Gly Trp Gly Met Gly Met Leu Ala Ser Arg Phe
50 55 60
Val Leu Glu Trp Asn His Trp Ile Ala Phe Val Leu Leu Ile Phe Leu
65 70 75 80
Gly Gly Arg Met Ile Ile Glu Gly Phe Arg Gly Ala Asp Asp Glu Asp
85 90 95
Glu Glu Pro Arg Arg Arg His Gly Phe Trp Leu Leu Val Thr Thr Ala
100 105 110
Ile Ala Thr Ser Leu Asp Ala Met Ala Val Gly Val Gly Leu Ala Phe
115 120 125
Leu Gln Val Asn Ile Ile Ala Thr Ala Leu Ala Ile Gly Cys Ala Thr
130 135 140
Leu Ile Met Ser Thr Leu Gly Met Met Val Gly Arg Phe Ile Gly Ser
145 150 155 160
Ile Ile Gly Lys Lys Ala Glu Ile Leu Gly Gly Leu Val Leu Ile Gly
165 170 175
Ile Gly Val Gln Ile Leu Trp Thr His Phe His Gly
180 185
<210> 26
<211> 188
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 26
Met Asn Ile Thr Ala Thr Val Leu Leu Ala Phe Gly Met Ser Met Asp
1 5 10 15
Ala Phe Ala Ala Ser Ile Gly Lys Asp Ala Thr Leu His Lys Pro Lys
20 25 30
Phe Ser Glu Ala Leu Arg Thr Gly Leu Ile Phe Gly Ala Val Glu Thr
35 40 45
Leu Thr Pro Leu Ile Gly Trp Gly Met Gly Met Leu Ala Ser Arg Phe
50 55 60
Val Leu Glu Trp Asn His Trp Ile Ala Phe Val Leu Leu Ile Phe Leu
65 70 75 80
Gly Gly Arg Met Ile Ile Glu Gly Phe Arg Gly Ala Asp Asp Glu Asp
85 90 95
Glu Glu Pro Arg Arg Arg His Gly Phe Trp Leu Leu Val Thr Thr Ala
100 105 110
Ile Ala Thr Ser Leu Asp Ala Met Ala Val Gly Val Gly Leu Ala Phe
115 120 125
Leu Gln Val Asn Ile Ile Ala Thr Ala Leu Ala Ile Gly Cys Ala Thr
130 135 140
Leu Ile Met Ser Thr Leu Gly Met Met Val Gly Arg Phe Ile Gly Ser
145 150 155 160
Ile Ile Gly Lys Lys Ala Glu Ile Leu Gly Gly Leu Val Leu Ile Gly
165 170 175
Ile Gly Val Gln Ile Leu Trp Thr His Phe His Gly
180 185
<210> 27
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 27
cgggatccct tcgccaatgt ctggattg 28
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 28
atggagggtg gcatctttac 20
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 29
tgcatcaatc ggtaaagatg 20
<210> 30
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 30
aaggaaaaaa gcggccgcca actccgcact ctgctgta 38
<210> 31
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 31
ccatcacggc ttgttgttc 19
<210> 32
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 32
acgaaaaccc tcaataatc 19
Claims (10)
- 뉴클레오티드 서열로서,
i. 서열번호 1로 표시되는 야생형 kdtA 유전자 코딩 서열 82번째 염기의 돌연변이에 의해 형성된 서열; 또는
ii. 서열번호 13으로 표시되는 spoT 유전자 코딩 서열 520번째 염기의 돌연변이에 의해 형성된 서열; 또는
iii. 서열번호 23으로 표시되는 야생형 yebN 유전자 코딩 서열 74번째 염기의 돌연변이에 의해 형성된 뉴클레오티드 서열로부터 선택되는 서열을 포함하는, 뉴클레오티드 서열. - 제1항에 있어서,
i. 상기 돌연변이는 서열번호 1의 82번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이이거나; 또는
ii. 상기 돌연변이는 서열번호 13의 520번째 염기가 구아닌(G)에서 티민(T)으로의 돌연변이거나; 또는
iii. 상기 돌연변이는 서열번호 23의 74번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이인 것으로부터 선택되는 서열을 포함하는, 뉴클레오티드 서열. - 제1항에 있어서,
상기 돌연변이된 뉴클레오티드 서열은,
i. 서열번호 2로 표시되는 서열; 또는
ii. 서열번호 14로 표시되는 서열; 또는
iii. 서열번호 24로 표시되는 서열로부터 선택되는, 뉴클레오티드 서열. - 재조합 단백질로서,
제1항에 따른 뉴클레오티드 서열에 의해 코딩되고,
바람직하게는, 이의 아미노산 서열은 서열번호 4로 표시되거나; 또는
아미노산 서열은 서열번호 16으로 표시되거나; 또는
아미노산 서열은 서열번호 26으로 표시되는, 재조합 단백질. - 재조합 벡터로서,
제1항에 따른 뉴클레오티드 서열을 포함하는, 재조합 벡터. - 제5항에 있어서,
상기 재조합 벡터는 상기 뉴클레오티드 서열을 플라스미드에 도입하여 구축된 것인, 재조합 벡터. - 재조합 균주로서.
제1항에 따른 뉴클레오티드 서열을 포함하는, 재조합 균주. - 제7항에 있어서,
상기 재조합 균주는 제5항에 따른 재조합 벡터를 숙주 균주에 도입하여 재조합으로 형성된 것이고; 상기 숙주 균주는 대장균으로부터 선택되며; 예를 들어, 상기 숙주 균주는 E.coli K12, 이의 유도체 균주 E.coli K12(W3110) 또는 E.coli CGMCC 7.232 균주인, 재조합 균주. - 제7항에 따른 재조합 균주의 구축 방법으로서,
(1) 서열번호 1 또는 서열번호 13 또는 서열번호 23으로 표시되는 야생형 유전자의 뉴클레오티드 서열을 변형하여, 서열번호 2 또는 서열번호 14 또는 서열번호 24로 표시되는 돌연변이된 뉴클레오티드 서열을 획득하는 단계;
(2) 상기 돌연변이된 뉴클레오티드 서열과 플라스미드를 연결하여 재조합 벡터를 구축하되, 바람직하게 상기 플라스미드는 pKOV 플라스미드인 단계; 및
(3) 상기 재조합 벡터를 숙주 균주에 도입하여 상기 재조합 균주를 획득하는 단계를 포함하는, 재조합 균주의 구축 방법. - L-트레오닌의 발효 및 제조에서 제1항에 따른 뉴클레오티드 서열, 제4항에 따른 재조합 단백질, 제5항에 따른 재조합 벡터 또는 제7항에 따른 재조합 균주의 응용.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910804688.1A CN110564742B (zh) | 2019-08-28 | 2019-08-28 | 一种yebN基因改造的重组菌株及其构建方法与应用 |
CN201910804679.2 | 2019-08-28 | ||
CN201910804679.2A CN110592109B (zh) | 2019-08-28 | 2019-08-28 | 一种spoT基因改造的重组菌株及其构建方法与应用 |
CN201910804688.1 | 2019-08-28 | ||
CN201910926295.8A CN110804617B (zh) | 2019-09-27 | 2019-09-27 | 一种kdtA基因改造的重组菌株及其构建方法与应用 |
CN201910926295.8 | 2019-09-27 | ||
PCT/CN2020/111842 WO2021037166A1 (zh) | 2019-08-28 | 2020-08-27 | 基于大肠杆菌的重组菌株及其构建方法与应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220034218A true KR20220034218A (ko) | 2022-03-17 |
Family
ID=74683481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227005071A KR20220034218A (ko) | 2019-08-28 | 2020-08-27 | 대장균 기반 재조합 균주 및 이의 구축 방법과 응용 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220324919A1 (ko) |
EP (2) | EP4253569A3 (ko) |
JP (1) | JP7471395B2 (ko) |
KR (1) | KR20220034218A (ko) |
BR (1) | BR112022002535A2 (ko) |
WO (1) | WO2021037166A1 (ko) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008063900A1 (de) * | 2008-12-19 | 2010-06-24 | Wacker Chemie Ag | Verfahren zur fermentativen Herstellung von heterologen Proteinen mittels Escherichia coli |
EP2628792A1 (de) * | 2012-02-17 | 2013-08-21 | Evonik Industries AG | Zelle mit verringerter ppGppase-Aktivität |
CN107267568A (zh) * | 2017-07-21 | 2017-10-20 | 徐州工程学院 | 利用spoT基因缺失菌株通过发酵生产L‑氨基酸的方法 |
CN110804617B (zh) * | 2019-09-27 | 2020-09-22 | 黑龙江伊品生物科技有限公司 | 一种kdtA基因改造的重组菌株及其构建方法与应用 |
CN110592109B (zh) * | 2019-08-28 | 2020-10-09 | 黑龙江伊品生物科技有限公司 | 一种spoT基因改造的重组菌株及其构建方法与应用 |
CN110564742B (zh) * | 2019-08-28 | 2020-08-21 | 黑龙江伊品生物科技有限公司 | 一种yebN基因改造的重组菌株及其构建方法与应用 |
-
2020
- 2020-08-27 EP EP23180518.5A patent/EP4253569A3/en active Pending
- 2020-08-27 WO PCT/CN2020/111842 patent/WO2021037166A1/zh active Application Filing
- 2020-08-27 KR KR1020227005071A patent/KR20220034218A/ko not_active Application Discontinuation
- 2020-08-27 US US17/753,368 patent/US20220324919A1/en active Pending
- 2020-08-27 JP JP2022513939A patent/JP7471395B2/ja active Active
- 2020-08-27 EP EP20859580.1A patent/EP3992293A4/en active Pending
- 2020-08-27 BR BR112022002535A patent/BR112022002535A2/pt unknown
Also Published As
Publication number | Publication date |
---|---|
JP2022547010A (ja) | 2022-11-10 |
EP4253569A3 (en) | 2024-04-24 |
EP3992293A4 (en) | 2023-01-04 |
JP7471395B2 (ja) | 2024-04-19 |
WO2021037166A1 (zh) | 2021-03-04 |
EP3992293A1 (en) | 2022-05-04 |
US20220324919A1 (en) | 2022-10-13 |
BR112022002535A2 (pt) | 2022-05-03 |
EP4253569A2 (en) | 2023-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110195087B (zh) | 用改变ppc基因的细菌发酵生产L-赖氨酸的方法 | |
CN113667682B (zh) | Yh66-rs11190基因突变体及其在制备l-缬氨酸中的应用 | |
CN110592109B (zh) | 一种spoT基因改造的重组菌株及其构建方法与应用 | |
CN110846333B (zh) | 一种deoB基因改造的重组菌株及其构建方法与应用 | |
CN111471693B (zh) | 一种产赖氨酸的谷氨酸棒杆菌及其构建方法与应用 | |
CN110592084B (zh) | 一种rhtA基因启动子改造的重组菌株及其构建方法与应用 | |
CN110846312B (zh) | 一种sdaA基因的启动子核酸序列、含有该核酸序列的重组菌株及其应用 | |
CN110079566B (zh) | 用改变ppc启动子的细菌发酵生产L-赖氨酸的方法 | |
CN110804617B (zh) | 一种kdtA基因改造的重组菌株及其构建方法与应用 | |
CN110564742B (zh) | 一种yebN基因改造的重组菌株及其构建方法与应用 | |
KR20220034218A (ko) | 대장균 기반 재조합 균주 및 이의 구축 방법과 응용 | |
CN114181288A (zh) | 制备l-缬氨酸的方法及其所用的基因与该基因编码的蛋白质 | |
RU2813283C2 (ru) | Рекомбинантный штамм на основе escherichia coli, способ его конструирования и его применение | |
KR20220034220A (ko) | 대장균 기반 재조합 균주 및 이의 구축 방법과 응용 | |
RU2813511C2 (ru) | Рекомбинантный штамм на основе escherichia coli и способ его конструирования и его применение | |
CN114560918B (zh) | Yh66_14275蛋白或其突变体在制备l-精氨酸中的应用 | |
CN114605509B (zh) | Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用 | |
CN114507273B (zh) | Yh66_07020蛋白及其相关生物材料在提高精氨酸产量中的应用 | |
CN114315998B (zh) | Cey17_rs00300基因突变体及其在制备l-缬氨酸中的应用 | |
CN114277069B (zh) | 制备l-缬氨酸的方法及其所用生物材料 | |
CN114410615B (zh) | Yh66_00525蛋白及其编码基因在调控细菌精氨酸产量中的应用 | |
CN114539367B (zh) | Cey17_rs11900基因突变体及其在制备l-缬氨酸中的应用 | |
CN110438058B (zh) | 一种产l-色氨酸的重组菌株及其构建方法与应用 | |
CN113683667B (zh) | Yh66-rs10865基因改造得到的工程菌及其在制备缬氨酸中的应用 | |
CN117551708A (zh) | 一种制备l-谷氨酸的方法及其相关bbd29_13530基因突变体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |