KR20220110249A - 재조합 미생물로부터 에틸렌을 생산하기 위한 방법 및 조성물 - Google Patents
재조합 미생물로부터 에틸렌을 생산하기 위한 방법 및 조성물 Download PDFInfo
- Publication number
- KR20220110249A KR20220110249A KR1020227022359A KR20227022359A KR20220110249A KR 20220110249 A KR20220110249 A KR 20220110249A KR 1020227022359 A KR1020227022359 A KR 1020227022359A KR 20227022359 A KR20227022359 A KR 20227022359A KR 20220110249 A KR20220110249 A KR 20220110249A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- nucleotide sequence
- native
- ala
- gly
- Prior art date
Links
- 244000005700 microbiome Species 0.000 title claims abstract description 271
- 239000005977 Ethylene Substances 0.000 title claims abstract description 120
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 79
- 239000000203 mixture Substances 0.000 title description 3
- 238000004519 manufacturing process Methods 0.000 claims abstract description 83
- 230000001976 improved effect Effects 0.000 claims abstract description 20
- 238000009629 microbiological culture Methods 0.000 claims abstract description 17
- 230000001965 increasing effect Effects 0.000 claims abstract description 13
- 239000002773 nucleotide Substances 0.000 claims description 410
- 125000003729 nucleotide group Chemical group 0.000 claims description 410
- 108010065744 ethylene forming enzyme Proteins 0.000 claims description 264
- 230000014509 gene expression Effects 0.000 claims description 252
- 101710098648 Alpha-ketoglutarate permease Proteins 0.000 claims description 124
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 91
- 239000013612 plasmid Substances 0.000 claims description 68
- 241000894006 Bacteria Species 0.000 claims description 51
- 230000001580 bacterial effect Effects 0.000 claims description 42
- 241000588724 Escherichia coli Species 0.000 claims description 37
- 108090000623 proteins and genes Proteins 0.000 claims description 32
- 108010062110 water dikinase pyruvate Proteins 0.000 claims description 26
- 241000195585 Chlamydomonas Species 0.000 claims description 25
- 241000192700 Cyanobacteria Species 0.000 claims description 25
- KPGXRSRHYNQIFN-UHFFFAOYSA-L 2-oxoglutarate(2-) Chemical compound [O-]C(=O)CCC(=O)C([O-])=O KPGXRSRHYNQIFN-UHFFFAOYSA-L 0.000 claims description 24
- 102000012011 Isocitrate Dehydrogenase Human genes 0.000 claims description 22
- 108010075869 Isocitrate Dehydrogenase Proteins 0.000 claims description 22
- 241000589516 Pseudomonas Species 0.000 claims description 20
- 241001148183 Pseudomonas savastanoi Species 0.000 claims description 20
- 102000004169 proteins and genes Human genes 0.000 claims description 19
- 108010030844 2-methylcitrate synthase Proteins 0.000 claims description 17
- 108010071536 Citrate (Si)-synthase Proteins 0.000 claims description 17
- 102000006732 Citrate synthase Human genes 0.000 claims description 17
- 101710117283 Sucrose permease Proteins 0.000 claims description 17
- 238000012217 deletion Methods 0.000 claims description 17
- 230000037430 deletion Effects 0.000 claims description 17
- 241000195597 Chlamydomonas reinhardtii Species 0.000 claims description 16
- 241000589615 Pseudomonas syringae Species 0.000 claims description 16
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 16
- 241000588722 Escherichia Species 0.000 claims description 15
- 241000233866 Fungi Species 0.000 claims description 15
- 239000012298 atmosphere Substances 0.000 claims description 15
- 230000000243 photosynthetic effect Effects 0.000 claims description 15
- 241000195493 Cryptophyta Species 0.000 claims description 13
- 241000488157 Escherichia sp. Species 0.000 claims description 13
- 241000192584 Synechocystis Species 0.000 claims description 13
- 235000015097 nutrients Nutrition 0.000 claims description 12
- 108091033409 CRISPR Proteins 0.000 claims description 10
- 238000010354 CRISPR gene editing Methods 0.000 claims description 10
- 238000012258 culturing Methods 0.000 claims description 10
- 230000006801 homologous recombination Effects 0.000 claims description 10
- 238000002744 homologous recombination Methods 0.000 claims description 10
- 238000002823 phage display Methods 0.000 claims description 10
- 108700023224 Glucose-1-phosphate adenylyltransferases Proteins 0.000 claims description 9
- 239000012190 activator Substances 0.000 claims description 9
- 229930006000 Sucrose Natural products 0.000 claims description 8
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 8
- 239000005720 sucrose Substances 0.000 claims description 8
- 241001453296 Synechococcus elongatus Species 0.000 claims description 7
- 230000001939 inductive effect Effects 0.000 claims description 6
- 239000007788 liquid Substances 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 238000004113 cell culture Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 238000003306 harvesting Methods 0.000 claims description 4
- 102000007390 Glycogen Phosphorylase Human genes 0.000 claims description 3
- 108010046163 Glycogen Phosphorylase Proteins 0.000 claims description 3
- 108010001483 Glycogen Synthase Proteins 0.000 claims description 3
- 108700006291 Sucrose-phosphate synthases Proteins 0.000 claims description 3
- 241000192707 Synechococcus Species 0.000 claims description 3
- 241001453317 Synechococcus leopoliensis Species 0.000 claims description 3
- 108010051210 beta-Fructofuranosidase Proteins 0.000 claims description 3
- 108091022928 glucosylglycerol-phosphate synthase Proteins 0.000 claims description 3
- 241000192542 Anabaena Species 0.000 claims description 2
- 108010082433 UDP-glucose-hexose-1-phosphate uridylyltransferase Proteins 0.000 claims description 2
- 229950010772 glucose-1-phosphate Drugs 0.000 claims description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 abstract description 92
- 229910002092 carbon dioxide Inorganic materials 0.000 abstract description 46
- 239000001569 carbon dioxide Substances 0.000 abstract description 45
- 230000008901 benefit Effects 0.000 abstract description 16
- 239000000126 substance Substances 0.000 abstract description 6
- 239000004033 plastic Substances 0.000 abstract description 4
- 229920003023 plastic Polymers 0.000 abstract description 4
- 239000000835 fiber Substances 0.000 abstract description 2
- 230000009467 reduction Effects 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 38
- 108020004705 Codon Proteins 0.000 description 35
- 238000000746 purification Methods 0.000 description 21
- 238000010367 cloning Methods 0.000 description 19
- 108010050848 glycylleucine Proteins 0.000 description 19
- 108010047495 alanylglycine Proteins 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 17
- 210000004027 cell Anatomy 0.000 description 16
- 241000880493 Leptailurus serval Species 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 14
- 229940024606 amino acid Drugs 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 14
- 230000006698 induction Effects 0.000 description 14
- 108091033319 polynucleotide Proteins 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 12
- 241000192581 Synechocystis sp. Species 0.000 description 12
- 108090000765 processed proteins & peptides Proteins 0.000 description 12
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 11
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 11
- 235000018102 proteins Nutrition 0.000 description 11
- 108010061238 threonyl-glycine Proteins 0.000 description 11
- 108010062796 arginyllysine Proteins 0.000 description 10
- 108010038633 aspartylglutamate Proteins 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 10
- 108010031719 prolyl-serine Proteins 0.000 description 10
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 9
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 9
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 239000013592 cell lysate Substances 0.000 description 9
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 9
- 108010089804 glycyl-threonine Proteins 0.000 description 9
- 108010009298 lysylglutamic acid Proteins 0.000 description 9
- 229920001184 polypeptide Polymers 0.000 description 9
- 102000004196 processed proteins & peptides Human genes 0.000 description 9
- 108010090894 prolylleucine Proteins 0.000 description 9
- 108010080629 tryptophan-leucine Proteins 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 8
- 108010041407 alanylaspartic acid Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 108010078144 glutaminyl-glycine Proteins 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 8
- 108010036413 histidylglycine Proteins 0.000 description 8
- 108010012581 phenylalanylglutamate Proteins 0.000 description 8
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 7
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 7
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 7
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 108010053725 prolylvaline Proteins 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- 239000004475 Arginine Substances 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 6
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 6
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 6
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 6
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 6
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 6
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 6
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 6
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 6
- 108010044940 alanylglutamine Proteins 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 6
- 108010078274 isoleucylvaline Proteins 0.000 description 6
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 150000002894 organic compounds Chemical class 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 108010078580 tyrosylleucine Proteins 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 5
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 5
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- 241000672609 Escherichia coli BL21 Species 0.000 description 5
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 5
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 5
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 5
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 5
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 5
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 5
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 5
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 5
- 238000002105 Southern blotting Methods 0.000 description 5
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 5
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 5
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 5
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 5
- 108010068380 arginylarginine Proteins 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 238000001502 gel electrophoresis Methods 0.000 description 5
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 5
- 108010084389 glycyltryptophan Proteins 0.000 description 5
- 108010087823 glycyltyrosine Proteins 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 108010084932 tryptophyl-proline Proteins 0.000 description 5
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 4
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 4
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 4
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 4
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 4
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 4
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 4
- 239000002028 Biomass Substances 0.000 description 4
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 4
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 4
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 4
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 4
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 4
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 4
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 4
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 4
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 4
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 4
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 4
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 4
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 4
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 4
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 4
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 4
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 4
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 4
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 4
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 4
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 4
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 4
- 240000000111 Saccharum officinarum Species 0.000 description 4
- 235000007201 Saccharum officinarum Nutrition 0.000 description 4
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 4
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 4
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 4
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 4
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 4
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 4
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- 108010011559 alanylphenylalanine Proteins 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 101150075169 cscB gene Proteins 0.000 description 4
- 239000002803 fossil fuel Substances 0.000 description 4
- 101150013858 glgC gene Proteins 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 4
- 230000002018 overexpression Effects 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 108010079317 prolyl-tyrosine Proteins 0.000 description 4
- 101150075980 psbA gene Proteins 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 238000010792 warming Methods 0.000 description 4
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 3
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 3
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 3
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 3
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 3
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 3
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 3
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 3
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 3
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 3
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 3
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 3
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 3
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 3
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 3
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 3
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 3
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 3
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 3
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 3
- QQJSJIBESHAJPM-IHRRRGAJSA-N Arg-Cys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QQJSJIBESHAJPM-IHRRRGAJSA-N 0.000 description 3
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 3
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 3
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 3
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 3
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 3
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 3
- RLHANKIRBONJBK-IHRRRGAJSA-N Asn-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N RLHANKIRBONJBK-IHRRRGAJSA-N 0.000 description 3
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 3
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 3
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 3
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 3
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 3
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 3
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 3
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 3
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 3
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 3
- NONWUQAWAANERO-BZSNNMDCSA-N Asp-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 NONWUQAWAANERO-BZSNNMDCSA-N 0.000 description 3
- KKZHXOOZHFABQQ-UWJYBYFXSA-N Cys-Ala-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKZHXOOZHFABQQ-UWJYBYFXSA-N 0.000 description 3
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 3
- KFYPRIGJTICABD-XGEHTFHBSA-N Cys-Thr-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N)O KFYPRIGJTICABD-XGEHTFHBSA-N 0.000 description 3
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 3
- 108010090461 DFG peptide Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 3
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 3
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 3
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 3
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 3
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 3
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 3
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 3
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 3
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 3
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 3
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 3
- ZJFNRQHUIHKZJF-GUBZILKMSA-N Glu-His-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ZJFNRQHUIHKZJF-GUBZILKMSA-N 0.000 description 3
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 3
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 3
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 3
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 3
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 3
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 3
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 3
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 3
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 3
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 3
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 3
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 3
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 3
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 3
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 3
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 3
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 3
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 3
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 3
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 3
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 3
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 3
- OSZUPUINVNPCOE-SDDRHHMPSA-N His-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OSZUPUINVNPCOE-SDDRHHMPSA-N 0.000 description 3
- GHAFKUCRIVBLDJ-IHRRRGAJSA-N His-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N GHAFKUCRIVBLDJ-IHRRRGAJSA-N 0.000 description 3
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 3
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 3
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 3
- 101150020771 IDH gene Proteins 0.000 description 3
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 3
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 3
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 3
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 3
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 3
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 3
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 3
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 3
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 3
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 3
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 3
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 3
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 3
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 3
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 3
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 3
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 3
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 3
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 3
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 3
- UFPLDOKWDNTTRP-ULQDDVLXSA-N Leu-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=C(O)C=C1 UFPLDOKWDNTTRP-ULQDDVLXSA-N 0.000 description 3
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 3
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 3
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 3
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 3
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 3
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 3
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 3
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 3
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 3
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 3
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 3
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 3
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 3
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 3
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 3
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 3
- 108010066427 N-valyltryptophan Proteins 0.000 description 3
- 244000061176 Nicotiana tabacum Species 0.000 description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 3
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 3
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 3
- RTUWVJVJSMOGPL-KKUMJFAQSA-N Phe-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RTUWVJVJSMOGPL-KKUMJFAQSA-N 0.000 description 3
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 3
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 3
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 3
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 3
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 3
- OGRYXQOUFHAMPI-DCAQKATOSA-N Pro-Cys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O OGRYXQOUFHAMPI-DCAQKATOSA-N 0.000 description 3
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 3
- SNSYSBUTTJBPDG-OKZBNKHCSA-N Pro-Trp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N4CCC[C@@H]4C(=O)O SNSYSBUTTJBPDG-OKZBNKHCSA-N 0.000 description 3
- VBZXFFYOBDLLFE-HSHDSVGOSA-N Pro-Trp-Thr Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H]([C@H](O)C)C(O)=O)C(=O)[C@@H]1CCCN1 VBZXFFYOBDLLFE-HSHDSVGOSA-N 0.000 description 3
- 241000589776 Pseudomonas putida Species 0.000 description 3
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 3
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 3
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 3
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 3
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 3
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 3
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 3
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 3
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 3
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 3
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 3
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 3
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 3
- 241000499912 Trichoderma reesei Species 0.000 description 3
- 241000223261 Trichoderma viride Species 0.000 description 3
- IXEGQBJZDIRRIV-QEJZJMRPSA-N Trp-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IXEGQBJZDIRRIV-QEJZJMRPSA-N 0.000 description 3
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 3
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 3
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 3
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 3
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 3
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 3
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 3
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 3
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 3
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 108010085203 methionylmethionine Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 3
- 108010029384 tryptophyl-histidine Proteins 0.000 description 3
- 108010044292 tryptophyltyrosine Proteins 0.000 description 3
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 2
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 2
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 2
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 2
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 2
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 2
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 2
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 2
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 2
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 2
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 2
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 2
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 2
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 2
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 2
- YWFLXGZHZXXINF-BPUTZDHNSA-N Asn-Pro-Trp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 YWFLXGZHZXXINF-BPUTZDHNSA-N 0.000 description 2
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 2
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 2
- PJERDVUTUDZPGX-ZKWXMUAHSA-N Asp-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O PJERDVUTUDZPGX-ZKWXMUAHSA-N 0.000 description 2
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 2
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 2
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 2
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 2
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 2
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 2
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 2
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 2
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 2
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 2
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 2
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 2
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 2
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 2
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 2
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 2
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 2
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- 229920002527 Glycogen Polymers 0.000 description 2
- DGYNAJNQMBFYIF-SZMVWBNQSA-N His-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 DGYNAJNQMBFYIF-SZMVWBNQSA-N 0.000 description 2
- CTGZVVQVIBSOBB-AVGNSLFASA-N His-His-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTGZVVQVIBSOBB-AVGNSLFASA-N 0.000 description 2
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- CISBRYJZMFWOHJ-JBDRJPRFSA-N Ile-Ala-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N CISBRYJZMFWOHJ-JBDRJPRFSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 2
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 2
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 2
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 2
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 2
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 2
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 2
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 2
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 2
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 2
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 2
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 2
- 239000006137 Luria-Bertani broth Substances 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 2
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 2
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 2
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 2
- UJDMTKHGWSBHBX-IHRRRGAJSA-N Met-Cys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UJDMTKHGWSBHBX-IHRRRGAJSA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- CUICVBQQHMKBRJ-LSJOCFKGSA-N Met-His-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O CUICVBQQHMKBRJ-LSJOCFKGSA-N 0.000 description 2
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 2
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 2
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 2
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 2
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 2
- KPVLLNDCBYXKNV-CYDGBPFRSA-N Met-Val-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KPVLLNDCBYXKNV-CYDGBPFRSA-N 0.000 description 2
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 2
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 2
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 2
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 2
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 2
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 2
- ACJULKNZOCRWEI-ULQDDVLXSA-N Phe-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O ACJULKNZOCRWEI-ULQDDVLXSA-N 0.000 description 2
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 2
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 2
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 2
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 2
- BTAIJUBAGLVFKQ-BVSLBCMMSA-N Phe-Trp-Val Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C(C)C)C(O)=O)C1=CC=CC=C1 BTAIJUBAGLVFKQ-BVSLBCMMSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 2
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- QGLFRQCECIWXFA-RCWTZXSCSA-N Pro-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1)O QGLFRQCECIWXFA-RCWTZXSCSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 2
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 2
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000192560 Synechococcus sp. Species 0.000 description 2
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 2
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 2
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 2
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 2
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 2
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 2
- AOAMKFFPFOPMLX-BVSLBCMMSA-N Trp-Arg-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 AOAMKFFPFOPMLX-BVSLBCMMSA-N 0.000 description 2
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 2
- WLQRIHCMPFHGKP-PMVMPFDFSA-N Trp-Leu-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=CC=C1 WLQRIHCMPFHGKP-PMVMPFDFSA-N 0.000 description 2
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 2
- NSOMQRHZMJMZIE-GVARAGBVSA-N Tyr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NSOMQRHZMJMZIE-GVARAGBVSA-N 0.000 description 2
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 2
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 2
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 2
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 2
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 2
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 2
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 2
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 2
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- XPYNXORPPVTVQK-SRVKXCTJSA-N Val-Arg-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N XPYNXORPPVTVQK-SRVKXCTJSA-N 0.000 description 2
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- WBUOKGBHGDPYMH-GUBZILKMSA-N Val-Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)C(C)C WBUOKGBHGDPYMH-GUBZILKMSA-N 0.000 description 2
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 2
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 2
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 2
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 2
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 2
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 2
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 150000003862 amino acid derivatives Chemical class 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 2
- 108010066119 arginyl-leucyl-aspartyl-serine Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010924 continuous production Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 101150111968 efe gene Proteins 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 101150106096 gltA gene Proteins 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 229940096919 glycogen Drugs 0.000 description 2
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 101150023641 ppc gene Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000004230 steam cracking Methods 0.000 description 2
- 239000004753 textile Substances 0.000 description 2
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- SADYNMDJGAWAEW-JKQORVJESA-N (2s)-2-[[(2s)-3-carboxy-2-[[(2s)-2-[[(2s)-2,6-diaminohexanoyl]amino]-3-methylbutanoyl]amino]propanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN SADYNMDJGAWAEW-JKQORVJESA-N 0.000 description 1
- BEJKOYIMCGMNRB-GRHHLOCNSA-N (2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BEJKOYIMCGMNRB-GRHHLOCNSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 1
- KDZIGQIDPXKMBA-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-methylbutanoyl)amino]acetyl]amino]-3-hydroxypropanoyl]amino]pentanedioic acid Chemical compound CC(C)C(N)C(=O)NCC(=O)NC(CO)C(=O)NC(C(O)=O)CCC(O)=O KDZIGQIDPXKMBA-UHFFFAOYSA-N 0.000 description 1
- DVGKRPYUFRZAQW-UHFFFAOYSA-N 3 prime Natural products CC(=O)NC1OC(CC(O)C1C(O)C(O)CO)(OC2C(O)C(CO)OC(OC3C(O)C(O)C(O)OC3CO)C2O)C(=O)O DVGKRPYUFRZAQW-UHFFFAOYSA-N 0.000 description 1
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- MBWYUTNBYSSUIQ-HERUPUMHSA-N Ala-Asn-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N MBWYUTNBYSSUIQ-HERUPUMHSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 1
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- LBFXVAXPDOBRKU-LKTVYLICSA-N Ala-His-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LBFXVAXPDOBRKU-LKTVYLICSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 1
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- PHQXWZGXKAFWAZ-ZLIFDBKOSA-N Ala-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 PHQXWZGXKAFWAZ-ZLIFDBKOSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- XKXAZPSREVUCRT-BPNCWPANSA-N Ala-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=C(O)C=C1 XKXAZPSREVUCRT-BPNCWPANSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- XKHLBBQNPSOGPI-GUBZILKMSA-N Ala-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N XKHLBBQNPSOGPI-GUBZILKMSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- OLDOLPWZEMHNIA-PJODQICGSA-N Arg-Ala-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OLDOLPWZEMHNIA-PJODQICGSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- 108010010777 Arg-Gly-Asp-Gly Proteins 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- QEHMMRSQJMOYNO-DCAQKATOSA-N Arg-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QEHMMRSQJMOYNO-DCAQKATOSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- FOQFHANLUJDQEE-GUBZILKMSA-N Arg-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(=O)O FOQFHANLUJDQEE-GUBZILKMSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- FXGMURPOWCKNAZ-JYJNAYRXSA-N Arg-Val-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FXGMURPOWCKNAZ-JYJNAYRXSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- NTXNUXPCNRDMAF-WFBYXXMGSA-N Asn-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC(N)=O)C)C(O)=O)=CNC2=C1 NTXNUXPCNRDMAF-WFBYXXMGSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- XLHLPYFMXGOASD-CIUDSAMLSA-N Asn-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLHLPYFMXGOASD-CIUDSAMLSA-N 0.000 description 1
- QEQVUHQQYDZUEN-GUBZILKMSA-N Asn-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N QEQVUHQQYDZUEN-GUBZILKMSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 1
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- APYNREQHZOGYHV-ACZMJKKPSA-N Asp-Cys-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N APYNREQHZOGYHV-ACZMJKKPSA-N 0.000 description 1
- YBMUFUWSMIKJQA-GUBZILKMSA-N Asp-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N YBMUFUWSMIKJQA-GUBZILKMSA-N 0.000 description 1
- JRBVWZLHBGYZNY-QEJZJMRPSA-N Asp-Gln-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRBVWZLHBGYZNY-QEJZJMRPSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 1
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 1
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 1
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- YODBPLSWNJMZOJ-BPUTZDHNSA-N Asp-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N YODBPLSWNJMZOJ-BPUTZDHNSA-N 0.000 description 1
- LTARLVHGOGBRHN-AAEUAGOBSA-N Asp-Trp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O LTARLVHGOGBRHN-AAEUAGOBSA-N 0.000 description 1
- IHZFGJLKDYINPV-XIRDDKMYSA-N Asp-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(O)=O)N)C(O)=O)C1=CN=CN1 IHZFGJLKDYINPV-XIRDDKMYSA-N 0.000 description 1
- KACWACLNYLSVCA-VHWLVUOQSA-N Asp-Trp-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KACWACLNYLSVCA-VHWLVUOQSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- HTSSXFASOUSJQG-IHPCNDPISA-N Asp-Tyr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HTSSXFASOUSJQG-IHPCNDPISA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 1
- GZYDPEJSZYZWEF-MXAVVETBSA-N Asp-Val-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O GZYDPEJSZYZWEF-MXAVVETBSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101100351124 Bacillus subtilis (strain 168) pckA gene Proteins 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical compound OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- 108010072454 CTGCAG-specific type II deoxyribonucleases Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 108091029430 CpG site Proteins 0.000 description 1
- IIGHQOPGMGKDMT-SRVKXCTJSA-N Cys-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N IIGHQOPGMGKDMT-SRVKXCTJSA-N 0.000 description 1
- SFRQEQGPRTVDPO-NRPADANISA-N Cys-Gln-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O SFRQEQGPRTVDPO-NRPADANISA-N 0.000 description 1
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 1
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- LYSHSHHDBVKJRN-JBDRJPRFSA-N Cys-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N LYSHSHHDBVKJRN-JBDRJPRFSA-N 0.000 description 1
- LKUCSUGWHYVYLP-GHCJXIJMSA-N Cys-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N LKUCSUGWHYVYLP-GHCJXIJMSA-N 0.000 description 1
- ODDOYXKAHLKKQY-MMWGEVLESA-N Cys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N ODDOYXKAHLKKQY-MMWGEVLESA-N 0.000 description 1
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 1
- BHAMDFHCNPRSQL-UHFFFAOYSA-N Cys-Met-Met-Cys Chemical compound SCC(N)C(=O)NC(CCSC)C(=O)NC(CCSC)C(=O)NC(CS)C(O)=O BHAMDFHCNPRSQL-UHFFFAOYSA-N 0.000 description 1
- DTFJUSWYECELTM-BPUTZDHNSA-N Cys-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O DTFJUSWYECELTM-BPUTZDHNSA-N 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- AZDQAZRURQMSQD-XPUUQOCRSA-N Cys-Val-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AZDQAZRURQMSQD-XPUUQOCRSA-N 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 101100061504 Escherichia coli cscB gene Proteins 0.000 description 1
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- -1 GC content Proteins 0.000 description 1
- 108010046649 GDNP peptide Proteins 0.000 description 1
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 1
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 1
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- SSWAFVQFQWOJIJ-XIRDDKMYSA-N Gln-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N SSWAFVQFQWOJIJ-XIRDDKMYSA-N 0.000 description 1
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 1
- PONUFVLSGMQFAI-AVGNSLFASA-N Gln-Asn-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PONUFVLSGMQFAI-AVGNSLFASA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- VVWWRZZMPSPVQU-KBIXCLLPSA-N Gln-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N VVWWRZZMPSPVQU-KBIXCLLPSA-N 0.000 description 1
- PZVJDMJHKUWSIV-AVGNSLFASA-N Gln-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)O PZVJDMJHKUWSIV-AVGNSLFASA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- QFJPFPCSXOXMKI-BPUTZDHNSA-N Gln-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N QFJPFPCSXOXMKI-BPUTZDHNSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- TYRMVTKPOWPZBC-SXNHZJKMSA-N Gln-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N TYRMVTKPOWPZBC-SXNHZJKMSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- AMHIFFIUJOJEKJ-SZMVWBNQSA-N Gln-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N AMHIFFIUJOJEKJ-SZMVWBNQSA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- XBWGJWXGUNSZAT-CIUDSAMLSA-N Gln-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XBWGJWXGUNSZAT-CIUDSAMLSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- SYTFJIQPBRJSOK-NKIYYHGXSA-N Gln-Thr-His Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 SYTFJIQPBRJSOK-NKIYYHGXSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- XMWNHGKDDIFXQJ-NWLDYVSISA-N Gln-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XMWNHGKDDIFXQJ-NWLDYVSISA-N 0.000 description 1
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- RSUVOPBMWMTVDI-XEGUGMAKSA-N Glu-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(O)=O)C)C(O)=O)=CNC2=C1 RSUVOPBMWMTVDI-XEGUGMAKSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- DRLVXRQFROIYTD-GUBZILKMSA-N Glu-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DRLVXRQFROIYTD-GUBZILKMSA-N 0.000 description 1
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- ZGKXAUIVGIBISK-SZMVWBNQSA-N Glu-His-Trp Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]cn1)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O ZGKXAUIVGIBISK-SZMVWBNQSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 1
- JLCYOCDGIUZMKQ-JBACZVJFSA-N Glu-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N JLCYOCDGIUZMKQ-JBACZVJFSA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- LJXWZPHEMJSNRC-KBPBESRZSA-N Gly-Gln-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LJXWZPHEMJSNRC-KBPBESRZSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- PYFHPYDQHCEVIT-KBPBESRZSA-N Gly-Trp-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O PYFHPYDQHCEVIT-KBPBESRZSA-N 0.000 description 1
- UMRIXLHPZZIOML-OALUTQOASA-N Gly-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN UMRIXLHPZZIOML-OALUTQOASA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 1
- YPLYIXGKCRQZGW-SRVKXCTJSA-N His-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YPLYIXGKCRQZGW-SRVKXCTJSA-N 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- BQYZXYCEKYJKAM-VGDYDELISA-N His-Cys-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQYZXYCEKYJKAM-VGDYDELISA-N 0.000 description 1
- LIEIYPBMQJLASB-SRVKXCTJSA-N His-Gln-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LIEIYPBMQJLASB-SRVKXCTJSA-N 0.000 description 1
- VYMGAXSNYUFVCK-GUBZILKMSA-N His-Gln-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N VYMGAXSNYUFVCK-GUBZILKMSA-N 0.000 description 1
- FLYSHWAAHYNKRT-JYJNAYRXSA-N His-Gln-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLYSHWAAHYNKRT-JYJNAYRXSA-N 0.000 description 1
- SDTPKSOWFXBACN-GUBZILKMSA-N His-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O SDTPKSOWFXBACN-GUBZILKMSA-N 0.000 description 1
- WGHJXSONOOTTCZ-JYJNAYRXSA-N His-Glu-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WGHJXSONOOTTCZ-JYJNAYRXSA-N 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 1
- KAFZDWMZKGQDEE-SRVKXCTJSA-N His-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KAFZDWMZKGQDEE-SRVKXCTJSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 1
- MFQVZYSPCIZFMR-MGHWNKPDSA-N His-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N MFQVZYSPCIZFMR-MGHWNKPDSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 1
- MIHTTYXBXIRRGV-AVGNSLFASA-N His-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MIHTTYXBXIRRGV-AVGNSLFASA-N 0.000 description 1
- SAPLASXFNUYUFE-CQDKDKBSSA-N His-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N SAPLASXFNUYUFE-CQDKDKBSSA-N 0.000 description 1
- RLAOTFTXBFQJDV-KKUMJFAQSA-N His-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CN=CN1 RLAOTFTXBFQJDV-KKUMJFAQSA-N 0.000 description 1
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 1
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 1
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 1
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 1
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- PDLQNLSEJXOQNQ-IHPCNDPISA-N His-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CN=CN1 PDLQNLSEJXOQNQ-IHPCNDPISA-N 0.000 description 1
- FOCSWPCHUDVNLP-PMVMPFDFSA-N His-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC4=CN=CN4)N FOCSWPCHUDVNLP-PMVMPFDFSA-N 0.000 description 1
- FRDFAWHTPDKRHG-ULQDDVLXSA-N His-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 FRDFAWHTPDKRHG-ULQDDVLXSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 1
- MUENHEQLLUDKSC-PMVMPFDFSA-N His-Tyr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 MUENHEQLLUDKSC-PMVMPFDFSA-N 0.000 description 1
- GYXDQXPCPASCNR-NHCYSSNCSA-N His-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N GYXDQXPCPASCNR-NHCYSSNCSA-N 0.000 description 1
- WSXNWASHQNSMRX-GVXVVHGQSA-N His-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSXNWASHQNSMRX-GVXVVHGQSA-N 0.000 description 1
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- RSDHVTMRXSABSV-GHCJXIJMSA-N Ile-Asn-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N RSDHVTMRXSABSV-GHCJXIJMSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- JQLFYZMEXFNRFS-DJFWLOJKSA-N Ile-Asp-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N JQLFYZMEXFNRFS-DJFWLOJKSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- LLHYWBGDMBGNHA-VGDYDELISA-N Ile-Cys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LLHYWBGDMBGNHA-VGDYDELISA-N 0.000 description 1
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- ZXIGYKICRDFISM-DJFWLOJKSA-N Ile-His-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZXIGYKICRDFISM-DJFWLOJKSA-N 0.000 description 1
- JNDYZNJRRNFYIR-VGDYDELISA-N Ile-His-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N JNDYZNJRRNFYIR-VGDYDELISA-N 0.000 description 1
- VNDQNDYEPSXHLU-JUKXBJQTSA-N Ile-His-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N VNDQNDYEPSXHLU-JUKXBJQTSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- RQQCJTLBSJMVCR-DSYPUSFNSA-N Ile-Leu-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RQQCJTLBSJMVCR-DSYPUSFNSA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 1
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 1
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- NHRINZSPIUXYQZ-DCAQKATOSA-N Leu-Met-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N NHRINZSPIUXYQZ-DCAQKATOSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 1
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- WXDRGWBQZIMJDE-ULQDDVLXSA-N Leu-Phe-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O WXDRGWBQZIMJDE-ULQDDVLXSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- MAXILRZVORNXBE-PMVMPFDFSA-N Leu-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MAXILRZVORNXBE-PMVMPFDFSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- JLYUZRKPDKHUTC-WDSOQIARSA-N Leu-Pro-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JLYUZRKPDKHUTC-WDSOQIARSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- RNYLNYTYMXACRI-VFAJRCTISA-N Leu-Thr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O RNYLNYTYMXACRI-VFAJRCTISA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- WPIKRJDRQVFRHP-TUSQITKMSA-N Leu-Trp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O WPIKRJDRQVFRHP-TUSQITKMSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- GHOIOYHDDKXIDX-SZMVWBNQSA-N Lys-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 GHOIOYHDDKXIDX-SZMVWBNQSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 1
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 1
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 1
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 1
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 1
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 1
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 1
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 1
- 108010072489 Met-Ile-Phe-Leu Proteins 0.000 description 1
- AFVOKRHYSSFPHC-STECZYCISA-N Met-Ile-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFVOKRHYSSFPHC-STECZYCISA-N 0.000 description 1
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 1
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 1
- OXIWIYOJVNOKOV-SRVKXCTJSA-N Met-Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCNC(N)=N OXIWIYOJVNOKOV-SRVKXCTJSA-N 0.000 description 1
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 1
- CNTNPWWHFWAZGA-JYJNAYRXSA-N Met-Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CNTNPWWHFWAZGA-JYJNAYRXSA-N 0.000 description 1
- GFDBWMDLBKCLQH-IHRRRGAJSA-N Met-Phe-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N GFDBWMDLBKCLQH-IHRRRGAJSA-N 0.000 description 1
- KBTQZYASLSUFJR-KKUMJFAQSA-N Met-Phe-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KBTQZYASLSUFJR-KKUMJFAQSA-N 0.000 description 1
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 1
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- SBFPAAPFKZPDCZ-JYJNAYRXSA-N Met-Pro-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SBFPAAPFKZPDCZ-JYJNAYRXSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- XLTSAUGGDYRFLS-UMPQAUOISA-N Met-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCSC)N)O XLTSAUGGDYRFLS-UMPQAUOISA-N 0.000 description 1
- NSMXRFMGZYTFEX-KJEVXHAQSA-N Met-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCSC)N)O NSMXRFMGZYTFEX-KJEVXHAQSA-N 0.000 description 1
- XTSBLBXAUIBMLW-KKUMJFAQSA-N Met-Tyr-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N XTSBLBXAUIBMLW-KKUMJFAQSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- ALTHVGNGGZZSAC-SRVKXCTJSA-N Met-Val-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N ALTHVGNGGZZSAC-SRVKXCTJSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 1
- IQJMEDDVOGMTKT-SRVKXCTJSA-N Met-Val-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IQJMEDDVOGMTKT-SRVKXCTJSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241001507673 Penicillium digitatum Species 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 1
- CTNODEMQIKCZGQ-JYJNAYRXSA-N Phe-Gln-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 CTNODEMQIKCZGQ-JYJNAYRXSA-N 0.000 description 1
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- XXAOSEUPEMQJOF-KKUMJFAQSA-N Phe-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XXAOSEUPEMQJOF-KKUMJFAQSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- FINLZXKJWTYYLC-ACRUOGEOSA-N Phe-His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FINLZXKJWTYYLC-ACRUOGEOSA-N 0.000 description 1
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 1
- LYCOGHUNJCETDK-JYJNAYRXSA-N Phe-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N LYCOGHUNJCETDK-JYJNAYRXSA-N 0.000 description 1
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- YMTMNYNEZDAGMW-RNXOBYDBSA-N Phe-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YMTMNYNEZDAGMW-RNXOBYDBSA-N 0.000 description 1
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- OLZVAVSJEUAOHI-UNQGMJICSA-N Phe-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O OLZVAVSJEUAOHI-UNQGMJICSA-N 0.000 description 1
- AOKZOUGUMLBPSS-PMVMPFDFSA-N Phe-Trp-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O AOKZOUGUMLBPSS-PMVMPFDFSA-N 0.000 description 1
- NWVMQNAELALJFW-RNXOBYDBSA-N Phe-Trp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NWVMQNAELALJFW-RNXOBYDBSA-N 0.000 description 1
- WDOCBGZHAQQIBL-IHPCNDPISA-N Phe-Trp-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 WDOCBGZHAQQIBL-IHPCNDPISA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 1
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 1
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- RETPETNFPLNLRV-JYJNAYRXSA-N Pro-Asn-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O RETPETNFPLNLRV-JYJNAYRXSA-N 0.000 description 1
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- NTXFLJULRHQMDC-GUBZILKMSA-N Pro-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 NTXFLJULRHQMDC-GUBZILKMSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- JRBWMRUPXWPEID-JYJNAYRXSA-N Pro-Trp-Cys Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CS)C(=O)O)C(=O)[C@@H]1CCCN1 JRBWMRUPXWPEID-JYJNAYRXSA-N 0.000 description 1
- GNFHQWNCSSPOBT-ULQDDVLXSA-N Pro-Trp-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O GNFHQWNCSSPOBT-ULQDDVLXSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 108010025216 RVF peptide Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 1
- RTXKJFWHEBTABY-IHPCNDPISA-N Ser-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CO)N RTXKJFWHEBTABY-IHPCNDPISA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- XVNZSJIKGJLQLH-RCWTZXSCSA-N Thr-Arg-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N)O XVNZSJIKGJLQLH-RCWTZXSCSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- PAOYNIKMYOGBMR-PBCZWWQYSA-N Thr-Asn-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PAOYNIKMYOGBMR-PBCZWWQYSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 1
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 1
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- GJOBRAHDRIDAPT-NGTWOADLSA-N Thr-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H]([C@@H](C)O)N GJOBRAHDRIDAPT-NGTWOADLSA-N 0.000 description 1
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- VMSSYINFMOFLJM-KJEVXHAQSA-N Thr-Tyr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O VMSSYINFMOFLJM-KJEVXHAQSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- OETOOJXFNSEYHQ-WFBYXXMGSA-N Trp-Ala-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 OETOOJXFNSEYHQ-WFBYXXMGSA-N 0.000 description 1
- NXAPHBHZCMQORW-FDARSICLSA-N Trp-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NXAPHBHZCMQORW-FDARSICLSA-N 0.000 description 1
- VFURAIPBOIWAKP-SZMVWBNQSA-N Trp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N VFURAIPBOIWAKP-SZMVWBNQSA-N 0.000 description 1
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 1
- VKMOGXREKGVZAF-QEJZJMRPSA-N Trp-Asp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VKMOGXREKGVZAF-QEJZJMRPSA-N 0.000 description 1
- KOVOKXBHGVXQMG-BPUTZDHNSA-N Trp-Cys-Met Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(O)=O)=CNC2=C1 KOVOKXBHGVXQMG-BPUTZDHNSA-N 0.000 description 1
- LGEPIBQBGZTBHL-SXNHZJKMSA-N Trp-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LGEPIBQBGZTBHL-SXNHZJKMSA-N 0.000 description 1
- PTAWAMWPRFTACW-SZMVWBNQSA-N Trp-Gln-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PTAWAMWPRFTACW-SZMVWBNQSA-N 0.000 description 1
- DVIIYMVCSUQOJG-QEJZJMRPSA-N Trp-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DVIIYMVCSUQOJG-QEJZJMRPSA-N 0.000 description 1
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 1
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 1
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 1
- YYXIWHBHTARPOG-HJXMPXNTSA-N Trp-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YYXIWHBHTARPOG-HJXMPXNTSA-N 0.000 description 1
- KIMOCKLJBXHFIN-YLVFBTJISA-N Trp-Ile-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O)=CNC2=C1 KIMOCKLJBXHFIN-YLVFBTJISA-N 0.000 description 1
- CSRCUZAVBSEDMB-FDARSICLSA-N Trp-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N CSRCUZAVBSEDMB-FDARSICLSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 1
- KCZGSXPFPNKGLE-WDSOQIARSA-N Trp-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N KCZGSXPFPNKGLE-WDSOQIARSA-N 0.000 description 1
- ZHDQRPWESGUDST-JBACZVJFSA-N Trp-Phe-Gln Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=CC=C1 ZHDQRPWESGUDST-JBACZVJFSA-N 0.000 description 1
- JZSLIZLZGWOJBJ-PMVMPFDFSA-N Trp-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N JZSLIZLZGWOJBJ-PMVMPFDFSA-N 0.000 description 1
- XGFOXYJQBRTJPO-PJODQICGSA-N Trp-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XGFOXYJQBRTJPO-PJODQICGSA-N 0.000 description 1
- IVBJBFSWJDNQFW-XIRDDKMYSA-N Trp-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IVBJBFSWJDNQFW-XIRDDKMYSA-N 0.000 description 1
- LWHUUHCERHMOAB-WDSOQIARSA-N Trp-Pro-His Chemical compound N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O LWHUUHCERHMOAB-WDSOQIARSA-N 0.000 description 1
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 1
- GFUOTIPYXKAPAH-BVSLBCMMSA-N Trp-Pro-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GFUOTIPYXKAPAH-BVSLBCMMSA-N 0.000 description 1
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- YCEHCFIOIYNQTR-NYVOZVTQSA-N Trp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CO)C(=O)O)N YCEHCFIOIYNQTR-NYVOZVTQSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- WTXQBCCKXIKKHB-JYJNAYRXSA-N Tyr-Arg-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WTXQBCCKXIKKHB-JYJNAYRXSA-N 0.000 description 1
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 1
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- JBBYKPZAPOLCPK-JYJNAYRXSA-N Tyr-Arg-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O JBBYKPZAPOLCPK-JYJNAYRXSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- IUQDEKCCHWRHRW-IHPCNDPISA-N Tyr-Asn-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IUQDEKCCHWRHRW-IHPCNDPISA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- QOEZFICGUZTRFX-IHRRRGAJSA-N Tyr-Cys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O QOEZFICGUZTRFX-IHRRRGAJSA-N 0.000 description 1
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- FJKXUIJOMUWCDD-FHWLQOOXSA-N Tyr-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N)O FJKXUIJOMUWCDD-FHWLQOOXSA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 1
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- YIKDYZDNRCNFQB-KKUMJFAQSA-N Tyr-His-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O YIKDYZDNRCNFQB-KKUMJFAQSA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- NENACTSCXYHPOX-ULQDDVLXSA-N Tyr-His-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O NENACTSCXYHPOX-ULQDDVLXSA-N 0.000 description 1
- STTVVMWQKDOKAM-YESZJQIVSA-N Tyr-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O STTVVMWQKDOKAM-YESZJQIVSA-N 0.000 description 1
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- QPBJXNYYQTUTDD-KKUMJFAQSA-N Tyr-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QPBJXNYYQTUTDD-KKUMJFAQSA-N 0.000 description 1
- KZOZXAYPVKKDIO-UFYCRDLUSA-N Tyr-Met-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KZOZXAYPVKKDIO-UFYCRDLUSA-N 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 1
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 1
- 108700023183 UTP-glucose-1-phosphate uridylyltransferases Proteins 0.000 description 1
- 102000048175 UTP-glucose-1-phosphate uridylyltransferases Human genes 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- XKVXSCHXGJOQND-ZOBUZTSGSA-N Val-Asp-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N XKVXSCHXGJOQND-ZOBUZTSGSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- SBJCTAZFSZXWSR-AVGNSLFASA-N Val-Met-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SBJCTAZFSZXWSR-AVGNSLFASA-N 0.000 description 1
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 1
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010031045 aspartyl-glycyl-aspartyl-alanine Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 101150041954 galU gene Proteins 0.000 description 1
- 101150068630 ggpS gene Proteins 0.000 description 1
- 101150019926 glgA gene Proteins 0.000 description 1
- 101150090624 glgP gene Proteins 0.000 description 1
- 101150042350 gltA2 gene Proteins 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010075702 lysyl-valyl-aspartyl-leucine Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 230000007939 microbial gene expression Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 239000012474 protein marker Substances 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 230000009962 secretion pathway Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 101150076304 spp gene Proteins 0.000 description 1
- 150000003890 succinate salts Chemical class 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010037335 tyrosyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
- C12P5/026—Unsaturated compounds, i.e. alkenes, alkynes or allenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/21—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0069—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1294—Phosphotransferases with paired acceptors (2.7.9)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01041—Isocitrate dehydrogenase (NAD+) (1.1.1.41)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/03—Acyl groups converted into alkyl on transfer (2.3.3)
- C12Y203/03001—Citrate (Si)-synthase (2.3.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/09—Phosphotransferases with paired acceptors (2.7.9)
- C12Y207/09002—Pyruvate, water dikinase (2.7.9.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2500/00—Specific components of cell culture medium
- C12N2500/02—Atmosphere, e.g. low oxygen conditions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01042—Isocitrate dehydrogenase (NADP+) (1.1.1.42)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Virology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
본 개시 내용은 개선된 에틸렌 생산 능력을 갖는 재조합 미생물, 이를 제조하는 방법, 및 에틸렌을 생산하는 방법에 관한 것이다. 본 출원에서 개시된 재조합 미생물 및 방법의 이점은 미생물 배양으로부터의 에틸렌 생산 증가를 포함할 수 있다. 추가의 이점은 플라스틱, 섬유 및 화학 물질의 제조를 위한 공급 원료로서 유용한 바이오 에틸렌을 생산하고 다른 응용 분야에 사용하기 위한 이산화탄소의 용도일 수 있다. 본 출원에서 개시된 방법 및 시스템의 또 다른 이점은 환경으로부터의 과량의 이산화탄소의 감소를 포함할 수 있다.
Description
상호 참조
본 출원은 2019년 12월 3일자로 출원된 미국 가출원 번호 62/942,895의 이익을 주장하며, 이는 본 출원에 참조로 포함된다.
기술분야
본 발명은 개선된 에틸렌 생산 능력을 갖는 재조합 미생물, 이를 제조하는 방법, 및 이러한 재조합 유기체로부터 에틸렌을 수확하는 방법에 관한 것이다. 본 출원에서 개시된 재조합 미생물 및 방법의 이점은 미생물 배양으로부터의 에틸렌 생산 증가를 포함할 수 있다. 추가의 이점은 플라스틱, 섬유 및 화학 물질의 제조를 위한 공급 원료로서 유용한 바이오 에틸렌을 생산하고 다른 응용 분야에 사용하기 위한 이산화탄소의 용도일 수 있다. 본 출원에서 개시된 방법 및 시스템의 또 다른 이점은 환경으로부터의 과량의 이산화탄소의 감소를 포함할 수 있다.
전세계적인 전력 수요 증가는 석유 및 가스와 같은 화석 연료의 연소로부터 과량의 이산화탄소를 초래하여 많은 사람들이 지구 온난화 위기라고 부르는 것에 상당히 기여하였다. 산업계는 이산화탄소가 대기로 유입되는 것을 방지하는데 필사적이어서 이들은 이산화탄소를 배기 스트림과 대기로부터 격리하는 것에 의존하였다. 그 다음, 이들은 이산화탄소를 지하 환경에 저장한다. 그러나, 현재 공지된 모든 방법은 이산화탄소를 지하에 저장하여 대기로부터 제거한다. 이들은 실제로 이산화탄소를 임의의 다른 유용한 물질로 다시 전환하지 않는다.
제한된 석유 공급과 환경에 대한 이의 유해한 영향은 연료 및 화학 물질의 재생 가능한 공급원에 대한 개발을 촉진하였다. 에틸렌은 플라스틱, 용매 및 섬유를 비롯한 광범위한 산업 분야에 유용한 세계에서 가장 널리 생산되는 유기 화합물이다. 에틸렌은 현재 화석 연료를 증기 분해하거나 에탄을 탈수소화하여 생산된다. 그러나, 매년 수백만 톤의 에틸렌 생산으로 인해, 충분한 양 초과의 이산화탄소가 이러한 공정에 의해 생산되어 전세계 탄소 발자국에 크게 기여한다. 이에 따라, 재생 가능한 방법을 통한 에틸렌의 생산은 에너지 및 화학 산업의 막대한 수요를 충족시키는데 도움이 되면서 또한 환경을 보호하는데 도움이 될 것이다.
에틸렌은 잠재적으로 재생 가능한 공급 원료이기 때문에, 이산화탄소 및 바이오매스와 같은 재생 가능한 공급원으로부터 에틸렌을 생산하는 기술 개발에 많은 관심이 있었다. 바이오 에틸렌은 현재 옥수수 또는 사탕수수로부터 유래된 에탄올을 사용하여 생산되고 있다. 세균 및 진균을 비롯한 다양한 미생물은 자연적으로 소량의 에틸렌을 생성한다. 에틸렌 생성 효소의 이종 발현은 여러 미생물 종에서 입증되었으며, 숙주는 리그노셀룰로오스 및 이산화탄소를 비롯한 다양한 탄소원을 활용할 수 있었다.
현대사에 비추어 볼 때, 대기 중 과량의 이산화탄소는 이를 감소시키는 것이 수익성이 될 때까지 감소되지 않을 것이라고 말하는 것이 타당하다. 상업적 규모로 에틸렌을 생산하기 위해서는 미생물 바이오 에틸렌 시스템 및 공정의 개선이 필요하다. 보다 효율적인 재생 가능한 기술을 통해 탄화수소를 생산할 필요성이 남아 있다. 대기로부터 과량의 이산화탄소를 제거할 필요성이 남아 있다. 산업적 및 상업적 적용을 위한 재생 가능한 공급 원료로부터 에틸렌을 생산하기 위한 개선된 방법에 대한 필요성이 남아 있다.
요약
본 출원의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물에 관한 것이며, 상기 재조합 미생물은 비-천연의 에틸렌 형성 효소(ethylene forming enzyme: EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1 (첨부된 부록 참조)과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 한 실시 형태에서, 상기 재조합 미생물은 또한 비-천연의 알파-케토글루타레이트 퍼미아제(alpha-ketoglutarate permease: AKGP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 2 (첨부된 부록 참조)와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 AKGP 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 한 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많다.
다양한 실시 형태에서, 상기 재조합 미생물은 시아노박테리아(Cyanobacteria), 시네코코커스(Synechococcus), 시네코코커스 엘롱가투스(Synechococcus elongatus), 시네코코커스 레오폴리엔시스(Synechococcus leopoliensis), 시네코시스티스(Synechocystis), 아나베나(Anabaena), 슈도모나스(Pseudomonas), 슈도모나스 시링가에(Pseudomonas syringae), 슈도모나스 사바스타노이(Pseudomonas savastanoi), 클라미도모나스(Chlamydomonas), 클라미도모나스 레인하르티이(Chlamydomonas reinhardtii), 에세리키아(Escherichia), 에세리키아 콜라이(Escherichia coli), 지오박테리아(Geobacteria), 조류, 미세조류, 전해합성(electrosynthesis) 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다.
한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 높은 카피 수의 세균 벡터 플라스미드, 유도성 프로모터를 갖는 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3 (첨부된 부록 참조)과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다.
한 실시 형태에서, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 높은 카피 수의 세균 벡터 플라스미드, 유도성 프로모터를 갖는 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4 (첨부된 부록 참조)와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 AKGP 발현 뉴클레오타이드 서열은 에세리키아 종 세균의 벡터 플라스미드 내로 삽입된다.
한 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함하고, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 (첨부된 부록 참조)와 적어도 95% 동일한 조합된 아미노산 서열을 발현하며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 또 다른 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함하고, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6(첨부된 부록 참조)과 적어도 95% 동일한 조합된 아미노산 서열을 발현하며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 포스포에놀피루베이트 신타아제(phosphoenolpyruvate synthase: PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 PEP 단백질의 양은 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 많고, 상기 재조합 미생물에 의해 생산되는 AKG의 양은 대조군 미생물에 대해 생산되는 양보다 더 많다. 이러한 특정 실시 형태에서, 상기 재조합 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함한다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 포스포에놀피루베이트 신타아제(PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고,
여기서, 상기 재조합 미생물에 의해 생산되는 PEP 단백질의 양은 상기 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고, 상기 재조합 미생물에 의해 생산되는 AKG의 양은 상기 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 17과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 시트레이트 신타아제 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 시트레이트 신타아제 단백질의 양은 상기 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 많다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 이소시트레이트 데하이드로게나아제(isocitrate dehydrogenase: IDH) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 20과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 IDH 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 IDH 단백질의 양은 상기 비-천연의 IDH 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 많고, 상기 재조합 미생물에 의해 생산되는 AKG의 양은 상기 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 발현 뉴클레오타이드 서열에서 결실을 포함하고, 여기서, 상기 재조합 미생물에 의해 생산되는 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 단백질의 양은 상기 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 24와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 수크로오스 퍼미아제 단백질을 발현하고,
여기서, 상기 재조합 미생물에 의해 생산되는 수크로오스 퍼미아제 단백질의 양은 상기 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 24와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 수크로오스 퍼미아제 단백질을 발현하고,
여기서, 상기 재조합 미생물에 의해 생산되는 수크로오스 퍼미아제 단백질의 양은 상기 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 24와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 수크로오스 퍼미아제 단백질을 발현하고,
여기서, 상기 재조합 미생물에 의해 생산되는 수크로오스 퍼미아제 단백질의 양은 상기 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 서열 번호 26과 적어도 95% 동일한 아미노산 서열을 갖는 수크로오스 포스페이트 신타아제 단백질, 서열 번호 28과 적어도 95% 동일한 아미노산 서열을 갖는 수크로오스-6-포스파타아제 단백질, 서열 번호 30과 적어도 95% 동일한 아미노산 서열을 갖는 글리코겐 포스포릴라아제 단백질, 및 서열 번호 32와 적어도 95% 동일한 아미노산 서열을 갖는 DTP-글루코오스-1-포스페이트 우리딜릴트랜스퍼라아제 단백질로 이루어진 군으로부터 선택된 적어도 하나의 단백질을 코딩하는 비-천연의 뉴클레오타이드 서열을 발현함으로써 상기 적어도 하나의 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 상기 적어도 하나의 단백질의 양은 상기 적어도 하나의 단백질을 코딩하는 상기 비-천연의 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고, 상기 재조합 미생물에 의해 생산되는 수크로오스의 양은 상기 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 적어도 하나의 뉴클레오타이드 서열에서 적어도 하나의 결실을 포함하고, 여기서, 상기 적어도 하나의 뉴클레오타이드 서열은 서열 번호 34와 적어도 95% 동일한 아미노산 서열을 갖는 인버타아제 단백질, 서열 번호 36과 적어도 95% 동일한 아미노산 서열을 갖는 글루코실글리세롤-포스페이트 신타아제 단백질, 및 서열 번호 38과 적어도 95% 동일한 아미노산 서열을 갖는 글리코겐 신타아제 단백질로부터 선택된 적어도 하나의 단백질을 코딩하고, 상기 재조합 미생물에 의해 생산되는 상기 적어도 하나의 단백질의 양은 상기 적어도 하나의 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 적다.
본 출원의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제조하는 방법에 관한 것이다. 한 실시 형태에서, 상기 방법은 비-천연의 EFE 발현 뉴클레오타이드 서열, 또는 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 상기 재조합 미생물을 제조하는 단계를 포함하고, 여기서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3 또는 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현한다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7 (첨부된 부록 참조)과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다.
다양한 구체화된 방법에서, 상기 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다.
한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 미생물은 클라미도모나스 종 세균이다. 또 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 미생물은 에세리키아 종 세균이다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현하며, 상기 미생물은 시네코코커스 종 세균이다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 미생물은 시네코코커스 종 세균이다.
에틸렌을 생산하는 방법이 본 출원에서 구체화된다. 이러한 방법의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제공하는 단계로서, 여기서, 상기 재조합 미생물이 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양이 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 단계; 생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 상기 생물 반응기 배양 용기에서 상기 재조합 미생물을 배양하는 단계; 및 에틸렌을 상기 생물 반응기 배양 용기로부터 수확하는 단계를 포함한다.
본 출원의 에틸렌을 생산하는 방법의 한 실시 형태에서, 상기 재조합 미생물은 상기 미생물의 세균 플라스미드 내로 삽입된, 비-천연의 EFE 발현 뉴클레오타이드 서열, 또는 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 포함하고, 여기서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3 또는 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현한다.
본 출원의 에틸렌을 생산하는 다양한 실시 형태에서, 상기 재조합 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다.
에틸렌을 생산하는 방법의 한 실시 형태는 상기 생물 반응기 배양 용기 내에 위치한 상기 재조합 미생물을 함유하는 배양물에 적어도 하나의 활성화제를 첨가하여 에틸렌 생산량을 증가시키는 단계를 추가로 포함한다. 한 실시 형태에서, 이러한 방법은 상기 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO2를 약 100 ml/분 내지 약 500 ml/분의 속도로 첨가하는 단계를 포함한다. 한 실시 형태에서, 이러한 방법은 상기 생물 반응기 배양 용기 내에 위치한 상기 재조합 미생물을 함유하는 상기 세포 배양물로부터 적어도 하나의 분자 스위치를 제거하여 에틸렌 생산량을 감소시키는 단계를 추가로 포함한다. 한 실시 형태에서, 이러한 방법은 상기 재조합 미생물을 배양할 때 적어도 하나의 영양소의 농도 또는 적어도 하나의 자극(제)의 양을 증가 또는 감소시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 조절하는 단계를 추가로 포함한다. 한 실시 형태에서, 상기 적어도 하나의 영양소의 농도 및 상기 적어도 하나의 자극의 양은 상기 미생물 배양에서 약 0.5~1.5 그램/리터 내지 약 0.1 mM의 비율이다. 한 실시 형태에서, 이러한 방법은 상기 에틸렌을 기체 상태에서 액체 상태로 응축시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 제거하는 단계를 추가로 포함하거나, 회수된 에틸렌의 양은 약 0.5 ml 내지 약 10 ml/리터/h이다.
본 출원의 실시 형태는 개선된 알파-케토글루타레이트(alpha-ketoglutarate: AKG) 생산 능력을 갖는 재조합 미생물에 관한 것이다. 특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 포스포에놀피루베이트 신타아제(PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 PEP 단백질의 양은 상기 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 이소시트레이트 데하이드로게나아제(IDH) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 20과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 IDH 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 IDH 단백질의 양은 상기 비-천연의 IDH 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고; 상기 재조합 미생물에 의해 생산되는 AKG의 양은 상기 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 17과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 시트레이트 신타아제 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 시트레이트 신타아제 단백질의 양은 상기 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다.
특정 실시 형태에서, 상기 재조합 미생물은 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 발현 뉴클레오타이드 서열에서 결실을 포함하고, 여기서, 상기 재조합 미생물에 의해 생산되는 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 단백질의 양은 상기 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적다.
특정 실시 형태에서, 상기 재조합 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함한다.
실시 형태에 대한 하기 상세한 설명 뿐만 아니라 전술한 요약은 첨부된 도면과 함께 정독할 때 보다 잘 이해될 것이다. 예시의 목적으로, 바람직할 수 있는 일부 실시 형태가 도면에 도시되어 있다. 묘사된 실시 형태는 도시된 정확한 세부 사항으로 한정되지 않는다는 것을 이해해야 한다. 달리 명시되지 않는다면, 도면은 축척에 맞지 않다.
도 1은 본 출원의 에틸렌을 생산하는 방법의 실시 형태를 도시하는 흐름도이다.
도 2는 본 출원의 실시 형태에 따른 에틸렌 형성 효소(EFE) 단백질의 발현을 위한 벡터 플라스미드의 예시이다.
도 3a는 본 출원의 실시 형태에 따른 EFE 단백질의 발현을 도시하는 SDS-PAGE 겔의 사진이다.
도 3b는 본 출원의 실시 형태에 따른 EFE 단백질의 발현을 도시하는 웨스턴 블롯의 사진이다.
도 4a는 본 출원의 실시 형태에 따른 시간 경과에 따른 이. 콜라이(E.coli) BL 21 PUC19 EFE의 성장 속도를 도시하는 그래프이다.
도 4b는 본 출원의 실시 형태에 따른 이. 콜라이 BL 21 PUC19 EFE 배양물에 대한 시간 경과에 따른 에틸렌 수율을 도시하는 그래프이다.
도 5a는 본 출원의 실시 형태에 따른 세균 콜로니의 성장을 도시하는 사진이다.
도 5b는 본 출원의 실시 형태에 따른 세균 콜로니의 성장을 도시하는 사진이다.
도 6은 본 발명의 실시 형태에 따른 AKG 및 수크로오스 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 7a는 본 발명의 실시 형태에 따른 수크로오스 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 7b는 본 출원의 실시 형태에 따른 플라스크 세균 배양물의 사진이다.
도 8a는 본 발명의 실시 형태에 따른 에틸렌 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 8b는 본 발명의 실시 형태에 따른 에틸렌 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 9a는 본 발명의 실시 형태에 따른 AKG 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 9b는 본 출원의 실시 형태에 따른 플라스크 세균 배양물의 사진이다.
도 1은 본 출원의 에틸렌을 생산하는 방법의 실시 형태를 도시하는 흐름도이다.
도 2는 본 출원의 실시 형태에 따른 에틸렌 형성 효소(EFE) 단백질의 발현을 위한 벡터 플라스미드의 예시이다.
도 3a는 본 출원의 실시 형태에 따른 EFE 단백질의 발현을 도시하는 SDS-PAGE 겔의 사진이다.
도 3b는 본 출원의 실시 형태에 따른 EFE 단백질의 발현을 도시하는 웨스턴 블롯의 사진이다.
도 4a는 본 출원의 실시 형태에 따른 시간 경과에 따른 이. 콜라이(E.coli) BL 21 PUC19 EFE의 성장 속도를 도시하는 그래프이다.
도 4b는 본 출원의 실시 형태에 따른 이. 콜라이 BL 21 PUC19 EFE 배양물에 대한 시간 경과에 따른 에틸렌 수율을 도시하는 그래프이다.
도 5a는 본 출원의 실시 형태에 따른 세균 콜로니의 성장을 도시하는 사진이다.
도 5b는 본 출원의 실시 형태에 따른 세균 콜로니의 성장을 도시하는 사진이다.
도 6은 본 발명의 실시 형태에 따른 AKG 및 수크로오스 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 7a는 본 발명의 실시 형태에 따른 수크로오스 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 7b는 본 출원의 실시 형태에 따른 플라스크 세균 배양물의 사진이다.
도 8a는 본 발명의 실시 형태에 따른 에틸렌 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 8b는 본 발명의 실시 형태에 따른 에틸렌 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 9a는 본 발명의 실시 형태에 따른 AKG 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 9b는 본 출원의 실시 형태에 따른 플라스크 세균 배양물의 사진이다.
달리 명시되지 않는다면, 모든 측정 값은 표준 미터법 단위이다.
달리 명시되지 않는다면, 한, 하나 또는 상기라는 단어의 모든 경우는 이들이 수식하는 단어의 하나 이상을 지칭할 수 있다.
달리 명시되지 않는다면, "적어도 하나"라는 문구는 대상의 하나 이상을 의미한다. 예를 들어, "적어도 하나의 영양소"는 하나의 영양소, 하나 이상의 영양소 또는 이들의 임의의 조합을 의미한다.
달리 명시되지 않는다면, "약"이라는 용어는 가장 가까운 정수로 반올림된 기재되는 비-백분율 숫자의 ±10%를 지칭한다. 예를 들어, 약 100 ml/분은 90 내지 110 ml/분을 포함할 것이다. 달리 명시되지 않는다면, "약"이라는 용어는 백분율 숫자의 ±5%를 지칭한다. 예를 들어, 약 95%는 90 내지 100%를 포함할 것이다. "약"이라는 용어가 범위의 관점에서 논의될 때, 상기 용어는 하한 이상 및 상한 이하의 적절한 양을 지칭한다. 예를 들어, 약 100 내지 약 500 ml/분은 90 내지 550 ml/분을 포함할 것이다.
달리 명시되지 않는다면, 본 출원에서 기재된 바와 같은 측정 가능한 특성(높이, 너비, 길이, 비율 등)은 평균 측정값으로 이해된다.
달리 명시되지 않는다면, "제공하다", "제공된" 또는 "제공하는"이라는 용어는 본 출원의 임의의 실시 형태의 물질의 임의의 조성물, 방법 또는 시스템의 임의의 요소, 양, 성분, 시약, 정량, 측정 또는 분석의 공급, 생산, 구입, 제조, 조립, 형성, 선택, 배치, 전환, 도입, 추가 또는 혼입을 지칭한다.
서열 동일성은 본 출원에서 서열을 비교함으로써 결정된 때 2개 이상의 아미노산 (폴리펩타이드 또는 단백질) 서열 또는 2개 이상의 핵산 (폴리뉴클레오타이드) 서열 사이의 관계로서 정의된다. 일반적으로, 서열 동일성 또는 유사성은 비교되는 서열의 전체 길이에 걸쳐 비교된다. 당해 분야에서, "동일성"은 또한 경우에 따라 이러한 서열의 스트링들 사이의 일치에 의해 결정된 때 아미노산 또는 핵산 서열들 사이의 서열 관련성의 정도를 의미한다. 2개의 아미노산 서열 사이의 "유사성"은 하나의 폴리펩타이드의 아미노산 서열 및 이의 보존된 아미노산 치환을 두 번째 폴리펩타이드의 서열과 비교함으로써 결정된다. "동일성" 및 "유사성"은 당해 분야의 통상의 기술자들에게 공지된 다양한 방법에 의해 용이하게 계산될 수 있다. 한 실시 형태에서, 서열 동일성은 본 출원에서 확인되는 바와 같은 서열의 전체 길이를 비교함으로써 결정된다.
동일성을 결정하기 위한 예시적인 방법은 테스트되는 서열들 사이에서 최대 일치를 제공하도록 설계된다. 동일성 및 유사성의 측정 방법은 공개적으로 이용 가능한 컴퓨터 프로그램으로 명문화되어 있다. 2개의 서열 사이의 동일성 및 유사성을 결정하기 위한 예시적인 컴퓨터 프로그램 방법으로는, 예를 들어, NCBI 및 기타 출처 (문헌 [BLAST.RTM. Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, Md. 20894])로부터 공개적으로 이용 가능한 BestFit, BLASTP (Protein Basic Local Alignment Search Tool), BLASTN (Nucleotide Basic Local Alignment Search Tool) 및 FASTA (문헌 [Altschul, S. F. et al., J. Mol. Biol. 215:403-410 (1990)]가 포함된다. 사용되는 가장 모범적인 알고리즘은 EMBOSS (European Molecular Biology Open Software Suite)이다. EMBOSS를 사용한 아미노산 서열 비교를 위한 예시적인 파라미터는 갭 개방 10.0, 갭 확장 0.5, Blosum 매트릭스이다. EMBOSS를 사용한 핵산 서열 비교를 위한 예시적인 파라미터는 갭 개방 10.0, 갭 확장 0.5, DNA 전체 매트릭스 (DNA 동일성 매트릭스)이다. 실시 형태에서, 유전자 은행, KEG, BLAST 및 Ensemble과 같은 온라인 데이터를 사용하여 서열의 상동성을 결정하기 위해 상이한 종들 사이의 DNA/단백질 서열을 비교하는 것이 가능하다.
임의로, 아미노산 유사성의 정도를 결정할 때, 통상의 기술자는 또한 통상의 기술자에게 명백한 바와 같은 소위 "보존적" 아미노산 치환을 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기의 상호 교환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 그룹은 글리신, 알라닌, 발린, 류신 및 이소류신이고; 지방족-하이드록실 측쇄를 갖는 아미노산의 그룹은 세린 및 트레오닌이고; 아미드 함유 측쇄를 갖는 아미노산의 그룹은 아스파라긴 및 글루타민이고; 방향족 측쇄를 갖는 아미노산의 그룹은 페닐알라닌, 타이로신 및 트립토판이고; 염기성 측쇄를 갖는 아미노산의 그룹은 라이신, 아르기닌 및 히스티딘이고; 황 함유 측쇄를 갖는 아미노산의 그룹은 시스테인 및 메티오닌이다. 바람직한 보존적 아미노산 치환기로는 발린-류신-이소류신, 페닐알라닌-타이로신, 라이신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이 있다. 본 출원에서 개시된 아미노산 서열의 치환 변이체는, 개시된 서열에서 적어도 하나의 잔기가 제거되고 이의 자리에 상이한 잔기가 삽입된 것이다. 바람직하게, 상기 아미노산 변경은 보존적이다. 자연 발생 아미노산 각각에 대한 바람직한 보존적 치환은 다음과 같다: Ala을 ser으로; Arg을 lys으로; Asn를 gln 또는 his으로; Asp를 glu로; Cys을 ser 또는 ala으로; Gln을 asn으로; Glu을 asp로; Gly을 pro으로; His을 asn 또는 gln으로; Ile을 leu 또는 val으로; Leu을 ile 또는 val으로; Lys을 arg으로; gln 또는 glu; Met을 leu 또는 ile으로; Phe을 met, leu 또는 tyr으로; Ser을 thr으로; Thr을 ser으로; Trp을 tyr으로; Tyr을 trp 또는 phe으로; 및, Val을 ile 또는 leu으로.
달리 언급되지 않는다면, "적합화된" 또는 "코돈 적합화된"이라는 용어는 본 출원에서 개시된 바와 같은 폴리뉴클레오타이드의 "코돈 최적화"를 지칭하며, 이의 서열은 본래 또는 비-본래일 수 있거나, 다른 미생물에서의 발현을 위해 적합화될 수 있다. 코돈 최적화는 코딩된 폴리펩타이드에 대한 코돈 사용을 폴리펩타이드를 발현하는 유기체의 코돈 편향에 적합화한다. 코돈 최적화는 일반적으로 숙주 세포에서 코딩된 폴리펩타이드의 생산 수준을 증가시키는데 도움이 된다.
화석 연료의 사용으로 인한 이산화탄소 배출은 전세계적으로 계속해서 증가하고 있다. 대기 이산화탄소 수준의 감소는 기후 변화를 완화하거나 역전시키는 핵심이다. 탄소 포집 및 저장(carbon capture and storage: CCS)은 대기로부터 산업적 이산화탄소의 제거를 위한 탁월한 기술이며; 정제 및 기타 산업 공정으로부터 포집된 20조 톤 이상의 이산화탄소가 다양한 유형의 지하 환경 또는 저장 탱크로 운송 및 저장될 수 있는 것으로 추정된다. CCS가 현재 이용 가능한 다른 방법과 비교하여 이산화탄소 배출을 감소시키기 위한 비용 효율적이고 저렴한 방법이지만, 이산화탄소가 꺼내어 질 때까지 지하에 저장될 뿐이라는 문제가 남아 있다. 그러므로, CCS 방법은 대기 중 과량의 이산화탄소를 감소시키기 위한 지속 가능한 해결책을 제공하지 않는다. 또한, 환경 규제에 의해 강제되거나 비용을 비즈니스 모델의 일부로서 지불하지 않는다면, 이산화탄소를 지하 환경에 주입하는 산업체에 대한 재정적 인센티브가 거의 없다. 거의 틀림없이, 이산화탄소를 처분하는 것 보다 이산화탄소를 생산하는 것이 보다 수익성이 좋기 때문에, 지구 온난화는 위기이다.
대기로부터 과량의 이산화탄소를 보다 효율적이고 지속 가능한 방식으로 제거할 필요성이 남아 있다. 유용한 제품을 제조하기 위해 과량의 이산화탄소를 이용할 수 있는 기술, 및 산업 및 환경에 유익한 기타 응용 분야에 대한 필요성이 남아 있다.
제한된 석유 공급과 환경에 대한 석유 작업의 유해한 영향의 도전은 기존 자원으로부터의 생산량 극대화와 환경적 영향을 최소화할 수 있는 연료 및 화학 물질의 재생 가능한 공급원에 대한 개발에 대한 강조를 증가시켰다. 에틸렌은 잠재적으로 재생 가능한 공급 원료이기 때문에, 이산화탄소 및 바이오매스와 같은 재생 가능한 공급원으로부터 에틸렌을 생산하는 기술의 개발에 많은 관심이 있었다. 에틸렌은 플라스틱, 용매 및 섬유를 비롯한 광범위한 산업 분야에 유용한 세계에서 가장 널리 생산되는 유기 화합물이다. 에틸렌은 현재 화석 연료를 증기 분해하거나 에탄을 탈수소화하여 생산된다. 그러나, 매년 수백만 톤의 에틸렌 생산으로 인해, 충분한 양 초과의 이산화탄소가 이러한 공정에 의해 생산되어 전세계 탄소 발자국에 크게 기여한다. 이에 따라, 재생 가능한 방법을 통한 에틸렌의 생산은 에너지 및 화학 산업의 막대한 수요를 충족시키는데 도움이 되면서 또한 환경을 보호하는데 도움이 될 것이다.
옥수수 또는 사탕수수로부터 유래된 에탄올을 사용하여 바이오 에틸렌을 생산하는 통상적인 방법이 개발되었다. 그러나, 바이오매스 (예를 들어, 옥수수 및 사탕수수)로부터의 바이오 에틸렌 생산은 시간 소모적이고 비용 효율적이지 않은 과정이어서 토지, 운송 및 바이오매스 분해를 필요로 한다. 예를 들어, 그 자체로 CO2 배출을 유발하는 옥수수와 사탕수수의 재배 및 운송과 관련된 막대한 비효율이 있다. 세균 및 진균을 비롯한 다양한 미생물은 자연적으로 소량의 에틸렌을 생성한다. 이러한 미생물은 에틸렌 형성 효소(EFE)를 사용한다. 슈도모나스 시링가에 및 페니실리움 디지타툼(Penicillium digitatum)에서 발견되는 것과 같은 일종의 에틸렌 경로는 에틸렌 형성 효소에 의해 촉매되는 반응에서 기질로서 알파-케토글루타레이트(AKG)와 아르기닌을 사용한다. 단일 유전자의 발현이 에틸렌 생산에 충분할 수 있기 때문에, 에틸렌 형성 효소는 유망한 표적을 제공한다. EFE의 이종 발현을 이용하는 기술은 여러 미생물 종에서 입증되었으며, 미생물 숙주는 리그노셀룰로오스 및 이산화탄소를 비롯한 다양한 탄소원을 캘빈 회로에서 활용할 수 있었다. 또한, 최근 비용 효율적인 고처리량 유전자 서열 분석 기술의 발전은 미생물 유전자 발현에 대한 이해의 증가를 초래하였다. 그러나, 현재 이용 가능한 기술은 미생물 활성화를 통해 산업적 관련 양의 에틸렌을 생산하지 않는다. 상업적 규모로 에틸렌을 생산할 수 있는 미생물 바이오 에틸렌 시스템의 개선이 필요하다. 이산화탄소 공급 원료를 사용하는 산업적 및 기타 응용 분야에 유용한 에틸렌을 생산하는 방법에 대한 필요성이 남아 있다.
본 발명의 실시 형태는 상업적으로 판매될 수 있는 가치 있는 유기 화합물을 생산하는 이점과 함께 환경으로부터 이산화탄소를 제거하는 이점을 제공할 수 있다. 따라서, 본 개시 내용의 실시 형태는 재조합 미생물 기술을 사용하여 이산화탄소를 유용한 유기 화합물로서의 에틸렌으로 전환함으로써 통상적인 이산화탄소 저장에 대한 재생 가능한 대안을 제공할 수 있다. 본 개시 내용의 실시 형태의 하나의 이점은 상기 방법이 환경으로부터 이산화탄소를 제거하는 것을 석유 또는 천연 가스 회사에게 경제적으로 수익성 있도록 만들 수 있다는 점이다. 석유 회사 또는 이의 계약자는 이산화탄소를 지하 환경에 주입하거나 격리된 이산화탄소를 지하에 남겨두는 대신에 이산화탄소를 재조합 미생물 배양을 위한 탄소원으로서 사용하여 이산화탄소를 에틸렌으로 비용 효율적인 방식으로 전환할 수 있었다. 또한, 공정이 현장에서 실행될 수 있거나 생산하는 것보다 더 많은 이산화탄소를 소비할 것으로 예상되기 때문에, 운송에 의해 생성되는 많은 이산화탄소를 회피할 수 있다.
환경을 보호하기 위한 가장 효과적인 방법은 사람들이 실제로 사용하는 이러한 방법이다. 이러한 방법이 보다 수익성이 있을 수록, 사람들이 보다 많이 사용한다. 본 출원에서 개시된 방법의 이점 중 하나는 생물 반응기 시스템을 사용하는 비용 효율성이다. 본 개시 내용의 실시 형태는 산업적 규모로 에틸렌을 생산하기 위해 관련 대사적 신호 전달 경로를 적합화함으로써 광합성 에틸렌 생산 미생물을 조작하는 이점을 제공할 수 있다. 이러한 실시 형태는 대기로부터 이산화탄소를 제거하는 것과 미생물이 이전에는 상상할 수 없는 규모로 작업을 수행하는 동안 가치 있는 유기 화합물을 수동적으로 생성하는 것이 수익성이 되도록 만들 수 있다.
제일 먼저 이산화탄소를 생성하는 것보다 이산화탄소를 가치 있는 유기 화합물로 전환하는 것이 보다 수익성이 더 높거나 수익성이 비슷하다면 지구 온난화 위기는 어떻게 될까요? 본 개시 내용의 방법은 에너지 생산자를 지구 온난화 회사에서 지구 냉각 회사로 전환시킬 수 있다.
본 발명은 개선된 에틸렌 생산 능력을 갖는 재조합 미생물에 관한 것이다. 본 개시 내용은 본 출원의 다양한 실시 형태에 따라 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제공하는 단계를 포함하는, 에틸렌을 생산하는 방법에 관한 것이다. 본 출원에서 개시된 방법의 일반적인 개요로서, 도 1을 참조하면, 상기 방법은 본 출원에서 개시된 실시 형태에 따른 적어도 하나의 EFE 단백질을 발현하는 재조합 미생물을 제공하는 단계 (102); 생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 상기 생물 반응기 배양 용기에서 상기 재조합 미생물을 배양하는 단계 (104); 상기 생물 반응기 배양 용기 내의 배양물에 적어도 하나의 활성화제를 첨가하거나 상기 생물 반응기 배양 용기 내의 배양 분위기에 이산화탄소를 첨가함으로써 에틸렌 생산량을 증가시키는 단계 (106); 상기 세포 배양물로부터 적어도 하나의 분자 스위치를 제거함으로써 에틸렌 생산량을 감소시키는 단계 (108); 상기 재조합 미생물을 배양할 때 적어도 하나의 영양소의 농도 또는 적어도 하나의 자극의 양을 증가 또는 감소시켜 미생물 배양으로부터 생산되는 에틸렌의 양을 조절하는 단계 (110); 및 상기 에틸렌을 기체 상태에서 액체 상태로 응축시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 제거하는 단계 (112)를 포함한다. 본 출원의 실시 형태에 따른 EFE 단백질의 발현을 위한 벡터 플라스미드의 예시로서, 도 2를 참조하면, 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다. 본 출원에서 개선된 에틸렌 생산 능력을 갖는 재조합 미생물의 예시로서, 도 3a의 SDS-PAGE 겔의 예시 및 도 3b의 웨스턴 블롯의 예시를 참조하면, EFE 단백질은 화살표로 도시된 바와 같이 벡터 플라스미드 내로 삽입된 비-천연의 EFE 발현 뉴클레오타이드 서열을 갖는 에세리키아 종 세균의 벡터 플라스미드로부터 발현된다.
재조합 미생물의 실시 형태
본 개시 내용은 개선된 에틸렌 생산 능력을 갖는 재조합 미생물에 관한 것이다. 이러한 실시 형태에서, 상기 재조합 미생물은 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 슈도모나스 사바스타노이의 EFE를 코딩한다. 한 실시 형태에서, 상기 EFE 단백질은 서열 번호 1과 적어도 80% 또는 적어도 90% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 상기 EFE 단백질은 서열 번호 1과 적어도 98% 동일한 아미노산 서열을 갖는다. 다양한 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 50% 내지 약 150% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 75% 내지 약 100% 또는 그 이상 더 많다.
한 실시 형태에서, 상기 재조합 미생물은 또한 비-천연의 알파-케토글루타레이트 퍼미아제(AKGP) 발현 뉴클레오타이드 서열을 발현함으로써 적어도 하나의 AKGP 단백질을 발현하고, 한 실시 형태에서, 상기 AKGP 단백질은 서열 번호 2와 적어도 95% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 상기 AKGP 단백질은 서열 번호 2와 적어도 80% 또는 적어도 90% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 상기 AKGP 단백질은 서열 번호 2와 적어도 98% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 서열 번호 2에 대한 원래 서열은 슈도모나스 시링가에의 AKGP로부터 유래되었지만, 시네코코커스 엘롱가투스에서 이러한 서열의 발현을 개선하기 위해 서열 혁신을 수행하였다. 다양한 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 50% 내지 약 150% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 75% 내지 약 100% 또는 그 이상 더 많다.
다양한 실시 형태에서, 상기 재조합 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다. 일부 실시 형태에서, 상기 재조합 미생물로는 사카로마이세스 세레비지에(Saccharomyces cerevisiae), 슈도모나스 푸티다(Pseudomonas putida), 트리코더마 비리데(Trichoderma viride), 트리코더마 리세이(Trichoderma reesei) 및 타바코(tobacco)가 포함될 수 있다.
한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다.
한 실시 형태에서, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 AKGP 발현 뉴클레오타이드 서열은 에세리키아 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 에세리키아 종 세균 또는 에세리키아 콜라이 세균에서의 발현을 위해 코돈 적합화된다.
한 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함한다. 이러한 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.
재조합 미생물을 제조하는 방법의 실시 형태
본 출원의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제조하는 방법에 관한 것이다. 한 실시 형태에서, 상기 방법은 비-천연의 EFE 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 재조합 미생물을 제조하는 단계를 포함한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 슈도모나스 사바스타노이의 EFE를 코딩한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 클라미도모나스 종 세균으로는 클라미도모나스 레인하르티이가 포함된다.
한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 에세리키아 종 세균에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 에세리키아 종 세균으로는 이. 콜라이가 포함된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 N-말단 NdeI 클로닝 부위를 포함한다 (서열 번호 8 (부록 참조)). 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 하나 이상의 정제 태그를 포함하고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 C-말단에서 히스티딘 태그에 이어서, 정지 코돈 및 HindIII 클로닝 부위를 포함한다 (서열 번호 9 (부록 참조)).
한 실시 형태에서, 상기 방법은 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 재조합 미생물을 제조하는 단계를 포함한다. 이러한 하나의 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10 (부록 참조)을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.
다양한 구체화된 방법에서, 상기 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다. 일부 실시 형태에서, 상기 재조합 미생물로는 사카로마이세스 세레비지에, 슈도모나스 푸티다, 트리코더마 비리데, 트리코더마 리세이 및 타바코가 포함될 수 있다.
본 출원의 방법의 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다.
한 실시 형태에서, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 AKGP 발현 뉴클레오타이드 서열은 에세리키아 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 에세리키아 종 세균 또는 에세리키아 콜라이 세균에서의 발현을 위해 코돈 적합화된다.
한 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함한다. 이러한 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다.
한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.
에틸렌을 생산하는 방법의 실시 형태
에틸렌을 생산하는 방법이 본 출원에서 구체화된다. 이러한 방법의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제공하는 단계를 포함한다. 한 실시 형태에서, 상기 재조합 미생물은 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고; 생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 상기 생물 반응기 배양 용기에서 상기 재조합 미생물을 배양하고; 에틸렌을 상기 생물 반응기 배양 용기로부터 수확하며, 여기서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 많다.
에틸렌을 생산하는 방법의 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 슈도모나스 사바스타노이의 EFE를 코딩한다. 한 실시 형태에서, 상기 EFE 단백질은 서열 번호 1과 적어도 80% 또는 적어도 90% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 상기 EFE 단백질은 서열 번호 1과 적어도 98% 동일한 아미노산 서열을 갖는다. 다양한 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 50% 내지 약 150% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 75% 내지 약 100% 또는 그 이상 더 많다.
에틸렌을 생산하는 방법의 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 80% 또는 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 클라미도모나스 종 세균으로는 클라미도모나스 레인하르티이가 포함된다.
본 출원의 방법의 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 에세리키아 종 세균에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 에세리키아 종 세균으로는 이. 콜라이가 포함된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 N-말단 NdeI 클로닝 부위를 포함한다 (서열 번호 8). 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 하나 이상의 정제 태그를 포함하고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 C-말단에서 히스티딘 태그에 이어서, 정지 코돈 및 HindIII 클로닝 부위를 포함한다 (서열 번호 9).
한 실시 형태에서, 에틸렌을 생산하는 방법은 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 재조합 미생물을 제조하는 단계를 포함한다. 이러한 하나의 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.
다양한 구체화된 방법에서, 상기 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다. 일부 실시 형태에서, 상기 재조합 미생물로는 사카로마이세스 세레비지에, 슈도모나스 푸티다, 트리코더마 비리데, 트리코더마 리세이 및 타바코가 포함될 수 있다.
본 출원의 방법의 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다.
한 실시 형태에서, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 AKGP 발현 뉴클레오타이드 서열은 에세리키아 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 에세리키아 종 세균 또는 에세리키아 콜라이 세균에서의 발현을 위해 코돈 적합화된다.
한 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함한다. 이러한 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.
본 출원의 에틸렌을 생산하는 실시 형태는 생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 상기 생물 반응기 배양에서 재조합 미생물을 배양하는 단계를 포함한다. 구체화된 방법에 따른 생물 반응기 배양물은 상기 재조합 미생물 배양물의 성장을 지원하기 위한 하나 이상의 적합한 시약 또는 성장 배지를 포함할 수 있다. 이러한 시약 또는 배양 배지로는 물, 하나 이상의 탄수화물, 하나 이상의 아미노산 또는 아미노산 유도체, 하나 이상의 완충액, 해수, 루리아 브로쓰(Luria broth), 루리아 베르타니 브로쓰(Luria Bertani broth), BG-11 배지, 이산화탄소, 빛, 온도, 전기 또는 이들의 조합이 포함될 수 있다.
에틸렌을 생산하는 방법의 한 실시 형태는 상기 생물 반응기 배양 용기 내에 위치한 상기 재조합 미생물을 함유하는 배양물에 적어도 하나의 활성화제를 첨가하여 에틸렌 생산량을 증가시키는 단계를 포함한다. 이러한 활성화제의 첨가는 재조합 미생물 배양에 의해 발현되는 EFE 효소의 하나 이상의 기질의 농도를 증가시키는 것을 포함할 수 있다. 이러한 기질로는 알파-케토글루타레이트 또는 아르기닌, 또는 이들의 조합 뿐만 아니라 글리세롤 및 글루코오스와 같은 다른 탄소원이 포함될 수 있다. 다른 실시 형태에서, 적어도 하나의 활성화제의 첨가는 분자 스위치를 첨가하는 것을 포함할 수 있다. 일부 실시 형태에서, 적어도 하나의 활성화제의 첨가는 EFE 유전자의 업스트림에 유도성 프로모터의 삽입을 포함할 수 있으며; 이러한 프로모터 중 하나는 IPTG 프로모터를 포함한다. 이러한 실시 형태에서, IPTG는 배양 배지에 분자 스위치로서 첨가될 수 있다. 일부 실시 형태에서, 적어도 하나의 활성화제의 첨가는 상기 배양물에 하나 이상의 영양소 또는 자극을 첨가하는 것을 포함할 수 있다. 이러한 영양소 또는 자극으로는 하나 이상의 탄수화물, 하나 이상의 아미노산 또는 아미노산 유도체, 하나 이상의 EFE 기질, 석시네이트, 이산화탄소, 빛, 온도, 전기, 글리세롤, 당 또는 이들의 조합이 포함될 수 있다. 이러한 실시 형태에서, 상기 배양물에 대한 하나 이상의 활성화제의 첨가는 에틸렌 생산 주기를 제어하고 에틸렌 생산 속도를 증진시키는 이점을 제공할 수 있다. 일부 실시 형태에서, 상기 생산되는 에틸렌은 생산되는 대로 상기 생물 반응기 배양 용기로부터 제거될 수 있다. 이러한 실시 형태에서, 상기 에틸렌의 제거는 기체로서 생산된 에틸렌을 액체 형태로 응축시켜 상기 생물 반응기 배양 용기로부터 제거하는 것을 포함할 수 있다.
한 실시 형태에서, 에틸렌을 생산하는 방법은 상기 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO2를 약 100 ml/분 내지 약 500 ml/분의 속도로 첨가하는 단계를 포함한다. 한 실시 형태에서, 상기 방법은 상기 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO2를 약 150 ml/분 내지 약 450 ml/분의 속도로 첨가하는 단계를 포함한다. 한 실시 형태에서, 상기 방법은 상기 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO2를 약 250 ml/분 내지 약 350 ml/분의 속도로 첨가하는 단계를 포함한다. 이러한 실시 형태는 상기 생물 반응기 배양 용기에서 에틸렌 생산 속도를 증진 또는 제어하는 이점을 제공할 뿐만 아니라 CO2를 유용한 생성물로 전환시키는 이점을 제공할 수 있다.
한 실시 형태에서, 에틸렌을 생산하는 방법은 상기 생물 반응기 배양 용기 내에 위치한 상기 재조합 미생물을 함유하는 상기 미생물 배양물로부터 적어도 하나의 분자 스위치를 제거하여 에틸렌 생산량을 감소시키는 단계를 추가로 포함한다. 한 실시 형태에서, 이러한 방법은 상기 재조합 미생물을 배양할 때 적어도 하나의 영양소의 농도 또는 적어도 하나의 자극의 양을 증가 또는 감소시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 조절하는 단계를 추가로 포함한다. 한 실시 형태에서, 상기 적어도 하나의 영양소의 농도 및 상기 적어도 하나의 자극의 양은 상기 미생물 배양에서 약 0.5~1.5 그램/리터 내지 약 0.1 mM의 비율이다. 한 실시 형태에서, 이러한 방법은 상기 에틸렌을 기체 상태에서 액체 상태로 응축시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 제거하는 단계를 추가로 포함하거나, 회수된 에틸렌의 양은 약 0.5 ml 내지 약 10 ml/리터/h이다. 이러한 실시 형태는 미생물 배양에서 캘빈 회로의 활성 속도를 조절하여 에틸렌 생산의 양을 조절하는 이점을 제공할 수 있다. 예를 들어, 발현 시스템에서 성장 시스템으로 전환하는 것이 가능하며, 여기서, 상기 세포는 5~7일 동안 성장하도록 허용되고, 이의 성장 조건은 모니터링된다. 상기 세포가 대수 증식 조건 (상기 세포가 대사적으로 활성인 것을 의미함)에 도달할 때, 성장 시스템에서 발현 시스템으로 전환하는 것이 가능하며, 여기서, 상기 세포는 수확을 위해 에틸렌을 생산하기 위한 에틸렌 생산 주기로 전환된다. 이러한 발현 시스템은 7일 이상 유지될 수 있다.
실시예
실시예 1: 에틸렌 형성 효소 유전자 서열의 클라미도모나스 레인하르티이 벡터 플라스미드 내로의 클로닝
EFE(에틸렌 형성 효소) 단백질을 클라미도모나스 레인하르티이에서 발현 및 생산한다. 플라스미드 pChlamy_4-EFE를 성공적으로 생산하여 EFE 단백질 발현에 사용하였다 (Creative Enzymes, Shirley, NY).
슈도모나스 사바스타노이 피.브이. 파설리콜라(Pseudomonas savastanoi pv. Phaseolicola) EFE 단백질 (GenBank: KPB44727.1, 서열 번호 1)을 코딩하는 폴리뉴클레오타이드를 pChlamy_4 벡터 플라스미드 (ThermoFisher) 내로 클로닝하였다. 다른 시약 및 기기 사용은 Creative Biostructure에 의해 제공되었다.
슈도모나스 사바스타노이 피.브이. 파설리콜라 균주 유래의 에틸렌 형성 효소(EFE) 유전자 서열 (GenBank: KPB44727.1)을 EFE 재조합 단백질의 제조에 사용하였다. 상응하는 뉴클레오타이드 서열을 클라미도모나스 레인하르티이에서의 발현을 위해 코돈 적합화 및 합성하였다 (서열 번호 3). EFE 작제물을 KpnI 및 PstI 제한 효소 부위를 갖는 pChlamy_4 벡터 내로 클로닝하였다.
pChlamy_4 벡터 특성에 따라, N-태그를 갖는 EFE를 설계 및 생성하였다. pChlamy_4 벡터는 인트론-1 Rbc S2의 제거 후 Shble 유전자의 시작 부분에서 발견되는 497~499번 위치에서 적절한 번역 개시를 위한 ATG 개시 코돈 (벡터 ATG)을 포함한다. 다중 클로닝 부위 1 (Multiple Cloning Site 1: MCS1)을 플랭킹하는 FMDV 2A 펩타이드 유전자는 Shble 유전자를 갖는 프레임 내에 있다. N-말단 6× His-V5-TEV 태그를 사용하기 위해, EFE 서열을 TEV 부위 이후의 프레임 내에서 KphI/PstI 분해된 pChlamy_4 벡터 내로 클로닝하였다. 적절한 번역 종료를 위해 TAA (정지 코돈)를 설계하였다. 생성된 서열 크로마토그램은 도 2에 도시되어 있으며; 도 2를 참조하면, EFE 단백질 유전자 코딩 서열은 "EFE 단백질"로 라벨링된 화살표에 도시되어 있다. 오픈 리딩 프레임 배향을 뉴클레오타이드 서열 분석에 의한 플라스미드 검증에 의해 확인하였다.
실시예 2: 이. 콜라이에서 EFE의 발현에 대한 단백질 발현 평가
슈도모나스 사바스타노이 피.브이. 파설리콜라 EFE 단백질 (GenBank: KPB44727.1, 서열 번호 1)을 코딩하는 폴리뉴클레오타이드를 pET-30a(+) 벡터 플라스미드 내로 클로닝하였다. 이. 콜라이에서의 발현을 위해, C-말단에서 임의의 His 태그에 이어서 정지 코돈 및 Hindll 부위 (서열 번호 9)를 함유하는 상응하는 뉴클레오타이드 서열을 코돈 적합화하였다 (서열 번호 4). 5-프라임 말단에서의 클로닝을 위해 NdeI 부위를 사용하였으며, 여기서, 상기 NdeI 부위는 ATG 개시 코돈을 포함한다 (서열 번호 8). 이. 콜라이 BL2l(DE3) 적격 세포를 재조합 플라스미드로 형질 전환시켰다. 카나마이신을 함유하는 LB 배지에 단일 콜로니를 접종하였으며; 배양물을 37℃에서 200 rpm으로 인큐베이션하였다. 세포 밀도가 600 nm에서 OD = 0.6~0.8에 도달하면, 유도를 위해 0.5 mM IPTG를 도입하였다. EFE (약 44.5 kDa)_BL2l(DE3)의 파일럿 발현을 수행하였다. SDS-PAGE (도 3a) 및 웨스턴 블롯팅 (도 3b)을 사용하여 EFE 단백질 발현을 모니터링하였다 (GenScript USA, Inc., Piscataway, NJ). 도 3a 및 도 3b를 참조한다:
작제물 pET 30a(+)의 이. 콜라이 발현에서 EFE의 파일럿 발현의 SDS-PAGE (좌측) 및 웨스턴 블롯 (우측, 항 His 항체 (GenScript, 카탈로그 번호 A00186) 사용) 분석.
레인 M1: 단백질 마커
레인 M2: 웨스턴 블롯 마커
레인 PC1: BSA (1 μg)
레인 PC2: BSA (2 μg)
레인 NC: 유도를 갖지 않는 세포 용해물
레인 1: 15℃에서 16 시간 동안 유도를 갖는 세포 용해물
레인 2: 37℃에서 4 시간 동안 유도를 갖는 세포 용해물
레인 NC1: 유도를 갖지 않는 세포 용해물의 상청액
레인 3: 15℃에서 16 시간 동안 유도를 갖는 세포 용해물의 상청액
레인 4: 37℃에서 4 시간 동안 유도를 갖는 세포 용해물의 상청액
레인 NC2: 유도를 갖지 않는 세포 용해물의 펠릿
레인 5: 15℃에서 16 시간 동안 유도를 갖는 세포 용해물의 펠릿
레인 6: 37℃에서 4 시간 동안 유도를 갖는 세포 용해물의 펠릿
SDS-PAGE 및 웨스턴 블롯의 결과는 EFE가 이. 콜라이에서 발현되었다는 것을 나타냈다. 가장 높은 EFE 발현 조건은 5 mg/L의 발현 수준과 30%의 용해도를 초래하는 15℃에서 16 시간 동안의 유도로 밝혀졌다.
실시예 3: 시네코코커스 종 세균에서의 발현을 위해 적합화된 재조합 EFE 및 AKGP 발현 뉴클레오타이드 서열
시아노박테리아 종 시네코코커스 엘롱가투스 및 시네코코커스 레오폴리엔시스 (GenScript, Piscataway, NJ)에서의 발현을 위한 뉴클레오타이드 서열의 적합화 후, EFE 단백질을 발현하고 AKGP 단백질 (서열 번호 2)을 발현하기 위한 폴리뉴클레오타이드 서열의 조합 (EFE_-P2A-aKGP, 서열 번호 7)을 생성하였다. 코돈 사용 편향, GC 함량, CpG 디뉴클레오타이드 함량, mRNA 2차 구조, 잠재 스플라이싱 부위, 조기 PolyA 부위, 내부 카이 부위 및 리보솜 결합 부위, 음성 CpG 섬, RNA 불안정성 모티프 (ARE), 반복체 서열 (직접 반복체, 역 반복체 및 Dyad 반복체), 및 클로닝을 방해할 수 있는 제한 부위를 포함하지만 이들에 한정되지 않는, 유전자 발현의 효율성에 중요한 다양한 파라미터를 적합화하는 코돈 적합화 분석 알고리즘을 사용하였다. 0.95의 생성된 코돈 적응 지수 (Codon Adaptation Index: CAI)와 함께 유전자 서열의 길이에 따른 코돈 사용 빈도의 분포를 사용하여 코돈 사용 편향 조정을 수행하였다. 1.0의 CAI는 목적하는 발현 유기체에서 완벽한 것으로 간주되며, 0.8 초과의 CAI는 높은 유전자 발현 수준의 관점에서 우수한 것으로 간주된다. 최적 코돈의 빈도 (Frequency of Optimal Codon: FOP)를 계산된 코돈 품질 그룹에서 유리한 코돈의 백분율 분포로서 측정하였으며, 목적하는 발현 유기체에서 주어진 아미노산에 대한 최대 사용 빈도를 갖는 코돈에 대해 100의 값을 설정하였다. 상기 코돈 중 80%의 결과가 91~100의 최고 코돈 품질 그룹에서, 3%가 81-90의 두 번째 최고 품질 그룹에서, 14%가 71~80의 세 번째 최고 품질 그룹에서 발견되었다. GC 함량 조정을 수행하여 56.46%의 평균 GC 함량을 생성하였으며, 이상적인 GC 함량의 백분율 범위는 30~70%이다. 하나의 임의의 HindIII 클로닝 부위 (서열 번호 12)를 서열의 1번 위치의 5-프라임 말단에 도입하였으며; 하나의 임의의 KpnI 클로닝 부위 (서열 번호 13)를 서열의 2524번 위치의 3-프라임 말단에 도입하였다.
서열 번호 7로 표현되는 상응하는 EFE와 AKGP 아미노산 서열의 조합은 EFE와 AKGP 아미노산 서열 사이에 삽입된 P2A 절단 서열 (서열 번호 11)을 갖는다. EFE 및 AKGP 서열을 함께 갖는 코딩된 아미노산 서열은 서열 번호 5 (EFE-P2A_pSyn_6 (His 없음))에 나타나 있다. 임의의 His-TEV 서열은 N-말단 (서열 번호 10)에 포함될 수 있으며, 이는 서열 번호 6 (EFE-P2A-aKGP_pSyn_6)의 아미노산 서열을 생성한다.
실시예 4: 실험실 규모 실험 절차
1. 합성 바이오 에틸렌 경로의 중요한 중간체를 코딩하는 맞춤형 설계된 DNA 작제물을 생성한다. 2. 그 다음, 클로닝 및 유전자 발현을 위해 신중하게 선택된 광합성 미생물을 확장한다. 3. 그 다음, 바이오 에틸렌의 지속적인 생산을 위해 미생물의 유전적 및 대사적 조작을 수행한다. 4. 그 다음, 생물 조작 미생물을 선택하고, 광 생물 반응기에서 확장한다. 5. 생물 반응기 배양 조건 (CO2 농도, 광 노출 시간 및 파장, 온도, pH 포함)을 적합화한다. 6. 샘플을 수집하고, HPLC로 분석하여 바이오 에틸렌 합성을 측정한다. 7. 유전자 조작 미생물에서 바이오 에틸렌 생산을 적합화한다. 8. 에틸렌 생산 공정을 규모 확대한다.
실시예 5: 시아노박테리아에서의 AKG 생산 조작
이전 연구는 glgC 유전자의 결실이 시아노박테리아에서 AKG 생산의 증가를 초래한다는 것을 나타냈다. 또한, 포스포에놀피루베이트 신타아제 (서열 번호 15)를 코딩하는 ppc 유전자 (서열 번호 14, Genbank P74299)와 시트레이트 신타아제 (서열 번호 17)를 코딩하는 gltA 유전자 (서열 번호 16, Genbank Q59977)의 과발현은 다른 화합물을 생산하기 위한 기질로서 AKG의 생산을 증진시킬 수 있는 것으로 나타났다. 본 연구를 바탕으로, ppc 및 gltA (과발현)를 비롯한 AKG 합성 및 분비 경로에 직접 관련되는 유전자와 글리코겐 합성 경로에서 중요한 역할을 하는 glgC (결실)를 비롯한 에너지 저장 경로에 관여하는 유전자를 포함하는 2가지 범주의 유전자를 선택하였다. 시네코코커스 엘롱가투스 내로의 통합과 형질 전환된 콜로니의 성장 전에 pSyn6 플라스미드 내로 클로닝하기 위한 ppc-p2A-gltA 작제물 (서열 번호 18)을 생성하였다. 시아노박테리아에서 작제물의 발현을 확인하기 위해 pSyn6-PPC-gltA 콜로니에 대해 PCR을 수행하였으며; 4621개 염기쌍의 PPC-gltA에 대한 예상 밴드 크기를 관찰하였다.
시아노박테리아에서의 AKG 과발현을 위해, IDH 유전자 (서열 번호 19)를 pSyn6 플라스미드에 클로닝하여 이소시트레이트 데하이드로게나아제 (서열 번호 20)를 코딩하는 상기 IDH 유전자의 작제물을 제조하였다. pSyn6-IDH 플라스미드 내로의 IDH 유전자의 성공적인 클로닝을 세균 콜로니의 성장 (도 5a)과 겔 전기 영동 및 DNA 분석 (도 6)에 의해 확인하였다. IDH 작제물을 통합하는 시네코코커스 엘롱가투스 균주 S2434-IDH를 세균 배양 성장 (도 9b)과 겔 전기 영동 및 DNA 분석 (도 9a)에 의해 확인하였다. 세포 배양 성장은 성장 배지 중의 중탄산염 농도를 0.5 g/L 또는 1.0 g/L 증가시킴으로써 상당히 개선되는 것으로 나타났다. 시아노박테리아에서 글루코오스-1-포스페이트 아데닐릴트랜스퍼라제 (서열 번호 22)를 코딩하는 glgC 유전자 (서열 번호 21, Genbank CP000I00.1) 결실을 위한 플라스미드도 또한 제작 및 확인하였다.
실시예 6: 시아노박테리아에서의 수크로오스 생산 조작
시아노박테리아에서의 수크로오스 생산을 위해, 이. 콜라이 유래의 cscB 유전자 (서열 번호 23, Genbank P300000)를 pSyn6 플라스미드에 클로닝하여 수크로오스 퍼미아제 (서열 번호 24)를 코딩하는 상기 cscB 유전자의 작제물을 제조하였다. pSyn6-cscB 작제물 내로의 cscB 유전자의 성공적인 클로닝을 세균 콜로니 성장 (도 5b)과 겔 전기 영동 및 DNA 분석 (도 6)에 의해 확인하였다. cscB를 통합하는 시네코코커스 엘롱가투스 균주 UTEX S2434 (S2434-cscB)를 세균 배양 성장 (도 7b)과 겔 전기 영동 및 DNA 분석 (도 7a)에 의해 확인하였다.
cscB 유전자의 과발현 및 glgC 유전자의 결실에 추가하여, 다른 유전자 표적은 중간체를 수크로오스로 경로를 변경시키기 위해 수크로오스 포스페이트 신타아제 (서열 번호 26)를 코딩하는 sps 유전자 (서열 번호 25, Genbank A0A0H3K0V9)의 과발현; 수크로오스-6-포스파타아제 (서열 번호 28)를 코딩하는 spp 유전자 (서열 번호 27, Genbank Q7BII3), 글리코겐 포스포릴라아제 (서열 번호 30)를 코딩하는 glgP 유전자 (서열 번호 29, Genbank Q31RP3), 및 UTP-글루코오스-1-포스페이트 우리딜릴트랜스퍼라아제 (서열 번호 32)를 코딩하는 galU 유전자 (서열 번호 31, Genbank P0AEP3)를 포함한다. 또한, 인버타아제 (서열 번호 34)를 코딩하는 inv 유전자 (서열 번호 33, Genbank P74573)와 글루코실글리세롤-포스페이트 신타아제 (서열 번호 36)를 코딩하는 ggpS 유전자 (서열 번호 35, Genbank P74258)의 결실은 대체 생성물로의 전환을 방지할 것이며; 글리코겐 신타아제 (서열 번호 38)를 코딩하는 glgA 유전자 (서열 번호 37, Genbank P74521)의 결실은 잠재적으로 수크로오스 수율을 증가시킬 수 있는 글리코겐으로의 기질의 전환을 제거할 것이다.
실시예 7: 이. 콜라이에서의 에틸렌 생산 조작
이. 콜라이에서 에틸렌 생산을 조작하기 위해, 높은 카피 수의 플라스미드 pUC19에서 IPTG 유도성 프로모터 하에 에틸렌 형성 효소(EFE)를 코딩하는 유전자 작제물 pUC-EFE (서열 번호 39)를 제조하였다. 이. 콜라이에서의 PUC-EFE 플라스미드 발현을 암피실린, IPTG 및 X-gal로 보충된 한천 배지 상의 콜로니 성장과 겔 전기 영동 및 DNA 분석에 의한 2322개 염기쌍의 예상 밴드 크기의 관찰에 의해 확인하였다 (도 8a 및 도 8b). 도 8a에서, 화살표는 EFE DNA 작제물을 나타내며; 도 8b에서, 화살표는 플라스미드 카피 수를 조절하는 DNA 요소를 나타낸다. DNA 서열 분석 결과는 플라스미드의 존재를 확인하였다. EFE 생산을 SDS-PAGE 및 웨스턴 블롯 분석에 의해 확인하였다. 5 mg/L의 에틸렌 발현 수준과 30% 용해도는 섭씨 15도에서 16 시간의 유도 조건하에 관찰되었다.
이. 콜라이에서 에틸렌의 생산을 조작하기 위해, 이. 콜라이에서 EFE의 지속적인 생산을 위한 플라스미드를 작제하였다. 모든 접근법에서, EFE 발현은 엽록체 psbA 프로모터의 제어하에 있었다. 제1 작제물 EFE-AKGP-psbA (서열 번호 40)에서, EFE 및 AKGP 유전자는 psbA 프로모터 (서열 번호 41) 및 rmB 터미네이터 (서열 번호 42)의 제어하에 놓여 있었다. 제2 작제물 EFE-psbA (서열 번호 43)에서, EFE 유전자 발현만이 psbA 프로모터 (서열 번호 41) 및 T7 터미네이터 (서열 번호 44)의 제어하에 놓여 있었다. 이. 콜라이 BL21(DE3), DH5알파 또는 MG1655 세포주에서 단백질을 발현하기 전에, 높은 카피 수의 플라스미드를 이용하기 위해 두 작제물 모두를 pUC19 플라스미드 백본 내로 클로닝하였다. pUC-psb-EFE 플라스미드를 작제하였다 (서열 번호 45).
에틸렌 생산에 미치는 AKG 및 아르기닌 보충제 뿐만 아니라 성장 배지의 영향을 측정하였다. 그 결과는 이. 콜라이 BL 21 PUC19 EFE에 대한 0.037 lb/갤런/월의 최대 에틸렌 생산이 표 1에 나타낸 조건하에 발효될 때 수득되었다는 것을 나타냈다.
표 1. 30℃에서 이. 콜라이 BL 21 PUC19 EFE에 대한 에틸렌 생산 조건
배지 MOPS
글루코오스 4 g/L
IPTG 0.5 mM
아르기닌 3 mM
AKG 2 mM
유도 시작시 유도
이. 콜라이 BL 21 PUC19 EFE의 관찰된 성장률의 결과는 도 4a에 도시되어 있다. 표 1에 나타낸 조건하에 관찰된 에틸렌 수율은 도 4b에 도시되어 있다. 헤드 스페이스 샘플의 가스 크로마토그래피 분석은 이. 콜라이 배양에 의한 에틸렌 생산을 확인하였다.
부록
서열 번호 1: -
서열 번호 2: -
서열 번호 3: -
서열 번호 4: -
서열 번호 5: -
서열 번호 6: -
서열 번호 7: -
서열 번호 14: -
서열 번호 15: -
서열 번호 16: -
서열 번호 17: -
서열 번호 18: -
서열 번호 19: -
서열 번호 20: -
서열 번호 21: -
서열 번호 22: -
서열 번호 23: -
서열 번호 24: -
서열 번호 25: -
서열 번호 26: -
서열 번호 27: -
서열 번호 28: -
서열 번호 29: -
서열 번호 30: -
서열 번호 31: -
서열 번호 32: -
서열 번호 33: -
서열 번호 34: -
서열 번호 35: -
서열 번호 36: -
서열 번호 37: -
서열 번호 38: -
서열 번호 39: -
서열 번호 40: -
서열 번호 41: -
서열 번호 42: -
서열 번호 43: -
서열 번호 44: -
서열 번호 45: -
SEQUENCE LISTING
<110> CEMVITA FACTORY, INC.
<120> METHODS AND COMPOSITIONS FOR PRODUCING ETHYLENE FROM RECOMBINANT
MICROORGANISMS
<130> P12854WO
<140> PCT/US2020/062938
<141> 2020-12-02
<150> 62/942,895
<151> 2019-12-03
<160> 46
<170> PatentIn version 3.5
<210> 1
<211> 387
<212> PRT
<213> Pseudomonas savastanoi
<400> 1
Met Ile His Ala Pro Ser Arg Trp Gly Val Phe Pro Ser Leu Gly Leu
1 5 10 15
Cys Ser Pro Asp Val Val Trp Asn Glu His Pro Ser Leu Tyr Met Asp
20 25 30
Lys Glu Glu Thr Ser Met Thr Asn Leu Gln Thr Phe Glu Leu Pro Thr
35 40 45
Glu Val Thr Gly Cys Ala Ala Asp Ile Ser Leu Gly Arg Ala Leu Ile
50 55 60
Gln Ala Trp Gln Lys Asp Gly Ile Phe Gln Ile Lys Thr Asp Ser Glu
65 70 75 80
Gln Asp Arg Lys Thr Gln Glu Ala Met Ala Ala Ser Lys Gln Phe Cys
85 90 95
Lys Glu Pro Leu Thr Phe Lys Ser Ser Cys Val Ser Asp Leu Thr Tyr
100 105 110
Ser Gly Tyr Val Ala Ser Gly Glu Glu Val Thr Ala Gly Lys Pro Asp
115 120 125
Phe Pro Glu Ile Phe Thr Val Cys Lys Asp Leu Ser Val Gly Asp Gln
130 135 140
Arg Val Lys Ala Gly Trp Pro Cys His Gly Pro Val Pro Trp Pro Asn
145 150 155 160
Asn Thr Tyr Gln Lys Ser Met Lys Thr Phe Met Glu Glu Leu Gly Leu
165 170 175
Ala Gly Glu Arg Leu Leu Lys Leu Thr Ala Leu Gly Phe Glu Leu Pro
180 185 190
Ile Asn Thr Phe Thr Asp Leu Thr Arg Asp Gly Trp His His Met Arg
195 200 205
Val Leu Arg Phe Pro Pro Gln Thr Ser Thr Leu Ser Arg Gly Ile Gly
210 215 220
Ala His Thr Asp Tyr Gly Leu Leu Val Ile Ala Ala Gln Asp Asp Val
225 230 235 240
Gly Gly Leu Tyr Ile Arg Pro Pro Val Glu Gly Glu Lys Arg Asn Arg
245 250 255
Asn Trp Leu Pro Gly Glu Ser Ser Ala Gly Met Phe Glu His Asp Glu
260 265 270
Pro Trp Thr Phe Val Thr Pro Thr Pro Gly Val Trp Thr Val Phe Pro
275 280 285
Gly Asp Ile Leu Gln Phe Met Thr Gly Gly Gln Leu Leu Ser Thr Pro
290 295 300
His Lys Val Lys Leu Asn Thr Arg Glu Arg Phe Ala Cys Ala Tyr Phe
305 310 315 320
His Glu Pro Asn Phe Glu Ala Ser Ala Tyr Pro Leu Phe Glu Pro Ser
325 330 335
Ala Asn Glu Arg Ile His Tyr Gly Glu His Phe Thr Asn Met Phe Met
340 345 350
Arg Cys Tyr Pro Asp Arg Ile Thr Thr Gln Arg Ile Asn Lys Glu Asn
355 360 365
Arg Leu Ala His Leu Glu Asp Leu Lys Lys Tyr Ser Asp Thr Arg Ala
370 375 380
Thr Gly Ser
385
<210> 2
<211> 431
<212> PRT
<213> Pseudomonas syringae
<400> 2
Met Thr Glu Ser Ile Thr Ser Asn Gly Thr Leu Val Ala Ser Asp Thr
1 5 10 15
Arg Arg Arg Val Trp Ala Ile Val Ser Ala Ser Ser Gly Asn Leu Val
20 25 30
Glu Trp Phe Asp Phe Tyr Val Tyr Ser Phe Cys Ser Leu Tyr Phe Ala
35 40 45
His Ile Phe Phe Pro Ser Gly Asn Thr Thr Thr Gln Leu Leu Gln Thr
50 55 60
Ala Gly Val Phe Ala Ala Gly Phe Leu Met Arg Pro Ile Gly Gly Trp
65 70 75 80
Leu Phe Gly Arg Ile Ala Asp Arg Arg Gly Arg Lys Thr Ser Met Leu
85 90 95
Ile Ser Val Cys Met Met Cys Phe Gly Ser Leu Ile Ile Ala Cys Leu
100 105 110
Pro Gly Tyr Asp Ala Ile Gly Thr Trp Ala Pro Ala Leu Leu Leu Leu
115 120 125
Ala Arg Leu Phe Gln Gly Leu Ser Val Gly Gly Glu Tyr Gly Thr Ser
130 135 140
Ala Thr Tyr Met Ser Glu Ile Ala Leu Glu Gly Arg Lys Gly Phe Tyr
145 150 155 160
Ala Ser Phe Gln Tyr Val Thr Leu Ile Gly Gly Gln Leu Leu Ala Ile
165 170 175
Leu Val Val Val Ile Leu Gln Gln Ile Leu Thr Asp Ser Gln Leu His
180 185 190
Glu Trp Gly Trp Arg Ile Pro Phe Ala Met Gly Ala Ala Leu Ala Ile
195 200 205
Val Ala Leu Trp Leu Arg Arg Gln Leu Asp Glu Thr Ser Gln Lys Glu
210 215 220
Val Arg Ala Leu Lys Glu Ala Gly Ser Phe Lys Gly Leu Trp Arg Asn
225 230 235 240
Arg Lys Ala Phe Leu Met Val Leu Gly Phe Thr Ala Gly Gly Ser Leu
245 250 255
Ser Phe Tyr Thr Phe Thr Thr Tyr Met Gln Lys Tyr Leu Val Asn Thr
260 265 270
Thr Gly Met His Ala Asn Val Ala Ser Val Ile Met Thr Ala Ala Leu
275 280 285
Phe Val Phe Met Leu Ile Gln Pro Leu Ile Gly Ala Leu Ser Asp Lys
290 295 300
Ile Gly Arg Arg Thr Ser Met Leu Ile Phe Gly Gly Met Ser Ala Leu
305 310 315 320
Cys Thr Val Pro Ile Leu Thr Ala Leu Gln His Val Ser Ser Pro Tyr
325 330 335
Ala Ala Phe Ala Leu Val Met Leu Ala Met Val Ile Val Ser Phe Tyr
340 345 350
Thr Ser Ile Ser Gly Ile Leu Lys Ala Glu Met Phe Pro Ala Gln Val
355 360 365
Arg Ala Leu Gly Val Gly Leu Ser Tyr Ala Val Ala Asn Ala Leu Phe
370 375 380
Gly Gly Ser Ala Glu Tyr Val Ala Leu Ser Leu Lys Ser Trp Gly Ser
385 390 395 400
Glu Thr Thr Phe Phe Trp Tyr Val Thr Ile Met Gly Ala Leu Ala Phe
405 410 415
Ile Val Ser Leu Met Leu His Arg Lys Gly Lys Gly Ile Arg Leu
420 425 430
<210> 3
<211> 1161
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 3
atgattcacg ccccgtcgcg ctggggcgtg tttccctcgc tgggcctgtg cagccccgac 60
gtggtgtgga acgagcaccc gagcctgtac atggacaagg aggagacgtc gatgaccaac 120
ctgcagacgt tcgagctgcc gaccgaggtg accggctgcg ccgccgacat ctccctgggc 180
cgggcgctga tccaggcgtg gcagaaggac ggcatcttcc agatcaagac cgacagcgag 240
caggaccgga agacccagga ggcgatggcg gcctccaagc agttctgcaa ggagcccctg 300
accttcaagt cgtcctgcgt cagcgacctg acctactcgg gctacgtggc ctcgggcgag 360
gaggtgaccg ccggcaagcc ggactttccg gagatcttca ccgtgtgcaa ggacctgagc 420
gtgggcgacc agcgggtcaa ggcgggctgg ccctgccacg gccccgtgcc gtggccgaac 480
aacacctacc agaagtccat gaagacgttc atggaggagc tgggcctggc cggcgagcgc 540
ctgctgaagc tgaccgcgct gggcttcgag ctgcccatca acacgttcac cgacctgacc 600
cgggacggct ggcaccacat gcgcgtcctg cggtttccgc cccagaccag cacgctgagc 660
cgcggcattg gcgcgcacac ggactacggc ctgctggtga ttgccgcgca ggacgacgtg 720
ggcggcctgt acattcgccc gccggtggag ggcgagaagc gcaaccggaa ctggctgccc 780
ggcgagtcct cggcgggcat gttcgagcac gacgagccct ggacgttcgt gacccccacg 840
ccgggcgtgt ggacggtgtt tcccggcgac atcctgcagt tcatgaccgg cggccagctg 900
ctgtcgacgc cgcacaaggt gaagctgaac acccgggagc gcttcgcctg cgcgtacttc 960
cacgagccga acttcgaggc ctcggcctac cccctgttcg agccctccgc gaacgagcgc 1020
atccactacg gcgagcactt caccaatatg tttatgcgct gctaccccga ccgcatcacc 1080
acccagcgca tcaacaagga gaatcgcctg gcgcacctgg aggacctgaa gaagtacagc 1140
gacacccgcg ccaccggctc g 1161
<210> 4
<211> 1161
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 4
atgatacacg ctccaagtag atggggagta tttccctcac tagggttatg cagcccggac 60
gttgtgtgga atgagcatcc gagcctgtac atggacaaag aggaaaccag catgaccaac 120
ctgcagacct ttgaactgcc gaccgaagtg accggttgcg cggcggacat cagcctgggt 180
cgtgcgctga ttcaggcgtg gcaaaaggat ggtatcttcc agattaaaac cgacagcgag 240
caggatcgta agacccaaga agcgatggcg gcgagcaagc aattttgcaa agagccgctg 300
accttcaaaa gcagctgcgt tagcgacctg acctacagcg gttatgtggc gagcggcgag 360
gaagttaccg cgggcaagcc ggatttcccg gaaattttta ccgtgtgcaa ggacctgagc 420
gtgggcgatc agcgtgttaa agcgggttgg ccgtgccatg gtccggttcc gtggccgaac 480
aacacctatc aaaagagcat gaaaaccttt atggaggaac tgggtctggc gggcgagcgt 540
ctgctgaaac tgaccgcgct gggttttgaa ctgccgatca acaccttcac cgacctgacc 600
cgtgatggct ggcaccacat gcgtgtgctg cgtttcccgc cgcagaccag caccctgagc 660
cgtggtattg gtgcgcacac cgactacggt ctgctggtga ttgcggcgca agacgatgtt 720
ggtggcctgt atatccgtcc gccggtggag ggcgaaaagc gtaaccgtaa ctggctgccg 780
ggcgagagca gcgcgggcat gtttgagcac gacgaaccgt ggaccttcgt taccccgacc 840
ccgggtgtgt ggaccgtttt tccgggcgat attctgcagt tcatgaccgg tggccaactg 900
ctgagcaccc cgcacaaggt taaactgaac acccgtgaac gtttcgcgtg cgcgtacttt 960
cacgagccga acttcgaagc gagcgcgtat ccgctgttcg agccgagcgc gaacgaacgt 1020
atccactacg gcgagcactt caccaacatg tttatgcgtt gctatccgga tcgtatcacc 1080
acccaacgta ttaacaaaga aaaccgtctg gcgcacctgg aagacctgaa gaaatacagc 1140
gacacccgtg cgaccggcag c 1161
<210> 5
<211> 838
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 5
Met Ile His Ala Pro Ser Arg Trp Gly Val Phe Pro Ser Leu Gly Leu
1 5 10 15
Cys Ser Pro Asp Val Val Trp Asn Glu His Pro Ser Leu Tyr Met Asp
20 25 30
Lys Glu Glu Thr Ser Met Thr Asn Leu Gln Thr Phe Glu Leu Pro Thr
35 40 45
Glu Val Thr Gly Cys Ala Ala Asp Ile Ser Leu Gly Arg Ala Leu Ile
50 55 60
Gln Ala Trp Gln Lys Asp Gly Ile Phe Gln Ile Lys Thr Asp Ser Glu
65 70 75 80
Gln Asp Arg Lys Thr Gln Glu Ala Met Ala Ala Ser Lys Gln Phe Cys
85 90 95
Lys Glu Pro Leu Thr Phe Lys Ser Ser Cys Val Ser Asp Leu Thr Tyr
100 105 110
Ser Gly Tyr Val Ala Ser Gly Glu Glu Val Thr Ala Gly Lys Pro Asp
115 120 125
Phe Pro Glu Ile Phe Thr Val Cys Lys Asp Leu Ser Val Gly Asp Gln
130 135 140
Arg Val Lys Ala Gly Trp Pro Cys His Gly Pro Val Pro Trp Pro Asn
145 150 155 160
Asn Thr Tyr Gln Lys Ser Met Lys Thr Phe Met Glu Glu Leu Gly Leu
165 170 175
Ala Gly Glu Arg Leu Leu Lys Leu Thr Ala Leu Gly Phe Glu Leu Pro
180 185 190
Ile Asn Thr Phe Thr Asp Leu Thr Arg Asp Gly Trp His His Met Arg
195 200 205
Val Leu Arg Phe Pro Pro Gln Thr Ser Thr Leu Ser Arg Gly Ile Gly
210 215 220
Ala His Thr Asp Tyr Gly Leu Leu Val Ile Ala Ala Gln Asp Asp Val
225 230 235 240
Gly Gly Leu Tyr Ile Arg Pro Pro Val Glu Gly Glu Lys Arg Asn Arg
245 250 255
Asn Trp Leu Pro Gly Glu Ser Ser Ala Gly Met Phe Glu His Asp Glu
260 265 270
Pro Trp Thr Phe Val Thr Pro Thr Pro Gly Val Trp Thr Val Phe Pro
275 280 285
Gly Asp Ile Leu Gln Phe Met Thr Gly Gly Gln Leu Leu Ser Thr Pro
290 295 300
His Lys Val Lys Leu Asn Thr Arg Glu Arg Phe Ala Cys Ala Tyr Phe
305 310 315 320
His Glu Pro Asn Phe Glu Ala Ser Ala Tyr Pro Leu Phe Glu Pro Ser
325 330 335
Ala Asn Glu Arg Ile His Tyr Gly Glu His Phe Thr Asn Met Phe Met
340 345 350
Arg Cys Tyr Pro Asp Arg Ile Thr Thr Gln Arg Ile Asn Lys Glu Asn
355 360 365
Arg Leu Ala His Leu Glu Asp Leu Lys Lys Tyr Ser Asp Thr Arg Ala
370 375 380
Thr Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
385 390 395 400
Val Glu Glu Asn Pro Gly Pro Met Thr Glu Ser Ile Thr Ser Asn Gly
405 410 415
Thr Leu Val Ala Ser Asp Thr Arg Arg Arg Val Trp Ala Ile Val Ser
420 425 430
Ala Ser Ser Gly Asn Leu Val Glu Trp Phe Asp Phe Tyr Val Tyr Ser
435 440 445
Phe Cys Ser Leu Tyr Phe Ala His Ile Phe Phe Pro Ser Gly Asn Thr
450 455 460
Thr Thr Gln Leu Leu Gln Thr Ala Gly Val Phe Ala Ala Gly Phe Leu
465 470 475 480
Met Arg Pro Ile Gly Gly Trp Leu Phe Gly Arg Ile Ala Asp Arg Arg
485 490 495
Gly Arg Lys Thr Ser Met Leu Ile Ser Val Cys Met Met Cys Phe Gly
500 505 510
Ser Leu Ile Ile Ala Cys Leu Pro Gly Tyr Asp Ala Ile Gly Thr Trp
515 520 525
Ala Pro Ala Leu Leu Leu Leu Ala Arg Leu Phe Gln Gly Leu Ser Val
530 535 540
Gly Gly Glu Tyr Gly Thr Ser Ala Thr Tyr Met Ser Glu Ile Ala Leu
545 550 555 560
Glu Gly Arg Lys Gly Phe Tyr Ala Ser Phe Gln Tyr Val Thr Leu Ile
565 570 575
Gly Gly Gln Leu Leu Ala Ile Leu Val Val Val Ile Leu Gln Gln Ile
580 585 590
Leu Thr Asp Ser Gln Leu His Glu Trp Gly Trp Arg Ile Pro Phe Ala
595 600 605
Met Gly Ala Ala Leu Ala Ile Val Ala Leu Trp Leu Arg Arg Gln Leu
610 615 620
Asp Glu Thr Ser Gln Lys Glu Val Arg Ala Leu Lys Glu Ala Gly Ser
625 630 635 640
Phe Lys Gly Leu Trp Arg Asn Arg Lys Ala Phe Leu Met Val Leu Gly
645 650 655
Phe Thr Ala Gly Gly Ser Leu Ser Phe Tyr Thr Phe Thr Thr Tyr Met
660 665 670
Gln Lys Tyr Leu Val Asn Thr Thr Gly Met His Ala Asn Val Ala Ser
675 680 685
Val Ile Met Thr Ala Ala Leu Phe Val Phe Met Leu Ile Gln Pro Leu
690 695 700
Ile Gly Ala Leu Ser Asp Lys Ile Gly Arg Arg Thr Ser Met Leu Ile
705 710 715 720
Phe Gly Gly Met Ser Ala Leu Cys Thr Val Pro Ile Leu Thr Ala Leu
725 730 735
Gln His Val Ser Ser Pro Tyr Ala Ala Phe Ala Leu Val Met Leu Ala
740 745 750
Met Val Ile Val Ser Phe Tyr Thr Ser Ile Ser Gly Ile Leu Lys Ala
755 760 765
Glu Met Phe Pro Ala Gln Val Arg Ala Leu Gly Val Gly Leu Ser Tyr
770 775 780
Ala Val Ala Asn Ala Leu Phe Gly Gly Ser Ala Glu Tyr Val Ala Leu
785 790 795 800
Ser Leu Lys Ser Trp Gly Ser Glu Thr Thr Phe Phe Trp Tyr Val Thr
805 810 815
Ile Met Gly Ala Leu Ala Phe Ile Val Ser Leu Met Leu His Arg Lys
820 825 830
Gly Lys Gly Ile Arg Leu
835
<210> 6
<211> 854
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 6
Met His His His His His His Glu Asn Leu Tyr Phe Gln Gly Lys Leu
1 5 10 15
Met Ile His Ala Pro Ser Arg Trp Gly Val Phe Pro Ser Leu Gly Leu
20 25 30
Cys Ser Pro Asp Val Val Trp Asn Glu His Pro Ser Leu Tyr Met Asp
35 40 45
Lys Glu Glu Thr Ser Met Thr Asn Leu Gln Thr Phe Glu Leu Pro Thr
50 55 60
Glu Val Thr Gly Cys Ala Ala Asp Ile Ser Leu Gly Arg Ala Leu Ile
65 70 75 80
Gln Ala Trp Gln Lys Asp Gly Ile Phe Gln Ile Lys Thr Asp Ser Glu
85 90 95
Gln Asp Arg Lys Thr Gln Glu Ala Met Ala Ala Ser Lys Gln Phe Cys
100 105 110
Lys Glu Pro Leu Thr Phe Lys Ser Ser Cys Val Ser Asp Leu Thr Tyr
115 120 125
Ser Gly Tyr Val Ala Ser Gly Glu Glu Val Thr Ala Gly Lys Pro Asp
130 135 140
Phe Pro Glu Ile Phe Thr Val Cys Lys Asp Leu Ser Val Gly Asp Gln
145 150 155 160
Arg Val Lys Ala Gly Trp Pro Cys His Gly Pro Val Pro Trp Pro Asn
165 170 175
Asn Thr Tyr Gln Lys Ser Met Lys Thr Phe Met Glu Glu Leu Gly Leu
180 185 190
Ala Gly Glu Arg Leu Leu Lys Leu Thr Ala Leu Gly Phe Glu Leu Pro
195 200 205
Ile Asn Thr Phe Thr Asp Leu Thr Arg Asp Gly Trp His His Met Arg
210 215 220
Val Leu Arg Phe Pro Pro Gln Thr Ser Thr Leu Ser Arg Gly Ile Gly
225 230 235 240
Ala His Thr Asp Tyr Gly Leu Leu Val Ile Ala Ala Gln Asp Asp Val
245 250 255
Gly Gly Leu Tyr Ile Arg Pro Pro Val Glu Gly Glu Lys Arg Asn Arg
260 265 270
Asn Trp Leu Pro Gly Glu Ser Ser Ala Gly Met Phe Glu His Asp Glu
275 280 285
Pro Trp Thr Phe Val Thr Pro Thr Pro Gly Val Trp Thr Val Phe Pro
290 295 300
Gly Asp Ile Leu Gln Phe Met Thr Gly Gly Gln Leu Leu Ser Thr Pro
305 310 315 320
His Lys Val Lys Leu Asn Thr Arg Glu Arg Phe Ala Cys Ala Tyr Phe
325 330 335
His Glu Pro Asn Phe Glu Ala Ser Ala Tyr Pro Leu Phe Glu Pro Ser
340 345 350
Ala Asn Glu Arg Ile His Tyr Gly Glu His Phe Thr Asn Met Phe Met
355 360 365
Arg Cys Tyr Pro Asp Arg Ile Thr Thr Gln Arg Ile Asn Lys Glu Asn
370 375 380
Arg Leu Ala His Leu Glu Asp Leu Lys Lys Tyr Ser Asp Thr Arg Ala
385 390 395 400
Thr Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
405 410 415
Val Glu Glu Asn Pro Gly Pro Met Thr Glu Ser Ile Thr Ser Asn Gly
420 425 430
Thr Leu Val Ala Ser Asp Thr Arg Arg Arg Val Trp Ala Ile Val Ser
435 440 445
Ala Ser Ser Gly Asn Leu Val Glu Trp Phe Asp Phe Tyr Val Tyr Ser
450 455 460
Phe Cys Ser Leu Tyr Phe Ala His Ile Phe Phe Pro Ser Gly Asn Thr
465 470 475 480
Thr Thr Gln Leu Leu Gln Thr Ala Gly Val Phe Ala Ala Gly Phe Leu
485 490 495
Met Arg Pro Ile Gly Gly Trp Leu Phe Gly Arg Ile Ala Asp Arg Arg
500 505 510
Gly Arg Lys Thr Ser Met Leu Ile Ser Val Cys Met Met Cys Phe Gly
515 520 525
Ser Leu Ile Ile Ala Cys Leu Pro Gly Tyr Asp Ala Ile Gly Thr Trp
530 535 540
Ala Pro Ala Leu Leu Leu Leu Ala Arg Leu Phe Gln Gly Leu Ser Val
545 550 555 560
Gly Gly Glu Tyr Gly Thr Ser Ala Thr Tyr Met Ser Glu Ile Ala Leu
565 570 575
Glu Gly Arg Lys Gly Phe Tyr Ala Ser Phe Gln Tyr Val Thr Leu Ile
580 585 590
Gly Gly Gln Leu Leu Ala Ile Leu Val Val Val Ile Leu Gln Gln Ile
595 600 605
Leu Thr Asp Ser Gln Leu His Glu Trp Gly Trp Arg Ile Pro Phe Ala
610 615 620
Met Gly Ala Ala Leu Ala Ile Val Ala Leu Trp Leu Arg Arg Gln Leu
625 630 635 640
Asp Glu Thr Ser Gln Lys Glu Val Arg Ala Leu Lys Glu Ala Gly Ser
645 650 655
Phe Lys Gly Leu Trp Arg Asn Arg Lys Ala Phe Leu Met Val Leu Gly
660 665 670
Phe Thr Ala Gly Gly Ser Leu Ser Phe Tyr Thr Phe Thr Thr Tyr Met
675 680 685
Gln Lys Tyr Leu Val Asn Thr Thr Gly Met His Ala Asn Val Ala Ser
690 695 700
Val Ile Met Thr Ala Ala Leu Phe Val Phe Met Leu Ile Gln Pro Leu
705 710 715 720
Ile Gly Ala Leu Ser Asp Lys Ile Gly Arg Arg Thr Ser Met Leu Ile
725 730 735
Phe Gly Gly Met Ser Ala Leu Cys Thr Val Pro Ile Leu Thr Ala Leu
740 745 750
Gln His Val Ser Ser Pro Tyr Ala Ala Phe Ala Leu Val Met Leu Ala
755 760 765
Met Val Ile Val Ser Phe Tyr Thr Ser Ile Ser Gly Ile Leu Lys Ala
770 775 780
Glu Met Phe Pro Ala Gln Val Arg Ala Leu Gly Val Gly Leu Ser Tyr
785 790 795 800
Ala Val Ala Asn Ala Leu Phe Gly Gly Ser Ala Glu Tyr Val Ala Leu
805 810 815
Ser Leu Lys Ser Trp Gly Ser Glu Thr Thr Phe Phe Trp Tyr Val Thr
820 825 830
Ile Met Gly Ala Leu Ala Phe Ile Val Ser Leu Met Leu His Arg Lys
835 840 845
Gly Lys Gly Ile Arg Leu
850
<210> 7
<211> 2517
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 7
atgattcatg ccccctcccg ctggggcgtg tttcccagtc tgggtctctg ctcccccgat 60
gtggtgtgga acgaacaccc cagcctgtac atggataagg aagagaccag tatgaccaat 120
ctgcaaacct ttgaactgcc caccgaggtg accggttgcg ccgccgatat tagcctcggt 180
cgcgccctga ttcaagcctg gcaaaaggat ggcatcttcc aaatcaagac cgattccgaa 240
caagatcgca agacccaaga ggccatggcc gccagcaaac aattttgcaa ggaacccctg 300
acctttaaat ccagctgcgt gagcgatctc acctacagtg gctatgtggc cagtggtgaa 360
gaggtgaccg ccggcaagcc cgattttccc gagattttta ccgtgtgcaa ggatctgagt 420
gtgggtgatc aacgcgtgaa agccggttgg ccctgccatg gtcccgtgcc ctggcccaac 480
aatacctatc aaaaatccat gaagaccttt atggaagaac tcggtctggc cggtgaacgc 540
ctgctcaaac tgaccgccct cggctttgag ctgcccatta acacctttac cgatctcacc 600
cgcgatggtt ggcaccacat gcgcgtgctg cgctttcctc cccaaaccag caccctgagc 660
cgcggtattg gtgcccacac cgattacggc ctgctcgtga ttgccgccca agatgatgtg 720
ggcggtctgt atattcgccc tcccgtggaa ggcgagaaac gcaaccgcaa ttggctcccc 780
ggcgaaagtt ccgccggcat gtttgaacac gatgaaccct ggacctttgt gacgcccacg 840
cccggcgtgt ggaccgtgtt tcccggtgat attctgcaat ttatgaccgg cggtcaactg 900
ctctccacgc cccacaaagt gaagctcaac acccgcgaac gctttgcctg cgcctacttt 960
cacgaaccca attttgaggc cagtgcctat cccctgtttg aaccctccgc caacgagcgc 1020
attcactacg gcgagcactt taccaatatg tttatgcgct gctatcccga tcgcattacc 1080
acccaacgca ttaacaagga aaatcgcctg gcccacctcg aggatctgaa aaagtatagt 1140
gatacccgcg ccaccggtag tggtgccacc aactttagcc tgctcaaaca agccggcgat 1200
gtggaagaga accccggtcc catgaccgaa agtattacca gcaatggcac cctggtggcc 1260
agtgataccc gtcgccgcgt gtgggccatt gtgagtgcca gcagtggtaa cctggtggag 1320
tggtttgatt tttacgtgta tagcttttgc agtctctact ttgcccacat tttctttccc 1380
agtggcaata ccaccaccca actgctgcaa accgccggcg tgtttgccgc cggttttctg 1440
atgcgcccca ttggcggttg gctctttggc cgcattgccg atcgtcgcgg tcgcaagacc 1500
agcatgctga ttagcgtgtg catgatgtgc tttggctccc tgattattgc ctgcctcccc 1560
ggctatgatg ccattggcac ctgggccccc gccctgctcc tgctggcccg cctctttcaa 1620
ggcctgagcg tgggcggtga atacggcacc agcgccacct atatgagtga aattgccctg 1680
gagggccgca aaggttttta cgccagtttt caatatgtga ccctgattgg cggtcaactg 1740
ctcgccattc tcgtggtggt gattctccaa caaattctga ccgattccca actgcacgaa 1800
tggggctggc gcattccctt tgccatgggt gccgccctgg ccattgtggc cctgtggctc 1860
cgtcgccaac tcgatgaaac cagccaaaaa gaggtgcgcg ccctgaaaga agccggcagt 1920
tttaaaggtc tctggcgcaa ccgcaaggcc tttctcatgg tgctgggctt taccgccggc 1980
ggtagtctgt ccttttacac ctttaccacc tacatgcaaa aatatctcgt gaacaccacc 2040
ggcatgcacg ccaatgtggc cagcgtgatt atgaccgccg ccctgtttgt gtttatgctc 2100
attcaacccc tgattggcgc cctcagcgat aagattggtc gtcgcaccag tatgctgatt 2160
tttggcggta tgagtgccct ctgcaccgtg cccattctca ccgccctgca acacgtgtcc 2220
agcccctacg ccgcctttgc cctcgtgatg ctggccatgg tgattgtgtc cttttatacc 2280
agcattagtg gcattctgaa ggccgaaatg tttcccgccc aagtgcgcgc cctgggcgtg 2340
ggtctcagtt acgccgtggc caatgccctg tttggcggtt ccgccgaata tgtggccctg 2400
tccctcaaaa gctggggcag tgagaccacc tttttctggt acgtgaccat tatgggtgcc 2460
ctggccttta ttgtgagcct gatgctccac cgcaaaggca agggtattcg cctctag 2517
<210> 8
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 8
catatg 6
<210> 9
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 9
caccaccacc atcatcatta atgaaagctt 30
<210> 10
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 10
Met His His His His His His Glu Asn Leu Tyr Phe Gln Gly Lys Leu
1 5 10 15
<210> 11
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 11
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
1 5 10 15
Asn Pro Gly Pro
20
<210> 12
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 12
aagctt 6
<210> 13
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 13
ggtacc 6
<210> 14
<211> 2757
<212> DNA
<213> Synechocystis sp.
<400> 14
atgactgatt ttttacgcga tgacatcagg ttcctcggtc aaatcctcgg tgaggtaatt 60
gcggaacaag aaggccagga ggtttatgaa ctggtcgaac aagcgcgcct gacttctttt 120
gatatcgcca agggcaacgc cgaaatggat agcctggttc aggttttcga cggcattact 180
ccagccaagg caacaccgat tgctcgcgca ttttcccact tcgctctgct ggctaacctg 240
gcggaagacc tctacgatga agagcttcgt gaacaggctc tcgatgcagg cgacacccct 300
ccggacagca ctcttgatgc cacctggctg aaactcaatg agggcaatgt tggcgcagaa 360
gctgtggccg atgtgctgcg caatgctgag gtggcgccgg ttctgactgc gcacccaact 420
gagactcgcc gccgcactgt ttttgatgcg caaaagtgga tcaccaccca catgcgtgaa 480
cgccacgctt tgcagtctgc ggagcctacc gctcgtacgc aaagcaagtt ggatgagatc 540
gagaagaaca tccgccgtcg catcaccatt ttgtggcaga ccgcgttgat tcgtgtggcc 600
cgcccacgta tcgaggacga gatcgaagta gggctgcgct actacaagct gagccttttg 660
gaagagattc cacgtatcaa ccgtgatgtg gctgttgagc ttcgtgagcg tttcggcgag 720
ggtgttcctt tgaagcccgt ggtcaagcca ggttcctgga ttggtggaga ccacgacggt 780
aacccttatg tcaccgcgga aacagttgag tattccactc accgcgctgc ggaaaccgtg 840
ctcaagtact atgcacgcca gctgcattcc ctcgagcatg agctcagcct gtcggaccgc 900
atgaataagg tcaccccgca gctgcttgcg ctggcagatg cagggcacaa cgacgtgcca 960
agccgcgtgg atgagcctta tcgacgcgcc gtccatggcg ttcgcggacg tatcctcgcg 1020
acgacggccg agctgatcgg cgaggacgcc gttgagggcg tgtggttcaa ggtctttact 1080
ccatacgcat ctccggaaga attcttaaac gatgcgttga ccattgatca ttctctgcgt 1140
gaatccaagg acgttctcat tgccgatgat cgtttgtctg tgctgatttc tgccatcgag 1200
agctttggat tcaaccttta cgcactggat ctgcgccaaa actccgaaag ctacgaggac 1260
gtcctcaccg agcttttcga acgcgcccaa gtcaccgcaa actaccgcga gctgtctgaa 1320
gcagagaaac ttgaggtgct gctgaaggaa ctgcgcagcc ctcgtccgct gatcccgcac 1380
ggttcagatg aatacagcga ggtcaccgac cgcgagctcg gcatcttccg caccgcgtcg 1440
gaggctgtta agaaattcgg gccacggatg gtgcctcact gcatcatctc catggcatca 1500
tcggtcaccg atgtgctcga gccgatggtg ttgctcaagg aattcggact catcgcagcc 1560
aacggcgaca acccacgcgg caccgtcgat gtcatcccac tgttcgaaac catcgaagat 1620
ctccaggccg gcgccggaat cctcgacgaa ctgtggaaaa ttgatctcta ccgcaactac 1680
ctcctgcagc gcgacaacgt ccaggaagtc atgctcggtt actccgattc caacaaggat 1740
ggcggatatt tctccgcaaa ctgggcgctt tacgacgcgg aactgcagct cgtcgaacta 1800
tgccgatcag ccggggtcaa cgttcgcctg ttccacggcc gtggtggcac cgtcggccgc 1860
ggtggcggac cttcctacga cgcgattctt gcccagccca ggggggctgt ccaaggttcc 1920
gtgcgcatca ccgagcaggg cgagatcatc tccgctaagt acggcaaccc cgaaaccgcg 1980
cgccgaaacc tcgaagccct ggtctcagcc acgcttgagg catcgcttct cgacgtctcc 2040
gaactcaccg atcaccaacg cgcgtacgac atcatgagtg agatctctga gctcagcttg 2100
aagaagtacg cctccttggt gcacgaggat caaggcttca tcgattactt cacccagtcc 2160
acgccgctgc aggagattgg atccctcaac atcggatcca ggccttcctc acgcaagcag 2220
acctcctcgg tggaagattt gcgagccatc ccatgggtgc tcagctggtc acagtctcgt 2280
gtcatgctgc caggctggtt tggtgtcgga accgcattag agcagtggat tggcgaaggg 2340
gagcaggcca cccaacgcat tgccgagctg caaacactca atgagtcctg gccattttta 2400
ccctcagtgt tggataacat ggctcaggtg atgtccaagg cagagctgcg tttggcaaag 2460
ctctacgcag acctgatccc agatacggaa gtagccgagc gagtctattc cgtcatccgc 2520
gaggagtact tcctgaccaa gaagatgttc tgcgtaatca ccggctctga tgatctgctt 2580
gatgacaacc cacttctcgc acgctctgtc cagcgccgat acccctacct gcttccactc 2640
aacgtgatcc aggtagagat gatgcgacgc taccgaaaag gcgaccaaag cgagcaagtg 2700
tcccgcaaca ttcagctgac catgaacggt ctttccactg cggtgcgcaa ctccggc 2757
<210> 15
<211> 919
<212> PRT
<213> Synechocystis sp.
<400> 15
Met Thr Asp Phe Leu Arg Asp Asp Ile Arg Phe Leu Gly Gln Ile Leu
1 5 10 15
Gly Glu Val Ile Ala Glu Gln Glu Gly Gln Glu Val Tyr Glu Leu Val
20 25 30
Glu Gln Ala Arg Leu Thr Ser Phe Asp Ile Ala Lys Gly Asn Ala Glu
35 40 45
Met Asp Ser Leu Val Gln Val Phe Asp Gly Ile Thr Pro Ala Lys Ala
50 55 60
Thr Pro Ile Ala Arg Ala Phe Ser His Phe Ala Leu Leu Ala Asn Leu
65 70 75 80
Ala Glu Asp Leu Tyr Asp Glu Glu Leu Arg Glu Gln Ala Leu Asp Ala
85 90 95
Gly Asp Thr Pro Pro Asp Ser Thr Leu Asp Ala Thr Trp Leu Lys Leu
100 105 110
Asn Glu Gly Asn Val Gly Ala Glu Ala Val Ala Asp Val Leu Arg Asn
115 120 125
Ala Glu Val Ala Pro Val Leu Thr Ala His Pro Thr Glu Thr Arg Arg
130 135 140
Arg Thr Val Phe Asp Ala Gln Lys Trp Ile Thr Thr His Met Arg Glu
145 150 155 160
Arg His Ala Leu Gln Ser Ala Glu Pro Thr Ala Arg Thr Gln Ser Lys
165 170 175
Leu Asp Glu Ile Glu Lys Asn Ile Arg Arg Arg Ile Thr Ile Leu Trp
180 185 190
Gln Thr Ala Leu Ile Arg Val Ala Arg Pro Arg Ile Glu Asp Glu Ile
195 200 205
Glu Val Gly Leu Arg Tyr Tyr Lys Leu Ser Leu Leu Glu Glu Ile Pro
210 215 220
Arg Ile Asn Arg Asp Val Ala Val Glu Leu Arg Glu Arg Phe Gly Glu
225 230 235 240
Gly Val Pro Leu Lys Pro Val Val Lys Pro Gly Ser Trp Ile Gly Gly
245 250 255
Asp His Asp Gly Asn Pro Tyr Val Thr Ala Glu Thr Val Glu Tyr Ser
260 265 270
Thr His Arg Ala Ala Glu Thr Val Leu Lys Tyr Tyr Ala Arg Gln Leu
275 280 285
His Ser Leu Glu His Glu Leu Ser Leu Ser Asp Arg Met Asn Lys Val
290 295 300
Thr Pro Gln Leu Leu Ala Leu Ala Asp Ala Gly His Asn Asp Val Pro
305 310 315 320
Ser Arg Val Asp Glu Pro Tyr Arg Arg Ala Val His Gly Val Arg Gly
325 330 335
Arg Ile Leu Ala Thr Thr Ala Glu Leu Ile Gly Glu Asp Ala Val Glu
340 345 350
Gly Val Trp Phe Lys Val Phe Thr Pro Tyr Ala Ser Pro Glu Glu Phe
355 360 365
Leu Asn Asp Ala Leu Thr Ile Asp His Ser Leu Arg Glu Ser Lys Asp
370 375 380
Val Leu Ile Ala Asp Asp Arg Leu Ser Val Leu Ile Ser Ala Ile Glu
385 390 395 400
Ser Phe Gly Phe Asn Leu Tyr Ala Leu Asp Leu Arg Gln Asn Ser Glu
405 410 415
Ser Tyr Glu Asp Val Leu Thr Glu Leu Phe Glu Arg Ala Gln Val Thr
420 425 430
Ala Asn Tyr Arg Glu Leu Ser Glu Ala Glu Lys Leu Glu Val Leu Leu
435 440 445
Lys Glu Leu Arg Ser Pro Arg Pro Leu Ile Pro His Gly Ser Asp Glu
450 455 460
Tyr Ser Glu Val Thr Asp Arg Glu Leu Gly Ile Phe Arg Thr Ala Ser
465 470 475 480
Glu Ala Val Lys Lys Phe Gly Pro Arg Met Val Pro His Cys Ile Ile
485 490 495
Ser Met Ala Ser Ser Val Thr Asp Val Leu Glu Pro Met Val Leu Leu
500 505 510
Lys Glu Phe Gly Leu Ile Ala Ala Asn Gly Asp Asn Pro Arg Gly Thr
515 520 525
Val Asp Val Ile Pro Leu Phe Glu Thr Ile Glu Asp Leu Gln Ala Gly
530 535 540
Ala Gly Ile Leu Asp Glu Leu Trp Lys Ile Asp Leu Tyr Arg Asn Tyr
545 550 555 560
Leu Leu Gln Arg Asp Asn Val Gln Glu Val Met Leu Gly Tyr Ser Asp
565 570 575
Ser Asn Lys Asp Gly Gly Tyr Phe Ser Ala Asn Trp Ala Leu Tyr Asp
580 585 590
Ala Glu Leu Gln Leu Val Glu Leu Cys Arg Ser Ala Gly Val Asn Val
595 600 605
Arg Leu Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro
610 615 620
Ser Tyr Asp Ala Ile Leu Ala Gln Pro Arg Gly Ala Val Gln Gly Ser
625 630 635 640
Val Arg Ile Thr Glu Gln Gly Glu Ile Ile Ser Ala Lys Tyr Gly Asn
645 650 655
Pro Glu Thr Ala Arg Arg Asn Leu Glu Ala Leu Val Ser Ala Thr Leu
660 665 670
Glu Ala Ser Leu Leu Asp Val Ser Glu Leu Thr Asp His Gln Arg Ala
675 680 685
Tyr Asp Ile Met Ser Glu Ile Ser Glu Leu Ser Leu Lys Lys Tyr Ala
690 695 700
Ser Leu Val His Glu Asp Gln Gly Phe Ile Asp Tyr Phe Thr Gln Ser
705 710 715 720
Thr Pro Leu Gln Glu Ile Gly Ser Leu Asn Ile Gly Ser Arg Pro Ser
725 730 735
Ser Arg Lys Gln Thr Ser Ser Val Glu Asp Leu Arg Ala Ile Pro Trp
740 745 750
Val Leu Ser Trp Ser Gln Ser Arg Val Met Leu Pro Gly Trp Phe Gly
755 760 765
Val Gly Thr Ala Leu Glu Gln Trp Ile Gly Glu Gly Glu Gln Ala Thr
770 775 780
Gln Arg Ile Ala Glu Leu Gln Thr Leu Asn Glu Ser Trp Pro Phe Leu
785 790 795 800
Pro Ser Val Leu Asp Asn Met Ala Gln Val Met Ser Lys Ala Glu Leu
805 810 815
Arg Leu Ala Lys Leu Tyr Ala Asp Leu Ile Pro Asp Thr Glu Val Ala
820 825 830
Glu Arg Val Tyr Ser Val Ile Arg Glu Glu Tyr Phe Leu Thr Lys Lys
835 840 845
Met Phe Cys Val Ile Thr Gly Ser Asp Asp Leu Leu Asp Asp Asn Pro
850 855 860
Leu Leu Ala Arg Ser Val Gln Arg Arg Tyr Pro Tyr Leu Leu Pro Leu
865 870 875 880
Asn Val Ile Gln Val Glu Met Met Arg Arg Tyr Arg Lys Gly Asp Gln
885 890 895
Ser Glu Gln Val Ser Arg Asn Ile Gln Leu Thr Met Asn Gly Leu Ser
900 905 910
Thr Ala Val Arg Asn Ser Gly
915
<210> 16
<211> 1314
<212> DNA
<213> Synechocystis sp.
<400> 16
atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60
ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120
aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180
accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240
gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300
ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360
cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420
gcaaccttgg cttcctcggt taacattttg tctacctact accaggacca gctgaaccca 480
ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540
gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600
aatgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660
gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720
aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780
atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840
ctggagatgc tcgaagacat caagagcaac cacggtggcg acgcaaccga gttcatgaac 900
aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960
aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020
ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080
tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140
gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200
tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260
caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314
<210> 17
<211> 437
<212> PRT
<213> Synechocystis sp.
<400> 17
Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu
1 5 10 15
His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu
20 25 30
Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu
35 40 45
Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys
50 55 60
Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr
65 70 75 80
Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr
85 90 95
Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe
100 105 110
Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser
115 120 125
Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala
130 135 140
Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro
145 150 155 160
Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys
165 170 175
Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro
180 185 190
Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg
195 200 205
Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met
210 215 220
Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln
225 230 235 240
Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn
245 250 255
Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu
260 265 270
His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys
275 280 285
Ser Asn His Gly Gly Asp Ala Thr Glu Phe Met Asn Lys Val Lys Asn
290 295 300
Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys
305 310 315 320
Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile
325 330 335
Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu
340 345 350
Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr
355 360 365
Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe
370 375 380
Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly
385 390 395 400
Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile
405 410 415
Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val
420 425 430
Pro Arg Glu Glu Arg
435
<210> 18
<211> 4148
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 18
atgactgatt ttttacgcga tgacatcagg ttcctcggtc aaatcctcgg tgaggtaatt 60
gcggaacaag aaggccagga ggtttatgaa ctggtcgaac aagcgcgcct gacttctttt 120
gatatcgcca agggcaacgc cgaaatggat agcctggttc aggttttcga cggcattact 180
ccagccaagg caacaccgat tgctcgcgca ttttcccact tcgctctgct ggctaacctg 240
gcggaagacc tctacgatga agagcttcgt gaacaggctc tcgatgcagg cgacacccct 300
ccggacagca ctcttgatgc cacctggctg aaactcaatg agggcaatgt tggcgcagaa 360
gctgtggccg atgtgctgcg caatgctgag gtggcgccgg ttctgactgc gcacccaact 420
gagactcgcc gccgcactgt ttttgatgcg caaaagtgga tcaccaccca catgcgtgaa 480
cgccacgctt tgcagtctgc ggagcctacc gctcgtacgc aaagcaagtt ggatgagatc 540
gagaagaaca tccgccgtcg catcaccatt ttgtggcaga ccgcgttgat tcgtgtggcc 600
cgcccacgta tcgaggacga gatcgaagta gggctgcgct actacaagct gagccttttg 660
gaagagattc cacgtatcaa ccgtgatgtg gctgttgagc ttcgtgagcg tttcggcgag 720
ggtgttcctt tgaagcccgt ggtcaagcca ggttcctgga ttggtggaga ccacgacggt 780
aacccttatg tcaccgcgga aacagttgag tattccactc accgcgctgc ggaaaccgtg 840
ctcaagtact atgcacgcca gctgcattcc ctcgagcatg agctcagcct gtcggaccgc 900
atgaataagg tcaccccgca gctgcttgcg ctggcagatg cagggcacaa cgacgtgcca 960
agccgcgtgg atgagcctta tcgacgcgcc gtccatggcg ttcgcggacg tatcctcgcg 1020
acgacggccg agctgatcgg cgaggacgcc gttgagggcg tgtggttcaa ggtctttact 1080
ccatacgcat ctccggaaga attcttaaac gatgcgttga ccattgatca ttctctgcgt 1140
gaatccaagg acgttctcat tgccgatgat cgtttgtctg tgctgatttc tgccatcgag 1200
agctttggat tcaaccttta cgcactggat ctgcgccaaa actccgaaag ctacgaggac 1260
gtcctcaccg agcttttcga acgcgcccaa gtcaccgcaa actaccgcga gctgtctgaa 1320
gcagagaaac ttgaggtgct gctgaaggaa ctgcgcagcc ctcgtccgct gatcccgcac 1380
ggttcagatg aatacagcga ggtcaccgac cgcgagctcg gcatcttccg caccgcgtcg 1440
gaggctgtta agaaattcgg gccacggatg gtgcctcact gcatcatctc catggcatca 1500
tcggtcaccg atgtgctcga gccgatggtg ttgctcaagg aattcggact catcgcagcc 1560
aacggcgaca acccacgcgg caccgtcgat gtcatcccac tgttcgaaac catcgaagat 1620
ctccaggccg gcgccggaat cctcgacgaa ctgtggaaaa ttgatctcta ccgcaactac 1680
ctcctgcagc gcgacaacgt ccaggaagtc atgctcggtt actccgattc caacaaggat 1740
ggcggatatt tctccgcaaa ctgggcgctt tacgacgcgg aactgcagct cgtcgaacta 1800
tgccgatcag ccggggtcaa cgttcgcctg ttccacggcc gtggtggcac cgtcggccgc 1860
ggtggcggac cttcctacga cgcgattctt gcccagccca ggggggctgt ccaaggttcc 1920
gtgcgcatca ccgagcaggg cgagatcatc tccgctaagt acggcaaccc cgaaaccgcg 1980
cgccgaaacc tcgaagccct ggtctcagcc acgcttgagg catcgcttct cgacgtctcc 2040
gaactcaccg atcaccaacg cgcgtacgac atcatgagtg agatctctga gctcagcttg 2100
aagaagtacg cctccttggt gcacgaggat caaggcttca tcgattactt cacccagtcc 2160
acgccgctgc aggagattgg atccctcaac atcggatcca ggccttcctc acgcaagcag 2220
acctcctcgg tggaagattt gcgagccatc ccatgggtgc tcagctggtc acagtctcgt 2280
gtcatgctgc caggctggtt tggtgtcgga accgcattag agcagtggat tggcgaaggg 2340
gagcaggcca cccaacgcat tgccgagctg caaacactca atgagtcctg gccattttta 2400
ccctcagtgt tggataacat ggctcaggtg atgtccaagg cagagctgcg tttggcaaag 2460
ctctacgcag acctgatccc agatacggaa gtagccgagc gagtctattc cgtcatccgc 2520
gaggagtact tcctgaccaa gaagatgttc tgcgtaatca ccggctctga tgatctgctt 2580
gatgacaacc cacttctcgc acgctctgtc cagcgccgat acccctacct gcttccactc 2640
aacgtgatcc aggtagagat gatgcgacgc taccgaaaag gcgaccaaag cgagcaagtg 2700
tcccgcaaca ttcagctgac catgaacggt ctttccactg cggtgcgcaa ctccggcgcc 2760
accaactcaa ctccggcgcc accaacttta gcctgctcaa acaagccggc gatgtggaag 2820
agaaccccgg tcccatgttt gaaagggata tcgtggctac tgataacaac aaggctgtcc 2880
tgcactaccc cggtggcgag ttcgaaatgg acatcatcga ggcttctgag ggtaacaacg 2940
gtgttgtcct gggcaagatg ctgtctgaga ctggactgat cacttttgac ccaggttatg 3000
tgagcactgg ctccaccgag tcgaagatca cctacatcga tggcgatgcg ggaatcctgc 3060
gttaccgcgg ctatgacatc gctgatctgg ctgagaatgc caccttcaac gaggtttctt 3120
acctacttat caacggtgag ctaccaaccc cagatgagct tcacaagttt aacgacgaga 3180
ttcgccacca cacccttctg gacgaggact tcaagtccca gttcaacgtg ttcccacgcg 3240
acgctcaccc aatggcaacc ttggcttcct cggttaacat tttgtctacc tactaccagg 3300
accagctgaa cccactcgat gaggcacagc ttgataaggc aaccgttcgc ctcatggcaa 3360
aggttccaat gctggctgcg tacgcacacc gcgcacgcaa gggtgctcct tacatgtacc 3420
cagacaactc cctcaatgcg cgtgagaact tcctgcgcat gatgttcggt tacccaaccg 3480
agccatacga gatcgaccca atcatggtca aggctctgga caagctgctc atcctgcacg 3540
ctgaccacga gcagaactgc tccacctcca ccgttcgtat gatcggttcc gcacaggcca 3600
acatgtttgt ctccatcgct ggtggcatca acgctctgtc cggcccactg cacggtggcg 3660
caaaccaggc tgttctggag atgctcgaag acatcaagag caaccacggt ggcgacgcaa 3720
ccgagttcat gaacaaggtc aagaacaagg aagacggcgt ccgcctcatg ggcttcggac 3780
accgcgttta caagaactac gatccacgtg cagcaatcgt caaggagacc gcacacgaga 3840
tcctcgagca cctcggtggc gacgatcttc tggatctggc aatcaagctg gaagaaattg 3900
cactggctga tgattacttc atctcccgca agctctaccc gaacgtagac ttctacaccg 3960
gcctgatcta ccgcgcaatg ggcttcccaa ctgacttctt caccgtattg ttcgcaatcg 4020
gtcgtctgcc aggatggatc gctcactacc gcgagcagct cggtgcagca ggcaacaaga 4080
tcaaccgccc acgccaggtc tacaccggca acgaatcccg caagttggtt cctcgcgagg 4140
agcgctaa 4148
<210> 19
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 19
atgtacgaga agattcaacc ccctagcgaa ggcagcaaaa ttcgctttga agccggcaag 60
ccgatcgttc ccgacaaccc gatcattccc ttcattcgtg gtgacggcgc tggcgttgat 120
atctggcccg caactgagcg cgttctcgat gccgctgtcg ctaaagccta tggcggtcag 180
cgcaaaatca cttggttcaa agtctacgcg ggtgatgaag cctgcgacct ctacggcacc 240
taccaatatc tgcctgaaga tacgctgaca gcgatccgcg agtacggcgt ggcaatcaaa 300
ggcccgctga cgacgccgat cggtggtggc attcgatcgc tgaacgtggc gctacggcaa 360
atcttcgatc tctatgcctg cgtccgcccc tgtcgctact acaccggcac accctcgccc 420
caccgcacgc ccgaacaact cgatgtggtg gtctaccgcg aaaacaccga ggatatctac 480
ctcggcatcg aatggaagca aggtgatccc accggcgatc gcctgatcaa gctgctgaac 540
gaggacttca ttcccaacag ccccagcttg ggtaaaaagc aaatccgttt ggattccggc 600
attggtatta agccgatcag taaaacgggt agccagcgtc tgattcgtcg tgcgatcgag 660
catgccctac gcctcgaagg ccgcaagcga catgtcaccc ttgtccacaa gggcaacatc 720
atgaagttca cggaaggtgc tttccgggac tggggctatg aactggccac gactgagttc 780
cgaaccgact gtgtgactga acgggagagc tggattcttg ccaaccaaga aagcaagccg 840
gatctcagct tggaagacaa tgcgcggctc atcgaacctg gctacgacgc gatgacgccc 900
gaaaagcagg cagcagtggt ggctgaagtg aaagctgtgc tcgacagcat cggcgccacc 960
cacggcaacg gtcagtggaa gtctaaggtg ctggttgacg atcgcattgc tgacagcatc 1020
ttccagcaga ttcaaacccg cccgggtgaa tactcggtgc tggcgacgat gaacctcaat 1080
ggcgactaca tctctgatgc agcggcggcg gtggtcggtg gcctgggcat ggcccccggt 1140
gccaacattg gcgacgaagc ggcgatcttt gaagcgaccc acggcgcagc gcccaagcac 1200
gctggcctcg atcgcattaa ccccggctcg gtcatcctct ccggcgtgat gatgctggag 1260
tacctaggct ggcaagaggc tgctgacttg atcaccaagg gcatcagcca agcgatcgct 1320
aaccgtgagg tcacctacga tctggctcgg ttgatggaac cggcggttga tcaaccactc 1380
aagtgctcgg aatttgccga agccatcgtc aagcatttcg acgattag 1428
<210> 20
<211> 475
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 20
Met Tyr Glu Lys Ile Gln Pro Pro Ser Glu Gly Ser Lys Ile Arg Phe
1 5 10 15
Glu Ala Gly Lys Pro Ile Val Pro Asp Asn Pro Ile Ile Pro Phe Ile
20 25 30
Arg Gly Asp Gly Thr Gly Val Asp Ile Trp Pro Ala Thr Glu Arg Val
35 40 45
Leu Asp Ala Ala Val Ala Lys Ala Tyr Gly Gly Gln Arg Lys Ile Thr
50 55 60
Trp Phe Lys Val Tyr Ala Gly Asp Glu Ala Cys Asp Leu Tyr Gly Thr
65 70 75 80
Tyr Gln Tyr Leu Pro Glu Asp Thr Leu Thr Ala Ile Arg Glu Tyr Gly
85 90 95
Val Ala Ile Lys Gly Pro Leu Thr Thr Pro Ile Gly Gly Gly Ile Arg
100 105 110
Ser Leu Asn Val Ala Leu Arg Gln Ile Phe Asp Leu Tyr Ala Cys Val
115 120 125
Arg Pro Cys Arg Tyr Tyr Thr Gly Thr Pro Ser Pro His Arg Thr Pro
130 135 140
Glu Gln Leu Asp Val Val Val Tyr Arg Glu Asn Thr Glu Asp Ile Tyr
145 150 155 160
Leu Gly Ile Glu Trp Lys Gln Gly Asp Pro Thr Gly Asp Arg Leu Ile
165 170 175
Lys Leu Leu Asn Glu Asp Phe Ile Pro Asn Ser Pro Ser Leu Gly Lys
180 185 190
Lys Gln Ile Arg Leu Asp Ser Gly Ile Gly Ile Lys Pro Ile Ser Lys
195 200 205
Thr Gly Ser Gln Arg Leu Ile Arg Arg Ala Ile Glu His Ala Leu Arg
210 215 220
Leu Glu Gly Arg Lys Arg His Val Thr Leu Val His Lys Gly Asn Ile
225 230 235 240
Met Lys Phe Thr Glu Gly Ala Phe Arg Asp Trp Gly Tyr Glu Leu Ala
245 250 255
Thr Thr Glu Phe Arg Thr Asp Cys Val Thr Glu Arg Glu Ser Trp Ile
260 265 270
Leu Ala Asn Gln Glu Ser Lys Pro Asp Leu Ser Leu Glu Asp Asn Ala
275 280 285
Arg Leu Ile Glu Pro Gly Tyr Asp Ala Met Thr Pro Glu Lys Gln Ala
290 295 300
Ala Val Val Ala Glu Val Lys Ala Val Leu Asp Ser Ile Gly Ala Thr
305 310 315 320
His Gly Asn Gly Gln Trp Lys Ser Lys Val Leu Val Asp Asp Arg Ile
325 330 335
Ala Asp Ser Ile Phe Gln Gln Ile Gln Thr Arg Pro Gly Glu Tyr Ser
340 345 350
Val Leu Ala Thr Met Asn Leu Asn Gly Asp Tyr Ile Ser Asp Ala Ala
355 360 365
Ala Ala Val Val Gly Gly Leu Gly Met Ala Pro Gly Ala Asn Ile Gly
370 375 380
Asp Glu Ala Ala Ile Phe Glu Ala Thr His Gly Thr Ala Pro Lys His
385 390 395 400
Ala Gly Leu Asp Arg Ile Asn Pro Gly Ser Val Ile Leu Ser Gly Val
405 410 415
Met Met Leu Glu Tyr Leu Gly Trp Gln Glu Ala Ala Asp Leu Ile Thr
420 425 430
Lys Gly Ile Ser Gln Ala Ile Ala Asn Arg Glu Val Thr Tyr Asp Leu
435 440 445
Ala Arg Leu Met Glu Pro Ala Val Asp Gln Pro Leu Lys Cys Ser Glu
450 455 460
Phe Ala Glu Ala Ile Val Lys His Phe Asp Asp
465 470 475
<210> 21
<211> 1293
<212> DNA
<213> Synechococcus elongatus
<400> 21
gtgaaaaacg tgctggcgat cattctcggt ggaggcgcag gcagtcgtct ctatccacta 60
accaaacagc gcgccaaacc agcggtcccc ctggcgggca aataccgctt gatcgatatt 120
cccgtcagca attgcatcaa cgctgacatc aacaaaatct atgtgctgac gcagtttaac 180
tctgcctcgc tcaaccgcca cctcagtcag acctacaacc tctccagcgg ctttggcaat 240
ggctttgttg aggtgctagc agctcagatt acgccggaga accccaactg gttccaaggc 300
accgccgatg cggttcgcca gtatctctgg ctaatcaaag agtgggatgt ggatgagtac 360
ctgatcctgt cgggggatca tctctaccgc atggactata gccagttcat tcagcggcac 420
cgagacacca atgccgacat cacactctcg gtcttgccga tcgatgaaaa gcgcgcctct 480
gattttggcc tgatgaagct agatggcagc ggccgggtgg tcgagttcag cgaaaagccc 540
aaaggggatg aactcagggc gatgcaagtc gataccacga tcctcgggct tgaccctgtc 600
gctgctgctg cccagccctt cattgcctcg atgggcatct acgtcttcaa gcgggatgtt 660
ctgatcgatt tgctcagcca tcatcccgag caaaccgact ttggcaagga agtgattccc 720
gctgcagcca cccgctacaa cacccaagcc tttctgttca acgactactg ggaagacatc 780
ggcacgatcg cctcattcta cgaggccaat ctggcgctga ctcagcaacc tagcccaccc 840
ttcagcttct acgacgagca ggcgccgatt tacacccgcg ctcgctacct gccgccaacc 900
aagctgctcg attgccaggt gacccagtcg atcattggcg agggctgcat tctcaagcaa 960
tgcaccgttc agaattccgt cttagggatt cgctcccgca ttgaggccga ctgcgtgatc 1020
caggacgcct tgttgatggg cgctgacttc tacgaaacct cggagctacg gcaccagaat 1080
cgggccaatg gcaaagtgcc gatgggaatc ggcagtggca gcaccatccg tcgcgccatc 1140
gtcgacaaaa atgcccacat tggccagaac gttcagatcg tcaacaaaga ccatgtggaa 1200
gaggccgatc gcgaagatct gggctttatg atccgcagcg gcattgtcgt tgtggtcaaa 1260
ggggcggtta ttcccgacaa cacggtgatc taa 1293
<210> 22
<211> 430
<212> PRT
<213> Synechococcus elongatus
<400> 22
Met Lys Asn Val Leu Ala Ile Ile Leu Gly Gly Gly Ala Gly Ser Arg
1 5 10 15
Leu Tyr Pro Leu Thr Lys Gln Arg Ala Lys Pro Ala Val Pro Leu Ala
20 25 30
Gly Lys Tyr Arg Leu Ile Asp Ile Pro Val Ser Asn Cys Ile Asn Ala
35 40 45
Asp Ile Asn Lys Ile Tyr Val Leu Thr Gln Phe Asn Ser Ala Ser Leu
50 55 60
Asn Arg His Leu Ser Gln Thr Tyr Asn Leu Ser Ser Gly Phe Gly Asn
65 70 75 80
Gly Phe Val Glu Val Leu Ala Ala Gln Ile Thr Pro Glu Asn Pro Asn
85 90 95
Trp Phe Gln Gly Thr Ala Asp Ala Val Arg Gln Tyr Leu Trp Leu Ile
100 105 110
Lys Glu Trp Asp Val Asp Glu Tyr Leu Ile Leu Ser Gly Asp His Leu
115 120 125
Tyr Arg Met Asp Tyr Ser Gln Phe Ile Gln Arg His Arg Asp Thr Asn
130 135 140
Ala Asp Ile Thr Leu Ser Val Leu Pro Ile Asp Glu Lys Arg Ala Ser
145 150 155 160
Asp Phe Gly Leu Met Lys Leu Asp Gly Ser Gly Arg Val Val Glu Phe
165 170 175
Ser Glu Lys Pro Lys Gly Asp Glu Leu Arg Ala Met Gln Val Asp Thr
180 185 190
Thr Ile Leu Gly Leu Asp Pro Val Ala Ala Ala Ala Gln Pro Phe Ile
195 200 205
Ala Ser Met Gly Ile Tyr Val Phe Lys Arg Asp Val Leu Ile Asp Leu
210 215 220
Leu Ser His His Pro Glu Gln Thr Asp Phe Gly Lys Glu Val Ile Pro
225 230 235 240
Ala Ala Ala Thr Arg Tyr Asn Thr Gln Ala Phe Leu Phe Asn Asp Tyr
245 250 255
Trp Glu Asp Ile Gly Thr Ile Ala Ser Phe Tyr Glu Ala Asn Leu Ala
260 265 270
Leu Thr Gln Gln Pro Ser Pro Pro Phe Ser Phe Tyr Asp Glu Gln Ala
275 280 285
Pro Ile Tyr Thr Arg Ala Arg Tyr Leu Pro Pro Thr Lys Leu Leu Asp
290 295 300
Cys Gln Val Thr Gln Ser Ile Ile Gly Glu Gly Cys Ile Leu Lys Gln
305 310 315 320
Cys Thr Val Gln Asn Ser Val Leu Gly Ile Arg Ser Arg Ile Glu Ala
325 330 335
Asp Cys Val Ile Gln Asp Ala Leu Leu Met Gly Ala Asp Phe Tyr Glu
340 345 350
Thr Ser Glu Leu Arg His Gln Asn Arg Ala Asn Gly Lys Val Pro Met
355 360 365
Gly Ile Gly Ser Gly Ser Thr Ile Arg Arg Ala Ile Val Asp Lys Asn
370 375 380
Ala His Ile Gly Gln Asn Val Gln Ile Val Asn Lys Asp His Val Glu
385 390 395 400
Glu Ala Asp Arg Glu Asp Leu Gly Phe Met Ile Arg Ser Gly Ile Val
405 410 415
Val Val Val Lys Gly Ala Val Ile Pro Asp Asn Thr Val Ile
420 425 430
<210> 23
<211> 1248
<212> DNA
<213> Escherichia coli
<400> 23
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctaggattaa cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcattct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctcttttt tggcctgggg 360
tatctggcgg gatgcggttt gcttgacagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggtatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg catagcggcg 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactc 720
tttcctgtct tttatgcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggtg ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgttgtt cgttaacccc tggattattt cattagtgaa gctgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cctgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 24
<211> 250
<212> PRT
<213> Escherichia coli
<400> 24
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Ile Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ala Gly Leu Phe Glu
245 250
<210> 25
<211> 2133
<212> DNA
<213> Synechococcus sp.
<400> 25
atggtggcag ctcaaaatct ctacattctg cacattcaga cccatggtct gctgcgaggg 60
cagaacttgg aactggggcg agatgccgac accggcgggc agaccaagta cgtcttagaa 120
ctggctcaag cccaagctaa atccccacaa gtccaacaag tcgacatcat cacccgccaa 180
atcaccgacc cccgcgtcag tgttggttac agtcaggcga tcgaaccctt tgcgcccaaa 240
ggtcggattg tccgtttgcc ttttggcccc aaacgctacc tccgtaaaga gctgctttgg 300
ccccatctct acacctttgc ggatgcaatt ctccaatatc tggctcagca aaagcgcacc 360
ccgacttgga ttcaggccca ctatgctgat gctggccaag tgggatcact gctgagtcgc 420
tggttgaatg taccgctaat tttcacaggg cattctctgg ggcggatcaa gctaaaaaag 480
ctgttggagc aagactggcc gcttgaggaa attgaagcgc aattcaatat tcaacagcga 540
attgatgcgg aggagatgac gctcactcat gctgactgga ttgtcgccag cactcagcag 600
gaagtggagg agcaataccg cgtttacgat cgctacaacc cagagcgcaa acttgtcatt 660
ccaccgggtg tcgataccga tcgcttcagg tttcagccct tgggcgatcg cggtgttgtt 720
ctccaacagg aactgagccg ctttctgcgc gacccagaaa aacctcaaat tctctgcctc 780
tgtcgccccg cacctcgcaa aaatgtaccg gcgctggtgc gagcctttgg cgaacatcct 840
tggctgcgca aaaaagccaa ccttgtctta gtactgggca gccgccaaga catcaaccag 900
atggatcgcg gcagtcggca ggtgttccaa gagattttcc atctggtcga tcgctacgac 960
ctctacggca gcgtcgccta tcccaaacag catcaggctg atgatgtgcc ggagttctat 1020
cgcctagcgg ctcattccgg cggggtattc gtcaatccgg cgctgaccga accttttggt 1080
ttgacaattt tggaggcagg aagctgcggc gtgccggtgg tggcaaccca tgatggcggc 1140
ccccaggaaa ttctcaaaca ctgtgatttc ggcactttag ttgatgtcag ccgacccgct 1200
aatatcgcga ctgcactcgc caccctgctg agcgatcgcg atctttggca gtgctatcac 1260
cgcaatggca ttgaaaaagt tcccgcccat tacagctggg atcaacatgt caataccctg 1320
tttgagcgca tggaaacggt ggctttgcct cgtcgtcgtg ctgtcagttt cgtacggagt 1380
cgcaaacgct tgattgatgc caaacgcctt gtcgttagtg acatcgacaa cacactgttg 1440
ggcgatcgtc aaggactcga gaatttaatg acctatctcg atcagtatcg cgatcatttt 1500
gcctttggaa ttgccacggg gcgtcgccta gactctgccc aagaagtctt gaaagagtgg 1560
ggcgttcctt cgccaaactt ctgggtgact tccgtcggca gcgagattca ctatggcacc 1620
gatgctgaac cggatatcag ctgggaaaag catatcaatc gcaactggaa tcctcagcga 1680
attcgggcag taatggcaca actacccttt cttgaactgc agccggaaga ggatcaaaca 1740
cccttcaaag tcagcttctt tgtccgcgat cgccacgaga ctgtgctgcg agaagtacgg 1800
caacatcttc gccgccatcg cctgcggctg aagtcaatct attcccatca ggagtttctt 1860
gacattctgc cgctagctgc ctcgaaaggg gatgcgattc gccacctctc actccgctgg 1920
cggattcctc ttgagaacat tttggtggca ggcgattctg gtaacgatga ggaaatgctc 1980
aagggccata atctcggcgt tgtagttggc aattactcac cggaattgga gccactgcgc 2040
agctacgagc gcgtctattt tgctgagggc cactatgcta atggcattct ggaagcctta 2100
aaacactatc gcttttttga ggcgatcgct taa 2133
<210> 26
<211> 710
<212> PRT
<213> Synechococcus sp.
<400> 26
Met Val Ala Ala Gln Asn Leu Tyr Ile Leu His Ile Gln Thr His Gly
1 5 10 15
Leu Leu Arg Gly Gln Asn Leu Glu Leu Gly Arg Asp Ala Asp Thr Gly
20 25 30
Gly Gln Thr Lys Tyr Val Leu Glu Leu Ala Gln Ala Gln Ala Lys Ser
35 40 45
Pro Gln Val Gln Gln Val Asp Ile Ile Thr Arg Gln Ile Thr Asp Pro
50 55 60
Arg Val Ser Val Gly Tyr Ser Gln Ala Ile Glu Pro Phe Ala Pro Lys
65 70 75 80
Gly Arg Ile Val Arg Leu Pro Phe Gly Pro Lys Arg Tyr Leu Arg Lys
85 90 95
Glu Leu Leu Trp Pro His Leu Tyr Thr Phe Ala Asp Ala Ile Leu Gln
100 105 110
Tyr Leu Ala Gln Gln Lys Arg Thr Pro Thr Trp Ile Gln Ala His Tyr
115 120 125
Ala Asp Ala Gly Gln Val Gly Ser Leu Leu Ser Arg Trp Leu Asn Val
130 135 140
Pro Leu Ile Phe Thr Gly His Ser Leu Gly Arg Ile Lys Leu Lys Lys
145 150 155 160
Leu Leu Glu Gln Asp Trp Pro Leu Glu Glu Ile Glu Ala Gln Phe Asn
165 170 175
Ile Gln Gln Arg Ile Asp Ala Glu Glu Met Thr Leu Thr His Ala Asp
180 185 190
Trp Ile Val Ala Ser Thr Gln Gln Glu Val Glu Glu Gln Tyr Arg Val
195 200 205
Tyr Asp Arg Tyr Asn Pro Glu Arg Lys Leu Val Ile Pro Pro Gly Val
210 215 220
Asp Thr Asp Arg Phe Arg Phe Gln Pro Leu Gly Asp Arg Gly Val Val
225 230 235 240
Leu Gln Gln Glu Leu Ser Arg Phe Leu Arg Asp Pro Glu Lys Pro Gln
245 250 255
Ile Leu Cys Leu Cys Arg Pro Ala Pro Arg Lys Asn Val Pro Ala Leu
260 265 270
Val Arg Ala Phe Gly Glu His Pro Trp Leu Arg Lys Lys Ala Asn Leu
275 280 285
Val Leu Val Leu Gly Ser Arg Gln Asp Ile Asn Gln Met Asp Arg Gly
290 295 300
Ser Arg Gln Val Phe Gln Glu Ile Phe His Leu Val Asp Arg Tyr Asp
305 310 315 320
Leu Tyr Gly Ser Val Ala Tyr Pro Lys Gln His Gln Ala Asp Asp Val
325 330 335
Pro Glu Phe Tyr Arg Leu Ala Ala His Ser Gly Gly Val Phe Val Asn
340 345 350
Pro Ala Leu Thr Glu Pro Phe Gly Leu Thr Ile Leu Glu Ala Gly Ser
355 360 365
Cys Gly Val Pro Val Val Ala Thr His Asp Gly Gly Pro Gln Glu Ile
370 375 380
Leu Lys His Cys Asp Phe Gly Thr Leu Val Asp Val Ser Arg Pro Ala
385 390 395 400
Asn Ile Ala Thr Ala Leu Ala Thr Leu Leu Ser Asp Arg Asp Leu Trp
405 410 415
Gln Cys Tyr His Arg Asn Gly Ile Glu Lys Val Pro Ala His Tyr Ser
420 425 430
Trp Asp Gln His Val Asn Thr Leu Phe Glu Arg Met Glu Thr Val Ala
435 440 445
Leu Pro Arg Arg Arg Ala Val Ser Phe Val Arg Ser Arg Lys Arg Leu
450 455 460
Ile Asp Ala Lys Arg Leu Val Val Ser Asp Ile Asp Asn Thr Leu Leu
465 470 475 480
Gly Asp Arg Gln Gly Leu Glu Asn Leu Met Thr Tyr Leu Asp Gln Tyr
485 490 495
Arg Asp His Phe Ala Phe Gly Ile Ala Thr Gly Arg Arg Leu Asp Ser
500 505 510
Ala Gln Glu Val Leu Lys Glu Trp Gly Val Pro Ser Pro Asn Phe Trp
515 520 525
Val Thr Ser Val Gly Ser Glu Ile His Tyr Gly Thr Asp Ala Glu Pro
530 535 540
Asp Ile Ser Trp Glu Lys His Ile Asn Arg Asn Trp Asn Pro Gln Arg
545 550 555 560
Ile Arg Ala Val Met Ala Gln Leu Pro Phe Leu Glu Leu Gln Pro Glu
565 570 575
Glu Asp Gln Thr Pro Phe Lys Val Ser Phe Phe Val Arg Asp Arg His
580 585 590
Glu Thr Val Leu Arg Glu Val Arg Gln His Leu Arg Arg His Arg Leu
595 600 605
Arg Leu Lys Ser Ile Tyr Ser His Gln Glu Phe Leu Asp Ile Leu Pro
610 615 620
Leu Ala Ala Ser Lys Gly Asp Ala Ile Arg His Leu Ser Leu Arg Trp
625 630 635 640
Arg Ile Pro Leu Glu Asn Ile Leu Val Ala Gly Asp Ser Gly Asn Asp
645 650 655
Glu Glu Met Leu Lys Gly His Asn Leu Gly Val Val Val Gly Asn Tyr
660 665 670
Ser Pro Glu Leu Glu Pro Leu Arg Ser Tyr Glu Arg Val Tyr Phe Ala
675 680 685
Glu Gly His Tyr Ala Asn Gly Ile Leu Glu Ala Leu Lys His Tyr Arg
690 695 700
Phe Phe Glu Ala Ile Ala
705 710
<210> 27
<211> 735
<212> DNA
<213> Synechocystis sp.
<400> 27
atgcgacagt tattgctaat ttctgacctg gacaatacct gggtcggaga tcaacaagcc 60
ctggaacatt tgcaagaata tctaggcgat cgccggggaa atttttattt ggcctatgcc 120
acggggcgtt cctaccattc cgcgagggag ttgcaaaaac aggtgggact catggaaccg 180
gactattggc tcaccgcggt ggggagtgaa atttaccatc cagaaggcct ggaccaacat 240
tgggctgatt acctctctga gcattggcaa cgggatatcc tccaggcgat cgccgatggt 300
tttgaggcct taaaacccca atctcccttg gaacaaaacc catggaaaat tagctatcat 360
ctcgatcccc aggcttgccc caccgtcatc gaccaattaa cggagatgtt gaaggaaacc 420
ggcatcccgg tgcaggtgat tttcagcagt ggcaaagatg tggatttatt gccccaacgg 480
agtaacaaag gtaacgccac ccaatatctg caacaacatt tagccatgga gccgtctcaa 540
accctggtgt gtggggactc cggcaatgat attggcttat ttgaaacttc cgctcggggt 600
gtcattgtcc gtaatgccca gccggaatta ttgcactggt atgaccaatg gggggattct 660
cgtcattatc gggcccaatc gagccatgct ggcgctatcc tagaggcgat cgcccatttc 720
gattttttga gctga 735
<210> 28
<211> 244
<212> PRT
<213> Synechocystis sp.
<400> 28
Met Arg Gln Leu Leu Leu Ile Ser Asp Leu Asp Asn Thr Trp Val Gly
1 5 10 15
Asp Gln Gln Ala Leu Glu His Leu Gln Glu Tyr Leu Gly Asp Arg Arg
20 25 30
Gly Asn Phe Tyr Leu Ala Tyr Ala Thr Gly Arg Ser Tyr His Ser Ala
35 40 45
Arg Glu Leu Gln Lys Gln Val Gly Leu Met Glu Pro Asp Tyr Trp Leu
50 55 60
Thr Ala Val Gly Ser Glu Ile Tyr His Pro Glu Gly Leu Asp Gln His
65 70 75 80
Trp Ala Asp Tyr Leu Ser Glu His Trp Gln Arg Asp Ile Leu Gln Ala
85 90 95
Ile Ala Asp Gly Phe Glu Ala Leu Lys Pro Gln Ser Pro Leu Glu Gln
100 105 110
Asn Pro Trp Lys Ile Ser Tyr His Leu Asp Pro Gln Ala Cys Pro Thr
115 120 125
Val Ile Asp Gln Leu Thr Glu Met Leu Lys Glu Thr Gly Ile Pro Val
130 135 140
Gln Val Ile Phe Ser Ser Gly Lys Asp Val Asp Leu Leu Pro Gln Arg
145 150 155 160
Ser Asn Lys Gly Asn Ala Thr Gln Tyr Leu Gln Gln His Leu Ala Met
165 170 175
Glu Pro Ser Gln Thr Leu Val Cys Gly Asp Ser Gly Asn Asp Ile Gly
180 185 190
Leu Phe Glu Thr Ser Ala Arg Gly Val Ile Val Arg Asn Ala Gln Pro
195 200 205
Glu Leu Leu His Trp Tyr Asp Gln Trp Gly Asp Ser Arg His Tyr Arg
210 215 220
Ala Gln Ser Ser His Ala Gly Ala Ile Leu Glu Ala Ile Ala His Phe
225 230 235 240
Asp Phe Leu Ser
<210> 29
<211> 2535
<212> DNA
<213> Synechococcus elongatus
<400> 29
atgagtgatt ccaccgccca actcagctac gaccccacca cgagctacct cgagcccagt 60
ggcttggtct gtgaggatga acggacttct gtgactcccg agaccttgaa acgggcttac 120
gaggcccatc tctactacag ccagggcaaa acctcagcga tcgccaccct gcgtgatcac 180
tacatggcac tggcctacat ggtccgcgat cgcctcctgc aacggtggct agcttcactg 240
tcgacctatc aacaacagca cgtcaaagtg gtctgttacc tgtccgctga gtttttgatg 300
ggtcggcacc tcgaaaactg cctgatcaac ctgcatcttc acgaccgcgt tcagcaagtt 360
ttggatgaac tgggtctcga ttttgagcaa ctgctagaga aagaggaaga acccgggcta 420
ggcaacggtg gcctcggtcg cctcgcagct tgtttcctcg actccatggc taccctcgac 480
attcctgccg tcggctatgg cattcgctat gagttcggta tcttccacca agaactccac 540
aacggctggc agatcgaaat ccccgataac tggctgcgct ttggcaaccc ttgggagcta 600
gagcggcgcg aacaggccgt ggaaattaag ttgggcggcc acacggaggc ctaccacgat 660
gcgcgaggcc gctactgcgt ctcttggatc cccgatcgcg tcattcgcgc catcccctac 720
gacacccccg taccgggcta cgacaccaat aacgtcagca tgttgcggct ctggaaggct 780
gagggcacca cggaactcaa ccttgaggct ttcaactcag gcaactacga cgatgcggtt 840
gccgacaaaa tgtcgtcgga aacgatctcg aaggtgctct atcccaacga caacaccccc 900
caagggcggg aactgcggct ggagcagcag tatttcttcg tctcggcttc gctccaagac 960
atcatccgtc gccacttgat gaaccacggt catcttgagc ggctgcatga ggcgatcgca 1020
gtccagctta acgacaccca tcccagcgtg gcggtgccgg agttgatgcg cctcctgatc 1080
gatgagcatc acctgacttg ggacaatgct tggacgatta cacagcgcac cttcgcctac 1140
accaaccaca cgctgctacc tgaagccttg gaacgctggc ccgtgggcat gttccagcgc 1200
actttaccgc gcttgatgga gattatctac gaaatcaact ggcgcttctt ggccaatgtg 1260
cgggcctggt atcccggtga cgacacgaga gctcgccgcc tctccctgat tgaggaagga 1320
gctgagcccc aggtgcgcat ggctcacctc gcctgcgtgg gcagtcatgc catcaacggt 1380
gtggcagccc tgcatacgca actgctcaag caagaaaccc tgcgagattt ctacgagctt 1440
tggcccgaga aattcttcaa catgaccaac ggtgtgacgc cccgccgctg gctgctgcaa 1500
agtaatcctc gcctagccaa cctgatcagc gatcgcattg gcaatgactg gattcatgat 1560
ctcaggcaac tgcgacggct ggaagacagc gtgaacgatc gcgagttttt acagcgctgg 1620
gcagaggtca agcaccaaaa taaggtcgat ctgagccgct acatctacca gcagactcgc 1680
atagaagtcg atccgcactc tctctttgat gtgcaagtca aacggattca cgaatacaaa 1740
cgccagctcc tcgctgtcat gcatatcgtg acgctctaca actggctgaa gcacaatccc 1800
cagctcaacc tggtgccgcg cacttttatc tttgcgggca aagcggcccc gggttactac 1860
cgtgccaagc aaatcgtcaa actgatcaat gcggtcggga gcatcatcaa ccatgatccc 1920
gatgtccaag ggcgactgaa ggtcgtcttc ctacctaact tcaacgtttc cttggggcag 1980
cgcatttatc cagctgccga tttgtcggag caaatctcaa ctgcagggaa agaagcgtcc 2040
ggcaccggca acatgaagtt caccatgaat ggcgcgctga caatcggaac ctacgatggt 2100
gccaacatcg agatccgcga ggaagtcggc cccgaaaact tcttcctgtt tggcctgcga 2160
gccgaagata tcgcccgacg ccaaagtcgg ggctatcgac ctgtggagtt ctggagcagc 2220
aatgcggaac tgcgggcagt cctcgatcgc tttagcagtg gtcacttcac accggatcag 2280
cccaacctct tccaagactt ggtcagcgat ctgctgcagc gggatgagta catgttgatg 2340
gcggactatc agtcctacat cgactgccag cgcgaagctg ctgctgccta ccgcgattcc 2400
gatcgctggt ggcggatgtc gctactcaac accgcgagat cgggcaagtt ctcctccgat 2460
cgcacgatcg ctgactacag cgaacagatc tgggaggtca aaccagtccc cgtcagccta 2520
agcactagct tttag 2535
<210> 30
<211> 844
<212> PRT
<213> Synechococcus elongatus
<400> 30
Met Ser Asp Ser Thr Ala Gln Leu Ser Tyr Asp Pro Thr Thr Ser Tyr
1 5 10 15
Leu Glu Pro Ser Gly Leu Val Cys Glu Asp Glu Arg Thr Ser Val Thr
20 25 30
Pro Glu Thr Leu Lys Arg Ala Tyr Glu Ala His Leu Tyr Tyr Ser Gln
35 40 45
Gly Lys Thr Ser Ala Ile Ala Thr Leu Arg Asp His Tyr Met Ala Leu
50 55 60
Ala Tyr Met Val Arg Asp Arg Leu Leu Gln Arg Trp Leu Ala Ser Leu
65 70 75 80
Ser Thr Tyr Gln Gln Gln His Val Lys Val Val Cys Tyr Leu Ser Ala
85 90 95
Glu Phe Leu Met Gly Arg His Leu Glu Asn Cys Leu Ile Asn Leu His
100 105 110
Leu His Asp Arg Val Gln Gln Val Leu Asp Glu Leu Gly Leu Asp Phe
115 120 125
Glu Gln Leu Leu Glu Lys Glu Glu Glu Pro Gly Leu Gly Asn Gly Gly
130 135 140
Leu Gly Arg Leu Ala Ala Cys Phe Leu Asp Ser Met Ala Thr Leu Asp
145 150 155 160
Ile Pro Ala Val Gly Tyr Gly Ile Arg Tyr Glu Phe Gly Ile Phe His
165 170 175
Gln Glu Leu His Asn Gly Trp Gln Ile Glu Ile Pro Asp Asn Trp Leu
180 185 190
Arg Phe Gly Asn Pro Trp Glu Leu Glu Arg Arg Glu Gln Ala Val Glu
195 200 205
Ile Lys Leu Gly Gly His Thr Glu Ala Tyr His Asp Ala Arg Gly Arg
210 215 220
Tyr Cys Val Ser Trp Ile Pro Asp Arg Val Ile Arg Ala Ile Pro Tyr
225 230 235 240
Asp Thr Pro Val Pro Gly Tyr Asp Thr Asn Asn Val Ser Met Leu Arg
245 250 255
Leu Trp Lys Ala Glu Gly Thr Thr Glu Leu Asn Leu Glu Ala Phe Asn
260 265 270
Ser Gly Asn Tyr Asp Asp Ala Val Ala Asp Lys Met Ser Ser Glu Thr
275 280 285
Ile Ser Lys Val Leu Tyr Pro Asn Asp Asn Thr Pro Gln Gly Arg Glu
290 295 300
Leu Arg Leu Glu Gln Gln Tyr Phe Phe Val Ser Ala Ser Leu Gln Asp
305 310 315 320
Ile Ile Arg Arg His Leu Met Asn His Gly His Leu Glu Arg Leu His
325 330 335
Glu Ala Ile Ala Val Gln Leu Asn Asp Thr His Pro Ser Val Ala Val
340 345 350
Pro Glu Leu Met Arg Leu Leu Ile Asp Glu His His Leu Thr Trp Asp
355 360 365
Asn Ala Trp Thr Ile Thr Gln Arg Thr Phe Ala Tyr Thr Asn His Thr
370 375 380
Leu Leu Pro Glu Ala Leu Glu Arg Trp Pro Val Gly Met Phe Gln Arg
385 390 395 400
Thr Leu Pro Arg Leu Met Glu Ile Ile Tyr Glu Ile Asn Trp Arg Phe
405 410 415
Leu Ala Asn Val Arg Ala Trp Tyr Pro Gly Asp Asp Thr Arg Ala Arg
420 425 430
Arg Leu Ser Leu Ile Glu Glu Gly Ala Glu Pro Gln Val Arg Met Ala
435 440 445
His Leu Ala Cys Val Gly Ser His Ala Ile Asn Gly Val Ala Ala Leu
450 455 460
His Thr Gln Leu Leu Lys Gln Glu Thr Leu Arg Asp Phe Tyr Glu Leu
465 470 475 480
Trp Pro Glu Lys Phe Phe Asn Met Thr Asn Gly Val Thr Pro Arg Arg
485 490 495
Trp Leu Leu Gln Ser Asn Pro Arg Leu Ala Asn Leu Ile Ser Asp Arg
500 505 510
Ile Gly Asn Asp Trp Ile His Asp Leu Arg Gln Leu Arg Arg Leu Glu
515 520 525
Asp Ser Val Asn Asp Arg Glu Phe Leu Gln Arg Trp Ala Glu Val Lys
530 535 540
His Gln Asn Lys Val Asp Leu Ser Arg Tyr Ile Tyr Gln Gln Thr Arg
545 550 555 560
Ile Glu Val Asp Pro His Ser Leu Phe Asp Val Gln Val Lys Arg Ile
565 570 575
His Glu Tyr Lys Arg Gln Leu Leu Ala Val Met His Ile Val Thr Leu
580 585 590
Tyr Asn Trp Leu Lys His Asn Pro Gln Leu Asn Leu Val Pro Arg Thr
595 600 605
Phe Ile Phe Ala Gly Lys Ala Ala Pro Gly Tyr Tyr Arg Ala Lys Gln
610 615 620
Ile Val Lys Leu Ile Asn Ala Val Gly Ser Ile Ile Asn His Asp Pro
625 630 635 640
Asp Val Gln Gly Arg Leu Lys Val Val Phe Leu Pro Asn Phe Asn Val
645 650 655
Ser Leu Gly Gln Arg Ile Tyr Pro Ala Ala Asp Leu Ser Glu Gln Ile
660 665 670
Ser Thr Ala Gly Lys Glu Ala Ser Gly Thr Gly Asn Met Lys Phe Thr
675 680 685
Met Asn Gly Ala Leu Thr Ile Gly Thr Tyr Asp Gly Ala Asn Ile Glu
690 695 700
Ile Arg Glu Glu Val Gly Pro Glu Asn Phe Phe Leu Phe Gly Leu Arg
705 710 715 720
Ala Glu Asp Ile Ala Arg Arg Gln Ser Arg Gly Tyr Arg Pro Val Glu
725 730 735
Phe Trp Ser Ser Asn Ala Glu Leu Arg Ala Val Leu Asp Arg Phe Ser
740 745 750
Ser Gly His Phe Thr Pro Asp Gln Pro Asn Leu Phe Gln Asp Leu Val
755 760 765
Ser Asp Leu Leu Gln Arg Asp Glu Tyr Met Leu Met Ala Asp Tyr Gln
770 775 780
Ser Tyr Ile Asp Cys Gln Arg Glu Ala Ala Ala Ala Tyr Arg Asp Ser
785 790 795 800
Asp Arg Trp Trp Arg Met Ser Leu Leu Asn Thr Ala Arg Ser Gly Lys
805 810 815
Phe Ser Ser Asp Arg Thr Ile Ala Asp Tyr Ser Glu Gln Ile Trp Glu
820 825 830
Val Lys Pro Val Pro Val Ser Leu Ser Thr Ser Phe
835 840
<210> 31
<211> 909
<212> DNA
<213> Escherichia coli
<400> 31
atggctgcca ttaatacgaa agtcaaaaaa gccgttatcc ccgttgcggg attaggaacc 60
aggatgttgc cggcgacgaa agccatcccg aaagagatgc tgccacttgt cgataagcca 120
ttaattcaat acgtcgtgaa tgaatgtatt gcggctggca ttactgaaat tgtgctggtt 180
acacactcat ctaaaaactc tattgaaaac cactttgata ccagttttga actggaagca 240
atgctggaaa aacgtgtaaa acgtcaactg cttgatgaag tgcagtctat ttgtccaccg 300
cacgtgacta ttatgcaagt tcgtcagggt ctggcgaaag gcctgggaca cgcggtattg 360
tgtgctcacc cggtagtggg tgatgaaccg gtagctgtta ttttgcctga tgttattctg 420
gatgaatatg aatccgattt gtcacaggat aacctggcag agatgatccg ccgctttgat 480
gaaacgggtc atagccagat catggttgaa ccggttgctg atgtgaccgc atatggcgtt 540
gtggattgca aaggcgttga attagcgccg ggtgaaagcg taccgatggt tggtgtggta 600
gaaaaaccga aagcggatgt tgcgccgtct aatctcgcta ttgtgggtcg ttacgtactt 660
agcgcggata tttggccgtt gctggcaaaa acccctccgg gagctggtga tgaaattcag 720
ctcaccgacg caattgatat gctgatcgaa aaagaaacgg tggaagccta tcatatgaaa 780
gggaagagcc atgactgcgg taataaatta ggttacatgc aggccttcgt tgaatacggt 840
attcgtcata acacccttgg cacggaattt aaagcctggc ttgaagaaga gatgggcatt 900
aagaagtaa 909
<210> 32
<211> 302
<212> PRT
<213> Escherichia coli
<400> 32
Met Ala Ala Ile Asn Thr Lys Val Lys Lys Ala Val Ile Pro Val Ala
1 5 10 15
Gly Leu Gly Thr Arg Met Leu Pro Ala Thr Lys Ala Ile Pro Lys Glu
20 25 30
Met Leu Pro Leu Val Asp Lys Pro Leu Ile Gln Tyr Val Val Asn Glu
35 40 45
Cys Ile Ala Ala Gly Ile Thr Glu Ile Val Leu Val Thr His Ser Ser
50 55 60
Lys Asn Ser Ile Glu Asn His Phe Asp Thr Ser Phe Glu Leu Glu Ala
65 70 75 80
Met Leu Glu Lys Arg Val Lys Arg Gln Leu Leu Asp Glu Val Gln Ser
85 90 95
Ile Cys Pro Pro His Val Thr Ile Met Gln Val Arg Gln Gly Leu Ala
100 105 110
Lys Gly Leu Gly His Ala Val Leu Cys Ala His Pro Val Val Gly Asp
115 120 125
Glu Pro Val Ala Val Ile Leu Pro Asp Val Ile Leu Asp Glu Tyr Glu
130 135 140
Ser Asp Leu Ser Gln Asp Asn Leu Ala Glu Met Ile Arg Arg Phe Asp
145 150 155 160
Glu Thr Gly His Ser Gln Ile Met Val Glu Pro Val Ala Asp Val Thr
165 170 175
Ala Tyr Gly Val Val Asp Cys Lys Gly Val Glu Leu Ala Pro Gly Glu
180 185 190
Ser Val Pro Met Val Gly Val Val Glu Lys Pro Lys Ala Asp Val Ala
195 200 205
Pro Ser Asn Leu Ala Ile Val Gly Arg Tyr Val Leu Ser Ala Asp Ile
210 215 220
Trp Pro Leu Leu Ala Lys Thr Pro Pro Gly Ala Gly Asp Glu Ile Gln
225 230 235 240
Leu Thr Asp Ala Ile Asp Met Leu Ile Glu Lys Glu Thr Val Glu Ala
245 250 255
Tyr His Met Lys Gly Lys Ser His Asp Cys Gly Asn Lys Leu Gly Tyr
260 265 270
Met Gln Ala Phe Val Glu Tyr Gly Ile Arg His Asn Thr Leu Gly Thr
275 280 285
Glu Phe Lys Ala Trp Leu Glu Glu Glu Met Gly Ile Lys Lys
290 295 300
<210> 33
<211> 1470
<212> DNA
<213> Synechocystis sp.
<400> 33
atgaaatccc cccaggctca acaaatccta gaccaggccc gccgtttgct ctacgaaaaa 60
gccatggtca aaatcaatgg gcaatacgtg gggacggtgg cggccattcc ccaatcggat 120
caccatgatt tgaactatac ggaagttttc attcgggaca atgtgccggt gatgatcttc 180
ttgttactgc aaaatgaaac ggaaattgtc caaaactttt tggaaatttg cctcaccctc 240
caaagtaagg gctttcccac ctacggcatt tttcccacta gttttgtgga aacggaaaac 300
catgaactca aggcagacta tggccaacgg gcgatcggtc gagtttgctc ggtggatgcg 360
tccctctggt ggcctatttt ggcctattac tacgtgcaaa gaaccggcaa tgaagcctgg 420
gctagacaaa cccatgtgca attggggcta caaaagtttt taaacctcat tctccatcca 480
gtctttcggg atgcacccac tttgtttgtg cccgacgggg cctttatgat tgaccgcccc 540
atggatgtgt ggggagcgcc gttggaaatc caaaccctgc tctacggagc cctgaaaagt 600
gcggcggggt tactgttaat cgacctcaag gcgaagggtt attgcagcaa taaagaccat 660
ccttttgaca gcttcacgat ggagcagagt catcaattta acctgagtgt ggattggctc 720
aaaaaactcc gcacctatct gctcaagcat tattggatta attgcaatat tgtccaagct 780
ctccgccgcc gtcccacgga acagtacggt gaagaagcca gcaacgaaca taatgtccac 840
acagaaacca ttcccaactg gctccaggat tggctcggcg atcggggagg ctatttaatc 900
ggcaatatcc gcacgggtcg ccccgatttt cgctttttct ccctgggtaa ttgcttgggg 960
gcaattttcg atgtcactag cttggcccag caacgttcct ttttccgttt ggtattaaat 1020
aatcagcggg agttatgtgc ccaaatgccc ctgaggattt gccatccccc cctcaaagat 1080
gacgattggc gcagtaaaac cggctttgac cgcaaaaatt taccctggtg ctaccacaac 1140
gccggccatt ggccctgttt attttggttt ctggtggtgg cggtgctccg ccatagctgc 1200
cattccaact acggcacggt ggagtatgcg gaaatgggga acctaattcg caataactat 1260
gaggtgcttt tgcgccgttt gcccaagcat aaatgggctg aatattttga tggccccacg 1320
ggcttttggg tcgggcaaca atcccgttcc taccaaacct ggaccattgt gggcctattg 1380
ctagtacacc atttcacaga agttaacccc gacgatgctt tgatgttcga tttgcctagt 1440
ttgaaaagtt tgcatcaagc gctgcattaa 1470
<210> 34
<211> 489
<212> PRT
<213> Synechocystis sp.
<400> 34
Met Lys Ser Pro Gln Ala Gln Gln Ile Leu Asp Gln Ala Arg Arg Leu
1 5 10 15
Leu Tyr Glu Lys Ala Met Val Lys Ile Asn Gly Gln Tyr Val Gly Thr
20 25 30
Val Ala Ala Ile Pro Gln Ser Asp His His Asp Leu Asn Tyr Thr Glu
35 40 45
Val Phe Ile Arg Asp Asn Val Pro Val Met Ile Phe Leu Leu Leu Gln
50 55 60
Asn Glu Thr Glu Ile Val Gln Asn Phe Leu Glu Ile Cys Leu Thr Leu
65 70 75 80
Gln Ser Lys Gly Phe Pro Thr Tyr Gly Ile Phe Pro Thr Ser Phe Val
85 90 95
Glu Thr Glu Asn His Glu Leu Lys Ala Asp Tyr Gly Gln Arg Ala Ile
100 105 110
Gly Arg Val Cys Ser Val Asp Ala Ser Leu Trp Trp Pro Ile Leu Ala
115 120 125
Tyr Tyr Tyr Val Gln Arg Thr Gly Asn Glu Ala Trp Ala Arg Gln Thr
130 135 140
His Val Gln Leu Gly Leu Gln Lys Phe Leu Asn Leu Ile Leu His Pro
145 150 155 160
Val Phe Arg Asp Ala Pro Thr Leu Phe Val Pro Asp Gly Ala Phe Met
165 170 175
Ile Asp Arg Pro Met Asp Val Trp Gly Ala Pro Leu Glu Ile Gln Thr
180 185 190
Leu Leu Tyr Gly Ala Leu Lys Ser Ala Ala Gly Leu Leu Leu Ile Asp
195 200 205
Leu Lys Ala Lys Gly Tyr Cys Ser Asn Lys Asp His Pro Phe Asp Ser
210 215 220
Phe Thr Met Glu Gln Ser His Gln Phe Asn Leu Ser Val Asp Trp Leu
225 230 235 240
Lys Lys Leu Arg Thr Tyr Leu Leu Lys His Tyr Trp Ile Asn Cys Asn
245 250 255
Ile Val Gln Ala Leu Arg Arg Arg Pro Thr Glu Gln Tyr Gly Glu Glu
260 265 270
Ala Ser Asn Glu His Asn Val His Thr Glu Thr Ile Pro Asn Trp Leu
275 280 285
Gln Asp Trp Leu Gly Asp Arg Gly Gly Tyr Leu Ile Gly Asn Ile Arg
290 295 300
Thr Gly Arg Pro Asp Phe Arg Phe Phe Ser Leu Gly Asn Cys Leu Gly
305 310 315 320
Ala Ile Phe Asp Val Thr Ser Leu Ala Gln Gln Arg Ser Phe Phe Arg
325 330 335
Leu Val Leu Asn Asn Gln Arg Glu Leu Cys Ala Gln Met Pro Leu Arg
340 345 350
Ile Cys His Pro Pro Leu Lys Asp Asp Asp Trp Arg Ser Lys Thr Gly
355 360 365
Phe Asp Arg Lys Asn Leu Pro Trp Cys Tyr His Asn Ala Gly His Trp
370 375 380
Pro Cys Leu Phe Trp Phe Leu Val Val Ala Val Leu Arg His Ser Cys
385 390 395 400
His Ser Asn Tyr Gly Thr Val Glu Tyr Ala Glu Met Gly Asn Leu Ile
405 410 415
Arg Asn Asn Tyr Glu Val Leu Leu Arg Arg Leu Pro Lys His Lys Trp
420 425 430
Ala Glu Tyr Phe Asp Gly Pro Thr Gly Phe Trp Val Gly Gln Gln Ser
435 440 445
Arg Ser Tyr Gln Thr Trp Thr Ile Val Gly Leu Leu Leu Val His His
450 455 460
Phe Thr Glu Val Asn Pro Asp Asp Ala Leu Met Phe Asp Leu Pro Ser
465 470 475 480
Leu Lys Ser Leu His Gln Ala Leu His
485
<210> 35
<211> 1500
<212> DNA
<213> Synechocystis sp.
<400> 35
atgaattcat cccttgtgat cctttaccac cgtgagccct acgacgaagt tagggaaaat 60
ggcaaaacgg tgtatcgaga gaaaaagagt cccaacggga ttttgcccac cctcaaaagt 120
ttttttgccg atgcggaaca gagcacctgg gtcgcatgga aacaggtttc gccgaagcaa 180
aaggatgatt ttcaggcgga tatgtccatt gaaggccttg gcgatcgttg tacggtgcgc 240
cgggtgcccc tgacggcgga gcaggtaaaa aacttctatc acatcacttc caaggaagcc 300
ttttggccca ttctccactc tttcccctgg cagttcacct acgattcttc tgattgggat 360
aattttcagc acattaaccg cttatttgcc gaggcggcct gtgccgatgc cgatgacaat 420
gcattgtttt gggtccacga ctataacctc tggttagcgc ccctttacat tcgtcagctc 480
aagcccaacg ccaagattgc ctttttccac cacaccccct tccccagcgt tgatattttc 540
aatattttgc cctggcggga ggcgatcgta gaaagcttgc tggcctgtga tctctgtggt 600
tttcatattc cccgctacgt agaaaatttt gtcgccgtgg cccgtagtct caagccggtg 660
gaaatcacca gacgggttgt ggtagaccaa gcctttaccc cctacggtac ggccctggcg 720
gaaccggaac tcaccaccca gttgcgttat ggcgatcgcc tcattaacct cgatgcgttt 780
cccgtgggca ccaatccggc aaatatccgg gcgatcgtgg ccaaagaaag tgtgcaacaa 840
aaagttgctg aaattaaaca agatttaggc ggtaagaggc taattgtttc cgctgggcgg 900
gtggattacg tgaagggcac caaggaaatg ttgatgtgct atgaacgtct actggagcgt 960
cgccccgaat tgcaggggga aattagcctg gtagtccccg tagccaaggc cgctgaggga 1020
atgcgtattt atcgcaacgc ccaaaacgaa attgaacgac tggcagggaa aattaacggt 1080
cgctttgcca aactgtcctg gacaccagtg atgctgttca cctctccttt agcctatgag 1140
gagctcattg ccctgttctg tgccgccgac attgcctgga tcactcccct gcgggatggg 1200
ctaaacctgg tggctaagga gtatgtggtg gctaaaaatg gcgaagaagg agttctgatc 1260
ctctcggaat ttgccggttg tgcggtggaa ctacccgatg cggtgttgac taacccctac 1320
gcttccagcc gtatggacga atccattgac caggccctgg ccatggacaa agacgaacag 1380
aaaaaacgca tggggagaat gtacgccgcc attaagcgtt acgacgttca acaatgggcc 1440
aatcacctac tgcgggaagc ctacgccgat gtggtactgg gagagccccc ccaaatgtag 1500
<210> 36
<211> 499
<212> PRT
<213> Synechocystis sp.
<400> 36
Met Asn Ser Ser Leu Val Ile Leu Tyr His Arg Glu Pro Tyr Asp Glu
1 5 10 15
Val Arg Glu Asn Gly Lys Thr Val Tyr Arg Glu Lys Lys Ser Pro Asn
20 25 30
Gly Ile Leu Pro Thr Leu Lys Ser Phe Phe Ala Asp Ala Glu Gln Ser
35 40 45
Thr Trp Val Ala Trp Lys Gln Val Ser Pro Lys Gln Lys Asp Asp Phe
50 55 60
Gln Ala Asp Met Ser Ile Glu Gly Leu Gly Asp Arg Cys Thr Val Arg
65 70 75 80
Arg Val Pro Leu Thr Ala Glu Gln Val Lys Asn Phe Tyr His Ile Thr
85 90 95
Ser Lys Glu Ala Phe Trp Pro Ile Leu His Ser Phe Pro Trp Gln Phe
100 105 110
Thr Tyr Asp Ser Ser Asp Trp Asp Asn Phe Gln His Ile Asn Arg Leu
115 120 125
Phe Ala Glu Ala Ala Cys Ala Asp Ala Asp Asp Asn Ala Leu Phe Trp
130 135 140
Val His Asp Tyr Asn Leu Trp Leu Ala Pro Leu Tyr Ile Arg Gln Leu
145 150 155 160
Lys Pro Asn Ala Lys Ile Ala Phe Phe His His Thr Pro Phe Pro Ser
165 170 175
Val Asp Ile Phe Asn Ile Leu Pro Trp Arg Glu Ala Ile Val Glu Ser
180 185 190
Leu Leu Ala Cys Asp Leu Cys Gly Phe His Ile Pro Arg Tyr Val Glu
195 200 205
Asn Phe Val Ala Val Ala Arg Ser Leu Lys Pro Val Glu Ile Thr Arg
210 215 220
Arg Val Val Val Asp Gln Ala Phe Thr Pro Tyr Gly Thr Ala Leu Ala
225 230 235 240
Glu Pro Glu Leu Thr Thr Gln Leu Arg Tyr Gly Asp Arg Leu Ile Asn
245 250 255
Leu Asp Ala Phe Pro Val Gly Thr Asn Pro Ala Asn Ile Arg Ala Ile
260 265 270
Val Ala Lys Glu Ser Val Gln Gln Lys Val Ala Glu Ile Lys Gln Asp
275 280 285
Leu Gly Gly Lys Arg Leu Ile Val Ser Ala Gly Arg Val Asp Tyr Val
290 295 300
Lys Gly Thr Lys Glu Met Leu Met Cys Tyr Glu Arg Leu Leu Glu Arg
305 310 315 320
Arg Pro Glu Leu Gln Gly Glu Ile Ser Leu Val Val Pro Val Ala Lys
325 330 335
Ala Ala Glu Gly Met Arg Ile Tyr Arg Asn Ala Gln Asn Glu Ile Glu
340 345 350
Arg Leu Ala Gly Lys Ile Asn Gly Arg Phe Ala Lys Leu Ser Trp Thr
355 360 365
Pro Val Met Leu Phe Thr Ser Pro Leu Ala Tyr Glu Glu Leu Ile Ala
370 375 380
Leu Phe Cys Ala Ala Asp Ile Ala Trp Ile Thr Pro Leu Arg Asp Gly
385 390 395 400
Leu Asn Leu Val Ala Lys Glu Tyr Val Val Ala Lys Asn Gly Glu Glu
405 410 415
Gly Val Leu Ile Leu Ser Glu Phe Ala Gly Cys Ala Val Glu Leu Pro
420 425 430
Asp Ala Val Leu Thr Asn Pro Tyr Ala Ser Ser Arg Met Asp Glu Ser
435 440 445
Ile Asp Gln Ala Leu Ala Met Asp Lys Asp Glu Gln Lys Lys Arg Met
450 455 460
Gly Arg Met Tyr Ala Ala Ile Lys Arg Tyr Asp Val Gln Gln Trp Ala
465 470 475 480
Asn His Leu Leu Arg Glu Ala Tyr Ala Asp Val Val Leu Gly Glu Pro
485 490 495
Pro Gln Met
<210> 37
<211> 1434
<212> DNA
<213> Synechocystis sp.
<400> 37
atgaagattt tatttgtggc ggcggaagta tcccccctag caaaggtagg tggcatgggg 60
gatgtggtgg gttccctgcc taaagttctg catcagttgg gccatgatgt ccgtgtcttc 120
atgccctact acggtttcat cggcgacaag attgatgtgc ccaaggagcc ggtctggaaa 180
ggggaagcca tgttccagca gtttgctgtt taccagtcct atctaccgga caccaaaatt 240
cctctctact tgttcggcca tccagctttc gactcccgaa ggatctatgg cggagatgac 300
gaggcgtggc ggttcacttt tttttctaac ggggcagctg aatttgcctg gaaccattgg 360
aagccggaaa ttatccattg ccatgattgg cacactggca tgatccctgt ttggatgcat 420
cagtccccag acatcgccac cgttttcacc atccataatc ttgcttacca agggccctgg 480
cggggcttgc ttgaaactat gacttggtgt ccttggtaca tgcagggaga caatgtgatg 540
gcggcggcga ttcaatttgc caatcgggtg actaccgttt ctcccaccta tgcccaacag 600
atccaaaccc cggcctatgg ggaaaagctg gaagggttat tgtcctacct gagtggtaat 660
ttagtcggta ttctcaacgg tattgatacg gagatttaca acccggcgga agaccgcttt 720
atcagcaatg ttttcgatgc ggacagtttg gacaagcggg tgaaaaataa aattgccatc 780
caggaggaaa cggggttaga aattaatcgt aatgccatgg tggtgggtat agtggctcgc 840
ttggtggaac aaaaggggat tgatttggtg attcagatcc ttgaccgctt catgtcctac 900
accgattccc agttaattat cctcggcact ggcgatcgcc attacgaaac ccaactttgg 960
cagatggctt cccgatttcc tgggcggatg gcggtgcaat tactccacaa cgatgccctt 1020
tcccgtcgag tctatgccgg ggcggatgtg tttttaatgc cttctcgctt tgagccctgt 1080
gggctgagtc aattgatggc catgcgttat ggctgtatcc ccattgtgcg gcggacaggg 1140
ggtttggtgg atacggtatc cttctacgat cctatcaatg aagccggcac cggctattgc 1200
tttgaccgtt atgaacccct ggattgcttt acggccatgg tgcgggcctg ggagggtttc 1260
cgtttcaagg cagattggca aaaattacag caacgggcca tgcgggcaga ctttagttgg 1320
taccgttccg ccggggaata tatcaaagtt tataagggcg tggtggggaa accggaggaa 1380
ttaagcccca tggaagagga aaaaatcgct gagttaactg cttcctatcg ctaa 1434
<210> 38
<211> 477
<212> PRT
<213> Synechocystis sp.
<400> 38
Met Lys Ile Leu Phe Val Ala Ala Glu Val Ser Pro Leu Ala Lys Val
1 5 10 15
Gly Gly Met Gly Asp Val Val Gly Ser Leu Pro Lys Val Leu His Gln
20 25 30
Leu Gly His Asp Val Arg Val Phe Met Pro Tyr Tyr Gly Phe Ile Gly
35 40 45
Asp Lys Ile Asp Val Pro Lys Glu Pro Val Trp Lys Gly Glu Ala Met
50 55 60
Phe Gln Gln Phe Ala Val Tyr Gln Ser Tyr Leu Pro Asp Thr Lys Ile
65 70 75 80
Pro Leu Tyr Leu Phe Gly His Pro Ala Phe Asp Ser Arg Arg Ile Tyr
85 90 95
Gly Gly Asp Asp Glu Ala Trp Arg Phe Thr Phe Phe Ser Asn Gly Ala
100 105 110
Ala Glu Phe Ala Trp Asn His Trp Lys Pro Glu Ile Ile His Cys His
115 120 125
Asp Trp His Thr Gly Met Ile Pro Val Trp Met His Gln Ser Pro Asp
130 135 140
Ile Ala Thr Val Phe Thr Ile His Asn Leu Ala Tyr Gln Gly Pro Trp
145 150 155 160
Arg Gly Leu Leu Glu Thr Met Thr Trp Cys Pro Trp Tyr Met Gln Gly
165 170 175
Asp Asn Val Met Ala Ala Ala Ile Gln Phe Ala Asn Arg Val Thr Thr
180 185 190
Val Ser Pro Thr Tyr Ala Gln Gln Ile Gln Thr Pro Ala Tyr Gly Glu
195 200 205
Lys Leu Glu Gly Leu Leu Ser Tyr Leu Ser Gly Asn Leu Val Gly Ile
210 215 220
Leu Asn Gly Ile Asp Thr Glu Ile Tyr Asn Pro Ala Glu Asp Arg Phe
225 230 235 240
Ile Ser Asn Val Phe Asp Ala Asp Ser Leu Asp Lys Arg Val Lys Asn
245 250 255
Lys Ile Ala Ile Gln Glu Glu Thr Gly Leu Glu Ile Asn Arg Asn Ala
260 265 270
Met Val Val Gly Ile Val Ala Arg Leu Val Glu Gln Lys Gly Ile Asp
275 280 285
Leu Val Ile Gln Ile Leu Asp Arg Phe Met Ser Tyr Thr Asp Ser Gln
290 295 300
Leu Ile Ile Leu Gly Thr Gly Asp Arg His Tyr Glu Thr Gln Leu Trp
305 310 315 320
Gln Met Ala Ser Arg Phe Pro Gly Arg Met Ala Val Gln Leu Leu His
325 330 335
Asn Asp Ala Leu Ser Arg Arg Val Tyr Ala Gly Ala Asp Val Phe Leu
340 345 350
Met Pro Ser Arg Phe Glu Pro Cys Gly Leu Ser Gln Leu Met Ala Met
355 360 365
Arg Tyr Gly Cys Ile Pro Ile Val Arg Arg Thr Gly Gly Leu Val Asp
370 375 380
Thr Val Ser Phe Tyr Asp Pro Ile Asn Glu Ala Gly Thr Gly Tyr Cys
385 390 395 400
Phe Asp Arg Tyr Glu Pro Leu Asp Cys Phe Thr Ala Met Val Arg Ala
405 410 415
Trp Glu Gly Phe Arg Phe Lys Ala Asp Trp Gln Lys Leu Gln Gln Arg
420 425 430
Ala Met Arg Ala Asp Phe Ser Trp Tyr Arg Ser Ala Gly Glu Tyr Ile
435 440 445
Lys Val Tyr Lys Gly Val Val Gly Lys Pro Glu Glu Leu Ser Pro Met
450 455 460
Glu Glu Glu Lys Ile Ala Glu Leu Thr Ala Ser Tyr Arg
465 470 475
<210> 39
<211> 5386
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 39
tgggcgcggg gcatgactat cgtcgccgca cttatgactg tcttctttat catgcaactc 60
gtaggacagg tggtacctac ggttatccac agaatcaggg gataacgcag gaaagaacat 120
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 180
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 240
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 300
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 360
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 420
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 480
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 540
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 600
ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 660
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 720
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 780
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 840
gagattatca aaaaggatct tcacctgcta gcgaagatcc tttgatcttt tctacggggt 900
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaac aataaaactg 960
tctgcttaca taaacagtaa tacaaggggt gttatgagcc atattcaacg ggaaacgtct 1020
tgctctaggc cgcgattaaa ttccaacatg gatgctgatt tatatgggta taaatgggct 1080
cgcgataatg tcgggcaatc aggtgcgaca atctatcgat tgtatgggaa gcccgatgcg 1140
ccagagttgt ttctgaaaca tggcaaaggt agcgttgcca atgatgttac agatgagatg 1200
gtcagactaa actggctgac ggaatttatg cctcttccga ccatcaagca ttttatccgt 1260
actcctgatg atgcatggtt actcaccact gcgatccccg ggaaaacagc attccaggta 1320
ttagaagaat atcctgattc aggtgaaaat attgttgatg cgctggcagt gttcctgcgc 1380
cggttgcatt cgattcctgt ttgtaattgt ccttttaaca gcgatcgcgt atttcgtctc 1440
gctcaggcgc aatcacgaat gaataacggt ttggttgatg cgagtgattt tgatgacgag 1500
cgtaatggct ggcctgttga acaagtctgg aaagaaatgc ataaactttt gccattctca 1560
ccggattcag tcgtcactca tggtgatttc tcacttgata accttatttt tgacgagggg 1620
aaattaatag gttgtattga tgttggacga gtcggaatcg cagaccgata ccaggatctt 1680
gccatcctat ggaactgcct cggtgagttt tctccttcat tacagaaacg gctttttcaa 1740
aaatatggta ttgataatcc tgatatgaat aaattgcagt ttcatttgat gctcgatgag 1800
tttttctaag aattaattca tgagcggata catatttgaa tgtatttaga aaaataaaca 1860
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gaaattgtaa acgttaatat 1920
tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 1980
aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 2040
agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 2100
cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc 2160
gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 2220
gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 2280
ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 2340
gccgctacag ggcgcgtccc attcgccaat ccggatatag ttcctccttt cagcaaaaaa 2400
cccctcaaga cccgtttaga ggccccaagg ggttatgcta gttattgctc agcggtggca 2460
gcagccaact cagcttcctt tcgggctttg ttagcagccg gatctcagtg gtggtggtgg 2520
tggtgctcga gtgcggccgc aagctttcat taatgatgat ggtggtggtg gctgccggtc 2580
gcacgggtgt cgctgtattt cttcaggtct tccaggtgcg ccagacggtt ttctttgtta 2640
atacgttggg tggtgatacg atccggatag caacgcataa acatgttggt gaagtgctcg 2700
ccgtagtgga tacgttcgtt cgcgctcggc tcgaacagcg gatacgcgct cgcttcgaag 2760
ttcggctcgt gaaagtacgc gcacgcgaaa cgttcacggg tgttcagttt aaccttgtgc 2820
ggggtgctca gcagttggcc accggtcatg aactgcagaa tatcgcccgg aaaaacggtc 2880
cacacacccg gggtcggggt aacgaaggtc cacggttcgt cgtgctcaaa catgcccgcg 2940
ctgctctcgc ccggcagcca gttacggtta cgcttttcgc cctccaccgg cggacggata 3000
tacaggccac caacatcgtc ttgcgccgca atcaccagca gaccgtagtc ggtgtgcgca 3060
ccaataccac ggctcagggt gctggtctgc ggcgggaaac gcagcacacg catgtggtgc 3120
cagccatcac gggtcaggtc ggtgaaggtg ttgatcggca gttcaaaacc cagcgcggtc 3180
agtttcagca gacgctcgcc cgccagaccc agttcctcca taaaggtttt catgctcttt 3240
tgataggtgt tgttcggcca cggaaccgga ccatggcacg gccaacccgc tttaacacgc 3300
tgatcgccca cgctcaggtc cttgcacacg gtaaaaattt ccgggaaatc cggcttgccc 3360
gcggtaactt cctcgccgct cgccacataa ccgctgtagg tcaggtcgct aacgcagctg 3420
cttttgaagg tcagcggctc tttgcaaaat tgcttgctcg ccgccatcgc ttcttgggtc 3480
ttacgatcct gctcgctgtc ggttttaatc tggaagatac catccttttg ccacgcctga 3540
atcagcgcac gacccaggct gatgtccgcc gcgcaaccgg tcacttcggt cggcagttca 3600
aaggtctgca ggttggtcat gctggtttcc tctttgtcca tgtacaggct cggatgctca 3660
ttccacacaa cgtccgggct gcataaccct agtgagggaa atactcccca tctacttgga 3720
gcgtgtatca tatgtatatc tccttcttaa agttaaacaa aattatttct agaggggaat 3780
tgttatccgc tcacaattcc cctatagtga gtcgtattaa tttcgcggga tcgagatcga 3840
tctcgatcct ctacgccgga cgcatcgtgg ccggcatcac cggcgccaca ggtgcggttg 3900
ctggcgccta tatcgccgac atcaccgatg gggaagatcg ggctcgccac ttcgggctca 3960
tgagcgcttg tttcggcgtg ggtatggtgg caggccccgt ggccggggga ctgttgggcg 4020
ccatctcctt gcatgcacca ttccttgcgg cggcggtgct caacggcctc aacctactac 4080
tgggctgctt cctaatgcag gagtcgcata agggagagcg tcgagatccc ggacaccatc 4140
gaatggcgca aaacctttcg cggtatggca tgatagcgcc cggaagagag tcaattcagg 4200
gtggtgaatg tgaaaccagt aacgttatac gatgtcgcag agtatgccgg tgtctcttat 4260
cagaccgttt cccgcgtggt gaaccaggcc agccacgttt ctgcgaaaac gcgggaaaaa 4320
gtggaagcgg cgatggcgga gctgaattac attcccaacc gcgtggcaca acaactggcg 4380
ggcaaacagt cgttgctgat tggcgttgcc acctccagtc tggccctgca cgcgccgtcg 4440
caaattgtcg cggcgattaa atctcgcgcc gatcaactgg gtgccagcgt ggtggtgtcg 4500
atggtagaac gaagcggcgt cgaagcctgt aaagcggcgg tgcacaatct tctcgcgcaa 4560
cgcgtcagtg ggctgatcat taactatccg ctggatgacc aggatgccat tgctgtggaa 4620
gctgcctgca ctaatgttcc ggcgttattt cttgatgtct ctgaccagac acccatcaac 4680
agtattattt tctcccatga agacggtacg cgactgggcg tggagcatct ggtcgcattg 4740
ggtcaccagc aaatcgcgct gttagcgggc ccattaagtt ctgtctcggc gcgtctgcgt 4800
ctggctggct ggcataaata tctcactcgc aatcaaattc agccgatagc ggaacgggaa 4860
ggcgactgga gtgccatgtc cggttttcaa caaaccatgc aaatgctgaa tgagggcatc 4920
gttcccactg cgatgctggt tgccaacgat cagatggcgc tgggcgcaat gcgcgccatt 4980
accgagtccg ggctgcgcgt tggtgcggac atctcggtag tgggatacga cgataccgaa 5040
gacagctcat gttatatccc gccgttaacc accatcaaac aggattttcg cctgctgggg 5100
caaaccagcg tggaccgctt gctgcaactc tctcagggcc aggcggtgaa gggcaatcag 5160
ctgttgcccg tctcactggt gaaaagaaaa accaccctgg cgcccaatac gcaaaccgcc 5220
tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 5280
agcgggcagt gagcgcaacg caattaatgt aagttagctc actcattagg caccgggatc 5340
tcgaccgatg cccttgagag ccttcaaccc agtcagctcc ttccgg 5386
<210> 40
<211> 3063
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 40
atttagcgtc ttctaatcca gtgtagacag tagttttggc tccgttgagc actgtagcct 60
tgggcgatcg ctctaaacat tacataaatt cacaaagttt tcgttacata aaaatagtgt 120
ctacttagct aaaaattaag ggttttttac acctttttga cagttaatct cctagcctaa 180
aaagcaagag tttttaacta agactcttgc cctttacaac ctcgaaggag cgtcagatct 240
catatgcacc accaccatca ccacgaaaac ctgtactttc agggcaagct tatgattcat 300
gccccctccc gctggggcgt gtttcccagt ctgggtctct gctcccccga tgtggtgtgg 360
aacgaacacc ccagcctgta catggataag gaagagacca gtatgaccaa tctgcaaacc 420
tttgaactgc ccaccgaggt gaccggttgc gccgccgata ttagcctcgg tcgcgccctg 480
attcaagcct ggcaaaagga tggcatcttc caaatcaaga ccgattccga acaagatcgc 540
aagacccaag aggccatggc cgccagcaaa caattttgca aggaacccct gacctttaaa 600
tccagctgcg tgagcgatct cacctacagt ggctatgtgg ccagtggtga agaggtgacc 660
gccggcaagc ccgattttcc cgagattttt accgtgtgca aggatctgag tgtgggtgat 720
caacgcgtga aagccggttg gccctgccat ggtcccgtgc cctggcccaa caatacctat 780
caaaaatcca tgaagacctt tatggaagaa ctcggtctgg ccggtgaacg cctgctcaaa 840
ctgaccgccc tcggctttga gctgcccatt aacaccttta ccgatctcac ccgcgatggt 900
tggcaccaca tgcgcgtgct gcgctttcct ccccaaacca gcaccctgag ccgcggtatt 960
ggtgcccaca ccgattacgg cctgctcgtg attgccgccc aagatgatgt gggcggtctg 1020
tatattcgcc ctcccgtgga aggcgagaaa cgcaaccgca attggctccc cggcgaaagt 1080
tccgccggca tgtttgaaca cgatgaaccc tggacctttg tgacgcccac gcccggcgtg 1140
tggaccgtgt ttcccggtga tattctgcaa tttatgaccg gcggtcaact gctctccacg 1200
ccccacaaag tgaagctcaa cacccgcgaa cgctttgcct gcgcctactt tcacgaaccc 1260
aattttgagg ccagtgccta tcccctgttt gaaccctccg ccaacgagcg cattcactac 1320
ggcgagcact ttaccaatat gtttatgcgc tgctatcccg atcgcattac cacccaacgc 1380
attaacaagg aaaatcgcct ggcccacctc gaggatctga aaaagtatag tgatacccgc 1440
gccaccggta gtggtgccac caactttagc ctgctcaaac aagccggcga tgtggaagag 1500
aaccccggtc ccatgaccga aagtattacc agcaatggca ccctggtggc cagtgatacc 1560
cgtcgccgcg tgtgggccat tgtgagtgcc agcagtggta acctggtgga gtggtttgat 1620
ttttacgtgt atagcttttg cagtctctac tttgcccaca ttttctttcc cagtggcaat 1680
accaccaccc aactgctgca aaccgccggc gtgtttgccg ccggttttct gatgcgcccc 1740
attggcggtt ggctctttgg ccgcattgcc gatcgtcgcg gtcgcaagac cagcatgctg 1800
attagcgtgt gcatgatgtg ctttggctcc ctgattattg cctgcctccc cggctatgat 1860
gccattggca cctgggcccc cgccctgctc ctgctggccc gcctctttca aggcctgagc 1920
gtgggcggtg aatacggcac cagcgccacc tatatgagtg aaattgccct ggagggccgc 1980
aaaggttttt acgccagttt tcaatatgtg accctgattg gcggtcaact gctcgccatt 2040
ctcgtggtgg tgattctcca acaaattctg accgattccc aactgcacga atggggctgg 2100
cgcattccct ttgccatggg tgccgccctg gccattgtgg ccctgtggct ccgtcgccaa 2160
ctcgatgaaa ccagccaaaa agaggtgcgc gccctgaaag aagccggcag ttttaaaggt 2220
ctctggcgca accgcaaggc ctttctcatg gtgctgggct ttaccgccgg cggtagtctg 2280
tccttttaca cctttaccac ctacatgcaa aaatatctcg tgaacaccac cggcatgcac 2340
gccaatgtgg ccagcgtgat tatgaccgcc gccctgtttg tgtttatgct cattcaaccc 2400
ctgattggcg ccctcagcga taagattggt cgtcgcacca gtatgctgat ttttggcggt 2460
atgagtgccc tctgcaccgt gcccattctc accgccctgc aacacgtgtc cagcccctac 2520
gccgcctttg ccctcgtgat gctggccatg gtgattgtgt ccttttatac cagcattagt 2580
ggcattctga aggccgaaat gtttcccgcc caagtgcgcg ccctgggcgt gggtctcagt 2640
tacgccgtgg ccaatgccct gtttggcggt tccgccgaat atgtggccct gtccctcaaa 2700
agctggggca gtgagaccac ctttttctgg tacgtgacca ttatgggtgc cctggccttt 2760
attgtgagcc tgatgctcca ccgcaaaggc aagggtattc gcctctaggg taccaggcaa 2820
acccatcccc aaccccctgc tgggcctgga tagcaccggt ggtggtcacc accaccatca 2880
ccactagagt actgtatgca tcgagtgcct ggcggcagta gcgcggtggt cccacctgac 2940
cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat 3000
gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 3060
ctt 3063
<210> 41
<211> 223
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
psbA promoter sequence
<400> 41
atttagcgtc ttctaatcca gtgtagacag tagttttggc tccgttgagc actgtagcct 60
tgggcgatcg ctctaaacat tacataaatt cacaaagttt tcgttacata aaaatagtgt 120
ctacttagct aaaaattaag ggttttttac acctttttga cagttaatct cctagcctaa 180
aaagcaagag tttttaacta agactcttgc cctttacaac ctc 223
<210> 42
<211> 158
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
rrnB terminator sequence
<400> 42
tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 60
gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 120
caaataaaac gaaaggctca gtcgaaagac tgggcctt 158
<210> 43
<211> 1578
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 43
gaggttgtaa agggcaagag tcttagttaa aaactcttgc tttttaggct aggagattaa 60
ctgtcaaaaa ggtgtaaaaa acccttaatt tttagctaag tagacactat ttttatgtaa 120
cgaaaacttt gtgaatttat gtaatgttta gagcgatcgc ccaaggctac agtgctcaac 180
ggagccaaaa ctactgtcta cactggatta gaagacgcta aatggtacct acgatctcat 240
atgatacacg ctccaagtag atggggagta tttccctcac tagggttatg cagcccggac 300
gttgtgtgga atgagcatcc gagcctgtac atggacaaag aggaaaccag catgaccaac 360
ctgcagacct ttgaactgcc gaccgaagtg accggttgcg cggcggacat cagcctgggt 420
cgtgcgctga ttcaggcgtg gcaaaaggat ggtatcttcc agattaaaac cgacagcgag 480
caggatcgta agacccaaga agcgatggcg gcgagcaagc aattttgcaa agagccgctg 540
accttcaaaa gcagctgcgt tagcgacctg acctacagcg gttatgtggc gagcggcgag 600
gaagttaccg cgggcaagcc ggatttcccg gaaattttta ccgtgtgcaa ggacctgagc 660
gtgggcgatc agcgtgttaa agcgggttgg ccgtgccatg gtccggttcc gtggccgaac 720
aacacctatc aaaagagcat gaaaaccttt atggaggaac tgggtctggc gggcgagcgt 780
ctgctgaaac tgaccgcgct gggttttgaa ctgccgatca acaccttcac cgacctgacc 840
cgtgatggct ggcaccacat gcgtgtgctg cgtttcccgc cgcagaccag caccctgagc 900
cgtggtattg gtgcgcacac cgactacggt ctgctggtga ttgcggcgca agacgatgtt 960
ggtggcctgt atatccgtcc gccggtggag ggcgaaaagc gtaaccgtaa ctggctgccg 1020
ggcgagagca gcgcgggcat gtttgagcac gacgaaccgt ggaccttcgt taccccgacc 1080
ccgggtgtgt ggaccgtttt tccgggcgat attctgcagt tcatgaccgg tggccaactg 1140
ctgagcaccc cgcacaaggt taaactgaac acccgtgaac gtttcgcgtg cgcgtacttt 1200
cacgagccga acttcgaagc gagcgcgtat ccgctgttcg agccgagcgc gaacgaacgt 1260
atccactacg gcgagcactt caccaacatg tttatgcgtt gctatccgga tcgtatcacc 1320
acccaacgta ttaacaaaga aaaccgtctg gcgcacctgg aagacctgaa gaaatacagc 1380
gacacccgtg cgaccggcag ccaccaccac catcatcatt aatgaaagct tgcggccgca 1440
ctcgagcacc accaccacca ccactgagat ccggctgcta acaaagcccg aaaggaagct 1500
gagttggctg ctgccaccgc tgagcaataa ctagcataac cccttggggc ctctaaacgg 1560
gtcttgaggg gttttttg 1578
<210> 44
<211> 48
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
T7 terminator sequence
<400> 44
caaaaaaccc ctcaagaccc gtttagaggc cccaaggggt tatgctag 48
<210> 45
<211> 3943
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 45
gagcgtgtat catatgagat ctgacgctcc ttcgaggttg taaagggcaa gagtcttagt 60
taaaaactct tgctttttag gctaggagat taactgtcaa aaaggtgtaa aaaaccctta 120
atttttagct aagtagacac tatttttatg taacgaaaac tttgtgaatt tatgtaatgt 180
ttagagcgat cgcccaaggc tacagtgctc aacggagcca aaactactgt ctacactgga 240
ttagaagacg ctaaatggta cctacgatct catatgatac acgctccaag tagatgggga 300
gtatttccct cactagggtt atgcagcccg gacgttgtgt ggaatgagca tccgagcctg 360
tacatggaca aagaggaaac cagcatgacc aacctgcaga cctttgaact gccgaccgaa 420
gtgaccggtt gcgcggcgga catcagcctg ggtcgtgcgc tgattcaggc gtggcaaaag 480
gatggtatct tccagattaa aaccgacagc gagcaggatc gtaagaccca agaagcgatg 540
gcggcgagca agcaattttg caaagagccg ctgaccttca aaagcagctg cgttagcgac 600
ctgacctaca gcggttatgt ggcgagcggc gaggaagtta ccgcgggcaa gccggatttc 660
ccggaaattt ttaccgtgtg caaggacctg agcgtgggcg atcagcgtgt taaagcgggt 720
tggccgtgcc atggtccggt tccgtggccg aacaacacct atcaaaagag catgaaaacc 780
tttatggagg aactgggtct ggcgggcgag cgtctgctga aactgaccgc gctgggtttt 840
gaactgccga tcaacacctt caccgacctg acccgtgatg gctggcacca catgcgtgtg 900
ctgcgtttcc cgccgcagac cagcaccctg agccgtggta ttggtgcgca caccgactac 960
ggtctgctgg tgattgcggc gcaagacgat gttggtggcc tgtatatccg tccgccggtg 1020
gagggcgaaa agcgtaaccg taactggctg ccgggcgaga gcagcgcggg catgtttgag 1080
cacgacgaac cgtggacctt cgttaccccg accccgggtg tgtggaccgt ttttccgggc 1140
gatattctgc agttcatgac cggtggccaa ctgctgagca ccccgcacaa ggttaaactg 1200
aacacccgtg aacgtttcgc gtgcgcgtac tttcacgagc cgaacttcga agcgagcgcg 1260
tatccgctgt tcgagccgag cgcgaacgaa cgtatccact acggcgagca cttcaccaac 1320
atgtttatgc gttgctatcc ggatcgtatc accacccaac gtattaacaa agaaaaccgt 1380
ctggcgcacc tggaagacct gaagaaatac agcgacaccc gtgcgaccgg cagccaccac 1440
caccatcatc attaatgaaa gcttgcggcc gcactcgagc accaccacca ccaccactga 1500
gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg ctgctgccac cgctgagcaa 1560
taactagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt gctgaaagga 1620
ggaactatat ccggattggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg 1680
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 1740
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 1800
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 1860
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 1920
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 1980
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 2040
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa 2100
tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 2160
tacattcaaa tatgtatccg ctcatgaatt aattcttaga aaaactcatc gagcatcaaa 2220
tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 2280
tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 2340
tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 2400
aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagt 2460
ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 2520
ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 2580
tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 2640
agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 2700
ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 2760
atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 2820
tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 2880
tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 2940
tataaatcag catccatgtt ggaatttaat cgcggcctag agcaagacgt ttcccgttga 3000
atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 3060
gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 3120
caaaggatct tcgctagcag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 3180
aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 3240
gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 3300
cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 3360
gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc caccacttca 3420
agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 3480
ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 3540
cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 3600
acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 3660
gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 3720
ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 3780
agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 3840
cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 3900
tatcccctga ttctgtggat aaccgtaggt accatttagc gtc 3943
<210> 46
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
6xHis tag
<400> 46
His His His His His His
1 5
Claims (33)
- 개선된 에틸렌 생산 능력을 갖는 재조합 미생물로서, 재조합 미생물이 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고,
재조합 미생물에 의해 생산되는 EFE 단백질의 양이 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물. - 제1항에 있어서, 재조합 미생물이 비-천연의 알파-케토글루타레이트 퍼미아제(AKGP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 2와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 AKGP 단백질을 발현하고,
재조합 미생물에 의해 생산되는 AKGP 단백질의 양이 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물. - 제1항에 있어서, 재조합 미생물에 의해 생산되는 EFE 단백질의 양이 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많은, 재조합 미생물.
- 제1항에 있어서, 재조합 미생물이 시아노박테리아(Cyanobacteria), 시네코코커스(Synechococcus), 시네코코커스 엘롱가투스(Synechococcus elongatus), 시네코코커스 레오폴리엔시스(Synechococcus leopoliensis), 시네코시스티스(Synechocystis), 아나베나(Anabaena), 슈도모나스(Pseudomonas), 슈도모나스 시링가에(Pseudomonas syringae), 슈도모나스 사바스타노이(Pseudomonas savastanoi), 클라미도모나스(Chlamydomonas), 클라미도모나스 레인하르티이(Chlamydomonas reinhardtii), 에세리키아(Escherichia), 에세리키아 콜라이(Escherichia coli), 지오박테리아(Geobacteria), 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함하는, 재조합 미생물.
- 제1항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열이 세균 벡터 플라스미드, 높은 카피 수의 세균 벡터 플라스미드, 유도성 프로모터를 갖는 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입되는, 재조합 미생물.
- 제2항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 세균 벡터 플라스미드, 높은 카피 수의 세균 벡터 플라스미드, 유도성 프로모터를 갖는 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입되는, 재조합 미생물.
- 제1항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 비-천연의 EFE 발현 뉴클레오타이드 서열이 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입되는, 재조합 미생물.
- 제2항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 AKGP 발현 뉴클레오타이드 서열이 에세리키아 종 세균의 벡터 플라스미드 내로 삽입되는, 재조합 미생물.
- 제1항에 있어서, 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함하고, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 5와 적어도 95% 동일한 조합된 아미노산 서열을 발현하며, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 시네코코커스 종 세균의 세균 플라스미드 내로 삽입되는, 재조합 미생물.
- 제1항에 있어서, 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함하고, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현하며, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 시네코코커스 종 세균의 세균 플라스미드 내로 삽입되는, 재조합 미생물.
- 제1항에 있어서, 재조합 미생물이 비-천연의 포스포에놀피루베이트 신타아제(PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고,
재조합 미생물에 의해 생산되는 PEP 단백질의 양이 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고,
재조합 미생물에 의해 생산되는 AKG의 양이 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물. - 제11항에 있어서, 재조합 미생물이 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 17과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 시트레이트 신타아제 단백질을 발현하고, 재조합 미생물에 의해 생산되는 시트레이트 신타아제 단백질의 양이 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
- 제1항에 있어서, 재조합 미생물이 비-천연의 이소시트레이트 데하이드로게나아제(IDH) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 20과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 IDH 단백질을 발현하고,
재조합 미생물에 의해 생산되는 IDH 단백질의 양이 비-천연의 IDH 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고,
재조합 미생물에 의해 생산되는 AKG의 양이 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물. - 제13항에 있어서, 재조합 미생물이 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 발현 뉴클레오타이드 서열에서 결실을 함유하고, 재조합 미생물에 의해 생산되는 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 단백질의 양이 상기 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적은, 재조합 미생물.
- 제11항에 있어서, 재조합 미생물이 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함하는, 재조합 미생물.
- 제1항에 있어서, 재조합 미생물이 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 24와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 수크로오스 퍼미아제 단백질을 발현하고,
재조합 미생물에 의해 생산되는 수크로오스 퍼미아제 단백질의 양이 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물. - 제1항에 있어서, 재조합 미생물이 서열 번호 26과 적어도 95% 동일한 아미노산 서열을 갖는 수크로오스 포스페이트 신타아제 단백질, 서열 번호 28과 적어도 95% 동일한 아미노산 서열을 갖는 수크로오스-6-포스파타아제 단백질, 서열 번호 30과 적어도 95% 동일한 아미노산 서열을 갖는 글리코겐 포스포릴라아제 단백질, 및 서열 번호 32와 적어도 95% 동일한 아미노산 서열을 갖는 UTP-글루코오스-1-포스페이트 우리딜릴트랜스퍼라아제 단백질로 이루어진 군으로부터 선택된 적어도 하나의 단백질을, 상기 적어도 하나의 단백질을 코딩하는 비-천연의 뉴클레오타이드 서열을 발현함으로써 발현하고,
재조합 미생물에 의해 생산되는 적어도 하나의 단백질의 양이 상기 적어도 하나의 단백질을 코딩하는 비-천연의 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고,
재조합 미생물에 의해 생산되는 수크로오스의 양이 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물. - 제17항에 있어서, 재조합 미생물이 적어도 하나의 뉴클레오타이드 서열에서 적어도 하나의 결실을 함유하고, 적어도 하나의 뉴클레오타이드 서열은 서열 번호 34와 적어도 95% 동일한 아미노산 서열을 갖는 인버타아제 단백질, 서열 번호 36과 적어도 95% 동일한 아미노산 서열을 갖는 글루코실글리세롤-포스페이트 신타아제 단백질, 및 서열 번호 38과 적어도 95% 동일한 아미노산 서열을 갖는 글리코겐 신타아제 단백질로부터 선택된 적어도 하나의 단백질을 코딩하고, 재조합 미생물에 의해 생산되는 상기 적어도 하나의 단백질의 양이 상기 적어도 하나의 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적은, 재조합 미생물.
- 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제조하는 방법으로서,
비-천연의 EFE 발현 뉴클레오타이드 서열, 또는 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 재조합 미생물을 제조하는 단계를 포함하고,
비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 3 또는 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖거나, 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현하거나; 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는, 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제조하는 방법. - 제19항에 있어서, 미생물이 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택되는, 방법.
- 제19항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 미생물이 클라미도모나스 종 세균이거나; 또는
비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 미생물이 에세리키아 종 세균이거나; 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현하고, 미생물이 시네코코커스 종 세균이거나; 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 미생물이 시네코코커스 종 세균인, 방법. - 에틸렌을 생산하는 방법으로서,
개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제공하는 단계로서, 재조합 미생물이 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고,
재조합 미생물에 의해 생산되는 EFE 단백질의 양이 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은 것인 단계;
생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 생물 반응기 배양 용기에서 재조합 미생물을 배양하는 단계; 및
생물 반응기 배양 용기로부터 에틸렌을 수확하는 단계
를 포함하는, 에틸렌을 생산하는 방법. - 제22항에 있어서, 재조합 미생물이, 미생물의 세균 플라스미드 내로 삽입된, 비-천연의 EFE 발현 뉴클레오타이드 서열 또는 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 포함하고,
비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 3 또는 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖거나, 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 갖거나; 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현하는, 방법. - 제22항에 있어서, 미생물이 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택되는, 방법.
- 제22항에 있어서, 생물 반응기 배양 용기 내에 위치한 재조합 미생물을 함유하는 배양물에 적어도 하나의 활성화제를 첨가하여 에틸렌 생산량을 증가시키는 단계; 또는 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO2를 약 100 ml/분 내지 약 500 ml/분의 속도로 첨가하는 단계를 추가로 포함하는 방법.
- 제22항에 있어서, 생물 반응기 배양 용기 내에 위치한 재조합 미생물을 함유하는 세포 배양물로부터 적어도 하나의 분자 스위치를 제거하여 에틸렌 생산량을 감소시키는 단계를 추가로 포함하는 방법.
- 제22항에 있어서, 재조합 미생물을 배양할 때 적어도 하나의 영양소의 농도 또는 적어도 하나의 자극의 양을 증가 또는 감소시켜 미생물 배양물로부터 생산되는 에틸렌의 양을 제어하는 단계를 추가로 포함하는 방법.
- 제22항에 있어서, 적어도 하나의 영양소의 농도 및 적어도 하나의 자극의 양이 미생물 배양물에서 약 0.5~1.5 그램/리터 내지 약 0.1 mM의 비율인, 방법.
- 제22항에 있어서, 에틸렌을 기체 상태에서 액체 상태로 응축시켜 미생물 배양물로부터 생산되는 에틸렌의 양을 제거하는 단계를 추가로 포함하거나, 회수된 에틸렌의 양이 약 0.5 ml 내지 약 10 ml/리터/h인, 방법.
- 개선된 알파-케토글루타레이트(AKG) 생산 능력을 갖는 재조합 미생물로서,
재조합 미생물이 비-천연의 포스포에놀피루베이트 신타아제(PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고,
재조합 미생물에 의해 생산되는 PEP 단백질의 양이 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많거나; 또는
재조합 미생물이 비-천연의 이소시트레이트 데하이드로게나아제(IDH) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 20과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 IDH 단백질을 발현하고,
재조합 미생물에 의해 생산되는 IDH 단백질의 양이 비-천연의 IDH 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고;
재조합 미생물에 의해 생산되는 AKG의 양이 대조군 미생물에 대해 생산되는 양보다 더 많은, 개선된 AKG 생산 능력을 갖는 재조합 미생물. - 제30항에 있어서, 재조합 미생물이 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 17과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 시트레이트 신타아제 단백질을 발현하고, 재조합 미생물에 의해 생산되는 시트레이트 신타아제 단백질의 양이 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
- 제30항에 있어서, 재조합 미생물이 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 발현 뉴클레오타이드 서열에서 결실을 포함하고, 재조합 미생물에 의해 생산되는 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 단백질의 양이 상기 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적은, 재조합 미생물.
- 제30항에 있어서, 재조합 미생물이 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함하는, 재조합 미생물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962942895P | 2019-12-03 | 2019-12-03 | |
US62/942,895 | 2019-12-03 | ||
PCT/US2020/062938 WO2021113396A1 (en) | 2019-12-03 | 2020-12-02 | Methods and compositions for producing ethylene from recombinant microorganisms |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220110249A true KR20220110249A (ko) | 2022-08-05 |
Family
ID=76221147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227022359A KR20220110249A (ko) | 2019-12-03 | 2020-12-02 | 재조합 미생물로부터 에틸렌을 생산하기 위한 방법 및 조성물 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220411829A1 (ko) |
EP (1) | EP4069857A4 (ko) |
JP (1) | JP2023505443A (ko) |
KR (1) | KR20220110249A (ko) |
CN (1) | CN115052990A (ko) |
AU (1) | AU2020395163A1 (ko) |
BR (1) | BR112022010689A2 (ko) |
CA (1) | CA3160540A1 (ko) |
CO (1) | CO2022008803A2 (ko) |
MX (1) | MX2022006610A (ko) |
WO (1) | WO2021113396A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230407271A1 (en) * | 2022-06-21 | 2023-12-21 | Lanzatech, Inc. | Microorganisms and methods for the continuous production of ethylene from c1-substrates |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2769321A (en) * | 1952-08-07 | 1956-11-06 | Kellogg M W Co | Separation of ethylene from a gaseous mixture |
JPH0698776A (ja) * | 1992-09-18 | 1994-04-12 | Hideo Fukuda | 細菌のエチレン生成酵素をコードするdna断片、及びその用途 |
MX2010006679A (es) * | 2007-12-17 | 2010-11-30 | Univ Amsterdam | Reduccion de co2 inducida con luz para compuestos orgánicos que sirven como combustibles o como semiproductos industriales por un autotrofo que contiene un casete genico fermentador. |
EP2723872A1 (en) * | 2011-06-24 | 2014-04-30 | Algenol Biofuels Inc. | Genetically enhanced cyanobacteria lacking functional genes conferring biocide resistance for the production of chemical compounds |
US20130203136A1 (en) * | 2011-07-27 | 2013-08-08 | Alliance For Sustainable Energy, Llc | Biological production of organic compounds |
KR20150131880A (ko) * | 2014-05-16 | 2015-11-25 | 삼성전자주식회사 | 숙신산 생산성이 향상된 미생물 및 이를 이용한 숙신산 생산방법 |
WO2018009770A1 (en) * | 2016-07-07 | 2018-01-11 | Cemvita Technologies Llc. | Cognitive cell with coded chemicals for generating outputs from environmental inputs and method of using same |
-
2020
- 2020-12-02 US US17/756,400 patent/US20220411829A1/en active Pending
- 2020-12-02 KR KR1020227022359A patent/KR20220110249A/ko unknown
- 2020-12-02 MX MX2022006610A patent/MX2022006610A/es unknown
- 2020-12-02 BR BR112022010689A patent/BR112022010689A2/pt unknown
- 2020-12-02 CA CA3160540A patent/CA3160540A1/en active Pending
- 2020-12-02 EP EP20895365.3A patent/EP4069857A4/en active Pending
- 2020-12-02 JP JP2022532714A patent/JP2023505443A/ja active Pending
- 2020-12-02 WO PCT/US2020/062938 patent/WO2021113396A1/en unknown
- 2020-12-02 CN CN202080095327.5A patent/CN115052990A/zh active Pending
- 2020-12-02 AU AU2020395163A patent/AU2020395163A1/en active Pending
-
2022
- 2022-06-24 CO CONC2022/0008803A patent/CO2022008803A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
CN115052990A (zh) | 2022-09-13 |
WO2021113396A1 (en) | 2021-06-10 |
US20220411829A1 (en) | 2022-12-29 |
MX2022006610A (es) | 2022-10-07 |
JP2023505443A (ja) | 2023-02-09 |
EP4069857A4 (en) | 2024-03-13 |
CO2022008803A2 (es) | 2022-06-30 |
AU2020395163A1 (en) | 2022-06-16 |
EP4069857A1 (en) | 2022-10-12 |
BR112022010689A2 (pt) | 2022-08-23 |
CA3160540A1 (en) | 2021-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106701810B (zh) | 一种谷氨酸棒状杆菌的基因编辑系统及其应用 | |
WO2014066670A1 (en) | Engineering of multi-carbon substrate utilization pathways in methanotrophic bacteria | |
KR102257842B1 (ko) | 신규한 d-알라닌-d-알라닌 리가아제 a 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
KR20220110249A (ko) | 재조합 미생물로부터 에틸렌을 생산하기 위한 방법 및 조성물 | |
KR20150131880A (ko) | 숙신산 생산성이 향상된 미생물 및 이를 이용한 숙신산 생산방법 | |
KR20130080944A (ko) | 퀴놀린산을 생산하는 재조합 미생물 및 이를 이용한 퀴놀린산의 생산 방법 | |
KR20210015881A (ko) | 메타크릴레이트 제조 방법 | |
US9040264B2 (en) | Recombinant cyanobacterium expressing a transcription factor domain protein | |
KR101922113B1 (ko) | 패오닥틸럼 트리코누튬 유래 피루브산 전달효소 | |
Asayama | Regulatory system for light-responsive gene expression in photosynthesizing bacteria: cis-elements and trans-acting factors in transcription and post-transcription | |
KR102254635B1 (ko) | 신규한 글루코사민-6-포스페이트 디아미나제 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
CN115087734B (zh) | 新型膦酰基乙酸酯水解酶变体及使用其生产xmp或gmp的方法 | |
KR102254633B1 (ko) | 신규한 3d-(3,5/4)-트리하이드록시사이클로헥세인-1,2-다이온 아실하이드롤라아제 변이체 및 이를 이용한 imp 생산 방법 | |
KR102266231B1 (ko) | 신규한 mfs 트랜스포터 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
KR101987282B1 (ko) | 클라미도모나스 레인하드티 유래 rhp1 유전자를 이용한 바이오매스가 증가된 형질전환 난노클로롭시스 살리나의 제조 방법 | |
KR102254634B1 (ko) | 신규한 포름아미도피리미딘-dna 글리코실라제 변이체 및 이를 이용한 imp 생산 방법 | |
KR102254630B1 (ko) | 신규한 셀레니드, 물 디키나제 변이체 및 이를 이용한 imp 생산 방법 | |
KR102257841B1 (ko) | 신규한 피토엔 신타제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102254631B1 (ko) | 신규한 펩타이드 메티오닌 설폭사이드 환원효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102254632B1 (ko) | 신규한 피토엔 탈포화효소 변이체 및 이를 이용한 imp 생산 방법 | |
CN101528928A (zh) | 编码降解长链正烷烃的酶的核酸分子 | |
CN113950525B (zh) | 新型核糖核酸酶p变体及使用其生产l-谷氨酸的方法 | |
KR20190001426A (ko) | 당근 Hsp17.7 유전자를 포함하는 에스케리키아 속 미생물을 이용하여 산물을 생산하는 방법 | |
KR102525074B1 (ko) | 신규한 시트레이트 신타아제 변이체 및 이를 이용한 o-아세틸-l-호모세린 또는 l-메티오닌 생산 방법 | |
RU2814875C1 (ru) | Способ получения L-триптофана посредством усиления активности префенатдегидратазы |