KR20140019848A - 면역원성 조성물 - Google Patents
면역원성 조성물 Download PDFInfo
- Publication number
- KR20140019848A KR20140019848A KR1020137034795A KR20137034795A KR20140019848A KR 20140019848 A KR20140019848 A KR 20140019848A KR 1020137034795 A KR1020137034795 A KR 1020137034795A KR 20137034795 A KR20137034795 A KR 20137034795A KR 20140019848 A KR20140019848 A KR 20140019848A
- Authority
- KR
- South Korea
- Prior art keywords
- asn
- gly
- ile
- tyr
- asp
- Prior art date
Links
- 239000000203 mixture Substances 0.000 title claims description 47
- 230000002163 immunogen Effects 0.000 title claims description 46
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 169
- 229920001184 polypeptide Polymers 0.000 claims abstract description 160
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 160
- 239000012634 fragment Substances 0.000 claims abstract description 135
- 101710084578 Short neurotoxin 1 Proteins 0.000 claims abstract description 100
- 101710182532 Toxin a Proteins 0.000 claims abstract description 100
- 101710182223 Toxin B Proteins 0.000 claims abstract description 77
- 241000193163 Clostridioides difficile Species 0.000 claims abstract description 70
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 30
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 30
- 150000001413 amino acids Chemical class 0.000 claims description 206
- 238000000034 method Methods 0.000 claims description 27
- 229960005486 vaccine Drugs 0.000 claims description 27
- 108091033319 polynucleotide Proteins 0.000 claims description 26
- 102000040430 polynucleotide Human genes 0.000 claims description 26
- 239000002157 polynucleotide Substances 0.000 claims description 25
- 241000588724 Escherichia coli Species 0.000 claims description 15
- 108091007433 antigens Proteins 0.000 claims description 14
- 102000036639 antigens Human genes 0.000 claims description 14
- 230000028993 immune response Effects 0.000 claims description 13
- 238000011282 treatment Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 13
- 239000000427 antigen Substances 0.000 claims description 11
- 201000010099 disease Diseases 0.000 claims description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 11
- 230000001681 protective effect Effects 0.000 claims description 11
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 claims description 9
- 230000002265 prevention Effects 0.000 claims description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 8
- 230000001939 inductive effect Effects 0.000 claims description 8
- 241000894006 Bacteria Species 0.000 claims description 7
- 239000002671 adjuvant Substances 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 241000606768 Haemophilus influenzae Species 0.000 claims description 5
- 239000003814 drug Substances 0.000 claims description 5
- 239000004471 Glycine Substances 0.000 claims description 4
- 241000191963 Staphylococcus epidermidis Species 0.000 claims description 4
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 4
- 241000588650 Neisseria meningitidis Species 0.000 claims description 3
- 206010013023 diphtheria Diseases 0.000 claims description 3
- 230000005847 immunogenicity Effects 0.000 claims description 3
- 101710169972 Menin Proteins 0.000 claims description 2
- 102100030550 Menin Human genes 0.000 claims description 2
- 201000005702 Pertussis Diseases 0.000 claims description 2
- 206010043376 Tetanus Diseases 0.000 claims description 2
- 230000036039 immunity Effects 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 abstract description 44
- 102000004169 proteins and genes Human genes 0.000 abstract description 37
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 230
- 235000001014 amino acid Nutrition 0.000 description 172
- 108010061238 threonyl-glycine Proteins 0.000 description 107
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 100
- 108010047857 aspartylglycine Proteins 0.000 description 79
- 230000004927 fusion Effects 0.000 description 72
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 69
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 59
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 53
- 108010037850 glycylvaline Proteins 0.000 description 53
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 47
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 47
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 47
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 42
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 40
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 40
- 239000003053 toxin Substances 0.000 description 37
- 231100000765 toxin Toxicity 0.000 description 37
- 108700012359 toxins Proteins 0.000 description 37
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 36
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 36
- 108010087924 alanylproline Proteins 0.000 description 35
- 235000018102 proteins Nutrition 0.000 description 34
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 33
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 32
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 32
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 31
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 31
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 31
- 108010054155 lysyllysine Proteins 0.000 description 31
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 30
- PYFHPYDQHCEVIT-KBPBESRZSA-N Gly-Trp-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O PYFHPYDQHCEVIT-KBPBESRZSA-N 0.000 description 30
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 30
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 30
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 30
- 210000004027 cell Anatomy 0.000 description 30
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 30
- 108010010147 glycylglutamine Proteins 0.000 description 30
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 29
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 29
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 29
- 108010064235 lysylglycine Proteins 0.000 description 29
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 28
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 28
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 28
- 210000004899 c-terminal region Anatomy 0.000 description 28
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 27
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 27
- 108010038633 aspartylglutamate Proteins 0.000 description 26
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 26
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 26
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 25
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 24
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 24
- 108010012581 phenylalanylglutamate Proteins 0.000 description 24
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 23
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 23
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 23
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 23
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 23
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 23
- 108010015792 glycyllysine Proteins 0.000 description 23
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 22
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 22
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 22
- 238000009826 distribution Methods 0.000 description 22
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 21
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 21
- 108010050848 glycylleucine Proteins 0.000 description 21
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 20
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 20
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 20
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 20
- 241000699670 Mus sp. Species 0.000 description 20
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 20
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 19
- WHKLDLQHSYAVGU-ACRUOGEOSA-N His-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WHKLDLQHSYAVGU-ACRUOGEOSA-N 0.000 description 19
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 19
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 19
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 19
- 108010081551 glycylphenylalanine Proteins 0.000 description 19
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 18
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 18
- 108010003137 tyrosyltyrosine Proteins 0.000 description 18
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 17
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 17
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 17
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 17
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 17
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 17
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 17
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 16
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 16
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 16
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 16
- FRMKIPSIZSFTTE-HJOGWXRNSA-N Phe-Tyr-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FRMKIPSIZSFTTE-HJOGWXRNSA-N 0.000 description 16
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 16
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 16
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 16
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 16
- 108010092854 aspartyllysine Proteins 0.000 description 16
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 15
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 15
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 15
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 15
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 15
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 15
- 108010025306 histidylleucine Proteins 0.000 description 15
- 108010092114 histidylphenylalanine Proteins 0.000 description 15
- 239000011780 sodium chloride Substances 0.000 description 15
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 14
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 14
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 14
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 14
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 14
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 14
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 14
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 14
- FSVCELGFZIQNCK-UHFFFAOYSA-N N,N-bis(2-hydroxyethyl)glycine Chemical compound OCCN(CCO)CC(O)=O FSVCELGFZIQNCK-UHFFFAOYSA-N 0.000 description 14
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 14
- 239000007998 bicine buffer Substances 0.000 description 14
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 14
- 108010038320 lysylphenylalanine Proteins 0.000 description 14
- 210000002966 serum Anatomy 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 14
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 13
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 13
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 13
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 13
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 13
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 13
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 13
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 13
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 13
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 13
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 13
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 13
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 13
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 13
- 108700004896 tripeptide FEG Proteins 0.000 description 13
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 12
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 12
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 12
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 12
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 12
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 12
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 12
- 238000002965 ELISA Methods 0.000 description 12
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 12
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 12
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 12
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 12
- 241000880493 Leptailurus serval Species 0.000 description 12
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 12
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 12
- 241000124008 Mammalia Species 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 12
- YRKFKTQRVBJYLT-CQDKDKBSSA-N Phe-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 YRKFKTQRVBJYLT-CQDKDKBSSA-N 0.000 description 12
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 12
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 12
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 12
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 12
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 12
- 239000000872 buffer Substances 0.000 description 12
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 12
- 108010076441 Ala-His-His Proteins 0.000 description 11
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 11
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 11
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 11
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 11
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 11
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 11
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 11
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 11
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 11
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 11
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 11
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 11
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 11
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 11
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 11
- 241000699666 Mus <mouse, genus> Species 0.000 description 11
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 11
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 11
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 11
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 11
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 11
- 230000005764 inhibitory process Effects 0.000 description 11
- 108010051242 phenylalanylserine Proteins 0.000 description 11
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 10
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 10
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 10
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 10
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 10
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 10
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 10
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 10
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 10
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 10
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 10
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 10
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 10
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 10
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 10
- MHQXIBRPDKXDGZ-ZFWWWQNUSA-N Met-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MHQXIBRPDKXDGZ-ZFWWWQNUSA-N 0.000 description 10
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 10
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 10
- -1 SEQ ID NO: 2 amino acids Chemical class 0.000 description 10
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 10
- VUSAEKOXGNEYNE-PBCZWWQYSA-N Thr-His-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VUSAEKOXGNEYNE-PBCZWWQYSA-N 0.000 description 10
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 10
- 238000013461 design Methods 0.000 description 10
- 238000002211 ultraviolet spectrum Methods 0.000 description 10
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 9
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 9
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 9
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 9
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 9
- SRILZRSXIKRGBF-HRCADAONSA-N Phe-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N SRILZRSXIKRGBF-HRCADAONSA-N 0.000 description 9
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 9
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 9
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 9
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 125000003275 alpha amino acid group Chemical group 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 230000003053 immunization Effects 0.000 description 9
- 108010034529 leucyl-lysine Proteins 0.000 description 9
- 108010017391 lysylvaline Proteins 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- 108010009962 valyltyrosine Proteins 0.000 description 9
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 8
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 8
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 8
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 8
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 8
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 8
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 8
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 8
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 8
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 8
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 8
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 8
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 8
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 8
- 108010087823 glycyltyrosine Proteins 0.000 description 8
- 238000002649 immunization Methods 0.000 description 8
- 108010009298 lysylglutamic acid Proteins 0.000 description 8
- 238000004062 sedimentation Methods 0.000 description 8
- XAGIMRPOEJSYER-CIUDSAMLSA-N Ala-Cys-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XAGIMRPOEJSYER-CIUDSAMLSA-N 0.000 description 7
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 7
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 7
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 7
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 7
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 7
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 7
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 7
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 7
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 7
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 7
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 7
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 7
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 7
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 7
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 7
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 7
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 7
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 7
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 7
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 7
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 7
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 7
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 7
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 7
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 7
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 7
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 7
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 7
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 7
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 7
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 7
- GRKPXCKLOOUDFG-UFYCRDLUSA-N Met-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 GRKPXCKLOOUDFG-UFYCRDLUSA-N 0.000 description 7
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 7
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 7
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 7
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 7
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 7
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 7
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 7
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 7
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 7
- 230000035931 haemagglutination Effects 0.000 description 7
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 6
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 6
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 6
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 6
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 6
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 6
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 6
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 6
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 6
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 6
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 6
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 6
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 6
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 6
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 6
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 6
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 6
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 6
- MRVZCDSYLJXKKX-ACRUOGEOSA-N His-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N MRVZCDSYLJXKKX-ACRUOGEOSA-N 0.000 description 6
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 6
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 6
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 6
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 6
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 6
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 6
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 6
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 6
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 6
- 101710150115 Sensory rhodopsin-2 Proteins 0.000 description 6
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 6
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 6
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 6
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 6
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 6
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 6
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 6
- PHKQVWWHRYUCJL-HJOGWXRNSA-N Tyr-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PHKQVWWHRYUCJL-HJOGWXRNSA-N 0.000 description 6
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 6
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 6
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 238000010790 dilution Methods 0.000 description 6
- 239000012895 dilution Substances 0.000 description 6
- 108010084389 glycyltryptophan Proteins 0.000 description 6
- 238000011068 loading method Methods 0.000 description 6
- 108010003700 lysyl aspartic acid Proteins 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- 239000008188 pellet Substances 0.000 description 6
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 5
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 5
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 5
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 5
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 5
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 5
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 5
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 5
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 5
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 5
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 5
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 5
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 5
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 5
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 5
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 5
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 5
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 5
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 5
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 5
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 5
- 208000037384 Clostridium Infections Diseases 0.000 description 5
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 5
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 5
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 5
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 5
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 5
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 5
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 5
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 5
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 5
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 5
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 5
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 5
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 5
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 5
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 5
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 5
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 5
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 5
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 5
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 5
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 5
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 5
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 5
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 5
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 5
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 5
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 5
- KRCPXGSWDOGHAM-XIRDDKMYSA-N Trp-Lys-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O KRCPXGSWDOGHAM-XIRDDKMYSA-N 0.000 description 5
- YRBHLWWGSSQICE-IHRRRGAJSA-N Tyr-Asp-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O YRBHLWWGSSQICE-IHRRRGAJSA-N 0.000 description 5
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 5
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 5
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 5
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 5
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 5
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 5
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 5
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 5
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 5
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 5
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 5
- 108010070944 alanylhistidine Proteins 0.000 description 5
- 108010077245 asparaginyl-proline Proteins 0.000 description 5
- 238000001142 circular dichroism spectrum Methods 0.000 description 5
- 238000002784 cytotoxicity assay Methods 0.000 description 5
- 231100000263 cytotoxicity test Toxicity 0.000 description 5
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 5
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 239000002953 phosphate buffered saline Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 108010051110 tyrosyl-lysine Proteins 0.000 description 5
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 4
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 4
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 4
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 4
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 4
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 4
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 4
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 4
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 4
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 4
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 206010009657 Clostridium difficile colitis Diseases 0.000 description 4
- 206010054236 Clostridium difficile infection Diseases 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 4
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 4
- HPBKQFJXDUVNQV-FHWLQOOXSA-N Gln-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O HPBKQFJXDUVNQV-FHWLQOOXSA-N 0.000 description 4
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 4
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 4
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 4
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 4
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 4
- CTJHHEQNUNIYNN-SRVKXCTJSA-N His-His-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O CTJHHEQNUNIYNN-SRVKXCTJSA-N 0.000 description 4
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 4
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 4
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 4
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 4
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 4
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 4
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 4
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 4
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 4
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 4
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 4
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 4
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 4
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 4
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 4
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 4
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 4
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 4
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 4
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 4
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 4
- UBTBGUDNDFZLGP-SRVKXCTJSA-N Val-Arg-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UBTBGUDNDFZLGP-SRVKXCTJSA-N 0.000 description 4
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 4
- 101100113494 Vibrio cholerae serotype O1 (strain ATCC 39315 / El Tor Inaba N16961) ctxB gene Proteins 0.000 description 4
- 108010070783 alanyltyrosine Proteins 0.000 description 4
- 210000004900 c-terminal fragment Anatomy 0.000 description 4
- 229910002091 carbon monoxide Inorganic materials 0.000 description 4
- 238000002983 circular dichroism Methods 0.000 description 4
- 231100000433 cytotoxic Toxicity 0.000 description 4
- 230000001472 cytotoxic effect Effects 0.000 description 4
- 210000003743 erythrocyte Anatomy 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 108010068488 methionylphenylalanine Proteins 0.000 description 4
- 230000010287 polarization Effects 0.000 description 4
- 238000003756 stirring Methods 0.000 description 4
- 101150089436 tcdB gene Proteins 0.000 description 4
- 238000005199 ultracentrifugation Methods 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 3
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 3
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 3
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 3
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 3
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 3
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 3
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 3
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 3
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 3
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 3
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 3
- XSXVLWBWIPKUSN-UHFFFAOYSA-N Asp-Leu-Glu-Asp Chemical compound OC(=O)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(O)=O)C(O)=O XSXVLWBWIPKUSN-UHFFFAOYSA-N 0.000 description 3
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 3
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 3
- 102100021935 C-C motif chemokine 26 Human genes 0.000 description 3
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 3
- CIVXDCMSSFGWAL-YUMQZZPRSA-N Cys-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N CIVXDCMSSFGWAL-YUMQZZPRSA-N 0.000 description 3
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 3
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 3
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 3
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 3
- QBLCUWAGTGRXAY-UHFFFAOYSA-N Glu-Glu-Tyr-Tyr Chemical compound C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)N)CC1=CC=C(O)C=C1 QBLCUWAGTGRXAY-UHFFFAOYSA-N 0.000 description 3
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 3
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 3
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 3
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 3
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 3
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 3
- WTUSRDZLLWGYAT-KCTSRDHCSA-N Gly-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN WTUSRDZLLWGYAT-KCTSRDHCSA-N 0.000 description 3
- 101000897493 Homo sapiens C-C motif chemokine 26 Proteins 0.000 description 3
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 3
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 3
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 3
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 3
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 3
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 3
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 3
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 3
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 3
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 3
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 3
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 3
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 3
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 3
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 3
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 3
- GPVLSVCBKUCEBI-KKUMJFAQSA-N Met-Gln-Phe Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GPVLSVCBKUCEBI-KKUMJFAQSA-N 0.000 description 3
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 3
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 3
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 3
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 3
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 3
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 3
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 3
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 3
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 3
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 3
- 101710150104 Sensory rhodopsin-1 Proteins 0.000 description 3
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 3
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 3
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 3
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 3
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 3
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 3
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 3
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 3
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 3
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 3
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 3
- NXAPHBHZCMQORW-FDARSICLSA-N Trp-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NXAPHBHZCMQORW-FDARSICLSA-N 0.000 description 3
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 3
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 3
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 3
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 3
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 3
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 3
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 3
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 3
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 108010036533 arginylvaline Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 3
- 238000010211 hemagglutination inhibition (HI) assay Methods 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 3
- 108010085203 methionylmethionine Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- GEYOCULIXLDCMW-UHFFFAOYSA-N 1,2-phenylenediamine Chemical compound NC1=CC=CC=C1N GEYOCULIXLDCMW-UHFFFAOYSA-N 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 2
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 2
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 2
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 2
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 2
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 2
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 2
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 2
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 2
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 2
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 2
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 2
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 2
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 2
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 2
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- 108010077805 Bacterial Proteins Proteins 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 241000700199 Cavia porcellus Species 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 2
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 2
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 2
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 2
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 2
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 2
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 2
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- UERORLSAFUHDGU-AVGNSLFASA-N Glu-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UERORLSAFUHDGU-AVGNSLFASA-N 0.000 description 2
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 2
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 2
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 2
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 2
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 2
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 2
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- VYMGAXSNYUFVCK-GUBZILKMSA-N His-Gln-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N VYMGAXSNYUFVCK-GUBZILKMSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 2
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 2
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 2
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 2
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 2
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 2
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 2
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 2
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 2
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical class [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 2
- 108050004171 Lon proteases Proteins 0.000 description 2
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 2
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 2
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 2
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 2
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 2
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 2
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 2
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 2
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 2
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 2
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 2
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 2
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 2
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 2
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 2
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 2
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 2
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 2
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 2
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 2
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 2
- 241000589886 Treponema Species 0.000 description 2
- WNZRNOGHEONFMS-PXDAIIFMSA-N Trp-Ile-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WNZRNOGHEONFMS-PXDAIIFMSA-N 0.000 description 2
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 229940009444 amphotericin Drugs 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 150000002333 glycines Chemical class 0.000 description 2
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 2
- 101150023479 hsdS gene Proteins 0.000 description 2
- 230000002480 immunoprotective effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 230000001320 lysogenic effect Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 101150093139 ompT gene Proteins 0.000 description 2
- 108010003052 omptin outer membrane protease Proteins 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 238000002731 protein assay Methods 0.000 description 2
- 101150079601 recA gene Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 239000013074 reference sample Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 1
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- QNRATNLHPGXHMA-XZHTYLCXSA-N (r)-(6-ethoxyquinolin-4-yl)-[(2s,4s,5r)-5-ethyl-1-azabicyclo[2.2.2]octan-2-yl]methanol;hydrochloride Chemical compound Cl.C([C@H]([C@H](C1)CC)C2)CN1[C@@H]2[C@H](O)C1=CC=NC2=CC=C(OCC)C=C21 QNRATNLHPGXHMA-XZHTYLCXSA-N 0.000 description 1
- UZDMJOILBYFRMP-UHFFFAOYSA-N 2-[2-[2-[(2-amino-3-methylpentanoyl)amino]propanoylamino]propanoylamino]-3-methylpentanoic acid Chemical compound CCC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(=O)NC(C(O)=O)C(C)CC UZDMJOILBYFRMP-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241000606750 Actinobacillus Species 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- DPNHSNLIULPOBH-GUBZILKMSA-N Arg-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DPNHSNLIULPOBH-GUBZILKMSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 1
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 1
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 1
- SJPZTWAYTJPPBI-GUBZILKMSA-N Asn-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SJPZTWAYTJPPBI-GUBZILKMSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- IHUJUZBUOFTIOB-QEJZJMRPSA-N Asn-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N IHUJUZBUOFTIOB-QEJZJMRPSA-N 0.000 description 1
- KWQPAXYXVMHJJR-AVGNSLFASA-N Asn-Gln-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KWQPAXYXVMHJJR-AVGNSLFASA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 1
- YGHCVNQOZZMHRZ-DJFWLOJKSA-N Asn-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N YGHCVNQOZZMHRZ-DJFWLOJKSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- KMCRKVOLRCOMBG-DJFWLOJKSA-N Asn-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KMCRKVOLRCOMBG-DJFWLOJKSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 1
- RLHANKIRBONJBK-IHRRRGAJSA-N Asn-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N RLHANKIRBONJBK-IHRRRGAJSA-N 0.000 description 1
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- RWHHSFSWKFBTCF-KKUMJFAQSA-N Asp-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N RWHHSFSWKFBTCF-KKUMJFAQSA-N 0.000 description 1
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 1
- 231100000699 Bacterial toxin Toxicity 0.000 description 1
- 241000588807 Bordetella Species 0.000 description 1
- 241000588832 Bordetella pertussis Species 0.000 description 1
- 241000589562 Brucella Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical class [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 101710168515 Cell surface glycoprotein Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 1
- SQJSYLDKQBZQTG-FXQIFTODSA-N Cys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N SQJSYLDKQBZQTG-FXQIFTODSA-N 0.000 description 1
- UWXFFVQPAMBETM-ZLUOBGJFSA-N Cys-Asp-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UWXFFVQPAMBETM-ZLUOBGJFSA-N 0.000 description 1
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 1
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 239000006145 Eagle's minimal essential medium Substances 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- RBSKVTZUFMIWFU-XEGUGMAKSA-N Gln-Trp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O RBSKVTZUFMIWFU-XEGUGMAKSA-N 0.000 description 1
- WPJDPEOQUIXXOY-AVGNSLFASA-N Gln-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WPJDPEOQUIXXOY-AVGNSLFASA-N 0.000 description 1
- WIMVKDYAKRAUCG-IHRRRGAJSA-N Gln-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WIMVKDYAKRAUCG-IHRRRGAJSA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 1
- BIHMNDPWRUROFZ-JYJNAYRXSA-N Glu-His-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BIHMNDPWRUROFZ-JYJNAYRXSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- BHXSLRDWXIFKTP-SRVKXCTJSA-N Glu-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BHXSLRDWXIFKTP-SRVKXCTJSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 1
- PAZQYODKOZHXGA-SRVKXCTJSA-N Glu-Pro-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O PAZQYODKOZHXGA-SRVKXCTJSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- XOEKMEAOMXMURD-JYJNAYRXSA-N Glu-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O XOEKMEAOMXMURD-JYJNAYRXSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- JNGJGFMFXREJNF-KBPBESRZSA-N Gly-Glu-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JNGJGFMFXREJNF-KBPBESRZSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- RUDRIZRGOLQSMX-IUCAKERBSA-N Gly-Met-Met Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O RUDRIZRGOLQSMX-IUCAKERBSA-N 0.000 description 1
- MDKCBHZLQJZOCJ-STQMWFEESA-N Gly-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)CN MDKCBHZLQJZOCJ-STQMWFEESA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 1
- WZOGEMJIZBNFBK-CIUDSAMLSA-N His-Asp-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WZOGEMJIZBNFBK-CIUDSAMLSA-N 0.000 description 1
- LMMPTUVWHCFTOT-GARJFASQSA-N His-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O LMMPTUVWHCFTOT-GARJFASQSA-N 0.000 description 1
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- LJUIEESLIAZSFR-SRVKXCTJSA-N His-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LJUIEESLIAZSFR-SRVKXCTJSA-N 0.000 description 1
- SGLXGEDPYJPGIQ-ACRUOGEOSA-N His-Phe-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N SGLXGEDPYJPGIQ-ACRUOGEOSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 1
- QHGBCRCMBCWMBJ-UHFFFAOYSA-N Ile-Glu-Ala-Lys Natural products CCC(C)C(N)C(=O)NC(CCC(O)=O)C(=O)NC(C)C(=O)NC(C(O)=O)CCCCN QHGBCRCMBCWMBJ-UHFFFAOYSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 1
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- AYLAAGNJNVZDPY-CYDGBPFRSA-N Ile-Met-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N AYLAAGNJNVZDPY-CYDGBPFRSA-N 0.000 description 1
- FTUZWJVSNZMLPI-RVMXOQNASA-N Ile-Met-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N FTUZWJVSNZMLPI-RVMXOQNASA-N 0.000 description 1
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 1
- USXAYNCLFSUSBA-MGHWNKPDSA-N Ile-Phe-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N USXAYNCLFSUSBA-MGHWNKPDSA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 1
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- 206010022678 Intestinal infections Diseases 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- VHFFQUSNFFIZBT-CIUDSAMLSA-N Lys-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N VHFFQUSNFFIZBT-CIUDSAMLSA-N 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical class [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- ODFBIJXEWPWSAN-CYDGBPFRSA-N Met-Ile-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O ODFBIJXEWPWSAN-CYDGBPFRSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- YYEIFXZOBZVDPH-DCAQKATOSA-N Met-Lys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O YYEIFXZOBZVDPH-DCAQKATOSA-N 0.000 description 1
- AOFZWWDTTJLHOU-ULQDDVLXSA-N Met-Lys-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AOFZWWDTTJLHOU-ULQDDVLXSA-N 0.000 description 1
- WYDFQSJOARJAMM-GUBZILKMSA-N Met-Pro-Asp Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WYDFQSJOARJAMM-GUBZILKMSA-N 0.000 description 1
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 241000588621 Moraxella Species 0.000 description 1
- 241000588655 Moraxella catarrhalis Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- YZJKNDCEPDDIDA-BZSNNMDCSA-N Phe-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 YZJKNDCEPDDIDA-BZSNNMDCSA-N 0.000 description 1
- RGZYXNFHYRFNNS-MXAVVETBSA-N Phe-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGZYXNFHYRFNNS-MXAVVETBSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- ZIQQNOXKEFDPBE-BZSNNMDCSA-N Phe-Lys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N ZIQQNOXKEFDPBE-BZSNNMDCSA-N 0.000 description 1
- KLXQWABNAWDRAY-ACRUOGEOSA-N Phe-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 KLXQWABNAWDRAY-ACRUOGEOSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- YTGGLKWSVIRECD-JBACZVJFSA-N Phe-Trp-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 YTGGLKWSVIRECD-JBACZVJFSA-N 0.000 description 1
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- XBCOOBCTVMMQSC-BVSLBCMMSA-N Phe-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XBCOOBCTVMMQSC-BVSLBCMMSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- DYJTXTCEXMCPBF-UFYCRDLUSA-N Pro-Tyr-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O DYJTXTCEXMCPBF-UFYCRDLUSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 229940096437 Protein S Drugs 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 108010025216 RVF peptide Proteins 0.000 description 1
- 101710099182 S-layer protein Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 1
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 1
- OSFZCEQJLWCIBG-BZSNNMDCSA-N Ser-Tyr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSFZCEQJLWCIBG-BZSNNMDCSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- HRKOLWXWQSDMSK-XIRDDKMYSA-N Trp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HRKOLWXWQSDMSK-XIRDDKMYSA-N 0.000 description 1
- AZBIIKDSDLVJAK-VHWLVUOQSA-N Trp-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N AZBIIKDSDLVJAK-VHWLVUOQSA-N 0.000 description 1
- BYSKNUASOAGJSS-NQCBNZPSSA-N Trp-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BYSKNUASOAGJSS-NQCBNZPSSA-N 0.000 description 1
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 1
- WKQNLTQSCYXKQK-VFAJRCTISA-N Trp-Lys-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WKQNLTQSCYXKQK-VFAJRCTISA-N 0.000 description 1
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 1
- IYHRKILQAQWODS-VJBMBRPKSA-N Trp-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IYHRKILQAQWODS-VJBMBRPKSA-N 0.000 description 1
- FHHYVSCGOMPLLO-IHPCNDPISA-N Trp-Tyr-Asp Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 FHHYVSCGOMPLLO-IHPCNDPISA-N 0.000 description 1
- RWTFCAMQLFNPTK-UMPQAUOISA-N Trp-Val-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 RWTFCAMQLFNPTK-UMPQAUOISA-N 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- ZAGPDPNPWYPEIR-SRVKXCTJSA-N Tyr-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ZAGPDPNPWYPEIR-SRVKXCTJSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- AZZLDIDWPZLCCW-ZEWNOJEFSA-N Tyr-Ile-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O AZZLDIDWPZLCCW-ZEWNOJEFSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- FJBCEFPCVPHPPM-STECZYCISA-N Tyr-Ile-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O FJBCEFPCVPHPPM-STECZYCISA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 1
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 1
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 1
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 1
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- JPPXDMBGXJBTIB-ULQDDVLXSA-N Val-His-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N JPPXDMBGXJBTIB-ULQDDVLXSA-N 0.000 description 1
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 1
- SVLAAUGFIHSJPK-JYJNAYRXSA-N Val-Trp-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N SVLAAUGFIHSJPK-JYJNAYRXSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- 108010059993 Vancomycin Proteins 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical class [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229940037003 alum Drugs 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical class O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000013103 analytical ultracentrifugation Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 230000001147 anti-toxic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000000688 bacterial toxin Substances 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000978 circular dichroism spectroscopy Methods 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 239000002619 cytotoxin Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 229940009976 deoxycholate Drugs 0.000 description 1
- KXGVEGMKQFWNSR-LLQZFEROSA-N deoxycholic acid Chemical compound C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 KXGVEGMKQFWNSR-LLQZFEROSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 231100000174 enterotoxicity Toxicity 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- LBORZFICAPONTF-UHFFFAOYSA-N lithium;silane Chemical compound [Li].[SiH4] LBORZFICAPONTF-UHFFFAOYSA-N 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Chemical class 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 229960000282 metronidazole Drugs 0.000 description 1
- VAOCPAMSLUNLGC-UHFFFAOYSA-N metronidazole Chemical compound CC1=NC=C([N+]([O-])=O)N1CCO VAOCPAMSLUNLGC-UHFFFAOYSA-N 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 229920002627 poly(phosphazenes) Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 108010038196 saccharide-binding proteins Proteins 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 150000003668 tyrosines Chemical class 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 229960003165 vancomycin Drugs 0.000 description 1
- MYPYJXKWCTUITO-LYRMYLQWSA-N vancomycin Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=C2C=C3C=C1OC1=CC=C(C=C1Cl)[C@@H](O)[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@H]3C(=O)N[C@H]1C(=O)N[C@H](C(N[C@@H](C3=CC(O)=CC(O)=C3C=3C(O)=CC=C1C=3)C(O)=O)=O)[C@H](O)C1=CC=C(C(=C1)Cl)O2)=O)NC(=O)[C@@H](CC(C)C)NC)[C@H]1C[C@](C)(N)[C@H](O)[C@H](C)O1 MYPYJXKWCTUITO-LYRMYLQWSA-N 0.000 description 1
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 229910052725 zinc Chemical class 0.000 description 1
- 239000011701 zinc Chemical class 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/08—Clostridium, e.g. Clostridium tetani
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/04—Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/33—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Clostridium (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/12—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
- C07K16/1267—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria
- C07K16/1282—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria from Clostridium (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/575—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/55—Fusion polypeptide containing a fusion with a toxin, e.g. diphteria toxin
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 클로스트리듐 디피실레의 독소 A 및/또는 독소 B로부터의 단편을 포함하는 융합 단백질에 관한 것이며, 특히, 본 발명은 제1 단편 및 제2 단편을 포함하는 단백질에 관한 것이며, 여기서,
(v) 제1 단편이 독소 A 반복 도메인 단편이고;
(vi) 제2 단편이 독소 B 반복 도메인 단편이며;
(vii) 제1 단편이 제1 근위단을 갖고;
(viii) 제2 단편이 제2 근위단을 가지며;
제1 단편 및 제2 단편은 서로 인접하고, 폴리펩티드는 독소 A 또는 독소 B 또는 둘 모두를 중화시키는 항체를 유도한다. 본 발명은 추가로 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35의 단편 또는 변이체를 포함하는 조성물에 관한 것이다.
(v) 제1 단편이 독소 A 반복 도메인 단편이고;
(vi) 제2 단편이 독소 B 반복 도메인 단편이며;
(vii) 제1 단편이 제1 근위단을 갖고;
(viii) 제2 단편이 제2 근위단을 가지며;
제1 단편 및 제2 단편은 서로 인접하고, 폴리펩티드는 독소 A 또는 독소 B 또는 둘 모두를 중화시키는 항체를 유도한다. 본 발명은 추가로 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35의 단편 또는 변이체를 포함하는 조성물에 관한 것이다.
Description
기술 분야
본 발명은 클로스트리듐 디피실레(Clostridium difficile) 유래의 항원에 관한 것이다. 특히, 본 발명은 독소 A 및/또는 독소 B의 단편을 포함하는 재조합 단백질 항원에 관한 것이다. 또한, 본 발명은 이들 항원을 포함하는 면역원성 조성물 또는 백신, 및 예방 또는 치료에서의 본 발명의 백신 및 면역원성 조성물의 용도에 관한 것이다. 또한, 본 발명은 본 발명의 조성물을 사용한 면역화 방법 및 약제의 제조에서의 본 발명의 조성물의 용도에 관한 것이다.
배경
클로스트리듐 디피실레는 병원내 장 감염의 가장 중요한 원인이며, 인간의 가막성 대장염의 주요 원인이다(문헌[Bartlett et al Am . J. Clin . Nutr . 11 suppl:2521-6 (1980)]). 클로스트리듐 디피실레에 감염된 개체에 대한 전체 관련 사망률은 진단 3개월 내에 5.99%이며, 보다 높은 사망률이 고령과 관련이 있고, 80세 초과의 환자에서 13.5%인 것으로 계산되었다(문헌[karas et al Journal of Infection 561:1-9 (2010)]). 클로스트리듐 디피실레 감염에 대한 현행의 치료는 항생제(메트로니다졸 및 반코마이신)의 투여이나, 이들 항생제에 내성인 균주의 증거가 존재한다(문헌[Shah et al., Expert Rev. Anti Infect. Ther. 8(5), 555-564 (2010)]). 따라서, 클로스트리듐 디피실레에 대한 항체 및/또는 이에 대한 보호 면역 반응을 유도할 수 있는 면역원성 조성물이 필요하다.
간단한 요약
클로스트리듐 디피실레의 장독성(enterotoxicity)은 주로 2가지 독소, 독소 A 및 독소 B의 작용 때문이다. 이들은 둘 모두 강력한 세포독소이다(문헌[Lyerly et al Current Microbiology 21:29-32 (1990)]). 독소 A 및 독소 B의 C-말단 도메인은 반복 단위를 포함하며, 예를 들어, 독소 A의 C-말단 도메인은 연속 반복 단위로 구성되며(문헌[Dove et al Infect. Immun. 58:480-499 (1990)]), 이러한 이유로, C-말단 도메인은 '반복 도메인'으로 지칭될 수 있다. 이들 반복 부분은 문헌[Ho et al (PNAS 102:18373-18378 (2005))]에 기재된 바와 같이 짧은 반복부(short repeat, SR) 및 긴 반복부(long repeat, LR)로 분리될 수 있다.
독소 A 반복 도메인의 C 말단으로부터의 127-아미노산 단편의 구조가 결정되어 있다(문헌[Ho et al PNAS 102:18373-18378 (2005)]). 이러한 단편은 낮은 비율의 α-나선와 함께 주로 β-가닥으로 이루어진 β-솔레노이드-유사 폴드를 형성하였다.
독소 A의 단편, 특히, C-말단 도메인의 단편이 햄스터에서 보호 면역 반응을 야기할 수 있는 것이 입증되었다(문헌[Lyerly et al Current Microbiology 21:29-32 (1990)], WO96/12802호 및 WO00/61762호).
발현 동안 정확하게 폴딩되는 융합 단백질의 설계에 수반되는 어려움이 존재하는 것으로 알려져 있다. 본 발명의 폴리펩티드는 고유(native) β-솔레노이드-유사 구조가 유지되고, 마우스에서 독소 A 및 독소 B 둘 모두에 대한 면역 반응을 제공하는 것으로 보이는 융합 단백질이다.
본 발명의 제1 태양에서, 제1 단편 및 제2 단편을 포함하는 폴리펩티드가 제공되며, 여기서,
(i) 제1 단편은 독소 A 반복 도메인 단편이고;
(ii) 제2 단편은 독소 B 반복 도메인 단편이며;
(iii) 제1 단편은 제1 근위단을 갖고;
(iv) 제2 단편은 제2 근위단을 가지며;
폴리펩티드는 독소 A 또는 독소 B 또는 둘 모두를 중화시키는 항체를 유도한다.
본 발명의 제2 태양에서,
(i) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35;
(ii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35에 대하여 적어도 90%, 95%, 98%, 99% 또는 100% 유사성을 갖는 변이체; 또는
(iii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35의 적어도 250, 280, 300, 350, 380, 400, 430, 450, 480, 500, 530, 550, 580 또는 600개 아미노산의 단편을 포함하는 폴리펩티드가 제공된다.
본 발명의 제3 태양에서, 본 발명의 폴리펩티드를 엔코딩(encoding)하는 폴리뉴클레오티드가 제공된다.
본 발명의 제4 태양에서, 유도성 프로모터에 연결된 본 발명의 폴리뉴클레오티드를 포함하는 벡터가 제공된다.
본 발명의 제5 태양에서, 본 발명의 벡터 또는 본 발명의 폴리뉴클레오티드를 포함하는 숙주 세포가 제공된다.
본 발명의 제6 태양에서, 본 발명의 폴리펩티드 및 약제학적으로 허용가능한 부형제를 포함하는 면역원성 조성물이 제공된다.
본 발명의 제7 태양에서, 본 발명의 면역원성 조성물을 포함하는 백신이 제공된다.
본 발명의 제8 태양에서, 클로스트리듐 디피실레 질환의 치료 또는 예방에서의 본 발명의 면역원성 조성물 또는 본 발명의 백신의 용도가 제공된다.
본 발명의 제9 태양에서, 클로스트리듐 디피실레 질환의 예방 또는 치료용 약제의 제조에서의 본 발명의 면역원성 조성물 또는 본 발명의 백신의 용도가 제공된다.
본 발명의 제10 태양에서, 본 발명의 면역원성 조성물 또는 본 발명의 백신을 환자에게 투여하는 것을 포함하는 클로스트리듐 디피실레 질환의 예방 또는 치료 방법이 제공된다.
도면의 간단한 설명
도 1 - 본 발명의 폴리펩티드의 서열 목록.
도 2 - SR 반복부가 백색 사각형으로 나타나 있고, LR 박스가 흑색 사각형으로 나타나 있는 ToxA 및 ToxB의 C-말단 도메인의 그림 표현.
도 3 - 융합체 1에 사용되는 ToxA의 제3 SR VIII과 ToxB의 제4 SR II 사이의 접합부(junction)의 그림 표현.
도 4 - 융합체 2에 사용되는 ToxA의 제2 SR VIII과 ToxB의 제3 SR II 사이의 접합부의 그림 표현.
도 5 - 융합체 3에 사용되는 ToxA의 LRVII과 ToxB의 LRII 사이의 접합부의 그림 표면(오직 ToxA의 LRVII 일부 및 ToxB의 LRII의 일부만을 함유).
도 6 - 융합체 4에 사용되는 ToxA의 제2 SR VIII과 ToxB의 제3 SR I 사이의 접합부의 그림 표현.
도 7 - 융합체 5에 사용되는 ToxA 단백질 서열의 마지막 잔기와 ToxB의 제4 SR II의 시작 사이의 글리신 링커를 포함하는 접합부의 그림 표현.
도 8 - 침강 속도 분석 초원심분리에 의해 결정시 클로스트리듐 디피실레 ToxA-ToxB 융합체 1 내지 5의 분포를 나타내는 그래프. 패널 a)는 융합체 1의 분포를 나타내고, 패널 b)는 융합체 2의 분포를 나타내며, 패널 c)는 융합체 3의 분포를 나타내고, 패널 d)는 융합체 4의 분포를 나타내며, 패널 e)는 융합체 5의 분포를 나타낸다.
도 9 - 원편광 이색성을 사용하여 측정된 융합체 2, 3, 4 및 5의 원자외선 스펙트럼을 나타내는 그래프. 융합체 2에 대한 스펙트럼은 작은 사각형으로 도시된 점이 있는 선으로 나타나 있고, 융합체 3에 대한 스펙트럼은 작은 마름모꼴 형상으로 도시된 점이 있는 선으로 나타나 있으며, 융합체 4에 대한 스펙트럼은 원형으로 도시된 점이 있는 선으로 나타나 있고, 융합체 5에 대한 스펙트럼은 십자형으로 도시된 점이 있는 선으로 나타나 있다.
도 10 - 원편광 이색성을 사용하여 측정된 융합체 2, 3, 4 및 5의 근자외선 스펙트럼을 나타내는 그래프. 융합체 2에 대한 스펙트럼은 십자형으로 도시된 점이 있는 선으로 나타나 있고, 융합체 3에 대한 스펙트럼은 원형으로 도시된 점이 있는 선으로 나타나 있으며, 융합체 4에 대한 스펙트럼은 삼각형으로 도시된 점이 있는 선으로 나타나 있고, 융합체 5에 대한 스펙트럼은 작은 마름모꼴 형상으로 도시된 점이 있는 선으로 나타나 있다.
도 11 - 독소 A의 C-말단의 단편(아미노산 2387 내지 2706), 독소 B의 C-말단의 단편(아미노산 1750 내지 2360), 또는 융합체 1, 2, 3, 4 또는 5로 면역화된 마우스에서의 항-ToxA 면역원성을 보여주는 그래프.
도 12 - 독소 A의 C-말단의 단편(아미노산 2387 내지 2706), 독소 B의 C-말단의 단편(아미노산 1750 내지 2360), 또는 융합체 1, 2, 3, 4 또는 5로 면역화된 마우스에서의 적혈구 응집반응 저해를 보여주는 그래프.
도 13 - 독소 A의 C-말단의 단편(아미노산 2387 내지 2706), 독소 B의 C-말단의 단편(아미노산 1750 내지 2360), 또는 융합체 1, 2, 3, 4 또는 5로 면역화된 마우스에서의 항-ToxB 면역원성을 보여주는 그래프.
도 14 - 독소 A의 C-말단의 단편(아미노산 2387 내지 2706), 독소 B의 C-말단의 단편(아미노산 1750 내지 2360), 또는 융합체 1, 2, 3, 4 또는 5로 면역화된 마우스로부터의 세포독성 저해 역가.
도 15 - 침강 속도 분석 초원심분리에 의해 결정시 클로스트리듐 디피실레 ToxA-ToxB 융합체 F52New, F54Gly, F54New 및 F5ToxB의 분포를 나타내는 그래프. 패널 a)는 F52New의 분포를 나타내고, 패널 b)는 F54Gly의 분포를 나타내며, 패널 c)는 F54New의 분포를 나타내고, 패널 d)는 F5ToxB의 분포를 나타낸다.
도 16 - 원편광 이색성을 사용하여 측정된 융합체 F52New, F54Gly, F54New 및 F5ToxB의 원자외선 스펙트럼을 나타내는 그래프. F52New에 대한 스펙트럼은 이중 십자형으로 도시된 점이 있는 선으로 나타나 있고, F54Gly에 대한 스펙트럼은 삼각형으로 도시된 점이 있는 선으로 나타나 있으며, F54New는 사각형으로 도시된 점이 있는 선으로 나타나 있고, F5ToxB는 십자 형상으로 도시된 점이 있는 선으로 나타나 있다.
도 17 - 원편광 이색성을 사용하여 측정된 융합체 F52New, F54Gly, F54New 및 F5ToxB의 근자외선 스펙트럼을 나타내는 그래프. F52New에 대한 스펙트럼은 이중 십자형으로 도시된 점이 있는 선으로 나타나 있고, F54Gly에 대한 스펙트럼은 삼각형으로 도시된 점이 있는 선으로 나타나 있으며, F54New는 사각형으로 도시된 점이 있는 선으로 나타나 있고, F5ToxB는 십자 형상으로 도시된 점이 있는 선으로 나타나 있다.
도 18 - F2, F52New, F54Gly, G54New 또는 F5ToxB 융합체로 면역화된 마우스에 대한 항-ToxA ELISA 결과를 보여주는 그래프.
도 19 - F2, F52New, F54Gly, F54New 또는 F5ToxB 융합체로 면역화된 마우스에 대한 항-ToxB ELISA 결과를 보여주는 그래프.
도 20 - F2, F52New, F54Gly, F54New 또는 F5ToxB 융합체로 면역화된 마우스에서의 적혈구 응집반응 저해를 보여주는 그래프.
도 21 - F2, F52New, F54Gly, F54New 또는 F5ToxB 융합체로 면역화된 마우스 유래의 HT29 세포에서의 세포독성 역가를 보여주는 그래프.
도 22 - F2, F52New, F54Gly, F54New 또는 F5ToxB 융합체로 면역화된 마우스 유래의 IMR90 세포에서의 세포독성 역가를 보여주는 그래프.
상세한 설명
폴리펩티드
본 발명은 제1 단편 및 제2 단편을 포함하는 폴리펩티드에 관한 것이며, 여기서,
(i) 제1 단편은 독소 A 반복 도메인 단편이고;
(ii) 제2 단편은 독소 B 반복 도메인 단편이며;
(iii) 제1 단편은 제1 근위단을 갖고;
(iv) 제2 단편은 제2 근위단을 가지며;
제1 단편과 제2 단편은 서로 인접하고, 폴리펩티드는 독소 A 또는 독소 B 또는 둘 모두를 중화시키는 항체를 유도한다.
용어 폴리펩티드는 아미노산의 연속 서열을 말한다.
용어 '독소 A 반복 도메인'은 반복 서열을 포함하는 클로스트리듐 디피실레 유래의 독소 A 단백질의 C-말단 도메인을 말한다. 이러한 도메인은 균주 VPI10463(ATCC43255) 유래의 독소 A의 아미노산 1832 내지 2710 및 상이한 균주에서의 이들의 등가물을 말하며, 균주 VPI10463(ATCC43255) 유래의 아미노산 1832 내지 2710의 서열은 서열 번호 1의 아미노산 1832 내지 2710에 상응한다.
용어 '독소 B 반복 도메인'은 클로스트리듐 디피실레 유래의 독소 B 단백질의 C-말단 도메인을 말한다. 이러한 도메인은 균주 VPI10463(ATCC43255) 유래의 아미노산 1834 내지 2366 및 상이한 균주에서의 이들의 등가물을 말하며, 균주 VPI10463(ATCC43255) 유래의 아미노산 1834 내지 2366의 서열은 서열 번호 2의 아미노산 1834 내지 2366에 상응한다.
클로스트리듐 디피실레 독소 A 및 B는 보존된 단백질이지만, 서열은 균주 간에 약간 상이하며, 더욱이 상이한 균주에서 독소 A 및 B에 대한 아미노산 서열은 아미노산의 개수가 상이할 수 있다.
따라서, 본 발명에서 용어 독소 A 반복 도메인 및/또는 독소 B 반복 도메인은 서열 번호 1의 아미노산 1832 내지 2710에 대하여 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 변이체, 또는 서열 번호 2의 아미노산 1834 내지 2366에 대하여 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 변이체인 서열을 말한다. 일 실시형태에서, '변이체'는 소정의 잔기가 동일한 물리화학적 특성을 갖는 다른 잔기로 치환되는 보존적 아미노산 치환에 의해 참조 폴리펩티드와 달라지는 폴리펩티드이다. 전형적으로, 이러한 치환은 Ala, Val, Leu 및 Ile 간에; Ser 및 Thr 간에; 산성 잔기 Asp 및 Glu 간에; Asn 및 Gln 간에, 그리고 염기성 잔기 Lys 및 Arg 간에; 또는 방향족 잔기 Phe 및 Tyr 간에 행해진다. 일 실시형태에서, '단편'은 폴리펩티드의 적어도 250개 아미노산의 연속 부분을 포함하는 폴리펩티드이다.
더욱이, 하나의 균주 유래의 독소 A(또는 독소 B)와 다른 균주 유래의 독소 A(또는 독소 B)의 C-말단 도메인 간에 아미노산 넘버링이 달라질 수 있다. 이러한 이유로, 용어 '상이한 균주에서의 등가물'은 참조 균주(예를 들어, 클로스트리듐 디피실레 VPI10463)의 아미노산에 상응하나, 상이한 균주 유래의 독소에서 관찰되며, 이에 따라 상이하게 넘버링될 수 있는 아미노산을 말한다. '등가' 아미노산의 영역은 상이한 균주 유래의 독소의 서열을 정렬함으로써 결정될 수 있다. 도처에 제공되는 아미노산 번호는 균주 VPI10463의 아미노산 번호를 말한다.
폴리펩티드 또는 단백질의 '단편'이라는 용어는 상기 폴리펩티드 또는 단백질로부터의 적어도 100, 200, 230, 250, 300, 350, 380, 400, 450, 480, 500, 530, 550, 580 또는 600개 아미노산의 연속 부분을 말한다. 용어 '제1 단편'은 독소 A 반복 도메인의 적어도 100, 250, 300, 350, 380, 400, 450, 480, 500, 530, 550, 580 또는 600개 아미노산의 연속 부분을 말한다. 용어 '제2 단편'은 독소 B 반복 도메인의 적어도 100, 200, 230, 250, 280, 300, 350, 400, 450 또는 500개 아미노산의 연속 부분을 말한다.
용어 '제1 근위단'은 제2 단편(ToxB 단편)에 공유 결합되거나, 또는 제1 및 제2 단편 사이의 링커 서열에 공유 결합되며, 일차 구조에서 제2 단편에 가장 가까운 제1 단편(ToxA 단편)의 말단을 말한다. 용어 '제2 근위단'은 제1 단편(ToxA 단편)에 공유 결합되거나, 또는 제1 및 제2 단편 사이의 링커 서열에 공유 결합되며, 일차 구조에서 제1 단편에 가장 가까운 제2 단편의 말단을 말한다.
폴리펩티드는 더 큰 단백질, 예를 들어, 전구체 또는 융합 단백질의 일부일 수 있다. 정제를 보조하는 서열, 예를 들어, 다중 히스티딘 잔기를 함유하는 추가의 아미노산 서열, 또는 재조합 생성 동안의 안정성을 위한 추가의 서열을 포함하는 것이 종종 유리하다. 추가로, 최종 분자의 면역원성 잠재력을 증가시키기 위한 외인성 폴리펩티드 또는 지질 테일(tail) 또는 폴리뉴클레오티드 서열의 부가도 또한 고려된다.
제1 서열의 N-말단이 제2 단편의 C-말단에 인접하도록, 대안적으로, 제1 단편의 C-말단이 제2 단편의 N-말단에 인접할 수 있도록, 또는 제1 단편의 C-말단이 제2 단편의 C-말단에 인접할 수 있도록, 또는 제1 단편의 N-말단이 제2 단편의 N-말단에 인접할 수 있도록 단편이 배치될 수 있다.
단어 '인접한'은 일차 구조에서 정확히 20, 15, 10, 8, 5, 2, 1 또는 0개 또는 그 미만의 아미노산에 의해 분리된 것을 의미한다.
본 발명의 폴리펩티드는 독소 A 또는 독소 B 또는 둘 모두를 중화시키는 항체를 유도한다. 일 실시형태에서, 폴리펩티드는 독소 A를 중화시키는 항체를 유도한다. 추가의 실시형태에서, 폴리펩티드는 독소 B를 중화시키는 항체를 유도한다. 추가의 실시형태에서, 폴리펩티드는 독소 A 및 독소 B를 중화시키는 항체를 유도한다.
폴리펩티드가 독소에 대한 항체를 유도하는지의 여부는 폴리펩티드를 포함하는 면역원성 조성물로 마우스를 면역화시키고, 혈청을 수집하고, ELISA를 사용하여 혈청의 항-독소 역가를 분석함으로써 측정할 수 있다. 혈청은 면역화된 적이 없는 마우스로부터 수득되는 참조 시료와 비교하여야 한다. 이러한 기술의 일 예는 실시예 6에서 찾을 수 있다. 본 발명의 폴리펩티드는 혈청이 폴리펩티드에 대하여 참조 시료보다 10%, 20%, 30%, 50%, 70%, 80%, 90% 또는 100% 넘게 더 큰 ELISA 판독치를 제공한다면, 독소 A를 중화시키는 항체를 유도하는 것이다.
추가의 실시형태에서, 본 발명의 폴리펩티드는 포유류 숙주에서 클로스트리듐 디피실레의 균주에 대하여 보호 면역 반응을 유도한다. 일 실시형태에서, 포유류 숙주는 마우스, 토끼, 기니피그(guinea pig), 비-인간 영장류, 원숭이 및 인간으로 이루어진 군으로부터 선택된다. 일 실시형태에서, 포유류 숙주는 마우스이다. 추가의 실시형태에서, 포유류 숙주는 인간이다.
폴리펩티드가 포유류 숙주에서 클로스트리듐 디피실레의 균주에 대하여 보호 면역 반응을 유도하는지의 여부는 시험감염(challenge) 검정을 사용하여 결정할 수 있다. 이러한 검정에서, 포유류 숙주는 폴리펩티드로 백신접종되고, 클로스트리듐 디피실레에 대한 노출에 의해 시험감염되며, 시험감염 후에 포유류가 생존하는 기간을 폴리펩티드로 면역화된 적이 없는 참조 포유류가 생존하는 기간과 비교한다. 폴리펩티드로 면역화된 포유류가 클로스트리듐 디피실레로의 시험감염 후에, 면역화된 적이 없는 참조 포유류보다 적어도 10%, 20%, 30%, 50%, 80%, 80%, 90% 또는 100% 더 길게 생존한다면, 폴리펩티드는 보호 면역 반응을 유도한다.
독소 A 및 B로부터의 C-말단 도메인의 고유 구조는 연장된 β 솔레노이드-유사 구조로 이루어진다. 이러한 구조는 문헌[Ho et al (PNAS 102:18373-18378 (2005))]에서 나타낸 바와 같이, 소수의 α 나선 구조와 함께, 주로 β 시트 구조로 이루어진다. 존재하는 2차 구조는 원편광 이색성을 사용하여 결정할 수 있다. 예를 들어, 원자외선 영역(190 내지 250nm)에서 CD 스펙트럼의 형상과 세기를 측정하고, 결과를 공지된 구조의 결과와 비교한다. 이는 예를 들어, 하기 실시예 5에서 보이는 바와 같이, 178로부터 250nm까지 0,01㎝의 광로와, Jasco J-720 분광편광계 상에서의 1nm 분해능과 대역폭을 사용하여 수행할 수 있다.
일 실시형태에서, 제1 단편은 25%, 23%, 20%, 18%, 15%, 10% 또는 7% 미만의 알파 나선 2차 구조를 포함한다. 일 실시형태에서, 제2 단편은 28%, 25%, 23%, 20%, 18%, 15%, 10% 또는 7% 미만의 알파 나선 2차 구조를 포함한다. 추가의 실시형태에서, 제1 단편 및 제2 단편 둘 모두는 28%, 25%, 23%, 20%, 18%, 15%, 10% 또는 7% 미만의 알파 나선 2차 구조를 포함한다.
일 실시형태에서, 제1 단편은 20%, 25%, 28%, 30%, 33%, 35%, 38%, 40% 또는 42% 초과의 베타 시트 구조를 포함한다. 일 실시형태에서, 제2 단편은 20%, 25%, 28%, 30%, 33%, 35%, 38%, 40% 또는 42% 초과의 베타 시트 구조를 포함한다. 추가의 실시형태에서, 제1 단편 및 제2 단편 둘 모두는 20%, 25%, 28%, 30%, 33%, 35%, 38%, 40% 또는 42% 초과의 베타 시트 구조를 포함한다.
도 2는 ToxA 및 ToxB의 C-말단 도메인의 구조를 도시한 것이다. 독소 A의 C-말단 도메인은 8개의 반복 부분(지정된 반복 부분 I, 반복 부분 II, 반복 부분 III, 반복 부분 IV, 반복 부분 V, 반복 부분 VI, 반복 부분 VII 및 반복 부분 VIII)으로 구성되며, 각각의 이들 반복 부분은 추가로 도 2에 백색 사각형으로 도시되어 있는 짧은 반복부(SR) 및 도 2에서 흑색 사각형으로 도시되어 있는 긴 반복부(LR)로 나뉠 수 있다(긴 반복부를 갖지 않는 ToxA 반복 부분 VIII을 제외). 각각의 긴 반복부는 다른 긴 반복부와 일부 구조 및 서열 유사성을 갖는다. 유사하게, 짧은 반복부는 서로 일부 서열 및 구조 유사성을 갖는다. 독소 B의 C-말단 도메인은 SR 및 LR로 세분되는 5개의 반복 부분으로 구성된다. 각각의 반복 부분은 1개의 LR 및 2 내지 5개의 SR을 함유한다(긴 반복부를 갖지 않는 ToxB 반복 부분 V를 제외). 개시내용의 목적을 위하여, 어구 '반복 부분'은 ToxA의 8개의 반복 부분(지정된 I, II, III, IV, V, VI, VII 및 VIII) 중 하나 또는 ToxB의 5개의 반복 부분(지정된 I, II, III, IV 또는 VI) 중 하나를 말한다. 본 명세서에 사용되는 바와 같이, 용어 '제1 반복 부분'은 독소 A 반복 도메인으로부터의 반복 부분(또는 부분 반복 부분)을 말한다. 용어 '제2 반복 부분'은 독소 B 반복 도메인으로부터의 반복 부분(또는 부분 반복 부분)을 말한다. 개시내용의 목적을 위하여, 용어 '긴 반복부'는 도 2에 흑색 사각형으로 도시된 LR 도메인 중 하나를 말한다. 개시내용의 목적을 위하여, 용어 '짧은 반복부'는 도 2에 백색 사각형으로 도시된 SR 도메인 중 하나를 말한다.
따라서, 예를 들어, ToxA의 반복 부분 I은 3개의 SR 및 1개의 LR을 함유하며, 이는 각각 ToxA의 제1 SRI, ToxA의 제2 SRI, ToxA의 제3 SRI 및 ToxA의 LRI로 지칭될 수 있다.
제1 단편이 '반복 부분' 내에 존재하는 아미노산에서 종결된다면, 제1 근위단은 그 반복 부분 내에 존재하는 것으로 여겨진다(즉, 제1 근위단은 오직 일부의 반복 부분 서열만을 함유한다). 유사하게, 제2 단편이 '반복 부분' 내에 존재하는 아미노산에서 종결된다면, 제2 근위단은 그 반복 부분 내에 존재하는 것으로 여겨진다. 예를 들어, 제1 단편이 VPI10463의 아미노산 1832 내지 1924 또는 다른 균주에서의 이들의 등가물 중 어느 하나로 종결된다면, 제1 근위단은 'ToxA의 반복 부분 I' 내에 존재한다. 제1 단편이 짧은 반복 - 긴 반복 - 짧은 반복 부분 내에 존재하지 않는 아미노산으로 종결된다면, 제1 근위단은 짧은 반복 - 긴 반복 - 짧은 반복 부분 내에 존재하지 않는다.
각 도메인의 아미노산 위치는 균주 VPI10463(ATCC43255) 유래의 독소 A 및 독소 B에 대해 정의되어 있다. 이들은 하기와 같다:
표 1
이러한 이유로, 용어 '반복 부분'은 독소 A의 아미노산 1832 내지 1924, 1925 내지 2058, 2059 내지 2192, 2193 내지 2306, 2307 내지 2440, 2441 내지 2553, 2554 내지 2644 또는 2645 내지 2710(서열 번호 1), 또는 독소 B의 아미노산 1834 내지 1926, 1927 내지 2057, 2058 내지 2189, 2190 내지 2323 또는 2324 내지 2366(서열 번호 2), 또는 클로스트리듐 디피실레의 상이한 균주에서의 이들의 등가물을 지칭할 수 있다.
이러한 이유로, 용어 '짧은 반복부'는 독소 A의 아미노산 1832 내지 1852, 1853 내지 1873, 1874 내지 1893, 1925 내지 1944, 1945 내지 1965, 1966 내지 1986, 1987 내지 2007, 2008 내지 2027, 2059 내지 2078, 2079 내지 2099, 2100 내지 2120, 2121 내지 2141, 2142 내지 2161, 2193 내지 2212, 2213 내지 2233, 2234 내지 2253, 2254 내지 2275, 2307 내지 2326, 2327 내지 2347, 2348 내지 2368, 2369 내지 2389, 2390 내지 2409, 2441 내지 2460, 2461 내지 2481, 2482 내지 2502, 2503 내지 2522, 2554 내지 2573, 2574 내지 2594, 2595 내지 2613, 2645 내지 2664, 2665 내지 2686 또는 2687 내지 2710(서열 번호 1), 또는 독소 B의 아미노산 1834 내지 1854, 1855 내지 1876, 1877 내지 1896, 1927 내지 1946, 1947 내지 1967, 1968 내지 1987, 1988 내지 2007, 2008 내지 2027, 2058 내지 2078, 2079 내지 2099, 2100 내지 2119, 2120 내지 2139, 2140 내지 2159, 2190 내지 2212, 2213 내지 2233, 2234 내지 2253, 2254 내지 2273, 2274 내지 2293, 2324 내지 2343 또는 2344 내지 2366(서열 번호 2), 또는 클로스트리듐 디피실레의 상이한 균주에서의 이들의 등가물을 지칭할 수 있다.
유사하게, 용어 '긴 반복부'는 독소 A의 아미노산 1894 내지 1924, 2028 내지 2058, 2162 내지 2192, 2276 내지 2306, 2410 내지 2440, 2523 내지 2553 또는 2614 내지 2644(서열 번호 1), 또는 독소 B의 아미노산 1897 내지 1926, 2028 내지 2057, 2160 내지 2189 또는 2294 내지 2323(서열 번호 2), 또는 클로스트리듐 디피실레의 상이한 균주에서의 이들의 등가물을 지칭할 수 있다.
유사하게, 용어 '짧은 반복 - 긴 반복 - 짧은 반복 부분'은 독소 A의 아미노산 1874 내지 1944, 2008 내지 2078, 2142 내지 2212, 2254 내지 2326, 2390 내지 2460, 2503 내지 2573 또는 2595 내지 2664(서열 번호 1), 또는 독소 B의 아미노산 1877 내지 1946, 2008 내지 2078, 2140 내지 2212 또는 2274 내지 2343(서열 번호 2), 또는 클로스트리듐 디피실레의 상이한 균주에서의 이들의 등가물을 지칭할 수 있다. 용어 '짧은 반복 - 긴 반복 - 짧은 반복 부분을 파괴하지 않는다'는 근위단이 짧은 반복 - 긴 반복 - 짧은 반복 부분의 구조를 파괴하지 않는 영역 내에 존재하는 것을 의미하며, 일반적으로, 이는 근위단이 긴 반복부로부터 서열이 가장 멀리 떨어져 있는 짧은 반복부의 1, 2, 3, 4, 5 또는 6개 아미노산의 영역 내에 존재할 수 있는 것을 제외하고, 근위단이 긴 반복부 내에 존재하지 않고, 짧은 반복부 내에 존재하지 않아서, 짧은 반복 - 긴 반복 - 짧은 반복 부분을 형성하는 것을 의미한다. 일 실시형태에서, 용어 '짧은 반복 - 긴 반복 - 짧은 반복 부분을 파괴하지 않는다'는 근위단이 짧은 반복 - 긴 반복 - 짧은 반복 부분 내에 존재하지 않음을 의미한다.
일 실시형태에서, 제1 근위단은 짧은 반복부 내에 존재한다. 일 실시형태에서, 제2 근위단은 짧은 반복부 내에 존재한다. 일 실시형태에서, 제1 근위단 및 제2 근위단은 짧은 반복부 내에 존재한다. 일 실시형태에서, 제1 근위단은 짧은 반복 - 긴 반복 - 짧은 반복 부분을 파괴하지 않는다. 일 실시형태에서, 제2 근위단은 짧은 반복 - 긴 반복 - 짧은 반복 부분을 파괴하지 않는다. 일 실시형태에서, 제1 근위단 및 제2 근위단은 짧은 반복 - 긴 반복 - 짧은 반복 부분을 파괴하지 않는다.
일 실시형태에서, 제1 근위단은 독소 A의 아미노산 1878 내지 1940, 2146 내지 2208, 2012 내지 2074, 2258 내지 2322, 2394 내지 2456, 2507 내지 2569, 2599 내지 2660 또는 2593 내지 2660(서열 번호 1), 또는 클로스트리듐 디피실레의 상이한 균주에서의 이들의 등가물에 존재하지 않는다. 제2 실시형태에서, 제2 근위단은 독소 B의 아미노산 1881 내지 1942, 2012 내지 2074, 2144 내지 2208 또는 2278 내지 2339(서열 번호 2), 또는 클로스트리듐 디피실레의 상이한 균주에서의 이들의 등가물에 존재하지 않는다. 추가의 실시형태에서, 제1 근위단은 독소 A의 아미노산 1878 내지 1940, 2146 내지 2208, 2012 내지 2074, 2258 내지 2322, 2394 내지 2456, 2507 내지 2569, 2599 내지 2660 또는 2593 내지 2660(서열 번호 1), 또는 클로스트리듐 디피실레의 상이한 균주에서의 이들의 등가물에 존재하지 않으며, 제2 근위단은 독소 B의 아미노산 1881 내지 1942, 2012 내지 2074, 2144 내지 2208 또는 2278 내지 2339(서열 번호 2), 또는 클로스트리듐 디피실레의 상이한 균주에서의 이들의 등가물에 존재하지 않는다.
일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 V(서열 번호 1의 아미노산 2307 내지 2440, 또는 상이한 균주에서의 이들의 등가물), VI(서열 번호 1의 아미노산 2441 내지 2553, 또는 상이한 균주에서의 이들의 등가물), VII(서열 번호 1의 아미노산 2554 내지 2644, 또는 상이한 균주에서의 이들의 등가물) 또는 VIII(서열 번호 1의 아미노산 2645 내지 2710, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VII(서열 번호 1의 아미노산 2554 내지 2644, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII(서열 번호 1의 아미노산 2645 내지 2710 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다.
일 실시형태에서, 제2 근위단은 독소 B의 반복 부분 I(서열 번호 2의 아미노산 1834 내지 1926, 또는 상이한 균주에서의 이들의 등가물), II(서열 번호 2의 아미노산 1927 내지 2057, 또는 상이한 균주에서의 이들의 등가물) 또는 III(서열 번호 2의 아미노산 2058 내지 2189, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제2 근위단은 독소 B의 반복 부분 II(서열 번호 2의 아미노산 1927 내지 2057, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제2 근위단은 독소 B의 반복 부분 I(서열 번호 2의 아미노산 1834 내지 1926 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다.
일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII(서열 번호 1의 아미노산 2645 내지 2710 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I(서열 번호 2의 아미노산 1834 내지 1926 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII(서열 번호 1의 아미노산 2645 내지 2710 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II(서열 번호 2의 아미노산 1927 내지 2057 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VII(서열 번호 1의 아미노산 2554 내지 2644 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I(서열 번호 2의 아미노산 1834 내지 1926 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VII(서열 번호 1의 아미노산 2554 내지 2644 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II(서열 번호 2의 아미노산 1927 내지 2057 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 반복 부분 VI(서열 번호 1의 아미노산 2441 내지 2553 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I(서열 번호 2의 아미노산 1834 내지 1926 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 반복 부분 VI(서열 번호 1의 아미노산 2441 내지 2553 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II(서열 번호 2의 아미노산 1927 내지 2057 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 반복 부분 V(서열 번호 1의 아미노산 2307 내지 2440 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I(서열 번호 2의 아미노산 1834 내지 1926 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 반복 부분 V(서열 번호 1의 아미노산 2307 내지 2440 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II(서열 번호 2의 아미노산 1927 내지 2057 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다.
일 실시형태에서, 제1 근위단은 서열 번호 1의 아미노산 2690 내지 2710 또는 2695 내지 2710 또는 2700 내지 2710, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 추가의 실시형태에서, 제1 근위단은 서열 번호 1의 아미노산 2670 내지 2700 또는 2675 내지 2695 또는 2680 내지 2690, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 일 실시형태에서, 제2 근위단은 독소 B의 아미노산 1860 내지 1878, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 일 실시형태에서, 제2 근위단은 서열 번호 2의 아미노산 1950 내지 1980, 1955 내지 1975 또는 1960 내지 1970, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 추가의 실시형태에서, 제2 근위단은 서열 번호 2의 아미노산 1978 내지 2008, 1983 내지 2003 또는 1988 내지 1998, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 추가의 실시형태에서, 제2 근위단은 서열 번호 2의 아미노산 1860 내지 1878, 1854 내지 1876, 1857 내지 1887, 1862 내지 1882 또는 1867 내지 1877, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다.
일 실시형태에서, 제1 단편은 전체 독소 A 반복 도메인(아미노산 1832 내지 2710)으로 이루어진다. 일 실시형태에서, 제2 단편은 전체 독소 B 반복 도메인(아미노산 1833 내지 2366)으로 이루어진다.
일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부3(서열 번호 1의 아미노산 2687 내지 2710, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부4(서열 번호 2의 아미노산 1988 내지 2007, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부3(서열 번호 1의 아미노산 2687 내지 2710, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부3(서열 번호 2의 아미노산 1968 내지 1987, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부3(서열 번호 1의 아미노산 2687 내지 2710, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부2(서열 번호 2의 아미노산 1947 내지 1967, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부3(서열 번호 1의 아미노산 2687 내지 2710, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부3(서열 번호 2의 아미노산 1877 내지 1896, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부3(서열 번호 1의 아미노산 2687 내지 2710, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부2(서열 번호 2의 아미노산 1855 내지 1876, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부3(서열 번호 1의 아미노산 2687 내지 2710, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부1(서열 번호 2의 아미노산 1834 내지 1854, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부2(서열 번호 1의 아미노산 2665 내지 2686, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부4(서열 번호 2의 아미노산 1988 내지 2007, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부2(서열 번호 1의 아미노산 2665 내지 2686, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부3(서열 번호 2의 아미노산 1968 내지 1987, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부2(서열 번호 1의 아미노산 2665 내지 2686, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부2(서열 번호 2의 아미노산 1947 내지 1967, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부2(서열 번호 1의 아미노산 2665 내지 2686, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부3(독소 B의 아미노산 1877 내지 1896, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부2(서열 번호 1의 아미노산 2665 내지 2686, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부2(서열 번호 2의 아미노산 1855 내지 1876, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VIII의 짧은 반복부2(서열 번호 1의 아미노산 2665 내지 2686, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부1(서열 번호 2의 아미노산 1834 내지 1854, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VII의 짧은 반복부2(서열 번호 1의 아미노산 2574 내지 2594, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부4(서열 번호 2의 아미노산 1988 내지 2007, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VII의 짧은 반복부2(서열 번호 1의 아미노산 2574 내지 2594, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부3(서열 번호 2의 아미노산 1668 내지 1987, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VII의 짧은 반복부2(서열 번호 1의 아미노산 2574 내지 2594, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부2(서열 번호 2의 아미노산 1947 내지 1967, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VII의 짧은 반복부2(서열 번호 1의 아미노산 2574 내지 2594, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부2(서열 번호 2의 아미노산 1855 내지 1876, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VII의 짧은 반복부2(서열 번호 1의 아미노산 2574 내지 2594, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부1(서열 번호 2의 아미노산 1834 내지 1854, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부3(서열 번호 1의 아미노산 2482 내지 2502, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부4(서열 번호 2의 아미노산 1988 내지 2007, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부3(서열 번호 1의 아미노산 2482 내지 2502, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부3(서열 번호 2의 아미노산 1968 내지 1987, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부3(서열 번호 1의 아미노산 2482 내지 2502, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부2(서열 번호 2의 아미노산 1947 내지 1967, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부3(서열 번호 1의 아미노산 2482 내지 2502, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부2(서열 번호 2의 아미노산 1855 내지 1876, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부3(서열 번호 1의 아미노산 2482 내지 2502, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부1(서열 번호 2의 아미노산 1834 내지 1854, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부2(서열 번호 1의 아미노산 2461 내지 2481, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부4(서열 번호 2의 아미노산 1988 내지 2007, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부2(서열 번호 1의 아미노산 2461 내지 2481, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부3(서열 번호 2의 아미노산 1968 내지 1987, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부2(서열 번호 1의 아미노산 2461 내지 2481, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 II의 짧은 반복부2(서열 번호 2의 아미노산 1947 내지 1967, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부2(서열 번호 1의 아미노산 2461 내지 2481, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부2(서열 번호 2의 아미노산 1855 내지 1876, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다. 일 실시형태에서, 제1 근위단은 독소 A의 반복 부분 VI의 짧은 반복부2(서열 번호 1의 아미노산 2461 내지 2481, 또는 상이한 균주에서의 이들의 등가물) 내에 존재하며, 제2 근위단은 독소 B의 반복 부분 I의 짧은 반복부1(서열 번호 2의 아미노산 1834 내지 1854, 또는 상이한 균주에서의 이들의 등가물) 내에 존재한다.
일 실시형태에서, 제1 근위단은 서열 번호 1의 아미노산 2690 내지 2710 또는 2695 내지 2710 또는 2700 내지 2710, 또는 상이한 균주에서의 이들의 등가물 내에 존재하며, 제2 근위단은 서열 번호 2의 아미노산 1950 내지 1980, 1955 내지 1975 또는 1960 내지 1970, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 일 실시형태에서, 제1 근위단은 서열 번호 1의 아미노산 2690 내지 2710 또는 2695 내지 2710 또는 2700 내지 2710, 또는 상이한 균주에서의 이들의 등가물 내에 존재하며, 제2 근위단은 서열 번호 2의 아미노산 1978 내지 2008, 1983 내지 2003 또는 1988 내지 1998, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 일 실시형태에서, 제1 근위단은 서열 번호 1의 아미노산 2690 내지 2710 또는 2695 내지 2710 또는 2700 내지 2710, 또는 상이한 균주에서의 이들의 등가물 내에 존재하며, 제2 근위단은 서열 번호 2의 아미노산 1857 내지 1887, 1862 내지 1882 또는 1867 내지 1877, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 일 실시형태에서, 제1 근위단은 서열 번호 1의 아미노산 2670 내지 2700 또는 2675 내지 2695 또는 2680 내지 2690, 또는 상이한 균주에서의 이들의 등가물 내에 존재하며, 제2 근위단은 서열 번호 2의 아미노산 1950 내지 1980, 1955 내지 1975 또는 1960 내지 1970, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 일 실시형태에서, 제1 근위단은 서열 번호 1의 아미노산 2670 내지 2700 또는 2675 내지 2695 또는 2680 내지 2690, 또는 상이한 균주에서의 이들의 등가물 내에 존재하며, 제2 근위단은 서열 번호 2의 아미노산 1978 내지 2008, 1983 내지 2003 또는 1988 내지 1998, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다. 일 실시형태에서, 제1 근위단은 서열 번호 1의 아미노산 2670 내지 2700 또는 2675 내지 2695 또는 2680 내지 2690, 또는 상이한 균주에서의 이들의 등가물 내에 존재하며, 제2 근위단은 서열 번호 2의 아미노산 1857 내지 1887, 1862 내지 1882, 1860 내지 1878 또는 1867 내지 1877, 또는 상이한 균주에서의 이들의 등가물 내에 존재한다.
일 실시형태에서, 제1 단편은 적어도 100, 200, 300, 400 또는 450개의 아미노산을 포함한다. 일 실시형태에서, 제2 단편은 적어도 100, 200, 300 또는 400개의 아미노산을 포함한다.
일 실시형태에서, 폴리펩티드는 링커를 추가로 포함한다. 이러한 링커는 제1 근위단과 제2 근위단 사이에 존재할 수 있으며, 대안적으로, 링커는 제1 단편 및/또는 제2 단편의 원위단을 추가의 아미노산 서열에 연결시킬 수 있다.
펩티드 링커 서열을 사용하여, 제1 단편과 제2 단편을 분리할 수 있다. 이러한 펩티드 링커 서열은 당업계에 널리 공지되어 있는 표준 기술을 사용하여 융합 단백질 내로 혼입된다. 적절한 펩티드 링커 서열은 하기의 인자에 기초하여 선택될 수 있다: (1) 가요성의 연장된 구조를 취하는 이들의 능력; (2) 이들이 제1 단편 및/또는 제2 단편 상의 작용성 에피토프와 상호작용할 수 있는 2차 구조를 취할 수 없음; 및 (3) ToxA 및/또는 ToxB 작용성 에피토프와 상호작용할 수 있는 소수성 또는 하전된 잔기의 결여. 펩티드 링커 서열은 Gly, Asn 및 Ser 잔기를 함유할 수 있다. 다른 거의 중성의 아미노산, 예를 들어, Thr 및 Ala이 또한 링커 서열에 사용될 수 있다. 링커로 유용하게 사용될 수 있는 아미노산 서열은 문헌[Maratea et al., Gene 40:39-46 (1985)]; 문헌[Murphy et al., Proc. Natl. Acad. Sci. USA 83:8258-8262 (1986)]; 미국 특허 제4,935,233호 및 미국 특허 제4,751,180호에 개시된 아미노산 서열을 포함한다.
일 실시형태에서, 링커는 1 내지 19개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 1 내지 2개, 5 내지 20개, 5 내지 15개, 5 내지 15개, 10 내지 20개, 또는 10 내지 15개의 아미노산을 포함한다. 일 실시형태에서, 링커는 글리신 링커이거나, 링커는 다수의(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 18 또는 19개의) 연속 글리신 잔기를 포함할 수 있거나, 대안적으로, 링커는 몇몇 글리신 잔기와, 알라닌과 같은 몇몇 기타 아미노산 잔기를 포함할 수 있다. 추가의 실시형태에서, 링커는 단일의 글리신 잔기를 포함한다.
일 실시형태에서, 본 발명의 폴리펩티드는 더 큰 융합 단백질의 부분이다. 융합 단백질은 추가의 단백질 항원의 면역원성 부분을 엔코딩하는 아미노산을 추가로 포함할 수 있다. 예를 들어, 융합 단백질은 S. 뉴모니아(S.pneumoniae), H. 인플루엔자(H.influenzae), N. 메닌지티디스(N.meningitidis), E. 콜라이(E.coli), M. 카타랄리스(M.cattarhalis), C. 텐타니(C.tentani), C. 디프테리아(C.diphtheriae), B. 페르투시스(B.pertussis), S. 에피더미디스(S.epidermidis), 장내구균(enterococci), S. 아우레우스(S.aureus) 및 슈도모나스 아에루기노사(Pseudomonas aeruginosa)로 이루어진 군으로부터 선택되는 박테리아로부터 수득되거나 이로부터 유래되는 단백질 항원의 면역원성 부분을 추가로 포함할 수 있다. 이러한 경우에, 링커는 제1 단편 또는 제2 단편과 단백질 항원의 추가의 면역원성 부분 사이에 존재할 수 있다.
용어 "이의 면역원성 부분" 또는 '면역원성 단편'은 폴리펩티드의 단편을 지칭하며, 여기서, 단편은 세포독성 T 림프구, 헬퍼 T 림프구 또는 B 세포에 의해 인식되는 에피토프를 포함한다. 적절하게는, 면역원성 부분은 적어도 30%, 적절하게는 적어도 50%, 특히 적어도 75%, 특히 적어도 90%(예를 들어, 95% 또는 98%)의 참조 서열 내의 아미노산을 포함할 것이다. 면역원성 부분은 적절하게는 참조 서열의 에피토프 영역 모두를 포함할 것이다.
일 실시형태에서, 폴리펩티드는 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 서열 번호 7, 서열 번호 21, 서열 번호 23, 서열 번호 25 또는 서열 번호 27의 면역원성 단편을 포함한다. 일 실시형태에서, 폴리펩티드는 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 서열 번호 7, 서열 번호 21, 서열 번호 23, 서열 번호 25 또는 서열 번호 27의 적어도 500, 550, 600, 650, 700, 750, 780, 800, 830, 850, 880, 900, 920 또는 950개 아미노산의 면역원성 단편을 포함한다. 추가의 실시형태에서, 폴리펩티드는 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 서열 번호 7, 서열 번호 21, 서열 번호 23, 서열 번호 25 또는 서열 번호 27의 변이체를 포함하며, 추가의 실시형태에서, 폴리펩티드는 서열 번호 3 내지 서열 번호 7에 대하여 적어도 80%, 85%, 90%, 92%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 변이체를 포함한다.
일 실시형태에서, 폴리펩티드는 독소 A로부터의 450, 475, 500, 525, 575, 600, 625, 650, 675, 700, 725, 750, 775, 800, 825 또는 850개 초과의 아미노산을 포함한다. 일 실시형태에서, 폴리펩티드는 독소 A로부터의 850, 825, 800, 775, 750, 725, 700, 675, 650, 625 또는 600개 미만의 아미노산을 포함한다. 일 실시형태에서, 폴리펩티드는 독소 B로부터의 350, 375, 400, 425, 450, 475, 500 또는 525개 초과의 아미노산을 포함한다. 일 실시형태에서, 폴리펩티드는 독소 B로부터의 525, 500, 475 또는 450개 미만의 아미노산을 포함한다.
당업계에 공지된 용어 '동일성'은 경우에 따라, 서열을 비교하는 것에 의해 결정되는 바와 같은 둘 이상의 폴리펩티드 서열 또는 둘 이상의 폴리뉴클레오티드 서열 간의 관계이다. 해당 분야에서 "동일성"은 또한 경우에 따라, 서열의 스트링 사이의 매치(match)에 의해 결정되는 바와 같은 폴리펩티드 또는 폴리뉴클레오티드 서열 간의 서열 관련도를 의미한다. "동일성"은 문헌[Computational Molecular Biology, Lesk, A.M., ed., Oxford University Press, New York, 1988]; 문헌[Biocomputing: Informatics and Genome Projects, Smith, D.W., ed., Academic Press, New York, 1993]; 문헌[Computer Analysis of Sequence Data, Part I, Griffin, A.M., and Griffin, H.G., eds., Humana Press, New Jersey, 1994]; 문헌[Sequence Analysis in Molecular Biology, von Heine, G., Academic Press, 1987]; 및 문헌[Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991]; 및 문헌[Carillo, H., and Lipman, D., SIAM J. Applied Math., 48: 1073 (1988)]에 기재된 것들을 포함하나 이들에 한정되지 않는 공지된 방법에 의해 용이하게 계산할 수 있다. 동일성을 결정하기 위한 방법은 시험되는 서열 간에 가장 큰 매치를 제공하도록 설계된다. 더욱이, 동일성을 결정하기 위한 방법은 공개적으로 이용가능한 컴퓨터 프로그램에서 체계화되어 있다. 두 서열 간의 동일성을 결정하는 컴퓨터 프로그램 방법은 니들(Needle) 프로그램 BLASTP, BLASTN(문헌[Altschul, S.F. et al., J. Molec. Biol. 215: 403-410 (1990)]) 및 FASTA(문헌[Pearson and Lipman Proc. Natl. Acad. Sci. USA 85; 2444-2448 (1988)])를 포함하나 이들에 한정되지 않는다. BLAST 과의 프로그램은 NCBI 및 기타 공급원으로부터 공개적으로 입수할 수 있다(문헌[BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894]; 문헌[Altschul, S., et al., J. Mol. Biol. 215: 403-410 (1990)]). 널리 공지되어 있는 스미스 워터만(Smith Waterman) 알고리즘도 또한 동일성을 결정하기 위해 사용할 수 있다.
폴리펩티드 서열 비교를 위한 파라미터에는 다음의 것이 포함된다:
알고리즘: 문헌[Needleman and Wunsch, J. Mol Biol. 48:443-453(1970)]
비교 매트릭스: 헤니코프(Henikoff)로부터의 BLOSSUM62 및 문헌[Henikoff, Proc. Natl. Acad. Sci. USA, 89:10915-10919 (1992)].
갭 패널티: 10
갭 연장 패널티: 0.5
이들 파라미터와 함께 유용한 프로그램은 EMBOSS 패키지로부터의 '니들' 프로그램(문헌[Rice P.et al, Trends in Genetics 2000 col.16(6):276-277])으로 공개적으로 이용가능하다. 전술한 파라미터는 펩티드 비교를 위한 디폴트(default) 파라미터이다(말단 갭에 대해서는 패널티가 없음).
서열 번호 1에 대한 참조 서열의 동일성을 결정하기 위하여, 일 실시형태에서, 서열 동일성은 참조 서열의 전체 길이에 걸쳐 계산된다. 추가의 실시형태에서, 서열 동일성은 서열 번호 1의 서열의 전체 길이에 걸쳐 계산된다. 서열 번호 2에 대한 참조 서열의 동일성을 결정하기 위하여, 일 실시형태에서, 서열 동일성은 참조 서열의 전체 길이에 걸쳐 계산된다. 추가의 실시형태에서, 서열 동일성은 서열 번호 2의 서열의 전체 길이에 걸쳐 계산된다.
본 발명의 추가의 태양에서, (i) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35, (ii) 서열 번호 10 내지 19에 대하여 적어도 80%, 85%, 88%, 90%, 92%, 95%, 98%, 99% 또는 100% 동일성을 갖는 변이체; 또는 (iii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35의 적어도 100, 200, 230, 250, 300, 350, 380, 400, 450, 480, 500, 530, 550, 580 또는 600개 아미노산의 단편을 포함하는 폴리펩티드가 제공된다. 추가의 실시형태에서, 폴리펩티드는 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35, ii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35에 대하여 적어도 80%, 85%, 88%, 90%, 92%, 95%, 98%, 99% 또는 100% 동일성을 갖는 변이체; 또는 (iii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35의 적어도 100, 200, 230, 250, 300, 350, 380, 400, 450, 480, 500, 530, 550, 580 또는 600개 아미노산의 단편을 포함한다. 추가의 실시형태에서, 폴리펩티드는 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35, ii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35에 대하여 적어도 80%, 85%, 88%, 90%, 92%, 95%, 98%, 99% 또는 100% 동일성을 갖는 변이체; 또는 (iii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35의 적어도 100, 200, 230, 250, 300, 350, 380, 400, 450, 480, 500, 530, 550, 580 또는 600개 아미노산의 단편을 포함한다.
일 실시형태에서, 폴리펩티드는 독소 A로부터의 450, 475, 500, 525, 575, 600, 625, 650, 675, 700, 725, 750, 775, 800, 825 또는 850개 초과의 아미노산을 포함한다. 일 실시형태에서, 폴리펩티드는 독소 A로부터의 850, 825, 800, 775, 750, 725, 700, 675, 650, 625 또는 600개 미만의 아미노산을 포함한다. 일 실시형태에서, 폴리펩티드는 독소 B로부터의 350, 375, 400, 425, 450, 475, 500 또는 525개 초과의 아미노산을 포함한다. 일 실시형태에서, 폴리펩티드는 독소 B로부터의 525, 500, 475 또는 450개 미만의 아미노산을 포함한다.
추가의 실시형태에서, 폴리펩티드는 독소 A 또는 독소 B 또는 둘 모두를 중화시키는 중화 항체를 유도한다. 추가의 실시형태에서, 폴리펩티드는 독소 A를 중화시키는 항체를 유도한다. 추가의 실시형태에서, 폴리펩티드는 독소 B를 중화시키는 항체를 유도한다. 추가의 실시형태에서, 폴리펩티드는 독소 A 및 독소 B를 중화시키는 항체를 유도한다. 본 발명의 폴리펩티드는 혈청이 폴리펩티드에 대하여 참조 시료보다 10%, 20%, 30%, 50%, 70%, 80%, 90% 또는 100% 넘게 더 높은 ELISA 판독치를 제공한다면, 독소 A를 중화시키는 항체를 유도하는 것이다.
추가의 실시형태에서, 본 발명의 폴리펩티드는 포유류 숙주에서 클로스트리듐 디피실레의 균주에 대하여 보호 면역 반응을 유도한다. 일 실시형태에서, 포유류 숙주는 마우스, 토끼, 기니피그, 원숭이, 비-인간 영장류 및 인간으로 이루어진 군으로부터 선택된다. 일 실시형태에서, 포유류 숙주는 마우스이다. 추가의 실시형태에서, 포유류 숙주는 인간이다.
폴리펩티드가 포유류 숙주에서 클로스트리듐 디피실레의 균주에 대하여 보호 면역 반응을 유도하는지의 여부는 시험감염 검정을 사용하여 결정할 수 있다. 이러한 검정에서, 포유류 숙주는 폴리펩티드로 백신접종되고, 클로스트리듐 디피실레에 대한 노출에 의해 시험감염되며, 시험감염 후에 포유류가 생존하는 기간을 폴리펩티드로 면역화된 적이 없는 참조 포유류가 생존하는 기간과 비교한다. 폴리펩티드로 면역화된 포유류가 클로스트리듐 디피실레로의 시험감염 후에, 면역화된 적이 없는 참조 포유류보다 적어도 10%, 20%, 30%, 50%, 70%, 80%, 90% 또는 100% 더 길게 생존한다면, 폴리펩티드는 보호 면역 반응을 유도한다. 일 실시형태에서, 본 발명의 폴리펩티드는 마우스, 기니피그, 원숭이 및 인간으로 이루어진 군으로부터 선택되는 포유류에서 클로스트리듐 디피실레의 균주에 대하여 보호 면역 반응을 유도한다. 일 실시형태에서, 포유류는 마우스이며, 추가의 실시형태에서, 포유류는 인간이다.
독소 A 및 B로부터의 C-말단 (반복) 도메인의 고유(native) 구조는 연장된 β 솔레노이드-유사 구조로 이루어진다. 이러한 구조는 문헌[Ho et al (PNAS 102:18373-18378 (2005))]에서 나타낸 바와 같이, 소수의 α 나선 구조와 함께, 주로 β 시트 구조로 이루어진다. 존재하는 2차 구조는 원편광 이색성을 사용하여 결정할 수 있다. 예를 들어, 원자외선 영역(190 내지 250nm)에서 CD 스펙트럼의 형상과 세기를 측정하고, 결과를 공지된 구조의 결과와 비교한다. 이는 예를 들어, 하기 실시예 5에서 보이는 바와 같이, 178로부터 250nm까지 0,01㎝의 광로와, Jasco J-720 분광편광계 상에서의 1nm 분해능과 대역폭을 사용하여 수행할 수 있다.
일 실시형태에서, 폴리펩티드는 25%, 23%, 20%, 28%, 15%, 10% 또는 7% 미만의 알파 나선 2차 구조를 포함한다. 추가의 실시형태에서, 폴리펩티드는 20%, 25%, 28%, 30%, 33%, 35%, 38%, 40% 또는 42% 초과의 베타 시트 구조를 포함한다.
폴리뉴클레오티드
본 발명은 추가로 본 발명의 폴리펩티드를 엔코딩하는 폴리뉴클레오티드를 제공한다. 본 발명의 목적을 위하여, 용어 '폴리뉴클레오티드(들)'는 일반적으로, 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 지칭하며, 이는 단일 및 이중-가닥 영역/형태를 포함하는 비변형된 RNA 또는 DNA, 또는 변형된 RNA 또는 DNA일 수 있다.
본 명세서에 사용되는 바와 같은 용어 '펩티드를 엔코딩하는 폴리뉴클레오티드'는 본 발명의 펩티드 또는 폴리펩티드를 엔코딩하는 서열을 포함하는 폴리뉴클레오티드를 포함한다. 상기 용어는 또한 코딩 및/또는 비-코딩 서열을 함유할 수 있는 추가의 영역과 함께, 펩티드 또는 폴리펩티드를 엔코딩하는 단일의 연속 영역 또는 불연속 영역을 포함하는 폴리뉴클레오티드(예를 들어, RNA 편집(editing) 또는 게놈 DNA 재구성 때문에, 또는 통합된 파지, 통합된 삽입 서열, 통합된 벡터 서열, 통합된 트랜스포존 서열에 의해 단절되는 폴리뉴클레오티드)를 포함한다.
유전 암호의 축퇴성(degeneracy)의 결과로서, 본 명세서에 기재된 바와 같은 폴리펩티드를 엔코딩하는 많은 뉴클레오티드 서열이 존재하는 것이 당업자에 의해 인식될 것이다. 이들 폴리뉴클레오티드 중 일부는 임의의 고유(즉, 천연 발생) 유전자의 뉴클레오티드 서열에 대하여 최소의 유사성을 지닌다. 그럼에도 불구하고, 코돈 사용의 차이에 기인하여 달라지는 폴리뉴클레오티드, 예를 들어, 인간 및/또는 영장류 및/또는 E. 콜라이 코돈 선택을 위해 최적화된 폴리뉴클레오티드가 특별히 본 발명에 의해 고려된다.
요망되는 폴리펩티드를 엔코딩하는 서열은 부분적으로 또는 전부 당업계에 널리 공지된 화학적 방법(문헌[Caruthers, M. H. et al., Nucl. Acids Res. Symp. Ser. pp. 215-223 (1980)], 문헌[Horn et al., Nucl. Acids Res. Symp. Ser. pp. 225-232 (1980)] 참조)을 이용하여 합성될 수 있다. 대안적으로, 단백질 자체는 폴리펩티드의 아미노산 서열 또는 이의 일부를 합성하기 위한 화학적 방법을 사용하여 생성될 수 있다. 예를 들어, 펩티드 합성은 다양한 고체상 기술(문헌[Roberge et al., Science 269:202-204 (1995)])을 이용하여 수행될 수 있고, 자동화된 합성은, 예를 들어, ASI 431 A 펩티드 합성장치(미국 캘리포니아주 팔로알토에 소재한 퍼킨 엘머(Perkin Elmer))를 이용하여 달성될 수 있다.
더욱이, 본 발명의 폴리뉴클레오티드 서열은 유전자 산물의 클로닝, 가공 및/또는 발현을 변형시키는 변경을 포함하나 이로 제한되지 않는 다양한 이유로, 폴리펩티드 엔코딩 서열을 변경시키기 위해 당업계에 일반적으로 공지된 방법을 이용하여 엔지니어링될 수 있다. 예를 들어, 무작위 단편화 및 유전자 단편과 합성 올리고뉴클레오티드의 PCR 리어셈블리(reassembly)에 의한 DNA 셔플링(schuffling)이 뉴클레오티드 서열을 엔지니어링하는데 사용될 수 있다. 또한, 부위 지정 돌연변이유발이 새로운 제한 부위를 삽입하거나, 당화 패턴을 변경시키거나, 코돈 선호도를 변경시키거나, 스플라이스 변이체를 생성시키거나, 돌연변이를 유도하는 등을 위해 사용될 수 있다.
벡터
본 발명의 추가의 태양에서, 본 발명은 프로모터가 유도되는 경우, 폴리뉴클레오티드에 의해 엔코딩되는 폴리펩티드가 발현되도록 유도성 프로모터에 연결된 본 발명의 폴리뉴클레오티드를 포함하는 벡터에 관한 것이다.
본 발명의 추가의 태양은 상기 벡터를 포함하며, 여기서, 유도성 프로모터는 바람직하게는 배양 배지로의 충분한 양의 IPTG(아이소프로필 β-D-1-티오갈락토피라노시드)의 첨가에 의해 활성화된다. 임의로, 이는 0.1 내지 10mM, 0.1 내지 5mM, 0.1 내지 2.5mM, 0.2 내지 10mM, 0.2 내지 5mM, 0.2 내지 2.5mM, 0.4 내지 10mM, 1 내지 10mM, 1 내지 5mM, 2.5 내지 10mM, 2.5 내지 5mM, 5 내지 10mM의 농도로 존재한다. 대안적으로, 프로모터는 온도 또는 pH의 변화에 의해 유도될 수 있다.
숙주 세포
본 발명의 폴리펩티드의 재조합 생성을 위하여, 숙주 세포를 유전적으로 엔지니어링하여, 발현 시스템 또는 이의 부분 또는 본 발명의 폴리뉴클레오티드를 혼입시킬 수 있다. 폴리뉴클레오티드의 숙주 세포로의 도입은 많은 표준 실험실 매뉴얼, 예를 들어, 문헌[Davis, et al., BASIC METHODS IN MOLECULAR BIOLOGY, (1986)] 및 문헌[Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989)]에 기재된 방법, 예를 들어, 인산칼슘 트랜스펙션(transfection), DEAE-덱스트란 매개 트랜스펙션, 트랜스벡션(transvection), 미세주입, 양이온 지질-매개의 트랜스펙션, 전기천공법, 컨쥬게이션(conjugation), 형질도입(transduction), 스크레이프 로딩(scrape loading), 탄도성 도입(ballistic introduction) 및 감염에 의해 시행될 수 있다.
적절한 숙주의 대표적인 예에는 그람 음성 박테리아 세포, 예를 들어, E. 콜라이, 아시네토박터(Acinetobacter), 악티노바실루스(Actinobacillus), 보르데텔라(Bordetella), 브루셀라(Brucella), 캄필로박터(Campylobacter), 시아노박테리아(Cyanobacteria), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 프란시셀라(Franciscella), 헬리코박터(Helicobacter), 헤모필루스(hemophilus), 클레브시엘라(Klebsiella), 레지오넬라(Legionella), 모락셀라(Moraxella), 네이세리아(Neisseria), 파스퇴렐라(Pasteurella), 프로테우스(Proteus), 슈도모나스(Pseudomonas), 살모넬라(Salmonella), 세라티아(Serratia), 시겔라(Shigella), 트레포네마(Treponema), 비브리오(Vibrio), 예르시니아(Yersinia)의 세포가 포함된다. 일 실시형태에서, 숙주 세포는 E. 콜라이 세포이다. 대안적으로, 그람 양성 박테리아 세포도 또한 사용될 수 있다. 매우 다양한 발현 시스템을 사용하여, 본 발명의 폴리펩티드를 생성할 수 있다. 일 실시형태에서, 벡터는 박테리아 플라스미드로부터 유래된다. 일반적으로, 숙주에서 폴리뉴클레오티드를 유지하거나, 전파하거나 발현하고/거나 폴리펩티드를 발현하기에 적절한 임의의 시스템 또는 벡터가 이와 관련하여 발현을 위해 사용될 수 있다. 적절한 DNA 서열은 다양한 널리 공지되어 있는 통상의 기술 중 임의의 것, 예를 들어, 상기 문헌[Sambrook et al., MOLECULAR CLONING, A LABORATORY MANUAL]에 기재된 것에 의해 발현 시스템으로 삽입될 수 있다.
면역원성 조성물 및 백신
본 발명의 폴리펩티드 및 약제학적으로 허용가능한 부형제를 포함하는 면역원성 조성물이 추가로 제공된다.
일 실시형태에서, 면역원성 조성물은 애쥬번트(adjuvant)를 추가로 포함한다. 본 발명의 프로세스를 사용하여 제조된 박테리아 독소 또는 컨쥬게이트와 혼합될 적절한 애쥬번트의 선택은 당업자의 지식 내에 있다. 적절한 애쥬번트는 알루미늄 염, 예를 들어, 수산화알루미늄 겔 또는 인산알루미늄 또는 명반(alum)을 포함하나, 또한 칼슘, 마그네슘, 철 또는 아연의 염과 같은 다른 금속 염일 수 있거나, 아실화된 티로신 또는 아실화된 당의 불용성 현탁액, 양이온 또는 음이온으로 유도된 당류 또는 폴리포스파젠일 수 있다.
일 실시형태에서, 면역원성 조성물은 추가의 항원을 더 포함한다. 일 실시형태에서, 추가의 항원은 S. 뉴모니아, H. 인플루엔자, N. 메닌지티디스, E. 콜라이, M. 카타랄리스, 파상풍, 디프테리아, 백일해, S. 에피데르미디스, 장구균, S. 아우레우스 및 슈도모나스 아에루기노사로 이루어진 군으로부터 선택되는 박테리아로부터 유래되는 항원이다. 추가의 실시형태에서, 본 발명의 면역원성 조성물은 추가로 클로스트리듐 디피실레 유래의 항원, 예를 들어, S-층 단백질을 포함할 수 있다(WO01/73030호).
면역원성 조성물을 포함하는 백신이 추가로 제공되며, 이러한 백신은 약제학적으로 허용가능한 부형제를 추가로 포함할 수 있다.
본 발명의 면역원성 조성물을 함유하는 백신 제제를 사용하여, 전신 또는 점막 경로를 통한 상기 백신의 투여의 수단에 의해 클로스트리듐 디피실레 감염에 감수성이 있는 포유류를 보호하거나 클로스트리듐 디피실레 감염이 있는 포유류를 치료할 수 있다. 이들 투여는 근내, 복강내, 피내 또는 피하 경로를 통한; 또는 경구/식도(alimentary), 호흡기, 비뇨생식관으로의 점막 투여를 통한 주입을 포함할 수 있다. 본 발명의 백신은 단일 투여량으로 투여될 수 있지만, 이의 성분은 동시에 또는 상이한 시간에(예를 들어, 폐렴구균 당류 컨쥬게이트는 서로에 대한 면역 반응 조정을 위하여 백신의 임의의 박테리아 단백질 성분의 투여와 별개로, 동시에 또는 1 내지 2주 후에 투여될 수 있다) 함께 동시-투여될 수 있다. 단일의 투여 경로에 더하여, 2가지의 상이한 투여 경로가 사용될 수 있다. 예를 들어, 당류 또는 당류 컨쥬게이트는 근육내(IM) 또는 피내(ID)로 투여될 수 있으며, 박테리아 단백질은 비내(IN) 또는 피내(ID)로 투여될 수 있다. 또한, 본 발명의 백신은 초회감작(priming) 투여량을 위해 근육내로, 그리고 부스터(booster) 투여량을 위해 비내로 투여될 수 있다.
백신 중의 독소의 함량은 전형적으로, 1 내지 250㎍, 바람직하게는 5 내지 50㎍, 가장 전형적으로는 5 내지 25㎍의 범위로 존재할 것이다. 조기의 백신접종 후에, 대상체에는 적절하게 떨어져 있는 1회 또는 수회의 부스터 면역화를 제공할 수 있다. 백신 제제는 일반적으로, 문헌[Vaccine Design ("The subunit and adjuvant approach"(eds Powell M.F. & Newman M.J.) (1995) Plenum Press New York)]에 기재되어 있다. 리포좀 내의 봉입은 미국 특허 제4,235,877호(Fullerton)에 기재되어 있다.
본 발명의 일 태양에서, 임의로, 동결건조된 형태의 본 발명의 면역원성 조성물을 함유하는 바이알(vial)을 포함하며, 본 명세서에 기재된 바와 같은 애쥬번트를 함유하는 바이알을 추가로 포함하는 백신 키트가 제공된다. 이러한 본 발명의 태양에서, 애쥬번트는 동결건조된 면역원성 조성물을 재구성하기 위해 사용될 것으로 예상된다.
본 발명의 추가의 태양은 면역보호적 용량의 본 발명의 면역원성 조성물 또는 백신 또는 키트를 숙주에게 투여하는 것을 포함하는 클로스트리듐 디피실레 감염의 예방 또는 치료 방법이다. 일 실시형태에서, 면역보호적 용량의 본 발명의 면역원성 조성물 또는 백신 또는 키트를 숙주에게 투여하는 것을 포함하는 클로스트리듐 디피실레 감염의 일차 및/또는 재발 에피소드의 예방 또는 치료 방법이 제공된다.
본 발명의 추가의 태양은 클로스트리듐 디피실레 질환의 치료 또는 예방에 사용하기 위한 본 발명의 면역원성 조성물이다. 일 실시형태에서, 클로스트리듐 디피실레 질환의 일차 및/또는 재발 에피소드의 치료 또는 예방에 사용하기 위한 본 발명의 면역원성 조성물이 제공된다.
본 발명의 추가의 태양은 클로스트리듐 디피실레 질환의 치료 또는 예방용 약제의 제조에서의 본 발명의 면역원성 조성물 또는 백신 또는 키트의 용도이다. 일 실시형태에서, 클로스트리듐 디피실레 질환의 일차 및/또는 재발 에피소드의 치료 또는 예방용 약제의 제조에 사용하기 위한 본 발명의 면역원성 조성물이 제공된다.
"약" 또는 "대략"은 본 발명의 목적을 위해 제공된 수치의 거의 10% 내로 정의된다.
용어 "포함하는(comprising)", "포함하다(comprise)" 및 "포함한다(comprises)"는 본 발명자들에 의해 모든 예에서 각각 용어 "로 이루어진", "로 이루어진다" 및 "로 구성된다"로 임의로 치환가능한 것으로 의도된다. 용어 "포함하다"는 "포함된다"를 의미한다. 따라서, 문맥적으로 달리 요구되지 않는 한, "포함하다"라는 단어, 및 변형물 예컨대 "포함한다" 및 "포함하는"은 언급된 화합물 또는 조성물(예를 들어, 핵산, 폴리펩티드, 항원) 또는 단계, 또는 화합물들 또는 단계들의 군의 포함(inclusion)을 의미하지만, 임의의 다른 화합물, 조성물, 단계 또는 이들의 군의 배제를 의미하지는 않는 것으로 이해될 것이다. 약어 "예를 들어(e.g.)"는 라틴어 <exempli gratia>로부터 유래되고, 비-제한적인 예를 지시하도록 본 명세서에 사용된다. 따라서, 약어 "예를 들어(e.g.)"는 용어 "예를 들어(for example)"와 동의어이다.
본 발명의 "백신 조성물"과 관련된 본 명세서의 실시형태는 또한 본 발명의 "면역원성 조성물"과 관련된 실시형태에 적용가능하며, 그 역도 그러하다.
달리 설명되지 않는 한, 본 명세서에 사용된 모든 기술 용어 및 과학 용어는 본 개시내용이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 분자 생물학에서의 통상적인 용어의 정의는 문헌[Benjamin Lewin, Genes V, published by Oxford University Press, 1994 (ISBN 0-19-854287-9)]; 문헌[Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0-632-02182-9)]; 및 문헌[Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8)]에서 찾을 수 있다.
단수형 용어("a", "an", 및 "the")는 명백하게 문맥적으로 다르게 지시되지 않는 한 복수 지시대상을 포함한다. 유사하게, "또는"이라는 단어는 명백하게 문맥적으로 다르게 지시되지 않는 한 "및"을 포함하는 것으로 의도된다. 용어 "복수"는 2개 이상을 말한다. 핵산 또는 폴리펩티드에 대해 제공된 모든 염기 크기 또는 아미노산 크기, 및 모든 분자량 또는 분자 질량 값은 대략적이고, 설명을 위해 제공된다는 것을 추가로 이해하여야 한다. 추가로, 물질, 예컨대 항원의 농도 또는 수준과 관련하여 제공된 수치 한정은 근사치일 수 있다.
이러한 특허 명세서에서 열거된 모든 참조문헌 또는 특허 출원은 그들 전문이 본 명세서에 참조로 포함된다.
본 발명을 더욱 잘 이해할 수 있도록, 하기의 실시예가 기재된다. 이들 실시예는 오직 예시의 목적을 위한 것이며, 본 발명의 범주를 어떠한 방식으로든 제한하는 것으로 간주되어서는 안된다.
실시예
실시예 1: 5개의 클로스트리듐 디피실레 ToxA-ToxB 융합체의 설계
ToxA 및 ToxB의 C-말단 반복 도메인의 단편을 함유하는 융합 단백질을 설계하였다. 이들 융합체는 ToxA의 C-말단 반복 도메인의 단편 및 ToxB의 C-말단 반복 도메인의 단편, 및 ToxA 단편의 C-종말단과 ToxB 단편의 N-종말단 사이에 접합ㅂ부를 함유하였다. 2가지 전략을 고안하였으며, 제1 전략에서, 긴 솔레노이드 구조가 2개의 단편 사이의 접합부에서 유지되도록 융합체를 설계하였다. 제2 전략에서는, 융합체의 2개의 단편을 링커에 의해 분리하여, 이들의 독립적인 정확한 폴딩을 가능하게 한다.
ToxA 및 B의 C-말단 부분은 하기의 반복 서열로 이루어진다: 짧은 반복부(SR) 및 긴 반복부(LR)(문헌[PNAS 2005 vol 102 : 18373-18378]).
ToxA의 C-말단 도메인에 대한 3D 구조가 일부 공지되어 있다(문헌[PNAS 2005 Greco et al., vol 102 : 18373-18378]; 문헌[Nature Structural & Molecular biology 2006 vol 13(5) : 460-461]; PDB 코드 : 2F6E, 2G7C 및 2QJ6).
본 발명자들은 ToxA 및 ToxB의 C-말단 부분의 잔기 사이에 2가지 종류의 중요한 상호작용이 존재하는 것을 예측하였다. 제1 상호작용은 LR과 이의 앞에 존재하는 SR에 포함되는 잔기 사이에 발생하며, 솔레노이드-유사 구조를 유지하는데 중요하다. 제2 유형의 상호작용은 LR과 뒤에 존재하는 SR에 포함되는 잔기 사이에 발생하며, 이러한 상호작용은 독소의 탄수화물-결합 기능을 매개하는 것이다.
신규한 "구조-기능" 반복부 SR-LR-SR이 정의되었다. 이러한 반복부의 구조는 본 발명자들이 설계한 융합체에서 온전하게 유지되었다.
도 2는 ToxA 및 ToxB의 C-말단 도메인 및 정의된 "SR-LR-SR" 박스를 나타낸다.
ToxA 및 ToxB의 짧은 반복부(SR) 및 긴 반복부(LR)의 위치는 표 1에 제시되어 있다.
ToxA 및 ToxB의 C-말단 도메인에 포함되는 "SR-LR-SR" 박스의 목록은 표 2에 제시되어 있다.
표 2
마지막으로, 2개의 LR 사이의 SR의 개수는 설계된 융합체에서 유지되어, 긴 솔레노이드-유사 구조가 유지될 것이다.
융합체를 위한 접합부의 설계 전에, 2가지의 적용되는 가설을 정의하였다: 제1 가설은, 융합체가 짧아지면, 융합체가 안정적으로 과발현되게 할 가능성이 보다 뛰어나다는 것이고; 제2 가설은, "SR-LR-SR" 박스의 개념에 따라, 출발 위치는 이러한 이전에 정의된 SR-LR-SR 박스의 제1 SR의 올바른 폴딩을 보장하도록 선택되어야 한다는 것이다. 따라서, 융합체는 SR-LR-SR 박스의 앞에 존재하는 SR의 처음에 시작된다. 이들 2개의 가설을 사용하여, 3개의 출발 위치를 분석하였다: ToxA의 잔기 2370, 2234 및 2121.
출발 위치 2370을 배제하였다. 출발 위치 2234도 또한 배제하였는데, 이는 단백질 구조 안정성에 중요한 상호작용에 수반되는 잔기 중 하나가 보존되지 않기 때문이다. 그래서, 모든 설계된 융합체가 Tox의 잔기 2121에 시작할 것을 결정하였다.
모든 융합체는 ToxB의 마지막 잔기에서 종결될 것이다.
전체 융합체를 2개의 융합 단편 사이의 긴 솔레노이드-유사 구조로 유지하기 위하여 4개의 융합체(F1 내지 4)를 설계하였다.
융합체 1(F1) 및 2(F2)를 동일한 가설을 사용하여 설계하였다. ToxA 및 ToxB의 모든 SR 단백질 서열을 다중 정렬 소프트웨어를 사용하여 비교하였다(문헌[ClustalW - Thompson JD et al. (1994) Nucleic Acids Res., 22, 4673-4680]). 더욱 유사한 서열은 ToxA의 제3 SR VIII 및 ToxB의 제3 SR II 및 ToxB의 제3 SR III이었다. 이들 ToxB의 2개의 SR 사이에서 선택하기 위하여, 구조적 유사성 모델링(SwissModel 인터페이스 사용 - 문헌[Arnold K et al. (2006) Bioinformatics, 22, 195-201])을 부분 ToxA C-말단 도메인(PDB 코드 : 2QJ6)의 공지되어 있는 3D 구조를 사용하여 ToxB의 C-말단 부분 상에서 수행하였다. ToxA의 제3 SR VIII을 사용하여, ToxB의 제3 SR II와 함께 최적의 국소 구조 중첩(SwissPDBViewer를 사용하여 수행 - 문헌[Guex N et al. (1997), Electrophoresis 18, 2714-2723])을 수득하였다. 그래서, 2개의 접합부를 설계하였다: 제1 접합부는 ToxA의 제3 SR VIII과 ToxB의 제4 SR II 사이에 존재하며(F1), 제2 접합부는 ToxA의 제2 SR VIII와 ToxB의 제3 SR II 사이에 존재한다(F2). 이들 접합부는 각각 도 3 및 4에 제시되어 있다.
융합체 3(F3)을 설계하기 위하여, ToxA의 부분 C-말단 도메인의 공지되어 있는 구조와 ToxB의 C-말단 도메인의 예측된 구조 간에서 전체적인 구조 중첩을 수행하였다(SwissModel 및 SwissPDBViewer 소프트웨어를 사용). 최적의 중첩이 ToxA의 LR VII과 ToxB의 LR II 사이에서 관찰되었다. 그래서, 이러한 유사한 LR에서 접합부를 형성하기로 결정하였다. 접합을 먼저 서열이 ToxA와 ToxB 간에 보존되는 영역에서, 그 다음에, 융합체의 ToxA 부분에서 앞에 존재하는 SR과 상호작용하는 잔기를 유지하고, 마지막으로, ToxB 부분에서, 뒤에 존재하는 SR과 상호작용하는 잔기를 유지하기 위하여 수행하였다. 이러한 접합부는 도 5에 나타나 있다.
융합체 4(F4)의 설계를 위하여, ToxB의 C-말단 도메인을 4개의 단편으로 나누고, 더욱 정밀한 상동성 모델링(SwissModel)을 이들에서 수행하였다. 분할을 실현하여, 'SR-LR-SR 박스'를 온전하게 유지하였다(각 도메인은 LR의 뒤에 존재하는 SR의 말단에서 종결된다). 이들 단편의 예측된 구조와 ToxA의 공지되어 있는 3D 구조 간의 구조적 중첩을 행하고, ToxB의 제3 SR(SR I)과 ToxA의 마지막 SR(제3 SR VIII)에 대하여 최적의 구조적 중첩을 수득하였다. 그래서, ToxA의 제2 SR VIII과 ToxB의 제3 SR I 사이에서 접합을 행하였다. 이러한 설계는 도 6에 제시되어 있다.
마지막 융합체(F5)를 설계하여, 융합체의 2개의 단편의 독립적인 올바른 폴딩을 가능하게 하였다. 링커를 ToxA 단백질 서열의 마지막 잔기와 ToxB의 제4 SR II의 시작 사이에 부가하였다(항상 무손상 "SR-LR-SR" 박스의 중요성을 고려하여). 오직 하나의 외인성 잔기(글리신)를 링커로서 부가하고, 2개의 기존의 글리신 사이에 배치하였다. 따라서, 링커는 또한 공지되어 있는 베타-가닥(ToxA에 대한) 및 예측된 베타-가닥(ToxB에 대한)에 의해 둘러싸인 3개의 글리신으로 이루어진 것으로 기재될 수 있다. 이러한 마지막 설계는 도 7에 나타나 있다.
실시예 2: 융합 단백질의 클로닝 발현 및 정제
발현 플라스미드 및 재조합 균주
ToxA 및 ToxB의 부분 C-말단 도메인의 융합 단백질을 엔코딩하는 유전자(서열 번호 3, 4, 5, 6 및 7) 및 His 태그를 표준 절차를 사용하여, NdeI/XhoI 제한 부위를 사용해 pET24b(+) 발현 벡터(노바겐(Novagen))로 클로닝하였다. CaCl2-처리 세포를 사용하는 표준 방법에 따라 재조합 발현 벡터로 E. 콜라이 균주 BLR(DE3)을 형질전환시킴으로써 최종 구축물을 생성하였다(문헌[Hanahan D. 《 Plasmid transformation by Simanis. 》 In Glover, D. M. (Ed), DNA cloning. IRL Press London. (1985): p. 109-135]).
숙주 균주:
BLR(DE3). BLR은 BL21의 recA 유도체이다. 상기 명칭(DE3)을 갖는 균주는 IPTG 유도성 T7 RNA 중합효소를 함유하는 λ 프로파지에 대하여 용원성이다. pET 벡터로부터의 단백질 발현을 위하여 λ DE3 용원이 설계된다. 이러한 균주는 또한 lon 및 ompT 프로테아제에 결함이 있다.
유전형 : E. 콜라이 BLR::DE3 균주, F- ompT hsdS B(rB - mB -) gal dcm (DE3) Δ(srl-recA)306::Tn10 (TetR)
재조합 단백질의 발현:
E. 콜라이 형질전환체를 한천 플레이트로부터 떼어내고, 이를 사용하여 200㎖의 LBT 브로쓰(broth) ± 1%(w/v) 글루코스 + 카나마이신(50 ㎍/㎖)을 접종하여, 0.1 내지 0.2의 O.D.600nm를 수득하였다. 배양물을 37℃, 250 RPM에서 밤새 인큐베이션시켰다.
이러한 밤샘 배양물을 카나마이신(50 ㎍/㎖)을 함유하는 500 ㎖의 LBT 배지에 1:20으로 희석하고, O.D.620이 0.5/0.6에 도달할 때까지 250 rpm의 교반 속도에서 37℃에서 성장시켰다.
대략 0.6의 O.D.600nm에서, 배양물을 냉각시킨 후, 1 mM 아이소프로필 β-D-1-티오갈락토피라노시드(IPTG; 이엠디 케미칼즈 인코포레이티드(EMD Chemicals Inc.), 카탈로그 번호: 5815)의 첨가에 의해 재조합 단백질의 발현을 유도하고, 23℃, 250 RPM에서 밤새 인큐베이션시켰다.
밤샘 유도(대략 16시간) 후에, 유도 후의 O.D.600nm를 평가하고, 배양물을 14 000 RPM에서 15분 동안 원심분리하고, 펠릿을 따로 -20℃에서 동결시켰다.
정제:
박테리아 펠릿을 500 mM NaCl 및 프로테아제 저해제 혼합물(컴플리트(Complete), 로슈(Roche))을 함유하는 20 mM 비신 완충제(pH 8.0)에 재현탁화시켰다. 박테리아를 프렌치 프레스 시스템(French Press system) 20 000 PSI를 사용하여 용해시켰다. 가용성(상청액) 및 불용성(펠릿) 성분을 예를 들어, 20 000g에서, 4℃에서 30분 동안의 원심분리에 의해 분리하였다.
6-His 태그화 단백질을 IMAC 상에서 고유 조건 하에 정제하였다. 가용성 성분을 박테리아 재현탁화에 사용된 것과 동일한 완충제로 사전평형화된 GE 컬럼(예를 들어, 15 ㎖)(Ni 로딩) 상에 로딩하였다. 컬럼 상의 로딩 후에, 컬럼을 동일한 완충제로 세척하였다. 500 mM NaCl 및 상이한 농도의 이미다졸(5 내지 600 mM)을 함유하는 20mM 비신 완충제(pH 8.0)를 사용하여 용리를 수행하였다. 겔 분석 후에, 더욱 순수한 분획을 선택하고, 농축시키고, 추가의 정제 단계를 위해 SEC 크로마토그래피 상에 로딩하였다.
융합 단백질을 함유하는 분획을 SDS-PAGE에 의한 순도에 기초하여 선택하고, 비신 완충제(20mM 비신, 150 mM NaCl, 5mM EDTA pH8.0의 존재 또는 부재)에 대하여 투석하였다. 단백질 농도를 바이오래드(BioRad)의 DC Protein Assay를 사용하여 측정하였다. 이에 따라, 단백질을 풀링하고, 0.22 ㎛ 상에서 멸균-여과하고 -80℃에서 보관하였다.
대안적으로, IMAC 정제에 앞서, 로딩 및 세척을 위해 2mM 비신 완충제(pH 8.0)를 사용하는 DEAE 정제 단계를 행하고, 동일한 완충제이나 1M NaCl이 첨가된 완충제를 사용하여 기울기를 사용해 용리하였다.
실시예 3
개별 클로스트리듐 디피실레
ToxA
및 ToxB 단편의 클로닝 발현 및 정제
발현 플라스미드 및 재조합 균주
ToxA 및 ToxB의 단백질 단편을 엔코딩하는 유전자(서열 번호 8 및 서열 번호 9) 및 His 태그를 표준 절차를 사용하여 NdeI/XhoI 제한 부위를 사용해 pET24b(+) 발현 벡터(노바겐)로 클로닝하였다. 최종 구축물을 CaCl2-처리 세포를 사용하는 표준 방법에 따라 E. 콜라이 균주 BLR(DE3)를 재조합 발현 벡터로 형질전환시킴에 의해 생성하였다(문헌[Hanahan D. 《 Plasmid transformation by Simanis. 》 In Glover, D. M. (Ed), DNA cloning. IRL Press London. (1985): p. 109-135]).
숙주 균주:
BLR(DE3). BLR은 BL21의 recA 유도체이다. 상기 명칭(DE3)을 갖는 균주는 IPTG 유도성 T7 RNA 중합효소를 함유하는 λ 프로파지에 대하여 용원성이다. pET 벡터로부터의 단백질 발현을 위하여 λ DE3 용원이 설계된다. 이러한 균주는 또한 lon 및 ompT 프로테아제에 결함이 있다.
유전형 : E. 콜라이 BLR::DE3 균주, F- ompT hsdS B(rB - mB -) gal dcm (DE3) Δ(srl-recA)306::Tn10 (TetR)
재조합 단백질의 발현:
E. 콜라이 형질전환체를 한천 플레이트로부터 떼어내고, 이를 사용하여 200㎖의 LBT 브로쓰 ± 1%(w/v) 글루코스 + 카나마이신(50 ㎍/㎖)을 접종하여, 0.1 내지 0.2의 O.D.600nm를 수득하였다. 배양물을 37℃, 250 RPM에서 밤새 인큐베이션시켰다.
이러한 밤샘 배양물을 카나마이신(50 ㎍/㎖)을 함유하는 500 ㎖의 LBT 배지에 1:20으로 희석하고, O.D.620이 0.5/0.6에 도달할 때까지 250 rpm의 교반 속도에서 37℃에서 성장시켰다.
대략 0.6의 O.D.600nm에서, 배양물을 냉각시킨 후, 1 mM 아이소프로필 β-D-1-티오갈락토피라노시드(IPTG; 이엠디 케미칼즈 인코포레이티드, 카탈로그 번호: 5815)의 첨가에 의해 재조합 단백질의 발현을 유도하고, 23℃, 250 RPM에서 밤새 인큐베이션시켰다.
밤샘 유도(대략 16시간) 후에, 유도 후의 O.D.600nm를 평가하고, 배양물을 14 000 RPM에서 15분 동안 원심분리하고, 펠릿을 따로 -20℃에서 동결시켰다.
정제:
박테리아 펠릿을 프로테아제 저해제(EDTA가 없는 컴플리트, 로슈 카탈로그 번호 11873580001) 및 벤조나제(로슈 카탈로그 번호 1.01695.0001)의 혼합물이 보충된 500 mM NaCl을 함유하는 20 mM 비신 완충제(pH 8.0) 중에 재현탁화시켰다. 박테리아를 프렌치 프레스 시스템 2 × 20 000 PSI를 사용하여 용해시켰다. 가용성(상청액) 및 불용성(펠릿) 성분을 34 000g 또는 48 000g에서, 4℃에서 25 내지 30분 동안의 원심분리에 의해 분리하였다. 상청액을 수집하고, 0.22㎛ 필터 상에서 여과하였다.
6-His 태그화 단백질을 IMAC 상에서 고유 조건 하에 정제하였다. 가용성 성분을 박테리아 재현탁화에 사용된 것과 동일한 완충제로 사전평형화된 GE 컬럼(예를 들어, 15 ㎖)(Ni 로딩) 상에 로딩하였다. 로딩 후에, 컬럼을 동일한 완충제로 세척하였다.
ToxA에 대하여:
500 mM NaCl 및 상이한 농도의 이미다졸(5 내지 100 mM)을 함유하는 20mM 비신 완충제(pH 8.0)를 사용하여 용리를 수행하였다. 겔 분석 후에, 더욱 순수한 분획을 선택하고, 농축시키고, 이미다졸이 없는 동일한 완충제에서의 추가의 정제 단계를 위해 SEC 크로마토그래피(SUPERDEX™ 75) 상에 로딩하였다.
ToxB에 대하여:
500 mM NaCl 및 0.5% 데옥시콜레이트를 함유하는 20mM 비신 완충제(pH 8.0) 또는 150 mM NaCl이 있는 동일한 완충제로 2차 세척을 수행하였다. 500 mM NaCl 및 상이한 농도의 이미다졸(10 내지 500 mM)을 함유하는 20mM 비신 완충제(pH 8.0)를 사용하여 용리를 수행하였다. 겔 분석 후에, 더욱 순수한 분획을 선택하고, 5 mM EDTA를 보충하고, 5 mM EDTA가 있는 동일한 완충제에서의 추가의 정제 단계를 위하여 SEC 크로마토그래피(SUPERDEX™ 200) 상에 로딩하였다.
ToxA 또는 ToxB 단편을 함유하는 분획을 SDS-PAGE에 의한 순도에 기초하여 선택하고, 비신 완충제(20mM 비신, 150 mM NaCl, pH8.0)에 대하여 투석하고, 바이오래드의 RCDC Protein Assay를 사용하여 단백질 농도를 측정하였다. 이에 따라, 단백질을 풀링하고, 0.22㎛ 상에서 멸균-여과하고, -80℃에서 보관하였다.
실시예 4
5개의 클로스트리듐 디피실레 ToxA-ToxB 융합체의 분자량 측정
분석적 초원심분리를 사용하여, 분자가 원심력에 대한 반응으로 이동하는 속도를 측정함으로써 단백질 시료 내의 상이한 종의 용액 중의 균질성과 크기 분포를 측정하였다. 이는 이들의 분자 형상 및 질량에 따라 달라지는 침강 속도 실험에 의해 수득되는 상이한 종의 침강 계수의 계산에 기초한다.
1. AN-60Ti 로터를 15℃로 평형화시킨 후에, 단백질 시료를 42 000 RPM에서, Beckman-Coulter PROTEOMELAB™ XL-1 분석적 초원심분리기에서 회전시킨다.
a. F1 융합 단백질, 500 ㎍/㎖, 20mM 비신, 150mM NaCl, pH8.0
b. F2 융합 단백질, 500 ㎍/㎖, 20mM 비신, 150mM NaCl, pH8.0
c. F3 융합 단백질, 500 ㎍/㎖, 20mM 비신, 150mM NaCl, pH8.0
d. F4 융합 단백질, 500 ㎍/㎖, 20mM 비신, 150mM NaCl, pH8.0
e. F5 융합 단백질, 500 ㎍/㎖, 20mM 비신, 150mM NaCl, pH8.0
2. 데이터 수집을 위하여, 160회의 스캔을 매 5분마다 280nm에서 기록하였다.
3. 데이터 분석을 C(S) 분포의 측정을 위하여 프로그램 SEDFIT를 사용하여 수행하였다. 단백질의 부분 비체적의 측정을 이들의 아미노산 서열로부터 SEDNTERP 소프트웨어를 사용하여 수행하였다. 또한, SEDNTERP를 사용하여 완충제의 점도 및 밀도를 측정하였다.
4. 상이한 종의 분자량을 C(S) 분포 플롯(plot)이 혼합물의 크기 분포를 특성화하기 위해 C(M) 분포(농도 대 분자량)보다 더욱 뛰어난 원자료의 표현임을 고려하여, C(S) 분포 플롯(농도 대 침강 계수)으로부터 측정하였다.
도 8은 침강 속도 분석 초원심분리에 의해 결정되는 바와 같은 ToxA-ToxB 융합체의 분포를 기재한다.
모든 5개의 ToxA-ToxB 융합 단백질의 C(S) 분포로부터 검출되는 주요 종의 분자량은 이들의 단량체 형태에 상응한다. 5개의 융합체에 대하여 결정된 최적합 마찰비(frictional ratio)는 모두 2 내지 2,2이다. 이는 단백질이 단백질 구조와 일치할 연장형으로서 용액 중에 존재하는 것을 나타낼 수 있다.
실시예 5
원편광 이색성 및 형광 분광법에 의한 클로스트리듐 디피실레 ToxA-ToxB 융합체의 2차 및 3차 구조의 평가
원편광 이색성을 사용하여, 구조적 비대칭에 기인한 좌편광 대 우편광의 흡수차를 측정함으로써 단백질의 2차 구조 조성을 측정한다. 원자외선 영역(190 내지 250nm)에서 CD 스펙트럼의 형상 및 크기는 단백질이 베타-시트를 나타내는지, 알파-나선를 나타내는지, 랜덤 코일 구조를 나타내는지에 따라 상이하다. 주어진 단백질 시료에서 각각의 2차 구조 유형의 상대 존재비는 참조 스펙트럼과의 비교에 의해 계산할 수 있다.
단백질 시료의 3차 구조를 방향족 아미노산의 고정의 측정에 의해 평가할 수 있다. 근자외선 영역(250 내지 50nm)에서 CD 신호의 관찰은 페닐알라닌, 티로신 및 트립토판 잔기의 편극에 기여할 수 있으며, 이는 단백질이 명확히 정의된 구조로 폴딩됨을 나타내는 우수한 지표이다.
하기의 프로토콜을 사용하였다:
1. Jasco J-720 분광편광계 상에서의 1nm 분해능과 대역폭을 사용하여 178로부터 250nm까지 0,01㎝의 광로를 사용하여 원자외선 스펙트럼을 측정한다. 셀의 온도를 Peltier 온도조절 RTE-111 셀 블록에 의해 23℃로 유지한다. 측정 동안 10ℓ/분의 질소 흐름을 유지한다.
2. Jasco J-720 분광편광계 상에서의 1nm 분해능과 대역폭을 사용하여 250으로부터 300nm까지 0,01㎝의 광로를 사용하여 근자외선 스펙트럼을 측정한다. 셀의 온도를 Peltier 온도조절 RTE-111 셀 블록에 의해 23℃로 유지한다. 측정 동안 6ℓ/분의 질소 흐름을 유지한다.
모든 5개의 ToxA-ToxB 융합 단백질에 대한 원자외선 스펙트럼(도 9)의 관찰에 의해, 약한 함량의 알파 나선 구조와 높은 함량의 베타 시트 구조가 시사되었다. 또한, 모든 단백질은 230nm에서 최대치를 나타내었으며, 이는 가용성 구형 단백질에 대하여 특이한 것이다. 이는 특히 문헌에 널리 특성화되어 있으며, 이들의 알파 나선의 부재, 및 이들의 고함량의 베타 시트 및 방향족 아미노산에 대하여 알려져 있는 작은 그룹의 단백질과 관련이 있다(문헌[Zsila, Analytical Biochemistry, 391(2009) 154-156]). 이들 특징은 ToxA-ToxB 융합 단백질에 대하여 예상되는 구조와 일치한다. 230nm에서 양성 신호를 갖는 특징적 CD 스펙트럼을 나타내는 13개의 단백질의 결정 구조를 비교하였다(Protein Data Bank). 이들 단백질의 평균 2차 구조 함량은 42%의 베타 시트 ± 9% 및 7%의 알파 나선 ± 6%이다. 이는 ToxA-ToxB 융합 단백질의 스펙트럼 특징이 고 베타 시트 및 저 알파 나선 함유 단백질을 예측하는 것임을 강력하게 나타낸다.
모든 5개의 융합 단백질에 대한 근자외선 스펙트럼의 형상의 관찰(도 10)에 의해, 적어도 일부의 방향족 아미노산이 고정화되는 것이 나타나며, 이는 치밀하고 특이적인 3차 구조임을 강력하게 나타낸다. 더욱이, 변성 농도의 우레아를 사용한 단백질의 처리에 의해, 근자외선 신호의 소실이 야기되며, 이는 이러한 특이적인 스펙트럼이 단백질 폴딩 때문이었음을 추가로 나타낸다.
실시예 6
ToxA 또는 ToxB 단편 및 ToxA-ToxB 융합체를 사용한 마우스의 면역화
Balb/C 마우스를 실시예 2 및 3에 기재된 구축물로 면역화시켰다.
마우스 면역화
15마리의 암컷 Balb/c 마우스의 그룹을 0, 14 및 28일에, ASO3B가 보조된 3 또는 10 ㎍의 toxA 및 toxB의 개별 단편(실시예 2 참조)뿐 아니라, ToxA-ToxB 융합 단백질(실시예 3 참조)로 근육 내로 면역화시켰다. 10마리 마우스의 대조군에 단독의 ASO3B를 백신접종하였다.
항-ToxA 및 항-ToxB ELISA 역가를 42일에 수집한 개별 혈청에서 측정하였다(포스트(post) III).
적혈구 응집반응 저해 역가를 풀링된 포스트 III 혈청에서 측정하였다.
항-ToxA 및 항-ToxB ELISA 반응: 프로토콜
toxA 또는 toxB 단편의 시료를 4℃에서 밤새 고-결합(high-binding) 마이크로타이터 플레이트(Nunc MAXISORP™) 상에 인산염 완충 염수(PBS) 중 1 ㎍/㎖로 코팅하였다. 플레이트를 교반하면서 실온에서 30분 동안 PBS-BSA 1%로 블로킹하였다. 마우스 항-혈청을 PBS-BSA0.2%-TWEEN™ 0.05% 중에 1/500로 사전희석시킨 다음, 추가의 2배 희석액을 마이크로플레이트에서 제조하고, 교반시키면서 실온에서 30분 동안 인큐베이션시켰다. 세척 후에, PBS-BSA0.2%-트윈 0.05% 중에 1:5000으로 희석된 잭슨 이뮤노래보러터리즈 인코포레이티드(Jackson ImmunoLaboratories Inc.) 과산화효소-컨쥬게이트된 아피니퓨어(affiniPure) 염소 항-마우스 IgG(H+L)(ref: 115-035-003)를 사용하여, 결합된 뮤린 항체를 검출하였다. 검출 항체를 진탕시키면서 실온(RT)에서 30분 동안 인큐베이션시켰다. 실온에서 암 중에 15분 동안 pH 4.5 0.1M 시트르산염 완충제 10 ㎖ 당 4 mg O-페닐렌다이아민(OPD) + 5 ㎕ H2O2를 사용하여 발색시켰다. 50㎕의 HCl을 사용하여 반응을 중단시키고, 620 nm와 비교하여 490 nm에서 광학 밀도(OD)를 판독하였다.
혈청 중에 존재하는 항-ToxA 또는 항-ToxB 항체의 수준을 중간값 역가로 표현하였다. 각 처리군에서 15개의 시료(대조군에 대하여 10개)에 대하여 GMT를 계산하였다.
적혈구 응집반응 저해 검정: 프로토콜
마우스 풀링 항혈청(25 ㎕)의 단계 2배 희석을 96-웰 U-바닥 마이크로플레이트에서 인산염 완충 염수(PBS) 중에서 수행하였다.
이어서, 25 ㎍의 고유 독소 A(0,2 ㎍/웰)를 첨가하고, 플레이트를 실온에서 30분 동안 인큐베이션시켰다.
인큐베이션 후에, 2%로 희석된 50 ㎕의 정제된 토끼 적혈구를 각 웰에 첨가하였다. 플레이트를 37℃에서 2시간 동안 인큐베이션시켰다.
플레이트를 시각적으로 분석하고, 적혈구 응집반응은 웰에서 미만성 적색 세포로 제시되며, 적혈구 응집반응의 저해는 웰 내에 정착된 적색 점으로 관찰된다.
저해 역가는 적혈구 응집반응을 저해하는 혈청의 가장 높은 희석률의 역수로 정의되었다.
세포독성 검정
IMR90 섬유아세포를 EMEM + 10% 우태아혈청 + 1% 글루타민 + 1% 항생제(페니실린-스트렙토마이신-암포테리신) 중에서 5% CO2와 함께 37℃에서 배양하고, 96-웰 조직 배양 플레이트에서 5.104개 세포/웰의 밀도로 씨딩하였다.
24시간 후에, 세포 배지를 웰로부터 제거하였다.
세포 배지에서 마우스 풀링 항혈청(50 ㎕)의 단계 2배 희석을 수행하였다.
이어서, 50 ㎕의 고유 독소 B(0.5ng/㎖)를 첨가하고, 플레이트를 24시간 동안 5% CO2와 함께 37℃에서 인큐베이션시켰다.
세포를 24시간 후에 관찰하고, 둥근 세포의 비율을 측정하였다.
저해 역가는 둥근 세포를 50% 저해하는 혈청의 가장 높은 희석률의 역수로 정의되었다.
결과:
ToxA 항체를 사용한 ELISA 결과는 도 11에 기재되어 있다. 단독의 ToxA를 사용하고, 각각의 5개의 융합체도 또한 사용한 면역화 후에 항-ToxA 항체를 유도하였다.
이들 항체의 기능적 특성을 적혈구 응집반응 검정에서 시험하였다. 이러한 검정은 적혈구 응집반응이 ToxB와 함께 관찰되지 않기 때문에, ToxA 측정에 대해서만 적합하게 한다.
적혈구 응집반응 저해 역가는 도 12에 기재되어 있다. 항-ToxA 단편 혈청 또는 각각의 ToxA-ToxB 융합체에 대하여 유도된 혈청을 사용하여 적혈구 응집반응 저해를 관찰하였다.
또한, ToxB 항체를 사용한 ELISA를 수행하였다; 이의 결과는 도 13에 예시되어 있다. 단독의 ToxB 단편을 사용하고 또한 F2, F3 및 F4 융합체를 사용한 면역화 후에 항-ToxB 항체를 유도하였다.
세포독성 저해 역가는 도 14에 기재되어 있다. ToxB 단편 또는 ToxA-ToxB 융합체로 면역화된 마우스 유래의 혈청을 사용하여 수득된 저해 역가는 대조군 혈청을 사용하여 수득된 것보다 더 컸다.
실시예 7
4개의 추가의 융합 단백질의 설계, 클로닝, 발현 및 정제
실시예 1에 기재된 설계 원리를 사용하여 4개의 추가의 융합 단백질을 설계하고, 이들을 F54 Gly(서열 번호 21), F54 New(서열 번호 23), F5 ToxB(서열 번호 25) 및 F52 New(서열 번호 27)로 명명하였다.
이들 융합 단백질을 실시예 2에 기재된 절차에 따라 발현시켰다.
실시예 8
서열 번호 21, 서열 번호 23, 서열 번호 25 및 서열 번호 27에 기재된 클로스트리듐 디피실레
ToxA-ToxB 융합체의 분자량 측정
서열 번호 21, 서열 번호 23, 서열 번호 25 및 서열 번호 27에 기재된 융합체의 분자량을 실시예 4에 기재된 바와 같이 측정하였다.
도 15는 침강 속도 분석 초원심분리에 의해 결정되는 바와 같은 이들 4개의 추가 융합 단백질의 분포를 나타낸다.
서열 번호 21, 서열 번호 23, 서열 번호 25 및 서열 번호 27에 기재된 모든 4개의 단백질 융합체의 C(S) 분포로부터 결정된 주요 종의 분자량은 이들의 단량체 형태에 상응하며, 모든 단백질은 F1 내지 F5 융합체와 유사한 침강 특성을 나타낸다.
실시예 9
서열 번호 21, 서열 번호 23, 서열 번호 25 및 서열 번호 27에 기재된 클로스트리듐 디피실레 ToxA-ToxB 융합체의 2차 및 3차 구조의 평가
서열 번호 21, 서열 번호 23, 서열 번호 25 및 서열 번호 27에 기재된 융합체의 2차 및 3차 구조를 실시예 5에 기재된 방법에 따라 평가하였다. 이들 융합 단백질에 대한 원자외선 CD는 도 16에서 찾을 수 있으며, 이들 융합체에 대한 근자외선 스펙트럼은 도 17에서 찾을 수 있다.
서열 번호 21, 서열 번호 23, 서열 번호 25 및 서열 번호 27에 기재된 단백질의 근자외선 및 원자외선 CD 스펙트럼의 분석에 의해, 4개 모두가 F1 내지 F5 융합체와 동일한 고 베타 시트 구조를 갖는 것이 나타났다. 또한, 근자외선 스펙트럼의 관찰에 의해 F1 내지 F5 융합체와 비교하여, 3차 구조에서 방향족 아미노산의 위치의 유의미한 차이가 나타나지 않았다.
실시예 10
ToxA-ToxB 융합체를 사용한 마우스의 면역화
Balb/c 마우스를 실시예 6에 기재된 바와 같은 4개의 융합 단백질 구축물 F54 Gly(서열 번호 21), F54 New(서열 번호 23), F5 ToxB(서열 번호 25) 및 F52 New(서열 번호 27)로 면역화시켰다.
여기서, toxA 또는 toxB 단편의 시료를 고-결합 마이크로타이터 플레이트 상에 인산염 완충 염수 중에서 2㎍/㎖로 코팅시킨 것을 제외하고 실시예 6에 기재된 항-ToxA 및 항-ToxB ELISA 반응:프로토콜을 사용하여, ELISA를 수행하였다. 적혈구 응집반응 저해 검정을 실시예 6에 기재된 바와 같이 수행하였다. toxB 세포독성 검정을 실시예 6에 기재된 바와 같이 수행하였다. 추가의 toxA 세포독성 검정을 하기 기재된 바와 같이 수행하였다.
ToxA 세포독성 검정
HT29 세포를 DMEM + 10% 우태아혈청 + 1% 글루타민 + 1% 항생제(페니실린-스트렙토마이신-암포테리신) 중에서 5% CO2와 함께 37℃에서 배양하고, 96-웰 조직 배양 플레이트에서 5.104개 세포/웰의 밀도로 씨딩하였다.
24시간 후에, 세포 배지를 웰로부터 제거하였다.
세포 배지에서 마우스 풀링 항혈청(50 ㎕)의 단계 2배 희석을 수행하였다.
이어서, 50 ㎕의 고유 독소 B(0.15ng/㎖)를 첨가하고, 플레이트를 48시간 동안 5% CO2와 함께 37℃에서 인큐베이션시켰다.
세포를 48시간 후에 관찰하고, 둥근 세포의 비율을 측정하였다.
항-toxA ELISA, 항-toxB ELISA, 적혈구 응집반응 저해 및 세포독성 검정의 결과는 각각 도 18, 19, 20, 21 및 22에 기재되어 있다.
SEQUENCE LISTING
<110> GlaxoSmithKline Biologicals s.a
<120> Immunogenic Composition
<130> VB64650
<160> 35
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 2710
<212> PRT
<213> Clostridium Difficile
<400> 1
Met Ser Leu Ile Ser Lys Glu Glu Leu Ile Lys Leu Ala Tyr Ser Ile
1 5 10 15
Arg Pro Arg Glu Asn Glu Tyr Lys Thr Ile Leu Thr Asn Leu Asp Glu
20 25 30
Tyr Asn Lys Leu Thr Thr Asn Asn Asn Glu Asn Lys Tyr Leu Gln Leu
35 40 45
Lys Lys Leu Asn Glu Ser Ile Asp Val Phe Met Asn Lys Tyr Lys Thr
50 55 60
Ser Ser Arg Asn Arg Ala Leu Ser Asn Leu Lys Lys Asp Ile Leu Lys
65 70 75 80
Glu Val Ile Leu Ile Lys Asn Ser Asn Thr Ser Pro Val Glu Lys Asn
85 90 95
Leu His Phe Val Trp Ile Gly Gly Glu Val Ser Asp Ile Ala Leu Glu
100 105 110
Tyr Ile Lys Gln Trp Ala Asp Ile Asn Ala Glu Tyr Asn Ile Lys Leu
115 120 125
Trp Tyr Asp Ser Glu Ala Phe Leu Val Asn Thr Leu Lys Lys Ala Ile
130 135 140
Val Glu Ser Ser Thr Thr Glu Ala Leu Gln Leu Leu Glu Glu Glu Ile
145 150 155 160
Gln Asn Pro Gln Phe Asp Asn Met Lys Phe Tyr Lys Lys Arg Met Glu
165 170 175
Phe Ile Tyr Asp Arg Gln Lys Arg Phe Ile Asn Tyr Tyr Lys Ser Gln
180 185 190
Ile Asn Lys Pro Thr Val Pro Thr Ile Asp Asp Ile Ile Lys Ser His
195 200 205
Leu Val Ser Glu Tyr Asn Arg Asp Glu Thr Val Leu Glu Ser Tyr Arg
210 215 220
Thr Asn Ser Leu Arg Lys Ile Asn Ser Asn His Gly Ile Asp Ile Arg
225 230 235 240
Ala Asn Ser Leu Phe Thr Glu Gln Glu Leu Leu Asn Ile Tyr Ser Gln
245 250 255
Glu Leu Leu Asn Arg Gly Asn Leu Ala Ala Ala Ser Asp Ile Val Arg
260 265 270
Leu Leu Ala Leu Lys Asn Phe Gly Gly Val Tyr Leu Asp Val Asp Met
275 280 285
Leu Pro Gly Ile His Ser Asp Leu Phe Lys Thr Ile Ser Arg Pro Ser
290 295 300
Ser Ile Gly Leu Asp Arg Trp Glu Met Ile Lys Leu Glu Ala Ile Met
305 310 315 320
Lys Tyr Lys Lys Tyr Ile Asn Asn Tyr Thr Ser Glu Asn Phe Asp Lys
325 330 335
Leu Asp Gln Gln Leu Lys Asp Asn Phe Lys Leu Ile Ile Glu Ser Lys
340 345 350
Ser Glu Lys Ser Glu Ile Phe Ser Lys Leu Glu Asn Leu Asn Val Ser
355 360 365
Asp Leu Glu Ile Lys Ile Ala Phe Ala Leu Gly Ser Val Ile Asn Gln
370 375 380
Ala Leu Ile Ser Lys Gln Gly Ser Tyr Leu Thr Asn Leu Val Ile Glu
385 390 395 400
Gln Val Lys Asn Arg Tyr Gln Phe Leu Asn Gln His Leu Asn Pro Ala
405 410 415
Ile Glu Ser Asp Asn Asn Phe Thr Asp Thr Thr Lys Ile Phe His Asp
420 425 430
Ser Leu Phe Asn Ser Ala Thr Ala Glu Asn Ser Met Phe Leu Thr Lys
435 440 445
Ile Ala Pro Tyr Leu Gln Val Gly Phe Met Pro Glu Ala Arg Ser Thr
450 455 460
Ile Ser Leu Ser Gly Pro Gly Ala Tyr Ala Ser Ala Tyr Tyr Asp Phe
465 470 475 480
Ile Asn Leu Gln Glu Asn Thr Ile Glu Lys Thr Leu Lys Ala Ser Asp
485 490 495
Leu Ile Glu Phe Lys Phe Pro Glu Asn Asn Leu Ser Gln Leu Thr Glu
500 505 510
Gln Glu Ile Asn Ser Leu Trp Ser Phe Asp Gln Ala Ser Ala Lys Tyr
515 520 525
Gln Phe Glu Lys Tyr Val Arg Asp Tyr Thr Gly Gly Ser Leu Ser Glu
530 535 540
Asp Asn Gly Val Asp Phe Asn Lys Asn Thr Ala Leu Asp Lys Asn Tyr
545 550 555 560
Leu Leu Asn Asn Lys Ile Pro Ser Asn Asn Val Glu Glu Ala Gly Ser
565 570 575
Lys Asn Tyr Val His Tyr Ile Ile Gln Leu Gln Gly Asp Asp Ile Ser
580 585 590
Tyr Glu Ala Thr Cys Asn Leu Phe Ser Lys Asn Pro Lys Asn Ser Ile
595 600 605
Ile Ile Gln Arg Asn Met Asn Glu Ser Ala Lys Ser Tyr Phe Leu Ser
610 615 620
Asp Asp Gly Glu Ser Ile Leu Glu Leu Asn Lys Tyr Arg Ile Pro Glu
625 630 635 640
Arg Leu Lys Asn Lys Glu Lys Val Lys Val Thr Phe Ile Gly His Gly
645 650 655
Lys Asp Glu Phe Asn Thr Ser Glu Phe Ala Arg Leu Ser Val Asp Ser
660 665 670
Leu Ser Asn Glu Ile Ser Ser Phe Leu Asp Thr Ile Lys Leu Asp Ile
675 680 685
Ser Pro Lys Asn Val Glu Val Asn Leu Leu Gly Cys Asn Met Phe Ser
690 695 700
Tyr Asp Phe Asn Val Glu Glu Thr Tyr Pro Gly Lys Leu Leu Leu Ser
705 710 715 720
Ile Met Asp Lys Ile Thr Ser Thr Leu Pro Asp Val Asn Lys Asn Ser
725 730 735
Ile Thr Ile Gly Ala Asn Gln Tyr Glu Val Arg Ile Asn Ser Glu Gly
740 745 750
Arg Lys Glu Leu Leu Ala His Ser Gly Lys Trp Ile Asn Lys Glu Glu
755 760 765
Ala Ile Met Ser Asp Leu Ser Ser Lys Glu Tyr Ile Phe Phe Asp Ser
770 775 780
Ile Asp Asn Lys Leu Lys Ala Lys Ser Lys Asn Ile Pro Gly Leu Ala
785 790 795 800
Ser Ile Ser Glu Asp Ile Lys Thr Leu Leu Leu Asp Ala Ser Val Ser
805 810 815
Pro Asp Thr Lys Phe Ile Leu Asn Asn Leu Lys Leu Asn Ile Glu Ser
820 825 830
Ser Ile Gly Asp Tyr Ile Tyr Tyr Glu Lys Leu Glu Pro Val Lys Asn
835 840 845
Ile Ile His Asn Ser Ile Asp Asp Leu Ile Asp Glu Phe Asn Leu Leu
850 855 860
Glu Asn Val Ser Asp Glu Leu Tyr Glu Leu Lys Lys Leu Asn Asn Leu
865 870 875 880
Asp Glu Lys Tyr Leu Ile Ser Phe Glu Asp Ile Ser Lys Asn Asn Ser
885 890 895
Thr Tyr Ser Val Arg Phe Ile Asn Lys Ser Asn Gly Glu Ser Val Tyr
900 905 910
Val Glu Thr Glu Lys Glu Ile Phe Ser Lys Tyr Ser Glu His Ile Thr
915 920 925
Lys Glu Ile Ser Thr Ile Lys Asn Ser Ile Ile Thr Asp Val Asn Gly
930 935 940
Asn Leu Leu Asp Asn Ile Gln Leu Asp His Thr Ser Gln Val Asn Thr
945 950 955 960
Leu Asn Ala Ala Phe Phe Ile Gln Ser Leu Ile Asp Tyr Ser Ser Asn
965 970 975
Lys Asp Val Leu Asn Asp Leu Ser Thr Ser Val Lys Val Gln Leu Tyr
980 985 990
Ala Gln Leu Phe Ser Thr Gly Leu Asn Thr Ile Tyr Asp Ser Ile Gln
995 1000 1005
Leu Val Asn Leu Ile Ser Asn Ala Val Asn Asp Thr Ile Asn Val Leu
1010 1015 1020
Pro Thr Ile Thr Glu Gly Ile Pro Ile Val Ser Thr Ile Leu Asp Gly
1025 1030 1035 1040
Ile Asn Leu Gly Ala Ala Ile Lys Glu Leu Leu Asp Glu His Asp Pro
1045 1050 1055
Leu Leu Lys Lys Glu Leu Glu Ala Lys Val Gly Val Leu Ala Ile Asn
1060 1065 1070
Met Ser Leu Ser Ile Ala Ala Thr Val Ala Ser Ile Val Gly Ile Gly
1075 1080 1085
Ala Glu Val Thr Ile Phe Leu Leu Pro Ile Ala Gly Ile Ser Ala Gly
1090 1095 1100
Ile Pro Ser Leu Val Asn Asn Glu Leu Ile Leu His Asp Lys Ala Thr
1105 1110 1115 1120
Ser Val Val Asn Tyr Phe Asn His Leu Ser Glu Ser Lys Lys Tyr Gly
1125 1130 1135
Pro Leu Lys Thr Glu Asp Asp Lys Ile Leu Val Pro Ile Asp Asp Leu
1140 1145 1150
Val Ile Ser Glu Ile Asp Phe Asn Asn Asn Ser Ile Lys Leu Gly Thr
1155 1160 1165
Cys Asn Ile Leu Ala Met Glu Gly Gly Ser Gly His Thr Val Thr Gly
1170 1175 1180
Asn Ile Asp His Phe Phe Ser Ser Pro Ser Ile Ser Ser His Ile Pro
1185 1190 1195 1200
Ser Leu Ser Ile Tyr Ser Ala Ile Gly Ile Glu Thr Glu Asn Leu Asp
1205 1210 1215
Phe Ser Lys Lys Ile Met Met Leu Pro Asn Ala Pro Ser Arg Val Phe
1220 1225 1230
Trp Trp Glu Thr Gly Ala Val Pro Gly Leu Arg Ser Leu Glu Asn Asp
1235 1240 1245
Gly Thr Arg Leu Leu Asp Ser Ile Arg Asp Leu Tyr Pro Gly Lys Phe
1250 1255 1260
Tyr Trp Arg Phe Tyr Ala Phe Phe Asp Tyr Ala Ile Thr Thr Leu Lys
1265 1270 1275 1280
Pro Val Tyr Glu Asp Thr Asn Ile Lys Ile Lys Leu Asp Lys Asp Thr
1285 1290 1295
Arg Asn Phe Ile Met Pro Thr Ile Thr Thr Asn Glu Ile Arg Asn Lys
1300 1305 1310
Leu Ser Tyr Ser Phe Asp Gly Ala Gly Gly Thr Tyr Ser Leu Leu Leu
1315 1320 1325
Ser Ser Tyr Pro Ile Ser Thr Asn Ile Asn Leu Ser Lys Asp Asp Leu
1330 1335 1340
Trp Ile Phe Asn Ile Asp Asn Glu Val Arg Glu Ile Ser Ile Glu Asn
1345 1350 1355 1360
Gly Thr Ile Lys Lys Gly Lys Leu Ile Lys Asp Val Leu Ser Lys Ile
1365 1370 1375
Asp Ile Asn Lys Asn Lys Leu Ile Ile Gly Asn Gln Thr Ile Asp Phe
1380 1385 1390
Ser Gly Asp Ile Asp Asn Lys Asp Arg Tyr Ile Phe Leu Thr Cys Glu
1395 1400 1405
Leu Asp Asp Lys Ile Ser Leu Ile Ile Glu Ile Asn Leu Val Ala Lys
1410 1415 1420
Ser Tyr Ser Leu Leu Leu Ser Gly Asp Lys Asn Tyr Leu Ile Ser Asn
1425 1430 1435 1440
Leu Ser Asn Thr Ile Glu Lys Ile Asn Thr Leu Gly Leu Asp Ser Lys
1445 1450 1455
Asn Ile Ala Tyr Asn Tyr Thr Asp Glu Ser Asn Asn Lys Tyr Phe Gly
1460 1465 1470
Ala Ile Ser Lys Thr Ser Gln Lys Ser Ile Ile His Tyr Lys Lys Asp
1475 1480 1485
Ser Lys Asn Ile Leu Glu Phe Tyr Asn Asp Ser Thr Leu Glu Phe Asn
1490 1495 1500
Ser Lys Asp Phe Ile Ala Glu Asp Ile Asn Val Phe Met Lys Asp Asp
1505 1510 1515 1520
Ile Asn Thr Ile Thr Gly Lys Tyr Tyr Val Asp Asn Asn Thr Asp Lys
1525 1530 1535
Ser Ile Asp Phe Ser Ile Ser Leu Val Ser Lys Asn Gln Val Lys Val
1540 1545 1550
Asn Gly Leu Tyr Leu Asn Glu Ser Val Tyr Ser Ser Tyr Leu Asp Phe
1555 1560 1565
Val Lys Asn Ser Asp Gly His His Asn Thr Ser Asn Phe Met Asn Leu
1570 1575 1580
Phe Leu Asp Asn Ile Ser Phe Trp Lys Leu Phe Gly Phe Glu Asn Ile
1585 1590 1595 1600
Asn Phe Val Ile Asp Lys Tyr Phe Thr Leu Val Gly Lys Thr Asn Leu
1605 1610 1615
Gly Tyr Val Glu Phe Ile Cys Asp Asn Asn Lys Asn Ile Asp Ile Tyr
1620 1625 1630
Phe Gly Glu Trp Lys Thr Ser Ser Ser Lys Ser Thr Ile Phe Ser Gly
1635 1640 1645
Asn Gly Arg Asn Val Val Val Glu Pro Ile Tyr Asn Pro Asp Thr Gly
1650 1655 1660
Glu Asp Ile Ser Thr Ser Leu Asp Phe Ser Tyr Glu Pro Leu Tyr Gly
1665 1670 1675 1680
Ile Asp Arg Tyr Ile Asn Lys Val Leu Ile Ala Pro Asp Leu Tyr Thr
1685 1690 1695
Ser Leu Ile Asn Ile Asn Thr Asn Tyr Tyr Ser Asn Glu Tyr Tyr Pro
1700 1705 1710
Glu Ile Ile Val Leu Asn Pro Asn Thr Phe His Lys Lys Val Asn Ile
1715 1720 1725
Asn Leu Asp Ser Ser Ser Phe Glu Tyr Lys Trp Ser Thr Glu Gly Ser
1730 1735 1740
Asp Phe Ile Leu Val Arg Tyr Leu Glu Glu Ser Asn Lys Lys Ile Leu
1745 1750 1755 1760
Gln Lys Ile Arg Ile Lys Gly Ile Leu Ser Asn Thr Gln Ser Phe Asn
1765 1770 1775
Lys Met Ser Ile Asp Phe Lys Asp Ile Lys Lys Leu Ser Leu Gly Tyr
1780 1785 1790
Ile Met Ser Asn Phe Lys Ser Phe Asn Ser Glu Asn Glu Leu Asp Arg
1795 1800 1805
Asp His Leu Gly Phe Lys Ile Ile Asp Asn Lys Thr Tyr Tyr Tyr Asp
1810 1815 1820
Glu Asp Ser Lys Leu Val Lys Gly Leu Ile Asn Ile Asn Asn Ser Leu
1825 1830 1835 1840
Phe Tyr Phe Asp Pro Ile Glu Phe Asn Leu Val Thr Gly Trp Gln Thr
1845 1850 1855
Ile Asn Gly Lys Lys Tyr Tyr Phe Asp Ile Asn Thr Gly Ala Ala Leu
1860 1865 1870
Thr Ser Tyr Lys Ile Ile Asn Gly Lys His Phe Tyr Phe Asn Asn Asp
1875 1880 1885
Gly Val Met Gln Leu Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
1890 1895 1900
Phe Ala Pro Ala Asn Thr Gln Asn Asn Asn Ile Glu Gly Gln Ala Ile
1905 1910 1915 1920
Val Tyr Gln Ser Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe
1925 1930 1935
Asp Asn Asn Ser Lys Ala Val Thr Gly Trp Arg Ile Ile Asn Asn Glu
1940 1945 1950
Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala Ala Val Gly Leu Gln
1955 1960 1965
Val Ile Asp Asn Asn Lys Tyr Tyr Phe Asn Pro Asp Thr Ala Ile Ile
1970 1975 1980
Ser Lys Gly Trp Gln Thr Val Asn Gly Ser Arg Tyr Tyr Phe Asp Thr
1985 1990 1995 2000
Asp Thr Ala Ile Ala Phe Asn Gly Tyr Lys Thr Ile Asp Gly Lys His
2005 2010 2015
Phe Tyr Phe Asp Ser Asp Cys Val Val Lys Ile Gly Val Phe Ser Thr
2020 2025 2030
Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Tyr Asn Asn Asn
2035 2040 2045
Ile Glu Gly Gln Ala Ile Val Tyr Gln Ser Lys Phe Leu Thr Leu Asn
2050 2055 2060
Gly Lys Lys Tyr Tyr Phe Asp Asn Asn Ser Lys Ala Val Thr Gly Leu
2065 2070 2075 2080
Gln Thr Ile Asp Ser Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ala Glu
2085 2090 2095
Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
2100 2105 2110
Thr Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys
2115 2120 2125
Lys Tyr Tyr Phe Asn Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr
2130 2135 2140
Ile Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln
2145 2150 2155 2160
Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala
2165 2170 2175
Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn
2180 2185 2190
Glu Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser
2195 2200 2205
Lys Ala Val Thr Gly Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe
2210 2215 2220
Asn Pro Asn Asn Ala Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn
2225 2230 2235 2240
Asp Lys Tyr Tyr Phe Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile
2245 2250 2255
Thr Ile Glu Arg Asn Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys
2260 2265 2270
Met Val Thr Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala
2275 2280 2285
Pro Ala Asn Thr His Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr
2290 2295 2300
Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn
2305 2310 2315 2320
Asp Ser Lys Ala Val Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
2325 2330 2335
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
2340 2345 2350
Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr
2355 2360 2365
Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr
2370 2375 2380
Phe Ile Ala Ser Thr Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr
2385 2390 2395 2400
Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn
2405 2410 2415
Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu
2420 2425 2430
Gly Gln Ala Ile Leu Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys
2435 2440 2445
Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr
2450 2455 2460
Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val
2465 2470 2475 2480
Thr Gly Trp Gln Thr Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
2485 2490 2495
Thr Ser Ile Ala Ser Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe
2500 2505 2510
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
2515 2520 2525
Asp Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
2530 2535 2540
Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp
2545 2550 2555 2560
Asn Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val
2565 2570 2575
Thr Ile Asp Gly Asn Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly
2580 2585 2590
Ala Asn Gly Tyr Lys Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn
2595 2600 2605
Gly Leu Pro Gln Ile Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr
2610 2615 2620
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
2625 2630 2635 2640
Arg Tyr Gln Asn Arg Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe
2645 2650 2655
Gly Asn Asn Ser Lys Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys
2660 2665 2670
Val Tyr Tyr Phe Met Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu
2675 2680 2685
Phe Glu Ile Asp Gly Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys
2690 2695 2700
Ala Pro Gly Ile Tyr Gly
2705 2710
<210> 2
<211> 2366
<212> PRT
<213> Clostridium Difficile
<400> 2
Met Ser Leu Val Asn Arg Lys Gln Leu Glu Lys Met Ala Asn Val Arg
1 5 10 15
Phe Arg Thr Gln Glu Asp Glu Tyr Val Ala Ile Leu Asp Ala Leu Glu
20 25 30
Glu Tyr His Asn Met Ser Glu Asn Thr Val Val Glu Lys Tyr Leu Lys
35 40 45
Leu Lys Asp Ile Asn Ser Leu Thr Asp Ile Tyr Ile Asp Thr Tyr Lys
50 55 60
Lys Ser Gly Arg Asn Lys Ala Leu Lys Lys Phe Lys Glu Tyr Leu Val
65 70 75 80
Thr Glu Val Leu Glu Leu Lys Asn Asn Asn Leu Thr Pro Val Glu Lys
85 90 95
Asn Leu His Phe Val Trp Ile Gly Gly Gln Ile Asn Asp Thr Ala Ile
100 105 110
Asn Tyr Ile Asn Gln Trp Lys Asp Val Asn Ser Asp Tyr Asn Val Asn
115 120 125
Val Phe Tyr Asp Ser Asn Ala Phe Leu Ile Asn Thr Leu Lys Lys Thr
130 135 140
Val Val Glu Ser Ala Ile Asn Asp Thr Leu Glu Ser Phe Arg Glu Asn
145 150 155 160
Leu Asn Asp Pro Arg Phe Asp Tyr Asn Lys Phe Phe Arg Lys Arg Met
165 170 175
Glu Ile Ile Tyr Asp Lys Gln Lys Asn Phe Ile Asn Tyr Tyr Lys Ala
180 185 190
Gln Arg Glu Glu Asn Pro Glu Leu Ile Ile Asp Asp Ile Val Lys Thr
195 200 205
Tyr Leu Ser Asn Glu Tyr Ser Lys Glu Ile Asp Glu Leu Asn Thr Tyr
210 215 220
Ile Glu Glu Ser Leu Asn Lys Ile Thr Gln Asn Ser Gly Asn Asp Val
225 230 235 240
Arg Asn Phe Glu Glu Phe Lys Asn Gly Glu Ser Phe Asn Leu Tyr Glu
245 250 255
Gln Glu Leu Val Glu Arg Trp Asn Leu Ala Ala Ala Ser Asp Ile Leu
260 265 270
Arg Ile Ser Ala Leu Lys Glu Ile Gly Gly Met Tyr Leu Asp Val Asp
275 280 285
Met Leu Pro Gly Ile Gln Pro Asp Leu Phe Glu Ser Ile Glu Lys Pro
290 295 300
Ser Ser Val Thr Val Asp Phe Trp Glu Met Thr Lys Leu Glu Ala Ile
305 310 315 320
Met Lys Tyr Lys Glu Tyr Ile Pro Glu Tyr Thr Ser Glu His Phe Asp
325 330 335
Met Leu Asp Glu Glu Val Gln Ser Ser Phe Glu Ser Val Leu Ala Ser
340 345 350
Lys Ser Asp Lys Ser Glu Ile Phe Ser Ser Leu Gly Asp Met Glu Ala
355 360 365
Ser Pro Leu Glu Val Lys Ile Ala Phe Asn Ser Lys Gly Ile Ile Asn
370 375 380
Gln Gly Leu Ile Ser Val Lys Asp Ser Tyr Cys Ser Asn Leu Ile Val
385 390 395 400
Lys Gln Ile Glu Asn Arg Tyr Lys Ile Leu Asn Asn Ser Leu Asn Pro
405 410 415
Ala Ile Ser Glu Asp Asn Asp Phe Asn Thr Thr Thr Asn Thr Phe Ile
420 425 430
Asp Ser Ile Met Ala Glu Ala Asn Ala Asp Asn Gly Arg Phe Met Met
435 440 445
Glu Leu Gly Lys Tyr Leu Arg Val Gly Phe Phe Pro Asp Val Lys Thr
450 455 460
Thr Ile Asn Leu Ser Gly Pro Glu Ala Tyr Ala Ala Ala Tyr Gln Asp
465 470 475 480
Leu Leu Met Phe Lys Glu Gly Ser Met Asn Ile His Leu Ile Glu Ala
485 490 495
Asp Leu Arg Asn Phe Glu Ile Ser Lys Thr Asn Ile Ser Gln Ser Thr
500 505 510
Glu Gln Glu Met Ala Ser Leu Trp Ser Phe Asp Asp Ala Arg Ala Lys
515 520 525
Ala Gln Phe Glu Glu Tyr Lys Arg Asn Tyr Phe Glu Gly Ser Leu Gly
530 535 540
Glu Asp Asp Asn Leu Asp Phe Ser Gln Asn Ile Val Val Asp Lys Glu
545 550 555 560
Tyr Leu Leu Glu Lys Ile Ser Ser Leu Ala Arg Ser Ser Glu Arg Gly
565 570 575
Tyr Ile His Tyr Ile Val Gln Leu Gln Gly Asp Lys Ile Ser Tyr Glu
580 585 590
Ala Ala Cys Asn Leu Phe Ala Lys Thr Pro Tyr Asp Ser Val Leu Phe
595 600 605
Gln Lys Asn Ile Glu Asp Ser Glu Ile Ala Tyr Tyr Tyr Asn Pro Gly
610 615 620
Asp Gly Glu Ile Gln Glu Ile Asp Lys Tyr Lys Ile Pro Ser Ile Ile
625 630 635 640
Ser Asp Arg Pro Lys Ile Lys Leu Thr Phe Ile Gly His Gly Lys Asp
645 650 655
Glu Phe Asn Thr Asp Ile Phe Ala Gly Phe Asp Val Asp Ser Leu Ser
660 665 670
Thr Glu Ile Glu Ala Ala Ile Asp Leu Ala Lys Glu Asp Ile Ser Pro
675 680 685
Lys Ser Ile Glu Ile Asn Leu Leu Gly Cys Asn Met Phe Ser Tyr Ser
690 695 700
Ile Asn Val Glu Glu Thr Tyr Pro Gly Lys Leu Leu Leu Lys Val Lys
705 710 715 720
Asp Lys Ile Ser Glu Leu Met Pro Ser Ile Ser Gln Asp Ser Ile Ile
725 730 735
Val Ser Ala Asn Gln Tyr Glu Val Arg Ile Asn Ser Glu Gly Arg Arg
740 745 750
Glu Leu Leu Asp His Ser Gly Glu Trp Ile Asn Lys Glu Glu Ser Ile
755 760 765
Ile Lys Asp Ile Ser Ser Lys Glu Tyr Ile Ser Phe Asn Pro Lys Glu
770 775 780
Asn Lys Ile Thr Val Lys Ser Lys Asn Leu Pro Glu Leu Ser Thr Leu
785 790 795 800
Leu Gln Glu Ile Arg Asn Asn Ser Asn Ser Ser Asp Ile Glu Leu Glu
805 810 815
Glu Lys Val Met Leu Thr Glu Cys Glu Ile Asn Val Ile Ser Asn Ile
820 825 830
Asp Thr Gln Ile Val Glu Glu Arg Ile Glu Glu Ala Lys Asn Leu Thr
835 840 845
Ser Asp Ser Ile Asn Tyr Ile Lys Asp Glu Phe Lys Leu Ile Glu Ser
850 855 860
Ile Ser Asp Ala Leu Cys Asp Leu Lys Gln Gln Asn Glu Leu Glu Asp
865 870 875 880
Ser His Phe Ile Ser Phe Glu Asp Ile Ser Glu Thr Asp Glu Gly Phe
885 890 895
Ser Ile Arg Phe Ile Asn Lys Glu Thr Gly Glu Ser Ile Phe Val Glu
900 905 910
Thr Glu Lys Thr Ile Phe Ser Glu Tyr Ala Asn His Ile Thr Glu Glu
915 920 925
Ile Ser Lys Ile Lys Gly Thr Ile Phe Asp Thr Val Asn Gly Lys Leu
930 935 940
Val Lys Lys Val Asn Leu Asp Thr Thr His Glu Val Asn Thr Leu Asn
945 950 955 960
Ala Ala Phe Phe Ile Gln Ser Leu Ile Glu Tyr Asn Ser Ser Lys Glu
965 970 975
Ser Leu Ser Asn Leu Ser Val Ala Met Lys Val Gln Val Tyr Ala Gln
980 985 990
Leu Phe Ser Thr Gly Leu Asn Thr Ile Thr Asp Ala Ala Lys Val Val
995 1000 1005
Glu Leu Val Ser Thr Ala Leu Asp Glu Thr Ile Asp Leu Leu Pro Thr
1010 1015 1020
Leu Ser Glu Gly Leu Pro Ile Ile Ala Thr Ile Ile Asp Gly Val Ser
1025 1030 1035 1040
Leu Gly Ala Ala Ile Lys Glu Leu Ser Glu Thr Ser Asp Pro Leu Leu
1045 1050 1055
Arg Gln Glu Ile Glu Ala Lys Ile Gly Ile Met Ala Val Asn Leu Thr
1060 1065 1070
Thr Ala Thr Thr Ala Ile Ile Thr Ser Ser Leu Gly Ile Ala Ser Gly
1075 1080 1085
Phe Ser Ile Leu Leu Val Pro Leu Ala Gly Ile Ser Ala Gly Ile Pro
1090 1095 1100
Ser Leu Val Asn Asn Glu Leu Val Leu Arg Asp Lys Ala Thr Lys Val
1105 1110 1115 1120
Val Asp Tyr Phe Lys His Val Ser Leu Val Glu Thr Glu Gly Val Phe
1125 1130 1135
Thr Leu Leu Asp Asp Lys Ile Met Met Pro Gln Asp Asp Leu Val Ile
1140 1145 1150
Ser Glu Ile Asp Phe Asn Asn Asn Ser Ile Val Leu Gly Lys Cys Glu
1155 1160 1165
Ile Trp Arg Met Glu Gly Gly Ser Gly His Thr Val Thr Asp Asp Ile
1170 1175 1180
Asp His Phe Phe Ser Ala Pro Ser Ile Thr Tyr Arg Glu Pro His Leu
1185 1190 1195 1200
Ser Ile Tyr Asp Val Leu Glu Val Gln Lys Glu Glu Leu Asp Leu Ser
1205 1210 1215
Lys Asp Leu Met Val Leu Pro Asn Ala Pro Asn Arg Val Phe Ala Trp
1220 1225 1230
Glu Thr Gly Trp Thr Pro Gly Leu Arg Ser Leu Glu Asn Asp Gly Thr
1235 1240 1245
Lys Leu Leu Asp Arg Ile Arg Asp Asn Tyr Glu Gly Glu Phe Tyr Trp
1250 1255 1260
Arg Tyr Phe Ala Phe Ile Ala Asp Ala Leu Ile Thr Thr Leu Lys Pro
1265 1270 1275 1280
Arg Tyr Glu Asp Thr Asn Ile Arg Ile Asn Leu Asp Ser Asn Thr Arg
1285 1290 1295
Ser Phe Ile Val Pro Ile Ile Thr Thr Glu Tyr Ile Arg Glu Lys Leu
1300 1305 1310
Ser Tyr Ser Phe Tyr Gly Ser Gly Gly Thr Tyr Ala Leu Ser Leu Ser
1315 1320 1325
Gln Tyr Asn Met Gly Ile Asn Ile Glu Leu Ser Glu Ser Asp Val Trp
1330 1335 1340
Ile Ile Asp Val Asp Asn Val Val Arg Asp Val Thr Ile Glu Ser Asp
1345 1350 1355 1360
Lys Ile Lys Lys Gly Asp Leu Ile Glu Gly Ile Leu Ser Thr Leu Ser
1365 1370 1375
Ile Glu Glu Asn Lys Ile Ile Leu Asn Ser His Glu Ile Asn Phe Ser
1380 1385 1390
Gly Glu Val Asn Gly Ser Asn Gly Phe Val Ser Leu Thr Phe Ser Ile
1395 1400 1405
Leu Glu Gly Ile Asn Ala Ile Ile Glu Val Asp Leu Leu Ser Lys Ser
1410 1415 1420
Tyr Lys Leu Leu Ile Ser Gly Glu Leu Lys Ile Leu Met Leu Asn Ser
1425 1430 1435 1440
Asn His Ile Gln Gln Lys Ile Asp Tyr Ile Gly Phe Asn Ser Glu Leu
1445 1450 1455
Gln Lys Asn Ile Pro Tyr Ser Phe Val Asp Ser Glu Gly Lys Glu Asn
1460 1465 1470
Gly Phe Ile Asn Gly Ser Thr Lys Glu Gly Leu Phe Val Ser Glu Leu
1475 1480 1485
Pro Asp Val Val Leu Ile Ser Lys Val Tyr Met Asp Asp Ser Lys Pro
1490 1495 1500
Ser Phe Gly Tyr Tyr Ser Asn Asn Leu Lys Asp Val Lys Val Ile Thr
1505 1510 1515 1520
Lys Asp Asn Val Asn Ile Leu Thr Gly Tyr Tyr Leu Lys Asp Asp Ile
1525 1530 1535
Lys Ile Ser Leu Ser Leu Thr Leu Gln Asp Glu Lys Thr Ile Lys Leu
1540 1545 1550
Asn Ser Val His Leu Asp Glu Ser Gly Val Ala Glu Ile Leu Lys Phe
1555 1560 1565
Met Asn Arg Lys Gly Asn Thr Asn Thr Ser Asp Ser Leu Met Ser Phe
1570 1575 1580
Leu Glu Ser Met Asn Ile Lys Ser Ile Phe Val Asn Phe Leu Gln Ser
1585 1590 1595 1600
Asn Ile Lys Phe Ile Leu Asp Ala Asn Phe Ile Ile Ser Gly Thr Thr
1605 1610 1615
Ser Ile Gly Gln Phe Glu Phe Ile Cys Asp Glu Asn Asp Asn Ile Gln
1620 1625 1630
Pro Tyr Phe Ile Lys Phe Asn Thr Leu Glu Thr Asn Tyr Thr Leu Tyr
1635 1640 1645
Val Gly Asn Arg Gln Asn Met Ile Val Glu Pro Asn Tyr Asp Leu Asp
1650 1655 1660
Asp Ser Gly Asp Ile Ser Ser Thr Val Ile Asn Phe Ser Gln Lys Tyr
1665 1670 1675 1680
Leu Tyr Gly Ile Asp Ser Cys Val Asn Lys Val Val Ile Ser Pro Asn
1685 1690 1695
Ile Tyr Thr Asp Glu Ile Asn Ile Thr Pro Val Tyr Glu Thr Asn Asn
1700 1705 1710
Thr Tyr Pro Glu Val Ile Val Leu Asp Ala Asn Tyr Ile Asn Glu Lys
1715 1720 1725
Ile Asn Val Asn Ile Asn Asp Leu Ser Ile Arg Tyr Val Trp Ser Asn
1730 1735 1740
Asp Gly Asn Asp Phe Ile Leu Met Ser Thr Ser Glu Glu Asn Lys Val
1745 1750 1755 1760
Ser Gln Val Lys Ile Arg Phe Val Asn Val Phe Lys Asp Lys Thr Leu
1765 1770 1775
Ala Asn Lys Leu Ser Phe Asn Phe Ser Asp Lys Gln Asp Val Pro Val
1780 1785 1790
Ser Glu Ile Ile Leu Ser Phe Thr Pro Ser Tyr Tyr Glu Asp Gly Leu
1795 1800 1805
Ile Gly Tyr Asp Leu Gly Leu Val Ser Leu Tyr Asn Glu Lys Phe Tyr
1810 1815 1820
Ile Asn Asn Phe Gly Met Met Val Ser Gly Leu Ile Tyr Ile Asn Asp
1825 1830 1835 1840
Ser Leu Tyr Tyr Phe Lys Pro Pro Val Asn Asn Leu Ile Thr Gly Phe
1845 1850 1855
Val Thr Val Gly Asp Asp Lys Tyr Tyr Phe Asn Pro Ile Asn Gly Gly
1860 1865 1870
Ala Ala Ser Ile Gly Glu Thr Ile Ile Asp Asp Lys Asn Tyr Tyr Phe
1875 1880 1885
Asn Gln Ser Gly Val Leu Gln Thr Gly Val Phe Ser Thr Glu Asp Gly
1890 1895 1900
Phe Lys Tyr Phe Ala Pro Ala Asn Thr Leu Asp Glu Asn Leu Glu Gly
1905 1910 1915 1920
Glu Ala Ile Asp Phe Thr Gly Lys Leu Ile Ile Asp Glu Asn Ile Tyr
1925 1930 1935
Tyr Phe Asp Asp Asn Tyr Arg Gly Ala Val Glu Trp Lys Glu Leu Asp
1940 1945 1950
Gly Glu Met His Tyr Phe Ser Pro Glu Thr Gly Lys Ala Phe Lys Gly
1955 1960 1965
Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser Asp Gly Val
1970 1975 1980
Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe Asp
1985 1990 1995 2000
Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys His
2005 2010 2015
Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn Thr
2020 2025 2030
Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly Asn
2035 2040 2045
Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn
2050 2055 2060
Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp Lys
2065 2070 2075 2080
Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu
2085 2090 2095
Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn
2100 2105 2110
Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys Val
2115 2120 2125
Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn Ile
2130 2135 2140
Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile Gly
2145 2150 2155 2160
Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr
2165 2170 2175
Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu Val
2180 2185 2190
Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu
2195 2200 2205
Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe
2210 2215 2220
Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp
2225 2230 2235 2240
Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu Ile
2245 2250 2255
Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln
2260 2265 2270
Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp
2275 2280 2285
Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr
2290 2295 2300
Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile
2305 2310 2315 2320
Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr
2325 2330 2335
Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu Glu
2340 2345 2350
Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser Glu
2355 2360 2365
<210> 3
<211> 966
<212> PRT
<213> Clostridium Difficile
<400> 3
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp
500 505 510
Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu
515 520 525
His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Val
530 535 540
Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met Pro Asp
545 550 555 560
Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly Val Ile
565 570 575
Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Pro Gly Phe Val Ser Ile
580 585 590
Asn Asp Asn Lys His Tyr Phe Asp Asp Ser Gly Val Met Lys Val Gly
595 600 605
Tyr Thr Glu Ile Asp Gly Lys His Phe Tyr Phe Ala Glu Asn Gly Glu
610 615 620
Met Gln Ile Gly Val Phe Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala
625 630 635 640
His His Asn Glu Asp Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr
645 650 655
Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser
660 665 670
Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr
675 680 685
Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile
690 695 700
Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly
705 710 715 720
Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile
725 730 735
Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp
740 745 750
Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr
755 760 765
Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln
770 775 780
Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr
785 790 795 800
Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu
805 810 815
Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys
820 825 830
Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys
835 840 845
Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr
850 855 860
Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp
865 870 875 880
Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe
885 890 895
Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp
900 905 910
Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu
915 920 925
Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly
930 935 940
Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala
945 950 955 960
Gln Leu Val Ile Ser Glu
965
<210> 4
<211> 966
<212> PRT
<213> Clostridium Difficile
<400> 4
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp
500 505 510
Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu
515 520 525
His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Val
530 535 540
Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met Pro Asp
545 550 555 560
Thr Ala Met Ala Ala Ala Gly Gly Leu Asn Gln Ile Gly Asp Tyr Lys
565 570 575
Tyr Tyr Phe Asn Ser Asp Gly Val Met Gln Lys Gly Phe Val Ser Ile
580 585 590
Asn Asp Asn Lys His Tyr Phe Asp Asp Ser Gly Val Met Lys Val Gly
595 600 605
Tyr Thr Glu Ile Asp Gly Lys His Phe Tyr Phe Ala Glu Asn Gly Glu
610 615 620
Met Gln Ile Gly Val Phe Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala
625 630 635 640
His His Asn Glu Asp Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr
645 650 655
Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser
660 665 670
Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr
675 680 685
Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile
690 695 700
Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly
705 710 715 720
Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile
725 730 735
Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp
740 745 750
Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr
755 760 765
Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln
770 775 780
Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr
785 790 795 800
Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu
805 810 815
Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys
820 825 830
Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys
835 840 845
Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr
850 855 860
Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp
865 870 875 880
Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe
885 890 895
Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp
900 905 910
Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu
915 920 925
Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly
930 935 940
Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala
945 950 955 960
Gln Leu Val Ile Ser Glu
965
<210> 5
<211> 833
<212> PRT
<213> Clostridium Difficile
<400> 5
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala His His Asn Glu Asp
500 505 510
Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn
515 520 525
Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val
530 535 540
Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp
545 550 555 560
Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr
565 570 575
Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn
580 585 590
Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val
595 600 605
Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val
610 615 620
Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro
625 630 635 640
Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser
645 650 655
Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr
660 665 670
Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys
675 680 685
Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu
690 695 700
Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr
705 710 715 720
Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly
725 730 735
Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe
740 745 750
Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly
755 760 765
Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly
770 775 780
Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr
785 790 795 800
Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp
805 810 815
Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser
820 825 830
Glu
<210> 6
<211> 1057
<212> PRT
<213> Clostridium Difficile
<400> 6
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp
500 505 510
Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu
515 520 525
His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Val
530 535 540
Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met Pro Asp
545 550 555 560
Thr Ala Met Ala Ala Ala Gly Gly Glu Thr Ile Ile Asp Asp Lys Asn
565 570 575
Tyr Tyr Phe Asn Gln Ser Gly Val Leu Gln Thr Gly Val Phe Ser Thr
580 585 590
Glu Asp Gly Phe Lys Tyr Phe Ala Pro Ala Asn Thr Leu Asp Glu Asn
595 600 605
Leu Glu Gly Glu Ala Ile Asp Phe Thr Gly Lys Leu Ile Ile Asp Glu
610 615 620
Asn Ile Tyr Tyr Phe Asp Asp Asn Tyr Arg Gly Ala Val Glu Trp Lys
625 630 635 640
Glu Leu Asp Gly Glu Met His Tyr Phe Ser Pro Glu Thr Gly Lys Ala
645 650 655
Phe Lys Gly Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser
660 665 670
Asp Gly Val Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn Lys His
675 680 685
Tyr Phe Asp Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu Ile Asp
690 695 700
Gly Lys His Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile Gly Val
705 710 715 720
Phe Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn Glu Asp
725 730 735
Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn
740 745 750
Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val
755 760 765
Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp
770 775 780
Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr
785 790 795 800
Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn
805 810 815
Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val
820 825 830
Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val
835 840 845
Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro
850 855 860
Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser
865 870 875 880
Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr
885 890 895
Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys
900 905 910
Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu
915 920 925
Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr
930 935 940
Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly
945 950 955 960
Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe
965 970 975
Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly
980 985 990
Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly
995 1000 1005
Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr
1010 1015 1020
Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp
1025 1030 1035 1040
Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser
1045 1050 1055
Glu
<210> 7
<211> 971
<212> PRT
<213> Clostridium Difficile
<400> 7
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp
500 505 510
Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu
515 520 525
His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Val
530 535 540
Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met Pro Asp
545 550 555 560
Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly Val Ile
565 570 575
Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Pro Gly Ile Tyr Gly Gly
580 585 590
Gly Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe Asp Asp Ser Gly
595 600 605
Val Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys His Phe Tyr Phe
610 615 620
Ala Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn Thr Glu Asp Gly
625 630 635 640
Phe Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly Asn Glu Glu Gly
645 650 655
Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr
660 665 670
Tyr Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu
675 680 685
Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile
690 695 700
Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly
705 710 715 720
Ile Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe
725 730 735
Ser Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn
740 745 750
Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp
755 760 765
Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp
770 775 780
Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly
785 790 795 800
Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp
805 810 815
Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu
820 825 830
Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr
835 840 845
Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu
850 855 860
Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr
865 870 875 880
Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met
885 890 895
Gln Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His
900 905 910
Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr
915 920 925
Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr
930 935 940
Ile Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe
945 950 955 960
Asp Pro Asp Thr Ala Gln Leu Val Ile Ser Glu
965 970
<210> 8
<211> 321
<212> PRT
<213> Clostridium Difficile
<400> 8
Met Ala Ser Thr Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe
1 5 10 15
Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly
20 25 30
Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly
35 40 45
Gln Ala Ile Leu Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys
50 55 60
Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile
65 70 75 80
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr
85 90 95
Gly Trp Gln Thr Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr
100 105 110
Ser Ile Ala Ser Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr
115 120 125
Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp
130 135 140
Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu
145 150 155 160
Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn
165 170 175
Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr
180 185 190
Ile Asp Gly Asn Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala
195 200 205
Asn Gly Tyr Lys Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly
210 215 220
Leu Pro Gln Ile Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe
225 230 235 240
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg
245 250 255
Tyr Gln Asn Arg Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly
260 265 270
Asn Asn Ser Lys Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val
275 280 285
Tyr Tyr Phe Met Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe
290 295 300
Glu Ile Asp Gly Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala
305 310 315 320
Pro
<210> 9
<211> 612
<212> PRT
<213> Clostridium Difficile
<400> 9
Met Ile Leu Met Ser Thr Ser Glu Glu Asn Lys Val Ser Gln Val Lys
1 5 10 15
Ile Arg Phe Val Asn Val Phe Lys Asp Lys Thr Leu Ala Asn Lys Leu
20 25 30
Ser Phe Asn Phe Ser Asp Lys Gln Asp Val Pro Val Ser Glu Ile Ile
35 40 45
Leu Ser Phe Thr Pro Ser Tyr Tyr Glu Asp Gly Leu Ile Gly Tyr Asp
50 55 60
Leu Gly Leu Val Ser Leu Tyr Asn Glu Lys Phe Tyr Ile Asn Asn Phe
65 70 75 80
Gly Met Met Val Ser Gly Leu Ile Tyr Ile Asn Asp Ser Leu Tyr Tyr
85 90 95
Phe Lys Pro Pro Val Asn Asn Leu Ile Thr Gly Phe Val Thr Val Gly
100 105 110
Asp Asp Lys Tyr Tyr Phe Asn Pro Ile Asn Gly Gly Ala Ala Ser Ile
115 120 125
Gly Glu Thr Ile Ile Asp Asp Lys Asn Tyr Tyr Phe Asn Gln Ser Gly
130 135 140
Val Leu Gln Thr Gly Val Phe Ser Thr Glu Asp Gly Phe Lys Tyr Phe
145 150 155 160
Ala Pro Ala Asn Thr Leu Asp Glu Asn Leu Glu Gly Glu Ala Ile Asp
165 170 175
Phe Thr Gly Lys Leu Ile Ile Asp Glu Asn Ile Tyr Tyr Phe Asp Asp
180 185 190
Asn Tyr Arg Gly Ala Val Glu Trp Lys Glu Leu Asp Gly Glu Met His
195 200 205
Tyr Phe Ser Pro Glu Thr Gly Lys Ala Phe Lys Gly Leu Asn Gln Ile
210 215 220
Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser Asp Gly Val Met Gln Lys Gly
225 230 235 240
Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe Asp Asp Ser Gly Val
245 250 255
Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys His Phe Tyr Phe Ala
260 265 270
Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn Thr Glu Asp Gly Phe
275 280 285
Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly Asn Glu Glu Gly Glu
290 295 300
Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr Tyr
305 310 315 320
Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu Asp
325 330 335
Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile Gly
340 345 350
Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly Ile
355 360 365
Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe Ser
370 375 380
Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn Tyr
385 390 395 400
Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp Thr
405 410 415
Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp Asn
420 425 430
Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly Glu
435 440 445
Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp Ile
450 455 460
Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu Thr
465 470 475 480
Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr Tyr
485 490 495
Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu Asn
500 505 510
Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr Ile
515 520 525
Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met Gln
530 535 540
Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His Gln
545 550 555 560
Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr Gly
565 570 575
Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr Ile
580 585 590
Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe Asp
595 600 605
Pro Asp Thr Ala
610
<210> 10
<211> 587
<212> PRT
<213> Clostridium Difficile
<400> 10
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp
500 505 510
Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu
515 520 525
His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Val
530 535 540
Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met Pro Asp
545 550 555 560
Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly Val Ile
565 570 575
Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Pro
580 585
<210> 11
<211> 567
<212> PRT
<213> Clostridium Difficile
<400> 11
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp
500 505 510
Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu
515 520 525
His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Val
530 535 540
Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met Pro Asp
545 550 555 560
Thr Ala Met Ala Ala Ala Gly
565
<210> 12
<211> 505
<212> PRT
<213> Clostridium Difficile
<400> 12
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr
500 505
<210> 13
<211> 567
<212> PRT
<213> Clostridium Difficile
<400> 13
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp
500 505 510
Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu
515 520 525
His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Val
530 535 540
Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met Pro Asp
545 550 555 560
Thr Ala Met Ala Ala Ala Gly
565
<210> 14
<211> 591
<212> PRT
<213> Clostridium Difficile
<400> 14
Met Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn
1 5 10 15
Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys His Phe
20 25 30
Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro
35 40 45
Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile
50 55 60
Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu Asn Gly
65 70 75 80
Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly Trp Arg
85 90 95
Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala Ile Ala
100 105 110
Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe Ser Tyr
115 120 125
Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn Asn Phe
130 135 140
Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val Phe Lys
145 150 155 160
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His Asn Asn
165 170 175
Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu Thr Leu
180 185 190
Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val Thr Gly
195 200 205
Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn Thr Ala
210 215 220
Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe
225 230 235 240
Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly
245 250 255
Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr Gly Tyr
260 265 270
Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile Met
275 280 285
Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro
290 295 300
Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln
305 310 315 320
Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp
325 330 335
Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys Tyr Tyr
340 345 350
Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr Ile Asn
355 360 365
Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser Thr Gly
370 375 380
Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp Gly Ile
385 390 395 400
Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr Phe Ala
405 410 415
Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr
420 425 430
Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe Gly Asn
435 440 445
Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn Arg Tyr
450 455 460
Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys Thr Ile
465 470 475 480
Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile Gly Val
485 490 495
Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp
500 505 510
Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg Phe Leu
515 520 525
His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys Ala Val
530 535 540
Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met Pro Asp
545 550 555 560
Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly Val Ile
565 570 575
Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Pro Gly Ile Tyr Gly
580 585 590
<210> 15
<211> 379
<212> PRT
<213> Clostridium Difficile
<400> 15
Gly Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe Asp Asp Ser Gly
1 5 10 15
Val Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys His Phe Tyr Phe
20 25 30
Ala Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn Thr Glu Asp Gly
35 40 45
Phe Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly Asn Glu Glu Gly
50 55 60
Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr
65 70 75 80
Tyr Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu
85 90 95
Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile
100 105 110
Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly
115 120 125
Ile Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe
130 135 140
Ser Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn
145 150 155 160
Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp
165 170 175
Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp
180 185 190
Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly
195 200 205
Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp
210 215 220
Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu
225 230 235 240
Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr
245 250 255
Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu
260 265 270
Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr
275 280 285
Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met
290 295 300
Gln Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His
305 310 315 320
Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr
325 330 335
Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr
340 345 350
Ile Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe
355 360 365
Asp Pro Asp Thr Ala Gln Leu Val Ile Ser Glu
370 375
<210> 16
<211> 399
<212> PRT
<213> Clostridium Difficile
<400> 16
Gly Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser Asp Gly
1 5 10 15
Val Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe
20 25 30
Asp Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys
35 40 45
His Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn
50 55 60
Thr Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly
65 70 75 80
Asn Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn
85 90 95
Asn Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp
100 105 110
Lys Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala
115 120 125
Glu Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe
130 135 140
Asn Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys
145 150 155 160
Val Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn
165 170 175
Ile Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile
180 185 190
Gly Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn
195 200 205
Thr Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu
210 215 220
Val Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile
225 230 235 240
Glu Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr
245 250 255
Phe Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp
260 265 270
Asp Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu
275 280 285
Ile Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met
290 295 300
Gln Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu
305 310 315 320
Asp Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys
325 330 335
Tyr Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser
340 345 350
Ile Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe
355 360 365
Thr Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu
370 375 380
Glu Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser Glu
385 390 395
<210> 17
<211> 328
<212> PRT
<213> Clostridium Difficile
<400> 17
Phe Ala His His Asn Glu Asp Leu Gly Asn Glu Glu Gly Glu Glu Ile
1 5 10 15
Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr Tyr Phe Asp
20 25 30
Asp Ser Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu Asp Gly Ser
35 40 45
Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile Gly Leu Ser
50 55 60
Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly Ile Met Gln
65 70 75 80
Val Gly Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe Ser Asp Ser
85 90 95
Gly Ile Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn Tyr Phe Tyr
100 105 110
Ile Asp Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp Thr Ser Asp
115 120 125
Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp Asn Ile Tyr
130 135 140
Gly Gln Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly Glu Asp Val
145 150 155 160
Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp Ile Tyr Asp
165 170 175
Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu Thr Lys Lys
180 185 190
Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr Tyr Phe Asp
195 200 205
Glu Lys Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu Asn Asn Asn
210 215 220
Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr Ile Asn Ile
225 230 235 240
Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met Gln Ile Gly
245 250 255
Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His Gln Asn Thr
260 265 270
Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr Gly Trp Leu
275 280 285
Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr Ile Ala Ala
290 295 300
Thr Gly Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe Asp Pro Asp
305 310 315 320
Thr Ala Gln Leu Val Ile Ser Glu
325
<210> 18
<211> 490
<212> PRT
<213> Clostridium Difficile
<400> 18
Gly Glu Thr Ile Ile Asp Asp Lys Asn Tyr Tyr Phe Asn Gln Ser Gly
1 5 10 15
Val Leu Gln Thr Gly Val Phe Ser Thr Glu Asp Gly Phe Lys Tyr Phe
20 25 30
Ala Pro Ala Asn Thr Leu Asp Glu Asn Leu Glu Gly Glu Ala Ile Asp
35 40 45
Phe Thr Gly Lys Leu Ile Ile Asp Glu Asn Ile Tyr Tyr Phe Asp Asp
50 55 60
Asn Tyr Arg Gly Ala Val Glu Trp Lys Glu Leu Asp Gly Glu Met His
65 70 75 80
Tyr Phe Ser Pro Glu Thr Gly Lys Ala Phe Lys Gly Leu Asn Gln Ile
85 90 95
Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser Asp Gly Val Met Gln Lys Gly
100 105 110
Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe Asp Asp Ser Gly Val
115 120 125
Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys His Phe Tyr Phe Ala
130 135 140
Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn Thr Glu Asp Gly Phe
145 150 155 160
Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly Asn Glu Glu Gly Glu
165 170 175
Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr Tyr
180 185 190
Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu Asp
195 200 205
Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile Gly
210 215 220
Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly Ile
225 230 235 240
Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe Ser
245 250 255
Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn Tyr
260 265 270
Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp Thr
275 280 285
Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp Asn
290 295 300
Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly Glu
305 310 315 320
Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp Ile
325 330 335
Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu Thr
340 345 350
Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr Tyr
355 360 365
Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu Asn
370 375 380
Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr Ile
385 390 395 400
Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met Gln
405 410 415
Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His Gln
420 425 430
Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr Gly
435 440 445
Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr Ile
450 455 460
Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe Asp
465 470 475 480
Pro Asp Thr Ala Gln Leu Val Ile Ser Glu
485 490
<210> 19
<211> 379
<212> PRT
<213> Clostridium Difficile
<400> 19
Gly Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe Asp Asp Ser Gly
1 5 10 15
Val Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys His Phe Tyr Phe
20 25 30
Ala Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn Thr Glu Asp Gly
35 40 45
Phe Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly Asn Glu Glu Gly
50 55 60
Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr
65 70 75 80
Tyr Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu
85 90 95
Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile
100 105 110
Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly
115 120 125
Ile Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe
130 135 140
Ser Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn
145 150 155 160
Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp
165 170 175
Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp
180 185 190
Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly
195 200 205
Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp
210 215 220
Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu
225 230 235 240
Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr
245 250 255
Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu
260 265 270
Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr
275 280 285
Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met
290 295 300
Gln Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His
305 310 315 320
Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr
325 330 335
Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr
340 345 350
Ile Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe
355 360 365
Asp Pro Asp Thr Ala Gln Leu Val Ile Ser Glu
370 375
<210> 20
<211> 3339
<212> DNA
<213> Clostridium Difficile
<400> 20
atggcaaccg gttggcagac catcgatggc aaaaaatatt attttaatac caacaccgca 60
attgcaagca ccggctatac cattatcaac ggcaaacact tttattttaa caccgacggc 120
attatgcaga ttggtgtgtt taaaggtccg aacggctttg aatactttgc accggcaaat 180
accgatgcca ataatattga aggccaggcc attctgtatc agaatgaatt tctgaccctg 240
aacggcaaaa aatactactt tggcagcgat agcaaagcag ttaccggttg gcgcatcatc 300
aacaataaga aatattactt caacccgaat aatgcaattg cagcaattca tctgtgcacc 360
attaacaacg acaaatatta tttcagctat gacggtattc tgcagaatgg ctacattacc 420
atcgaacgca acaactttta tttcgatgcc aacaacgaaa gcaaaatggt gaccggtgtt 480
ttcaaaggcc ctaatggttt tgagtatttc gctccggcaa acacccataa taacaacatt 540
gaaggtcagg cgatcgttta tcagaacaaa ttcctgacgc tgaatggtaa gaaatactat 600
ttcgataatg acagcaaagc cgtgaccggc tggcagacaa ttgacgggaa gaaatattac 660
tttaatctga ataccgcaga agcagcaacc ggttggcaaa cgatcgacgg taaaaagtac 720
tacttcaacc tgaacacagc cgaagcagcc acaggatggc agactattga tggaaaaaaa 780
tactatttca acaccaacac ctttattgca tctaccggtt ataccagcat taacggtaaa 840
catttctact tcaacaccga tggtatcatg cagatcggcg ttttcaaagg tccaaatggt 900
ttcgaatact ttgcccctgc caatacagat gcaaataaca tcgagggtca ggcaatcctg 960
taccaaaaca aatttctgac cctgaatggg aaaaaatatt actttggtag cgattctaaa 1020
gccgttaccg gtctgcgtac cattgatggt aaaaaatact actttaatac gaatacagcc 1080
gttgcggtta caggctggca gaccattaac gggaaaaaat actattttaa cacaaatacc 1140
agcattgcct caacgggtta taccattatt tcgggtaaac acttctactt taataccgat 1200
ggtattatgc aaatcggagt ctttaaagga cctgatgggt tcgaatattt tgcgcctgcg 1260
aacactgatg cgaacaatat cgaaggacag gcaatccgct atcagaatcg ctttctgtat 1320
ctgcacgaca acatctatta ttttggcaac aattcaaaag cagccaccgg ctgggttaca 1380
attgatggca accgctacta tttcgaaccg aataccgcaa tgggtgcaaa tggctacaaa 1440
accatcgata ataaaaattt ctattttcgc aacggtctgc cgcagatcgg ggtatttaaa 1500
ggtagcaacg gcttcgaata cttcgctcca gcgaatacgg acgcgaacaa tattgagggt 1560
caagcgattc gttatcaaaa ccgttttctg catctgctgg gcaaaatcta ctactttggc 1620
aataacagta aagcagttac tggatggcag acaatcaatg gtaaagtgta ctattttatg 1680
ccggataccg ccatggcagc agccggtggt ctgtttgaaa ttgatggcgt gatctatttt 1740
tttggtgtgg atggtgttaa agcaccggga atatacggtg gtaccggctt tgtgaccgtg 1800
ggtgatgata aatactattt caatccgatt aacggtggtg cagcgagcat tggcgaaacc 1860
atcatcgatg acaaaaacta ttatttcaac cagagcggtg tgctgcagac cggtgtgttt 1920
agcaccgaag atggctttaa atattttgcg ccagcgaaca ccctggatga aaacctggaa 1980
ggcgaagcga ttgattttac cggcaaactg atcatcgatg aaaacatcta ttacttcgat 2040
gataactatc gtggtgcggt ggaatggaaa gaactggatg gcgaaatgca ttatttttct 2100
ccggaaaccg gtaaagcgtt taaaggcctg aaccagatcg gcgattacaa atactacttc 2160
aacagcgatg gcgtgatgca gaaaggcttt gtgagcatca acgataacaa acactatttc 2220
gatgatagcg gtgtgatgaa agtgggctat accgaaattg atggcaaaca tttctacttc 2280
gcggaaaacg gcgaaatgca gattggcgtg ttcaataccg aagatggttt caaatacttc 2340
gcgcaccata acgaagatct gggtaacgaa gaaggcgaag aaattagcta tagcggcatc 2400
ctgaacttca acaacaaaat ctactacttt gatgatagct ttaccgcggt ggtgggctgg 2460
aaagatctgg aagatggcag caaatattat ttcgatgaag ataccgcgga agcgtatatt 2520
ggcctgagcc tgattaacga tggccagtac tattttaacg atgatggcat tatgcaggtg 2580
ggtttcgtga ccattaatga taaagtgttc tatttcagcg atagcggcat tattgaaagc 2640
ggcgtgcaga acattgatga taactacttc tacatcgatg ataacggcat tgtgcagatc 2700
ggcgtttttg ataccagcga tggctacaaa tatttcgcac cggccaatac cgtgaacgat 2760
aacatttatg gccaggcggt ggaatatagc ggtctggtgc gtgtgggcga agatgtgtat 2820
tatttcggcg aaacctatac catcgaaacc ggctggattt atgatatgga aaacgaaagc 2880
gataaatatt actttaatcc ggaaacgaaa aaagcgtgca aaggcattaa cctgatcgat 2940
gatatcaaat actattttga tgaaaaaggc attatgcgta ccggtctgat tagcttcgaa 3000
aacaacaact attacttcaa cgaaaacggt gaaatgcagt tcggctacat caacatcgaa 3060
gataaaatgt tctacttcgg cgaagatggt gttatgcaga ttggtgtttt taacaccccg 3120
gatggcttca aatactttgc ccatcagaat accctggatg aaaatttcga aggtgaaagc 3180
attaactata ccggctggct ggatctggat gaaaaacgct actacttcac cgatgaatac 3240
attgcggcga ccggcagcgt gattattgat ggcgaagaat actacttcga tccggatacc 3300
gcgcagctgg tgattagcga acatcatcat catcaccat 3339
<210> 21
<211> 1113
<212> PRT
<213> Clostridium Difficile
<400> 21
Met Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
1 5 10 15
Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys
20 25 30
His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys
35 40 45
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn
50 55 60
Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu
65 70 75 80
Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly
85 90 95
Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala
100 105 110
Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe
115 120 125
Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn
130 135 140
Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val
145 150 155 160
Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His
165 170 175
Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu
180 185 190
Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val
195 200 205
Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn
210 215 220
Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
225 230 235 240
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
245 250 255
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr
260 265 270
Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly
275 280 285
Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe
290 295 300
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu
305 310 315 320
Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly
325 330 335
Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys
340 345 350
Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr
355 360 365
Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser
370 375 380
Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp
385 390 395 400
Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
405 410 415
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
420 425 430
Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe
435 440 445
Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn
450 455 460
Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys
465 470 475 480
Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile
485 490 495
Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn
500 505 510
Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg
515 520 525
Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys
530 535 540
Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met
545 550 555 560
Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly
565 570 575
Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Pro Gly Ile Tyr
580 585 590
Gly Gly Thr Gly Phe Val Thr Val Gly Asp Asp Lys Tyr Tyr Phe Asn
595 600 605
Pro Ile Asn Gly Gly Ala Ala Ser Ile Gly Glu Thr Ile Ile Asp Asp
610 615 620
Lys Asn Tyr Tyr Phe Asn Gln Ser Gly Val Leu Gln Thr Gly Val Phe
625 630 635 640
Ser Thr Glu Asp Gly Phe Lys Tyr Phe Ala Pro Ala Asn Thr Leu Asp
645 650 655
Glu Asn Leu Glu Gly Glu Ala Ile Asp Phe Thr Gly Lys Leu Ile Ile
660 665 670
Asp Glu Asn Ile Tyr Tyr Phe Asp Asp Asn Tyr Arg Gly Ala Val Glu
675 680 685
Trp Lys Glu Leu Asp Gly Glu Met His Tyr Phe Ser Pro Glu Thr Gly
690 695 700
Lys Ala Phe Lys Gly Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe
705 710 715 720
Asn Ser Asp Gly Val Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn
725 730 735
Lys His Tyr Phe Asp Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu
740 745 750
Ile Asp Gly Lys His Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile
755 760 765
Gly Val Phe Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn
770 775 780
Glu Asp Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile
785 790 795 800
Leu Asn Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala
805 810 815
Val Val Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp
820 825 830
Glu Asp Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly
835 840 845
Gln Tyr Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr
850 855 860
Ile Asn Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser
865 870 875 880
Gly Val Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly
885 890 895
Ile Val Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe
900 905 910
Ala Pro Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu
915 920 925
Tyr Ser Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu
930 935 940
Thr Tyr Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser
945 950 955 960
Asp Lys Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile
965 970 975
Asn Leu Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met
980 985 990
Arg Thr Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu
995 1000 1005
Asn Gly Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe
1010 1015 1020
Tyr Phe Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro
1025 1030 1035 1040
Asp Gly Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe
1045 1050 1055
Glu Gly Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys
1060 1065 1070
Arg Tyr Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile
1075 1080 1085
Ile Asp Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val
1090 1095 1100
Ile Ser Glu His His His His His His
1105 1110
<210> 22
<211> 3324
<212> DNA
<213> Clostridium Difficile
<400> 22
atggcaaccg gttggcagac catcgatggc aaaaaatatt attttaatac caacaccgca 60
attgcaagca ccggctatac cattatcaac ggcaaacact tttattttaa caccgacggc 120
attatgcaga ttggtgtgtt taaaggtccg aacggctttg aatactttgc accggcaaat 180
accgatgcca ataatattga aggccaggcc attctgtatc agaatgaatt tctgaccctg 240
aacggcaaaa aatactactt tggcagcgat agcaaagcag ttaccggttg gcgcatcatc 300
aacaataaga aatattactt caacccgaat aatgcaattg cagcaattca tctgtgcacc 360
attaacaacg acaaatatta tttcagctat gacggtattc tgcagaatgg ctacattacc 420
atcgaacgca acaactttta tttcgatgcc aacaacgaaa gcaaaatggt gaccggtgtt 480
ttcaaaggcc ctaatggttt tgagtatttc gctccggcaa acacccataa taacaacatt 540
gaaggtcagg cgatcgttta tcagaacaaa ttcctgacgc tgaatggtaa gaaatactat 600
ttcgataatg acagcaaagc cgtgaccggc tggcagacaa ttgacgggaa gaaatattac 660
tttaatctga ataccgcaga agcagcaacc ggttggcaaa cgatcgacgg taaaaagtac 720
tacttcaacc tgaacacagc cgaagcagcc acaggatggc agactattga tggaaaaaaa 780
tactatttca acaccaacac ctttattgca tctaccggtt ataccagcat taacggtaaa 840
catttctact tcaacaccga tggtatcatg cagatcggcg ttttcaaagg tccaaatggt 900
ttcgaatact ttgcccctgc caatacagat gcaaataaca tcgagggtca ggcaatcctg 960
taccaaaaca aatttctgac cctgaatggg aaaaaatatt actttggtag cgattctaaa 1020
gccgttaccg gtctgcgtac cattgatggt aaaaaatact actttaatac gaatacagcc 1080
gttgcggtta caggctggca gaccattaac gggaaaaaat actattttaa cacaaatacc 1140
agcattgcct caacgggtta taccattatt tcgggtaaac acttctactt taataccgat 1200
ggtattatgc aaatcggagt ctttaaagga cctgatgggt tcgaatattt tgcgcctgcg 1260
aacactgatg cgaacaatat cgaaggacag gcaatccgct atcagaatcg ctttctgtat 1320
ctgcacgaca acatctatta ttttggcaac aattcaaaag cagccaccgg ctgggttaca 1380
attgatggca accgctacta tttcgaaccg aataccgcaa tgggtgcaaa tggctacaaa 1440
accatcgata ataaaaattt ctattttcgc aacggtctgc cgcagatcgg ggtatttaaa 1500
ggtagcaacg gcttcgaata cttcgctcca gcgaatacgg acgcgaacaa tattgagggt 1560
caagcgattc gttatcaaaa ccgttttctg catctgctgg gcaaaatcta ctactttggc 1620
aataacagta aagcagttac tggatggcag acaatcaatg gtaaagtgta ctattttatg 1680
ccggataccg ccatggcagc agccggtggt ctgtttgaaa ttgatggcgt gatctatttt 1740
tttggtgtgg atggtgttaa agcagttacc ggctttgtga ccgtgggtga tgataaatac 1800
tatttcaatc cgattaacgg tggtgcagcg agcattggcg aaaccatcat cgatgacaaa 1860
aactattatt tcaaccagag cggtgtgctg cagaccggtg tgtttagcac cgaagatggc 1920
tttaaatatt ttgcgccagc gaacaccctg gatgaaaacc tggaaggcga agcgattgat 1980
tttaccggca aactgatcat cgatgaaaac atctattact tcgatgataa ctatcgtggt 2040
gcggtggaat ggaaagaact ggatggcgaa atgcattatt tttctccgga aaccggtaaa 2100
gcgtttaaag gcctgaacca gatcggcgat tacaaatact acttcaacag cgatggcgtg 2160
atgcagaaag gctttgtgag catcaacgat aacaaacact atttcgatga tagcggtgtg 2220
atgaaagtgg gctataccga aattgatggc aaacatttct acttcgcgga aaacggcgaa 2280
atgcagattg gcgtgttcaa taccgaagat ggtttcaaat acttcgcgca ccataacgaa 2340
gatctgggta acgaagaagg cgaagaaatt agctatagcg gcatcctgaa cttcaacaac 2400
aaaatctact actttgatga tagctttacc gcggtggtgg gctggaaaga tctggaagat 2460
ggcagcaaat attatttcga tgaagatacc gcggaagcgt atattggcct gagcctgatt 2520
aacgatggcc agtactattt taacgatgat ggcattatgc aggtgggttt cgtgaccatt 2580
aatgataaag tgttctattt cagcgatagc ggcattattg aaagcggcgt gcagaacatt 2640
gatgataact acttctacat cgatgataac ggcattgtgc agatcggcgt ttttgatacc 2700
agcgatggct acaaatattt cgcaccggcc aataccgtga acgataacat ttatggccag 2760
gcggtggaat atagcggtct ggtgcgtgtg ggcgaagatg tgtattattt cggcgaaacc 2820
tataccatcg aaaccggctg gatttatgat atggaaaacg aaagcgataa atattacttt 2880
aatccggaaa cgaaaaaagc gtgcaaaggc attaacctga tcgatgatat caaatactat 2940
tttgatgaaa aaggcattat gcgtaccggt ctgattagct tcgaaaacaa caactattac 3000
ttcaacgaaa acggtgaaat gcagttcggc tacatcaaca tcgaagataa aatgttctac 3060
ttcggcgaag atggtgttat gcagattggt gtttttaaca ccccggatgg cttcaaatac 3120
tttgcccatc agaataccct ggatgaaaat ttcgaaggtg aaagcattaa ctataccggc 3180
tggctggatc tggatgaaaa acgctactac ttcaccgatg aatacattgc ggcgaccggc 3240
agcgtgatta ttgatggcga agaatactac ttcgatccgg ataccgcgca gctggtgatt 3300
agcgaacatc atcatcatca ccat 3324
<210> 23
<211> 1108
<212> PRT
<213> Clostridium Difficile
<400> 23
Met Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
1 5 10 15
Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys
20 25 30
His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys
35 40 45
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn
50 55 60
Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu
65 70 75 80
Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly
85 90 95
Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala
100 105 110
Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe
115 120 125
Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn
130 135 140
Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val
145 150 155 160
Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His
165 170 175
Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu
180 185 190
Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val
195 200 205
Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn
210 215 220
Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
225 230 235 240
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
245 250 255
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr
260 265 270
Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly
275 280 285
Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe
290 295 300
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu
305 310 315 320
Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly
325 330 335
Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys
340 345 350
Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr
355 360 365
Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser
370 375 380
Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp
385 390 395 400
Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
405 410 415
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
420 425 430
Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe
435 440 445
Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn
450 455 460
Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys
465 470 475 480
Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile
485 490 495
Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn
500 505 510
Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg
515 520 525
Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys
530 535 540
Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met
545 550 555 560
Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly
565 570 575
Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Val Thr Gly Phe
580 585 590
Val Thr Val Gly Asp Asp Lys Tyr Tyr Phe Asn Pro Ile Asn Gly Gly
595 600 605
Ala Ala Ser Ile Gly Glu Thr Ile Ile Asp Asp Lys Asn Tyr Tyr Phe
610 615 620
Asn Gln Ser Gly Val Leu Gln Thr Gly Val Phe Ser Thr Glu Asp Gly
625 630 635 640
Phe Lys Tyr Phe Ala Pro Ala Asn Thr Leu Asp Glu Asn Leu Glu Gly
645 650 655
Glu Ala Ile Asp Phe Thr Gly Lys Leu Ile Ile Asp Glu Asn Ile Tyr
660 665 670
Tyr Phe Asp Asp Asn Tyr Arg Gly Ala Val Glu Trp Lys Glu Leu Asp
675 680 685
Gly Glu Met His Tyr Phe Ser Pro Glu Thr Gly Lys Ala Phe Lys Gly
690 695 700
Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser Asp Gly Val
705 710 715 720
Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe Asp
725 730 735
Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys His
740 745 750
Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn Thr
755 760 765
Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly Asn
770 775 780
Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn
785 790 795 800
Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp Lys
805 810 815
Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu
820 825 830
Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn
835 840 845
Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys Val
850 855 860
Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn Ile
865 870 875 880
Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile Gly
885 890 895
Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr
900 905 910
Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu Val
915 920 925
Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu
930 935 940
Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe
945 950 955 960
Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp
965 970 975
Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu Ile
980 985 990
Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln
995 1000 1005
Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp
1010 1015 1020
Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr
1025 1030 1035 1040
Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile
1045 1050 1055
Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr
1060 1065 1070
Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu Glu
1075 1080 1085
Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser Glu His His
1090 1095 1100
His His His His
1105
<210> 24
<211> 3387
<212> DNA
<213> Clostridium Difficile
<400> 24
atggcaaccg gttggcagac catcgatggc aaaaaatatt attttaatac caacaccgca 60
attgcaagca ccggctatac cattatcaac ggcaaacact tttattttaa caccgacggc 120
attatgcaga ttggtgtgtt taaaggtccg aacggctttg aatactttgc accggcaaat 180
accgatgcca ataatattga aggccaggcc attctgtatc agaatgaatt tctgaccctg 240
aacggcaaaa aatactactt tggcagcgat agcaaagcag ttaccggttg gcgcatcatc 300
aacaataaga aatattactt caacccgaat aatgcaattg cagcaattca tctgtgcacc 360
attaacaacg acaaatatta tttcagctat gacggtattc tgcagaatgg ctacattacc 420
atcgaacgca acaactttta tttcgatgcc aacaacgaaa gcaaaatggt gaccggtgtt 480
ttcaaaggcc ctaatggttt tgagtatttc gctccggcaa acacccataa taacaacatt 540
gaaggtcagg cgatcgttta tcagaacaaa ttcctgacgc tgaatggtaa gaaatactat 600
ttcgataatg acagcaaagc cgtgaccggc tggcagacaa ttgacgggaa gaaatattac 660
tttaatctga ataccgcaga agcagcaacc ggttggcaaa cgatcgacgg taaaaagtac 720
tacttcaacc tgaacacagc cgaagcagcc acaggatggc agactattga tggaaaaaaa 780
tactatttca acaccaacac ctttattgca tctaccggtt ataccagcat taacggtaaa 840
catttctact tcaacaccga tggtatcatg cagatcggcg ttttcaaagg tccaaatggt 900
ttcgaatact ttgcccctgc caatacagat gcaaataaca tcgagggtca ggcaatcctg 960
taccaaaaca aatttctgac cctgaatggg aaaaaatatt actttggtag cgattctaaa 1020
gccgttaccg gtctgcgtac cattgatggt aaaaaatact actttaatac gaatacagcc 1080
gttgcggtta caggctggca gaccattaac gggaaaaaat actattttaa cacaaatacc 1140
agcattgcct caacgggtta taccattatt tcgggtaaac acttctactt taataccgat 1200
ggtattatgc aaatcggagt ctttaaagga cctgatgggt tcgaatattt tgcgcctgcg 1260
aacactgatg cgaacaatat cgaaggacag gcaatccgct atcagaatcg ctttctgtat 1320
ctgcacgaca acatctatta ttttggcaac aattcaaaag cagccaccgg ctgggttaca 1380
attgatggca accgctacta tttcgaaccg aataccgcaa tgggtgcaaa tggctacaaa 1440
accatcgata ataaaaattt ctattttcgc aacggtctgc cgcagatcgg ggtatttaaa 1500
ggtagcaacg gcttcgaata cttcgctcca gcgaatacgg acgcgaacaa tattgagggt 1560
caagcgattc gttatcaaaa ccgttttctg catctgctgg gcaaaatcta ctactttggc 1620
aataacagta aagcagttac tggatggcag acaatcaatg gtaaagtgta ctattttatg 1680
ccggataccg ccatggcagc agccggtggt ctgtttgaaa ttgatggcgt gatctatttt 1740
tttggtgtgg atggtgttaa agcagtgagc ggtctgattt atattaacga tagcctgtat 1800
tactttaaac caccggtgaa taacctgatt accggctttg tgaccgtggg tgatgataaa 1860
tactatttca atccgattaa cggtggtgca gcgagcattg gcgaaaccat catcgatgac 1920
aaaaactatt atttcaacca gagcggtgtg ctgcagaccg gtgtgtttag caccgaagat 1980
ggctttaaat attttgcgcc agcgaacacc ctggatgaaa acctggaagg cgaagcgatt 2040
gattttaccg gcaaactgat catcgatgaa aacatctatt acttcgatga taactatcgt 2100
ggtgcggtgg aatggaaaga actggatggc gaaatgcatt atttttctcc ggaaaccggt 2160
aaagcgttta aaggcctgaa ccagatcggc gattacaaat actacttcaa cagcgatggc 2220
gtgatgcaga aaggctttgt gagcatcaac gataacaaac actatttcga tgatagcggt 2280
gtgatgaaag tgggctatac cgaaattgat ggcaaacatt tctacttcgc ggaaaacggc 2340
gaaatgcaga ttggcgtgtt caataccgaa gatggtttca aatacttcgc gcaccataac 2400
gaagatctgg gtaacgaaga aggcgaagaa attagctata gcggcatcct gaacttcaac 2460
aacaaaatct actactttga tgatagcttt accgcggtgg tgggctggaa agatctggaa 2520
gatggcagca aatattattt cgatgaagat accgcggaag cgtatattgg cctgagcctg 2580
attaacgatg gccagtacta ttttaacgat gatggcatta tgcaggtggg tttcgtgacc 2640
attaatgata aagtgttcta tttcagcgat agcggcatta ttgaaagcgg cgtgcagaac 2700
attgatgata actacttcta catcgatgat aacggcattg tgcagatcgg cgtttttgat 2760
accagcgatg gctacaaata tttcgcaccg gccaataccg tgaacgataa catttatggc 2820
caggcggtgg aatatagcgg tctggtgcgt gtgggcgaag atgtgtatta tttcggcgaa 2880
acctatacca tcgaaaccgg ctggatttat gatatggaaa acgaaagcga taaatattac 2940
tttaatccgg aaacgaaaaa agcgtgcaaa ggcattaacc tgatcgatga tatcaaatac 3000
tattttgatg aaaaaggcat tatgcgtacc ggtctgatta gcttcgaaaa caacaactat 3060
tacttcaacg aaaacggtga aatgcagttc ggctacatca acatcgaaga taaaatgttc 3120
tacttcggcg aagatggtgt tatgcagatt ggtgttttta acaccccgga tggcttcaaa 3180
tactttgccc atcagaatac cctggatgaa aatttcgaag gtgaaagcat taactatacc 3240
ggctggctgg atctggatga aaaacgctac tacttcaccg atgaatacat tgcggcgacc 3300
ggcagcgtga ttattgatgg cgaagaatac tacttcgatc cggataccgc gcagctggtg 3360
attagcgaac atcatcatca tcaccat 3387
<210> 25
<211> 1129
<212> PRT
<213> Clostridium Difficile
<400> 25
Met Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
1 5 10 15
Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys
20 25 30
His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys
35 40 45
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn
50 55 60
Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu
65 70 75 80
Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly
85 90 95
Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala
100 105 110
Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe
115 120 125
Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn
130 135 140
Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val
145 150 155 160
Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His
165 170 175
Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu
180 185 190
Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val
195 200 205
Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn
210 215 220
Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
225 230 235 240
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
245 250 255
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr
260 265 270
Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly
275 280 285
Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe
290 295 300
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu
305 310 315 320
Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly
325 330 335
Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys
340 345 350
Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr
355 360 365
Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser
370 375 380
Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp
385 390 395 400
Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
405 410 415
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
420 425 430
Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe
435 440 445
Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn
450 455 460
Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys
465 470 475 480
Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile
485 490 495
Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn
500 505 510
Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg
515 520 525
Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys
530 535 540
Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met
545 550 555 560
Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly
565 570 575
Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Val Ser Gly Leu
580 585 590
Ile Tyr Ile Asn Asp Ser Leu Tyr Tyr Phe Lys Pro Pro Val Asn Asn
595 600 605
Leu Ile Thr Gly Phe Val Thr Val Gly Asp Asp Lys Tyr Tyr Phe Asn
610 615 620
Pro Ile Asn Gly Gly Ala Ala Ser Ile Gly Glu Thr Ile Ile Asp Asp
625 630 635 640
Lys Asn Tyr Tyr Phe Asn Gln Ser Gly Val Leu Gln Thr Gly Val Phe
645 650 655
Ser Thr Glu Asp Gly Phe Lys Tyr Phe Ala Pro Ala Asn Thr Leu Asp
660 665 670
Glu Asn Leu Glu Gly Glu Ala Ile Asp Phe Thr Gly Lys Leu Ile Ile
675 680 685
Asp Glu Asn Ile Tyr Tyr Phe Asp Asp Asn Tyr Arg Gly Ala Val Glu
690 695 700
Trp Lys Glu Leu Asp Gly Glu Met His Tyr Phe Ser Pro Glu Thr Gly
705 710 715 720
Lys Ala Phe Lys Gly Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe
725 730 735
Asn Ser Asp Gly Val Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn
740 745 750
Lys His Tyr Phe Asp Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu
755 760 765
Ile Asp Gly Lys His Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile
770 775 780
Gly Val Phe Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn
785 790 795 800
Glu Asp Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile
805 810 815
Leu Asn Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala
820 825 830
Val Val Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp
835 840 845
Glu Asp Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly
850 855 860
Gln Tyr Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr
865 870 875 880
Ile Asn Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser
885 890 895
Gly Val Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly
900 905 910
Ile Val Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe
915 920 925
Ala Pro Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu
930 935 940
Tyr Ser Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu
945 950 955 960
Thr Tyr Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser
965 970 975
Asp Lys Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile
980 985 990
Asn Leu Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met
995 1000 1005
Arg Thr Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu
1010 1015 1020
Asn Gly Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe
1025 1030 1035 1040
Tyr Phe Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro
1045 1050 1055
Asp Gly Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe
1060 1065 1070
Glu Gly Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys
1075 1080 1085
Arg Tyr Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile
1090 1095 1100
Ile Asp Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val
1105 1110 1115 1120
Ile Ser Glu His His His His His His
1125
<210> 26
<211> 2985
<212> DNA
<213> Clostridium Difficile
<400> 26
atggcaaccg gttggcagac catcgatggc aaaaaatatt attttaatac caacaccgca 60
attgcaagca ccggctatac cattatcaac ggcaaacact tttattttaa caccgacggc 120
attatgcaga ttggtgtgtt taaaggtccg aacggctttg aatactttgc accggcaaat 180
accgatgcca ataatattga aggccaggcc attctgtatc agaatgaatt tctgaccctg 240
aacggcaaaa aatactactt tggcagcgat agcaaagcag ttaccggttg gcgcatcatc 300
aacaataaga aatattactt caacccgaat aatgcaattg cagcaattca tctgtgcacc 360
attaacaacg acaaatatta tttcagctat gacggtattc tgcagaatgg ctacattacc 420
atcgaacgca acaactttta tttcgatgcc aacaacgaaa gcaaaatggt gaccggtgtt 480
ttcaaaggcc ctaatggttt tgagtatttc gctccggcaa acacccataa taacaacatt 540
gaaggtcagg cgatcgttta tcagaacaaa ttcctgacgc tgaatggtaa gaaatactat 600
ttcgataatg acagcaaagc cgtgaccggc tggcagacaa ttgacgggaa gaaatattac 660
tttaatctga ataccgcaga agcagcaacc ggttggcaaa cgatcgacgg taaaaagtac 720
tacttcaacc tgaacacagc cgaagcagcc acaggatggc agactattga tggaaaaaaa 780
tactatttca acaccaacac ctttattgca tctaccggtt ataccagcat taacggtaaa 840
catttctact tcaacaccga tggtatcatg cagatcggcg ttttcaaagg tccaaatggt 900
ttcgaatact ttgcccctgc caatacagat gcaaataaca tcgagggtca ggcaatcctg 960
taccaaaaca aatttctgac cctgaatggg aaaaaatatt actttggtag cgattctaaa 1020
gccgttaccg gtctgcgtac cattgatggt aaaaaatact actttaatac gaatacagcc 1080
gttgcggtta caggctggca gaccattaac gggaaaaaat actattttaa cacaaatacc 1140
agcattgcct caacgggtta taccattatt tcgggtaaac acttctactt taataccgat 1200
ggtattatgc aaatcggagt ctttaaagga cctgatgggt tcgaatattt tgcgcctgcg 1260
aacactgatg cgaacaatat cgaaggacag gcaatccgct atcagaatcg ctttctgtat 1320
ctgcacgaca acatctatta ttttggcaac aattcaaaag cagccaccgg ctgggttaca 1380
attgatggca accgctacta tttcgaaccg aataccgcaa tgggtgcaaa tggctacaaa 1440
accatcgata ataaaaattt ctattttcgc aacggtctgc cgcagatcgg ggtatttaaa 1500
ggtagcaacg gcttcgaata cttcgctcca gcgaatacgg acgcgaacaa tattgagggt 1560
caagcgattc gttatcaaaa ccgttttctg catctgctgg gcaaaatcta ctactttggc 1620
aataacagta aagcagttac tggatggcag acaatcaatg gtaaagtgta ctattttatg 1680
ccggataccg ccatggcagc agccggtggt ctgtttgaaa ttgatggcgt gatctatttt 1740
tttggtgtgg atggtgttaa agcagtgaaa ggcctgaacc agatcggcga ttacaaatac 1800
tacttcaaca gcgatggcgt gatgcagaaa ggctttgtga gcatcaacga taacaaacac 1860
tatttcgatg atagcggtgt gatgaaagtg ggctataccg aaattgatgg caaacatttc 1920
tacttcgcgg aaaacggcga aatgcagatt ggcgtgttca ataccgaaga tggtttcaaa 1980
tacttcgcgc accataacga agatctgggt aacgaagaag gcgaagaaat tagctatagc 2040
ggcatcctga acttcaacaa caaaatctac tactttgatg atagctttac cgcggtggtg 2100
ggctggaaag atctggaaga tggcagcaaa tattatttcg atgaagatac cgcggaagcg 2160
tatattggcc tgagcctgat taacgatggc cagtactatt ttaacgatga tggcattatg 2220
caggtgggtt tcgtgaccat taatgataaa gtgttctatt tcagcgatag cggcattatt 2280
gaaagcggcg tgcagaacat tgatgataac tacttctaca tcgatgataa cggcattgtg 2340
cagatcggcg tttttgatac cagcgatggc tacaaatatt tcgcaccggc caataccgtg 2400
aacgataaca tttatggcca ggcggtggaa tatagcggtc tggtgcgtgt gggcgaagat 2460
gtgtattatt tcggcgaaac ctataccatc gaaaccggct ggatttatga tatggaaaac 2520
gaaagcgata aatattactt taatccggaa acgaaaaaag cgtgcaaagg cattaacctg 2580
atcgatgata tcaaatacta ttttgatgaa aaaggcatta tgcgtaccgg tctgattagc 2640
ttcgaaaaca acaactatta cttcaacgaa aacggtgaaa tgcagttcgg ctacatcaac 2700
atcgaagata aaatgttcta cttcggcgaa gatggtgtta tgcagattgg tgtttttaac 2760
accccggatg gcttcaaata ctttgcccat cagaataccc tggatgaaaa tttcgaaggt 2820
gaaagcatta actataccgg ctggctggat ctggatgaaa aacgctacta cttcaccgat 2880
gaatacattg cggcgaccgg cagcgtgatt attgatggcg aagaatacta cttcgatccg 2940
gataccgcgc agctggtgat tagcgaacat catcatcatc accat 2985
<210> 27
<211> 995
<212> PRT
<213> Clostridium Difficile
<400> 27
Met Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
1 5 10 15
Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys
20 25 30
His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys
35 40 45
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn
50 55 60
Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu
65 70 75 80
Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly
85 90 95
Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala
100 105 110
Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe
115 120 125
Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn
130 135 140
Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val
145 150 155 160
Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His
165 170 175
Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu
180 185 190
Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val
195 200 205
Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn
210 215 220
Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
225 230 235 240
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
245 250 255
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr
260 265 270
Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly
275 280 285
Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe
290 295 300
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu
305 310 315 320
Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly
325 330 335
Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys
340 345 350
Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr
355 360 365
Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser
370 375 380
Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp
385 390 395 400
Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
405 410 415
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
420 425 430
Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe
435 440 445
Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn
450 455 460
Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys
465 470 475 480
Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile
485 490 495
Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn
500 505 510
Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg
515 520 525
Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys
530 535 540
Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met
545 550 555 560
Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly
565 570 575
Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Val Lys Gly Leu
580 585 590
Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser Asp Gly Val Met
595 600 605
Gln Lys Gly Phe Val Ser Ile Asn Asp Asn Lys His Tyr Phe Asp Asp
610 615 620
Ser Gly Val Met Lys Val Gly Tyr Thr Glu Ile Asp Gly Lys His Phe
625 630 635 640
Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile Gly Val Phe Asn Thr Glu
645 650 655
Asp Gly Phe Lys Tyr Phe Ala His His Asn Glu Asp Leu Gly Asn Glu
660 665 670
Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe Asn Asn Lys
675 680 685
Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val Gly Trp Lys Asp
690 695 700
Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr Ala Glu Ala
705 710 715 720
Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr Phe Asn Asp
725 730 735
Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn Asp Lys Val Phe
740 745 750
Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val Gln Asn Ile Asp
755 760 765
Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln Ile Gly Val
770 775 780
Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala Asn Thr Val
785 790 795 800
Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly Leu Val Arg
805 810 815
Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr Ile Glu Thr
820 825 830
Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr Tyr Phe Asn
835 840 845
Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile Asp Asp Ile
850 855 860
Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr Gly Leu Ile Ser
865 870 875 880
Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu Met Gln Phe
885 890 895
Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly Glu Asp Gly
900 905 910
Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly Phe Lys Tyr Phe
915 920 925
Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu Ser Ile Asn
930 935 940
Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr Phe Thr Asp
945 950 955 960
Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp Gly Glu Glu Tyr
965 970 975
Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser Glu His His His
980 985 990
His His His
995
<210> 28
<211> 593
<212> PRT
<213> Clostridium Difficile
<400> 28
Met Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
1 5 10 15
Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys
20 25 30
His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys
35 40 45
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn
50 55 60
Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu
65 70 75 80
Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly
85 90 95
Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala
100 105 110
Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe
115 120 125
Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn
130 135 140
Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val
145 150 155 160
Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His
165 170 175
Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu
180 185 190
Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val
195 200 205
Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn
210 215 220
Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
225 230 235 240
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
245 250 255
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr
260 265 270
Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly
275 280 285
Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe
290 295 300
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu
305 310 315 320
Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly
325 330 335
Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys
340 345 350
Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr
355 360 365
Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser
370 375 380
Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp
385 390 395 400
Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
405 410 415
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
420 425 430
Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe
435 440 445
Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn
450 455 460
Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys
465 470 475 480
Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile
485 490 495
Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn
500 505 510
Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg
515 520 525
Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys
530 535 540
Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met
545 550 555 560
Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly
565 570 575
Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Pro Gly Ile Tyr
580 585 590
Gly
<210> 29
<211> 589
<212> PRT
<213> Clostridium Difficile
<400> 29
Met Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
1 5 10 15
Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys
20 25 30
His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys
35 40 45
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn
50 55 60
Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu
65 70 75 80
Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly
85 90 95
Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala
100 105 110
Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe
115 120 125
Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn
130 135 140
Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val
145 150 155 160
Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His
165 170 175
Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu
180 185 190
Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val
195 200 205
Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn
210 215 220
Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
225 230 235 240
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
245 250 255
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr
260 265 270
Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly
275 280 285
Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe
290 295 300
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu
305 310 315 320
Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly
325 330 335
Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys
340 345 350
Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr
355 360 365
Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser
370 375 380
Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp
385 390 395 400
Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
405 410 415
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
420 425 430
Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe
435 440 445
Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn
450 455 460
Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys
465 470 475 480
Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile
485 490 495
Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn
500 505 510
Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg
515 520 525
Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys
530 535 540
Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met
545 550 555 560
Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly
565 570 575
Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Val
580 585
<210> 30
<211> 589
<212> PRT
<213> Clostridium Difficile
<400> 30
Met Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
1 5 10 15
Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys
20 25 30
His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys
35 40 45
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn
50 55 60
Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu
65 70 75 80
Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly
85 90 95
Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala
100 105 110
Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe
115 120 125
Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn
130 135 140
Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val
145 150 155 160
Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His
165 170 175
Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu
180 185 190
Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val
195 200 205
Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn
210 215 220
Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
225 230 235 240
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
245 250 255
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr
260 265 270
Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly
275 280 285
Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe
290 295 300
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu
305 310 315 320
Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly
325 330 335
Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys
340 345 350
Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr
355 360 365
Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser
370 375 380
Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp
385 390 395 400
Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
405 410 415
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
420 425 430
Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe
435 440 445
Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn
450 455 460
Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys
465 470 475 480
Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile
485 490 495
Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn
500 505 510
Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg
515 520 525
Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys
530 535 540
Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met
545 550 555 560
Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly
565 570 575
Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Val
580 585
<210> 31
<211> 589
<212> PRT
<213> Clostridium Difficile
<400> 31
Met Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn
1 5 10 15
Thr Asn Thr Ala Ile Ala Ser Thr Gly Tyr Thr Ile Ile Asn Gly Lys
20 25 30
His Phe Tyr Phe Asn Thr Asp Gly Ile Met Gln Ile Gly Val Phe Lys
35 40 45
Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr Asp Ala Asn
50 55 60
Asn Ile Glu Gly Gln Ala Ile Leu Tyr Gln Asn Glu Phe Leu Thr Leu
65 70 75 80
Asn Gly Lys Lys Tyr Tyr Phe Gly Ser Asp Ser Lys Ala Val Thr Gly
85 90 95
Trp Arg Ile Ile Asn Asn Lys Lys Tyr Tyr Phe Asn Pro Asn Asn Ala
100 105 110
Ile Ala Ala Ile His Leu Cys Thr Ile Asn Asn Asp Lys Tyr Tyr Phe
115 120 125
Ser Tyr Asp Gly Ile Leu Gln Asn Gly Tyr Ile Thr Ile Glu Arg Asn
130 135 140
Asn Phe Tyr Phe Asp Ala Asn Asn Glu Ser Lys Met Val Thr Gly Val
145 150 155 160
Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn Thr His
165 170 175
Asn Asn Asn Ile Glu Gly Gln Ala Ile Val Tyr Gln Asn Lys Phe Leu
180 185 190
Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Asp Asn Asp Ser Lys Ala Val
195 200 205
Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr Tyr Phe Asn Leu Asn
210 215 220
Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile Asp Gly Lys Lys Tyr
225 230 235 240
Tyr Phe Asn Leu Asn Thr Ala Glu Ala Ala Thr Gly Trp Gln Thr Ile
245 250 255
Asp Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Phe Ile Ala Ser Thr
260 265 270
Gly Tyr Thr Ser Ile Asn Gly Lys His Phe Tyr Phe Asn Thr Asp Gly
275 280 285
Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asn Gly Phe Glu Tyr Phe
290 295 300
Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Leu
305 310 315 320
Tyr Gln Asn Lys Phe Leu Thr Leu Asn Gly Lys Lys Tyr Tyr Phe Gly
325 330 335
Ser Asp Ser Lys Ala Val Thr Gly Leu Arg Thr Ile Asp Gly Lys Lys
340 345 350
Tyr Tyr Phe Asn Thr Asn Thr Ala Val Ala Val Thr Gly Trp Gln Thr
355 360 365
Ile Asn Gly Lys Lys Tyr Tyr Phe Asn Thr Asn Thr Ser Ile Ala Ser
370 375 380
Thr Gly Tyr Thr Ile Ile Ser Gly Lys His Phe Tyr Phe Asn Thr Asp
385 390 395 400
Gly Ile Met Gln Ile Gly Val Phe Lys Gly Pro Asp Gly Phe Glu Tyr
405 410 415
Phe Ala Pro Ala Asn Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile
420 425 430
Arg Tyr Gln Asn Arg Phe Leu Tyr Leu His Asp Asn Ile Tyr Tyr Phe
435 440 445
Gly Asn Asn Ser Lys Ala Ala Thr Gly Trp Val Thr Ile Asp Gly Asn
450 455 460
Arg Tyr Tyr Phe Glu Pro Asn Thr Ala Met Gly Ala Asn Gly Tyr Lys
465 470 475 480
Thr Ile Asp Asn Lys Asn Phe Tyr Phe Arg Asn Gly Leu Pro Gln Ile
485 490 495
Gly Val Phe Lys Gly Ser Asn Gly Phe Glu Tyr Phe Ala Pro Ala Asn
500 505 510
Thr Asp Ala Asn Asn Ile Glu Gly Gln Ala Ile Arg Tyr Gln Asn Arg
515 520 525
Phe Leu His Leu Leu Gly Lys Ile Tyr Tyr Phe Gly Asn Asn Ser Lys
530 535 540
Ala Val Thr Gly Trp Gln Thr Ile Asn Gly Lys Val Tyr Tyr Phe Met
545 550 555 560
Pro Asp Thr Ala Met Ala Ala Ala Gly Gly Leu Phe Glu Ile Asp Gly
565 570 575
Val Ile Tyr Phe Phe Gly Val Asp Gly Val Lys Ala Val
580 585
<210> 32
<211> 513
<212> PRT
<213> Clostridium Difficile
<400> 32
Thr Gly Phe Val Thr Val Gly Asp Asp Lys Tyr Tyr Phe Asn Pro Ile
1 5 10 15
Asn Gly Gly Ala Ala Ser Ile Gly Glu Thr Ile Ile Asp Asp Lys Asn
20 25 30
Tyr Tyr Phe Asn Gln Ser Gly Val Leu Gln Thr Gly Val Phe Ser Thr
35 40 45
Glu Asp Gly Phe Lys Tyr Phe Ala Pro Ala Asn Thr Leu Asp Glu Asn
50 55 60
Leu Glu Gly Glu Ala Ile Asp Phe Thr Gly Lys Leu Ile Ile Asp Glu
65 70 75 80
Asn Ile Tyr Tyr Phe Asp Asp Asn Tyr Arg Gly Ala Val Glu Trp Lys
85 90 95
Glu Leu Asp Gly Glu Met His Tyr Phe Ser Pro Glu Thr Gly Lys Ala
100 105 110
Phe Lys Gly Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser
115 120 125
Asp Gly Val Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn Lys His
130 135 140
Tyr Phe Asp Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu Ile Asp
145 150 155 160
Gly Lys His Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile Gly Val
165 170 175
Phe Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn Glu Asp
180 185 190
Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn
195 200 205
Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val
210 215 220
Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp
225 230 235 240
Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr
245 250 255
Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn
260 265 270
Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val
275 280 285
Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val
290 295 300
Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro
305 310 315 320
Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser
325 330 335
Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr
340 345 350
Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys
355 360 365
Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu
370 375 380
Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr
385 390 395 400
Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly
405 410 415
Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe
420 425 430
Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly
435 440 445
Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly
450 455 460
Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr
465 470 475 480
Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp
485 490 495
Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser
500 505 510
Glu
<210> 33
<211> 513
<212> PRT
<213> Clostridium Difficile
<400> 33
Thr Gly Phe Val Thr Val Gly Asp Asp Lys Tyr Tyr Phe Asn Pro Ile
1 5 10 15
Asn Gly Gly Ala Ala Ser Ile Gly Glu Thr Ile Ile Asp Asp Lys Asn
20 25 30
Tyr Tyr Phe Asn Gln Ser Gly Val Leu Gln Thr Gly Val Phe Ser Thr
35 40 45
Glu Asp Gly Phe Lys Tyr Phe Ala Pro Ala Asn Thr Leu Asp Glu Asn
50 55 60
Leu Glu Gly Glu Ala Ile Asp Phe Thr Gly Lys Leu Ile Ile Asp Glu
65 70 75 80
Asn Ile Tyr Tyr Phe Asp Asp Asn Tyr Arg Gly Ala Val Glu Trp Lys
85 90 95
Glu Leu Asp Gly Glu Met His Tyr Phe Ser Pro Glu Thr Gly Lys Ala
100 105 110
Phe Lys Gly Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser
115 120 125
Asp Gly Val Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn Lys His
130 135 140
Tyr Phe Asp Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu Ile Asp
145 150 155 160
Gly Lys His Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile Gly Val
165 170 175
Phe Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn Glu Asp
180 185 190
Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn
195 200 205
Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val
210 215 220
Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp
225 230 235 240
Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr
245 250 255
Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn
260 265 270
Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val
275 280 285
Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val
290 295 300
Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro
305 310 315 320
Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser
325 330 335
Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr
340 345 350
Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys
355 360 365
Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu
370 375 380
Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr
385 390 395 400
Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly
405 410 415
Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe
420 425 430
Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly
435 440 445
Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly
450 455 460
Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr
465 470 475 480
Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp
485 490 495
Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser
500 505 510
Glu
<210> 34
<211> 534
<212> PRT
<213> Clostridium Difficile
<400> 34
Ser Gly Leu Ile Tyr Ile Asn Asp Ser Leu Tyr Tyr Phe Lys Pro Pro
1 5 10 15
Val Asn Asn Leu Ile Thr Gly Phe Val Thr Val Gly Asp Asp Lys Tyr
20 25 30
Tyr Phe Asn Pro Ile Asn Gly Gly Ala Ala Ser Ile Gly Glu Thr Ile
35 40 45
Ile Asp Asp Lys Asn Tyr Tyr Phe Asn Gln Ser Gly Val Leu Gln Thr
50 55 60
Gly Val Phe Ser Thr Glu Asp Gly Phe Lys Tyr Phe Ala Pro Ala Asn
65 70 75 80
Thr Leu Asp Glu Asn Leu Glu Gly Glu Ala Ile Asp Phe Thr Gly Lys
85 90 95
Leu Ile Ile Asp Glu Asn Ile Tyr Tyr Phe Asp Asp Asn Tyr Arg Gly
100 105 110
Ala Val Glu Trp Lys Glu Leu Asp Gly Glu Met His Tyr Phe Ser Pro
115 120 125
Glu Thr Gly Lys Ala Phe Lys Gly Leu Asn Gln Ile Gly Asp Tyr Lys
130 135 140
Tyr Tyr Phe Asn Ser Asp Gly Val Met Gln Lys Gly Phe Val Ser Ile
145 150 155 160
Asn Asp Asn Lys His Tyr Phe Asp Asp Ser Gly Val Met Lys Val Gly
165 170 175
Tyr Thr Glu Ile Asp Gly Lys His Phe Tyr Phe Ala Glu Asn Gly Glu
180 185 190
Met Gln Ile Gly Val Phe Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala
195 200 205
His His Asn Glu Asp Leu Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr
210 215 220
Ser Gly Ile Leu Asn Phe Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser
225 230 235 240
Phe Thr Ala Val Val Gly Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr
245 250 255
Tyr Phe Asp Glu Asp Thr Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile
260 265 270
Asn Asp Gly Gln Tyr Tyr Phe Asn Asp Asp Gly Ile Met Gln Val Gly
275 280 285
Phe Val Thr Ile Asn Asp Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile
290 295 300
Ile Glu Ser Gly Val Gln Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp
305 310 315 320
Asp Asn Gly Ile Val Gln Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr
325 330 335
Lys Tyr Phe Ala Pro Ala Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln
340 345 350
Ala Val Glu Tyr Ser Gly Leu Val Arg Val Gly Glu Asp Val Tyr Tyr
355 360 365
Phe Gly Glu Thr Tyr Thr Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu
370 375 380
Asn Glu Ser Asp Lys Tyr Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys
385 390 395 400
Lys Gly Ile Asn Leu Ile Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys
405 410 415
Gly Ile Met Arg Thr Gly Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr
420 425 430
Phe Asn Glu Asn Gly Glu Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp
435 440 445
Lys Met Phe Tyr Phe Gly Glu Asp Gly Val Met Gln Ile Gly Val Phe
450 455 460
Asn Thr Pro Asp Gly Phe Lys Tyr Phe Ala His Gln Asn Thr Leu Asp
465 470 475 480
Glu Asn Phe Glu Gly Glu Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu
485 490 495
Asp Glu Lys Arg Tyr Tyr Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly
500 505 510
Ser Val Ile Ile Asp Gly Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala
515 520 525
Gln Leu Val Ile Ser Glu
530
<210> 35
<211> 400
<212> PRT
<213> Clostridium Difficile
<400> 35
Lys Gly Leu Asn Gln Ile Gly Asp Tyr Lys Tyr Tyr Phe Asn Ser Asp
1 5 10 15
Gly Val Met Gln Lys Gly Phe Val Ser Ile Asn Asp Asn Lys His Tyr
20 25 30
Phe Asp Asp Ser Gly Val Met Lys Val Gly Tyr Thr Glu Ile Asp Gly
35 40 45
Lys His Phe Tyr Phe Ala Glu Asn Gly Glu Met Gln Ile Gly Val Phe
50 55 60
Asn Thr Glu Asp Gly Phe Lys Tyr Phe Ala His His Asn Glu Asp Leu
65 70 75 80
Gly Asn Glu Glu Gly Glu Glu Ile Ser Tyr Ser Gly Ile Leu Asn Phe
85 90 95
Asn Asn Lys Ile Tyr Tyr Phe Asp Asp Ser Phe Thr Ala Val Val Gly
100 105 110
Trp Lys Asp Leu Glu Asp Gly Ser Lys Tyr Tyr Phe Asp Glu Asp Thr
115 120 125
Ala Glu Ala Tyr Ile Gly Leu Ser Leu Ile Asn Asp Gly Gln Tyr Tyr
130 135 140
Phe Asn Asp Asp Gly Ile Met Gln Val Gly Phe Val Thr Ile Asn Asp
145 150 155 160
Lys Val Phe Tyr Phe Ser Asp Ser Gly Ile Ile Glu Ser Gly Val Gln
165 170 175
Asn Ile Asp Asp Asn Tyr Phe Tyr Ile Asp Asp Asn Gly Ile Val Gln
180 185 190
Ile Gly Val Phe Asp Thr Ser Asp Gly Tyr Lys Tyr Phe Ala Pro Ala
195 200 205
Asn Thr Val Asn Asp Asn Ile Tyr Gly Gln Ala Val Glu Tyr Ser Gly
210 215 220
Leu Val Arg Val Gly Glu Asp Val Tyr Tyr Phe Gly Glu Thr Tyr Thr
225 230 235 240
Ile Glu Thr Gly Trp Ile Tyr Asp Met Glu Asn Glu Ser Asp Lys Tyr
245 250 255
Tyr Phe Asn Pro Glu Thr Lys Lys Ala Cys Lys Gly Ile Asn Leu Ile
260 265 270
Asp Asp Ile Lys Tyr Tyr Phe Asp Glu Lys Gly Ile Met Arg Thr Gly
275 280 285
Leu Ile Ser Phe Glu Asn Asn Asn Tyr Tyr Phe Asn Glu Asn Gly Glu
290 295 300
Met Gln Phe Gly Tyr Ile Asn Ile Glu Asp Lys Met Phe Tyr Phe Gly
305 310 315 320
Glu Asp Gly Val Met Gln Ile Gly Val Phe Asn Thr Pro Asp Gly Phe
325 330 335
Lys Tyr Phe Ala His Gln Asn Thr Leu Asp Glu Asn Phe Glu Gly Glu
340 345 350
Ser Ile Asn Tyr Thr Gly Trp Leu Asp Leu Asp Glu Lys Arg Tyr Tyr
355 360 365
Phe Thr Asp Glu Tyr Ile Ala Ala Thr Gly Ser Val Ile Ile Asp Gly
370 375 380
Glu Glu Tyr Tyr Phe Asp Pro Asp Thr Ala Gln Leu Val Ile Ser Glu
385 390 395 400
Claims (67)
- 제1 단편 및 제2 단편을 포함하는 폴리펩티드로서,
(i) 상기 제1 단편이 독소 A 반복 도메인 단편이고;
(ii) 상기 제2 단편이 독소 B 반복 도메인 단편이며;
(iii) 상기 제1 단편이 제1 근위단을 갖고;
(iv) 상기 제2 단편이 제2 근위단을 가지며;
상기 제1 단편 및 상기 제2 단편이 서로 인접하고, 상기 폴리펩티드가 독소 A 또는 독소 B 또는 둘 모두를 중화시키는 항체를 유도하는 폴리펩티드. - 제1항에 있어서, 상기 폴리펩티드가 포유류 숙주에서 클로스트리듐 디피실레(Clostridium difficile)의 균주에 대하여 보호 면역 반응을 유도하는 폴리펩티드.
- 제1항 또는 제2항에 있어서, 상기 제1 단편 및/또는 상기 제2 단편이 25%, 20%, 18% 또는 15% 미만의 알파 나선 구조를 포함하는 폴리펩티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1 단편 및/또는 상기 제2 단편이 25%, 30%, 35%, 38% 또는 40% 초과의 베타 시트 구조를 포함하는 폴리펩티드.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 제1 근위단이 짧은 반복부 내에 존재하는 폴리펩티드.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 제2 근위단이 짧은 반복부 내에 존재하는 폴리펩티드.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 제1 근위단이 짧은 반복-긴 반복-짧은 반복 부분을 파괴하지 않는 폴리펩티드.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 제2 근위단이 짧은 반복-긴 반복-짧은 반복 부분을 파괴하지 않는 폴리펩티드.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 제1 근위단 및 상기 제2 근위단이 짧은 반복-긴 반복-짧은 반복 부분을 파괴하지 않는 폴리펩티드.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 제1 근위단이 독소 A의 아미노산 1878 내지 1940, 2012 내지 2074, 2146 내지 2208, 2258 내지 2322, 2394 내지 2456, 2507 내지 2569 또는 2598 내지 2660 내에 존재하지 않는 폴리펩티드.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 제2 근위단이 독소 B의 아미노산 1881 내지 1942, 2012 내지 2074, 2144 내지 2208 또는 2278 내지 2339 내에 존재하지 않는 폴리펩티드.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 제1 단편이 적어도 100, 250, 400 또는 450개 아미노산을 포함하는 폴리펩티드.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 제2 단편이 적어도 100, 200, 300 또는 400개 아미노산을 포함하는 폴리펩티드.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 제1 근위단이 독소 A의 반복 부분 VIII(아미노산 2645 내지 2710) 내에 존재하는 폴리펩티드.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 제1 근위단이 독소 A의 아미노산 2700 내지 2710 또는 2680 내지 2690 내에 존재하는 폴리펩티드.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 제2 근위단이 독소 B의 반복 부분 I(아미노산 1834 내지 1926) 내에 존재하는 폴리펩티드.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 제2 근위단이 아미노산 1860 내지 1878, 1854 내지 1876 내에 존재하는 폴리펩티드.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 제2 근위단이 독소 B의 반복 부분 II(아미노산 1927 내지 2057) 내에 존재하는 폴리펩티드.
- 제1항 내지 제15항 및 제18항 중 어느 한 항에 있어서, 상기 제2 근위단이 독소 B의 아미노산 1960 내지 1970, 1988 내지 1998 또는 1867 내지 1877 내에 존재하는 폴리펩티드.
- 제1항 내지 제13항 및 제16항 내지 제19항 중 어느 한 항에 있어서, 상기 제1 단편이 전체 독소 A 반복 도메인(아미노산 1832 내지 2710)으로 이루어진 폴리펩티드.
- 제1항 내지 제15항 및 제20항 중 어느 한 항에 있어서, 상기 제2 단편이 전체 독소 B 반복 도메인(아미노산 1833 내지 2366)으로 이루어진 폴리펩티드.
- 제14항, 제15항, 제16항 또는 제17항에 있어서, 상기 제1 근위단이 독소 A의 반복 부분 VIII(아미노산 2645 내지 2710) 내에 존재하며, 상기 제2 근위단이 독소 B의 반복 부분 I(아미노산 1834 내지 1926) 내에 존재하는 폴리펩티드.
- 제14항, 제15항, 제18항 또는 제19항에 있어서, 상기 제1 근위단이 독소 A의 반복 부분 VIII(아미노산 2645 내지 2710) 내에 존재하며, 상기 제2 근위단이 독소 B의 반복 부분 II(아미노산 1927 내지 2057) 내에 존재하는 폴리펩티드.
- 제14항, 제15항, 제18항 또는 제19항에 있어서, 상기 제1 근위단이 독소 A의 반복 부분 VIII의 짧은 반복부 3(아미노산 2687 내지 2710) 내에 존재하며, 상기 제2 근위단이 독소 B의 반복 부분 II의 짧은 반복부 4(아미노산 1988 내지 2007) 내에 존재하는 폴리펩티드.
- 제14항, 제15항, 제18항 또는 제19항에 있어서, 상기 제1 근위단이 독소 A의 반복 부분 VIII의 짧은 반복부 2(아미노산 2665 내지 2686) 내에 존재하며, 상기 제2 근위단이 독소 B의 반복 부분 II의 짧은 반복부 3(아미노산 1968 내지 1987) 내에 존재하는 폴리펩티드.
- 제14항, 제15항, 제16항 또는 제17항에 있어서, 상기 제1 근위단이 독소 A의 반복 부분 VIII의 짧은 반복부 2(아미노산 2665 내지 2686) 내에 존재하며, 상기 제2 근위단이 독소 B의 반복 부분 I의 짧은 반복부 3(1877 내지 1896) 내에 존재하는 폴리펩티드.
- 제1항 내지 제13항, 제14항, 제15항, 제16항, 제17항 및 제22항 중 어느 한 항에 있어서, 상기 제1 근위단이 독소 A의 반복 부분 VIII의 짧은 반복부 3(아미노산 2645 내지 2686) 내에 존재하며, 상기 제2 근위단이 독소 B의 반복 부분 I의 짧은 반복부 1(아미노산 1834 내지 1854) 내에 존재하는 폴리펩티드.
- 제14항, 제15항, 제18항 또는 제19항에 있어서, 상기 제1 근위단이 독소 A의 반복 부분 VIII의 짧은 반복부 3(아미노산 2687 내지 2710) 내에 존재하며, 상기 제2 근위단이 독소 B의 반복 부분 II의 짧은 반복부 4(아미노산 1988 내지 2007) 내에 존재하는 폴리펩티드.
- 제23항에 있어서, 상기 제1 근위단이 독소 A의 아미노산 2700 내지 2710 내에 존재하며, 상기 제2 근위단이 독소 B의 아미노산 1960 내지 1970 내에 존재하는 폴리펩티드.
- 제23항에 있어서, 상기 제1 근위단이 독소 A의 아미노산 2680 내지 2690 내에 존재하며, 상기 제2 근위단이 독소 B의 아미노산 1960 내지 1970 내에 존재하는 폴리펩티드.
- 제23항에 있어서, 상기 제1 근위단이 독소 A의 아미노산 2700 내지 2710 내에 존재하며, 상기 제2 근위단이 독소 B의 아미노산 1988 내지 1998 내에 존재하는 폴리펩티드.
- 제23항에 있어서, 상기 제1 근위단이 아미노산 2680 내지 2690 내에 존재하며, 상기 제2 근위단이 아미노산 1860 내지 1878 내에 존재하는 폴리펩티드.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 폴리펩티드가 링커를 추가로 포함하는 폴리펩티드.
- 제33항에 있어서, 상기 링커가 1 내지 19개 아미노산을 포함하는 폴리펩티드.
- 제33항 또는 제34항에 있어서, 상기 링커가 글리신 링커인 폴리펩티드.
- 제33항 내지 제35항 중 어느 한 항에 있어서, 상기 링커가 상기 제1 단편의 근위단과 상기 제2 단편의 근위단 사이에 존재하는 폴리펩티드.
- 제1항 내지 제36항 중 어느 한 항에 있어서, 상기 폴리펩티드가 보다 큰 융합 단백질의 부분인 폴리펩티드.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 폴리펩티드가 서열 번호 3, 서열 번호 4, 서열 번호 6, 서열 번호 7 서열 번호 21, 서열 번호 23, 서열 번호 25 또는 서열 번호 27의 면역원성 단편을 포함하는 폴리펩티드.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 상기 폴리펩티드가 서열 번호 3, 서열 번호 4, 서열 번호 6, 서열 번호 7, 서열 번호 21, 서열 번호 23, 서열 번호 25 또는 서열 번호 27의 적어도 500, 600, 700, 750, 800, 850 또는 900개 아미노산의 면역원성 단편을 포함하는 폴리펩티드.
- 제1항 내지 제39항 중 어느 한 항에 있어서, 상기 폴리펩티드가 서열 번호 3, 서열 번호 4, 서열 번호 6, 서열 번호 7, 서열 번호 21, 서열 번호 23, 서열 번호 25 또는 서열 번호 27의 변이체를 포함하는 폴리펩티드.
- 제1항 내지 제40항 중 어느 한 항에 있어서, 상기 폴리펩티드가 독소 A로부터의 450, 475, 500, 525, 575, 600, 625, 650, 675, 700, 725, 750, 775, 800, 825 또는 850개 초과의 아미노산을 포함하는 폴리펩티드.
- 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 폴리펩티드가 독소 A로부터의 850, 825, 800, 775, 750, 725, 700, 675, 650, 625 또는 600개 미만의 아미노산을 포함하는 폴리펩티드.
- 제1항 내지 제42항 중 어느 한 항에 있어서, 상기 폴리펩티드가 독소 B로부터의 350, 375, 400, 425, 450, 475, 500 또는 525개 초과의 아미노산을 포함하는 폴리펩티드.
- 제1항 내지 제43항 중 어느 한 항에 있어서, 상기 폴리펩티드가 독소 B로부터의 525, 500, 475 또는 450개 미만의 아미노산을 포함하는 폴리펩티드.
- (i) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35;
(ii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35에 대하여 적어도 90%, 95%, 98%, 99% 또는 100% 유사성을 갖는 변이체; 또는
(iii) 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33 또는 서열 번호 34 또는 서열 번호 35의 적어도 250, 280, 300, 350, 380, 400, 430, 450, 480, 500, 530, 550, 580 또는 600개 아미노산의 단편을 포함하는 폴리펩티드. - 제45항에 있어서, 상기 폴리펩티드가 독소 A로부터의 450, 475, 500, 525, 575, 600, 625, 650, 675, 700, 725, 750, 775, 800, 825 또는 850개 초과의 아미노산을 포함하는 폴리펩티드.
- 제45항 또는 제46항에 있어서, 상기 폴리펩티드가 독소 A로부터의 850, 825, 800, 775, 750, 725, 700, 675, 650, 625 또는 600개 미만의 아미노산을 포함하는 폴리펩티드.
- 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 폴리펩티드가 독소 B로부터의 350, 375, 400, 425, 450, 475, 500 또는 525개 초과의 아미노산을 포함하는 폴리펩티드.
- 제45항 내지 제48항 중 어느 한 항에 있어서, 상기 폴리펩티드가 독소 B로부터의 525, 500, 475 또는 450개 미만의 아미노산을 포함하는 폴리펩티드.
- 제45항 내지 제49항 중 어느 한 항에 있어서, 상기 폴리펩티드가 독소 A 또는 독소 B 또는 둘 모두를 중화시키는 항체를 유도하는 폴리펩티드.
- 제45항 내지 제50항 중 어느 한 항에 있어서, 상기 폴리펩티드가 포유류 숙주에서 클로스트리듐 디피실레의 균주에 대하여 보호 면역 반응을 유도하는 폴리펩티드.
- 제45항 내지 제51항 중 어느 한 항에 있어서, 상기 폴리펩티드가 25%, 20%, 18% 또는 15% 미만의 알파 나선 구조를 포함하는 폴리펩티드.
- 제45항 내지 제52항 중 어느 한 항에 있어서, 상기 폴리펩티드가 25%, 30%, 35%, 38% 또는 40% 초과의 베타 시트 구조를 포함하는 폴리펩티드.
- 제1항 내지 제53항 중 어느 한 항의 폴리펩티드를 엔코딩(encoding)하는 폴리뉴클레오티드.
- 유도성 프로모터에 연결된 제54항의 폴리뉴클레오티드를 포함하는 벡터.
- 제47항에 있어서, 상기 유도성 프로모터가 충분량의 IPTG의 첨가에 의해 활성화되는 벡터.
- 제54항 또는 제55항의 벡터 또는 제46항의 폴리뉴클레오티드를 포함하는 숙주 세포.
- 제57항에 있어서, 상기 숙주 세포가 그람 음성 박테리아인 숙주 세포.
- 제57항에 있어서, 상기 숙주 세포가 E. 콜라이(E.coli)인 숙주 세포.
- 제1항 내지 제45항 중 어느 한 항의 폴리펩티드 및 약제학적으로 허용되는 부형제를 포함하는 면역원성 조성물.
- 제60항에 있어서, 애쥬번트(adjuvant)를 추가로 포함하는 면역원성 조성물.
- 제60항 또는 제61항에 있어서, 추가의 항원을 추가로 포함하는 면역원성 조성물.
- 제62항에 있어서, 상기 추가의 항원이 S. 뉴모니아(S.pneumoniae), H. 인플루엔자(H.influenzae), N. 메닌지티디스(N.meningitidis), E. 콜라이, M. 카타랄리스(M.cattarhalis), 파상풍, 디프테리아, 백일해, S. 에피데르미디스(S.epidermidis), 장구균 및 S. 아우레우스(S.aureus)로 이루어진 군으로부터 선택되는 박테리아로부터 유래되는 항원인 면역원성 조성물.
- 제60항 내지 제63항 중 어느 한 항의 면역원성 조성물을 포함하는 백신.
- 클로스트리듐 디피실레 질환의 치료 또는 예방에서의 제60항 내지 제63항 중 어느 한 항의 면역원성 조성물 또는 제64항의 백신의 용도.
- 클로스트리듐 디피실레 질환의 치료 또는 예방에 사용하기 위한 제60항 내지 제63항 중 어느 한 항의 면역원성 조성물 또는 제64항의 백신.
- 클로스트리듐 디피실레 질환의 예방 또는 치료용 약제의 제조에서의 제60항 내지 제63항 중 어느 한 항의 면역원성 조성물 또는 제64항의 백신의 용도.
제60항 내지 제63항 중 어느 한 항의 면역원성 조성물 또는 제64항의 백신을 환자에게 투여하는 것을 포함하는 클로스트리듐 디피실레 질환의 예방 또는 치료 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161490707P | 2011-05-27 | 2011-05-27 | |
US201161490716P | 2011-05-27 | 2011-05-27 | |
US201161490734P | 2011-05-27 | 2011-05-27 | |
US61/490,716 | 2011-05-27 | ||
US61/490,734 | 2011-05-27 | ||
US61/490,707 | 2011-05-27 | ||
PCT/EP2012/059805 WO2012163817A2 (en) | 2011-05-27 | 2012-05-25 | Immunogenic composition |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140019848A true KR20140019848A (ko) | 2014-02-17 |
KR102014502B1 KR102014502B1 (ko) | 2019-08-26 |
Family
ID=46168484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137034795A KR102014502B1 (ko) | 2011-05-27 | 2012-05-25 | 면역원성 조성물 |
Country Status (25)
Country | Link |
---|---|
US (5) | US9290565B2 (ko) |
EP (6) | EP3138916B1 (ko) |
JP (3) | JP5952390B2 (ko) |
KR (1) | KR102014502B1 (ko) |
CN (3) | CN103732750A (ko) |
BR (2) | BR112013030396A2 (ko) |
CA (2) | CA2837393A1 (ko) |
CY (3) | CY1118599T1 (ko) |
DK (4) | DK3564378T3 (ko) |
EA (1) | EA030898B1 (ko) |
ES (4) | ES2968455T3 (ko) |
FI (1) | FI3564378T3 (ko) |
HR (4) | HRP20231749T1 (ko) |
HU (4) | HUE037126T2 (ko) |
IL (1) | IL229529B2 (ko) |
LT (4) | LT2714910T (ko) |
ME (1) | ME02600B (ko) |
MX (1) | MX346200B (ko) |
PL (4) | PL2714911T3 (ko) |
PT (4) | PT3564378T (ko) |
RS (1) | RS55605B1 (ko) |
SG (1) | SG195037A1 (ko) |
SI (4) | SI2714911T1 (ko) |
SM (1) | SMT201700110B (ko) |
WO (3) | WO2012163817A2 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112014004896B1 (pt) | 2010-09-03 | 2023-02-14 | Valneva Usa, Inc. | Polipepttdeo isolado de proteínas de toxina a e toxina b de c. difficile e usos do mesmo |
PE20141029A1 (es) | 2011-04-22 | 2014-09-04 | Wyeth Llc | Composiciones relacionadas con una toxina de clostridium difficile mutante y sus metodos |
ES2704069T3 (es) | 2011-12-08 | 2019-03-14 | Glaxosmithkline Biologicals Sa | Vacuna basada en toxinas de Clostridium difficile |
BR122016023101B1 (pt) | 2012-10-21 | 2022-03-22 | Pfizer Inc | Polipeptídeo, composição imunogênica que o compreende, bem como célula recombinante derivada de clostridium difficile |
JP6290918B2 (ja) | 2012-12-05 | 2018-03-07 | グラクソスミスクライン バイオロジカルズ ソシエテ アノニム | 免疫原性組成物 |
EP2988778A4 (en) * | 2013-04-22 | 2016-12-14 | Board Of Regents Of The Univ Of Oklahoma | CLOSTRIDIUM DIFFICILE IMPREGENT AND METHOD OF USE |
US10533036B2 (en) | 2015-02-19 | 2020-01-14 | Immune Biosolutions Inc | Clostridium difficile toxins a and/or B antigen and epitope antibody, and pharmaceutical uses thereof |
WO2019243307A1 (en) | 2018-06-19 | 2019-12-26 | Glaxosmithkline Biologicals Sa | Immunogenic composition |
WO2023020993A1 (en) | 2021-08-16 | 2023-02-23 | Glaxosmithkline Biologicals Sa | Novel methods |
WO2023020992A1 (en) | 2021-08-16 | 2023-02-23 | Glaxosmithkline Biologicals Sa | Novel methods |
WO2023020994A1 (en) | 2021-08-16 | 2023-02-23 | Glaxosmithkline Biologicals Sa | Novel methods |
GB202205833D0 (en) | 2022-04-21 | 2022-06-08 | Glaxosmithkline Biologicals Sa | Bacteriophage |
WO2023232901A1 (en) | 2022-06-01 | 2023-12-07 | Valneva Austria Gmbh | Clostridium difficile vaccine |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000061762A1 (en) * | 1999-04-09 | 2000-10-19 | Techlab, Inc. | RECOMBINANT TOXIN A/TOXIN B VACCINE AGAINST $i(CLOSTRIDIUM DIFFICILE) |
WO2000061761A2 (en) * | 1999-04-09 | 2000-10-19 | Techlab, Inc. | Recombinant clostridium toxin a protein carrier for polysaccharide conjugate vaccines |
WO2010017383A1 (en) * | 2008-08-06 | 2010-02-11 | Emergent Product Development Uk Limited | Vaccines against clostridium difficile and methods of use |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4235877A (en) | 1979-06-27 | 1980-11-25 | Merck & Co., Inc. | Liposome particle containing viral or bacterial antigenic subunit |
US4751180A (en) | 1985-03-28 | 1988-06-14 | Chiron Corporation | Expression using fused genes providing for protein product |
US4935233A (en) | 1985-12-02 | 1990-06-19 | G. D. Searle And Company | Covalently linked polypeptide cell modulators |
HUT78048A (hu) * | 1994-10-24 | 1999-07-28 | Ophidian Pharmaceuticals, Inc. | A C. difficile által okozott betegség kezelésére és megelőzésére szolgáló vakcina és antitoxin |
CN1195297A (zh) * | 1995-07-07 | 1998-10-07 | 奥拉瓦克斯有限公司 | 艰难梭菌毒素作为粘膜佐剂 |
US20020065396A1 (en) | 2000-03-28 | 2002-05-30 | Fei Yang | Compositions and methods of diagnosing, monitoring, staging, imaging and treating colon cancer |
WO2011060431A2 (en) | 2009-11-16 | 2011-05-19 | University Of Maryland Baltimore | Multivalent live vector vaccine against clostridium difficile-associated disease |
BR112014004896B1 (pt) * | 2010-09-03 | 2023-02-14 | Valneva Usa, Inc. | Polipepttdeo isolado de proteínas de toxina a e toxina b de c. difficile e usos do mesmo |
GB201016742D0 (en) * | 2010-10-05 | 2010-11-17 | Health Prot Agency | Clostridium difficile antigens |
-
2012
- 2012-05-25 HR HRP20231749TT patent/HRP20231749T1/hr unknown
- 2012-05-25 DK DK19179871.9T patent/DK3564378T3/da active
- 2012-05-25 HU HUE12724950A patent/HUE037126T2/hu unknown
- 2012-05-25 JP JP2014511899A patent/JP5952390B2/ja active Active
- 2012-05-25 EP EP16193340.3A patent/EP3138916B1/en not_active Revoked
- 2012-05-25 WO PCT/EP2012/059805 patent/WO2012163817A2/en active Application Filing
- 2012-05-25 US US14/122,690 patent/US9290565B2/en not_active Expired - Fee Related
- 2012-05-25 ME MEP-2017-26A patent/ME02600B/me unknown
- 2012-05-25 LT LTEP12724950.6T patent/LT2714910T/lt unknown
- 2012-05-25 MX MX2013013924A patent/MX346200B/es active IP Right Grant
- 2012-05-25 CA CA2837393A patent/CA2837393A1/en not_active Abandoned
- 2012-05-25 WO PCT/EP2012/059793 patent/WO2012163811A1/en active Application Filing
- 2012-05-25 PL PL12726374T patent/PL2714911T3/pl unknown
- 2012-05-25 SI SI201230868A patent/SI2714911T1/sl unknown
- 2012-05-25 PT PT191798719T patent/PT3564378T/pt unknown
- 2012-05-25 PT PT127263747T patent/PT2714911T/pt unknown
- 2012-05-25 ES ES19179871T patent/ES2968455T3/es active Active
- 2012-05-25 HU HUE16193340 patent/HUE044772T2/hu unknown
- 2012-05-25 SI SI201232050T patent/SI3564378T1/sl unknown
- 2012-05-25 CA CA2837395A patent/CA2837395C/en active Active
- 2012-05-25 ES ES16193340T patent/ES2743442T3/es active Active
- 2012-05-25 KR KR1020137034795A patent/KR102014502B1/ko active IP Right Grant
- 2012-05-25 JP JP2014511895A patent/JP2014516532A/ja active Pending
- 2012-05-25 WO PCT/EP2012/059792 patent/WO2012163810A1/en active Application Filing
- 2012-05-25 LT LTEP12726374.7T patent/LT2714911T/lt unknown
- 2012-05-25 SI SI201231247T patent/SI2714910T1/en unknown
- 2012-05-25 PT PT16193340T patent/PT3138916T/pt unknown
- 2012-05-25 ES ES12726374.7T patent/ES2615737T3/es active Active
- 2012-05-25 EA EA201391548A patent/EA030898B1/ru not_active IP Right Cessation
- 2012-05-25 EP EP23205566.5A patent/EP4296361A3/en active Pending
- 2012-05-25 SI SI201231642T patent/SI3138916T1/sl unknown
- 2012-05-25 CN CN201280037466.8A patent/CN103732750A/zh active Pending
- 2012-05-25 RS RS20170051A patent/RS55605B1/sr unknown
- 2012-05-25 DK DK12726374.7T patent/DK2714911T3/en active
- 2012-05-25 PL PL19179871.9T patent/PL3564378T3/pl unknown
- 2012-05-25 CN CN201280037472.3A patent/CN103717742B/zh active Active
- 2012-05-25 EP EP18150735.1A patent/EP3327126A1/en not_active Withdrawn
- 2012-05-25 BR BR112013030396A patent/BR112013030396A2/pt not_active IP Right Cessation
- 2012-05-25 EP EP12726374.7A patent/EP2714911B1/en not_active Revoked
- 2012-05-25 PT PT127249506T patent/PT2714910T/pt unknown
- 2012-05-25 CN CN201710239709.0A patent/CN107098977A/zh active Pending
- 2012-05-25 PL PL16193340T patent/PL3138916T3/pl unknown
- 2012-05-25 SG SG2013085386A patent/SG195037A1/en unknown
- 2012-05-25 HU HUE12726374A patent/HUE030823T2/en unknown
- 2012-05-25 US US14/122,345 patent/US9409974B2/en active Active
- 2012-05-25 DK DK12724950.6T patent/DK2714910T3/en active
- 2012-05-25 EP EP12724950.6A patent/EP2714910B1/en active Active
- 2012-05-25 LT LTEP16193340.3T patent/LT3138916T/lt unknown
- 2012-05-25 BR BR112013030395-6A patent/BR112013030395B1/pt active IP Right Grant
- 2012-05-25 PL PL12724950T patent/PL2714910T3/pl unknown
- 2012-05-25 FI FIEP19179871.9T patent/FI3564378T3/fi active
- 2012-05-25 LT LTEP19179871.9T patent/LT3564378T/lt unknown
- 2012-05-25 DK DK16193340.3T patent/DK3138916T3/da active
- 2012-05-25 ES ES12724950.6T patent/ES2660468T3/es active Active
- 2012-05-25 HU HUE19179871A patent/HUE064492T2/hu unknown
- 2012-05-25 EP EP19179871.9A patent/EP3564378B1/en active Active
-
2013
- 2013-11-21 IL IL229529A patent/IL229529B2/en unknown
-
2016
- 2016-02-11 US US15/041,924 patent/US9644024B2/en active Active
- 2016-06-09 JP JP2016114910A patent/JP2017012160A/ja active Pending
- 2016-06-28 US US15/194,937 patent/US10093722B2/en active Active
-
2017
- 2017-01-20 HR HRP20170094TT patent/HRP20170094T1/hr unknown
- 2017-02-03 CY CY20171100158T patent/CY1118599T1/el unknown
- 2017-02-16 SM SM201700110T patent/SMT201700110B/it unknown
- 2017-03-21 US US15/464,454 patent/US10377816B2/en active Active
-
2018
- 2018-02-15 CY CY20181100188T patent/CY1119916T1/el unknown
- 2018-02-23 HR HRP20180339TT patent/HRP20180339T1/hr unknown
-
2019
- 2019-07-17 HR HRP20191291TT patent/HRP20191291T1/hr unknown
- 2019-08-27 CY CY20191100909T patent/CY1121936T1/el unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000061762A1 (en) * | 1999-04-09 | 2000-10-19 | Techlab, Inc. | RECOMBINANT TOXIN A/TOXIN B VACCINE AGAINST $i(CLOSTRIDIUM DIFFICILE) |
WO2000061761A2 (en) * | 1999-04-09 | 2000-10-19 | Techlab, Inc. | Recombinant clostridium toxin a protein carrier for polysaccharide conjugate vaccines |
WO2010017383A1 (en) * | 2008-08-06 | 2010-02-11 | Emergent Product Development Uk Limited | Vaccines against clostridium difficile and methods of use |
Non-Patent Citations (4)
Title |
---|
FEMS Microbiology Letters (2003) 225:325-329* * |
PNAS (2005) 102(51):18373-18378 * |
The Journal of Biological Chemistry (2011.03.18.) 286:8961-8976 * |
Toxins (2010) 2:998-1018 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102014502B1 (ko) | 면역원성 조성물 | |
EP4074830A2 (en) | Immunogenic compositions and vaccines derived from bacterial surface receptor proteins | |
AU2016203241B2 (en) | Immunogenic composition | |
AU2012264902A1 (en) | Immunogenic composition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |